對本機應(yīng)用的應(yīng)用頁面建索引的制作方法
【專利說明】
【背景技術(shù)】
[0001]因特網(wǎng)提供對廣泛各種信息的訪問。例如,通過因特網(wǎng)可訪問數(shù)字圖像文件、視頻和/或音頻文件、以及針對特定對象或者特定新聞文章的網(wǎng)頁資源。關(guān)于網(wǎng)頁資源,這些資源中的很多資源被設(shè)計成促進特定功能的執(zhí)行,該特定功能諸如銀行、預(yù)定酒店預(yù)約、購物等,或者被設(shè)計成提供結(jié)構(gòu)化信息,諸如在線百科全書、電影數(shù)據(jù)庫等。
[0002]各種搜索引擎可用于標識通過因特網(wǎng)可訪問的特定資源。這些搜索引擎對各種網(wǎng)頁資源爬行并且建索引。搜索引擎然后使用該索引來確定哪些資源最多地響應(yīng)于搜索查詢并且響應(yīng)于該查詢來提供鏈接至這些資源的搜索結(jié)果。
[0003]隨著平板電腦和智能電話的出現(xiàn),現(xiàn)在提供了大量本機應(yīng)用,其促進通過使用網(wǎng)頁資源促進的相同功能的執(zhí)行。然而,搜索引擎沒有對來自本機應(yīng)用環(huán)境內(nèi)的信息爬行或者建索引。相反,對與本機應(yīng)用相關(guān)的元數(shù)據(jù)建索引并且然后當(dāng)處理搜索查詢時訪問。
【發(fā)明內(nèi)容】
[0004]本說明書描述與對本機應(yīng)用的應(yīng)用頁面建索引相關(guān)的技術(shù)。
[0005]總體上,本說明書中所描述的主題的一個新穎性方面可以用如下方法來實施,該方法包括以下動作:實例化對用戶設(shè)備的操作系統(tǒng)進行仿真的虛擬機;在所述虛擬機內(nèi)實例化本機應(yīng)用,所述本機應(yīng)用生成應(yīng)用頁面以用于在用戶設(shè)備上、在所述本機應(yīng)用內(nèi)顯示,所述本機應(yīng)用獨立于能夠在所述用戶設(shè)備上操作的瀏覽器應(yīng)用來操作;在所述虛擬機內(nèi)訪問所述本機應(yīng)用的應(yīng)用頁面,并且對于所述應(yīng)用頁面中的每個應(yīng)用頁面:生成描述所述應(yīng)用頁面的內(nèi)容的應(yīng)用頁面數(shù)據(jù),由所述應(yīng)用頁面數(shù)據(jù)描述的內(nèi)容包括在用戶設(shè)備顯示所述應(yīng)用頁面時所述用戶設(shè)備在所述應(yīng)用頁面上顯示的文本,以及在由搜索引擎可搜索的索引中針對所述本機應(yīng)用對所述應(yīng)用頁面數(shù)據(jù)建索引。這一方面的其它實施例包括被配置成執(zhí)行在計算機存儲設(shè)備上編碼的方法的動作的對應(yīng)的系統(tǒng)、裝置和計算機程序。
[0006]本說明書中所描述的主題的另一新穎性方面可以在如下方法中實施,該方法包括以下動作:響應(yīng)于搜索查詢來接收第一搜索結(jié)果,所述搜索結(jié)果中的每個搜索結(jié)果引用能夠在用戶設(shè)備上的瀏覽器應(yīng)用中被渲染的資源并且包括至所述資源的鏈接,所述第一搜索結(jié)果響應(yīng)于對能夠在所述瀏覽器應(yīng)用中被渲染的資源的第一索引的搜索而生成;響應(yīng)于所述查詢來接收至少一個第二搜索結(jié)果,所述第二搜索結(jié)果指定獨立于能夠在所述用戶設(shè)備上操作的瀏覽器應(yīng)用來操作的本機應(yīng)用,所述第二搜索結(jié)果響應(yīng)于對能夠在用戶設(shè)備上、在所述本機應(yīng)用內(nèi)顯示的應(yīng)用頁面的第二索引的搜索而生成;以及提供所述第一搜索結(jié)果和所述第二搜索結(jié)果以用于在用戶設(shè)備上顯示。這一方面的其它實施例包括被配置成執(zhí)行在計算機存儲設(shè)備上編碼的方法的動作的對應(yīng)的系統(tǒng)、裝置和計算機程序。
[0007]本說明書中所描述的主題的另一新穎性方面可以在如下方法中實施,該方法包括以下動作:在操作系統(tǒng)環(huán)境內(nèi)實例化本機應(yīng)用,所述本機應(yīng)用生成應(yīng)用頁面以用于在用戶設(shè)備上、在所述本機應(yīng)用內(nèi)顯示,所述本機應(yīng)用獨立于能夠在所述用戶設(shè)備上操作的瀏覽器應(yīng)用來操作;在所述操作系統(tǒng)環(huán)境內(nèi)訪問所述本機應(yīng)用的應(yīng)用頁面,并且對于所述應(yīng)用頁面中的每個應(yīng)用頁面:提取描述所述應(yīng)用頁面的內(nèi)容的應(yīng)用頁面數(shù)據(jù),所述應(yīng)用頁面數(shù)據(jù)是被提供至所述本機應(yīng)用的渲染過程的數(shù)據(jù),其中所述渲染過程接收所述應(yīng)用頁面數(shù)據(jù)并且基于所述應(yīng)用頁面數(shù)據(jù)來渲染所述應(yīng)用頁面的所述內(nèi)容,以及將所述應(yīng)用頁面數(shù)據(jù)與所述應(yīng)用頁面的應(yīng)用頁面標識符和所述本機應(yīng)用的本機應(yīng)用標識符關(guān)聯(lián)。這一方面的其它實施例包括被配置成執(zhí)行在計算機存儲設(shè)備上編碼的方法的動作的對應(yīng)的系統(tǒng)、裝置和計算機程序。
[0008]本說明書中所描述的主題的特定實施例可以被實現(xiàn)以便實現(xiàn)下面的優(yōu)點中的一個或多個。本機應(yīng)用頁面的應(yīng)用頁面索引中所存儲的信息取自實際應(yīng)用頁面數(shù)據(jù),并且因此可以提供如下應(yīng)用內(nèi)容的描述,其相比由在本機應(yīng)用外部并且描述本機應(yīng)用的元數(shù)據(jù)所提供的應(yīng)用內(nèi)容的描述更全面。這又可以向搜索引擎提供確定相關(guān)測量的能力,其比基于描述本機應(yīng)用的元數(shù)據(jù)的相關(guān)測量更精確。特別地,本機應(yīng)用頁面的應(yīng)用頁面索引向搜索引擎提供針對本機應(yīng)用出現(xiàn)搜索結(jié)果的能力,其考慮在本機應(yīng)用的應(yīng)用頁面內(nèi)提供的實際數(shù)據(jù)。這可能比僅依賴于描述本機應(yīng)用的元數(shù)據(jù)(諸如本機應(yīng)用的標題和描述)更精確,并且還解除了發(fā)布者對元數(shù)據(jù)執(zhí)行搜索引擎優(yōu)化以確保響應(yīng)于特定查詢來標識本機應(yīng)用。
[0009]其中以二進制形式來訪問應(yīng)用頁面數(shù)據(jù)的實現(xiàn)降低了可能在使用取得這樣的數(shù)據(jù)的技術(shù)的情況下產(chǎn)生的描述錯誤(諸如光學(xué)字符標識錯誤)的可能性。另外,以二進制形式訪問數(shù)據(jù)還標識可能從視口上被隱藏的數(shù)據(jù),諸如在其中可滾動的元件必須被致動以在應(yīng)用環(huán)境內(nèi)移動視口的情況下。應(yīng)用頁面數(shù)據(jù)的采集將本機應(yīng)用用作應(yīng)用頁面數(shù)據(jù)的源,并且因此描述應(yīng)用的數(shù)據(jù)的采集可以按照比從多個不同網(wǎng)站采集元數(shù)據(jù)更及時的方式來完成。同樣,以這一方式采集應(yīng)用頁面數(shù)據(jù)比從多個不同網(wǎng)站采集元數(shù)據(jù)更可擴展。
[0010]下面在附圖和描述中闡述本說明書中所描述的主題的一個或多個實施例的細節(jié)。該主題的其它特征、方面和優(yōu)點根據(jù)描述、附圖和權(quán)利要求將變得顯而易見。
【附圖說明】
[0011]圖1是在其中針對本機應(yīng)用對應(yīng)用頁面建索引和搜索的示例環(huán)境的框圖。
[0012]圖2是用于對本機應(yīng)用的應(yīng)用頁面數(shù)據(jù)建索引的示例過程的流程圖。
[0013]圖3是包括本機應(yīng)用搜索結(jié)果的搜索結(jié)果頁面的圖示。
[0014]圖4是提供用于網(wǎng)頁資源和應(yīng)用頁面資源的搜索結(jié)果的示例過程的流程圖。
[0015]圖5是提取過程的系統(tǒng)流程圖。
[0016]圖6A是應(yīng)用頁面用戶界面的圖示。
[0017]圖6B是在渲染應(yīng)用頁面用戶界面的渲染過程中使用的種類和對象的圖示。
[0018]圖6C是描述應(yīng)用頁面的內(nèi)容的應(yīng)用頁面數(shù)據(jù)的示例。
[0019]各個附圖中相似的附圖標記和名稱表示相似的元素。
【具體實施方式】
[0020]系統(tǒng)對本機應(yīng)用的應(yīng)用頁面爬行和建索引。如本文中所使用的,本機應(yīng)用生成應(yīng)用頁面,以用于在本機應(yīng)用的環(huán)境內(nèi)、在用戶設(shè)備上顯示,并且獨立于該用戶設(shè)備上的瀏覽器應(yīng)用來操作。本機應(yīng)用是被特別地設(shè)計成在特定用戶設(shè)備操作系統(tǒng)和機器固件上運行的應(yīng)用。本機應(yīng)用因此不同于基于瀏覽器的應(yīng)用和瀏覽器渲染的資源。后者在每次將全部或者至少一些元素或者指令實例化或者渲染時需要從網(wǎng)頁服務(wù)來下載它們。另外,基于瀏覽器的應(yīng)用和瀏覽器渲染的資源可以由瀏覽器內(nèi)的所有網(wǎng)頁能力移動設(shè)備來處理并且因此不是操作系統(tǒng)特定的。
[0021]為了針對本機應(yīng)用對數(shù)據(jù)建索引,系統(tǒng)實例化對用戶設(shè)備上操作的操作系統(tǒng)進行仿真的虛擬機。在該虛擬機內(nèi),系統(tǒng)實例化專用于該操作系統(tǒng)的本機應(yīng)用。該本機應(yīng)用生成應(yīng)用頁面,用于在該用戶設(shè)備上、在該本機應(yīng)用內(nèi)顯示,并且獨立于該用戶設(shè)備上的瀏覽器應(yīng)用來操作。
[0022]在該虛擬機內(nèi),該系統(tǒng)訪問該本機應(yīng)用的應(yīng)用頁面。該系統(tǒng)可以通過開發(fā)用于每個應(yīng)用頁面和每個隨后的應(yīng)用頁面的各種菜單和選擇選項的自動過程來訪問頁面。備選地,該系統(tǒng)可以訪問由本機應(yīng)用的發(fā)布者指定的頁面。
[0023]對于每個應(yīng)用頁面,該系統(tǒng)生成描述應(yīng)用頁面的內(nèi)容的應(yīng)用頁面數(shù)據(jù)。通過應(yīng)用頁面描述的內(nèi)容可以例如包括:在用戶設(shè)備顯示應(yīng)用頁面時該用戶設(shè)備在該應(yīng)用頁面上顯示的文本;將應(yīng)用頁面的圖像定義為要在本機應(yīng)用中渲染的圖像數(shù)據(jù);描述應(yīng)用頁面的各種列表和菜單的列表/菜單數(shù)據(jù);以及描述應(yīng)用頁面的其它特征的其它數(shù)據(jù)。
[0024]然后在由搜索引擎可搜索的索引中,針對本機應(yīng)用對應(yīng)用頁面建索引。該搜索引擎將如下網(wǎng)絡(luò)資源搜索結(jié)果和如下本機應(yīng)用搜索結(jié)果進行組合,其中該網(wǎng)絡(luò)資源搜索結(jié)果參考能夠在用戶設(shè)備上的瀏覽器應(yīng)用中被渲染的網(wǎng)絡(luò)資源,該本機應(yīng)用搜索結(jié)果指定了本機應(yīng)用。該本機應(yīng)用搜索結(jié)果部分響應(yīng)于搜索用于本機應(yīng)用的應(yīng)用頁面的索引來生成。
[0025]下面更詳細地描述對應(yīng)用頁面數(shù)據(jù)建索引的系統(tǒng)的操作和用于應(yīng)用頁面的搜索結(jié)果的處理。
[0026]圖1是在其中針對本機應(yīng)用對應(yīng)用頁面建索引和