欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

網(wǎng)頁(yè)標(biāo)題的確定方法和裝置制造方法

文檔序號(hào):6632563閱讀:116來(lái)源:國(guó)知局
網(wǎng)頁(yè)標(biāo)題的確定方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種網(wǎng)頁(yè)標(biāo)題的確定方法和裝置,該方法包括:獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本;從所述一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。本發(fā)明實(shí)施例從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為該網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題,能夠提供簡(jiǎn)潔又能準(zhǔn)確、客觀地概括網(wǎng)頁(yè)內(nèi)容的網(wǎng)頁(yè)標(biāo)題。
【專利說(shuō)明】網(wǎng)頁(yè)標(biāo)題的確定方法和裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,特別是一種網(wǎng)頁(yè)標(biāo)題的確定方法和裝置。

【背景技術(shù)】
[0002]網(wǎng)頁(yè)標(biāo)題是對(duì)一個(gè)網(wǎng)頁(yè)的高度概括,它體現(xiàn)了網(wǎng)頁(yè)的核心內(nèi)容。搜索算法通常會(huì)對(duì)標(biāo)題中的詞賦予更高權(quán)重,因而網(wǎng)頁(yè)標(biāo)題在SE0(Search Engine Optimizat1n,搜索引擎優(yōu)化)中非常重要。站長(zhǎng)會(huì)在網(wǎng)頁(yè)標(biāo)題中加入很多關(guān)鍵詞,如一些重復(fù)或與網(wǎng)頁(yè)內(nèi)容不相關(guān)的關(guān)鍵詞,從而導(dǎo)致標(biāo)題很長(zhǎng)。例如下面這個(gè)標(biāo)題,“Android(安卓)開發(fā)視頻教程-老羅Android開發(fā)視頻教程-視頻教程-移動(dòng)開發(fā)門戶”,而實(shí)質(zhì)上該標(biāo)題中真正有價(jià)值的信息是“老羅Android開發(fā)視頻教程”。長(zhǎng)標(biāo)題不會(huì)對(duì)用戶的瀏覽產(chǎn)生實(shí)質(zhì)性影響,然而對(duì)于屏幕大小有限的終端(如手機(jī))會(huì)導(dǎo)致明顯的屏幕顯示空間浪費(fèi)。
[0003]相關(guān)技術(shù)中,搜索引擎對(duì)標(biāo)題進(jìn)行截?cái)嗵幚?,然而截?cái)喙潭ㄩL(zhǎng)度效果顯然不好。因而,如何提供簡(jiǎn)潔又能概括網(wǎng)頁(yè)內(nèi)容的網(wǎng)頁(yè)標(biāo)題成為目前亟待解決的技術(shù)問(wèn)題。


【發(fā)明內(nèi)容】

[0004]鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的網(wǎng)頁(yè)標(biāo)題的確定方法和相應(yīng)的裝置。
[0005]依據(jù)本發(fā)明的一個(gè)方面,提供了一種網(wǎng)頁(yè)標(biāo)題的確定方法,包括:獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本;從所述一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。
[0006]可選地,所述獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本,包括:解析待確定標(biāo)題的網(wǎng)頁(yè),確定指向所述網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接;獲取所述一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。
[0007]可選地,所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本對(duì)應(yīng)一個(gè)或多個(gè)外部鏈接。
[0008]可選地,獲取所述一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本,包括:獲取所述一個(gè)或多個(gè)外部鏈接中每個(gè)外部鏈接對(duì)應(yīng)的錨文本;對(duì)獲取的所述一個(gè)或多個(gè)外部鏈接中每個(gè)外部鏈接對(duì)應(yīng)的錨文本進(jìn)行聚類,生成錨文本的多個(gè)分組,其中,每個(gè)分組中的錨文本相同;將所述多個(gè)分組各自對(duì)應(yīng)的錨文本作為所述一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。
[0009]可選地,從所述一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題,包括:確定所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的等級(jí);選擇指定等級(jí)的錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。
[0010]可選地,確定所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的等級(jí),包括:獲取所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的參數(shù)值;根據(jù)獲取的所述每個(gè)錨文本的參數(shù)值,計(jì)算所述每個(gè)錨文本的等級(jí)。
[0011]可選地,根據(jù)獲取的所述每個(gè)錨文本的參數(shù)值,計(jì)算所述每個(gè)錨文本的等級(jí),包括:確定所述每個(gè)錨文本的參數(shù)值各自的權(quán)重;對(duì)所述每個(gè)錨文本的參數(shù)值進(jìn)行加權(quán)處理,計(jì)算所述每個(gè)錨文本的等級(jí)。
[0012]可選地,所述指定等級(jí)為最聞等級(jí)。
[0013]可選地,所述每個(gè)錨文本的參數(shù)值包括下列至少之一:
[0014]每個(gè)錨文本對(duì)應(yīng)的外部鏈接的總數(shù);
[0015]每個(gè)錨文本對(duì)應(yīng)的、與所述網(wǎng)頁(yè)的統(tǒng)一資源定位符URL同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù);
[0016]每個(gè)錨文本對(duì)應(yīng)的、與所述網(wǎng)頁(yè)的URL不同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù);
[0017]每個(gè)錨文本對(duì)應(yīng)的外部鏈接所在網(wǎng)頁(yè)的網(wǎng)頁(yè)等級(jí)PageRank ;
[0018]每個(gè)錨文本對(duì)應(yīng)的外部鏈接被點(diǎn)擊的次數(shù)。
[0019]依據(jù)本發(fā)明的另一個(gè)方面,還提供了一種網(wǎng)頁(yè)標(biāo)題的確定裝置,包括:
[0020]獲取模塊,適于獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本;
[0021]選擇模塊,適于從所述一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。
[0022]可選地,所述獲取模塊還適于:解析待確定標(biāo)題的網(wǎng)頁(yè),確定指向所述網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接;獲取所述一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。
[0023]可選地,所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本對(duì)應(yīng)一個(gè)或多個(gè)外部鏈接。
[0024]可選地,所述獲取模塊還適于:獲取所述一個(gè)或多個(gè)外部鏈接中每個(gè)外部鏈接對(duì)應(yīng)的錨文本;對(duì)獲取的所述一個(gè)或多個(gè)外部鏈接中每個(gè)外部鏈接對(duì)應(yīng)的錨文本進(jìn)行聚類,生成錨文本的多個(gè)分組,其中,每個(gè)分組中的錨文本相同;將所述多個(gè)分組各自對(duì)應(yīng)的錨文本作為所述一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。
[0025]可選地,所述選擇模塊還適于:確定所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的等級(jí);選擇指定等級(jí)的錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。
[0026]可選地,所述選擇模塊還適于:獲取所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的參數(shù)值;根據(jù)獲取的所述每個(gè)錨文本的參數(shù)值,計(jì)算所述每個(gè)錨文本的等級(jí)。
[0027]可選地,所述選擇模塊還適于:確定所述每個(gè)錨文本的參數(shù)值各自的權(quán)重;對(duì)所述每個(gè)錨文本的參數(shù)值進(jìn)行加權(quán)處理,計(jì)算所述每個(gè)錨文本的等級(jí)。
[0028]可選地,所述指定等級(jí)為最高等級(jí)。
[0029]可選地,所述每個(gè)錨文本的參數(shù)值包括下列至少之一:
[0030]每個(gè)錨文本對(duì)應(yīng)的外部鏈接的總數(shù);
[0031]每個(gè)錨文本對(duì)應(yīng)的、與所述網(wǎng)頁(yè)的統(tǒng)一資源定位符URL同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù);
[0032]每個(gè)錨文本對(duì)應(yīng)的、與所述網(wǎng)頁(yè)的URL不同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù);
[0033]每個(gè)錨文本對(duì)應(yīng)的外部鏈接所在網(wǎng)頁(yè)的網(wǎng)頁(yè)等級(jí)PageRank ;
[0034]每個(gè)錨文本對(duì)應(yīng)的外部鏈接被點(diǎn)擊的次數(shù)。
[0035]依據(jù)本發(fā)明提供的技術(shù)方案,獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本,進(jìn)而從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為該網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。外部鏈接對(duì)應(yīng)的錨文本是其他網(wǎng)頁(yè)對(duì)外部鏈接所指向網(wǎng)頁(yè)的一種描述,能夠準(zhǔn)確描述所指向網(wǎng)頁(yè)的內(nèi)容。本發(fā)明從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)更加合適的錨文本作為網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題,其對(duì)該所指向網(wǎng)頁(yè)的描述在格式或字?jǐn)?shù)上體現(xiàn)為更加簡(jiǎn)潔,且不會(huì)被加入不相關(guān)的關(guān)鍵詞,使得對(duì)網(wǎng)頁(yè)的描述更為準(zhǔn)確、客觀。綜上可知,本發(fā)明從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為該網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題,能夠提供簡(jiǎn)潔又能準(zhǔn)確、客觀地概括網(wǎng)頁(yè)內(nèi)容的網(wǎng)頁(yè)標(biāo)題。
[0036]上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。
[0037]根據(jù)下文結(jié)合附圖對(duì)本發(fā)明具體實(shí)施例的詳細(xì)描述,本領(lǐng)域技術(shù)人員將會(huì)更加明了本發(fā)明的上述以及其他目的、優(yōu)點(diǎn)和特征。

【專利附圖】

【附圖說(shuō)明】
[0038]通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0039]圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的網(wǎng)頁(yè)標(biāo)題的確定方法的流程圖;
[0040]圖2示出了以原本的網(wǎng)頁(yè)標(biāo)題作為移動(dòng)終端(如手機(jī))搜索結(jié)果中顯示的標(biāo)題的示意圖;
[0041]圖3示出了采用本發(fā)明的以錨文本作為網(wǎng)頁(yè)標(biāo)題在移動(dòng)終端搜索結(jié)果中顯示的示意圖;以及
[0042]圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的網(wǎng)頁(yè)標(biāo)題的確定裝置的結(jié)構(gòu)示意圖。

【具體實(shí)施方式】
[0043]下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0044]為解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供了一種網(wǎng)頁(yè)標(biāo)題的確定方法,圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的網(wǎng)頁(yè)標(biāo)題的確定方法的流程圖。如圖1所示,該方法至少包括以下步驟S102至步驟S104。
[0045]步驟S102、獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。
[0046]步驟S104、從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。
[0047]依據(jù)本發(fā)明提供的技術(shù)方案,獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本,進(jìn)而從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為該網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。外部鏈接對(duì)應(yīng)的錨文本是其他網(wǎng)頁(yè)對(duì)外部鏈接所指向網(wǎng)頁(yè)的一種描述,能夠準(zhǔn)確描述所指向網(wǎng)頁(yè)的內(nèi)容。本發(fā)明從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)更加合適的錨文本作為網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題,其對(duì)該所指向網(wǎng)頁(yè)的描述在格式或字?jǐn)?shù)上體現(xiàn)為更加簡(jiǎn)潔,且不會(huì)被加入不相關(guān)的關(guān)鍵詞,使得對(duì)網(wǎng)頁(yè)的描述更為準(zhǔn)確、客觀。綜上可知,本發(fā)明從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為該網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題,能夠提供簡(jiǎn)潔又能準(zhǔn)確、客觀地概括網(wǎng)頁(yè)內(nèi)容的網(wǎng)頁(yè)標(biāo)題。
[0048]上文步驟S102提及的外部鏈接是指從別的網(wǎng)站導(dǎo)入到自己網(wǎng)站的鏈接,且該鏈接對(duì)應(yīng)的錨文本能夠準(zhǔn)確描述該鏈接所指向網(wǎng)頁(yè)的內(nèi)容,該錨文本的形式如文本或圖片的形式等。舉例來(lái)說(shuō),待確定標(biāo)題的網(wǎng)頁(yè)為B網(wǎng)站的網(wǎng)頁(yè)b,從A網(wǎng)站的鏈接“B網(wǎng)站的網(wǎng)頁(yè)b”導(dǎo)入到B網(wǎng)站的網(wǎng)頁(yè)b,那么A網(wǎng)站的鏈接“B網(wǎng)站的網(wǎng)頁(yè)b”可以作為指向待確定標(biāo)題的網(wǎng)頁(yè)(即B網(wǎng)站的網(wǎng)頁(yè)b)的外部鏈接,這里鏈接對(duì)應(yīng)的錨文本為“B網(wǎng)站的網(wǎng)頁(yè)b”,準(zhǔn)確描述了 B網(wǎng)站的網(wǎng)頁(yè)b的內(nèi)容。錨文本“B網(wǎng)站的網(wǎng)頁(yè)b”的形式可以是以文本形式或圖片形式。進(jìn)一步地,可以通過(guò)解析待確定標(biāo)題的網(wǎng)頁(yè),確定指向網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接,進(jìn)而獲取一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。例如,可以通過(guò)解析待確定標(biāo)題的網(wǎng)頁(yè),得到網(wǎng)頁(yè)抓取器抓取的網(wǎng)頁(yè)之間的鏈接關(guān)系,進(jìn)而確定指向網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接,其中,網(wǎng)頁(yè)抓取器可以是網(wǎng)絡(luò)爬蟲、網(wǎng)頁(yè)蜘蛛、網(wǎng)絡(luò)機(jī)器人等。
[0049]上文步驟S104提及的網(wǎng)頁(yè)標(biāo)題可以是搜索結(jié)果中顯示的標(biāo)題,或搜索引擎收錄網(wǎng)頁(yè)時(shí)記錄的標(biāo)題等。在傳統(tǒng)的搜索引擎中,會(huì)直接使用網(wǎng)頁(yè)所在站點(diǎn)的站長(zhǎng)或管理員為該網(wǎng)頁(yè)制作或確定的網(wǎng)頁(yè)標(biāo)題(即網(wǎng)頁(yè)的原本的網(wǎng)頁(yè)標(biāo)題)作為搜索結(jié)果中顯示的標(biāo)題或搜索引擎收錄網(wǎng)頁(yè)時(shí)記錄的標(biāo)題。然而,如前文介紹,由于網(wǎng)頁(yè)標(biāo)題在SE0中非常重要,因而站長(zhǎng)或管理員會(huì)在網(wǎng)頁(yè)標(biāo)題中加入很多關(guān)鍵詞,導(dǎo)致標(biāo)題很長(zhǎng)。長(zhǎng)標(biāo)題不會(huì)對(duì)用戶的瀏覽產(chǎn)生實(shí)質(zhì)性影響,而對(duì)于屏幕大小有限的終端(如手機(jī))會(huì)導(dǎo)致明顯的屏幕顯示空間浪費(fèi)。本發(fā)明實(shí)施例從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本替代網(wǎng)頁(yè)的原本的網(wǎng)頁(yè)標(biāo)題作為網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題,能夠提供簡(jiǎn)潔又能準(zhǔn)確、客觀地概括網(wǎng)頁(yè)內(nèi)容的網(wǎng)頁(yè)標(biāo)題。
[0050]若一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本對(duì)應(yīng)一個(gè)或多個(gè)外部鏈接,本發(fā)明提供了一種優(yōu)選的聚類的方法來(lái)獲取一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本,在該方案中,可以獲取一個(gè)或多個(gè)外部鏈接中每個(gè)外部鏈接對(duì)應(yīng)的錨文本,進(jìn)而對(duì)獲取的一個(gè)或多個(gè)外部鏈接中每個(gè)外部鏈接對(duì)應(yīng)的錨文本進(jìn)行聚類,生成錨文本的多個(gè)分組,其中,每個(gè)分組中的錨文本相同。之后將多個(gè)分組各自對(duì)應(yīng)的錨文本作為一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。舉例來(lái)說(shuō),指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接為鏈接1、鏈接2、鏈接3、鏈接4、鏈接5、鏈接6,每個(gè)鏈接對(duì)應(yīng)的錨文本分別為錨文本A、錨文本B、錨文本C、錨文本B、錨文本C、錨文本D,此時(shí)可以對(duì)這些錨文本進(jìn)行聚類分析,將相同錨文本聚類到一個(gè)分組,這樣得到多個(gè)分組,進(jìn)而得到的一個(gè)或多個(gè)不同的錨文本為錨文本A、錨文本B、錨文本C以及錨文本D。
[0051]在步驟S102獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本之后,步驟S104從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題,可以通過(guò)多種方式來(lái)實(shí)現(xiàn),如根據(jù)錨文本的文本長(zhǎng)度或錨文本的等級(jí),下面將詳細(xì)介紹這兩種方式。
[0052]方式一,根據(jù)錨文本的文本長(zhǎng)度從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本的方式。在方式一中,可以確定一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的文本長(zhǎng)度,隨后從文本長(zhǎng)度小于或等于指定長(zhǎng)度的錨文本中選擇一個(gè)錨文本替代原本的網(wǎng)頁(yè)標(biāo)題作為網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。這里的指定長(zhǎng)度可以根據(jù)實(shí)際情況或需求來(lái)確定,如根據(jù)呈現(xiàn)搜索結(jié)果的終端的尺寸來(lái)確定或者將多個(gè)錨文本長(zhǎng)度的平均值作為指定長(zhǎng)度等等。
[0053]方式二,根據(jù)錨文本的等級(jí)從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本的方式。在方式二中,可以確定一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的等級(jí),隨后選擇指定等級(jí)的錨文本作為該網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。進(jìn)一步地,本發(fā)明提供了一種優(yōu)選的確定一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的等級(jí)的方案,即可以獲取一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的參數(shù)值,進(jìn)而根據(jù)獲取的每個(gè)錨文本的參數(shù)值,計(jì)算每個(gè)錨文本的等級(jí)。這里,每個(gè)錨文本的參數(shù)值可以是每個(gè)錨文本對(duì)應(yīng)的外部鏈接的總數(shù),每個(gè)錨文本對(duì)應(yīng)的、與網(wǎng)頁(yè)的統(tǒng)一資源定位符URL同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù),每個(gè)錨文本對(duì)應(yīng)的、與網(wǎng)頁(yè)的URL不同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù),每個(gè)錨文本對(duì)應(yīng)的外部鏈接所在網(wǎng)頁(yè)的網(wǎng)頁(yè)等級(jí)PageRank,每個(gè)錨文本對(duì)應(yīng)的外部鏈接被點(diǎn)擊的次數(shù),等等。
[0054]由每個(gè)錨文本的參數(shù)值計(jì)算每個(gè)錨文本的等級(jí),可以優(yōu)選地實(shí)施為確定每個(gè)錨文本的參數(shù)值各自的權(quán)重,并對(duì)每個(gè)錨文本的參數(shù)值進(jìn)行加權(quán)處理,計(jì)算每個(gè)錨文本的等級(jí)。舉例來(lái)說(shuō),獲取一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的參數(shù)值為P1、P2、P3、P4、P5,分別表示每個(gè)錨文本對(duì)應(yīng)的外部鏈接的總數(shù),每個(gè)錨文本對(duì)應(yīng)的、與網(wǎng)頁(yè)的統(tǒng)一資源定位符URL同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù),每個(gè)錨文本對(duì)應(yīng)的、與網(wǎng)頁(yè)的URL不同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù),每個(gè)錨文本對(duì)應(yīng)的外部鏈接所在網(wǎng)頁(yè)的網(wǎng)頁(yè)等級(jí)PageRank,每個(gè)錨文本對(duì)應(yīng)的外部鏈接被點(diǎn)擊的次數(shù)。確定每個(gè)錨文本的參數(shù)值各自的權(quán)重分別為al、a2、a3、a4、a5,根據(jù)每個(gè)錨文本的參數(shù)值P1、P2、P3、P4、P5以及每個(gè)錨文本的參數(shù)值各自的權(quán)重al、a2、a3、a4、a5,對(duì)每個(gè)錨文本的參數(shù)值中的一個(gè)或多個(gè)進(jìn)行加權(quán)處理,得到每個(gè)錨文本的等級(jí)。
[0055]此外,可以對(duì)計(jì)算得到的每個(gè)錨文本的等級(jí)進(jìn)行排序,選擇排在最前面的等級(jí)(即最高等級(jí))的錨文本作為指定等級(jí)的錨文本。
[0056]另外,還可以結(jié)合上述方式一和方式二來(lái)從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本。例如,首先確定出文本長(zhǎng)度小于或等于指定長(zhǎng)度的錨文本,然后計(jì)算確定出的錨文本的等級(jí),進(jìn)而選擇指定等級(jí)的錨文本作為網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。又例如,將文本長(zhǎng)度作為每個(gè)錨文本的參數(shù)值,進(jìn)而計(jì)算每個(gè)錨文本的等級(jí),進(jìn)而選擇指定等級(jí)的錨文本作為網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。當(dāng)然,上述列舉僅是示意性的,還可以有其它結(jié)合的方式均適用于本發(fā)明。
[0057]下面通過(guò)一具體實(shí)施例來(lái)詳細(xì)介紹本發(fā)明提供的網(wǎng)頁(yè)標(biāo)題的確定方法。該具體實(shí)施例是以網(wǎng)頁(yè)標(biāo)題為搜索結(jié)果中顯示的標(biāo)題為例,圖2示出了以原本的網(wǎng)頁(yè)標(biāo)題作為移動(dòng)終端(如手機(jī))搜索結(jié)果中顯示的標(biāo)題的示意圖,可以發(fā)現(xiàn)原本的網(wǎng)頁(yè)標(biāo)題“Android開發(fā)視頻教程_老羅Android開發(fā)視頻教程-視頻教程_移動(dòng)開發(fā)門戶”在移動(dòng)終端上顯不過(guò)長(zhǎng),導(dǎo)致明顯的屏幕顯示空間浪費(fèi)。圖3示出了采用本發(fā)明的以錨文本作為網(wǎng)頁(yè)標(biāo)題在移動(dòng)終端搜索結(jié)果中顯示的示意圖,從多個(gè)錨文本中選擇的一個(gè)錨文本“老羅Android開發(fā)視頻教程”替代了原本的網(wǎng)頁(yè)標(biāo)題“Android開發(fā)視頻教程-老羅Android開發(fā)視頻教程-視頻教程-移動(dòng)開發(fā)門戶”,使得標(biāo)題更加簡(jiǎn)潔而不損失信息,并能夠節(jié)省屏幕顯示空間位置,節(jié)省的位置可以展示更多的搜索結(jié)果。
[0058]基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例還提供了一種網(wǎng)頁(yè)標(biāo)題的確定裝置,以實(shí)現(xiàn)上述網(wǎng)頁(yè)標(biāo)題的確定方法。
[0059]圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的網(wǎng)頁(yè)標(biāo)題的確定裝置的結(jié)構(gòu)示意圖。參見圖4,該裝置至少包括:獲取模塊410以及選擇模塊420。
[0060]現(xiàn)介紹本發(fā)明實(shí)施例的網(wǎng)頁(yè)標(biāo)題的確定裝置的各組成或器件的功能以及各部分間的連接關(guān)系:
[0061]獲取模塊410,適于獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本;
[0062]選擇模塊420,與獲取模塊410相耦合,適于從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。
[0063]在一個(gè)實(shí)施例中,獲取模塊410還適于:解析待確定標(biāo)題的網(wǎng)頁(yè),確定指向網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接;獲取一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。例如,可以通過(guò)解析待確定標(biāo)題的網(wǎng)頁(yè),得到網(wǎng)頁(yè)抓取器抓取的網(wǎng)頁(yè)之間的鏈接關(guān)系,進(jìn)而確定指向網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接,其中,網(wǎng)頁(yè)抓取器可以是網(wǎng)絡(luò)爬蟲、網(wǎng)頁(yè)蜘蛛、網(wǎng)絡(luò)機(jī)器人坐寸。
[0064]在一個(gè)實(shí)施例中,一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本對(duì)應(yīng)一個(gè)或多個(gè)外部鏈接。
[0065]在一個(gè)實(shí)施例中,獲取模塊410還適于通過(guò)聚類的方法來(lái)獲取一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本,即獲取一個(gè)或多個(gè)外部鏈接中每個(gè)外部鏈接對(duì)應(yīng)的錨文本;對(duì)獲取的一個(gè)或多個(gè)外部鏈接中每個(gè)外部鏈接對(duì)應(yīng)的錨文本進(jìn)行聚類,生成錨文本的多個(gè)分組,其中,每個(gè)分組中的錨文本相同;將多個(gè)分組各自對(duì)應(yīng)的錨文本作為一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。
[0066]在一個(gè)實(shí)施例中,選擇模塊420還適于:確定一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的等級(jí);選擇指定等級(jí)的錨文本作為網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。
[0067]在一個(gè)實(shí)施例中,選擇模塊420還適于:獲取一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的參數(shù)值;根據(jù)獲取的每個(gè)錨文本的參數(shù)值,計(jì)算每個(gè)錨文本的等級(jí)。
[0068]在一個(gè)實(shí)施例中,選擇模塊420還適于:確定每個(gè)錨文本的參數(shù)值各自的權(quán)重;對(duì)每個(gè)錨文本的參數(shù)值進(jìn)行加權(quán)處理,計(jì)算每個(gè)錨文本的等級(jí)。
[0069]在一個(gè)實(shí)施例中,指定等級(jí)為最聞等級(jí)??梢詫?duì)計(jì)算得到的每個(gè)鋪文本的等級(jí)進(jìn)行排序,選擇排在最前面的等級(jí)(即最高等級(jí))的錨文本作為指定等級(jí)的錨文本。
[0070]在一個(gè)實(shí)施例中,每個(gè)錨文本的參數(shù)值包括下列至少之一:
[0071]每個(gè)錨文本對(duì)應(yīng)的外部鏈接的總數(shù);
[0072]每個(gè)錨文本對(duì)應(yīng)的、與網(wǎng)頁(yè)的統(tǒng)一資源定位符URL同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù);
[0073]每個(gè)錨文本對(duì)應(yīng)的、與網(wǎng)頁(yè)的URL不同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù);
[0074]每個(gè)錨文本對(duì)應(yīng)的外部鏈接所在網(wǎng)頁(yè)的網(wǎng)頁(yè)等級(jí)PageRank ;
[0075]每個(gè)錨文本對(duì)應(yīng)的外部鏈接被點(diǎn)擊的次數(shù)。
[0076]根據(jù)上述任意一個(gè)優(yōu)選實(shí)施例或多個(gè)優(yōu)選實(shí)施例的組合,本發(fā)明實(shí)施例能夠達(dá)到如下有益效果:
[0077]依據(jù)本發(fā)明提供的技術(shù)方案,獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本,進(jìn)而從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為該網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。外部鏈接對(duì)應(yīng)的錨文本是其他網(wǎng)頁(yè)對(duì)外部鏈接所指向網(wǎng)頁(yè)的一種描述,能夠準(zhǔn)確描述所指向網(wǎng)頁(yè)的內(nèi)容。本發(fā)明從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)更加合適的錨文本作為網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題,其對(duì)該所指向網(wǎng)頁(yè)的描述在格式或字?jǐn)?shù)上體現(xiàn)為更加簡(jiǎn)潔,且不會(huì)被加入不相關(guān)的關(guān)鍵詞,使得對(duì)網(wǎng)頁(yè)的描述更為準(zhǔn)確、客觀。綜上可知,本發(fā)明從一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為該網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題,能夠提供簡(jiǎn)潔又能準(zhǔn)確、客觀地概括網(wǎng)頁(yè)內(nèi)容的網(wǎng)頁(yè)標(biāo)題。
[0078]本發(fā)明還公開了:
[0079]A1、一種網(wǎng)頁(yè)標(biāo)題的確定方法,包括:
[0080]獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本;
[0081]從所述一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。
[0082]A2、根據(jù)A1所述的方法,其中,所述獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本,包括:
[0083]解析待確定標(biāo)題的網(wǎng)頁(yè),確定指向所述網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接;
[0084]獲取所述一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。
[0085]A3、根據(jù)A1-A2任一項(xiàng)所述的方法,其中,所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本對(duì)應(yīng)一個(gè)或多個(gè)外部鏈接。
[0086]A4、根據(jù)A1-A3任一項(xiàng)所述的方法,其中,獲取所述一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本,包括:
[0087]獲取所述一個(gè)或多個(gè)外部鏈接中每個(gè)外部鏈接對(duì)應(yīng)的錨文本;
[0088]對(duì)獲取的所述一個(gè)或多個(gè)外部鏈接中每個(gè)外部鏈接對(duì)應(yīng)的錨文本進(jìn)行聚類,生成錨文本的多個(gè)分組,其中,每個(gè)分組中的錨文本相同;
[0089]將所述多個(gè)分組各自對(duì)應(yīng)的錨文本作為所述一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。
[0090]A5、根據(jù)A1-A4任一項(xiàng)所述的方法,其中,從所述一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題,包括:
[0091]確定所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的等級(jí);
[0092]選擇指定等級(jí)的錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。
[0093]A6、根據(jù)A1-A5任一項(xiàng)所述的方法,其中,確定所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的等級(jí),包括:
[0094]獲取所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的參數(shù)值;
[0095]根據(jù)獲取的所述每個(gè)錨文本的參數(shù)值,計(jì)算所述每個(gè)錨文本的等級(jí)。
[0096]A7、根據(jù)A1-A6任一項(xiàng)所述的方法,其中,根據(jù)獲取的所述每個(gè)錨文本的參數(shù)值,計(jì)算所述每個(gè)錨文本的等級(jí),包括:
[0097]確定所述每個(gè)錨文本的參數(shù)值各自的權(quán)重;
[0098]對(duì)所述每個(gè)錨文本的參數(shù)值進(jìn)行加權(quán)處理,計(jì)算所述每個(gè)錨文本的等級(jí)。
[0099]A8、根據(jù)A1-A7任一項(xiàng)所述的方法,其中,所述指定等級(jí)為最聞等級(jí)。
[0100]A9、根據(jù)A1-A8任一項(xiàng)所述的方法,其中,所述每個(gè)錨文本的參數(shù)值包括下列至少之一:
[0101]每個(gè)錨文本對(duì)應(yīng)的外部鏈接的總數(shù);
[0102]每個(gè)錨文本對(duì)應(yīng)的、與所述網(wǎng)頁(yè)的統(tǒng)一資源定位符URL同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù);
[0103]每個(gè)錨文本對(duì)應(yīng)的、與所述網(wǎng)頁(yè)的URL不同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù);
[0104]每個(gè)錨文本對(duì)應(yīng)的外部鏈接所在網(wǎng)頁(yè)的網(wǎng)頁(yè)等級(jí)PageRank ;
[0105]每個(gè)錨文本對(duì)應(yīng)的外部鏈接被點(diǎn)擊的次數(shù)。
[0106]B10、一種網(wǎng)頁(yè)標(biāo)題的確定裝置,包括:
[0107]獲取模塊,適于獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本;
[0108]選擇模塊,適于從所述一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。
[0109]B11、根據(jù)B10所述的裝置,其中,所述獲取模塊還適于:
[0110]解析待確定標(biāo)題的網(wǎng)頁(yè),確定指向所述網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接;
[0111]獲取所述一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。
[0112]B12、根據(jù)B10-B11任一項(xiàng)所述的裝置,其中,所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本對(duì)應(yīng)一個(gè)或多個(gè)外部鏈接。
[0113]B13、根據(jù)B10-B12任一項(xiàng)所述的裝置,其中,所述獲取模塊還適于:
[0114]獲取所述一個(gè)或多個(gè)外部鏈接中每個(gè)外部鏈接對(duì)應(yīng)的錨文本;
[0115]對(duì)獲取的所述一個(gè)或多個(gè)外部鏈接中每個(gè)外部鏈接對(duì)應(yīng)的錨文本進(jìn)行聚類,生成錨文本的多個(gè)分組,其中,每個(gè)分組中的錨文本相同;
[0116]將所述多個(gè)分組各自對(duì)應(yīng)的錨文本作為所述一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。
[0117]B14、根據(jù)B10-B13任一項(xiàng)所述的裝置,其中,所述選擇模塊還適于:
[0118]確定所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的等級(jí);
[0119]選擇指定等級(jí)的錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。
[0120]B15、根據(jù)B10-B14任一項(xiàng)所述的裝置,其中,所述選擇模塊還適于:
[0121]獲取所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的參數(shù)值;
[0122]根據(jù)獲取的所述每個(gè)錨文本的參數(shù)值,計(jì)算所述每個(gè)錨文本的等級(jí)。
[0123]B16、根據(jù)B10-B15任一項(xiàng)所述的裝置,其中,所述選擇模塊還適于:
[0124]確定所述每個(gè)錨文本的參數(shù)值各自的權(quán)重;
[0125]對(duì)所述每個(gè)錨文本的參數(shù)值進(jìn)行加權(quán)處理,計(jì)算所述每個(gè)錨文本的等級(jí)。
[0126]B17、根據(jù)B10-B16任一項(xiàng)所述的裝置,其中,所述指定等級(jí)為最聞等級(jí)。
[0127]B18、根據(jù)B10-B17任一項(xiàng)所述的裝置,其中,所述每個(gè)錨文本的參數(shù)值包括下列至少之一:
[0128]每個(gè)錨文本對(duì)應(yīng)的外部鏈接的總數(shù);
[0129]每個(gè)錨文本對(duì)應(yīng)的、與所述網(wǎng)頁(yè)的統(tǒng)一資源定位符URL同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù);
[0130]每個(gè)錨文本對(duì)應(yīng)的、與所述網(wǎng)頁(yè)的URL不同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù);
[0131]每個(gè)錨文本對(duì)應(yīng)的外部鏈接所在網(wǎng)頁(yè)的網(wǎng)頁(yè)等級(jí)PageRank ;
[0132]每個(gè)錨文本對(duì)應(yīng)的外部鏈接被點(diǎn)擊的次數(shù)。
[0133]在此處所提供的說(shuō)明書中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書的理解。
[0134]類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
[0135]本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。
[0136]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。
[0137]本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的網(wǎng)頁(yè)標(biāo)題的確定裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
[0138]應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序。可將這些單詞解釋為名稱。
[0139]至此,本領(lǐng)域技術(shù)人員應(yīng)認(rèn)識(shí)到,雖然本文已詳盡示出和描述了本發(fā)明的多個(gè)示例性實(shí)施例,但是,在不脫離本發(fā)明精神和范圍的情況下,仍可根據(jù)本發(fā)明公開的內(nèi)容直接確定或推導(dǎo)出符合本發(fā)明原理的許多其他變型或修改。因此,本發(fā)明的范圍應(yīng)被理解和認(rèn)定為覆蓋了所有這些其他變型或修改。
【權(quán)利要求】
1.一種網(wǎng)頁(yè)標(biāo)題的確定方法,包括: 獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本; 從所述一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本,包括: 解析待確定標(biāo)題的網(wǎng)頁(yè),確定指向所述網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接; 獲取所述一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。
3.根據(jù)權(quán)利要求1-2任一項(xiàng)所述的方法,其中,所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本對(duì)應(yīng)一個(gè)或多個(gè)外部鏈接。
4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其中,獲取所述一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本,包括: 獲取所述一個(gè)或多個(gè)外部鏈接中每個(gè)外部鏈接對(duì)應(yīng)的錨文本; 對(duì)獲取的所述一個(gè)或多個(gè)外部鏈接中每個(gè)外部鏈接對(duì)應(yīng)的錨文本進(jìn)行聚類,生成錨文本的多個(gè)分組,其中,每個(gè)分組中的錨文本相同; 將所述多個(gè)分組各自對(duì)應(yīng)的錨文本作為所述一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本。
5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法,其中,從所述一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題,包括: 確定所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的等級(jí); 選擇指定等級(jí)的錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。
6.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的方法,其中,確定所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的等級(jí),包括: 獲取所述一個(gè)或多個(gè)不同的錨文本中每個(gè)錨文本的參數(shù)值; 根據(jù)獲取的所述每個(gè)錨文本的參數(shù)值,計(jì)算所述每個(gè)錨文本的等級(jí)。
7.根據(jù)權(quán)利要求1-6任一項(xiàng)所述的方法,其中,根據(jù)獲取的所述每個(gè)錨文本的參數(shù)值,計(jì)算所述每個(gè)錨文本的等級(jí),包括: 確定所述每個(gè)錨文本的參數(shù)值各自的權(quán)重; 對(duì)所述每個(gè)錨文本的參數(shù)值進(jìn)行加權(quán)處理,計(jì)算所述每個(gè)錨文本的等級(jí)。
8.根據(jù)權(quán)利要求1-7任一項(xiàng)所述的方法,其中,所述指定等級(jí)為最高等級(jí)。
9.根據(jù)權(quán)利要求1-8任一項(xiàng)所述的方法,其中,所述每個(gè)錨文本的參數(shù)值包括下列至少之一: 每個(gè)錨文本對(duì)應(yīng)的外部鏈接的總數(shù); 每個(gè)錨文本對(duì)應(yīng)的、與所述網(wǎng)頁(yè)的統(tǒng)一資源定位符URL同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù); 每個(gè)錨文本對(duì)應(yīng)的、與所述網(wǎng)頁(yè)的URL不同主域的外部鏈接所在網(wǎng)頁(yè)的總數(shù); 每個(gè)錨文本對(duì)應(yīng)的外部鏈接所在網(wǎng)頁(yè)的網(wǎng)頁(yè)等級(jí)PageRank ; 每個(gè)錨文本對(duì)應(yīng)的外部鏈接被點(diǎn)擊的次數(shù)。
10.一種網(wǎng)頁(yè)標(biāo)題的確定裝置,包括: 獲取模塊,適于獲取指向待確定標(biāo)題的網(wǎng)頁(yè)的一個(gè)或多個(gè)外部鏈接對(duì)應(yīng)的一個(gè)或多個(gè)不同的錨文本; 選擇模塊,適于從所述一個(gè)或多個(gè)不同的錨文本中選擇一個(gè)錨文本作為所述網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題。
【文檔編號(hào)】G06F17/30GK104317931SQ201410602297
【公開日】2015年1月28日 申請(qǐng)日期:2014年10月31日 優(yōu)先權(quán)日:2014年10月31日
【發(fā)明者】魏少俊 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
法库县| 武冈市| 黔江区| 上高县| 寿光市| 巴马| 徐闻县| 肃南| 凤凰县| 玉山县| 吴江市| 沭阳县| 宿州市| 西林县| 浦城县| 凤翔县| SHOW| 乌苏市| 龙游县| 孟村| 沙洋县| 满城县| 顺昌县| 隆回县| 玛纳斯县| 潞西市| 临泉县| 托克逊县| 永春县| 巴彦县| 荣昌县| 西乌珠穆沁旗| 金沙县| 精河县| 栾川县| 南陵县| 平罗县| 宁化县| 东至县| 武清区| 巴彦淖尔市|