欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

網(wǎng)頁(yè)相關(guān)性檢測(cè)方法及裝置制造方法

文檔序號(hào):6636503閱讀:249來(lái)源:國(guó)知局
網(wǎng)頁(yè)相關(guān)性檢測(cè)方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種網(wǎng)頁(yè)相關(guān)性檢測(cè)方法及裝置。該網(wǎng)頁(yè)相關(guān)性檢測(cè)方法包括:獲取多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接,其中,多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接分別位于多個(gè)外部網(wǎng)頁(yè)上;分別獲取多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容;分別判斷多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容中是否包括預(yù)設(shè)目標(biāo)關(guān)鍵詞;根據(jù)判斷結(jié)果分別統(tǒng)計(jì)預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù);根據(jù)預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù)分別計(jì)算多個(gè)外部網(wǎng)頁(yè)和目標(biāo)網(wǎng)頁(yè)的相關(guān)性。通過(guò)本發(fā)明,解決了網(wǎng)頁(yè)相關(guān)性檢測(cè)執(zhí)行效率低的問(wèn)題,進(jìn)而通過(guò)自動(dòng)獲取多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容并自動(dòng)統(tǒng)計(jì)預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù),達(dá)到了提高網(wǎng)頁(yè)相關(guān)性檢測(cè)執(zhí)行效率的效果。
【專利說(shuō)明】網(wǎng)頁(yè)相關(guān)性檢測(cè)方法及裝置

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,具體而言,涉及一種網(wǎng)頁(yè)相關(guān)性檢測(cè)方法及裝置。

【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)搜索已經(jīng)成了人們獲取信息的主要途徑之一。在搜索引 擎中如果想要網(wǎng)站信息容易被搜索到,需要排在搜索結(jié)果頁(yè)中較為靠前的位置。因此,網(wǎng)站 在搜索引擎搜索結(jié)果頁(yè)中排名靠前非常重要?,F(xiàn)有技術(shù)中主流的搜索引擎排序算法均涉及 到很多因素,除了受到網(wǎng)站文本內(nèi)容的影響之外,一個(gè)網(wǎng)站的外部鏈接數(shù)量的多少與質(zhì)量 的好壞也占有相當(dāng)大的比重。網(wǎng)站的外部鏈接,即指其他網(wǎng)站上有鏈向自己網(wǎng)站的鏈接。 高質(zhì)量的外部鏈接能夠有效的提高網(wǎng)站自身的權(quán)重值,從而影響該網(wǎng)站在搜索引擎中的排 名。低質(zhì)量的外部鏈接不僅不會(huì)提高網(wǎng)站自身的權(quán)重值,反而會(huì)降低網(wǎng)站在搜索引擎中的 排名。因此,需要一套合理有效的方式評(píng)判一個(gè)網(wǎng)站外部鏈接的質(zhì)量,來(lái)幫助網(wǎng)站進(jìn)行有效 的部署和篩選網(wǎng)站的外部鏈接,為網(wǎng)站增加高質(zhì)量外部鏈接、減少低質(zhì)量外部鏈接、拒絕垃 圾外部鏈接提供可靠的數(shù)據(jù)依據(jù)。
[0003] -般情況下,網(wǎng)站的外部鏈接分布在各類不同內(nèi)容的網(wǎng)站上,搜索引擎會(huì)根據(jù)這 些網(wǎng)站的權(quán)重和與被鏈接網(wǎng)站的相關(guān)性,來(lái)評(píng)判被鏈接網(wǎng)站的外部環(huán)境。在這里,外部鏈接 質(zhì)量用于衡量外部鏈接網(wǎng)站的權(quán)重和內(nèi)容相關(guān)性,該值越大的網(wǎng)頁(yè)說(shuō)明外部鏈接網(wǎng)站對(duì)自 身網(wǎng)站帶來(lái)的正面影響就越高。因此評(píng)價(jià)一個(gè)外部鏈接的質(zhì)量,從兩個(gè)方面考核,即該外部 鏈接網(wǎng)站的權(quán)重和與被鏈接網(wǎng)站的內(nèi)容相關(guān)性。
[0004] 現(xiàn)有的解決方案采用搜索引擎提供的外部鏈接數(shù)據(jù)接口,由第三方網(wǎng)站或者搜索 引擎自身的站長(zhǎng)工具獲取網(wǎng)站所有的外部鏈接數(shù)據(jù)。然后通過(guò)人工查看外部鏈接發(fā)布的網(wǎng) 站,和外部鏈接發(fā)布的內(nèi)容,逐一排查外部鏈接網(wǎng)站的網(wǎng)站權(quán)重、頁(yè)面質(zhì)量、內(nèi)容相關(guān)性等 等。這種方法,尤其是在進(jìn)行網(wǎng)頁(yè)內(nèi)容相關(guān)性檢測(cè)時(shí),需要花費(fèi)大量的人工時(shí)間來(lái)進(jìn)行查看 與判斷,效率很低;并且存在一定的主觀性,準(zhǔn)確率也比較低;同時(shí),人工排查網(wǎng)站外部鏈 接的分布情況,并不能使網(wǎng)站對(duì)外部鏈接情況有一個(gè)直觀清晰的認(rèn)識(shí),難以根據(jù)現(xiàn)有的外 部鏈接數(shù)據(jù)去指導(dǎo)網(wǎng)站下一步的鏈接建設(shè)。
[0005] 針對(duì)相關(guān)技術(shù)中網(wǎng)頁(yè)相關(guān)性檢測(cè)執(zhí)行效率低的問(wèn)題,目前尚未提出有效的解決方 案。


【發(fā)明內(nèi)容】

[0006] 針對(duì)現(xiàn)有的網(wǎng)頁(yè)相關(guān)性檢測(cè)執(zhí)行效率低的問(wèn)題而提出本發(fā)明,為此,本發(fā)明的主 要目的在于提供一種網(wǎng)頁(yè)相關(guān)性檢測(cè)方法及裝置,以解決上述問(wèn)題。
[0007] 為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種網(wǎng)頁(yè)相關(guān)性檢測(cè)方法。該 方法包括:獲取多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接,其中,多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接分別位于多個(gè)外部網(wǎng)頁(yè)上,多 個(gè)目標(biāo)網(wǎng)頁(yè)鏈接用于從多個(gè)外部網(wǎng)頁(yè)鏈接至目標(biāo)網(wǎng)頁(yè);分別獲取多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi) 容;將多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容與預(yù)設(shè)目標(biāo)關(guān)鍵詞進(jìn)行對(duì)比,分別判斷多個(gè)外部網(wǎng)頁(yè)的頁(yè) 面內(nèi)容中是否包括預(yù)設(shè)目標(biāo)關(guān)鍵詞,得到判斷結(jié)果;根據(jù)判斷結(jié)果分別統(tǒng)計(jì)預(yù)設(shè)目標(biāo)關(guān)鍵 詞在多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù);根據(jù)預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù)分別 計(jì)算多個(gè)外部網(wǎng)頁(yè)和目標(biāo)網(wǎng)頁(yè)的相關(guān)性。
[0008] 進(jìn)一步地,根據(jù)預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù)分別計(jì)算多個(gè)外部 網(wǎng)頁(yè)和目標(biāo)網(wǎng)頁(yè)的相關(guān)性之前,該方法還包括:分別統(tǒng)計(jì)多個(gè)外部網(wǎng)頁(yè)包含的關(guān)鍵詞的個(gè) 數(shù),按照以下公式計(jì)算多個(gè)外部網(wǎng)頁(yè)中每個(gè)外部網(wǎng)頁(yè)和目標(biāo)網(wǎng)頁(yè)的相關(guān)性:Re = C1/C2,其 中,Re為多個(gè)外部網(wǎng)頁(yè)中每個(gè)外部網(wǎng)頁(yè)和目標(biāo)網(wǎng)頁(yè)的相關(guān)性,Cl為預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個(gè) 外部網(wǎng)頁(yè)中每個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù),C2為多個(gè)外部網(wǎng)頁(yè)中每個(gè)外部網(wǎng)頁(yè)包含的關(guān)鍵詞 的個(gè)數(shù)。
[0009] 進(jìn)一步地,多個(gè)外部網(wǎng)頁(yè)位于外部網(wǎng)站上,根據(jù)預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個(gè)外部網(wǎng)頁(yè) 中出現(xiàn)的次數(shù)分別計(jì)算多個(gè)外部網(wǎng)頁(yè)和目標(biāo)網(wǎng)頁(yè)的相關(guān)性之后,該方法還包括:獲取外部 網(wǎng)站的權(quán)重;分別獲取多個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù);根據(jù)外部網(wǎng)站的權(quán)重、多個(gè)外部網(wǎng)頁(yè)的 權(quán)重系數(shù)和相關(guān)性,檢測(cè)目標(biāo)網(wǎng)頁(yè)的鏈接的質(zhì)量。
[0010] 進(jìn)一步地,分別獲取多個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù)包括:分別確定多個(gè)外部網(wǎng)頁(yè)所在 的目錄層級(jí);根據(jù)目錄層級(jí)分別計(jì)算多個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù)。
[0011] 進(jìn)一步地,獲取多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接之后,該方法還包括:根據(jù)多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接, 確定外部網(wǎng)站的域名;判斷外部網(wǎng)站的域名是否滿足預(yù)設(shè)條件;如果外部網(wǎng)站的域名不滿 足預(yù)設(shè)條件,則確定目標(biāo)網(wǎng)頁(yè)的鏈接的質(zhì)量為預(yù)設(shè)質(zhì)量,獲取外部網(wǎng)站的權(quán)重包括:如果外 部網(wǎng)站的域名滿足預(yù)設(shè)條件,則獲取外部網(wǎng)站的權(quán)重。
[0012] 進(jìn)一步地,根據(jù)多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接,確定外部網(wǎng)站的域名之前,該方法還包括:創(chuàng) 建預(yù)設(shè)域名數(shù)據(jù)庫(kù),其中,預(yù)設(shè)域名數(shù)據(jù)庫(kù)包含多個(gè)預(yù)設(shè)域名和多個(gè)預(yù)設(shè)域名對(duì)應(yīng)的網(wǎng)站 的性質(zhì),判斷外部網(wǎng)站的域名是否滿足預(yù)設(shè)條件包括:從預(yù)設(shè)域名數(shù)據(jù)庫(kù)中獲取外部網(wǎng)站 的域名對(duì)應(yīng)的網(wǎng)站的性質(zhì);以及判斷外部網(wǎng)站的域名對(duì)應(yīng)的網(wǎng)站的性質(zhì)是否滿足預(yù)設(shè)條 件。
[0013] 進(jìn)一步地,根據(jù)外部網(wǎng)站的權(quán)重、多個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù)和相關(guān)性,檢測(cè)目標(biāo)網(wǎng) 頁(yè)的鏈接的質(zhì)量包括:根據(jù)外部網(wǎng)站的權(quán)重、多個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù)和相關(guān)性,分別檢測(cè) 多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的質(zhì)量,分別獲取多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的質(zhì)量;統(tǒng)計(jì)多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的 個(gè)數(shù);通過(guò)多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的質(zhì)量和多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的個(gè)數(shù)獲取目標(biāo)網(wǎng)頁(yè)的鏈接的質(zhì) 量。
[0014] 進(jìn)一步地,根據(jù)外部網(wǎng)站的權(quán)重、多個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù)和相關(guān)性,分別檢測(cè)多 個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的質(zhì)量包括:分別確定外部網(wǎng)站的權(quán)重和相關(guān)性的比例系數(shù),其中,比例 系數(shù)用于表征外部網(wǎng)站的權(quán)重或相關(guān)性在網(wǎng)頁(yè)鏈接的質(zhì)量檢測(cè)中的重要程度,比例系數(shù)越 大,重要程度越強(qiáng);按照以下公式分別檢測(cè)多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的質(zhì)量:R = Ql*Q2*kl+X*k2, 其中,R為表征多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接中每個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的質(zhì)量的值,R越大,每個(gè)目標(biāo)網(wǎng)頁(yè) 鏈接的質(zhì)量越好,Ql為外部網(wǎng)站的權(quán)重,Q2為多個(gè)外部網(wǎng)頁(yè)中每個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù),X 為多個(gè)外部網(wǎng)頁(yè)中每個(gè)外部網(wǎng)頁(yè)與目標(biāo)網(wǎng)頁(yè)的相關(guān)性,kl為外部網(wǎng)站的權(quán)重的比例系數(shù), k2為相關(guān)性的比例系數(shù)。
[0015] 為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種網(wǎng)頁(yè)相關(guān)性檢測(cè)裝置,該 裝置包括:第一獲取單元,用于獲取多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接,其中,多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接分別位于 多個(gè)外部網(wǎng)頁(yè)上,多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接用于從多個(gè)外部網(wǎng)頁(yè)鏈接至目標(biāo)網(wǎng)頁(yè);第二獲取單元, 用于分別獲取多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容;判斷單元,用于將多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容與預(yù) 設(shè)目標(biāo)關(guān)鍵詞進(jìn)行對(duì)比,分別判斷多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容中是否包括預(yù)設(shè)目標(biāo)關(guān)鍵詞, 得到判斷結(jié)果;統(tǒng)計(jì)單元,用于根據(jù)判斷結(jié)果分別統(tǒng)計(jì)預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個(gè)外部網(wǎng)頁(yè)中 出現(xiàn)的次數(shù);計(jì)算單元,用于根據(jù)預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù)分別計(jì)算 多個(gè)外部網(wǎng)頁(yè)和目標(biāo)網(wǎng)頁(yè)的相關(guān)性。
[0016] 進(jìn)一步地,裝置還包括:第三獲取單元,用于獲取外部網(wǎng)站的權(quán)重;第四獲取單 元,用于分別獲取多個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù);檢測(cè)單元,用于根據(jù)外部網(wǎng)站的權(quán)重、多個(gè)外 部網(wǎng)頁(yè)的權(quán)重系數(shù)和相關(guān)性,檢測(cè)目標(biāo)網(wǎng)頁(yè)的鏈接的質(zhì)量。
[0017] 通過(guò)本發(fā)明,采用包括以下步驟的方法:獲取多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接,其中,多個(gè)目標(biāo) 網(wǎng)頁(yè)鏈接分別位于多個(gè)外部網(wǎng)頁(yè)上,多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接用于從多個(gè)外部網(wǎng)頁(yè)鏈接至目標(biāo)網(wǎng) 頁(yè);分別獲取多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容;將多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容與預(yù)設(shè)目標(biāo)關(guān)鍵詞進(jìn) 行對(duì)比,分別判斷多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容中是否包括預(yù)設(shè)目標(biāo)關(guān)鍵詞,得到判斷結(jié)果;根 據(jù)判斷結(jié)果分別統(tǒng)計(jì)預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù);根據(jù)預(yù)設(shè)目標(biāo)關(guān)鍵詞 在多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù)分別計(jì)算多個(gè)外部網(wǎng)頁(yè)和目標(biāo)網(wǎng)頁(yè)的相關(guān)性,解決了網(wǎng)頁(yè)相 關(guān)性檢測(cè)執(zhí)行效率低的問(wèn)題,進(jìn)而通過(guò)自動(dòng)獲取多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容并自動(dòng)統(tǒng)計(jì)預(yù)設(shè) 目標(biāo)關(guān)鍵詞在多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù),達(dá)到了提高網(wǎng)頁(yè)相關(guān)性檢測(cè)執(zhí)行效率的效果。

【專利附圖】

【附圖說(shuō)明】
[0018] 構(gòu)成本申請(qǐng)的一部分的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí) 施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0019] 圖1是根據(jù)本發(fā)明的根據(jù)本發(fā)明的網(wǎng)頁(yè)相關(guān)性檢測(cè)的第一實(shí)施例的流程圖;
[0020] 圖2是根據(jù)本發(fā)明的網(wǎng)頁(yè)相關(guān)性檢測(cè)的第二實(shí)施例的流程圖;
[0021] 圖3是根據(jù)本發(fā)明的網(wǎng)頁(yè)相關(guān)性檢測(cè)的第三實(shí)施例的流程圖;
[0022] 圖4是根據(jù)本發(fā)明的網(wǎng)頁(yè)相關(guān)性檢測(cè)裝置的第一實(shí)施例的示意圖;以及
[0023] 圖5是根據(jù)本發(fā)明的網(wǎng)頁(yè)相關(guān)性檢測(cè)裝置的第二實(shí)施例的示意圖。

【具體實(shí)施方式】
[0024] 為了使本【技術(shù)領(lǐng)域】的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的 附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是 本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù) 人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范 圍。
[0025] 需要說(shuō)明的是,本發(fā)明的說(shuō)明書和權(quán)利要求書及上述附圖中的術(shù)語(yǔ)"第一"、"第 二"等是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。此外,術(shù)語(yǔ)"包括" 和"具有"以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單 元的過(guò)程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒(méi) 有清楚地列出的或?qū)τ谶@些過(guò)程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
[0026] 在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將 參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明。
[0027] 圖1是根據(jù)本發(fā)明的網(wǎng)頁(yè)相關(guān)性檢測(cè)的第一實(shí)施例的流程圖。如圖1所示,該方 法包括步驟S102至步驟Sl 10。
[0028] 步驟S102,獲取多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接,其中,多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接分別位于多個(gè)外部網(wǎng) 頁(yè)上,多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接用于從多個(gè)外部網(wǎng)頁(yè)鏈接至目標(biāo)網(wǎng)頁(yè)。
[0029] 目標(biāo)網(wǎng)頁(yè)鏈接可以為一個(gè)網(wǎng)站的外部鏈接,網(wǎng)站的外部鏈接往往分布在各類不同 內(nèi)容的多個(gè)外部網(wǎng)頁(yè)上,這里,多個(gè)外部網(wǎng)頁(yè)可以位于一個(gè)網(wǎng)站,也可以位于不同的網(wǎng)站。 通過(guò)外部鏈接可以鏈接到目標(biāo)網(wǎng)頁(yè)。目標(biāo)網(wǎng)頁(yè)通常是投放該外部鏈接的網(wǎng)站的網(wǎng)頁(yè)。外 部網(wǎng)頁(yè)是部署了能鏈接到目標(biāo)網(wǎng)頁(yè)的鏈接的具體頁(yè)面,以網(wǎng)頁(yè)的形式存在于外部網(wǎng)站上, 一般具有較大的訪客量,通過(guò)部署在外部網(wǎng)頁(yè)的外部鏈接,可以起到增加投放網(wǎng)站的訪問(wèn) 量的效果。根據(jù)訪問(wèn)情況,投放網(wǎng)站可以優(yōu)化自身網(wǎng)站的外部環(huán)境,提升搜索引擎的認(rèn)可 度。一般來(lái)說(shuō),可以由第三方網(wǎng)站或者搜索引擎自身的站長(zhǎng)工具獲取網(wǎng)站所有的外部鏈接 數(shù)據(jù)??梢詫@取的目標(biāo)網(wǎng)頁(yè)鏈接數(shù)據(jù)存儲(chǔ)于數(shù)據(jù)表中,如表1所示。
[0030] 表 1
[0031]

【權(quán)利要求】
1. 一種網(wǎng)頁(yè)相關(guān)性檢測(cè)方法,其特征在于,包括: 獲取多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接,其中,所述多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接分別位于多個(gè)外部網(wǎng)頁(yè)上,所述 多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接用于從所述多個(gè)外部網(wǎng)頁(yè)鏈接至目標(biāo)網(wǎng)頁(yè); 分別獲取所述多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容; 將所述多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容與預(yù)設(shè)目標(biāo)關(guān)鍵詞進(jìn)行對(duì)比,分別判斷所述多個(gè)外部 網(wǎng)頁(yè)的頁(yè)面內(nèi)容中是否包括所述預(yù)設(shè)目標(biāo)關(guān)鍵詞,得到判斷結(jié)果; 根據(jù)所述判斷結(jié)果分別統(tǒng)計(jì)所述預(yù)設(shè)目標(biāo)關(guān)鍵詞在所述多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù); 以及 根據(jù)所述預(yù)設(shè)目標(biāo)關(guān)鍵詞在所述多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù)分別計(jì)算所述多個(gè)外部 網(wǎng)頁(yè)和所述目標(biāo)網(wǎng)頁(yè)的相關(guān)性。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于, 根據(jù)所述預(yù)設(shè)目標(biāo)關(guān)鍵詞在所述多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù)分別計(jì)算所述多個(gè)外部 網(wǎng)頁(yè)和所述目標(biāo)網(wǎng)頁(yè)的相關(guān)性之前,所述方法還包括:分別統(tǒng)計(jì)所述多個(gè)外部網(wǎng)頁(yè)包含的 關(guān)鍵詞的個(gè)數(shù), 按照以下公式計(jì)算所述多個(gè)外部網(wǎng)頁(yè)中每個(gè)外部網(wǎng)頁(yè)和所述目標(biāo)網(wǎng)頁(yè)的相關(guān)性: = (VC2,其中,&為所述多個(gè)外部網(wǎng)頁(yè)中每個(gè)外部網(wǎng)頁(yè)和所述目標(biāo)網(wǎng)頁(yè)的相關(guān)性,Ci 為所述預(yù)設(shè)目標(biāo)關(guān)鍵詞在所述多個(gè)外部網(wǎng)頁(yè)中每個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù),C2為所述多個(gè) 外部網(wǎng)頁(yè)中每個(gè)外部網(wǎng)頁(yè)包含的關(guān)鍵詞的個(gè)數(shù)。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述多個(gè)外部網(wǎng)頁(yè)位于外部網(wǎng)站上,根據(jù) 所述預(yù)設(shè)目標(biāo)關(guān)鍵詞在所述多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù)分別計(jì)算所述多個(gè)外部網(wǎng)頁(yè)和所 述目標(biāo)網(wǎng)頁(yè)的相關(guān)性之后,所述方法還包括: 犾取所述外部網(wǎng)站的權(quán)重; 分別獲取所述多個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù);以及 根據(jù)所述外部網(wǎng)站的權(quán)重、所述多個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù)和所述相關(guān)性,檢測(cè)所述目 標(biāo)網(wǎng)頁(yè)的鏈接的質(zhì)量。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,分別獲取所述多個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù) 包括: 分別確定所述多個(gè)外部網(wǎng)頁(yè)所在的目錄層級(jí);以及 根據(jù)所述目錄層級(jí)分別計(jì)算所述多個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù)。
5. 根據(jù)權(quán)利要求3所述的方法,其特征在于, 獲取多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接之后,所述方法還包括: 根據(jù)所述多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接,確定所述外部網(wǎng)站的域名; 判斷所述外部網(wǎng)站的域名是否滿足預(yù)設(shè)條件;以及 如果所述外部網(wǎng)站的域名不滿足預(yù)設(shè)條件,則確定所述目標(biāo)網(wǎng)頁(yè)的鏈接的質(zhì)量為預(yù)設(shè) 質(zhì)量, 獲取所述外部網(wǎng)站的權(quán)重包括:如果所述外部網(wǎng)站的域名滿足預(yù)設(shè)條件,則獲取所述 外部網(wǎng)站的權(quán)重。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于, 根據(jù)所述多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接,確定所述外部網(wǎng)站的域名之前,所述方法還包括:創(chuàng)建預(yù) 設(shè)域名數(shù)據(jù)庫(kù),其中,所述預(yù)設(shè)域名數(shù)據(jù)庫(kù)包含多個(gè)預(yù)設(shè)域名和所述多個(gè)預(yù)設(shè)域名對(duì)應(yīng)的 網(wǎng)站的性質(zhì), 判斷所述外部網(wǎng)站的域名是否滿足預(yù)設(shè)條件包括:從所述預(yù)設(shè)域名數(shù)據(jù)庫(kù)中獲取所述 外部網(wǎng)站的域名對(duì)應(yīng)的網(wǎng)站的性質(zhì);以及判斷所述外部網(wǎng)站的域名對(duì)應(yīng)的網(wǎng)站的性質(zhì)是否 滿足預(yù)設(shè)條件。
7. 根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)所述外部網(wǎng)站的權(quán)重、所述多個(gè)外部 網(wǎng)頁(yè)的權(quán)重系數(shù)和所述相關(guān)性,檢測(cè)所述目標(biāo)網(wǎng)頁(yè)的鏈接的質(zhì)量包括: 根據(jù)所述外部網(wǎng)站的權(quán)重、所述多個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù)和所述相關(guān)性,分別檢測(cè)所 述多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的質(zhì)量,分別獲取所述多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的質(zhì)量; 統(tǒng)計(jì)所述多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的個(gè)數(shù);以及 通過(guò)所述多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的質(zhì)量和所述多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的個(gè)數(shù)獲取所述目標(biāo)網(wǎng) 頁(yè)的鏈接的質(zhì)量。
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,根據(jù)所述外部網(wǎng)站的權(quán)重、所述多個(gè)外部 網(wǎng)頁(yè)的權(quán)重系數(shù)和所述相關(guān)性,分別檢測(cè)所述多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的質(zhì)量包括: 分別確定所述外部網(wǎng)站的權(quán)重和所述相關(guān)性的比例系數(shù),其中,所述比例系數(shù)用于表 征所述外部網(wǎng)站的權(quán)重或所述相關(guān)性在網(wǎng)頁(yè)鏈接的質(zhì)量檢測(cè)中的重要程度,所述比例系數(shù) 越大,重要程度越強(qiáng); 按照以下公式分別檢測(cè)所述多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的質(zhì)量: R = Q^Qdki+X*!^, 其中,R為表征所述多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接中每個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的質(zhì)量的值,R越大,所述 每個(gè)目標(biāo)網(wǎng)頁(yè)鏈接的質(zhì)量越好,Qi為所述外部網(wǎng)站的權(quán)重,Q2為所述多個(gè)外部網(wǎng)頁(yè)中每個(gè) 外部網(wǎng)頁(yè)的權(quán)重系數(shù),X為所述多個(gè)外部網(wǎng)頁(yè)中每個(gè)外部網(wǎng)頁(yè)與所述目標(biāo)網(wǎng)頁(yè)的相關(guān)性,& 為所述外部網(wǎng)站的權(quán)重的比例系數(shù),k2為所述相關(guān)性的比例系數(shù)。
9. 一種網(wǎng)頁(yè)相關(guān)性檢測(cè)裝置,其特征在于,包括: 第一獲取單元,用于獲取多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接,其中,所述多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接分別位于多 個(gè)外部網(wǎng)頁(yè)上,所述多個(gè)目標(biāo)網(wǎng)頁(yè)鏈接用于從所述多個(gè)外部網(wǎng)頁(yè)鏈接至目標(biāo)網(wǎng)頁(yè); 第二獲取單元,用于分別獲取所述多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容; 判斷單元,用于將所述多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容與預(yù)設(shè)目標(biāo)關(guān)鍵詞進(jìn)行對(duì)比,分別判 斷所述多個(gè)外部網(wǎng)頁(yè)的頁(yè)面內(nèi)容中是否包括所述預(yù)設(shè)目標(biāo)關(guān)鍵詞,得到判斷結(jié)果; 統(tǒng)計(jì)單元,用于根據(jù)所述判斷結(jié)果分別統(tǒng)計(jì)所述預(yù)設(shè)目標(biāo)關(guān)鍵詞在所述多個(gè)外部網(wǎng)頁(yè) 中出現(xiàn)的次數(shù);以及 計(jì)算單元,用于根據(jù)所述預(yù)設(shè)目標(biāo)關(guān)鍵詞在所述多個(gè)外部網(wǎng)頁(yè)中出現(xiàn)的次數(shù)分別計(jì)算 所述多個(gè)外部網(wǎng)頁(yè)和所述目標(biāo)網(wǎng)頁(yè)的相關(guān)性。
10. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述裝置還包括: 第三獲取單元,用于獲取所述外部網(wǎng)站的權(quán)重; 第四獲取單元,用于分別獲取所述多個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù);以及 檢測(cè)單元,用于根據(jù)所述外部網(wǎng)站的權(quán)重、所述多個(gè)外部網(wǎng)頁(yè)的權(quán)重系數(shù)和所述相關(guān) 性,檢測(cè)所述目標(biāo)網(wǎng)頁(yè)的鏈接的質(zhì)量。
【文檔編號(hào)】G06F17/30GK104391955SQ201410709438
【公開日】2015年3月4日 申請(qǐng)日期:2014年11月27日 優(yōu)先權(quán)日:2014年11月27日
【發(fā)明者】楊韜, 王曉群, 祁文, 譚紫萱 申請(qǐng)人:北京國(guó)雙科技有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
玉林市| 茂名市| 景东| 甘孜县| 泰顺县| 延津县| 平陆县| 桐梓县| 革吉县| 基隆市| 江陵县| 黔东| 德格县| 旅游| 托里县| 文安县| 聂拉木县| 武威市| 婺源县| 赞皇县| 巴青县| 那曲县| 东兰县| 启东市| 万宁市| 泾川县| 道孚县| 洛阳市| 东宁县| 新郑市| 洞头县| 娱乐| 山阴县| 休宁县| 志丹县| 怀化市| 桃园县| 天峨县| 诸城市| 宁明县| 宁海县|