欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

軟文展現(xiàn)次數(shù)統(tǒng)計方法和裝置與流程

文檔序號:12596110閱讀:415來源:國知局
軟文展現(xiàn)次數(shù)統(tǒng)計方法和裝置與流程

本申請涉及數(shù)據(jù)處理領(lǐng)域,具體而言,涉及一種軟文展現(xiàn)次數(shù)統(tǒng)計方法和裝置。



背景技術(shù):

軟文是一種文字廣告,例如,在報紙、雜志或網(wǎng)絡(luò)等宣傳載體上刊登的用于提升企業(yè)品牌形象和知名度,或促進(jìn)企業(yè)銷售的一些宣傳性、闡釋性文章,包括特定的新聞報道、深度文章、付費短文廣告、案例分析等。一些企業(yè)基于提高品牌聲譽度或增加品牌曝光量等原因,會制作出一批基于品牌關(guān)鍵詞或者產(chǎn)品關(guān)鍵詞的軟文,然后將軟文在眾多外部網(wǎng)站上進(jìn)行投放。

為了分析軟文的投放效果,通常需要統(tǒng)計所投放的軟文在搜索端的這些特定關(guān)鍵詞的搜索結(jié)果中的展現(xiàn)次數(shù)和排名情況?,F(xiàn)有技術(shù)中通過人工搜索關(guān)鍵詞,然后打開搜索結(jié)果頁的每一個鏈接,查看相應(yīng)網(wǎng)頁內(nèi)容并統(tǒng)計軟文的展現(xiàn)數(shù)量以及軟文的排名情況。這種人工操作的方式不僅效率低,而且統(tǒng)計結(jié)果容易出錯。

針對相關(guān)技術(shù)中通過人工方式統(tǒng)計軟文的展現(xiàn)次數(shù)效率較低的問題,目前尚未提出有效的解決方案。



技術(shù)實現(xiàn)要素:

本申請的主要目的在于提供一種軟文展現(xiàn)次數(shù)統(tǒng)計方法和裝置,以解決相關(guān)技術(shù)中通過人工方式統(tǒng)計軟文的展現(xiàn)次數(shù)效率較低的問題。

為了實現(xiàn)上述目的,根據(jù)本申請的一個方面,提供了一種軟文展現(xiàn)次數(shù)統(tǒng)計方法。該方法包括:獲取多個網(wǎng)頁內(nèi)容,其中,多個網(wǎng)頁內(nèi)容為搜索結(jié)果頁中的多個網(wǎng)頁的內(nèi)容;分別計算多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離;分別根據(jù)多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離判斷各個網(wǎng)頁內(nèi)容是否與目標(biāo)軟文相同;以及統(tǒng)計多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的數(shù)量,作為目標(biāo)軟文的展現(xiàn)次數(shù)。

進(jìn)一步地,多個網(wǎng)頁內(nèi)容包括第一網(wǎng)頁內(nèi)容,分別根據(jù)多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離判斷各個網(wǎng)頁內(nèi)容是否與目標(biāo)軟文相同包括:統(tǒng)計目標(biāo)軟文的長度;計算第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值;判斷第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值是否小于 第一閾值;當(dāng)判斷出第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值小于第一閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文相同;以及當(dāng)判斷出第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值不小于第一閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文不相同。

進(jìn)一步地,多個網(wǎng)頁內(nèi)容包括第一網(wǎng)頁內(nèi)容,分別計算多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離包括計算第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離,計算第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離包括:分別對第一網(wǎng)頁內(nèi)容和目標(biāo)軟文進(jìn)行分塊,得到第一內(nèi)容塊列表和第二內(nèi)容塊列表,其中,第一內(nèi)容塊列表為第一網(wǎng)頁內(nèi)容分塊后得到的內(nèi)容塊列表,第二內(nèi)容塊列表為目標(biāo)軟文分塊后得到的內(nèi)容塊列表;以及分別計算第一內(nèi)容塊列表中各個內(nèi)容塊與第二內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離。

進(jìn)一步地,分別根據(jù)多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離判斷各個網(wǎng)頁內(nèi)容是否與目標(biāo)軟文相同包括:根據(jù)第一內(nèi)容塊列表中各個內(nèi)容塊與第二內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離獲取第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊;分別統(tǒng)計第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度;計算第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值;判斷第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值是否大于第二閾值;當(dāng)判斷出第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值大于第二閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文相同;以及當(dāng)判斷出第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值不大于第二閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文不相同。

進(jìn)一步地,第二內(nèi)容塊列表包括第一內(nèi)容塊,根據(jù)第一內(nèi)容塊列表中各個內(nèi)容塊與第二內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離獲取第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊包括:統(tǒng)計第一內(nèi)容塊的長度;分別計算第一內(nèi)容塊列表中各個內(nèi)容塊與第一內(nèi)容塊的文本編輯距離與第一內(nèi)容塊的長度的比值,得到多個比值;判斷多個比值中是否存在小于第三閾值的比值;當(dāng)判斷出多個比值中不存在小于第三閾值的比值時,則確定第一內(nèi)容塊列表中不存在與第一內(nèi)容塊相同的內(nèi)容塊;以及當(dāng)判斷出多個比值中存在小于第三閾值的比值時,則確定第一內(nèi)容塊列表中存在與第一內(nèi)容塊相同的內(nèi)容塊,并獲取第一內(nèi)容塊。

進(jìn)一步地,在統(tǒng)計多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的數(shù)量,作為目標(biāo)軟文的展現(xiàn)次數(shù)之后,該方法還包括:分別獲取多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的排名;以及展示目標(biāo)軟文的展現(xiàn)次數(shù)和多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng) 頁內(nèi)容的排名。

為了實現(xiàn)上述目的,根據(jù)本申請的另一方面,提供了一種軟文展現(xiàn)次數(shù)統(tǒng)計裝置。該裝置包括:第一獲取單元,用于獲取多個網(wǎng)頁內(nèi)容,其中,多個網(wǎng)頁內(nèi)容為搜索結(jié)果頁中的多個網(wǎng)頁的內(nèi)容;計算單元,用于分別計算多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離;判斷單元,用于分別根據(jù)多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離判斷各個網(wǎng)頁內(nèi)容是否與目標(biāo)軟文相同;以及統(tǒng)計單元,用于統(tǒng)計多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的數(shù)量,作為目標(biāo)軟文的展現(xiàn)次數(shù)。

進(jìn)一步地,多個網(wǎng)頁內(nèi)容包括第一網(wǎng)頁內(nèi)容,判斷單元包括:第一統(tǒng)計模塊,用于統(tǒng)計目標(biāo)軟文的長度;第一計算模塊,用于計算第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值;第一判斷模塊,用于判斷第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值是否小于第一閾值;以及第一確定模塊,用于當(dāng)判斷出第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值小于第一閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文相同,當(dāng)判斷出第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值不小于第一閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文不相同。

進(jìn)一步地,多個網(wǎng)頁內(nèi)容包括第一網(wǎng)頁內(nèi)容,計算單元包括:分塊模塊,用于分別對第一網(wǎng)頁內(nèi)容和目標(biāo)軟文進(jìn)行分塊,得到第一內(nèi)容塊列表和第二內(nèi)容塊列表,其中,第一內(nèi)容塊列表為第一網(wǎng)頁內(nèi)容分塊后得到的內(nèi)容塊列表,第二內(nèi)容塊列表為目標(biāo)軟文分塊后得到的內(nèi)容塊列表;以及第二計算模塊,用于分別計算第一內(nèi)容塊列表中各個內(nèi)容塊與第二內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離。

進(jìn)一步地,判斷單元包括:獲取模塊,用于根據(jù)第一內(nèi)容塊列表中各個內(nèi)容塊與第二內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離獲取第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊;第二統(tǒng)計模塊,用于分別統(tǒng)計第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度;第三計算模塊,用于計算第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值;第二判斷模塊,用于判斷第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值是否大于第二閾值;以及第二確定模塊,用于當(dāng)判斷出第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值大于第二閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文相同,當(dāng)判斷出第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值不大于第二閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文不相同。

本申請通過獲取多個網(wǎng)頁內(nèi)容,其中,多個網(wǎng)頁內(nèi)容為搜索結(jié)果頁中的多個網(wǎng)頁的內(nèi)容;分別計算多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離;分別根 據(jù)多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離判斷各個網(wǎng)頁內(nèi)容是否與目標(biāo)軟文相同;以及統(tǒng)計多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的數(shù)量,作為目標(biāo)軟文的展現(xiàn)次數(shù)。本申請通過自動獲取與搜索關(guān)鍵詞匹配的所有網(wǎng)頁內(nèi)容,并根據(jù)與搜索關(guān)鍵詞匹配的所有網(wǎng)頁內(nèi)容與目標(biāo)軟文的文本編輯距離來統(tǒng)計目標(biāo)軟文的展現(xiàn)次數(shù),相比于現(xiàn)有技術(shù)中通過人工方式統(tǒng)計軟文展現(xiàn)次數(shù),速度更快,解決了相關(guān)技術(shù)中通過人工方式統(tǒng)計軟文的展現(xiàn)次數(shù)效率較低的問題,進(jìn)而達(dá)到了提高統(tǒng)計軟文的展現(xiàn)次數(shù)的效率的效果。

附圖說明

構(gòu)成本申請的一部分的附圖用來提供對本申請的進(jìn)一步理解,本申請的示意性實施例及其說明用于解釋本申請,并不構(gòu)成對本申請的不當(dāng)限定。在附圖中:

圖1是根據(jù)本申請實施例的軟文展現(xiàn)次數(shù)統(tǒng)計方法的流程圖;以及

圖2是根據(jù)本申請實施例的軟文展現(xiàn)次數(shù)統(tǒng)計裝置的示意圖。

具體實施方式

需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結(jié)合實施例來詳細(xì)說明本申請。

為了使本技術(shù)領(lǐng)域的人員更好地理解本申請方案,下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分的實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├绢I(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應(yīng)當(dāng)屬于本申請保護(hù)的范圍。

需要說明的是,本申請的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本申請的實施例。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。

根據(jù)本申請實施例,提供了一種軟文展現(xiàn)次數(shù)統(tǒng)計方法。圖1是根據(jù)本申請實施例的軟文展現(xiàn)次數(shù)統(tǒng)計方法的流程圖,如圖1所示,該方法包括如下的步驟S102至步驟S108:

步驟S102,獲取多個網(wǎng)頁內(nèi)容,其中,多個網(wǎng)頁內(nèi)容為搜索結(jié)果頁中的多個網(wǎng)頁的內(nèi)容。

本申請實施例的搜索結(jié)果頁為基于搜索關(guān)鍵詞進(jìn)行搜索得到的搜索結(jié)果頁,其中,搜索關(guān)鍵詞可以是與目標(biāo)軟文相關(guān)聯(lián)的關(guān)鍵詞,例如,如果目標(biāo)軟文是基于某個品牌關(guān)鍵詞投放的軟文,則搜索關(guān)鍵詞可以是該品牌關(guān)鍵詞、或是該品牌關(guān)鍵詞相關(guān)聯(lián)的關(guān)鍵詞等,如果目標(biāo)軟文是基于某個產(chǎn)品關(guān)鍵詞投放的軟文,搜索關(guān)鍵詞可以是該產(chǎn)品關(guān)鍵詞、或是該產(chǎn)品關(guān)鍵詞相關(guān)聯(lián)的關(guān)鍵詞等。需要說明的是,本申請實施例的搜索關(guān)鍵詞可以是一個,也可以是多個。

具體地,本申請實施例可以在接收到外部輸入的搜索關(guān)鍵詞后,通過網(wǎng)絡(luò)爬蟲去爬取該搜索關(guān)鍵詞對應(yīng)的搜索結(jié)果頁中每個網(wǎng)頁鏈接中的網(wǎng)頁內(nèi)容(即與搜索關(guān)鍵詞匹配的多個網(wǎng)頁內(nèi)容),其中,本申請實施例的網(wǎng)頁內(nèi)容是指網(wǎng)頁中的文本內(nèi)容。

步驟S104,分別計算多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離。

本申請實施例的文本編輯距離是指兩個字符串之間,由一個字符串轉(zhuǎn)成另一個字符串所需的最少編輯操作次數(shù),其中,允許的編輯操作包括將一個字符替換成另一個字符、插入一個字符和刪除一個字符,例如,兩個字符串分別為ABC與ABCD,由字符串ABC變換為字符串ABCD僅需要增加字符D,即僅需執(zhí)行一次操作,則字符串ABC和字符串ABCD的文本編輯距離為1。通常,文本編輯距離越小,兩個字符串的相似度越大。本申請實施例的目標(biāo)軟文可以是指當(dāng)前需要進(jìn)行投放效果監(jiān)測的軟文。

本申請實施例在獲取到與搜索關(guān)鍵詞匹配的多個網(wǎng)頁內(nèi)容之后,分別計算上述多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離,得到多個文本編輯距離,例如,存在10篇網(wǎng)頁內(nèi)容(即網(wǎng)頁內(nèi)容1至網(wǎng)頁內(nèi)容10)與搜索關(guān)鍵詞匹配,則分別計算網(wǎng)頁內(nèi)容1至網(wǎng)頁內(nèi)容10中各個網(wǎng)頁內(nèi)容與目標(biāo)軟文的文本編輯距離,得到10個文本編輯距離。

優(yōu)選地,為了提高統(tǒng)計結(jié)果的準(zhǔn)確性,在分別計算多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離之前,可以分別過濾多個網(wǎng)頁內(nèi)容和目標(biāo)軟文中的無效字符,其中,無效字符可以是標(biāo)點符號、空格等,再根據(jù)過濾無效字符后的多個網(wǎng)頁內(nèi)容和過濾無效字符后的目標(biāo)軟文計算文本編輯距離。

步驟S106,分別根據(jù)多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離判斷各個網(wǎng)頁內(nèi)容是否與目標(biāo)軟文相同。

本申請實施例在得到多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離之后,可以分別根據(jù)各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離判斷上述各個網(wǎng)頁內(nèi)容是否與目標(biāo)軟文相同,例如,分別將各個文本編輯距離與閾值比較,如果某個網(wǎng)頁內(nèi)容 與目標(biāo)軟文的文本編輯距離小于閾值,則確定該網(wǎng)頁內(nèi)容與目標(biāo)軟文相同,否則,則確定該網(wǎng)頁內(nèi)容與目標(biāo)軟文不相同。

步驟S108,統(tǒng)計多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的數(shù)量,作為目標(biāo)軟文的展現(xiàn)次數(shù)。

具體地,搜索關(guān)鍵詞對應(yīng)的搜索結(jié)果頁中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的數(shù)量即表示該目標(biāo)軟文在搜索結(jié)果頁的展現(xiàn)次數(shù)。在與搜索關(guān)鍵詞匹配的網(wǎng)頁內(nèi)容數(shù)量較大時,本申請實施例不僅可以大大提高統(tǒng)計效率,節(jié)省人工成本,而且可以提高統(tǒng)計結(jié)果的準(zhǔn)確性。

本申請實施例通過獲取多個網(wǎng)頁內(nèi)容,其中,多個網(wǎng)頁內(nèi)容為搜索結(jié)果頁中的多個網(wǎng)頁的內(nèi)容;分別計算多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離;分別根據(jù)多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離判斷各個網(wǎng)頁內(nèi)容是否與目標(biāo)軟文相同;以及統(tǒng)計多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的數(shù)量,作為目標(biāo)軟文的展現(xiàn)次數(shù)。本申請通過自動獲取與搜索關(guān)鍵詞匹配的所有網(wǎng)頁內(nèi)容,并根據(jù)與搜索關(guān)鍵詞匹配的所有網(wǎng)頁內(nèi)容與目標(biāo)軟文的文本編輯距離來統(tǒng)計目標(biāo)軟文的展現(xiàn)次數(shù),相比于現(xiàn)有技術(shù)中通過人工方式統(tǒng)計軟文展現(xiàn)次數(shù),速度更快,解決了相關(guān)技術(shù)中通過人工方式統(tǒng)計軟文的展現(xiàn)次數(shù)效率較低的問題,進(jìn)而達(dá)到了提高統(tǒng)計軟文的展現(xiàn)次數(shù)的效率的效果。

可選地,多個網(wǎng)頁內(nèi)容包括第一網(wǎng)頁內(nèi)容,分別根據(jù)多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離判斷各個網(wǎng)頁內(nèi)容是否與目標(biāo)軟文相同包括:統(tǒng)計目標(biāo)軟文的長度;計算第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值;判斷第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值是否小于第一閾值;當(dāng)判斷出第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值小于第一閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文相同;以及當(dāng)判斷出第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值不小于第一閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文不相同。

本申請實施例的第一網(wǎng)頁內(nèi)容可以是上述多個網(wǎng)頁內(nèi)容中任意一個網(wǎng)頁內(nèi)容,以下以第一網(wǎng)頁內(nèi)容為例對本申請實施例進(jìn)行說明。本申請實施例的目標(biāo)軟文的長度可以是目標(biāo)軟文的字符數(shù),其中,字符可以包括文字、字母和數(shù)字等。

具體地,本申請實施例通過計算第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值,并將該比值與第一閾值比較,如果該比值小于第一閾值,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文相同,如果該比值不小于第一閾值,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文不相同,其中,第一閾值可以根據(jù)目標(biāo)軟文的長度進(jìn)行設(shè)置,例如,目標(biāo)軟 文的長度較長(例如,目標(biāo)軟文的長度超過2000)時,相應(yīng)地可以將第一閾值設(shè)置的大一些(例如,設(shè)置第一閾值為0.38),目標(biāo)軟文的長度較短(例如,目標(biāo)軟文的長度小于500)時,相應(yīng)地可以將第一閾值設(shè)置的小一些(例如,設(shè)置第一閾值為0.3),其他條件下則將第一閾值設(shè)置為0.35。

本申請實施例通過直接計算第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離,根據(jù)第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值,并通過將該比值與第一閾值進(jìn)行比較來判斷第一網(wǎng)頁內(nèi)容和目標(biāo)軟文是否相同,執(zhí)行速率較快。

優(yōu)選地,為了提高統(tǒng)計結(jié)果的準(zhǔn)確性,多個網(wǎng)頁內(nèi)容包括第一網(wǎng)頁內(nèi)容,分別計算多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離包括計算第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離,計算第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離包括:分別對第一網(wǎng)頁內(nèi)容和目標(biāo)軟文進(jìn)行分塊,得到第一內(nèi)容塊列表和第二內(nèi)容塊列表,其中,第一內(nèi)容塊列表為第一網(wǎng)頁內(nèi)容分塊后得到的內(nèi)容塊列表,第二內(nèi)容塊列表為目標(biāo)軟文分塊后得到的內(nèi)容塊列表;以及分別計算第一內(nèi)容塊列表中各個內(nèi)容塊與第二內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離。

本申請實施例通過先對第一網(wǎng)頁內(nèi)容和目標(biāo)軟文進(jìn)行分塊,例如,按照斷句符(例如,逗號、句號、分號等)將第一網(wǎng)頁內(nèi)容和目標(biāo)軟文分成多個內(nèi)容塊,得到第一內(nèi)容塊列表和第二內(nèi)容塊列表。優(yōu)選地,本申請實施例可以在將第一網(wǎng)頁內(nèi)容和目標(biāo)軟文分成多個內(nèi)容塊之后,去除每個內(nèi)容塊內(nèi)的無效字符(例如,引號、空格等),并基于去除了無效字符的內(nèi)容塊計算文本編輯距離。具體地,本申請實施例可以遍歷第二內(nèi)容塊列表,并計算第二內(nèi)容塊列表中的每個內(nèi)容塊分別與第一內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離。

本申請實施例在得到第一內(nèi)容塊列表中各個內(nèi)容塊與第二內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離之后,即可以基于第一內(nèi)容塊列表中各個內(nèi)容塊與第二內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離判斷第一網(wǎng)頁內(nèi)容和目標(biāo)軟文是否相同。

優(yōu)選地,分別根據(jù)多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離判斷各個網(wǎng)頁內(nèi)容是否與目標(biāo)軟文相同包括:根據(jù)第一內(nèi)容塊列表中各個內(nèi)容塊與第二內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離獲取第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊;分別統(tǒng)計第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度;計算第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值;判斷第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值是否大于第二閾值;當(dāng)判斷出第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值大于第二閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文相同;以及 當(dāng)判斷出第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值不大于第二閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文不相同。

具體地,可以遍歷第二內(nèi)容塊列表,分別獲取第二內(nèi)容塊列表中各個內(nèi)容塊與第一內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離,并第二內(nèi)容塊列表中各個內(nèi)容塊與第一內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離判斷第二內(nèi)容塊列表中各個內(nèi)容塊是否與第一內(nèi)容塊列表中各個內(nèi)容塊相同,以下第二內(nèi)容塊列表中第一內(nèi)容塊為例進(jìn)行說明,其中,第一內(nèi)容塊可以是第二內(nèi)容塊列表中任意一個內(nèi)容塊。

優(yōu)選地,根據(jù)第一內(nèi)容塊列表中各個內(nèi)容塊與第二內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離獲取第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊包括:統(tǒng)計第一內(nèi)容塊的長度;分別計算第一內(nèi)容塊列表中各個內(nèi)容塊與第一內(nèi)容塊的文本編輯距離與第一內(nèi)容塊的長度的比值,得到多個比值;判斷多個比值中是否存在小于第三閾值的比值;當(dāng)判斷出多個比值中不存在小于第三閾值的比值時,則確定第一內(nèi)容塊列表中不存在與第一內(nèi)容塊相同的內(nèi)容塊;以及當(dāng)判斷出多個比值中存在小于第三閾值的比值時,則確定第一內(nèi)容塊列表中存在與第一內(nèi)容塊相同的內(nèi)容塊,并獲取第一內(nèi)容塊。

本申請實施例的第一內(nèi)容塊的長度可以是第一內(nèi)容塊的字符數(shù)。具體地,在得到第一內(nèi)容塊的長度之后,可以分別計算第一內(nèi)容塊與第一內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離與第一內(nèi)容塊的長度的比值,得到多個比值,如果這多個比值中不存在小于第三閾值的比值時,則說明該第一內(nèi)容塊與第一內(nèi)容塊列表中各個內(nèi)容塊均不相同,如果這多個比值中存在小于第三閾值的比值時,則說明第一內(nèi)容塊列表中存在與第一內(nèi)容塊相同的內(nèi)容塊,即第一內(nèi)容塊為第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊,獲取第一內(nèi)容塊。需要說明的是,上述第三閾值可以根據(jù)實際情況進(jìn)行設(shè)置,例如,設(shè)置第三閾值為0.35。通過對第二內(nèi)容塊列表中各個內(nèi)容塊均執(zhí)行上述操作,即可以得到第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的所有內(nèi)容塊。

在得到第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的所有內(nèi)容塊之后,統(tǒng)計第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的所有內(nèi)容塊的長度,例如,第二內(nèi)容塊列表中存在10個內(nèi)容塊與第一內(nèi)容塊列表中的內(nèi)容塊相同,則統(tǒng)計這10個內(nèi)容塊的長度,具體地,可以分別統(tǒng)計這10個內(nèi)容塊中每個內(nèi)容塊的長度,并進(jìn)行求和得到這10個內(nèi)容塊的長度。本申請實施例通過計算第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值,并與第二閾值進(jìn)行比較,其中,第二閾值可以根據(jù)實際情況進(jìn)行設(shè)置,例如,設(shè)置第二閾值為0.8,即存在80%以上的內(nèi)容相同時即認(rèn)為該第一網(wǎng)頁內(nèi)容與目標(biāo)軟文內(nèi)容相同,否則,則認(rèn)為 該第一網(wǎng)頁內(nèi)容與目標(biāo)軟文內(nèi)容不相同。

本申請實施例通過對多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容分別執(zhí)行上述操作來判斷是否與目標(biāo)軟文相同,在完成對多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容的判斷之后,即可以統(tǒng)計上述多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同網(wǎng)頁內(nèi)容的數(shù)量,從而可以得到目標(biāo)軟文的展現(xiàn)次數(shù)。

優(yōu)選地,為了便于用戶直觀的查看軟文的投放效果,在統(tǒng)計多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的數(shù)量,作為目標(biāo)軟文的展現(xiàn)次數(shù)之后,該方法還包括:分別獲取多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的排名;以及展示目標(biāo)軟文的展現(xiàn)次數(shù)和多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的排名。

本申請實施例可以在通過網(wǎng)絡(luò)爬蟲爬取網(wǎng)頁內(nèi)容時,同時爬取該網(wǎng)頁內(nèi)容的排名(即在搜索結(jié)果頁中的排名),在統(tǒng)計出目標(biāo)軟文的展現(xiàn)次數(shù)后,將目標(biāo)軟文的展現(xiàn)次數(shù)以及排名情況共同展現(xiàn)給用戶查看。

根據(jù)本申請又一實施例的軟文展現(xiàn)次數(shù)統(tǒng)計方法,包括如下步驟:

步驟S202,用戶輸入需要查詢的關(guān)鍵詞。

上述需要查詢的關(guān)鍵詞即搜索關(guān)鍵詞。

步驟S204,網(wǎng)絡(luò)爬蟲根據(jù)關(guān)鍵詞去抓取搜索結(jié)果頁的網(wǎng)頁內(nèi)容,并返回所有抓取的網(wǎng)頁內(nèi)容和序號。

上述序號即網(wǎng)頁內(nèi)容在搜索結(jié)果頁中的排名。

步驟S206,將上述任一網(wǎng)頁內(nèi)容按照斷句符(例如,句號、逗號、分號等)劃分成若干內(nèi)容塊。

步驟S208,去除內(nèi)容塊內(nèi)無效字符(例如,引號、空格等)。

步驟S210,將上述去除無效字符的內(nèi)容塊組成內(nèi)容塊列表1。

步驟S212,同樣對目標(biāo)軟文進(jìn)行分塊以及去除每個內(nèi)容塊內(nèi)的無效字符,得到內(nèi)容塊列表2。

步驟S214,計算將內(nèi)容塊列表1中的每個內(nèi)容塊與內(nèi)容塊列表2中的每個內(nèi)容塊的文本編輯距離。

例如,兩個字符串ABC與ABCD的文本編輯距離為1。

步驟S216,根據(jù)內(nèi)容塊列表1中的每個內(nèi)容塊與內(nèi)容塊列表2中的每個內(nèi)容塊的文本編輯距離獲取內(nèi)容塊列表1和內(nèi)容塊列表2中的相同內(nèi)容塊。

具體地,計算內(nèi)容塊列表1中的每個內(nèi)容塊與內(nèi)容塊列表2中的每個內(nèi)容塊的文本編輯距離之后,將各個文本編輯距離除以對應(yīng)的原字符串長度,得到多個比值,其中,原字符串長度可以是用于計算該文本編輯距離的內(nèi)容塊列表1中的內(nèi)容塊的長度,也可以是用于計算該文本編輯距離的內(nèi)容塊列表2中的內(nèi)容塊的長度,例如,通過內(nèi)容塊列表1中的內(nèi)容塊1和內(nèi)容塊列表2中的內(nèi)容塊2計算得到文本編輯距離,則可以該文本編輯距離除以內(nèi)容塊1的長度,也可以是用該文本編輯距離除以內(nèi)容塊2的長度。

在得到多個比值后,即可以將多個比值分別與閾值1(即上述第三閾值)比較,例如,將多個比值分別與0.35比較,如果存在某個比值小于0.35,則說明該比值對應(yīng)的內(nèi)容塊列表1中的內(nèi)容塊和內(nèi)容塊列表2中的內(nèi)容塊相同,否則,則說明該比值對應(yīng)的內(nèi)容塊列表1中的內(nèi)容塊和內(nèi)容塊列表2中的內(nèi)容塊不相同。

步驟S218,在得到內(nèi)容塊列表1和內(nèi)容塊列表2中的相同內(nèi)容塊之后,將相同內(nèi)容塊的字符數(shù)除以總的字符數(shù)得到重復(fù)率。

步驟S220,將上述重復(fù)率與閾值2比較,如果重復(fù)率大于閾值2則認(rèn)為上述網(wǎng)頁內(nèi)容與目標(biāo)軟文相同。

具體地,可以將閾值2設(shè)置為0.8(即80%),如果重復(fù)率大于80%則認(rèn)為上述網(wǎng)頁內(nèi)容與目標(biāo)軟文相同。

步驟S222,對上述步驟S204爬取的所有網(wǎng)頁內(nèi)容執(zhí)行步驟S206至步驟S220,可以得到爬取的所有網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容。

步驟S224,統(tǒng)計爬取的所有網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的數(shù)量,作為目標(biāo)軟文的展現(xiàn)次數(shù)。

需要說明的是,本申請實施例可以采用不同的分塊方法對網(wǎng)頁內(nèi)容和目標(biāo)軟文進(jìn)行分塊,也可以不進(jìn)行分塊直接計算網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離以判斷網(wǎng)頁內(nèi)容和目標(biāo)軟文是否相同,判斷方法同上,在此不再贅述。此外,本申請實施例還可以爬取全網(wǎng)絡(luò)的網(wǎng)頁內(nèi)容進(jìn)行目標(biāo)軟文的展現(xiàn)次數(shù)的統(tǒng)計。

本申請實施例通過自動抓取網(wǎng)頁內(nèi)容并與目標(biāo)軟文進(jìn)行內(nèi)容匹配,實現(xiàn)了目標(biāo)軟文展現(xiàn)次數(shù)的快速統(tǒng)計,此外,本申請實施例對網(wǎng)頁內(nèi)容和目標(biāo)軟文進(jìn)行切塊并運算處理后進(jìn)行比對,可以提高比對正確率,從而進(jìn)一步提供統(tǒng)計結(jié)果的準(zhǔn)確率。

由上述描述可知,本申請實施例可以實現(xiàn)更精確地文本匹配判斷,并且能夠自動地進(jìn)行文本匹配。

需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計算機可執(zhí)行指令的 計算機系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。

根據(jù)本申請實施例的另一方面,提供了一種軟文展現(xiàn)次數(shù)統(tǒng)計裝置,該軟文展現(xiàn)次數(shù)統(tǒng)計裝置可以用于執(zhí)行本申請實施例的軟文展現(xiàn)次數(shù)統(tǒng)計方法,本申請實施例的方法也可以通過本申請實施例的軟文展現(xiàn)次數(shù)統(tǒng)計裝置來執(zhí)行。

圖2是根據(jù)本申請實施例的軟文展現(xiàn)次數(shù)統(tǒng)計裝置的示意圖,如圖2所示,該裝置包括:第一獲取單元10、計算單元20、判斷單元30和統(tǒng)計單元40。

第一獲取單元10,用于獲取多個網(wǎng)頁內(nèi)容,其中,多個網(wǎng)頁內(nèi)容為搜索結(jié)果頁中的多個網(wǎng)頁的內(nèi)容。

計算單元20,用于分別計算多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離。

判斷單元30,用于分別根據(jù)多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離判斷各個網(wǎng)頁內(nèi)容是否與目標(biāo)軟文相同。

統(tǒng)計單元40,用于統(tǒng)計多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的數(shù)量,作為目標(biāo)軟文的展現(xiàn)次數(shù)。

本申請實施例通過第一獲取單元10獲取多個網(wǎng)頁內(nèi)容,其中,多個網(wǎng)頁內(nèi)容為搜索結(jié)果頁中的多個網(wǎng)頁的內(nèi)容;計算單元20分別計算多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離;判斷單元30分別根據(jù)多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離判斷各個網(wǎng)頁內(nèi)容是否與目標(biāo)軟文相同;以及統(tǒng)計單元40統(tǒng)計多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的數(shù)量,作為目標(biāo)軟文的展現(xiàn)次數(shù)。本申請通過自動獲取與搜索關(guān)鍵詞匹配的所有網(wǎng)頁內(nèi)容,并根據(jù)與搜索關(guān)鍵詞匹配的所有網(wǎng)頁內(nèi)容與目標(biāo)軟文的文本編輯距離來統(tǒng)計目標(biāo)軟文的展現(xiàn)次數(shù),相比于現(xiàn)有技術(shù)中通過人工方式統(tǒng)計軟文展現(xiàn)次數(shù),速度更快,解決了相關(guān)技術(shù)中通過人工方式統(tǒng)計軟文的展現(xiàn)次數(shù)效率較低的問題,進(jìn)而達(dá)到了提高統(tǒng)計軟文的展現(xiàn)次數(shù)的效率的效果。

優(yōu)選地,多個網(wǎng)頁內(nèi)容包括第一網(wǎng)頁內(nèi)容,判斷單元30包括:第一統(tǒng)計模塊,用于統(tǒng)計目標(biāo)軟文的長度;第一計算模塊,用于計算第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值;第一判斷模塊,用于判斷第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值是否小于第一閾值;以及第一確定模塊,用于當(dāng)判斷出第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值小于第一閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文相同,當(dāng)判斷出第一網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離與目標(biāo)軟文的長度的比值不小于第一閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文不相同。

優(yōu)選地,多個網(wǎng)頁內(nèi)容包括第一網(wǎng)頁內(nèi)容,計算單元20包括:分塊模塊,用于分別對第一網(wǎng)頁內(nèi)容和目標(biāo)軟文進(jìn)行分塊,得到第一內(nèi)容塊列表和第二內(nèi)容塊列表,其中,第一內(nèi)容塊列表為第一網(wǎng)頁內(nèi)容分塊后得到的內(nèi)容塊列表,第二內(nèi)容塊列表為目標(biāo)軟文分塊后得到的內(nèi)容塊列表;以及第二計算模塊,用于分別計算第一內(nèi)容塊列表中各個內(nèi)容塊與第二內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離。

優(yōu)選地,判斷單元30包括:獲取模塊,用于根據(jù)第一內(nèi)容塊列表中各個內(nèi)容塊與第二內(nèi)容塊列表中各個內(nèi)容塊的文本編輯距離獲取第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊;第二統(tǒng)計模塊,用于分別統(tǒng)計第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度;第三計算模塊,用于計算第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值;第二判斷模塊,用于判斷第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值是否大于第二閾值;以及第二確定模塊,用于當(dāng)判斷出第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值大于第二閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文相同,當(dāng)判斷出第二內(nèi)容塊列表中與第一內(nèi)容塊列表中的內(nèi)容塊相同的內(nèi)容塊的長度和目標(biāo)軟文的長度的比值不大于第二閾值時,則確定第一網(wǎng)頁內(nèi)容與目標(biāo)軟文不相同。

所述軟文展現(xiàn)次數(shù)統(tǒng)計裝置包括處理器和存儲器,上述第一獲取單元、計算單元、判斷單元和統(tǒng)計單元等均作為程序單元存儲在存儲器中,由處理器執(zhí)行存儲在存儲器中的上述程序單元來實現(xiàn)相應(yīng)的功能。

處理器中包含內(nèi)核,由內(nèi)核去存儲器中調(diào)取相應(yīng)的程序單元。內(nèi)核可以設(shè)置一個或以上,通過調(diào)整內(nèi)核參數(shù)來統(tǒng)計軟文的展現(xiàn)次數(shù)。

存儲器可能包括計算機可讀介質(zhì)中的非永久性存儲器,隨機存取存儲器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲器(ROM)或閃存(flash RAM),存儲器包括至少一個存儲芯片。

本申請還提供了一種計算機程序產(chǎn)品,當(dāng)在數(shù)據(jù)處理設(shè)備上執(zhí)行時,適于執(zhí)行初始化有如下方法步驟的程序代碼:獲取多個網(wǎng)頁內(nèi)容,其中,多個網(wǎng)頁內(nèi)容為搜索結(jié)果頁中的多個網(wǎng)頁的內(nèi)容;分別計算多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離;分別根據(jù)多個網(wǎng)頁內(nèi)容中各個網(wǎng)頁內(nèi)容和目標(biāo)軟文的文本編輯距離判斷各個網(wǎng)頁內(nèi)容是否與目標(biāo)軟文相同;以及統(tǒng)計多個網(wǎng)頁內(nèi)容中與目標(biāo)軟文相同的網(wǎng)頁內(nèi)容的數(shù)量,作為目標(biāo)軟文的展現(xiàn)次數(shù)。

上述本申請實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。

在本申請的上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有 詳述的部分,可以參見其他實施例的相關(guān)描述。

在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的技術(shù)內(nèi)容,可通過其它的方式實現(xiàn)。其中,以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,可以為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。

另外,在本申請各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。

所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中。基于這樣的理解,本申請的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可為個人計算機、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、移動硬盤、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

以上所述僅是本申請的優(yōu)選實施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本申請原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本申請的保護(hù)范圍。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
普定县| 防城港市| 柳林县| 加查县| 宾川县| 五家渠市| 禄丰县| 浦北县| 灵台县| 乌拉特后旗| 额尔古纳市| 夏邑县| 鄂尔多斯市| 新疆| 辽宁省| 嘉义县| 元阳县| 庄河市| 崇义县| 余庆县| 汨罗市| 大冶市| 宜黄县| 丹巴县| 千阳县| 余庆县| 达日县| 阿坝| 阿克陶县| 绵阳市| 海门市| 乌兰浩特市| 南安市| 皮山县| 慈溪市| 沾化县| 正阳县| 西乡县| 岗巴县| 调兵山市| 潮州市|