專利名稱:搜索網(wǎng)頁內(nèi)容的方法及系統(tǒng)的制作方法
搜索網(wǎng)頁內(nèi)容的方法及系統(tǒng)
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)應(yīng)用領(lǐng)域,特別涉及一種搜索網(wǎng)頁內(nèi)容的方法及系統(tǒng)。背景技術(shù):
傳統(tǒng)的網(wǎng)頁搜索引擎,根據(jù)用戶輸入的搜索對(duì)象,返回與搜索對(duì)象相關(guān)的網(wǎng)頁。返回的網(wǎng)頁僅僅列出網(wǎng)頁自身的內(nèi)容,或還顯示里面包含的評(píng)論個(gè)數(shù),或網(wǎng)頁中明確標(biāo)示的信息,如“報(bào)價(jià)”、“圖庫”等,但未對(duì)網(wǎng)頁內(nèi)容做進(jìn)一步分析,分析人們對(duì)一個(gè)事物評(píng)論時(shí)表達(dá)出來的情感。因此,搜索用戶無法根據(jù)返回的搜索結(jié)果獲取到人們對(duì)事物評(píng)論的情感傾向性,不能獲取到有價(jià)值的信息。
發(fā)明內(nèi)容基于此,有必要提供一種搜索網(wǎng)頁內(nèi)容的方法,能夠展示出網(wǎng)頁內(nèi)容的傾向性,讓搜索用戶獲取到網(wǎng)頁內(nèi)容的傾向性。此外,還有必要提供一種搜索網(wǎng)頁內(nèi)容的系統(tǒng),能夠展示出網(wǎng)頁內(nèi)容的傾向性,讓搜索用戶獲取到網(wǎng)頁內(nèi)容的傾向性。一種搜索網(wǎng)頁內(nèi)容的方法,包括以下步驟獲取查詢串;根據(jù)查詢串檢索,返回相關(guān)的網(wǎng)頁內(nèi)容;計(jì)算網(wǎng)頁內(nèi)容的傾向值;根據(jù)所述傾向值顯示所述網(wǎng)頁內(nèi)容。優(yōu)選地,還包括步驟 對(duì)查詢串預(yù)處理,分割出查詢對(duì)象;識(shí)別所述查詢串中為實(shí)體名的查詢對(duì)象;判斷所述查詢串中是否有實(shí)體名,若是,則根據(jù)查詢對(duì)象返回相關(guān)的網(wǎng)頁內(nèi)容,并從網(wǎng)頁內(nèi)容中獲取包含實(shí)體名的基本單元集合,若否,則根據(jù)查詢對(duì)象返回相關(guān)的網(wǎng)頁內(nèi)容,并顯示返回的相關(guān)網(wǎng)頁內(nèi)容。優(yōu)選地,所述從網(wǎng)頁內(nèi)容中獲取包含實(shí)體名的基本單元集合后還包括步驟判斷基本單元集合是否為空,若是,則根據(jù)查詢對(duì)象返回相關(guān)的網(wǎng)頁內(nèi)容,并顯示返回的相關(guān)網(wǎng)頁內(nèi)容,若否,則計(jì)算基本單元集合中每個(gè)基本單元的傾向值,再根據(jù)所得的基本單元集合中的每個(gè)基本單元的傾向值計(jì)算整個(gè)網(wǎng)頁內(nèi)容的傾向值,根據(jù)網(wǎng)頁內(nèi)容的傾向值顯示網(wǎng)頁內(nèi)容。優(yōu)選地,還包括設(shè)定第一閾值和第二閾值,且所述第一閾值大于所述第二閾值,設(shè)置第一區(qū)域、第二區(qū)域和第三區(qū)域;將網(wǎng)頁內(nèi)容的傾向值與所述第一閾值和第二閾值進(jìn)行比較,當(dāng)網(wǎng)頁內(nèi)容的傾向值大于所述第一閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示到第一區(qū)域,當(dāng)網(wǎng)頁內(nèi)容的傾向值小于等于第一閾值且大于等于第二閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示到第二區(qū)域,當(dāng)網(wǎng)頁內(nèi)容的傾向值小于第二閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示在第三區(qū)域。優(yōu)選地,還包括將所述第一區(qū)域中或第三區(qū)域中的所有網(wǎng)頁內(nèi)容的傾向值比較, 按傾向值從大到小或從小到大的順序在所述第一區(qū)域內(nèi)或第三區(qū)域內(nèi)顯示預(yù)定個(gè)數(shù)的網(wǎng)頁內(nèi)容。優(yōu)選地,還包括將網(wǎng)頁內(nèi)容的傾向值進(jìn)行比較排序,并根據(jù)所述排序顯示網(wǎng)頁內(nèi)容。一種搜索網(wǎng)頁內(nèi)容的系統(tǒng),包括數(shù)據(jù)獲取模塊,獲取查詢串;檢索模塊,根據(jù)查詢串檢索,返回相關(guān)的網(wǎng)頁內(nèi)容;處理模塊,計(jì)算網(wǎng)頁內(nèi)容的傾向值;顯示模塊,根據(jù)所述傾向值顯示所述網(wǎng)頁內(nèi)容。優(yōu)選地,還包括分詞模塊、識(shí)別模塊和判斷模塊,所述分詞模塊用于對(duì)查詢串預(yù)處理,分割出查詢對(duì)象,所述識(shí)別模塊識(shí)別所述查詢串中為實(shí)體名的查詢對(duì)象;判斷模塊,判斷所述查詢串中是否有實(shí)體名,若是,則所述處理模塊進(jìn)一步用于從網(wǎng)頁內(nèi)容中獲取包含實(shí)體名的基本單元集合,若否,則所述檢索模塊根據(jù)查詢對(duì)象返回相關(guān)的網(wǎng)頁內(nèi)容,所述顯示模塊顯示返回的相關(guān)網(wǎng)頁內(nèi)容。優(yōu)選地,所述處理模塊從網(wǎng)頁內(nèi)容中獲取包含實(shí)體名的基本單元集合后,所述判斷模塊還判斷所述基本單元集合是否為空,若是,則顯示模塊顯示返回的相關(guān)網(wǎng)頁內(nèi)容,若否,則所述處理模塊進(jìn)一步計(jì)算基本單元集合中每個(gè)基本單元的傾向值,再根據(jù)所得的基本單元集合中的每個(gè)基本單元的傾向值計(jì)算整個(gè)網(wǎng)頁內(nèi)容的傾向值,所述顯示模塊根據(jù)網(wǎng)頁內(nèi)容的傾向值顯示網(wǎng)頁內(nèi)容。優(yōu)選地,所述處理模塊進(jìn)一步設(shè)定第一閾值和第二閾值,且所述第一閾值大于所述第二閾值,并設(shè)置第一區(qū)域、第二區(qū)域和第三區(qū)域,還用于將網(wǎng)頁內(nèi)容的傾向值與所述第一閾值和第二閾值進(jìn)行比較,當(dāng)網(wǎng)頁內(nèi)容的傾向值大于所述第一閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示到第一區(qū)域,當(dāng)網(wǎng)頁內(nèi)容的傾向值小于等于第一閾值且大于等于第二閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示到第二區(qū)域,當(dāng)網(wǎng)頁內(nèi)容的傾向值小于第二閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示在第三區(qū)域。優(yōu)選地,所述處理模塊進(jìn)一步將所述第一區(qū)域中或第三區(qū)域的所有網(wǎng)頁內(nèi)容的傾向值比較,所述顯示模塊按傾向值從大到小或從小到大的順序在第一區(qū)域內(nèi)或第三區(qū)域顯示預(yù)定個(gè)數(shù)的網(wǎng)頁內(nèi)容。優(yōu)選地,還包括排序模塊,將網(wǎng)頁內(nèi)容的傾向值進(jìn)行比較排序,并根據(jù)所述排序顯示網(wǎng)頁內(nèi)容。上述搜索網(wǎng)頁內(nèi)容的方法及系統(tǒng),采用獲取查詢串,并根據(jù)查詢串檢索返回相關(guān)的網(wǎng)頁內(nèi)容,且計(jì)算出網(wǎng)頁內(nèi)容的傾向值,根據(jù)該傾向值顯示網(wǎng)頁內(nèi)容,讓搜索用戶能夠獲取到網(wǎng)頁內(nèi)容的對(duì)查詢串的評(píng)論傾向,掌握有價(jià)值的信息。
圖1為一個(gè)實(shí)施例中搜索網(wǎng)頁內(nèi)容的方法的流程圖2為另一個(gè)實(shí)施例中搜索網(wǎng)頁內(nèi)容的方法的流程圖;圖3為一個(gè)實(shí)施例中搜索網(wǎng)頁內(nèi)容的系統(tǒng)的結(jié)構(gòu)示意4為另一個(gè)實(shí)施例中搜索網(wǎng)頁內(nèi)容的系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施方式如圖1所示,一種搜索網(wǎng)頁內(nèi)容的方法,包括以下步驟步驟S10,獲取查詢串。獲取到用戶輸入的查詢串,如用戶輸入查詢“體育明星劉翔”。步驟S20,根據(jù)查詢串檢索,返回相關(guān)的網(wǎng)頁內(nèi)容。搜索引擎獲取到查詢串后,檢索到與查詢串相關(guān)的網(wǎng)頁內(nèi)容,將相關(guān)的網(wǎng)頁內(nèi)容返回到用戶。如查詢串“沈?qū)么筮\(yùn)會(huì)”,返回的有“深圳舉辦26屆大運(yùn)會(huì)”、“沈?qū)么筮\(yùn)會(huì)志愿者招募”等相關(guān)網(wǎng)頁內(nèi)容。步驟S30,計(jì)算網(wǎng)頁內(nèi)容的傾向值。網(wǎng)頁內(nèi)容中有對(duì)查詢串的相關(guān)的評(píng)論,通過情感分析算法,如支持向量機(jī),計(jì)算出返回的網(wǎng)頁內(nèi)容的傾向值。步驟S40,根據(jù)傾向值顯示該網(wǎng)頁內(nèi)容。根據(jù)計(jì)算所得網(wǎng)頁內(nèi)容的傾向值,顯示該網(wǎng)頁內(nèi)容。該網(wǎng)頁內(nèi)容可包括網(wǎng)頁標(biāo)題、摘要、網(wǎng)頁地址(UniversalResource Locator,簡(jiǎn)稱URL)以及計(jì)算得出的網(wǎng)頁內(nèi)容的傾向值。上述搜索網(wǎng)頁內(nèi)容的方法,采用獲取查詢串,并根據(jù)查詢串檢索返回相關(guān)的網(wǎng)頁內(nèi)容,且計(jì)算出網(wǎng)頁內(nèi)容的傾向值,根據(jù)該傾向值顯示網(wǎng)頁內(nèi)容,讓搜索用戶能夠獲取到網(wǎng)頁內(nèi)容的對(duì)查詢串的評(píng)論傾向,掌握有價(jià)值的信息。如一個(gè)產(chǎn)品制造商如果能夠從網(wǎng)絡(luò)上快速獲取自身的品牌以及競(jìng)爭(zhēng)對(duì)手的品牌聲譽(yù),對(duì)其自身的產(chǎn)品發(fā)展、市場(chǎng)營銷策略和客戶關(guān)系經(jīng)營是非常有價(jià)值的。如圖2所示,在一個(gè)實(shí)施例中,步驟SlO之后,步驟S20之前還包括以下步驟步驟S11,對(duì)查詢串預(yù)處理,分割出查詢對(duì)象。如查詢串“沈?qū)么筮\(yùn)會(huì)”進(jìn)行預(yù)處理,分割出語言學(xué)上有意義的詞,分割成“26”、“屆”和“大運(yùn)會(huì)”詞單元。步驟S12,識(shí)別查詢串中為實(shí)體名的查詢對(duì)象。將查詢串分割為有意義的詞單元后,識(shí)別出這些查詢對(duì)象中的實(shí)體名。該實(shí)體名是指對(duì)客觀世界中的實(shí)體,如人、地點(diǎn)、機(jī)構(gòu)、產(chǎn)品等的名稱。步驟S13,判斷該查詢串中是否有實(shí)體名,若是,則執(zhí)行步驟S20,若否,則執(zhí)行步驟S41。判斷查詢串中是否有實(shí)體名,如判斷查詢串“體育明星劉翔”中有實(shí)體名“劉翔”, 則根據(jù)返回的相關(guān)的網(wǎng)頁內(nèi)容,但不直接顯示,還需進(jìn)行下一步處理。步驟S41,根據(jù)查詢對(duì)象返回相關(guān)的網(wǎng)頁內(nèi)容,并顯示返回的相關(guān)網(wǎng)頁內(nèi)容。若該查詢串中沒有實(shí)體名,如“網(wǎng)絡(luò)技術(shù)應(yīng)用”,分割成查詢對(duì)象“網(wǎng)絡(luò)”、“技術(shù)”和“應(yīng)用”,根據(jù)該查詢對(duì)象返回相關(guān)的網(wǎng)頁內(nèi)容,然后直接顯示給搜索用戶。步驟S21,根據(jù)查詢對(duì)象返回相關(guān)的網(wǎng)頁內(nèi)容。將查詢串分割成查詢對(duì)象后,根據(jù)查詢對(duì)象檢索,返回相關(guān)的網(wǎng)頁內(nèi)容。在步驟S21之后,還包括以下步驟步驟S22,從網(wǎng)頁內(nèi)容中獲取包含實(shí)體名的基本單元集合。當(dāng)查詢串中有實(shí)體名時(shí),即查詢對(duì)象沒有為實(shí)體名的,返回相關(guān)的網(wǎng)頁內(nèi)容,然后從返回的網(wǎng)頁內(nèi)容中找到包含實(shí)體名的基本單元,將這些基本單元集中在一起構(gòu)成集合。其中,基本單元為短語、句子、句群和段落中的任意一種。本實(shí)施例中,以句子為基本單元介紹。從網(wǎng)頁內(nèi)容中找到包含實(shí)體名的句子集合S。步驟S23,判斷基本單元集合是否為空,若是,則執(zhí)行步驟S41,若否,則執(zhí)行步驟 S31。從網(wǎng)頁內(nèi)容中查找包含實(shí)體名的基本單元集合,即包含實(shí)體名的句子集合,若該句子集合為空,表示網(wǎng)頁內(nèi)容中沒有包含實(shí)體名的句子,則直接顯示返回的相關(guān)網(wǎng)頁內(nèi)容,若該句子集合不為空,表示網(wǎng)頁內(nèi)容中有包含實(shí)體名的句子,則執(zhí)行步驟S31。步驟S30中計(jì)算網(wǎng)頁內(nèi)容的傾向值的具體步驟如下步驟S31,計(jì)算基本單元集合中每個(gè)基本單元的傾向值。計(jì)算每個(gè)句子的傾向值, 可采用為每個(gè)句子打分,打分標(biāo)準(zhǔn)可預(yù)先設(shè)定。如“喜歡”80分,“非常喜歡”90分等。這些打分標(biāo)準(zhǔn)可存儲(chǔ)于數(shù)據(jù)庫中。步驟S32,根據(jù)所得的基本單元集合中的每個(gè)基本單元的傾向值計(jì)算整個(gè)網(wǎng)頁內(nèi)容的傾向值。計(jì)算出每個(gè)句子的傾向值后,可采用平均法或采用加權(quán)求和法求得整個(gè)網(wǎng)頁內(nèi)容的傾向值。其中,采用平均法時(shí),將所有句子的傾向值相加求和再除以句子個(gè)數(shù)得出平均值,該平均值即為整個(gè)網(wǎng)頁內(nèi)容的傾向值。采用加權(quán)求和法時(shí),具體如標(biāo)題中出現(xiàn)包含查詢對(duì)象的評(píng)論性詞,其加權(quán)值為0. 5,網(wǎng)頁內(nèi)容首行和尾行出現(xiàn)的對(duì)查詢對(duì)象評(píng)論性詞,其加權(quán)值為0. 2,中間出現(xiàn)的對(duì)查詢對(duì)象評(píng)論性詞,其加權(quán)值為0. 1,每個(gè)句子的傾向值乘以相對(duì)應(yīng)的加權(quán)值求和,得出整個(gè)網(wǎng)頁內(nèi)容的傾向值。本實(shí)施例中,上述搜索網(wǎng)頁內(nèi)容的方法,步驟S40根據(jù)傾向值顯示網(wǎng)頁內(nèi)容的步驟還包括將網(wǎng)頁內(nèi)容的傾向值轉(zhuǎn)換為相應(yīng)的等級(jí)標(biāo)記,并顯示該等級(jí)標(biāo)記。將網(wǎng)頁內(nèi)容的傾向值采用亮幾顆星形式表示。如設(shè)定5顆星等級(jí),每顆星可表示一個(gè)固定的傾向值,網(wǎng)頁內(nèi)容的傾向值與該固定的傾向值之比,可得出該網(wǎng)頁內(nèi)容的傾向的等級(jí)。且可以規(guī)定5顆星全亮表示這個(gè)網(wǎng)頁內(nèi)容對(duì)查詢對(duì)象是完全正面的評(píng)價(jià),5顆星全暗表示這個(gè)網(wǎng)頁內(nèi)容對(duì)查詢對(duì)象是強(qiáng)烈的反面評(píng)價(jià),2. 5顆星亮表示這個(gè)網(wǎng)頁內(nèi)容對(duì)查詢對(duì)象的評(píng)價(jià)為褒揚(yáng)和貶低的比例大致相當(dāng),即星星亮的越多,越說明這個(gè)網(wǎng)頁內(nèi)容對(duì)查詢對(duì)象的正面評(píng)價(jià)內(nèi)容多與負(fù)面評(píng)價(jià)內(nèi)容。另外,如果根本沒有星星(無論亮或暗),表明當(dāng)前網(wǎng)頁內(nèi)容對(duì)查詢對(duì)象沒有傾向。該每顆星代表的傾向值也可以不固定,如第一顆星代表的情感傾向值為100,第二顆星代表的情感傾向值為150,越往后每顆星的基值越大。再者,采用亮星的方式僅是本發(fā)明的一種實(shí)施方式,不限于此。如采用直接顯示網(wǎng)頁內(nèi)容的傾向值或采用10分滿分制形式的評(píng)分形式,如網(wǎng)頁內(nèi)容的傾向值560,每分對(duì)應(yīng)的傾向值為100,則該網(wǎng)頁內(nèi)容的傾向值轉(zhuǎn)換為5. 6分,顯示在網(wǎng)頁內(nèi)容側(cè)或標(biāo)題上等。采用上述顯示方式,直觀、清楚。在一個(gè)實(shí)施例中,上述搜索網(wǎng)頁內(nèi)容的方法,還包括以下步驟設(shè)定第一閾值和第二閾值,且所述第一閾值大于所述第二閾值,設(shè)置第一區(qū)域、第二區(qū)域和第三區(qū)域;將網(wǎng)頁內(nèi)容的傾向值與所述第一閾值和第二閾值進(jìn)行比較,當(dāng)網(wǎng)頁內(nèi)容的傾向值大于所述第一閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示到第一區(qū)域,當(dāng)網(wǎng)頁內(nèi)容的傾向值小于等于第一閾值且大于等于第二閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示到第二區(qū)域,當(dāng)網(wǎng)頁內(nèi)容的傾向值小于第二閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示在第三區(qū)域。將網(wǎng)頁內(nèi)容的傾向值按照大小分成三個(gè)等級(jí),設(shè)置第一閾值和第二閾值,且將第一閾值大于第二閾值,并將網(wǎng)頁內(nèi)容的傾向值與第一閾值和第二閾值進(jìn)行比較,根據(jù)比較的結(jié)果,將該網(wǎng)頁內(nèi)容分配到第一區(qū)域、 第二區(qū)域和第三區(qū)域中與之相對(duì)應(yīng)的區(qū)域。這樣使得在不同區(qū)域顯示的網(wǎng)頁內(nèi)容傾向比較集中,搜索用戶能夠比較直觀的獲取到相應(yīng)等級(jí)網(wǎng)頁內(nèi)容。其中,第一區(qū)域內(nèi)的網(wǎng)頁內(nèi)容表示比較正面的評(píng)價(jià),該區(qū)域中網(wǎng)頁內(nèi)容的傾向值越大表示評(píng)價(jià)越正面;第二區(qū)域內(nèi)的網(wǎng)頁內(nèi)容表示中立的評(píng)價(jià);第三區(qū)域內(nèi)的網(wǎng)頁內(nèi)容表示比較負(fù)面的評(píng)價(jià),該區(qū)域中網(wǎng)頁內(nèi)容的傾向值越小表示評(píng)價(jià)越負(fù)面。在一個(gè)實(shí)施例中,上述搜索網(wǎng)頁內(nèi)容的方法,還包括將第一區(qū)域中的所有網(wǎng)頁內(nèi)容的傾向值比較,按傾向值從大到小或從小到大的順序在所述第一區(qū)域內(nèi)顯示預(yù)定個(gè)數(shù)的網(wǎng)頁內(nèi)容。將第一區(qū)域中的網(wǎng)頁內(nèi)容的傾向比較,然后按照傾向值從大到小或從小到大進(jìn)行排序。由于顯示頁面受限或顯示內(nèi)容過多易導(dǎo)致網(wǎng)頁加載慢,可設(shè)定顯示預(yù)定個(gè)數(shù)的網(wǎng)頁內(nèi)容,則按傾向值從大到小的順序在第一區(qū)域顯示預(yù)定個(gè)數(shù)的網(wǎng)頁內(nèi)容??蛇x擇排在前面的多個(gè)網(wǎng)頁內(nèi)容進(jìn)行顯示,如排在前三的網(wǎng)頁內(nèi)容,包括網(wǎng)頁標(biāo)題、摘要、網(wǎng)頁地址及網(wǎng)頁內(nèi)容的傾向值。在一個(gè)實(shí)施例中,上述搜索網(wǎng)頁內(nèi)容的方法,還包括將第三區(qū)域中的所有網(wǎng)頁內(nèi)容的傾向值比較,按傾向值從小到大或從大到小的順序在所述第三區(qū)域內(nèi)顯示預(yù)定個(gè)數(shù)的網(wǎng)頁內(nèi)容。同樣,如第一區(qū)域一樣,在第三區(qū)域按傾向值從小到大或從小到大的順序顯示預(yù)定個(gè)數(shù)的網(wǎng)頁內(nèi)容。可選擇排在前面的多個(gè)網(wǎng)頁內(nèi)容進(jìn)行顯示,如排在前三的網(wǎng)頁內(nèi)容,包括網(wǎng)頁標(biāo)題、摘要、網(wǎng)頁地址及網(wǎng)頁內(nèi)容的傾向值。在一個(gè)實(shí)施例中,上述搜索網(wǎng)頁內(nèi)容的方法,還包括將網(wǎng)頁內(nèi)容的傾向值進(jìn)行比較排序,并根據(jù)所述排序顯示網(wǎng)頁內(nèi)容。將網(wǎng)頁內(nèi)容的傾向值進(jìn)行比較,按照傾向值從大到小或從小到大對(duì)網(wǎng)頁內(nèi)容進(jìn)行排序,然后將排序后的網(wǎng)頁內(nèi)容顯示出來。根據(jù)傾向分析的結(jié)果可以干擾搜索引擎的自然排序,如分析出查詢串中帶有強(qiáng)烈的傾向檢索需求,則可以按照網(wǎng)頁內(nèi)容的傾向適度重新排序。同時(shí),排序后顯示,更加方便用戶了解網(wǎng)頁內(nèi)容的傾向性f曰息。如圖3所示,在一個(gè)實(shí)施方式中,搜索網(wǎng)頁內(nèi)容的系統(tǒng)包括數(shù)據(jù)獲取模塊10、檢索模塊20、處理模塊30和顯示模塊40。數(shù)據(jù)獲取模塊10用于獲取查詢串。數(shù)據(jù)獲取模塊10獲取到用戶輸入的查詢串, 如“體育明星孫悅”。檢索模塊20用于根據(jù)查詢串檢索,并返回相關(guān)的網(wǎng)頁內(nèi)容。檢索模塊20根據(jù)用戶輸入的查詢串進(jìn)行檢索,將檢索到的相關(guān)的網(wǎng)頁內(nèi)容返回。其中,網(wǎng)頁內(nèi)容可包括網(wǎng)頁標(biāo)題、摘要和網(wǎng)頁地址(Universal Resource Locator,簡(jiǎn)稱 URL)。處理模塊30計(jì)算網(wǎng)頁內(nèi)容的傾向值。處理模塊30采用傾向分析算法,如支持向量機(jī),計(jì)算網(wǎng)頁內(nèi)容的傾向值。顯示模塊40根據(jù)傾向值顯示網(wǎng)頁內(nèi)容。其中,網(wǎng)頁內(nèi)容可包括網(wǎng)頁標(biāo)題、摘要、網(wǎng)頁地址(Universal Resource Locator,簡(jiǎn)稱URL)以及計(jì)算得出的網(wǎng)頁內(nèi)容的傾向值。如圖4所示,在一個(gè)實(shí)施例中,上述搜索網(wǎng)頁內(nèi)容的系統(tǒng)還包括分詞模塊50和識(shí)別模塊60。分詞模塊50對(duì)查詢串預(yù)處理,分割出查詢對(duì)象。分詞模塊50將查詢串分割成語言學(xué)上有意義的詞。如查詢串“體育明星孫悅”分割成“體育”、“明星”和“孫悅”。識(shí)別模塊60識(shí)別該查詢串中為實(shí)體名的查詢對(duì)象。該實(shí)體名是指對(duì)客觀世界中的實(shí)體,如人、 地點(diǎn)、機(jī)構(gòu)、產(chǎn)品等的名稱。上述搜索網(wǎng)頁內(nèi)容的系統(tǒng)還包括判斷模塊70、等級(jí)標(biāo)記模塊80和排序模塊90。判斷模塊70用于判斷查詢串中是否有實(shí)體名,若有,則處理模塊30進(jìn)一步用于從網(wǎng)頁內(nèi)容中獲取包含實(shí)體名的基本單元集合,若否,則檢索模塊20根據(jù)查詢串返回相關(guān)網(wǎng)頁內(nèi)容,顯示模塊40直接顯示返回的相關(guān)網(wǎng)頁內(nèi)容。處理模塊30從返回的網(wǎng)頁內(nèi)容中找到包含實(shí)體名的基本單元,將這些基本單元集中在一起構(gòu)成集合。其中,基本單元為短語、句子、句群和段落中的任意一種。本實(shí)施例中,以句子為基本單元介紹。處理模塊30從網(wǎng)頁內(nèi)容中找到包含實(shí)體名的句子集合S。判斷模塊70還用于在處理模塊30從網(wǎng)頁內(nèi)容中獲取包含實(shí)體名的基本單元集合后,判斷基本單元集合是否為空,若是,則顯示模塊40直接顯示返回的相關(guān)網(wǎng)頁內(nèi)容,若否,則處理模塊30進(jìn)一步計(jì)算基本單元集合中每個(gè)基本單元的傾向值,再根據(jù)所得的基本單元集合中的每個(gè)基本單元的傾向值計(jì)算整個(gè)網(wǎng)頁內(nèi)容的傾向值,顯示模塊40再根據(jù)網(wǎng)頁內(nèi)容的傾向值顯示網(wǎng)頁內(nèi)容。等級(jí)標(biāo)記模塊80將網(wǎng)頁內(nèi)容的傾向值轉(zhuǎn)換為相應(yīng)的等級(jí)標(biāo)記,并通過顯示模塊 40顯示該等級(jí)標(biāo)記。等級(jí)標(biāo)記模塊80將網(wǎng)頁內(nèi)容的傾向值采用亮幾顆星形式表示。如設(shè)定 5顆星等級(jí),每顆星可表示一個(gè)固定的傾向值,網(wǎng)頁內(nèi)容的傾向值與該固定的傾向值之比, 可得出該網(wǎng)頁內(nèi)容的傾向的等級(jí)。且可以規(guī)定5顆星全亮表示這個(gè)網(wǎng)頁內(nèi)容對(duì)查詢對(duì)象是完全正面的評(píng)價(jià),5顆星全暗表示這個(gè)網(wǎng)頁內(nèi)容對(duì)查詢對(duì)象是強(qiáng)烈的反面評(píng)價(jià),2. 5顆星亮表示這個(gè)網(wǎng)頁內(nèi)容對(duì)查詢對(duì)象的評(píng)價(jià)為褒揚(yáng)和貶低的比例大致相當(dāng),即星星亮的越多,越說明這個(gè)網(wǎng)頁內(nèi)容對(duì)查詢對(duì)象的正面評(píng)價(jià)內(nèi)容多與負(fù)面評(píng)價(jià)內(nèi)容。另外,如果根本沒有星星(無論亮或暗),表明當(dāng)前網(wǎng)頁內(nèi)容對(duì)查詢對(duì)象沒有傾向。該每顆星代表的傾向值也可以不固定,如第一顆星代表的情感傾向值為100,第二顆星代表的情感傾向值為150,越往后每顆星的基值越大。再者,采用亮星的方式僅是本發(fā)明的一種實(shí)施方式,不限于此。如采用直接顯示網(wǎng)頁內(nèi)容的傾向值或采用10分滿分制形式的評(píng)分形式,如網(wǎng)頁內(nèi)容的傾向值 560,每分對(duì)應(yīng)的傾向值為100,則該網(wǎng)頁內(nèi)容的傾向值轉(zhuǎn)換為5. 6分,顯示在網(wǎng)頁內(nèi)容側(cè)或標(biāo)題上等。排序模塊90將網(wǎng)頁內(nèi)容的傾向值進(jìn)行比較排序,顯示模塊40根據(jù)排序顯示網(wǎng)頁內(nèi)容。排序模塊90將網(wǎng)頁內(nèi)容的傾向值進(jìn)行比較,按照傾向值從大到小或從小到大進(jìn)行排序。顯示模塊40根據(jù)排序結(jié)果顯示網(wǎng)頁內(nèi)容。在一個(gè)實(shí)施例中,處理模塊30還進(jìn)一步設(shè)定第一閾值和第二閾值,且所述第一閾值大于所述第二閾值,并設(shè)置第一區(qū)域、第二區(qū)域和第三區(qū)域,還用于將網(wǎng)頁內(nèi)容的傾向值與所述第一閾值和第二閾值進(jìn)行比較,當(dāng)網(wǎng)頁內(nèi)容的傾向值大于所述第一閾值時(shí),通過顯示模塊40將所述網(wǎng)頁內(nèi)容顯示到第一區(qū)域,當(dāng)網(wǎng)頁內(nèi)容的傾向值小于等于第一閾值且大于等于第二閾值時(shí),通過顯示模塊40將所述網(wǎng)頁內(nèi)容顯示到第二區(qū)域,當(dāng)網(wǎng)頁內(nèi)容的傾向值小于第二閾值時(shí),通過顯示模塊40將所述網(wǎng)頁內(nèi)容顯示在第三區(qū)域。其中,第一區(qū)域內(nèi)的網(wǎng)頁內(nèi)容表示比較正面的評(píng)價(jià),該區(qū)域中網(wǎng)頁內(nèi)容的傾向值越大表示評(píng)價(jià)越正面;第二區(qū)域內(nèi)的網(wǎng)頁內(nèi)容表示中立的評(píng)價(jià);第三區(qū)域內(nèi)的網(wǎng)頁內(nèi)容表示比較負(fù)面的評(píng)價(jià),該區(qū)域中網(wǎng)頁內(nèi)容的傾向值越小表示評(píng)價(jià)越負(fù)面。在一個(gè)實(shí)施例中,處理模塊30進(jìn)一步將第一區(qū)域中的所有網(wǎng)頁內(nèi)容的傾向值比較,顯示模塊40按傾向值從大到小或從小到大的順序在第一區(qū)域內(nèi)顯示預(yù)定個(gè)數(shù)的網(wǎng)頁內(nèi)容??蛇x擇排在前面的多個(gè)網(wǎng)頁內(nèi)容進(jìn)行顯示,如排在前三的網(wǎng)頁內(nèi)容,包括網(wǎng)頁標(biāo)題、摘要、網(wǎng)頁地址及網(wǎng)頁內(nèi)容的傾向值。在一個(gè)實(shí)施例中,處理模塊30進(jìn)一步將第三區(qū)域中的所有網(wǎng)頁內(nèi)容的傾向值比較,顯示模塊40按傾向值從小到大或從大到小的順序在第三區(qū)域內(nèi)顯示預(yù)定個(gè)數(shù)的網(wǎng)頁內(nèi)容??蛇x擇排在前面的多個(gè)網(wǎng)頁內(nèi)容進(jìn)行顯示,如排在前三的網(wǎng)頁內(nèi)容,包括網(wǎng)頁標(biāo)題、 摘要、網(wǎng)頁地址及網(wǎng)頁內(nèi)容的傾向值。以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對(duì)本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
權(quán)利要求
1.一種搜索網(wǎng)頁內(nèi)容的方法,包括以下步驟 獲取查詢串;根據(jù)查詢串檢索,返回相關(guān)的網(wǎng)頁內(nèi)容; 計(jì)算網(wǎng)頁內(nèi)容的傾向值; 根據(jù)所述傾向值顯示所述網(wǎng)頁內(nèi)容。
2.根據(jù)權(quán)利要求1所述的搜索網(wǎng)頁內(nèi)容的方法,其特征在于,還包括步驟 對(duì)查詢串預(yù)處理,分割出查詢對(duì)象;識(shí)別所述查詢串中為實(shí)體名的查詢對(duì)象;判斷所述查詢串中是否有實(shí)體名,若是,則根據(jù)查詢對(duì)象返回相關(guān)的網(wǎng)頁內(nèi)容,并從網(wǎng)頁內(nèi)容中獲取包含實(shí)體名的基本單元集合,若否,則根據(jù)查詢對(duì)象返回相關(guān)的網(wǎng)頁內(nèi)容,并顯示返回的相關(guān)網(wǎng)頁內(nèi)容。
3.根據(jù)權(quán)利要求2所述的搜索網(wǎng)頁內(nèi)容的方法,其特征在于,所述從網(wǎng)頁內(nèi)容中獲取包含實(shí)體名的基本單元集合后還包括步驟判斷基本單元集合是否為空,若是,則根據(jù)查詢對(duì)象返回相關(guān)的網(wǎng)頁內(nèi)容,并顯示返回的相關(guān)網(wǎng)頁內(nèi)容,若否,則計(jì)算基本單元集合中每個(gè)基本單元的傾向值,再根據(jù)所得的基本單元集合中的每個(gè)基本單元的傾向值計(jì)算整個(gè)網(wǎng)頁內(nèi)容的傾向值,根據(jù)網(wǎng)頁內(nèi)容的傾向值顯示網(wǎng)頁內(nèi)容。
4.根據(jù)權(quán)利要求1所述的搜索網(wǎng)頁內(nèi)容的方法,其特征在于,還包括設(shè)定第一閾值和第二閾值,且所述第一閾值大于所述第二閾值,設(shè)置第一區(qū)域、第二區(qū)域和第三區(qū)域;將網(wǎng)頁內(nèi)容的傾向值與所述第一閾值和第二閾值進(jìn)行比較,當(dāng)網(wǎng)頁內(nèi)容的傾向值大于所述第一閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示到第一區(qū)域,當(dāng)網(wǎng)頁內(nèi)容的傾向值小于等于第一閾值且大于等于第二閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示到第二區(qū)域,當(dāng)網(wǎng)頁內(nèi)容的傾向值小于第二閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示在第三區(qū)域。
5.根據(jù)權(quán)利要求4所述的搜索網(wǎng)頁內(nèi)容的方法,其特征在于,還包括將所述第一區(qū)域中或第三區(qū)域中的所有網(wǎng)頁內(nèi)容的傾向值比較,按傾向值從大到小或從小到大的順序在所述第一區(qū)域內(nèi)或第三區(qū)域內(nèi)顯示預(yù)定個(gè)數(shù)的網(wǎng)頁內(nèi)容。
6.根據(jù)權(quán)利要求1所述的搜索網(wǎng)頁內(nèi)容的方法,其特征在于,還包括將網(wǎng)頁內(nèi)容的傾向值進(jìn)行比較排序,并根據(jù)所述排序顯示網(wǎng)頁內(nèi)容。
7.一種搜索網(wǎng)頁內(nèi)容的系統(tǒng),其特征在于,包括 數(shù)據(jù)獲取模塊,獲取查詢串;檢索模塊,根據(jù)查詢串檢索,返回相關(guān)的網(wǎng)頁內(nèi)容;處理模塊,計(jì)算網(wǎng)頁內(nèi)容的傾向值;顯示模塊,根據(jù)所述傾向值顯示所述網(wǎng)頁內(nèi)容。
8.根據(jù)權(quán)利要求7所述的搜索網(wǎng)頁內(nèi)容的系統(tǒng),其特征在于,還包括分詞模塊、識(shí)別模塊和判斷模塊,所述分詞模塊用于對(duì)查詢串預(yù)處理,分割出查詢對(duì)象,所述識(shí)別模塊識(shí)別所述查詢串中為實(shí)體名的查詢對(duì)象,判斷模塊,判斷所述查詢串中是否有實(shí)體名,若是,則所述處理模塊進(jìn)一步用于從網(wǎng)頁內(nèi)容中獲取包含實(shí)體名的基本單元集合,若否,則所述檢索模塊根據(jù)查詢對(duì)象返回相關(guān)的網(wǎng)頁內(nèi)容,所述顯示模塊顯示返回的相關(guān)網(wǎng)頁內(nèi)容。
9.根據(jù)權(quán)利要求8所述的搜索網(wǎng)頁內(nèi)容的系統(tǒng),其特征在于,所述處理模塊從網(wǎng)頁內(nèi)容中獲取包含實(shí)體名的基本單元集合后,所述判斷模塊還判斷所述基本單元集合是否為空,若是,則顯示模塊顯示返回的相關(guān)網(wǎng)頁內(nèi)容,若否,則所述處理模塊進(jìn)一步計(jì)算基本單元集合中每個(gè)基本單元的傾向值,再根據(jù)所得的基本單元集合中的每個(gè)基本單元的傾向值計(jì)算整個(gè)網(wǎng)頁內(nèi)容的傾向值,所述顯示模塊根據(jù)網(wǎng)頁內(nèi)容的傾向值顯示網(wǎng)頁內(nèi)容。
10.根據(jù)權(quán)利要求7所述的搜索網(wǎng)頁內(nèi)容的系統(tǒng),其特征在于,所述處理模塊進(jìn)一步設(shè)定第一閾值和第二閾值,且所述第一閾值大于所述第二閾值,并設(shè)置第一區(qū)域、第二區(qū)域和第三區(qū)域,還用于將網(wǎng)頁內(nèi)容的傾向值與所述第一閾值和第二閾值進(jìn)行比較,當(dāng)網(wǎng)頁內(nèi)容的傾向值大于所述第一閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示到第一區(qū)域,當(dāng)網(wǎng)頁內(nèi)容的傾向值小于等于第一閾值且大于等于第二閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示到第二區(qū)域,當(dāng)網(wǎng)頁內(nèi)容的傾向值小于第二閾值時(shí),將所述網(wǎng)頁內(nèi)容顯示在第三區(qū)域。
11.根據(jù)權(quán)利要求10所述的搜索網(wǎng)頁內(nèi)容的系統(tǒng),其特征在于,所述處理模塊進(jìn)一步將所述第一區(qū)域中或第三區(qū)域的所有網(wǎng)頁內(nèi)容的傾向值比較,所述顯示模塊按傾向值從大到小或從小到大的順序在第一區(qū)域內(nèi)或第三區(qū)域顯示預(yù)定個(gè)數(shù)的網(wǎng)頁內(nèi)容。
12.根據(jù)權(quán)利要求7所述的搜索網(wǎng)頁內(nèi)容的系統(tǒng),其特征在于,還包括排序模塊,將網(wǎng)頁內(nèi)容的傾向值進(jìn)行比較排序,并根據(jù)所述排序顯示網(wǎng)頁內(nèi)容。
全文摘要
本發(fā)明涉及一種搜索網(wǎng)頁內(nèi)容的方法,包括以下步驟獲取查詢串;根據(jù)查詢串檢索,返回相關(guān)的網(wǎng)頁內(nèi)容;計(jì)算網(wǎng)頁內(nèi)容的傾向值;根據(jù)所述傾向值顯示所述網(wǎng)頁內(nèi)容。此外,還涉及一種搜索網(wǎng)頁內(nèi)容的系統(tǒng)。上述搜索網(wǎng)頁內(nèi)容的方法及系統(tǒng),采用獲取查詢串,并根據(jù)查詢串檢索返回相關(guān)的網(wǎng)頁內(nèi)容,且計(jì)算出網(wǎng)頁內(nèi)容的傾向值,根據(jù)該傾向值顯示網(wǎng)頁內(nèi)容,讓搜索用戶能夠獲取到網(wǎng)頁內(nèi)容的對(duì)查詢串的評(píng)論傾向,掌握有價(jià)值的信息。
文檔編號(hào)G06F17/30GK102314435SQ201010215559
公開日2012年1月11日 申請(qǐng)日期2010年6月30日 優(yōu)先權(quán)日2010年6月30日
發(fā)明者劉云峰, 胡熠 申請(qǐng)人:騰訊科技(深圳)有限公司