文本內(nèi)容的篩選方法及裝置制造方法
【專利摘要】本發(fā)明公開(kāi)了一種文本內(nèi)容的篩選方法及裝置。其中,文本內(nèi)容的篩選方法包括:獲取網(wǎng)頁(yè)頁(yè)面的文本內(nèi)容;添加篩選條件至目標(biāo)詞包,其中,目標(biāo)詞包為包括目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象的詞包,目標(biāo)對(duì)象為文本內(nèi)容中的待篩選對(duì)象,關(guān)聯(lián)對(duì)象為與目標(biāo)對(duì)象具有關(guān)聯(lián)關(guān)系的對(duì)象;利用具有篩選條件的目標(biāo)詞包對(duì)文本內(nèi)容進(jìn)行篩選,得到目標(biāo)對(duì)象的目標(biāo)內(nèi)容。通過(guò)本發(fā)明,解決了現(xiàn)有技術(shù)中篩選的文本內(nèi)容不夠準(zhǔn)確的問(wèn)題,進(jìn)而達(dá)到了提高篩選的文本內(nèi)容準(zhǔn)確性的效果。
【專利說(shuō)明】文本內(nèi)容的篩選方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及文本內(nèi)容處理領(lǐng)域,具體而言,涉及一種文本內(nèi)容的篩選方法及裝置。
【背景技術(shù)】
[0002] 現(xiàn)有的輿情監(jiān)測(cè)系統(tǒng)能夠基于一個(gè)對(duì)象來(lái)進(jìn)行對(duì)該對(duì)象的多維度觀察和分析,例 如對(duì)象是可口可樂(lè)歌詞瓶,輿情監(jiān)測(cè)系統(tǒng)可以讓使用者觀察到在互聯(lián)網(wǎng)中,網(wǎng)民對(duì)可口可 樂(lè)歌詞瓶的情緒態(tài)度是怎樣的,例如:網(wǎng)民說(shuō)了什么關(guān)于可樂(lè)歌詞瓶的話、可樂(lè)歌詞瓶活動(dòng) 在互聯(lián)網(wǎng)的口碑變化趨勢(shì)等等。上述情緒態(tài)度的結(jié)果都是根據(jù)圍繞"可口可樂(lè)歌詞瓶"這 個(gè)詞語(yǔ)篩選出的相關(guān)內(nèi)容分析得出的,然而在互聯(lián)網(wǎng)中,不僅只有"可口可樂(lè)歌詞瓶"代表 可口可樂(lè)歌詞瓶,類似的"cola歌詞瓶" "coca cola歌詞瓶"等詞語(yǔ)同樣代表著可口可樂(lè), 所以輿情監(jiān)測(cè)系統(tǒng)加入了一個(gè)詞包的概念,即將"cola歌詞瓶" "coca cola歌詞瓶" "可口 可樂(lè)歌詞瓶"等詞打包放入可口可樂(lè)歌詞瓶的詞包中,互聯(lián)網(wǎng)上凡是提到"cola歌詞瓶"、 "coca cola歌詞瓶"或者"可口可樂(lè)歌詞瓶"都指代可口可樂(lè)歌詞瓶,相關(guān)內(nèi)容也都可以被 篩選出來(lái)。
[0003] 因?yàn)榛ヂ?lián)網(wǎng)上文字內(nèi)容的多樣性特點(diǎn),雖然在輿情監(jiān)測(cè)系統(tǒng)中加入了詞包的方 式,但通過(guò)增加詞包內(nèi)包含的詞語(yǔ)篩選到的結(jié)果始終不能比較全面的覆蓋所有情況。例如: 輿情監(jiān)測(cè)系統(tǒng)進(jìn)行監(jiān)測(cè)的對(duì)象是可樂(lè)歌詞瓶,當(dāng)文本內(nèi)容為"我今天買可樂(lè),發(fā)現(xiàn)一個(gè)歌詞 與瓶子組合的活動(dòng),還挺不錯(cuò)的"和"這個(gè)笑話可樂(lè)壞了我,笑話里面的歌詞真實(shí)幽默,笑得 我喝水把瓶子都打翻了"時(shí),這兩句話都會(huì)被篩選出來(lái)。雖然上述文本內(nèi)容上面兩句話都同 時(shí)提到了"可樂(lè)"、"歌詞"、和"瓶"這三個(gè)詞,但可以發(fā)現(xiàn)第一句話需要篩選出來(lái)的內(nèi)容,而 第二句話完全是干擾,不應(yīng)該被篩選出來(lái)。若篩選出來(lái)的信息不夠準(zhǔn)確,會(huì)導(dǎo)致輿情監(jiān)測(cè)系 統(tǒng)后續(xù)基于篩選的信息進(jìn)行分析的分析結(jié)果有誤。
[0004] 針對(duì)現(xiàn)有技術(shù)中篩選的文本內(nèi)容不夠準(zhǔn)確的問(wèn)題,目前尚未提出有效的解決方 案。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的主要目的在于提供一種文本內(nèi)容的篩選方法及裝置,以解決現(xiàn)有技術(shù)中 篩選的文本內(nèi)容不夠準(zhǔn)確的問(wèn)題。
[0006] 為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供了一種文本內(nèi)容的篩選 方法。
[0007] 根據(jù)本發(fā)明的文本內(nèi)容的篩選方法包括:獲取網(wǎng)頁(yè)頁(yè)面的文本內(nèi)容;添加篩選條 件至目標(biāo)詞包,其中,所述目標(biāo)詞包為包括目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象的詞包,所述目標(biāo)對(duì)象為所 述文本內(nèi)容中的待篩選對(duì)象,所述關(guān)聯(lián)對(duì)象為與所述目標(biāo)對(duì)象具有關(guān)聯(lián)關(guān)系的對(duì)象;以及 利用具有所述篩選條件的所述目標(biāo)詞包對(duì)所述文本內(nèi)容進(jìn)行篩選,得到所述目標(biāo)對(duì)象的目 標(biāo)內(nèi)容。
[0008] 進(jìn)一步地,添加篩選條件至目標(biāo)詞包包括:利用所述篩選條件關(guān)聯(lián)所述目標(biāo)對(duì)象 和所述關(guān)聯(lián)對(duì)象。
[0009] 進(jìn)一步地,所述關(guān)聯(lián)對(duì)象的數(shù)量為多個(gè),所述篩選條件包括第一子條件和第二子 條件,添加篩選條件至目標(biāo)詞包包括:分別利用所述第一子條件關(guān)聯(lián)每個(gè)所述關(guān)聯(lián)對(duì)象和 所述目標(biāo)對(duì)象,得到多個(gè)詞包元素;以及利用所述第二子條件關(guān)聯(lián)多個(gè)所述詞包元素,得到 具有所述篩選條件的所述目標(biāo)詞包。
[0010] 進(jìn)一步地,所述關(guān)聯(lián)對(duì)象的數(shù)量為多個(gè),所述篩選條件包括第一子條件和第二子 條件,添加篩選條件至目標(biāo)詞包包括:利用所述第一子條件關(guān)聯(lián)至少一個(gè)所述關(guān)聯(lián)對(duì)象和 所述目標(biāo)對(duì)象,得到至少一個(gè)第一詞包元素;利用所述第一子條件關(guān)聯(lián)第一關(guān)聯(lián)對(duì)象和第 二關(guān)聯(lián)對(duì)象,得到第二詞包元素,其中,所述第一關(guān)聯(lián)對(duì)象和所述第二關(guān)聯(lián)對(duì)象均為多個(gè)所 述關(guān)聯(lián)對(duì)象中的對(duì)象;以及利用所述第二子條件關(guān)聯(lián)所述至少一個(gè)第一詞包元素和所述第 二詞包元素,得到具有所述篩選條件的所述目標(biāo)詞包。
[0011] 進(jìn)一步地,在獲取網(wǎng)頁(yè)頁(yè)面的文本內(nèi)容之前,所述篩選方法還包括:接收選擇指 令,所述選擇指令用于確定獲取范圍,其中,獲取網(wǎng)頁(yè)頁(yè)面的文本內(nèi)容包括:在所述獲取范 圍內(nèi)獲取所述文本內(nèi)容。
[0012] 為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明實(shí)施例的另一方面,提供了一種文本內(nèi)容的篩選 裝直。
[0013] 根據(jù)本發(fā)明的文本內(nèi)容的篩選裝置包括:獲取單元,用于獲取網(wǎng)頁(yè)頁(yè)面的文本內(nèi) 容;添加單元,用于添加篩選條件至目標(biāo)詞包,其中,所述目標(biāo)詞包為包括目標(biāo)對(duì)象和關(guān)聯(lián) 對(duì)象的詞包,所述目標(biāo)對(duì)象為所述文本內(nèi)容中的待篩選對(duì)象,所述關(guān)聯(lián)對(duì)象為與所述目標(biāo) 對(duì)象具有關(guān)聯(lián)關(guān)系的對(duì)象;以及篩選單元,用于利用具有所述篩選條件的所述目標(biāo)詞包對(duì) 所述文本內(nèi)容進(jìn)行篩選,得到所述目標(biāo)對(duì)象的目標(biāo)內(nèi)容。
[0014] 進(jìn)一步地,所述添加單元包括:第一關(guān)聯(lián)模塊,用于利用所述篩選條件關(guān)聯(lián)所述目 標(biāo)對(duì)象和所述關(guān)聯(lián)對(duì)象。
[0015] 進(jìn)一步地,所述關(guān)聯(lián)對(duì)象的數(shù)量為多個(gè),所述篩選條件包括第一子條件和第二子 條件,所述添加單元還包括:第二關(guān)聯(lián)模塊,用于分別利用所述第一子條件關(guān)聯(lián)每個(gè)所述關(guān) 聯(lián)對(duì)象和所述目標(biāo)對(duì)象,得到多個(gè)詞包元素;以及第三關(guān)聯(lián)模塊,用于利用所述第二子條件 關(guān)聯(lián)多個(gè)所述詞包元素,得到具有所述篩選條件的所述目標(biāo)詞包。
[0016] 進(jìn)一步地,所述關(guān)聯(lián)對(duì)象的數(shù)量為多個(gè),所述篩選條件包括第一子條件和第二子 條件,所述添加單元還包括:第四關(guān)聯(lián)模塊,用于利用所述第一子條件關(guān)聯(lián)至少一個(gè)所述關(guān) 聯(lián)對(duì)象和所述目標(biāo)對(duì)象,得到至少一個(gè)第一詞包元素;第五關(guān)聯(lián)模塊,用于利用所述第一子 條件關(guān)聯(lián)第一關(guān)聯(lián)對(duì)象和第二關(guān)聯(lián)對(duì)象,得到第二詞包元素,其中,所述第一關(guān)聯(lián)對(duì)象和所 述第二關(guān)聯(lián)對(duì)象均為多個(gè)所述關(guān)聯(lián)對(duì)象中的對(duì)象;以及第六關(guān)聯(lián)模塊,用于利用所述第二 子條件關(guān)聯(lián)所述至少一個(gè)第一詞包元素和所述第二詞包元素,得到具有所述篩選條件的所 述目標(biāo)詞包。
[0017] 進(jìn)一步地,所述篩選裝置還包括:接收單元,用于在獲取網(wǎng)頁(yè)頁(yè)面的文本內(nèi)容之 前,接收選擇指令,所述選擇指令用于確定獲取范圍,其中,所述獲取單元包括獲取模塊,用 于在所述獲取范圍內(nèi)獲取所述文本內(nèi)容。
[0018] 根據(jù)發(fā)明實(shí)施例,采用獲取網(wǎng)頁(yè)頁(yè)面的文本內(nèi)容;添加篩選條件至目標(biāo)詞包,其 中,目標(biāo)詞包為包括目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象的詞包,目標(biāo)對(duì)象為文本內(nèi)容中的待篩選對(duì)象,關(guān) 聯(lián)對(duì)象為與目標(biāo)對(duì)象具有關(guān)聯(lián)關(guān)系的對(duì)象;以及利用具有篩選條件的目標(biāo)詞包對(duì)文本內(nèi) 容進(jìn)行篩選,得到目標(biāo)對(duì)象的目標(biāo)內(nèi)容。通過(guò)利用篩選條件將目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象進(jìn)行關(guān) 聯(lián)得到目標(biāo)詞包,實(shí)現(xiàn)了目標(biāo)詞包中不僅包含目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象,而且還包含篩選條件, 進(jìn)而利用目標(biāo)詞包對(duì)獲取的文本內(nèi)容進(jìn)行篩選的篩選方式,實(shí)現(xiàn)了不僅要包含目標(biāo)對(duì)象和 關(guān)聯(lián)對(duì)象,并且要同時(shí)滿足篩選條件的文本內(nèi)容才會(huì)被篩選出來(lái),被篩選出來(lái)的文本內(nèi)容 即為目標(biāo)內(nèi)容,相比較于現(xiàn)有技術(shù)中利用只包含目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象,而不包含篩選條件 的詞包對(duì)文本內(nèi)容進(jìn)行篩選的篩選方式,解決了現(xiàn)有技術(shù)中篩選的文本內(nèi)容不夠準(zhǔn)確的問(wèn) 題,進(jìn)而達(dá)到了提高篩選的文本內(nèi)容準(zhǔn)確性的效果。
【專利附圖】
【附圖說(shuō)明】
[0019] 構(gòu)成本申請(qǐng)的一部分的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí) 施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0020] 圖1是根據(jù)本發(fā)明實(shí)施例的文本內(nèi)容的篩選方法的流程圖;
[0021] 圖2是根據(jù)本發(fā)明實(shí)施例的文本內(nèi)容的篩選方法的另一流程圖;以及
[0022] 圖3是根據(jù)本發(fā)明實(shí)施例的文本內(nèi)容的篩選裝置的示意圖。
【具體實(shí)施方式】
[0023] 為了使本【技術(shù)領(lǐng)域】的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的 附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是 本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù) 人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范 圍。
[0024] 需要說(shuō)明的是,本發(fā)明的說(shuō)明書(shū)和權(quán)利要求書(shū)及上述附圖中的術(shù)語(yǔ)"第一"、"第 二"等是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用 的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例能夠以除了在這里圖示或 描述的那些以外的順序?qū)嵤?。此外,術(shù)語(yǔ)"包括"和"具有"以及他們的任何變形,意圖在于 覆蓋不排他的包含,例如,包含了一系列步驟或單元的過(guò)程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限 于清楚地列出的那些步驟或單元,而是可包括沒(méi)有清楚地列出的或?qū)τ谶@些過(guò)程、方法、產(chǎn) 品或設(shè)備固有的其它步驟或單元。
[0025] 實(shí)施例1
[0026] 根據(jù)本發(fā)明實(shí)施例,提供了一種可以用于實(shí)施本申請(qǐng)裝置實(shí)施例的方法實(shí)施例, 需要說(shuō)明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系 統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處 的順序執(zhí)行所示出或描述的步驟。
[0027] 根據(jù)本發(fā)明實(shí)施例,提供了一種文本內(nèi)容的篩選方法,圖1是根據(jù)本發(fā)明實(shí)施例 的文本內(nèi)容的篩選方法的流程圖,如圖1所示,該方法包括如下的步驟S102至步驟S106 :
[0028] S102 :獲取網(wǎng)頁(yè)頁(yè)面的文本內(nèi)容,具體地,可以通過(guò)網(wǎng)絡(luò)爬蟲(chóng)獲取網(wǎng)頁(yè)頁(yè)面的文本 內(nèi)容,文本內(nèi)容包括網(wǎng)頁(yè)頁(yè)面的網(wǎng)址和文字信息。
[0029] S104 :添加篩選條件至目標(biāo)詞包,其中,目標(biāo)詞包為包括目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象的詞 包,目標(biāo)對(duì)象為文本內(nèi)容中的待篩選對(duì)象,關(guān)聯(lián)對(duì)象為與目標(biāo)對(duì)象具有關(guān)聯(lián)關(guān)系的對(duì)象。具 體地,目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象具體可以根據(jù)需求通過(guò)接收輸入指令確定,輸入指令可以通過(guò) 鍵盤等硬件設(shè)備輸入,并且關(guān)聯(lián)對(duì)象的數(shù)量至少為一個(gè)。在本步驟中,通過(guò)將篩選條件添加 至目標(biāo)詞包,使目標(biāo)詞包中不僅包含目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象,而且還包含篩選條件。例如:目 標(biāo)對(duì)象為可口可樂(lè),關(guān)聯(lián)對(duì)象可以為雪碧等。
[0030] S106 :利用具有篩選條件的目標(biāo)詞包對(duì)文本內(nèi)容進(jìn)行篩選,得到目標(biāo)對(duì)象的目標(biāo) 內(nèi)容,即,滿足目標(biāo)詞包中的篩選條件,被篩選出來(lái)的文本內(nèi)容為目標(biāo)內(nèi)容。具體地,逐句判 斷文本內(nèi)容是否符合目標(biāo)詞包中的篩選條件,在判斷出文本內(nèi)容中存在符合目標(biāo)詞包中的 篩選條件的語(yǔ)句的情況下,該語(yǔ)句就會(huì)被篩選出來(lái),該語(yǔ)句即為得到的目標(biāo)內(nèi)容。
[0031] 在本發(fā)明實(shí)施列中,通過(guò)利用篩選條件將目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象進(jìn)行關(guān)聯(lián)得到目標(biāo) 詞包,實(shí)現(xiàn)了目標(biāo)詞包中不僅包含目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象,而且還包含篩選條件;進(jìn)而利用目 標(biāo)詞包對(duì)獲取的文本內(nèi)容進(jìn)行篩選的篩選方式,實(shí)現(xiàn)了不僅要包含目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象, 并且要同時(shí)滿足篩選條件的文本內(nèi)容才會(huì)被篩選出來(lái),被篩選出來(lái)的文本內(nèi)容即為目標(biāo)內(nèi) 容,相比較于現(xiàn)有技術(shù)中利用只包含目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象,而不包含篩選條件的詞包對(duì)文 本內(nèi)容進(jìn)行篩選的篩選方式,解決了現(xiàn)有技術(shù)中篩選的文本內(nèi)容不夠準(zhǔn)確的問(wèn)題,進(jìn)而達(dá) 到了提高篩選的文本內(nèi)容準(zhǔn)確性的效果。
[0032] 具體地,在本發(fā)明實(shí)施例中,添加篩選條件至目標(biāo)詞包的具體添加方式,可以是利 用篩選條件關(guān)聯(lián)目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象,即,通過(guò)篩選條件使目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象之間具有 關(guān)聯(lián)關(guān)系,而非目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象獨(dú)立存在于目標(biāo)詞包中。
[0033] 在本發(fā)明實(shí)施例中,通過(guò)利用篩選條件將目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象進(jìn)行關(guān)聯(lián),得到目 標(biāo)詞包,利用該目標(biāo)詞包對(duì)獲取的文本內(nèi)容進(jìn)行篩選,提高了文本內(nèi)容篩選的準(zhǔn)確性,為后 續(xù)的數(shù)據(jù)分析,提供了良好的基礎(chǔ)。
[0034] 具體地,篩選條件的種類如下表1所示,可以根據(jù)需求選擇具體的篩選條件。
[0035]表一
【權(quán)利要求】
1. 一種文本內(nèi)容的篩選方法,其特征在于,包括: 獲取網(wǎng)頁(yè)頁(yè)面的文本內(nèi)容; 添加篩選條件至目標(biāo)詞包,其中,所述目標(biāo)詞包為包括目標(biāo)對(duì)象和關(guān)聯(lián)對(duì)象的詞包,所 述目標(biāo)對(duì)象為所述文本內(nèi)容中的待篩選對(duì)象,所述關(guān)聯(lián)對(duì)象為與所述目標(biāo)對(duì)象具有關(guān)聯(lián)關(guān) 系的對(duì)象;以及 利用具有所述篩選條件的所述目標(biāo)詞包對(duì)所述文本內(nèi)容進(jìn)行篩選,得到所述目標(biāo)對(duì)象 的目標(biāo)內(nèi)容。
2. 根據(jù)權(quán)利要求1所述的篩選方法,其特征在于,添加篩選條件至目標(biāo)詞包包括: 利用所述篩選條件關(guān)聯(lián)所述目標(biāo)對(duì)象和所述關(guān)聯(lián)對(duì)象。
3. 根據(jù)權(quán)利要求2所述的篩選方法,其特征在于,所述關(guān)聯(lián)對(duì)象的數(shù)量為多個(gè),所述篩 選條件包括第一子條件和第二子條件,添加篩選條件至目標(biāo)詞包包括: 分別利用所述第一子條件關(guān)聯(lián)每個(gè)所述關(guān)聯(lián)對(duì)象和所述目標(biāo)對(duì)象,得到多個(gè)詞包元 素;以及 利用所述第二子條件關(guān)聯(lián)多個(gè)所述詞包元素,得到具有所述篩選條件的所述目標(biāo)詞 包。
4. 根據(jù)權(quán)利要求2所述的篩選方法,其特征在于,所述關(guān)聯(lián)對(duì)象的數(shù)量為多個(gè),所述篩 選條件包括第一子條件和第二子條件,添加篩選條件至目標(biāo)詞包包括: 利用所述第一子條件關(guān)聯(lián)至少一個(gè)所述關(guān)聯(lián)對(duì)象和所述目標(biāo)對(duì)象,得到至少一個(gè)第一 詞包元素; 利用所述第一子條件關(guān)聯(lián)第一關(guān)聯(lián)對(duì)象和第二關(guān)聯(lián)對(duì)象,得到第二詞包元素,其中,所 述第一關(guān)聯(lián)對(duì)象和所述第二關(guān)聯(lián)對(duì)象均為多個(gè)所述關(guān)聯(lián)對(duì)象中的對(duì)象;以及 利用所述第二子條件關(guān)聯(lián)所述至少一個(gè)第一詞包元素和所述第二詞包元素,得到具有 所述篩選條件的所述目標(biāo)詞包。
5. 根據(jù)權(quán)利要求1所述的篩選方法,其特征在于,在獲取網(wǎng)頁(yè)頁(yè)面的文本內(nèi)容之前,所 述篩選方法還包括: 接收選擇指令,所述選擇指令用于確定獲取范圍, 其中,獲取網(wǎng)頁(yè)頁(yè)面的文本內(nèi)容包括:在所述獲取范圍內(nèi)獲取所述文本內(nèi)容。
6. -種文本內(nèi)容的篩選裝置,其特征在于,包括: 獲取單元,用于獲取網(wǎng)頁(yè)頁(yè)面的文本內(nèi)容; 添加單元,用于添加篩選條件至目標(biāo)詞包,其中,所述目標(biāo)詞包為包括目標(biāo)對(duì)象和關(guān)聯(lián) 對(duì)象的詞包,所述目標(biāo)對(duì)象為所述文本內(nèi)容中的待篩選對(duì)象,所述關(guān)聯(lián)對(duì)象為與所述目標(biāo) 對(duì)象具有關(guān)聯(lián)關(guān)系的對(duì)象;以及 篩選單元,用于利用具有所述篩選條件的所述目標(biāo)詞包對(duì)所述文本內(nèi)容進(jìn)行篩選,得 到所述目標(biāo)對(duì)象的目標(biāo)內(nèi)容。
7. 根據(jù)權(quán)利要求6所述的篩選裝置,其特征在于,所述添加單元包括: 第一關(guān)聯(lián)模塊,用于利用所述篩選條件關(guān)聯(lián)所述目標(biāo)對(duì)象和所述關(guān)聯(lián)對(duì)象。
8. 根據(jù)權(quán)利要求7所述的篩選裝置,其特征在于,所述關(guān)聯(lián)對(duì)象的數(shù)量為多個(gè),所述篩 選條件包括第一子條件和第二子條件,所述添加單元還包括: 第二關(guān)聯(lián)模塊,用于分別利用所述第一子條件關(guān)聯(lián)每個(gè)所述關(guān)聯(lián)對(duì)象和所述目標(biāo)對(duì) 象,得到多個(gè)詞包元素;以及 第三關(guān)聯(lián)模塊,用于利用所述第二子條件關(guān)聯(lián)多個(gè)所述詞包元素,得到具有所述篩選 條件的所述目標(biāo)詞包。
9. 根據(jù)權(quán)利要求7所述的篩選裝置,其特征在于,所述關(guān)聯(lián)對(duì)象的數(shù)量為多個(gè),所述篩 選條件包括第一子條件和第二子條件,所述添加單元還包括: 第四關(guān)聯(lián)模塊,用于利用所述第一子條件關(guān)聯(lián)至少一個(gè)所述關(guān)聯(lián)對(duì)象和所述目標(biāo)對(duì) 象,得到至少一個(gè)第一詞包元素; 第五關(guān)聯(lián)模塊,用于利用所述第一子條件關(guān)聯(lián)第一關(guān)聯(lián)對(duì)象和第二關(guān)聯(lián)對(duì)象,得到第 二詞包元素,其中,所述第一關(guān)聯(lián)對(duì)象和所述第二關(guān)聯(lián)對(duì)象均為多個(gè)所述關(guān)聯(lián)對(duì)象中的對(duì) 象;以及 第六關(guān)聯(lián)模塊,用于利用所述第二子條件關(guān)聯(lián)所述至少一個(gè)第一詞包元素和所述第二 詞包元素,得到具有所述篩選條件的所述目標(biāo)詞包。
10. 根據(jù)權(quán)利要求6所述的篩選裝置,其特征在于,所述篩選裝置還包括: 接收單元,用于在獲取網(wǎng)頁(yè)頁(yè)面的文本內(nèi)容之前,接收選擇指令,所述選擇指令用于確 定獲取范圍, 其中,所述獲取單元包括獲取模塊,用于在所述獲取范圍內(nèi)獲取所述文本內(nèi)容。
【文檔編號(hào)】G06F17/30GK104408103SQ201410666150
【公開(kāi)日】2015年3月11日 申請(qǐng)日期:2014年11月19日 優(yōu)先權(quán)日:2014年11月19日
【發(fā)明者】楊韜, 陳俊宏, 余德樂(lè), 趙冬玲 申請(qǐng)人:北京國(guó)雙科技有限公司