欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

摘要提取方法以及摘要提取模塊的制作方法

文檔序號(hào):6609650閱讀:304來源:國(guó)知局
專利名稱:摘要提取方法以及摘要提取模塊的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及根據(jù)關(guān)鍵詞從文檔中提取摘要的技術(shù)領(lǐng)域,特別是摘要提取方法和摘要提取模塊。
背景技術(shù)
搜索引擎是目前互聯(lián)網(wǎng)上常見的一種工具。通常,搜索引擎利用爬蟲從網(wǎng)絡(luò)上的站點(diǎn)或者本地計(jì)算機(jī)上獲取數(shù)據(jù),并形成多個(gè)文檔。當(dāng)用戶使用搜索引擎進(jìn)行搜索時(shí),搜索引擎根據(jù)用戶提交的關(guān)鍵詞匹配到一個(gè)或多個(gè)文檔。接著,搜索引擎中的摘要提取模塊根據(jù)用戶提交的關(guān)鍵詞,從所匹配到的文檔中提取與關(guān)鍵詞相關(guān)的內(nèi)容作為摘要,該摘要應(yīng)該能夠最大限度地包含與關(guān)鍵詞相關(guān)的信息,然后搜索引擎通過頁(yè)面將各個(gè)文檔的摘要顯示給用戶。
目前,摘要提取模塊在文檔中通過關(guān)鍵詞進(jìn)行位置匹配,然后將文檔中關(guān)鍵詞周圍的內(nèi)容作為摘要。例如,當(dāng)關(guān)鍵詞為三個(gè)時(shí),這些關(guān)鍵詞在文檔中出現(xiàn)了10次、12次、18次,現(xiàn)有的摘要提取模塊將這30處關(guān)鍵詞中的一部分關(guān)鍵詞及其附近的內(nèi)容作為摘要。
但是,當(dāng)文檔中有4個(gè)包括全部關(guān)鍵詞的句子時(shí),說明這4個(gè)句子與關(guān)鍵詞非常相關(guān),但是上述現(xiàn)有技術(shù)并不能得知這一情況,從而提取出這4個(gè)句子作為摘要的一部分。換言之,現(xiàn)有的摘要提取方法提取出的摘要與關(guān)鍵詞的關(guān)聯(lián)程度較低,并不能將文檔中與關(guān)鍵詞高度相關(guān)的內(nèi)容體現(xiàn)出來。

發(fā)明內(nèi)容
有鑒于此,本發(fā)明提出了一種摘要提取方法,用以將與關(guān)鍵詞高度匹配的內(nèi)容提取出來作為摘要。本發(fā)明還提出了一種摘要提取模塊。
本發(fā)明提供了一種摘要提取方法,該方法包括在文檔中以設(shè)定步長(zhǎng)滑動(dòng)窗口的過程中,從文檔中提取與當(dāng)前窗口對(duì)應(yīng)的當(dāng)前窗口內(nèi)容,根據(jù)關(guān)鍵詞計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重,并保存當(dāng)前窗口內(nèi)容及對(duì)應(yīng)的權(quán)重;在滑動(dòng)結(jié)束后,根據(jù)所保存的窗口內(nèi)容及對(duì)應(yīng)的權(quán)重,取出與較高權(quán)重對(duì)應(yīng)的一個(gè)或多個(gè)窗口內(nèi)容作為摘要。
所述設(shè)定步長(zhǎng)為文檔內(nèi)容中的最小單位。
在根據(jù)關(guān)鍵詞計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重之前進(jìn)一步包括判斷當(dāng)前窗口內(nèi)容中是否包含關(guān)鍵詞的步驟,并在是的情況下計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重。
所述根據(jù)關(guān)鍵詞計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重的步驟包括對(duì)每個(gè)關(guān)鍵詞的權(quán)重求和作為當(dāng)前窗口內(nèi)容的權(quán)重。
該方法進(jìn)一步包括根據(jù)各關(guān)鍵詞的重要性,為各關(guān)鍵詞的權(quán)重分別乘以一個(gè)系數(shù),其中所述系數(shù)隨重要性的增加而增大;和/或,為當(dāng)前窗口內(nèi)容的權(quán)重乘以或加上一個(gè)系數(shù),該系數(shù)在當(dāng)前窗口內(nèi)容中關(guān)鍵詞出現(xiàn)的次序與輸入的關(guān)鍵詞的次序越接近時(shí)和/或在當(dāng)前窗口內(nèi)容中關(guān)鍵詞之間的距離越短時(shí)越大。
在保存當(dāng)前窗口內(nèi)容及對(duì)應(yīng)的權(quán)重之前進(jìn)一步包括判斷當(dāng)前窗口內(nèi)容的權(quán)重是否大于與當(dāng)前窗口重疊的窗口內(nèi)容的權(quán)重,并在是的情況下保存當(dāng)前窗口內(nèi)容及對(duì)應(yīng)的權(quán)重。
所述取出與較高權(quán)重對(duì)應(yīng)的一個(gè)或多個(gè)窗口內(nèi)容作為摘要的步驟包括根據(jù)權(quán)重對(duì)對(duì)應(yīng)的窗口內(nèi)容排序;根據(jù)摘要的大小,按照權(quán)重從大到小的順序取出一個(gè)或多個(gè)窗口內(nèi)容作為摘要。
本發(fā)明還提供了一種摘要提取模塊,該模塊包括存儲(chǔ)單元、滑動(dòng)單元、計(jì)算單元以及摘要形成單元,其中所述存儲(chǔ)單元用于存儲(chǔ)文檔、窗口內(nèi)容及對(duì)應(yīng)的權(quán)重;所述滑動(dòng)單元用于在文檔中以設(shè)定步長(zhǎng)滑動(dòng)窗口,并在滑動(dòng)的過程中,從文檔中提取與當(dāng)前窗口對(duì)應(yīng)的當(dāng)前窗口內(nèi)容提供給計(jì)算單元;
所述計(jì)算單元用于根據(jù)關(guān)鍵詞計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重,并在存儲(chǔ)單元中保存當(dāng)前窗口內(nèi)容及對(duì)應(yīng)的權(quán)重;所述摘要形成單元用于在滑動(dòng)結(jié)束后從所述存儲(chǔ)單元取出與較高權(quán)重對(duì)應(yīng)的一個(gè)或多個(gè)窗口內(nèi)容作為摘要。
該摘要提取模塊進(jìn)一步包括設(shè)置單元,用于為滑動(dòng)單元設(shè)置窗口大小和滑動(dòng)步長(zhǎng);和/或,排序模塊,用于根據(jù)權(quán)重對(duì)存儲(chǔ)單元中對(duì)應(yīng)的窗口內(nèi)容排序,以便所述摘要生成單元順序取出與較高權(quán)重對(duì)應(yīng)的一個(gè)或多個(gè)窗口內(nèi)容作為摘要。
所述計(jì)算單元進(jìn)一步用于判斷當(dāng)前窗口內(nèi)容中是否包含關(guān)鍵詞,并在是的情況下計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重;和/或,進(jìn)一步用于判斷當(dāng)前窗口內(nèi)容的權(quán)重是否大于與當(dāng)前窗口重疊的窗口內(nèi)容的權(quán)重,并在是的情況下保存當(dāng)前窗口內(nèi)容及對(duì)應(yīng)的權(quán)重。
從上述方案中可以看出,由于本發(fā)明在窗口滑動(dòng)過程中根據(jù)關(guān)鍵詞計(jì)算窗口內(nèi)容的權(quán)重,最后取出與較高權(quán)重對(duì)應(yīng)的一個(gè)或多個(gè)窗口內(nèi)容作為摘要,從而取出能夠最佳反應(yīng)與關(guān)鍵詞關(guān)系的摘要內(nèi)容,將與用戶輸入的關(guān)鍵詞最貼近的內(nèi)容作為摘要提供給用戶。


圖1為根據(jù)本發(fā)明實(shí)施例的摘要提取方法的流程示意圖;圖2為根據(jù)本發(fā)明實(shí)施例的摘要提取系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施例方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,以下舉實(shí)施例對(duì)本發(fā)明進(jìn)一步詳細(xì)說明。
圖1為根據(jù)本發(fā)明實(shí)施例的摘要提取方法的流程示意圖。如圖1所示,本發(fā)明實(shí)施例的摘要提取方法包括以下步驟步驟101,預(yù)先設(shè)定窗口大小以及滑動(dòng)步長(zhǎng)。這里的窗口是指在文檔中提取內(nèi)容的基本單元,通常包括多個(gè)字詞。一般來說步長(zhǎng)要小于等于窗口的大小,否則就不能覆蓋到文檔的全部?jī)?nèi)容。
優(yōu)選地,將步長(zhǎng)設(shè)為文檔中內(nèi)容的最小單位,例如一個(gè)漢字、一個(gè)英文單詞、一個(gè)數(shù)字等。
步驟102,以設(shè)定的步長(zhǎng)向前滑動(dòng)窗口,并提取當(dāng)前窗口所對(duì)應(yīng)的內(nèi)容。在這里將窗口所對(duì)應(yīng)的內(nèi)容的稱為窗口內(nèi)容,將當(dāng)前窗口所對(duì)應(yīng)的內(nèi)容稱為當(dāng)前窗口內(nèi)容。
步驟103,判斷當(dāng)前窗口中是否包含關(guān)鍵詞,如果包含關(guān)鍵詞,則執(zhí)行步驟104及其后續(xù)步驟;否則,執(zhí)行步驟107及其后續(xù)步驟。
當(dāng)然,也可以不進(jìn)行步驟103的判斷而直接執(zhí)行步驟104及其后續(xù)步驟,因?yàn)椴话P(guān)鍵詞的情況下當(dāng)前窗口的權(quán)重會(huì)被計(jì)算為零,從而不會(huì)被用作摘要。
步驟104,根據(jù)關(guān)鍵詞計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重。
這里以關(guān)鍵詞為多個(gè)的情況進(jìn)行描述。當(dāng)關(guān)鍵詞為單個(gè)時(shí),可以看成是多個(gè)關(guān)鍵詞的簡(jiǎn)化特例。
簡(jiǎn)單來說,窗口內(nèi)容的權(quán)重等于對(duì)每個(gè)關(guān)鍵詞的權(quán)重求和。簡(jiǎn)便起見,以兩個(gè)關(guān)鍵詞為例進(jìn)行描述。假設(shè)用戶輸入的關(guān)鍵詞是“摘要提取”兩個(gè)詞,那么,窗口內(nèi)容的權(quán)重就等于“摘要”的權(quán)重加上“提取”的權(quán)重。而每個(gè)關(guān)鍵詞的權(quán)重與這個(gè)關(guān)鍵詞在當(dāng)前窗口內(nèi)容中出現(xiàn)的次數(shù)相關(guān),出現(xiàn)的次數(shù)越多,關(guān)鍵詞的權(quán)重越大。從上面的描述可以看出,窗口內(nèi)容的權(quán)重與其中出現(xiàn)的關(guān)鍵詞的個(gè)數(shù)以及各個(gè)關(guān)鍵詞出現(xiàn)的次數(shù)相關(guān)。當(dāng)關(guān)鍵詞為單個(gè)時(shí),只需要按照上述方法將關(guān)鍵詞的權(quán)重作為當(dāng)前窗口內(nèi)容的權(quán)重即可,并不涉及下面的內(nèi)容。
進(jìn)一步,由于每個(gè)關(guān)鍵詞的重要性是不一樣的,可以在求和之前為每個(gè)關(guān)鍵詞的權(quán)重乘以一個(gè)系數(shù)。例如,在文檔中“摘要”出現(xiàn)了784次,而“提取”出現(xiàn)了98次,在文檔中出現(xiàn)次數(shù)多的關(guān)鍵詞的重要性一般小于在文檔中出現(xiàn)次數(shù)少,所以在求和之前為“摘要”的權(quán)重乘以一個(gè)較小的系數(shù),而為“提取”的乘以一個(gè)較大的系數(shù),從而區(qū)分出兩者的重要性。
更進(jìn)一步,在計(jì)算窗口內(nèi)容的權(quán)重時(shí),還可以根據(jù)窗口內(nèi)容中多個(gè)關(guān)鍵詞的相關(guān)程度,對(duì)窗口內(nèi)容的權(quán)重進(jìn)行修正,例如加一個(gè)系數(shù)和/或乘以一個(gè)系數(shù)。舉例來說,當(dāng)窗口內(nèi)容中的“摘要”、“提取”出現(xiàn)的次序與用戶輸入的順序一致或者越接近時(shí),加上一個(gè)較大的系數(shù)和/或乘以一個(gè)較大的系數(shù);當(dāng)窗口內(nèi)容中的“摘要”、“提取”出現(xiàn)的次序與用戶輸入的順序不一致或者越不接近時(shí),加上一個(gè)較小的系數(shù)和/或乘以一個(gè)較小的系數(shù);當(dāng)窗口內(nèi)容中的“摘要”和“提取”的距離較短時(shí),加上一個(gè)較大的系數(shù)和/或乘以一個(gè)較大的系數(shù);當(dāng)窗口內(nèi)容中的“摘要”和“提取”的距離較大時(shí),加上一個(gè)較小的系數(shù)和/或乘以一個(gè)較小的系數(shù)。
步驟105,判斷當(dāng)前窗口內(nèi)容的權(quán)重是否大于與當(dāng)前窗口重疊的窗口內(nèi)容的權(quán)重,如果是,則執(zhí)行步驟106及其后續(xù)步驟;否則,丟棄當(dāng)前窗口內(nèi)容,然后執(zhí)行步驟107及其后續(xù)步驟。
步驟106,保存當(dāng)前窗口內(nèi)容以及對(duì)應(yīng)的權(quán)重。
另外,也可以不執(zhí)行步驟105的判斷,直接保存當(dāng)前窗口內(nèi)容以及對(duì)應(yīng)的權(quán)重。
步驟107,判斷滑動(dòng)是否結(jié)束,即是否達(dá)到文檔末尾,如果是,則執(zhí)行步驟108及其后續(xù)步驟;如果不是,則執(zhí)行步驟102及其后續(xù)步驟。
步驟108,對(duì)保存的窗口內(nèi)容按照權(quán)重進(jìn)行排序,不妨假設(shè)按照與其對(duì)應(yīng)的權(quán)重從大到小排列。
步驟109,根據(jù)摘要長(zhǎng)度的要求,按照步驟108中的排序,從排列的窗口內(nèi)容中依照圈中從大到小的次序取出一個(gè)或多個(gè)窗口內(nèi)容,從而形成摘要。
另外,在本發(fā)明實(shí)施例的方法中,也可以不執(zhí)行步驟108的排序,而是在步驟109中,根據(jù)所保存的窗口內(nèi)容及對(duì)應(yīng)的權(quán)重,取出與較高權(quán)重對(duì)應(yīng)的一個(gè)或多個(gè)窗口內(nèi)容作為摘要。
該流程至此結(jié)束。
圖2是根據(jù)本發(fā)明實(shí)施例的摘要提取模塊的結(jié)構(gòu)示意圖。參照?qǐng)D2,該摘要提取裝置包括存儲(chǔ)單元、滑動(dòng)單元、計(jì)算單元以及摘要形成單元。
其中,存儲(chǔ)單元用于存儲(chǔ)文檔、窗口內(nèi)容及對(duì)應(yīng)的權(quán)重。
滑動(dòng)單元用于在文檔中以設(shè)定步長(zhǎng)滑動(dòng)窗口,并且在滑動(dòng)的過程中,從文檔中提取與當(dāng)前窗口對(duì)應(yīng)的當(dāng)前窗口內(nèi)容,然后將當(dāng)前窗口內(nèi)容提供給計(jì)算單元。
計(jì)算單元用于根據(jù)關(guān)鍵詞計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重,并在存儲(chǔ)單元中保存當(dāng)前窗口內(nèi)容及對(duì)應(yīng)的權(quán)重。計(jì)算單元可以通過對(duì)每個(gè)關(guān)鍵詞的權(quán)重求和作為當(dāng)前窗口內(nèi)容的權(quán)重。進(jìn)一步,計(jì)算單元還可以根據(jù)各關(guān)鍵詞的重要性,為各關(guān)鍵詞的權(quán)重分別乘以一個(gè)系數(shù),其中所述系數(shù)隨重要性的增加而增大。另外,計(jì)算單元還可以為當(dāng)前窗口內(nèi)容的權(quán)重乘以或加上一個(gè)系數(shù),該系數(shù)在當(dāng)前窗口中關(guān)鍵詞出現(xiàn)的次序與輸入的關(guān)鍵詞的次序越接近時(shí)和/或在當(dāng)前窗口中關(guān)鍵詞之間的距離越短時(shí)越大。
另外,計(jì)算單元可以進(jìn)一步在收到當(dāng)前窗口內(nèi)容并且未計(jì)算當(dāng)前窗口的權(quán)重時(shí),判斷當(dāng)前窗口內(nèi)容中是否包含關(guān)鍵詞,并在是的情況下計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重,如果當(dāng)前窗口內(nèi)容中不包含關(guān)鍵詞,則不計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重,從滑動(dòng)單元接收并處理下一個(gè)當(dāng)前窗口內(nèi)容。
另外,計(jì)算單元可以進(jìn)一步在保存當(dāng)前窗口內(nèi)容及對(duì)應(yīng)的權(quán)重時(shí),判斷當(dāng)前窗口內(nèi)容的權(quán)重是否大于與當(dāng)前窗口重疊的窗口內(nèi)容的權(quán)重,并在是的情況下保存當(dāng)前窗口內(nèi)容及對(duì)應(yīng)的權(quán)重,如果當(dāng)前窗口內(nèi)容的權(quán)重不大于與當(dāng)前窗口重疊的窗口內(nèi)容的權(quán)重,則丟棄當(dāng)前窗口內(nèi)容。
摘要形成單元用于在滑動(dòng)結(jié)束后從存儲(chǔ)單元取出與較高權(quán)重對(duì)應(yīng)的一個(gè)或多個(gè)窗口內(nèi)容作為摘要。
繼續(xù)參照?qǐng)D2,本發(fā)明實(shí)施例的摘要提取模塊還可以進(jìn)一步包括設(shè)置單元,該設(shè)置單元用于為滑動(dòng)單元設(shè)置窗口大小和滑動(dòng)步長(zhǎng)。
本發(fā)明實(shí)施例的摘要提取模塊還可以進(jìn)一步包括排序單元,該排序單元用于根據(jù)權(quán)重對(duì)存儲(chǔ)單元中對(duì)應(yīng)的窗口內(nèi)容排序,以便摘要生成單元順序取出與較高權(quán)重對(duì)應(yīng)的一個(gè)或多個(gè)窗口內(nèi)容作為摘要。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種摘要提取方法,其特征在于,該方法包括在文檔中以設(shè)定步長(zhǎng)滑動(dòng)窗口的過程中,從文檔中提取與當(dāng)前窗口對(duì)應(yīng)的當(dāng)前窗口內(nèi)容,根據(jù)關(guān)鍵詞計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重,并保存當(dāng)前窗口內(nèi)容及對(duì)應(yīng)的權(quán)重;在滑動(dòng)結(jié)束后,根據(jù)所保存的窗口內(nèi)容及對(duì)應(yīng)的權(quán)重,取出與較高權(quán)重對(duì)應(yīng)的一個(gè)或多個(gè)窗口內(nèi)容作為摘要。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述設(shè)定步長(zhǎng)為文檔內(nèi)容中的最小單位。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在根據(jù)關(guān)鍵詞計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重之前進(jìn)一步包括判斷當(dāng)前窗口內(nèi)容中是否包含關(guān)鍵詞的步驟,并在是的情況下計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)關(guān)鍵詞計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重的步驟包括對(duì)每個(gè)關(guān)鍵詞的權(quán)重求和作為當(dāng)前窗口內(nèi)容的權(quán)重。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,該方法進(jìn)一步包括根據(jù)各關(guān)鍵詞的重要性,為各關(guān)鍵詞的權(quán)重分別乘以一個(gè)系數(shù),其中所述系數(shù)隨重要性的增加而增大;和/或,為當(dāng)前窗口內(nèi)容的權(quán)重乘以或加上一個(gè)系數(shù),該系數(shù)在當(dāng)前窗口內(nèi)容中關(guān)鍵詞出現(xiàn)的次序與輸入的關(guān)鍵詞的次序越接近時(shí)和/或在當(dāng)前窗口內(nèi)容中關(guān)鍵詞之間的距離越短時(shí)越大。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,在保存當(dāng)前窗口內(nèi)容及對(duì)應(yīng)的權(quán)重之前進(jìn)一步包括判斷當(dāng)前窗口內(nèi)容的權(quán)重是否大于與當(dāng)前窗口重疊的窗口內(nèi)容的權(quán)重,并在是的情況下保存當(dāng)前窗口內(nèi)容及對(duì)應(yīng)的權(quán)重。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述取出與較高權(quán)重對(duì)應(yīng)的一個(gè)或多個(gè)窗口內(nèi)容作為摘要的步驟包括根據(jù)權(quán)重對(duì)對(duì)應(yīng)的窗口內(nèi)容排序;根據(jù)摘要的大小,按照權(quán)重從大到小的順序取出一個(gè)或多個(gè)窗口內(nèi)容作為摘要。
8.一種摘要提取模塊,其特征在于,該摘要提取模塊包括存儲(chǔ)單元、滑動(dòng)單元、計(jì)算單元以及摘要形成單元,其中所述存儲(chǔ)單元用于存儲(chǔ)文檔、窗口內(nèi)容及對(duì)應(yīng)的權(quán)重;所述滑動(dòng)單元用于在文檔中以設(shè)定步長(zhǎng)滑動(dòng)窗口,并在滑動(dòng)的過程中,從文檔中提取與當(dāng)前窗口對(duì)應(yīng)的當(dāng)前窗口內(nèi)容提供給計(jì)算單元;所述計(jì)算單元用于根據(jù)關(guān)鍵詞計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重,并在存儲(chǔ)單元中保存當(dāng)前窗口內(nèi)容及對(duì)應(yīng)的權(quán)重;所述摘要形成單元用于在滑動(dòng)結(jié)束后從所述存儲(chǔ)單元取出與較高權(quán)重對(duì)應(yīng)的一個(gè)或多個(gè)窗口內(nèi)容作為摘要。
9.根據(jù)權(quán)利要求1所述的摘要提取模塊,其特征在于,該摘要提取模塊進(jìn)一步包括設(shè)置單元,用于為滑動(dòng)單元設(shè)置窗口大小和滑動(dòng)步長(zhǎng);和/或,排序模塊,用于根據(jù)權(quán)重對(duì)存儲(chǔ)單元中對(duì)應(yīng)的窗口內(nèi)容排序,以便所述摘要生成單元順序取出與較高權(quán)重對(duì)應(yīng)的一個(gè)或多個(gè)窗口內(nèi)容作為摘要。
10.根據(jù)權(quán)利要求1所述的摘要提取模塊,其特征在于,所述計(jì)算單元進(jìn)一步用于判斷當(dāng)前窗口內(nèi)容中是否包含關(guān)鍵詞,并在是的情況下計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重;和/或,進(jìn)一步用于判斷當(dāng)前窗口內(nèi)容的權(quán)重是否大于與當(dāng)前窗口重疊的窗口內(nèi)容的權(quán)重,并在是的情況下保存當(dāng)前窗口內(nèi)容及對(duì)應(yīng)的權(quán)重。
全文摘要
本發(fā)明公開了一種摘要提取方法,該方法包括在文檔中以設(shè)定步長(zhǎng)滑動(dòng)窗口的過程中,從文檔中提取與當(dāng)前窗口對(duì)應(yīng)的當(dāng)前窗口內(nèi)容,根據(jù)關(guān)鍵詞計(jì)算當(dāng)前窗口內(nèi)容的權(quán)重,并保存當(dāng)前窗口內(nèi)容及對(duì)應(yīng)的權(quán)重;在滑動(dòng)結(jié)束后,根據(jù)所保存的窗口內(nèi)容及對(duì)應(yīng)的權(quán)重,取出與較高權(quán)重對(duì)應(yīng)的一個(gè)或多個(gè)窗口內(nèi)容作為摘要。本發(fā)明還公開了一種摘要提取模塊,該模塊包括存儲(chǔ)單元、滑動(dòng)單元、計(jì)算單元以及摘要形成單元。由于本發(fā)明在窗口滑動(dòng)過程中根據(jù)關(guān)鍵詞計(jì)算窗口內(nèi)容的權(quán)重,最后取出與較高權(quán)重對(duì)應(yīng)的一個(gè)或多個(gè)窗口內(nèi)容作為摘要,從而取出能夠最佳反應(yīng)與關(guān)鍵詞關(guān)系的摘要內(nèi)容,將與用戶輸入的關(guān)鍵詞最貼近的內(nèi)容作為摘要提供給用戶。
文檔編號(hào)G06F17/30GK101075260SQ200710109499
公開日2007年11月21日 申請(qǐng)日期2007年6月28日 優(yōu)先權(quán)日2007年6月28日
發(fā)明者袁哲 申請(qǐng)人:騰訊科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
盐津县| 宜良县| 达拉特旗| 信丰县| 陈巴尔虎旗| 柏乡县| 罗山县| 洛浦县| 南和县| 华容县| 调兵山市| 大竹县| 平谷区| 道孚县| 永丰县| 桑日县| 甘谷县| 四川省| 汝南县| 嘉禾县| 青浦区| 南宁市| 英超| 阜城县| 孙吴县| 远安县| 呼伦贝尔市| 美姑县| 丹寨县| 聊城市| 昌乐县| 武宁县| 缙云县| 阳曲县| 偏关县| 合山市| 乐山市| 团风县| 姚安县| 白玉县| 老河口市|