欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于創(chuàng)建文檔摘要的系統(tǒng)和方法

文檔序號(hào):6650158閱讀:166來源:國(guó)知局
專利名稱:用于創(chuàng)建文檔摘要的系統(tǒng)和方法
背景技術(shù)
本發(fā)明適用于一種用于創(chuàng)建摘要的技術(shù),該技術(shù)基于問題內(nèi)容從文檔中提取適合于摘要的范圍以創(chuàng)建摘要。特別地,本發(fā)明涉及一種用于創(chuàng)建文檔摘要的能調(diào)整候選范圍的系統(tǒng)和方法,所述候選范圍之一被提取作為摘要。
在基于使用自然語言構(gòu)建的問題內(nèi)容從文檔中提取適合于摘要的范圍來創(chuàng)建摘要的常規(guī)的文檔摘要?jiǎng)?chuàng)建系統(tǒng)中,依照如下所示的過程明確地創(chuàng)建摘要,例如日本專利申請(qǐng)KOKAI公告號(hào)2003-256425中所公開的。
首先,對(duì)使用自然語言構(gòu)建的問題進(jìn)行語素分析并將其劃分為單詞。通過將每個(gè)獲得的單詞與字典數(shù)據(jù)相比較而進(jìn)行語義分析。確定特定單詞的含義(時(shí)間、人物、地點(diǎn)等等)。
然后,在能被用于摘要的目標(biāo)的多個(gè)文檔上類似地執(zhí)行語素和語義分析。根據(jù)使用例如“新行單元”或“句點(diǎn)單元”的文檔單元的固定選擇方法來提取摘要目標(biāo)范圍,即,每一能被用作摘要候選的范圍(以下稱為“候選范圍”)。然后,對(duì)于每個(gè)被提取的候選范圍,將語素和語義分析結(jié)果與在問題上執(zhí)行的語素和語義分析結(jié)果相比較。比較結(jié)果顯示的具有高度一致性的候選被確定為問題的摘要。然而,這種常規(guī)的文檔摘要?jiǎng)?chuàng)建方法存在如下描述的問題。
該方法使用固定的方法來選擇候選范圍。即,通過“認(rèn)為新行單元為一個(gè)文檔”的這樣一種固定的選擇方法,如果在逐條列記部分的情況下為每個(gè)語義單元?jiǎng)?chuàng)建新行,則整個(gè)逐條列記部分就不能被選擇用作候選范圍。
例如,將考慮一種情況,其中,從例如以下所示的一個(gè)目標(biāo)文檔中提取問題“什么是常規(guī)的摘要方法?”的摘要。
(目標(biāo)文檔)“通過常規(guī)的摘要技術(shù),<新行1>
1.對(duì)使用自然語言構(gòu)建的問題進(jìn)行語素分析并將其劃分為單詞。進(jìn)一步地,基于語義分析,確定特定單詞的含義(時(shí)間、人物、地點(diǎn)等等)。<新行2>
2.也對(duì)一組摘要目標(biāo)文檔進(jìn)行語素和語義分析。目標(biāo)范圍被認(rèn)為符合固定的選擇方法,即,例如“新行單元”或“句點(diǎn)單元”的文檔單元。將在每個(gè)目標(biāo)范圍上執(zhí)行的語素和語義分析結(jié)果與在問題上執(zhí)行的語素和語義分析結(jié)果相比較。最相近的目標(biāo)范圍被確定為文檔的摘要。<新行3>
這就是怎樣執(zhí)行常規(guī)的摘要技術(shù)?!?amp;lt;新行4>
以上目標(biāo)文檔具有4個(gè)新行。不過,將通過新行從彼此之中分離出來的每個(gè)范圍認(rèn)為是一個(gè)候選范圍。因此,對(duì)于問題“什么是常規(guī)的摘要方法”,無法將整個(gè)目標(biāo)文檔提供作為摘要,盡管其適合作為摘要。

發(fā)明內(nèi)容
考慮到上述情況做出本發(fā)明。本發(fā)明的目的是提供創(chuàng)建文檔摘要的能任意設(shè)置候選范圍的系統(tǒng)和方法,所述候選范圍之一被提取作為問題的摘要。
為了實(shí)現(xiàn)以上發(fā)明目的,本發(fā)明使用了下面描述的方法。
本發(fā)明提供創(chuàng)建文檔摘要的系統(tǒng)和方法,所述系統(tǒng)和方法基于輸入檢索條件檢索文檔,并基于輸入摘要?jiǎng)?chuàng)建條件從所檢索的文檔中提取適合于摘要的范圍,其中,基于輸入范圍設(shè)置條件在所檢索的文檔中設(shè)置候選范圍,所述的候選范圍之一被提取作為摘要。為提取適合于摘要的部分,提取被設(shè)置的候選范圍之一。范圍的設(shè)置條件包括例如限制了所檢索文檔的至少一個(gè)限制條件和候選范圍的格式條件。可以通過交互輸入接收裝置輸入這樣的范圍設(shè)置條件。將涉及上述相關(guān)系統(tǒng)和方法的本發(fā)明制作成允許計(jì)算機(jī)執(zhí)行上述過程的程序。
使用上述方法的本發(fā)明甚至能從用各種表達(dá)形式的文檔中提取適合作為摘要的部分。進(jìn)一步地,設(shè)置范圍設(shè)置條件能夠限制將要檢索的文檔以及仔細(xì)指定候選范圍。因此,能夠創(chuàng)建更精確的摘要。
將在以下的描述中提出本發(fā)明的其它目標(biāo)和優(yōu)點(diǎn),部分目標(biāo)和優(yōu)點(diǎn)通過描述將顯而易見,或者可以通過實(shí)施本發(fā)明而認(rèn)識(shí)到??梢砸揽吭谙挛闹芯唧w指出的手段及組合而實(shí)現(xiàn)并獲得本發(fā)明的目標(biāo)和優(yōu)點(diǎn)。


被并入并且組成說明書一部分的附圖示例了本發(fā)明的實(shí)施例,并與上面給出的綜述及下面對(duì)實(shí)施例的詳細(xì)描述一起用于解釋本發(fā)明的原理。
附圖1是示出了根據(jù)本發(fā)明實(shí)施例的用于創(chuàng)建文檔摘要的方法所應(yīng)用的文檔摘要?jiǎng)?chuàng)建系統(tǒng)的示例的功能框圖;附圖2是示出了用于輸入摘要?jiǎng)?chuàng)建條件、檢索條件和范圍設(shè)置條件的交互輸入屏幕的示例的概圖;附圖3是詳細(xì)示出了檢索引擎的功能配置的示例的框圖;附圖4是示出了根據(jù)本發(fā)明實(shí)施例的用于創(chuàng)建文檔摘要的方法所應(yīng)用的文檔摘要?jiǎng)?chuàng)建系統(tǒng)的操作流程圖;附圖5是示出了由文檔檢索部所檢索的文檔的示例的圖;附圖6是示出了被設(shè)置了候選范圍的文檔的示例的圖;附圖7是示出了被設(shè)置了候選范圍的另一個(gè)文檔的示例的圖;及附圖8是示出了由摘要提取部所提取的摘要的示例的圖。
具體實(shí)施例方式
參照附圖,將給出實(shí)施本發(fā)明的最佳模式的描述。
附圖1是示出了根據(jù)本發(fā)明實(shí)施例的用于創(chuàng)建文檔摘要的方法所應(yīng)用的文檔摘要?jiǎng)?chuàng)建系統(tǒng)的示例的功能框圖。
根據(jù)本發(fā)明實(shí)施例的文檔摘要?jiǎng)?chuàng)建系統(tǒng)10包括通過例如因特網(wǎng)的通信網(wǎng)絡(luò)12連接在一起的客戶端20和服務(wù)器30。服務(wù)器30基于客戶端20輸入的檢索條件來檢索文檔。進(jìn)一步地,服務(wù)器30通過基于客戶端20輸入的摘要?jiǎng)?chuàng)建條件提取適合于摘要的候選范圍來創(chuàng)建文檔摘要,所述候選范圍被包括在基于客戶端20輸入的范圍設(shè)置條件在所檢索的文檔中設(shè)置的那些候選范圍中。
客戶端20包括通過通信網(wǎng)絡(luò)12與服務(wù)器30傳送和接收數(shù)據(jù)的通信部22,包括如鍵盤和鼠標(biāo)(未示出)的輸入工具以使用戶可以使用輸入工具輸入例如檢索條件、摘要?jiǎng)?chuàng)建條件和范圍設(shè)置條件的數(shù)據(jù)的輸入部24,以及包括了例如用于顯示通過通信部22從服務(wù)器30接收的數(shù)據(jù)和由輸入部24輸入的如檢索條件、摘要?jiǎng)?chuàng)建條件和范圍設(shè)置條件的數(shù)據(jù)的顯示器的顯示部26。為了從輸入部24輸入如檢索條件、摘要?jiǎng)?chuàng)建條件和范圍設(shè)置條件的數(shù)據(jù),用戶可以在顯示部26上顯示交互輸入屏幕,并根據(jù)顯示部26上顯示的交互輸入屏幕輸入數(shù)據(jù)。
圖2是示出了在顯示部26上顯示的便于用戶可以從輸入部24完全地輸入摘要?jiǎng)?chuàng)建條件、檢索條件和范圍設(shè)置條件的交互輸入屏幕40的示例的概圖。
輸入屏幕40包括摘要?jiǎng)?chuàng)建條件輸入部42、檢索條件輸入部44和范圍設(shè)置條件輸入部48。
摘要?jiǎng)?chuàng)建條件輸入部42包括應(yīng)用復(fù)選部43a和問題輸入部43b。為設(shè)置摘要?jiǎng)?chuàng)建條件,用戶選中應(yīng)用復(fù)選部43a(圖2中示出了選中標(biāo)記)并在問題輸入部43b上輸入使用自然語言構(gòu)建的用于創(chuàng)建摘要的問題。
檢索條件輸入部44包括被選中以指定需要搜索的數(shù)據(jù)庫名的應(yīng)用復(fù)選部45a、用于輸入包括在數(shù)據(jù)庫部37中的被指定和搜索的多個(gè)數(shù)據(jù)庫38(#1,#2,.....,#n)之一的名的數(shù)據(jù)庫名輸入部45b、被選中以指定將被檢索的文檔的資源(例如,URL)的應(yīng)用復(fù)選部46a、如果應(yīng)用復(fù)選部46a被選中則用于輸入資源名的資源名輸入部46b、被選中以指定如關(guān)鍵詞、更新日期和文件格式的檢索條件的申請(qǐng)復(fù)選部47a、以及如果應(yīng)用復(fù)選部47a被選中則用于輸入檢索條件的檢索條件輸入部47b。
范圍設(shè)置條件輸入部48是用于輸入范圍設(shè)置條件的部,范圍設(shè)置條件在文檔中設(shè)置候選范圍,所述候選范圍之一被提取作為摘要。范圍設(shè)置條件輸入部48包括基選擇部49和格式設(shè)置部50。為將候選范圍指定為新行賦予最高優(yōu)先權(quán),用戶在基選擇部49中選中應(yīng)用復(fù)選部49a。為將候選范圍指定為句點(diǎn)賦予最高優(yōu)先權(quán),用戶在基選擇部49中選中應(yīng)用復(fù)選部49b。對(duì)于在基選擇部49中指定的優(yōu)選項(xiàng),在格式設(shè)置部50中設(shè)置更加詳細(xì)的格式條件。對(duì)于將如圖中的51b,52b,...,58b示出為格式條件的這樣的特定項(xiàng),選中與將被應(yīng)用的項(xiàng)相應(yīng)的應(yīng)用復(fù)選部51a,52a,...,58a。如果選中應(yīng)用復(fù)選部53a、57a和58a,則通過把相應(yīng)的字符數(shù)輸入到字符數(shù)輸入部53c、把從開頭的相應(yīng)行數(shù)輸入到開頭行數(shù)輸入部57c、把從結(jié)尾的相應(yīng)行數(shù)輸入到結(jié)尾行數(shù)輸入部58c來指定特定的數(shù)值。圖2中所示的格式設(shè)置部50僅僅是示例性的??梢酝ㄟ^增加其它項(xiàng)而輸入更詳細(xì)的范圍設(shè)置條件。
服務(wù)器30包括基于通過使用例如圖2所示的輸入屏幕40的輸入部24輸入的檢索條件、摘要?jiǎng)?chuàng)建條件和范圍設(shè)置條件來檢索文檔并且創(chuàng)建所檢索文檔的摘要的通信部31,通信部31通過通信網(wǎng)絡(luò)12與客戶端20傳送和接收數(shù)據(jù);包括存儲(chǔ)文檔數(shù)據(jù)的一個(gè)或多個(gè)數(shù)據(jù)庫38(#1,#2,...,#n)的數(shù)據(jù)庫部37;以及基于由客戶端20傳送到通信部31的檢索條件、摘要?jiǎng)?chuàng)建條件和范圍設(shè)置條件在由數(shù)據(jù)庫部37提供的數(shù)據(jù)庫38(#1,#2,...,#n)中搜索文檔并且創(chuàng)建所檢索文檔的摘要的檢索引擎32。
圖3是詳細(xì)示出了檢索引擎32的功能配置的示例的框圖。檢索引擎32包括文檔檢索部33、存儲(chǔ)器34、候選范圍設(shè)置部35和摘要提取部36。
當(dāng)客戶端20發(fā)送檢索條件、摘要?jiǎng)?chuàng)建條件和范圍設(shè)置條件到通信部31時(shí),文檔檢索部33基于檢索條件在由數(shù)據(jù)庫部37提供的數(shù)據(jù)庫38(#1,#2,...,#n)中搜索文檔。文檔檢索部33將所檢索的文檔存儲(chǔ)在存儲(chǔ)器34中。
候選范圍設(shè)置部35獲取在存儲(chǔ)器34中存儲(chǔ)的文檔。候選范圍設(shè)置部35為基于包括于通過客戶端20傳送給通信部31的檢索條件、摘要?jiǎng)?chuàng)建條件和范圍設(shè)置條件之中的范圍設(shè)置條件而獲取的文檔設(shè)置候選范圍,所述候選范圍之一被提取作為摘要。候選范圍設(shè)置部35然后將獲取的文檔分離成所設(shè)置的候選范圍。候選范圍設(shè)置部35將被分離成候選范圍的文檔蓋寫并存儲(chǔ)到存儲(chǔ)器34中。
基于包括于由客戶端20傳送到通信部31的檢索條件、摘要?jiǎng)?chuàng)建條件和范圍設(shè)置條件之中的摘要?jiǎng)?chuàng)建條件,摘要提取部36在由自然語言構(gòu)成的并被輸入到問題輸入部43b的問題上執(zhí)行作為公知技術(shù)的語素和語義分析。語素和語義分析是公知的技術(shù),因此將不再對(duì)其進(jìn)行詳細(xì)描述。
此外,摘要提取部36對(duì)存儲(chǔ)在存儲(chǔ)器34中的文檔的每一候選范圍類似地執(zhí)行語素和語義分析。摘要提取部36將在問題上執(zhí)行的語素和語義分析結(jié)果和在每個(gè)候選范圍上執(zhí)行的語素和語義分析結(jié)果進(jìn)行比較。然后摘要提取部36提取通過比較結(jié)果示出的具有最高程度一致性的候選范圍,作為適合于摘要的部分。然后摘要提取部36將提取的候選范圍輸出到通信部31。
然后,通信部31將對(duì)應(yīng)于摘要提取部36所提取候選范圍的數(shù)據(jù)通過通信網(wǎng)絡(luò)12傳送到客戶端20。數(shù)據(jù)被客戶端20的通信部22接收并在顯示部26上顯示。用戶查看顯示器以獲取指定問題的摘要。
通過加載了存儲(chǔ)在如磁盤的存儲(chǔ)媒體中的程序或通過如因特網(wǎng)的網(wǎng)絡(luò)下載的程序并使所述的程序控制其操作的計(jì)算機(jī)來實(shí)現(xiàn)按以上描述所配置的本系統(tǒng)10。
存儲(chǔ)媒體的示例包括磁盤、軟盤、硬盤、光盤(CD-ROM,DVD或類似產(chǎn)品)、磁光盤(MO或類似產(chǎn)品)和半導(dǎo)體存儲(chǔ)器。所述存儲(chǔ)媒體可以具有能存儲(chǔ)程序并能被計(jì)算機(jī)讀取的任何存儲(chǔ)形式。
基于例如數(shù)據(jù)庫管理軟件或網(wǎng)絡(luò)軟件的安裝在計(jì)算機(jī)或中間件(MW)上的程序中的指令,可以通過運(yùn)行在計(jì)算機(jī)上的操作系統(tǒng)(OS)部分地執(zhí)行用于實(shí)現(xiàn)實(shí)施例的每個(gè)過程。
此外,存儲(chǔ)媒體的示例并不局限于那些獨(dú)立于計(jì)算機(jī)的存儲(chǔ)媒體,還包括那些下載并存儲(chǔ)或暫時(shí)存儲(chǔ)通過LAN、因特網(wǎng)或類似網(wǎng)絡(luò)傳送的程序的存儲(chǔ)媒體。
根據(jù)實(shí)施例的存儲(chǔ)媒體的數(shù)量并不局限于一個(gè),還可以在多個(gè)媒體上執(zhí)行根據(jù)實(shí)施例的過程。所述媒體可以被任意配置。
根據(jù)實(shí)施例的計(jì)算機(jī)基于存儲(chǔ)媒體中存儲(chǔ)的程序執(zhí)行實(shí)施例中的過程。所述計(jì)算機(jī)可以是例如單一的裝置如個(gè)人計(jì)算機(jī),或者是由通過網(wǎng)絡(luò)連接在一起的多個(gè)裝置組成的系統(tǒng)。所述計(jì)算機(jī)的示例并不局限于個(gè)人計(jì)算機(jī),還包括例如包含在信息處理設(shè)備中的算術(shù)處理裝置或微型計(jì)算機(jī)。所述計(jì)算機(jī)是能基于所述程序?qū)崿F(xiàn)本發(fā)明功能的設(shè)備和裝置的總稱。
現(xiàn)在,參考附圖4中示出的流程圖,將給出根據(jù)如上所述配置的實(shí)施例創(chuàng)建文檔摘要的方法所應(yīng)用的文檔摘要?jiǎng)?chuàng)建系統(tǒng)10的操作的描述。
為了使用根據(jù)實(shí)施例創(chuàng)建文檔摘要的方法所適用的文檔摘要?jiǎng)?chuàng)建系統(tǒng)10來創(chuàng)建文檔摘要,用戶首先從輸入部24中輸入摘要?jiǎng)?chuàng)建條件、檢索條件和范圍設(shè)置條件(S1)。
用戶通過選中在摘要?jiǎng)?chuàng)建條件輸入部42中的應(yīng)用復(fù)選部43a并輸入由自然語言組成的問題(例如,信息影響生產(chǎn)力所通過的過程是怎么樣的 )到問題輸入部43b來指定摘要?jiǎng)?chuàng)建條件。
進(jìn)一步地,用戶通過選中檢索條件輸入部44中的應(yīng)用復(fù)選部45a、46a和47a中想要的部并輸入需要的數(shù)據(jù)到對(duì)應(yīng)于所述選中的項(xiàng)目的部(45b、46b和47b中的任意幾個(gè))來指定檢索條件。例如,通過選中應(yīng)用復(fù)選部45a并輸入將被搜索的數(shù)據(jù)庫名(例如數(shù)據(jù)庫38[#1,#2,...#n]中的一個(gè))到數(shù)據(jù)庫名輸入部45b來指定將被檢索的文檔存儲(chǔ)于其中的數(shù)據(jù)庫38。進(jìn)一步地,用戶通過選中應(yīng)用復(fù)選部46a并輸入源名(例如,URL)到源名輸入部46b來指定將被檢索的文檔的源(創(chuàng)建者)。此外,用戶通過選中應(yīng)用復(fù)選部47a并輸入例如關(guān)鍵詞、更新日期和文件格式到檢索條件輸入部47b來指定檢索條件。
此外,在范圍設(shè)置條件輸入部48中,通過選中基選擇部49中的應(yīng)用復(fù)選部49a或49b,指定新行或句點(diǎn)被賦予最高優(yōu)先權(quán)作為將被提取作為摘要的候選范圍的設(shè)置條件。如果新行被賦予最高優(yōu)先權(quán),則將每個(gè)新行設(shè)置為候選范圍。這樣,如果指定了新行為在逐條列記部分中的每個(gè)項(xiàng)目,則將每個(gè)項(xiàng)目確定作為候選范圍。另一方面,如果句點(diǎn)被賦予最高優(yōu)先權(quán),則將每個(gè)句子設(shè)置為候選范圍。這樣,即使指定了新行為逐條列記的部分中的每個(gè)項(xiàng)目,由于將從句點(diǎn)到句點(diǎn)的范圍指定作為候選范圍,則能將整個(gè)逐條列記的部分確定作為候選范圍。然后,用戶選中格式設(shè)置部50中提供的應(yīng)用復(fù)選部51a,52a,...,58a中想要的部。如果已經(jīng)選中應(yīng)用復(fù)選部53a、57a和58a,則用戶輸入相應(yīng)的字符數(shù)到字符數(shù)輸入部53c、輸入相應(yīng)的從開頭的行數(shù)到開頭行數(shù)輸入部57c、輸入相應(yīng)的從結(jié)尾的行數(shù)到結(jié)尾行數(shù)輸入部58c。從而指定了候選范圍的詳細(xì)范圍設(shè)置條件。
為了輸入這些條件,用戶可在指向顯示部26上顯示的交互輸入界面40的時(shí)候輸入想要的數(shù)據(jù),附圖2示出了其示例。
這樣,將從輸入部24輸入的條件從輸入部24傳送到通信部22。然后,將所述條件通過網(wǎng)絡(luò)12從通信部22傳送到服務(wù)器30的通信部31。進(jìn)一步將所述條件從通信部31傳送到檢索引擎32(S2)。
在檢索引擎32中,文檔檢索部33基于客戶端20傳送的摘要?jiǎng)?chuàng)建條件、檢索條件和范圍設(shè)置條件在指定的數(shù)據(jù)庫38中搜索文檔(S3)。如果檢索條件是例如輸入到數(shù)據(jù)庫名輸入部45b的“數(shù)據(jù)庫38(#1)”、輸入到源名輸入部46b的“nippon.com”和輸入到檢索條件輸入部47b的“科學(xué)技術(shù)”,則檢索數(shù)據(jù)庫38(#1)中存儲(chǔ)的、由“nippon.com”創(chuàng)建的并且包含關(guān)鍵詞“科學(xué)技術(shù)”的文檔。將所檢索的文檔存儲(chǔ)在存儲(chǔ)器34中。附圖5示出了以這種方式檢索的文檔的示例。
然后,候選范圍設(shè)置部35基于客戶端20傳送給通信部31的檢索條件、摘要?jiǎng)?chuàng)建條件和范圍設(shè)置條件,在通過文檔檢索部33存儲(chǔ)于存儲(chǔ)器34的文檔中設(shè)置候選范圍,將所述的候選范圍之一提取作為摘要(S4)。例如,如果選中基選擇部49中的應(yīng)用復(fù)選部49a,則在存儲(chǔ)于存儲(chǔ)器34的文檔中,每?jī)蓚€(gè)相鄰的新行之間的區(qū)域是候選范圍K(#1到#8),如附圖6所示。另一方面,如果選中應(yīng)用復(fù)選部49b,則在存儲(chǔ)于存儲(chǔ)器34的文檔中,每個(gè)句子是候選范圍G(#1到#7),如附圖7所示。進(jìn)一步地,更詳細(xì)的范圍設(shè)置條件符合在格式設(shè)置部50中設(shè)置的內(nèi)容。在存儲(chǔ)器34中蓋寫并存儲(chǔ)被劃分為這些候選范圍的文檔。
摘要提取部36基于客戶端20傳輸給通信部31的檢索條件、摘要?jiǎng)?chuàng)建條件和范圍設(shè)置條件在使用自然語言構(gòu)建的被輸入到問題輸入部43b的問題上執(zhí)行語素和語義分析(S5)。例如,如果將問題“信息對(duì)生產(chǎn)力產(chǎn)生影響所通過的過程是怎么樣的?”輸入到問題輸入部43b,則語素分析提取單詞“信息”,“生產(chǎn)力”、“影響”、“產(chǎn)生”和“過程”。此外,將每個(gè)被提取的單詞和系統(tǒng)10中提供的字典數(shù)據(jù)(未示出)進(jìn)行比較來確定單詞的含義。例如,如果提取單詞“2004”、“Taro Tokyo”和“Hachioji”,則將這些單詞和字典數(shù)據(jù)進(jìn)行比較。因此,“2004”被識(shí)別為一個(gè)日期,“Taro Tokyo”為一個(gè)人,而“Hachioji”為一個(gè)地點(diǎn)。
此外,摘要提取部36在存儲(chǔ)于存儲(chǔ)器34的文檔中的每個(gè)候選范圍上執(zhí)行類似的語素和語義分析(S6)。然后,將在問題上執(zhí)行的語素和語義分析結(jié)果和在每個(gè)候選范圍上執(zhí)行的語素和語義分析結(jié)果進(jìn)行比較(S7)。
在所有的候選范圍上執(zhí)行上述比較(S8)。如果比較結(jié)果示出,對(duì)于語素和語義分析結(jié)果,沒有候選范圍和問題相一致(S9No),則系統(tǒng)確定沒有適合于摘要的候選范圍并且不創(chuàng)建任何摘要(S11)。另一方面,如果任何候選范圍和問題相一致(S9Yes),則將具有最高程度一致性的一個(gè)候選范圍提取作為摘要(S10)。
摘要提取部36輸出所提取的候選范圍到通信部31,通信部31然后通過網(wǎng)絡(luò)12傳送所述候選范圍到客戶端20。數(shù)據(jù)被客戶端20的通信部22接收并顯示在顯示部26上。用戶查看顯示內(nèi)容來獲取指定問題的摘要。附圖8示例了依此獲取的摘要結(jié)果。附圖8示出了按附圖7中所示而設(shè)置的候選范圍集G(#1)到G(#7)的其中一個(gè)G(#5)。候選范圍G(#5)包含單詞“信息”、“生產(chǎn)力”、“影響”和“產(chǎn)生”,并從而對(duì)于問題“‘信息’對(duì)‘生產(chǎn)力’‘產(chǎn)生’‘影響’所通過的過程是怎么樣的?”具有最高程度的一致性。因此,將候選范圍G(#5)提取作為摘要。
如上所述,通過根據(jù)實(shí)施例的用于創(chuàng)建文檔摘要的方法所應(yīng)用的文檔摘要?jiǎng)?chuàng)建系統(tǒng),能夠基于以上結(jié)果任意設(shè)置候選范圍,所述的候選范圍之一被提取作為摘要。結(jié)果,甚至可以從各種表達(dá)方式的文檔中提取適合作為摘要的部分。進(jìn)一步地,設(shè)置范圍設(shè)置條件能夠限定將被檢索的文檔并仔細(xì)指定候選范圍。從而能夠創(chuàng)建更加精確的摘要。
對(duì)于本領(lǐng)域普通技術(shù)人員將可以容易地實(shí)現(xiàn)其它優(yōu)點(diǎn)和修改。因此,本發(fā)明廣義上并不局限于這里示出和描述的特定的細(xì)節(jié)和典型的實(shí)施例。因此,可以不脫離由所附的權(quán)利要求及其等價(jià)物所定義的本發(fā)明的精神或范圍而做出各種修改。
權(quán)利要求
1.一種基于輸入的檢索條件檢索文檔并且基于輸入的摘要?jiǎng)?chuàng)建條件從所檢索的文檔中提取適合于摘要的范圍的文檔摘要?jiǎng)?chuàng)建系統(tǒng),所述系統(tǒng)的特征在于包括被配置用于基于輸入的范圍設(shè)置條件在所檢索的文檔中設(shè)置候選范圍的候選范圍設(shè)置部,所述的候選范圍之一被提取作為摘要,其中,為了提取適合于摘要的部分,提取由候選范圍設(shè)置部設(shè)置的候選范圍之一。
2.根據(jù)權(quán)利要求1所述的文檔摘要?jiǎng)?chuàng)建系統(tǒng),其特征在于,所述范圍設(shè)置條件包括限定了將要檢索的文檔的至少一個(gè)限定條件和候選范圍的格式條件。
3.根據(jù)權(quán)利要求2所述的文檔摘要?jiǎng)?chuàng)建系統(tǒng),其特征在于,還包括了被配置用于接受范圍設(shè)置條件的輸入的交互輸入接受部。
4.根據(jù)權(quán)利要求1所述的文檔摘要?jiǎng)?chuàng)建系統(tǒng),其特征在于,還包括了被配置用于接受范圍設(shè)置條件的輸入的交互輸入接受部。
5.一種用于創(chuàng)建文檔摘要的方法,所述方法基于由輸入裝置輸入的檢索條件檢索文檔并基于由輸入裝置輸入的摘要?jiǎng)?chuàng)建條件從所檢索的文檔中提取適合于摘要的范圍,所述方法的特征在于包括基于由輸入裝置輸入的范圍設(shè)置條件在所檢索的文檔中設(shè)置候選范圍,所述的候選范圍之一被提取作為摘要;及為提取適合于摘要的部分,提取候選范圍之一。
6.根據(jù)權(quán)利要求5所述的用于創(chuàng)建文檔摘要的方法,其特征在于,所述范圍設(shè)置條件包括限定了將要檢索的文檔的至少一個(gè)限定條件和候選范圍的格式條件。
7.根據(jù)權(quán)利要求6所述的用于創(chuàng)建文檔摘要的方法,其特征在于,還包括了通過交互輸入接受裝置接受范圍設(shè)置條件的輸入。
8.根據(jù)權(quán)利要求5所述的用于創(chuàng)建文檔摘要的方法,其特征在于,還包括了通過交互輸入接受裝置接受范圍設(shè)置條件的輸入。
全文摘要
本發(fā)明提供了一種用于創(chuàng)建文檔摘要的系統(tǒng)和方法,所述系統(tǒng)和方法基于輸入的檢索條件檢索文檔并基于輸入的摘要?jiǎng)?chuàng)建條件從所檢索的文檔中提取適合于摘要的范圍。所述文檔摘要?jiǎng)?chuàng)建系統(tǒng)包括基于輸入的范圍設(shè)置條件在所檢索的文檔中設(shè)置候選范圍的候選范圍設(shè)置部(35),所述候選范圍之一被提取作為摘要。為提取適合于摘要的部分,提取由候選范圍設(shè)置部(35)設(shè)置的候選范圍之一。
文檔編號(hào)G06F17/30GK1755696SQ20051011659
公開日2006年4月5日 申請(qǐng)日期2005年9月29日 優(yōu)先權(quán)日2004年9月29日
發(fā)明者高知尾勝?gòu)? 笹氣光一 申請(qǐng)人:株式會(huì)社東芝, 東芝解決方案株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
易门县| 台中市| 南郑县| 翁源县| 开平市| 香港| 北京市| 罗田县| 万州区| 丽水市| 临清市| 淮北市| 长汀县| 洮南市| 辽阳市| 金塔县| 漳平市| 林芝县| 灵宝市| 渝北区| 汉源县| 宜阳县| 屯门区| 瓦房店市| 双流县| 周口市| 金乡县| 阳东县| 崇明县| 山东| 汝城县| 山阴县| 理塘县| 黄冈市| 民丰县| 雅安市| 响水县| 沧州市| 清新县| 城口县| 获嘉县|