欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

關(guān)鍵詞輸出設(shè)備和關(guān)鍵詞輸出方法

文檔序號(hào):6611437閱讀:193來源:國(guó)知局
專利名稱:關(guān)鍵詞輸出設(shè)備和關(guān)鍵詞輸出方法
技術(shù)領(lǐng)域
本發(fā)明涉及用于輸出關(guān)鍵詞的設(shè)備和方法。
背景技術(shù)
一直以來,人們對(duì)了解被談?wù)摶蛄餍性掝}總有很大需求。種種技術(shù)被開發(fā)來迎合此種 需求。其中, 一項(xiàng)從文檔中提取時(shí)事關(guān)鍵詞的技術(shù)受到很多關(guān)注。該技術(shù)的突出應(yīng)用就是 基于網(wǎng)絡(luò)的搜索引擎,其通過使用搜索關(guān)鍵詞,實(shí)時(shí)搜索全球的廣泛信息。
另一項(xiàng)技術(shù)提供網(wǎng)絡(luò)搜索關(guān)鍵詞的排行信息,以致能獲取指定時(shí)間段內(nèi)的話題。在該 技術(shù)中,排行信息的產(chǎn)生是基于指定時(shí)間段內(nèi)關(guān)鍵詞的出現(xiàn)頻率,或者將來自最近更新搜 索引擎的共同關(guān)鍵詞輸出為潛在話題,例如網(wǎng)絡(luò)日志搜索引擎。
舉例來說,JP-A 2006-139717 (KOKAI)披露了一個(gè)關(guān)鍵詞提取方法,意在基于這些 話題張貼信息的頻率,從電子公告牌系統(tǒng)提取最近話題。
有一個(gè)網(wǎng)站(URL: http://kizasi.jp/),基于網(wǎng)絡(luò)日志張貼關(guān)鍵詞的頻率,提供被談?wù)?最多的當(dāng)前話題。網(wǎng)絡(luò)日志是用戶可以自由張貼日記或文章的網(wǎng)站。此種關(guān)鍵詞形成了部 分代表話題的關(guān)鍵詞。
上述網(wǎng)站提供預(yù)定時(shí)間段內(nèi)時(shí)事關(guān)鍵詞的排行信息,例如24小時(shí), 一星期,或一個(gè) 月。該網(wǎng)站也就具體話題提供指定時(shí)間段內(nèi)頻繁出現(xiàn)的關(guān)鍵詞,以及與該頻繁出現(xiàn)關(guān)鍵詞 相關(guān)的其他關(guān)鍵詞。
然而,上述網(wǎng)站無法以高度話題性的順序顯示關(guān)鍵詞,因此用戶無法方便地理解具體 話題的發(fā)展。舉例來說,考慮與具體時(shí)事新聞相關(guān)的關(guān)鍵詞"XXX侵害案"。其他與該 關(guān)鍵詞相關(guān)的關(guān)鍵詞可以是"事件的發(fā)生","逃犯逮捕令",和"逮捕罪犯"。然而, 網(wǎng)站無法以高度話題性的順序或者以便于理解的方式顯示這些關(guān)鍵詞。

發(fā)明內(nèi)容
根據(jù)本發(fā)明的一方面,提供有關(guān)鍵詞輸出設(shè)備,其包括文檔接收單元,配置為接收指
定時(shí)間段內(nèi)的具有日期時(shí)間屬性的文檔;關(guān)鍵詞提取單元,分析文檔并從文檔中提取時(shí)事 關(guān)鍵詞;排行確定單元,基于這些關(guān)鍵詞的屬性,確定各關(guān)鍵詞的排行;關(guān)鍵詞結(jié)構(gòu)產(chǎn)生 單元,基于關(guān)鍵詞的同現(xiàn)對(duì)關(guān)鍵詞進(jìn)行分類和分級(jí),以產(chǎn)生關(guān)鍵詞結(jié)構(gòu);以及關(guān)鍵詞輸出 單元,以排行確定單元所確定排行的降序輸出關(guān)鍵詞。
根據(jù)本發(fā)明的另一方面,提供有關(guān)鍵詞輸出方法,其包括接收指定時(shí)間段內(nèi)的具有日 期時(shí)間屬性的文檔;分析文檔并從文檔中提取時(shí)事關(guān)鍵詞;基于這些關(guān)鍵詞的屬性,確定 各關(guān)鍵詞的排行;基于關(guān)鍵詞的同現(xiàn)對(duì)關(guān)鍵詞進(jìn)行分類和分級(jí),以產(chǎn)生關(guān)鍵詞結(jié)構(gòu);以及 以排行的降序輸出關(guān)鍵詞。


圖1是本發(fā)明實(shí)施例所對(duì)應(yīng)的系統(tǒng)的示意圖; 圖2是用來說明圖1中的服務(wù)器的模塊配置的示意圖; 圖3是圖1中的服務(wù)器的方框圖4A是用來說明在網(wǎng)頁上顯示新聞文章的示意圖; 圖4B是用來說明電子節(jié)目指南(EPG)信息的示意圖; 圖5是圖3所示的關(guān)鍵詞提取處理器所執(zhí)行處理的流程圖; 圖6是一組時(shí)事關(guān)鍵詞的結(jié)構(gòu)示意圖; 圖7是構(gòu)成時(shí)事關(guān)鍵詞的處理的流程圖; 圖8是關(guān)鍵詞結(jié)構(gòu)示例的示意圖; 圖9是顯示時(shí)事關(guān)鍵詞的示例的示意圖;以及 圖IO是另一個(gè)顯示時(shí)事關(guān)鍵詞的示例的示意圖。
具體實(shí)施方式
以下參照附圖詳細(xì)說明本發(fā)明的示例實(shí)施例。
圖1是根據(jù)本發(fā)明實(shí)施例的包括關(guān)鍵詞輸出設(shè)備的服務(wù)器-客戶系統(tǒng)的示意圖。該服務(wù) 器-客戶系統(tǒng)包括服務(wù)器計(jì)算機(jī)(以下,"服務(wù)器")1,執(zhí)行關(guān)鍵詞輸出設(shè)備的功能。服務(wù) 器l通過例如局域網(wǎng)(LAN)的網(wǎng)絡(luò)2連接至一個(gè)或多個(gè)客戶計(jì)算機(jī)(以下,"客戶")3。 服務(wù)器1和客戶3可以是通用個(gè)人計(jì)算機(jī)。
圖2是用來說明服務(wù)器1的模塊配置的示意圖。服務(wù)器1包括中央處理器(CPU) 101 用于信息處理,只讀存儲(chǔ)器102具有基本輸入輸出系統(tǒng)(BIOS)信息,數(shù)據(jù)可重寫隨機(jī)存
取存儲(chǔ)器103,硬盤驅(qū)動(dòng)器(HDD) 104執(zhí)行數(shù)據(jù)庫(kù)的功能,并在其中儲(chǔ)存諸多計(jì)算機(jī)程 序,存儲(chǔ)介質(zhì)驅(qū)動(dòng)器105例如CD-ROM驅(qū)動(dòng)器用于對(duì)存儲(chǔ)介質(zhì)110進(jìn)行寫入信息和/或讀 取信息,通信控制設(shè)備106能夠通過網(wǎng)絡(luò)2與外界通信從而接收信息和/或傳輸信息至外界, 顯示單元107例如陰極射線管(CRT)或液晶顯示器(LCD)將例如處理進(jìn)展或結(jié)果的信 息顯示至操作員,以及輸入單元108例如操作員使用的鍵盤或鼠標(biāo)從而對(duì)CPU 101給出命 令或信息??偩€控制器109調(diào)停(arbitrate)在服務(wù)器1的組件之間傳輸?shù)乃袛?shù)據(jù)。
當(dāng)用戶接通服務(wù)器1和客戶3時(shí),CPU 101運(yùn)行ROM 102中的加載例行程序,使操作 系統(tǒng)(OS)被從HDD 104加載到RAM 103中,并運(yùn)行OS,該OS是管理計(jì)算機(jī)硬件和 軟件的計(jì)算機(jī)程序。OS運(yùn)行諸多計(jì)算機(jī)程序,讀取信息,并將信息保存為各用戶請(qǐng)求。 OS的典型示例是Windows (注冊(cè)商標(biāo))。在此種OS上運(yùn)行的計(jì)算機(jī)程序稱為應(yīng)用程序。 應(yīng)用程序也可以是使OS執(zhí)行部分稍后所述的操作的計(jì)算機(jī)程序,或者也可以是能被包括 在一組構(gòu)成預(yù)定應(yīng)用軟件或OS的計(jì)算機(jī)程序文件中的計(jì)算機(jī)程序。
關(guān)鍵詞輸出程序作為應(yīng)用程序儲(chǔ)存在HDD 104中。因此,HDD 104作為關(guān)鍵詞輸出 程序的存儲(chǔ)介質(zhì)。
通常,安裝在HDD 104中的應(yīng)用程序也可以存儲(chǔ)在存儲(chǔ)介質(zhì)110中,反之亦然。存儲(chǔ) 介質(zhì)110可以是光盤例如CD-ROM或DVD,磁性光盤,磁盤例如軟盤(FD),或者其他
介質(zhì)例如半導(dǎo)體存儲(chǔ)器。因此,可攜帶存儲(chǔ)介質(zhì)iio也可以執(zhí)行用于存儲(chǔ)應(yīng)用程序的存儲(chǔ)
介質(zhì)的功能。應(yīng)用程序也可以從外部計(jì)算機(jī)通過通信控制設(shè)備106導(dǎo)入,并安裝在HDD 104 中。
當(dāng)關(guān)鍵詞輸出程序在OS中執(zhí)行時(shí),CPU 101執(zhí)行諸多處理并整體控制服務(wù)器1的各 個(gè)組件。以下說明本實(shí)施例中CPU 101所執(zhí)行的典型處理。
圖3是服務(wù)器1構(gòu)件的方框圖。服務(wù)器1包括文檔接收單元11,時(shí)事關(guān)鍵詞提取單元 12,關(guān)鍵詞分析單元13,時(shí)事關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元14,時(shí)事關(guān)鍵詞存儲(chǔ)單元15,搜索請(qǐng) 求產(chǎn)生單元16,和時(shí)事關(guān)鍵詞輸出單元17。服務(wù)器1的這些單元可以通過執(zhí)行關(guān)鍵詞輸 出程序來實(shí)現(xiàn)。
任意常用存儲(chǔ)介質(zhì)例如HDD 104,存儲(chǔ)介質(zhì)110,和RAM 103都能執(zhí)行時(shí)事關(guān)鍵詞存 儲(chǔ)單元15的功能。
以下說明關(guān)鍵詞輸出程序各單元的功能。在需要時(shí)說明各單元的數(shù)據(jù)結(jié)構(gòu)或處理流程。
文檔接收單元11接收指定天數(shù)的文檔集合。各文檔具有日期時(shí)間屬性。具有日期時(shí)間
屬性的文檔示例包括網(wǎng)頁上的新聞文章(參圖4A),或EPG信息(參圖4B)。文檔需要有 日期時(shí)間屬性,例如張貼主體文本的時(shí)間或更新主體文本的時(shí)間??梢灾付ň唧w網(wǎng)站或數(shù) 據(jù)庫(kù)作為由此接收文檔的來源。例如網(wǎng)頁上的新聞文章或EPG上的信息的各文檔具有唯一 的可識(shí)別文檔ID。
時(shí)事關(guān)鍵詞提取單元12從文檔接收單元11獲取文檔并將該文檔傳遞至關(guān)鍵詞分析單 元13。關(guān)鍵詞分析單元13對(duì)文檔分析其中的可能關(guān)鍵詞。
艮P,關(guān)鍵詞分析單元13通過使用現(xiàn)有自然語言處理技術(shù),例如語素(morphological) 分析或n-gram提取,對(duì)文檔分析文檔中的可能特征關(guān)鍵詞,該文檔可以是網(wǎng)頁文本或EPG。 舉例來說,字符串"自然語言處理"的語素分析使字符串分解為單個(gè)單詞例如"自然","語 言",和"處理",作為關(guān)鍵詞。
關(guān)鍵詞分析單元13將一組關(guān)鍵詞返回至?xí)r事關(guān)鍵詞提取單元12。時(shí)事關(guān)鍵詞提取單 元12確定指定時(shí)期和時(shí)間內(nèi)具有高度話題性的固定關(guān)鍵詞(以下,"時(shí)事關(guān)鍵詞"),并提 取這些關(guān)鍵詞。
時(shí)事關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元14檢查時(shí)事關(guān)鍵詞提取單元12所提取的時(shí)事關(guān)鍵詞的同現(xiàn) 或其之間的相互關(guān)系,并通過基于同現(xiàn)和相互關(guān)系對(duì)時(shí)事關(guān)鍵詞進(jìn)行分級(jí)和分類,來產(chǎn)生 時(shí)事關(guān)鍵詞結(jié)構(gòu)。
時(shí)事關(guān)鍵詞存儲(chǔ)單元15在其中儲(chǔ)存時(shí)事關(guān)鍵詞和時(shí)事關(guān)鍵詞結(jié)構(gòu)。儲(chǔ)存在時(shí)事關(guān)鍵 詞存儲(chǔ)單元15中的時(shí)事關(guān)鍵詞和時(shí)事關(guān)鍵詞結(jié)構(gòu)被用于進(jìn)一步的參考。
基于時(shí)事關(guān)鍵詞和時(shí)事關(guān)鍵詞結(jié)構(gòu),搜索請(qǐng)求產(chǎn)生單元16產(chǎn)生具有內(nèi)嵌搜索請(qǐng)求的 網(wǎng)頁,以允許基于網(wǎng)絡(luò)搜索引擎中的關(guān)鍵詞搜索。
通過網(wǎng)絡(luò)2從客戶3接收到顯示網(wǎng)頁的請(qǐng)求之后,時(shí)事關(guān)鍵詞輸出單元17將搜索請(qǐng) 求產(chǎn)生單元16產(chǎn)生的網(wǎng)頁輸出(發(fā)送/傳輸)至指定客戶3。
圖5是時(shí)事關(guān)鍵詞提取單元12和關(guān)鍵詞分析單元13所執(zhí)行的關(guān)鍵詞提取程序的流程 圖。關(guān)鍵詞提取程序?qū)嶋H是由CPU 101通過執(zhí)行關(guān)鍵詞輸出程序而執(zhí)行的。
首先,關(guān)鍵詞分析單元13對(duì)文檔執(zhí)行語素分析,該文檔由文檔接收單元ll在一定時(shí) 間段中接收,并將文檔分解為多個(gè)單詞語素(步驟Sl)。關(guān)鍵詞分析單元13連接多個(gè)語素, 從而產(chǎn)生具有兩個(gè)或更多單詞的預(yù)期關(guān)鍵詞(步驟S2)。關(guān)鍵詞分析單元13從預(yù)期關(guān)鍵詞 中刪除不能被視作關(guān)鍵詞的助詞(particle),符號(hào)和參考編號(hào)(步驟S3)。關(guān)鍵詞分析單元 13將預(yù)期關(guān)鍵詞列表返回至?xí)r事關(guān)鍵詞提取單元12。
時(shí)事關(guān)鍵詞提取單元12計(jì)算各預(yù)期關(guān)鍵詞的出現(xiàn)頻率,并以預(yù)期關(guān)鍵詞出現(xiàn)頻率的
降序排列該預(yù)期關(guān)鍵詞(步驟S4)。時(shí)事關(guān)鍵詞提取單元12確定是否存在任何能形成其他 預(yù)期時(shí)事關(guān)鍵詞的子集的預(yù)期時(shí)事關(guān)鍵詞。換言之,時(shí)事關(guān)鍵詞提取單元12確定預(yù)期時(shí) 事關(guān)鍵詞之間是否存在包含關(guān)系(步驟S5)。
在計(jì)算關(guān)鍵詞的出現(xiàn)頻率時(shí),時(shí)事關(guān)鍵詞提取單元12除當(dāng)前關(guān)鍵詞的出現(xiàn)頻率之外, 還考慮關(guān)鍵詞出現(xiàn)頻率的歷史。歷史信息被儲(chǔ)存在時(shí)事關(guān)鍵詞存儲(chǔ)單元15中,與對(duì)應(yīng)關(guān) 鍵詞相聯(lián)系。
時(shí)事關(guān)鍵詞提取單元12被配置來基于關(guān)鍵詞的出現(xiàn)頻率,計(jì)算文檔集合中各關(guān)鍵詞 的分?jǐn)?shù),出現(xiàn)頻率是關(guān)鍵詞的屬性之一。然而,其他判斷標(biāo)準(zhǔn)也可能用來計(jì)算分?jǐn)?shù)。計(jì)算 分?jǐn)?shù)的標(biāo)準(zhǔn)可以是文檔集合中關(guān)鍵詞的其他屬性,例如關(guān)鍵詞的新鮮度,關(guān)鍵詞的長(zhǎng)度, 或者關(guān)鍵詞的語素信息。
當(dāng)關(guān)鍵詞之間存在包含關(guān)系時(shí)(步驟S5:是),時(shí)事關(guān)鍵詞提取單元12刪除形成其他 關(guān)鍵詞子集的關(guān)鍵詞(步驟S6)。舉例來說,考慮關(guān)鍵詞"XXX問題","XXX",和"問 題"。關(guān)鍵詞"XXX問題"與關(guān)鍵詞"XXX"和"問題"有包含關(guān)系。即,關(guān)鍵詞"XXX" 和"問題"都形成關(guān)鍵詞"XXX問題"的子集。在該示例中,時(shí)事關(guān)鍵詞提取單元12刪 除關(guān)鍵詞"XXX"和"問題"。
如果關(guān)鍵詞之間存在包含關(guān)系,可以考慮諸多方法。當(dāng)關(guān)鍵詞之間存在包含關(guān)系時(shí), 舉例來說,時(shí)事關(guān)鍵詞提取單元12可以配置來組合相應(yīng)的關(guān)鍵詞,而非刪除關(guān)鍵詞。舉 例來說,考慮具有重疊關(guān)鍵詞的關(guān)鍵詞"虛假抗震性能"和"抗震性能的欺詐"。時(shí)事關(guān) 鍵詞提取單元12可以配置來組合這兩個(gè)關(guān)鍵詞,以形成例如"虛假抗震性能的欺詐"的 關(guān)鍵詞,并通過加上原關(guān)鍵詞的出現(xiàn)頻率,來計(jì)算新關(guān)鍵詞的出現(xiàn)頻率。
因此,時(shí)事關(guān)鍵詞提取單元12首先檢查接收自關(guān)鍵詞分析單元12的關(guān)鍵詞之間的包 含關(guān)系,并根據(jù)包含關(guān)系產(chǎn)生新關(guān)鍵詞。用該方式獲得的關(guān)鍵詞形成一組時(shí)事關(guān)鍵詞。
另一方面,如果關(guān)鍵詞之間不存在包含關(guān)系(步驟S5:否),時(shí)事關(guān)鍵詞提取單元12 確定時(shí)事關(guān)鍵詞的數(shù)量是否查過預(yù)設(shè)的最大分配數(shù)(步驟S7)。
如果數(shù)量超過最大分配數(shù)(步驟S7:是),時(shí)事關(guān)鍵詞提取單元12根據(jù)出現(xiàn)頻率的降 序選擇時(shí)事關(guān)鍵詞,直到到達(dá)最大分配數(shù),并刪除剩余時(shí)事關(guān)鍵詞(步驟S8)。
圖6是提取時(shí)事關(guān)鍵詞組的結(jié)構(gòu)示意圖。各時(shí)事關(guān)鍵詞的屬性包括實(shí)施關(guān)鍵詞字符串, 對(duì)時(shí)事關(guān)鍵詞設(shè)置的時(shí)間段,時(shí)事關(guān)鍵詞的出現(xiàn)頻率,以及提取時(shí)事關(guān)鍵詞的原始文檔的 文檔ID。
以下說明時(shí)事關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元14所執(zhí)行的構(gòu)成時(shí)事關(guān)鍵詞的處理。圖7是構(gòu)成
時(shí)事關(guān)鍵詞的處理的流程圖。
時(shí)事關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元14產(chǎn)生時(shí)事關(guān)鍵詞對(duì)(組?),然后檢查在各對(duì)之間文檔ID 的共同部分(步驟Sll)。舉例來說,圖6所示的兩個(gè)關(guān)鍵詞"XXX問題"和"YYY被逮 捕"的文檔ID中共同具有"003"。
時(shí)事關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元14組合在文檔ID上有更大共同性的關(guān)鍵詞對(duì),以形成一組 更大的關(guān)鍵詞(步驟S12)。舉例來說,如果一對(duì)關(guān)鍵詞(A,B)的文檔ID和一對(duì)關(guān)鍵詞 (A,C)的文檔ID有更大的共同性,于是時(shí)事關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元14就組合對(duì),以形成 一組關(guān)鍵詞(A,B,C)。
對(duì)于各組關(guān)鍵詞,時(shí)事關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元14拾取具有最高出現(xiàn)頻率的關(guān)鍵詞,指 定該關(guān)鍵詞為標(biāo)題關(guān)鍵詞,并指定對(duì)應(yīng)組中的所有其他關(guān)鍵詞為副標(biāo)題關(guān)鍵詞(步驟S13)。 標(biāo)題關(guān)鍵詞和副標(biāo)題關(guān)鍵詞將如稍后所述以可辯別方式顯示在客戶3上。
通過這種方式,時(shí)事關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元14利用時(shí)事關(guān)鍵詞文件之間的共同性所引 起的時(shí)事關(guān)鍵詞的同現(xiàn),來分類和分級(jí)時(shí)事關(guān)鍵詞。
時(shí)事關(guān)鍵詞產(chǎn)生單元14于是確定同一關(guān)鍵詞是否已經(jīng)儲(chǔ)存在時(shí)事關(guān)鍵詞存儲(chǔ)單元15 中(步驟S14)。如果關(guān)鍵詞還未儲(chǔ)存在時(shí)事關(guān)鍵詞存儲(chǔ)單元15中(步驟S14:否),這表 示該關(guān)鍵詞是新關(guān)鍵詞,所以時(shí)事關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元14對(duì)關(guān)鍵詞附加"新"的標(biāo)記(步 驟S15)。當(dāng)關(guān)鍵詞已經(jīng)儲(chǔ)存在時(shí)事關(guān)鍵詞存儲(chǔ)單元15中時(shí)(步驟S14:是),時(shí)事關(guān)鍵詞 結(jié)構(gòu)產(chǎn)生單元14計(jì)算當(dāng)前關(guān)鍵詞和時(shí)事關(guān)鍵詞存儲(chǔ)單元15中的現(xiàn)有關(guān)鍵詞的出現(xiàn)頻率之 間的差別(步驟S16)。即,時(shí)事關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元14通過查看時(shí)事關(guān)鍵詞存儲(chǔ)單元15 中儲(chǔ)存的關(guān)鍵詞,確定關(guān)鍵詞是己經(jīng)存在,還是新近形成,并對(duì)尚未儲(chǔ)存在時(shí)事關(guān)鍵詞存 儲(chǔ)單元15中的新關(guān)鍵詞附加一個(gè)屬性("新"的標(biāo)志)。
檢査新關(guān)鍵詞以及計(jì)算當(dāng)前和之前關(guān)鍵詞出現(xiàn)頻率的差別的處理(步驟S14至S16) 將被重復(fù),直到不再剩下任何未檢查的關(guān)鍵詞(步驟S17:否)。
圖8說明時(shí)事關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元14如上所述執(zhí)行處理后獲得的關(guān)鍵詞結(jié)構(gòu)。除例 如字符串,時(shí)間段,出現(xiàn)頻率,和文檔ID等在提取時(shí)被附加至各時(shí)事關(guān)鍵詞的屬性之外, 其他屬性也被附加至各時(shí)事關(guān)鍵詞。其他屬性包括關(guān)鍵詞是標(biāo)題關(guān)鍵詞還是副標(biāo)題關(guān)鍵 詞,各標(biāo)題關(guān)鍵詞和副標(biāo)題關(guān)鍵詞的具體排行,關(guān)鍵詞是否具有"新"的標(biāo)簽,以及與前 一天相比關(guān)鍵詞的排行差別。指示關(guān)鍵詞排行差別的屬性只被附加至"新"的標(biāo)簽已經(jīng)關(guān) 閉("新"的標(biāo)簽為"0")的標(biāo)題關(guān)鍵詞,即只針對(duì)附加至從前一天就已經(jīng)出現(xiàn)并己經(jīng)具 有一定排行的標(biāo)題關(guān)鍵詞,該排行可以與最新排行進(jìn)行比較。如果前一天的副標(biāo)題關(guān)鍵詞
被提升為后一天的標(biāo)題關(guān)鍵詞,新近形成的標(biāo)題關(guān)鍵詞被附加具有"新"的標(biāo)簽打開("新"的標(biāo)簽為"l")。也可以對(duì)關(guān)鍵詞結(jié)構(gòu)增加屬性來表示關(guān)鍵詞是否從副標(biāo)題關(guān)鍵詞提升為 i(S蹄f據(jù);3通過這種方式,時(shí)事關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元14通過比較之前計(jì)算的關(guān)鍵詞分?jǐn)?shù)(例如 出現(xiàn)頻率),將屬性附加至關(guān)鍵詞。搜索請(qǐng)求產(chǎn)生單元16對(duì)各分類和分級(jí)的時(shí)事關(guān)鍵詞產(chǎn)生搜索請(qǐng)求,并對(duì)用戶輸出搜 索請(qǐng)求。標(biāo)題關(guān)鍵詞情形下的搜索請(qǐng)求條件是標(biāo)題關(guān)鍵詞的字符串,而副標(biāo)題關(guān)鍵詞情形 下的搜索請(qǐng)求條件是副標(biāo)題關(guān)鍵詞字符串和對(duì)應(yīng)標(biāo)題關(guān)鍵詞字符串的"與"操作。此種搜 索請(qǐng)求允許用戶不經(jīng)獲得標(biāo)題關(guān)鍵詞的廣泛上下文結(jié)果,而且獲得副標(biāo)題關(guān)鍵詞的有限上 下文結(jié)果。舉例來說,對(duì)于有廣泛上下文的標(biāo)題關(guān)鍵詞"XXX問題",還可以獲得具有有 限上下文結(jié)果的副標(biāo)題關(guān)鍵詞結(jié)果,例如"辯解(allegation)"或"道歉"。通過這種方式, 搜索請(qǐng)求產(chǎn)生單元16根據(jù)時(shí)事關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元14所產(chǎn)生的時(shí)事關(guān)鍵詞結(jié)構(gòu),產(chǎn)生具 有多個(gè)搜索關(guān)鍵詞的搜索請(qǐng)求。為了獲取所有可能的搜索結(jié)果,搜索請(qǐng)求的條件可以設(shè)置 為"標(biāo)題關(guān)鍵詞與(副標(biāo)題關(guān)鍵詞1或副標(biāo)題關(guān)鍵詞2或…副標(biāo)題關(guān)鍵詞n)"。為了獲取 新聞文章作為搜索結(jié)果,可以使用對(duì)新聞的固定搜索請(qǐng)求,例如"新聞"。搜索請(qǐng)求產(chǎn)生 單元16還可以使用預(yù)定關(guān)鍵詞字符串來產(chǎn)生搜索請(qǐng)求。搜索請(qǐng)求產(chǎn)生單元16基于時(shí)事關(guān)鍵詞和時(shí)事關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元14所產(chǎn)生的時(shí)事關(guān) 鍵詞結(jié)構(gòu),產(chǎn)生具有內(nèi)嵌搜索請(qǐng)求的網(wǎng)頁。所產(chǎn)生的網(wǎng)頁被輸出至客戶3用戶可以使用網(wǎng) 絡(luò)瀏覽器在客戶3上瀏覽網(wǎng)頁。圖9是顯示話題關(guān)鍵詞的示例的示意圖。標(biāo)題關(guān)鍵詞以圖8所示的分?jǐn)?shù)排行順序被顯 示。副標(biāo)題關(guān)鍵詞以關(guān)于對(duì)應(yīng)標(biāo)題關(guān)鍵詞的分級(jí)方式,并且也根據(jù)圖8所示的分?jǐn)?shù)排行順 序被顯示。分?jǐn)?shù)的排行順序在一定時(shí)間段內(nèi)會(huì)隨時(shí)間改變。舉例來說,此種一定時(shí)間段內(nèi) 的分?jǐn)?shù)排行順序的改變指示標(biāo)題所對(duì)應(yīng)的話題的當(dāng)前狀態(tài)。此外,新近顯示的標(biāo)題可以通 過使用字符或圖標(biāo)加以強(qiáng)調(diào)(舉例來說,圖9中的"新!")。時(shí)事關(guān)鍵詞輸出單元17還基 于屬性的狀態(tài)和類型顯示諸多記號(hào),例如圖標(biāo)、符號(hào)或顯示效果。每個(gè)記號(hào)都可以確認(rèn)指 定屬性。各顯示的時(shí)事關(guān)鍵詞是錨定文本,并由超鏈接鏈接至基于網(wǎng)絡(luò)的搜索站。當(dāng)用戶點(diǎn)擊 時(shí)事關(guān)鍵詞時(shí),網(wǎng)頁跳至基于網(wǎng)絡(luò)的搜索站上的搜索結(jié)果列表,對(duì)應(yīng)于被點(diǎn)擊時(shí)事關(guān)鍵詞 所產(chǎn)生的搜索請(qǐng)求。換而言之,各時(shí)事關(guān)鍵詞自身具有對(duì)基于網(wǎng)絡(luò)搜索站的搜索請(qǐng)求的功 能。因此,用戶可以方便地訪問所有時(shí)事新聞,無需從鍵盤鍵入關(guān)鍵詞,從而節(jié)省人工鍵
入禾n搜索諸多關(guān)鍵詞組合的精力。圖10是顯示話題關(guān)鍵詞的另一個(gè)示例的示意圖。時(shí)事關(guān)鍵詞提取自兩種文檔。其一是矢豆時(shí)間段內(nèi)的一組文檔,另一個(gè)是長(zhǎng)時(shí)間段內(nèi)的一組文檔。與短時(shí)間段內(nèi)的文檔相關(guān)的一組關(guān)鍵詞被顯示在分派給"今日熱點(diǎn)話題"的"A部分"。與長(zhǎng)時(shí)間段內(nèi)的文檔相關(guān)的其 他關(guān)鍵詞被顯示在分派給"最近關(guān)注話題"的"B部分"。因此,時(shí)事關(guān)鍵詞的顯示取決于 對(duì)提取該時(shí)事關(guān)鍵詞的各文檔所設(shè)置的時(shí)間段。圖標(biāo)和箭頭記號(hào)連同時(shí)事關(guān)鍵詞被顯示,以指示所顯示時(shí)事關(guān)鍵詞的任何排行變化, 即,以指示所顯示時(shí)事關(guān)鍵詞當(dāng)前狀態(tài)的流行度變化。舉例來說,新近顯示的時(shí)事關(guān)鍵詞 禾示有星號(hào)標(biāo)記。此外,出現(xiàn)頻率突然飆升的時(shí)事關(guān)鍵詞被顯示在分派給"流行度突然飆升的話題"的單獨(dú)"c部分",而與這些時(shí)事關(guān)鍵詞的排行無關(guān)。副標(biāo)題關(guān)鍵詞的顯示不僅根據(jù)其排行,而且根據(jù)其"新"的標(biāo)簽的狀態(tài)。g卩,具有"新" 的木示簽的副標(biāo)題關(guān)鍵詞優(yōu)先顯示,以在任意給定時(shí)間提供具有高度話題性的顯示。通過這種方式,時(shí)事關(guān)鍵詞輸出單元17基于屬性的狀態(tài)和類型,改變關(guān)鍵詞的顯示順序。有時(shí),可能難以理解對(duì)其意義沒有任何解釋的關(guān)鍵詞。然而,在圖10所示的示例中, 無需打開單獨(dú)的基于網(wǎng)絡(luò)搜索站,以獲取時(shí)事關(guān)鍵詞的詳細(xì)信息。只要將鼠標(biāo)指針放在時(shí) 事關(guān)鍵詞上就會(huì)顯示詳細(xì)信息,即由此提取時(shí)事關(guān)鍵詞的原始文檔的信息。換而言之,當(dāng) 鼠豐示指針被放到時(shí)事關(guān)鍵詞上時(shí),時(shí)事關(guān)鍵詞輸出單元17顯示原始文檔的信息,該文檔 包括各時(shí)事關(guān)鍵詞。舉例來說,在圖10中,當(dāng)鼠標(biāo)指針"P"被放到時(shí)事關(guān)鍵詞"總決賽" 上時(shí),時(shí)事關(guān)鍵詞輸出單元17顯示包括該時(shí)事關(guān)鍵詞"總決賽"的原始文檔的信息。因 此,可以方便地理解使用該時(shí)事關(guān)鍵詞"總決賽"的上下文。通過這種方式,關(guān)鍵詞分析單元分析一定時(shí)間段內(nèi)所接收文檔的關(guān)鍵詞。關(guān)鍵詞提取 單元計(jì)算各被分析關(guān)鍵詞的分?jǐn)?shù),并根據(jù)分?jǐn)?shù)順序提取關(guān)鍵詞。關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元分級(jí) 并分類所提取的關(guān)鍵詞,以產(chǎn)生關(guān)鍵詞結(jié)構(gòu)。關(guān)鍵詞輸出單元基于關(guān)鍵詞結(jié)構(gòu),以分?jǐn)?shù)的 降序順序,輸出分類和分級(jí)的關(guān)鍵詞。因此,可以有效地從具有日期時(shí)間屬性的文檔檢測(cè) 并輸出涉及指定日期和時(shí)間的話題的時(shí)事關(guān)鍵詞。此外,因?yàn)楦鲿r(shí)事關(guān)鍵詞被分級(jí)和分類, 并且還以分?jǐn)?shù)順序被顯示,可以通過查看時(shí)事關(guān)鍵詞的順序來在一定時(shí)間段內(nèi)追蹤話題, 該時(shí)事關(guān)鍵詞的排列以特定時(shí)事關(guān)鍵詞的分級(jí)方式。此種顯示使用戶容易理解特定話題的 當(dāng)前情況或進(jìn)展。更具體地說,因?yàn)殛P(guān)于話題的任何新發(fā)展都以分級(jí)關(guān)鍵詞的形式被顯示, 用戶可以僅通過檢査最近關(guān)注話題方便地了解特定話題的當(dāng)前情況或進(jìn)展。
根據(jù)本實(shí)施例,可以記錄分檔信息,例如電視劇的每日陣容,確定從文檔提取關(guān)鍵詞 的判斷標(biāo)準(zhǔn),計(jì)算關(guān)鍵詞的出現(xiàn)頻率或新鮮度,并產(chǎn)生與時(shí)事關(guān)鍵詞相關(guān)的所需標(biāo)題信息。 因此,可以方便地檢測(cè)被談?wù)摰漠?dāng)前時(shí)事關(guān)鍵詞,以及顯示對(duì)應(yīng)時(shí)事關(guān)鍵詞的話題的時(shí)間 段。此外,通過查看過去關(guān)鍵詞結(jié)果的關(guān)鍵詞結(jié)構(gòu),可以指出新近形成的關(guān)鍵詞,已有關(guān) 鍵詞出現(xiàn)頻率的改變,和關(guān)鍵詞排行的改變。顯示內(nèi)容根據(jù)此種信息更新,允許用戶了解 特定時(shí)事標(biāo)題的情況,或者包括與特定話題相關(guān)的最新關(guān)鍵詞的關(guān)鍵詞組。以上說明了時(shí)事關(guān)鍵詞輸出單元n在搜索請(qǐng)求產(chǎn)生單元16對(duì)各時(shí)事關(guān)鍵詞附加搜索請(qǐng)求"之后",輸出時(shí)事關(guān)鍵詞。然而,諸多其他方法也是可能的。舉例來說,時(shí)事關(guān)鍵詞輸出單元17可以配置為首先輸出時(shí)事關(guān)鍵詞,搜索請(qǐng)求產(chǎn)生單元16可以配置為對(duì)用戶 選擇的各時(shí)事關(guān)鍵詞附加搜索請(qǐng)求。此外,以上說明了時(shí)事關(guān)鍵詞輸出單元17通過網(wǎng)絡(luò)2從客戶3接收到顯示網(wǎng)頁的請(qǐng) 求之后,輸出搜索請(qǐng)求產(chǎn)生單元16所產(chǎn)生的網(wǎng)頁。然而,諸多其他方法也是可能的。舉 例來說,網(wǎng)頁可以事先被下載到客戶3上,并作為本地文件顯示至用戶。此外,以上說明提供關(guān)鍵詞輸出設(shè)備功能的服務(wù)器1通過網(wǎng)絡(luò)2被連接至多個(gè)客戶3。 然而,諸多其他方法也是可能的。舉例來說,可以只有一個(gè)客戶。此外,關(guān)鍵詞輸出設(shè)備 可以是獨(dú)立計(jì)算機(jī)。對(duì)本領(lǐng)域的技術(shù)人員而言,很容易實(shí)現(xiàn)其他優(yōu)點(diǎn)和修改。因此,本發(fā)明在其更廣大方 面并不限于本文說明的具體細(xì)節(jié)和典型實(shí)施例。相應(yīng)地,可以做出諸多修改,而不背離總體發(fā)明概念的精神和范圍,該總體發(fā)明概念由附加的權(quán)利要求及其等價(jià)物定義。
權(quán)利要求
1.一種關(guān)鍵詞輸出設(shè)備,其特征在于,包含文檔接收單元,配置為接收指定時(shí)間段內(nèi)的具有日期時(shí)間屬性的文檔;關(guān)鍵詞提取單元,其分析所述文檔并從所述文檔中提取時(shí)事關(guān)鍵詞;排行確定單元,其基于這些關(guān)鍵詞的屬性,確定各關(guān)鍵詞的排行;關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元,其基于關(guān)鍵詞的同現(xiàn)對(duì)關(guān)鍵詞進(jìn)行分類和分級(jí),以產(chǎn)生關(guān)鍵詞結(jié)構(gòu);以及關(guān)鍵詞輸出單元,其以所述排行確定單元所確定的排行的降序輸出關(guān)鍵詞。
2. 根據(jù)權(quán)利要求1所述的關(guān)鍵詞輸出設(shè)備,其特征在于,進(jìn)一步包含搜索請(qǐng)求產(chǎn)生單元, 在所述關(guān)鍵詞輸出單元輸出關(guān)鍵詞之前,對(duì)各關(guān)鍵詞附加搜索請(qǐng)求。
3. 根據(jù)權(quán)利要求l所述的關(guān)鍵詞輸出設(shè)備,其特征在于,進(jìn)一步包含搜索請(qǐng)求產(chǎn)生單元, 對(duì)用戶選中的各關(guān)鍵詞附加搜索請(qǐng)求。
4. 根據(jù)權(quán)利要求2所述的關(guān)鍵詞輸出設(shè)備,其特征在于,所述搜索請(qǐng)求產(chǎn)生單元基于關(guān)鍵 詞結(jié)構(gòu)組合多個(gè)關(guān)鍵詞,以產(chǎn)生所述搜索請(qǐng)求。
5. 根據(jù)權(quán)利要求2所述的關(guān)鍵詞輸出設(shè)備,其特征在于,所述搜索請(qǐng)求產(chǎn)生單元附加預(yù)定 關(guān)鍵詞字符串作為所述搜索請(qǐng)求。
6. 根據(jù)權(quán)利要求l所述的關(guān)鍵詞輸出設(shè)備,其特征在于,進(jìn)一步包含存儲(chǔ)單元,在其中儲(chǔ) 存具有對(duì)應(yīng)排行的關(guān)鍵詞和關(guān)鍵詞結(jié)構(gòu),其中所述排行確定單元和所述關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元査看所述存儲(chǔ)單元中的關(guān)鍵詞和關(guān)鍵詞 結(jié)構(gòu)。
7. 根據(jù)權(quán)利要求6所述的關(guān)鍵詞輸出設(shè)備,其特征在于,所述存儲(chǔ)單元進(jìn)一步在其中儲(chǔ)存與各關(guān)鍵詞相關(guān)的關(guān)鍵詞歷史,以及 所述排行確定單元基于所述關(guān)鍵詞歷史確定排行。
8. 根據(jù)權(quán)利要求6所述的關(guān)鍵詞輸出設(shè)備,其特征在于,所述關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元通過比 較各關(guān)鍵詞的當(dāng)前排行和先前確定的排行,對(duì)存儲(chǔ)單元中儲(chǔ)存的各關(guān)鍵詞附加指定屬性。
9. 根據(jù)權(quán)利要求6所述的關(guān)鍵詞輸出設(shè)備,其特征在于,所述關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元通過與 所述存儲(chǔ)單元中儲(chǔ)存的關(guān)鍵詞進(jìn)行比較確定關(guān)鍵詞是否為新近形成的關(guān)鍵詞,當(dāng)確定關(guān)鍵 詞是新近形成的關(guān)鍵詞時(shí),對(duì)新近形成的關(guān)鍵詞附加新的標(biāo)簽。
10. 根據(jù)權(quán)利要求1所述的關(guān)鍵詞輸出設(shè)備, 個(gè)指定時(shí)間段中的文檔。
11. 根據(jù)權(quán)利要求1所述的關(guān)鍵詞輸出設(shè)備, 鍵詞的指定屬性確定各關(guān)鍵詞的排行。其特征在于,所述文檔接收單元接收至少一其特征在于,所述排行確定單元通過使用關(guān)
12. 根據(jù)權(quán)利要求ll所述的關(guān)鍵詞輸出設(shè)備,其特征在于,關(guān)鍵詞的指定屬性是關(guān)鍵詞的出現(xiàn)頻率。
13. 根據(jù)權(quán)利要求ll所述的關(guān)鍵詞輸出設(shè)備,其特征在于,關(guān)鍵詞的指定屬性包括關(guān)鍵詞 是否首次被提取的信息。
14. 根據(jù)權(quán)利要求1所述的關(guān)鍵詞輸出設(shè)備,其特征在于,所述關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元基于 關(guān)鍵詞所屬文檔中的共同性所引起的關(guān)鍵詞的同現(xiàn),對(duì)關(guān)鍵詞進(jìn)行分類和分級(jí)。
15. 根據(jù)權(quán)利要求1所述的關(guān)鍵詞輸出設(shè)備,其特征在于,所述排行確定單元通過使用各 關(guān)鍵詞的包含關(guān)系提取關(guān)鍵詞。
16. 根據(jù)權(quán)利要求1所述的關(guān)鍵詞輸出設(shè)備,其特征在于,所述關(guān)鍵詞輸出單元響應(yīng)預(yù)定 操作,輸出包括關(guān)鍵詞的文檔。
17. 根據(jù)權(quán)利要求8所述的關(guān)鍵詞輸出設(shè)備,其特征在于,所述關(guān)鍵詞輸出單元基于所述 指定屬性的狀態(tài)和類型,顯示可以確認(rèn)所述指定屬性的記號(hào)。
18. 根據(jù)權(quán)利要求9所述的關(guān)鍵詞輸出設(shè)備,其特征在于,所述關(guān)鍵詞輸出單元基于所述 指定屬性的狀態(tài)和類型,顯示可以確認(rèn)所述指定屬性的記號(hào)。
19. 根據(jù)權(quán)利要求8所述的關(guān)鍵詞輸出設(shè)備,其特征在于,所述關(guān)鍵詞輸出單元基于所述 指定屬性的狀態(tài)和類型,改變關(guān)鍵詞的顯示順序。
20. 根據(jù)權(quán)利要求9所述的關(guān)鍵詞輸出設(shè)備,其特征在于,所述關(guān)鍵詞輸出單元基于所述 指定屬性的狀態(tài)和類型,改變關(guān)鍵詞的顯示順序。
21. —種關(guān)鍵詞輸出方法,其特征在于,包括 接收指定時(shí)間段內(nèi)的具有日期時(shí)間屬性的文檔; 分析所述文檔并從所述文檔中提取時(shí)事關(guān)鍵詞; 基于這些關(guān)鍵詞的屬性,確定各關(guān)鍵詞的排行;基于關(guān)鍵詞的同現(xiàn)對(duì)關(guān)鍵詞進(jìn)行分類和分級(jí),以產(chǎn)生關(guān)鍵詞結(jié)構(gòu);以及 以排行的降序輸出關(guān)鍵詞。
全文摘要
一種關(guān)鍵詞輸出設(shè)備,包括文檔接收單元,接收指定時(shí)間段內(nèi)的文檔;關(guān)鍵詞分析單元,對(duì)文檔分析可能的關(guān)鍵詞;關(guān)鍵詞提取單元,對(duì)各關(guān)鍵詞計(jì)算分?jǐn)?shù)并以分?jǐn)?shù)順序提取關(guān)鍵詞;關(guān)鍵詞結(jié)構(gòu)產(chǎn)生單元,通過分類和分級(jí)各提取的關(guān)鍵詞,產(chǎn)生關(guān)鍵詞結(jié)構(gòu);關(guān)鍵詞輸出單元,基于關(guān)鍵詞結(jié)構(gòu),以分?jǐn)?shù)的降序輸出關(guān)鍵詞。
文檔編號(hào)G06F17/30GK101118560SQ20071014003
公開日2008年2月6日 申請(qǐng)日期2007年8月3日 優(yōu)先權(quán)日2006年8月3日
發(fā)明者后藤和之, 山崎智弘, 崗本昌之, 梅本秀雄 申請(qǐng)人:株式會(huì)社東芝
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
衡阳市| 昔阳县| 井冈山市| 大丰市| 探索| 大同县| 邮箱| 疏勒县| 邹城市| 全椒县| 汕尾市| 嘉义县| 唐河县| 沁源县| 仲巴县| 渑池县| 泸定县| 乌拉特前旗| 栖霞市| 和田县| 南木林县| 瑞安市| 姜堰市| 丰县| 隆化县| 仲巴县| 神木县| 米林县| 普兰店市| 大邑县| 元谋县| 吕梁市| 滕州市| 东至县| 镇宁| 三江| 喜德县| 文安县| 宁国市| 始兴县| 花莲县|