專利名稱:用于產(chǎn)生關(guān)聯(lián)詞字典的裝置、方法和程序以及內(nèi)容搜索裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于產(chǎn)生用來(lái)搜索內(nèi)容信息的關(guān)聯(lián)詞字典的裝 置、方法和程序,并且還涉及一種內(nèi)容搜索裝置。
背景技術(shù):
網(wǎng)絡(luò)系統(tǒng)通常被用來(lái)獲取諸如圖像數(shù)據(jù)之類的希望的內(nèi)容信 息。在網(wǎng)絡(luò)系統(tǒng)中,客戶終端訪問(wèn)存儲(chǔ)了數(shù)據(jù)庫(kù)的服務(wù)器,并且根據(jù) 從該客戶終端輸入的搜索詞(關(guān)鍵詞)來(lái)對(duì)該數(shù)據(jù)庫(kù)進(jìn)行搜索。在所 輸入的搜索詞適當(dāng)時(shí),可以從數(shù)據(jù)庫(kù)中取出希望的圖像數(shù)據(jù)。但是, 選擇適當(dāng)?shù)乃阉髟~很困難,因此通常在改變搜索詞的同時(shí)不斷進(jìn)行搜 索,直到獲取希望的圖像數(shù)據(jù)。
最近,存儲(chǔ)了諸如上下位關(guān)系、部分總體關(guān)系、同義關(guān)系之類 的詞間關(guān)聯(lián)的關(guān)聯(lián)詞字典被用來(lái)改進(jìn)搜索精度。例如,與日本專利公
開(kāi)No. 2003-288359相對(duì)應(yīng)的美國(guó)專利申請(qǐng)公開(kāi)No. 2005/0160460公 開(kāi)了一種內(nèi)容搜索裝置,在對(duì)向其添加了元數(shù)據(jù)的內(nèi)容信息進(jìn)行搜索 時(shí),該內(nèi)容搜索裝置從關(guān)聯(lián)詞字典中取出搜索詞的關(guān)聯(lián)詞。這個(gè)內(nèi)容 搜索裝置不僅使用了搜索詞,而且使用了關(guān)聯(lián)詞來(lái)搜索內(nèi)容信息。
通常要求字典通過(guò)記錄新詞來(lái)增加其所存儲(chǔ)的詞的數(shù)量。對(duì)于 詞的記錄,將輸入字符串按詞性分類,而那些不能按詞性分類的輸入 字符串則在字典中記錄為未知詞(unknown words)。對(duì)于這種結(jié)構(gòu), 用戶不必記錄未知詞,因此可以很容易地增加詞數(shù)(日本專利公開(kāi) No.11-085761和2004-265440)。
關(guān)聯(lián)詞字典還需要記錄未知詞。在日本專利公開(kāi)
No. 2002-230020所公開(kāi)的信息搜索裝置中,在對(duì)多媒體信息進(jìn)行搜 索時(shí),根據(jù)搜索詞的出現(xiàn)頻率來(lái)獲取所取出的文件中與搜索詞共同出 現(xiàn)的詞(關(guān)聯(lián)詞)。如果所獲取的共同出現(xiàn)的詞未被記錄在關(guān)聯(lián)詞字
典中時(shí),則將它們記錄為與搜索詞相關(guān)的關(guān)聯(lián)詞。
然而,日本專利公開(kāi)No. 2002-230020的信息搜索裝置中,必須 進(jìn)行用于從文件中獲取共同出現(xiàn)的詞的操作,因此,處理是耗時(shí)的。 此外,由于沒(méi)有記錄作為關(guān)聯(lián)詞的未知詞,所以該系統(tǒng)不足以用來(lái)增 加關(guān)聯(lián)詞字典的詞數(shù)。
發(fā)明內(nèi)容
本發(fā)明的主要目的是提供一種用來(lái)產(chǎn)生關(guān)聯(lián)詞字典的裝置、方 法和程序,其能夠通過(guò)簡(jiǎn)單處理來(lái)記錄未知詞,并且能有效地增加存 儲(chǔ)在關(guān)聯(lián)詞字典中的詞數(shù)。
本發(fā)明的另一目的是提供一種能夠平穩(wěn)地執(zhí)行內(nèi)容信息搜索的 內(nèi)容搜索裝置。
為了實(shí)現(xiàn)上述及其它目的,本發(fā)明的一種用于產(chǎn)生關(guān)聯(lián)詞字典
的裝置包括元數(shù)據(jù)輸入部分、記分部分、以及關(guān)聯(lián)詞記錄部分。元 數(shù)據(jù)輸入部分輸入添加至內(nèi)容信息的多段元數(shù)據(jù)。記分部分確定代表 了元數(shù)據(jù)之間的關(guān)聯(lián)度的分?jǐn)?shù)。關(guān)聯(lián)詞記錄部分將元數(shù)據(jù)的組合和分 數(shù)相互關(guān)聯(lián)地記錄在關(guān)聯(lián)詞字典中。
記分部分可確定所輸入的元數(shù)據(jù)和關(guān)聯(lián)詞字典中的元數(shù)據(jù)之間 的分?jǐn)?shù)。
優(yōu)選的是,關(guān)聯(lián)詞字典產(chǎn)生裝置配置有內(nèi)容搜索部分,用于搜 索與所輸入的元數(shù)據(jù)具有共同元數(shù)據(jù)的內(nèi)容信息。記分部分確定所輸 入的元數(shù)據(jù)和添加至搜索到的內(nèi)容信息的元數(shù)據(jù)之間的分?jǐn)?shù)。
優(yōu)選的是,關(guān)聯(lián)詞字典產(chǎn)生裝置配置有跳數(shù)計(jì)數(shù)器,用于計(jì)算 可經(jīng)由共同的元數(shù)據(jù)進(jìn)行追蹤的內(nèi)容信息的跳數(shù)。記分部分基于跳數(shù) 來(lái)確定分?jǐn)?shù)。
記分部分可基于元數(shù)據(jù)的出現(xiàn)頻率/等級(jí)來(lái)確定分?jǐn)?shù)。 優(yōu)選的是,關(guān)聯(lián)詞字典產(chǎn)生裝置配置有詞提取器,用于從字符
串中提取詞。元數(shù)據(jù)輸入部分將所提取的詞作為元數(shù)據(jù)輸入。
優(yōu)選的是,關(guān)聯(lián)詞字典產(chǎn)生裝置配置有內(nèi)容搜集器,用于從預(yù)
先設(shè)置的數(shù)據(jù)搜集位置自動(dòng)地搜集內(nèi)容信息。元數(shù)據(jù)輸入部分輸入添
加至所搜集的內(nèi)容信息的元數(shù)據(jù)。
優(yōu)選的是,關(guān)聯(lián)詞字典產(chǎn)生裝置配置有內(nèi)容累積部分,用于對(duì) 其中添加了從元數(shù)據(jù)輸入部分輸入的元數(shù)據(jù)的內(nèi)容信息進(jìn)行累積。
本發(fā)明的一種用于產(chǎn)生關(guān)聯(lián)詞字典的方法和程序包括元數(shù)據(jù) 輸入步驟、記分步驟、和關(guān)聯(lián)詞記錄步驟。在元數(shù)據(jù)輸入步驟中,輸 入添加至內(nèi)容信息的多段元數(shù)據(jù)。在記分步驟中,確定代表了元數(shù)據(jù) 之間的關(guān)聯(lián)度的分?jǐn)?shù)。在關(guān)聯(lián)詞記錄步驟中,將元數(shù)據(jù)的組合和分?jǐn)?shù) 相互關(guān)聯(lián)地記錄在關(guān)聯(lián)詞字典中。
本發(fā)明的一種內(nèi)容搜索裝置包括元數(shù)據(jù)輸入部分、記分部分、
關(guān)聯(lián)詞記錄部分、內(nèi)容累積部分、搜索詞輸入部分、關(guān)聯(lián)詞搜索部分、
以及內(nèi)容搜索部分。元數(shù)據(jù)輸入部分輸入添加至內(nèi)容信息的多段元數(shù)
據(jù)。記分部分確定代表了元數(shù)據(jù)之間的關(guān)聯(lián)的分?jǐn)?shù)。關(guān)聯(lián)詞記錄部分
將元數(shù)據(jù)的組合和分?jǐn)?shù)相互關(guān)聯(lián)地記錄在關(guān)聯(lián)詞字典中。內(nèi)容累積部 分對(duì)其中添加了從元數(shù)據(jù)輸入部分輸入的元數(shù)據(jù)的內(nèi)容信息進(jìn)行累
積。搜索詞輸入部分輸入搜索詞。關(guān)聯(lián)詞搜索部分從關(guān)聯(lián)詞字典中搜 索關(guān)聯(lián)詞。內(nèi)容搜索部分從內(nèi)容累積部分中搜索具有搜索詞和至少一 個(gè)作為元數(shù)據(jù)的關(guān)聯(lián)詞的內(nèi)容信息。
搜索出來(lái)的內(nèi)容信息及其分?jǐn)?shù)中的至少一個(gè)被發(fā)送至客戶終 端。在客戶終端,具有較高分?jǐn)?shù)的內(nèi)容信息被優(yōu)先地顯示在搜索詞輸 入部分的監(jiān)視器上。
根據(jù)本發(fā)明,輸入了添加至內(nèi)容信息的多段元數(shù)據(jù),并且確定
代表了元數(shù)據(jù)之間的關(guān)聯(lián)度的分?jǐn)?shù),隨后將元數(shù)據(jù)的組合和分?jǐn)?shù)相互 關(guān)聯(lián)地記錄在關(guān)聯(lián)詞字典中。由此,無(wú)需復(fù)雜處理就可以將未知詞記 錄在關(guān)聯(lián)詞字典中。
此外,由于本發(fā)明的內(nèi)容搜索裝置使用了對(duì)未知詞及其分?jǐn)?shù)進(jìn) 行記錄的關(guān)聯(lián)詞字典,所以可以平穩(wěn)地對(duì)內(nèi)容信息進(jìn)行搜索。
通過(guò)結(jié)合附圖閱讀以下對(duì)優(yōu)選實(shí)施例的詳細(xì)描述,上述及其它 目的和優(yōu)點(diǎn)將變得明顯,圖中類似的標(biāo)號(hào)表示所有附圖中類似或?qū)?yīng)
的部分,其中
圖1是圖示了本發(fā)明的網(wǎng)絡(luò)系統(tǒng)的結(jié)構(gòu)的示意圖; 圖2是圖示了客戶終端的內(nèi)部結(jié)構(gòu)的框圖; 圖3是圖示了服務(wù)器的內(nèi)部結(jié)構(gòu)的框圖; 圖4是圖像數(shù)據(jù)和標(biāo)簽的數(shù)據(jù)表格;
圖5是圖示了對(duì)其添加了標(biāo)簽的圖像數(shù)據(jù)的說(shuō)明性視圖6是圖示了詞和分?jǐn)?shù)之間的關(guān)系的表格;
圖7是圖示了標(biāo)簽的關(guān)系的說(shuō)明性視圖8是圖示了跳數(shù)與評(píng)估值之間的關(guān)系的表格;
圖9是圖示了出現(xiàn)頻率與評(píng)估值之間的關(guān)系的表格;
圖IO是圖示了進(jìn)入順序與評(píng)估值之間的關(guān)系的表格;
圖ll是例示了各種評(píng)估值和分?jǐn)?shù)之間的關(guān)系的表格;
圖12是解釋了用于在字典DB中記錄標(biāo)簽的組合及其分?jǐn)?shù)的處
理步驟的流程圖13是解釋了用于利用字典DB來(lái)獲取圖像數(shù)據(jù)的處理步驟的
流程圖14是圖示了根據(jù)本發(fā)明第二實(shí)施例的服務(wù)器的內(nèi)部結(jié)構(gòu)的框
圖15是用于從字符串中提取詞的說(shuō)明性視圖;以及 圖16是說(shuō)明了圖像數(shù)據(jù)的自動(dòng)搜集的流程圖。
具體實(shí)施例方式
在圖1中,網(wǎng)絡(luò)系統(tǒng)14由服務(wù)器ll和客戶終端13構(gòu)成,客戶 終端13通過(guò)通信網(wǎng)絡(luò)12與服務(wù)器11連接。服務(wù)器11作為關(guān)聯(lián)詞字 典產(chǎn)生裝置和內(nèi)容搜索裝置來(lái)工作。將記錄在諸如CD-R0M之類的記 錄介質(zhì)中的關(guān)聯(lián)詞字典產(chǎn)生程序安裝在服務(wù)器11上。
客戶終端13是(例如)公知的個(gè)人計(jì)算機(jī)或工作站,其具有用 來(lái)顯示各種操作窗口的監(jiān)視器15和用來(lái)輸入指令等的操作部分18。 操作部分18具有鼠標(biāo)16和鍵盤17。
將通過(guò)數(shù)碼相機(jī)19的拍攝而獲取的圖像數(shù)據(jù)(與內(nèi)容信息對(duì)應(yīng))和記錄在諸如存儲(chǔ)卡或CD-R之類的記錄介質(zhì)20中的圖像數(shù)據(jù)輸入客 戶終端13??蛻艚K端13還通過(guò)通信網(wǎng)絡(luò)12將圖像數(shù)據(jù)發(fā)送至服務(wù) 器ll。圖像數(shù)據(jù)具有標(biāo)簽,標(biāo)簽中寫入了從操作部分18輸入的元數(shù) 據(jù)。為了取出希望的內(nèi)容信息,從鍵盤17輸入的搜索詞對(duì)元數(shù)據(jù)進(jìn) 行搜索。
數(shù)碼相機(jī)19通過(guò)無(wú)線L認(rèn)或符合例如IEEE 1394或通用串行總 線(USB)的通信線纜與客戶終端13連接,從而與客戶終端13交換 數(shù)據(jù)。記錄介質(zhì)20也能夠通過(guò)特定驅(qū)動(dòng)器與客戶終端13交換數(shù)據(jù)。
如圖2所示,客戶終端13由CPU 21、操作部分18、 RAM 23、 HDD 24、通信I/F 25和監(jiān)視器15組成。這些組件通過(guò)數(shù)據(jù)總線22 相互連接。
RAM 23被用作CPU 21用以執(zhí)行處理的工作存儲(chǔ)器。HDD 24存 儲(chǔ)了用于操作客戶終端13的各種程序和數(shù)據(jù)。HDD24還存儲(chǔ)了從數(shù) 碼相機(jī)19、記錄介質(zhì)20和通信網(wǎng)絡(luò)12下載下來(lái)的圖像數(shù)據(jù)。CPU 21 從HDD 24讀取程序并且在RAM 23中對(duì)程序進(jìn)行調(diào)度。CPU 21隨后
依次執(zhí)行所加載的程序。
通信I/F 25是(例如)對(duì)適合于通信網(wǎng)絡(luò)12的通信協(xié)議進(jìn)行 控制的調(diào)制解調(diào)器或路由器,其經(jīng)由通信網(wǎng)絡(luò)12交換數(shù)據(jù)。通信I/F 25還是客戶終端13與諸如數(shù)碼相機(jī)19和記錄介質(zhì)20之類的外部裝 置進(jìn)行數(shù)據(jù)通信的媒介。
如圖3所示,月艮務(wù)器11由CPU 26、 RAM 20、 HDD 29、通信I/F 30、圖像搜索部分(內(nèi)容搜索部分)31、記分部分32和關(guān)聯(lián)詞搜索 部分33組成。這些組件通過(guò)數(shù)據(jù)總線27相互連接。
CPU 26根據(jù)通過(guò)通信網(wǎng)絡(luò)12從客戶終端13到來(lái)的操作信號(hào)來(lái) 在總體上控制服務(wù)器11。 R認(rèn)28被用作CPU26用以執(zhí)行處理的工作 存儲(chǔ)器。HDD29存儲(chǔ)了用于操作服務(wù)器11的各種程序和數(shù)據(jù)。HDD29 還存儲(chǔ)了關(guān)聯(lián)詞字典產(chǎn)生程序42、用于搜索內(nèi)容信息的搜索程序等 等。CPU 26從HDD 29讀取程序并且在RAM 28中對(duì)程序進(jìn)行調(diào)度。 CPU 26隨后依次執(zhí)行所加載的程序。
HDD29包含圖像數(shù)據(jù)庫(kù)(圖像DB) 36和關(guān)聯(lián)詞字典數(shù)據(jù)庫(kù)(字典DB) 37。在圖像DB 36中,存儲(chǔ)了經(jīng)由通信網(wǎng)絡(luò)12獲取的圖像數(shù) 據(jù)和寫入添加至這些圖像數(shù)據(jù)的標(biāo)簽中的元數(shù)據(jù)。下文中,元數(shù)據(jù)僅 僅指標(biāo)簽。如圖4所示,相互關(guān)聯(lián)的圖像數(shù)據(jù)和標(biāo)簽被存儲(chǔ)在數(shù)據(jù)表 格中。下文中,存儲(chǔ)在圖像DB36中的圖像數(shù)據(jù)被稱為累積的圖像數(shù) 據(jù)。
圖5中示出了累積的圖像數(shù)據(jù)和標(biāo)簽的示例。圖像數(shù)據(jù)PA1是 富士山(MT. FUJI)的捕捉圖像。標(biāo)簽TA1 "富士山"、TA2 "林海"、 TA3 "朝暉"、TA4 "火山"、TA5 "曰本第一"、和TA6 "富士 SUBARU 路"與圖像數(shù)據(jù)PA1相關(guān)聯(lián)。
字典DB 37存儲(chǔ)了作為寫入標(biāo)簽的元數(shù)據(jù)的詞(下文中稱為標(biāo) 簽)的組合和代表了標(biāo)簽之間的關(guān)聯(lián)的分?jǐn)?shù)。圖6示出了字典DB37 的示例,其包括第一和第二標(biāo)簽的組合以及提供給各個(gè)組合的分?jǐn)?shù)。 例如,組合"富士山"和"日本第一"的分?jǐn)?shù)為"216"。
通信I/F 30是(例如)對(duì)適合于通信網(wǎng)絡(luò)12的通信協(xié)議進(jìn)行 控制的調(diào)制解調(diào)器或路由器,其經(jīng)由通信網(wǎng)絡(luò)12交換數(shù)據(jù)。經(jīng)由通 信網(wǎng)絡(luò)12獲取的數(shù)據(jù)被暫時(shí)存儲(chǔ)在RAM 28中,當(dāng)獲取到圖像數(shù)據(jù)時(shí), 圖像數(shù)據(jù)及其標(biāo)簽被存儲(chǔ)在RAM 28中。
CPU (元數(shù)據(jù)輸入部分)26將存儲(chǔ)在RAM 28中的標(biāo)簽輸入至記 分部分32。記分部分32確定所輸入的標(biāo)簽之間的分?jǐn)?shù)或者所輸入的 標(biāo)簽和累積的圖像數(shù)據(jù)的標(biāo)簽(累積的標(biāo)簽)之間的分?jǐn)?shù)。
記分部分32配置有跳數(shù)計(jì)數(shù)器38、出現(xiàn)頻率計(jì)數(shù)器39和等級(jí) 計(jì)數(shù)器40。跳數(shù)計(jì)數(shù)器38指的是標(biāo)簽的數(shù)據(jù)表,它對(duì)從所輸入的標(biāo) 簽數(shù)出來(lái)的累積的標(biāo)簽的跳數(shù)進(jìn)行計(jì)數(shù)。該跳數(shù)為可通過(guò)共同的標(biāo)簽 追蹤的圖像數(shù)據(jù)的數(shù)目。當(dāng)所輸入的圖像數(shù)據(jù)的標(biāo)簽中存在標(biāo)簽"A" 并且累積的圖像數(shù)據(jù)的標(biāo)簽中也存在標(biāo)簽"A"時(shí),可追蹤的累積的 圖像數(shù)據(jù)的數(shù)目為"1"。因此,這個(gè)累積的圖像數(shù)據(jù)的其它標(biāo)簽的 跳數(shù)為"1"。當(dāng)具有跳數(shù)為"1"的標(biāo)簽的累積的圖像數(shù)據(jù)的標(biāo)簽中 存在標(biāo)簽"B",并且另一累積的圖像數(shù)據(jù)的標(biāo)簽中存在標(biāo)簽"B"時(shí), 可經(jīng)由標(biāo)簽"A"和"B"追蹤兩段累積的圖像數(shù)據(jù)。因此,這個(gè)第二 累積的圖像數(shù)據(jù)的其它標(biāo)簽的跳數(shù)為"2"。相同圖像數(shù)據(jù)的標(biāo)簽之
間的跳數(shù)為"0"。
出現(xiàn)頻率計(jì)數(shù)器39對(duì)每個(gè)標(biāo)簽的出現(xiàn)頻率進(jìn)行計(jì)數(shù)。具體說(shuō)來(lái), 累積的標(biāo)簽和該標(biāo)簽被添加的次數(shù)之間的關(guān)系以數(shù)據(jù)表格的形式被 存儲(chǔ)在HDD 29中。當(dāng)新近輸入的標(biāo)簽與累積的標(biāo)簽之一相同時(shí),該 累積的標(biāo)簽的出現(xiàn)頻率增大。當(dāng)新近輸入的標(biāo)簽并不存在于累積的標(biāo) 簽中時(shí),以出現(xiàn)頻率"1"存儲(chǔ)該標(biāo)簽。
等級(jí)計(jì)數(shù)器40對(duì)每個(gè)標(biāo)簽的等級(jí)進(jìn)行計(jì)數(shù)。等級(jí)可能是例如進(jìn) 入順序或者用戶所指定的優(yōu)先級(jí)順序。在這個(gè)實(shí)施例中,標(biāo)簽的進(jìn)入 順序被指定為等級(jí)。
記分部分32通過(guò)用參考值乘以評(píng)估值來(lái)計(jì)算分?jǐn)?shù)。根據(jù)各個(gè)計(jì) 數(shù)器38至40所計(jì)算的數(shù)目來(lái)獲取評(píng)估值。在此,標(biāo)簽對(duì)之一被定義 為第一標(biāo)簽,而另一個(gè)標(biāo)簽被定義為第二標(biāo)簽。根據(jù)以下公式計(jì)算分 數(shù)
分?jǐn)?shù)二(參考值)X (基于跳數(shù)的評(píng)估值)X (基于第一標(biāo)簽的出現(xiàn) 頻率的評(píng)估值)X (基于第二標(biāo)簽的出現(xiàn)頻率的評(píng)估值)X (基于第一 標(biāo)簽的進(jìn)入順序的評(píng)估值)X (基于第二標(biāo)簽的進(jìn)入順序的評(píng)估值) ")
隨著標(biāo)簽之間的關(guān)聯(lián)度越高,分?jǐn)?shù)越高。注意,參考值是任意 的。本實(shí)施例中該參考值為"1"。
如圖8所示,按照如下方式設(shè)置跳數(shù)的評(píng)估值"0"跳為"3" 分,"1"跳為"2"分,"2"跳為"1"分。這些評(píng)估值初始地被存 儲(chǔ)在HDD 29中。跳數(shù)越大,那么該評(píng)估值越低,并且標(biāo)簽之間的關(guān) 聯(lián)度越低。
如圖9所示,按照如下方式設(shè)置出現(xiàn)頻率的評(píng)估值"l"次為 "1"分,"2"次為"2"分,"3"次為"3"分,"4"次為"4"
分, , "N"次為"N"分(N為計(jì)數(shù))。這些評(píng)估值初始地被存儲(chǔ) 在HDD 29中。出現(xiàn)頻率越高,那么該評(píng)估值越高。
如圖10所示,按照如下方式設(shè)置進(jìn)入順序的評(píng)估值"第l" 為"N"分,"第2"為"(N-1)"分,…,"第(N-2)"為"3"分, "第(N-1)"為"2"分,"第N"為"1"分。這些評(píng)估值預(yù)先被存
儲(chǔ)在HDD 29中。該評(píng)估值以進(jìn)入順序遞減。
參見(jiàn)圖7和11來(lái)解釋記分部分32的操作。在圖7中,標(biāo)簽TA1 "富士山"、TA2 "林海"、TA3 "朝暉"、TA4 "火山"、TA5 "日本 第一"、和TA6 "富士 SUBARU路"被加入同一圖像數(shù)據(jù)PA1。因此, 這些標(biāo)簽的各個(gè)標(biāo)簽之間的跳數(shù)為"0"。累積的標(biāo)簽TB2 "日出"、 TB3 "露天浴"、TB4 "溫泉"、TB6 "琵琶湖"、TB7 "滋賀縣"、和 TB9 "拉姆薩公約"可由標(biāo)簽TA1以及標(biāo)簽TBI和TB5 "富士山"、 以及由標(biāo)簽TA5和標(biāo)簽TB8 "日本第一"追蹤。因此,從標(biāo)簽TA1至
TA6數(shù)出來(lái)的標(biāo)簽TB2、 TB3、 TB4、 TB6、 TB7、和TB9的跳數(shù)分別為 "1" 。 TC1 "鳥(niǎo)人錦標(biāo)賽"、TC3 "人力"、和TC4 "飛機(jī)"可由TB2
和TC3"琵琶湖"追蹤。從標(biāo)簽TA1至TA6數(shù)出來(lái)的標(biāo)簽TC1、 TC3、
和TC4的跳數(shù)分別為"2"。
在假設(shè)圖中未示出的標(biāo)簽沒(méi)有在圖像DB 36中累積的情況下,
對(duì)于出現(xiàn)頻率計(jì)數(shù)器39所數(shù)出來(lái)的數(shù),"富士山"為"3","日本
第一"為"2","琵琶湖"為"2",其余的為"1"。
當(dāng)標(biāo)簽按照進(jìn)入順序從上到下地排列時(shí),對(duì)于等級(jí)計(jì)數(shù)器40所
數(shù)出來(lái)的數(shù),對(duì)于等級(jí)計(jì)數(shù)器所數(shù)出來(lái)的數(shù),"富士山"為"第1", "林海"為"第2",…,"富士SUBARU路"為"第N"。
基于以上描述,根據(jù)式(1)來(lái)計(jì)算分?jǐn)?shù)。圖11示出了計(jì)算出
來(lái)的分?jǐn)?shù)。將"富士山"和"火山"的組合的分?jǐn)?shù)作為示例進(jìn)行說(shuō)明。 "富士山"和"火山"的跳數(shù)為"0",因此基于該跳數(shù)的評(píng)估值為 "3"。"富士山"的出現(xiàn)頻率為"3",因此其評(píng)估值為"3";而 "火山"的出現(xiàn)頻率為"1",因此其評(píng)估值為"1"。"富士山"的
進(jìn)入順序是六個(gè)標(biāo)簽中的第一個(gè),因此其評(píng)估值為"6";而"火山"
的進(jìn)入順序是六個(gè)標(biāo)簽中的第四個(gè),因此其評(píng)估值為"3"。于是, "富士山"和"火山"的組合的分?jǐn)?shù)為162 (=3X3X1X6X3)。注
意,"基于出現(xiàn)頻率的評(píng)估值"和"基于進(jìn)入順序的評(píng)估值"是在假
設(shè)除了圖7所示的標(biāo)簽之外沒(méi)有其它標(biāo)簽存在的情況下計(jì)算出來(lái)的。 以相同的方式還計(jì)算其它組合的分?jǐn)?shù)。例如,"富士山"個(gè)"曰
出"的組合的分?jǐn)?shù)為36 (=2X3X1X6X1),"富士 SUBARU路"和
"飛機(jī)"的組合的分?jǐn)?shù)為1 (=1X1X1X1X1)。
標(biāo)簽的組合及其分?jǐn)?shù)被記錄在字典DB 37中。在已經(jīng)記錄了標(biāo) 簽的組合時(shí),僅僅重新寫入分?jǐn)?shù)。當(dāng)所輸入的標(biāo)簽中存在未知詞時(shí), 具有該未知詞的組合及其分?jǐn)?shù)被全新地記錄下來(lái)。
再次參見(jiàn)圖3, CPU (搜索詞輸入部分)26將從客戶終端13輸 入的搜索詞輸入至關(guān)聯(lián)詞搜索部分33。關(guān)聯(lián)詞搜索部分33基于搜索 詞在字典DB 37中搜索關(guān)聯(lián)詞。關(guān)聯(lián)詞搜索部分33獲取關(guān)聯(lián)詞及其 分?jǐn)?shù)。
圖像搜索部分31在圖像DB 36中搜索累積的圖像數(shù)據(jù),該累積 的圖像數(shù)據(jù)具有這樣的標(biāo)簽,即其中搜索詞和其關(guān)聯(lián)詞的全部或至少 一個(gè)被寫入作為元數(shù)據(jù)。圖像搜索部分31將該累積的圖像數(shù)據(jù)讀取 至RAM 28中。在RAM 28中讀取的圖像數(shù)據(jù)隨后經(jīng)由通信網(wǎng)絡(luò)12被 發(fā)送至客戶終端13。
下文中將說(shuō)明根據(jù)以上第一實(shí)施例的網(wǎng)絡(luò)系統(tǒng)14的操作??蛻?終端13將標(biāo)簽加至存儲(chǔ)在HDD24中的圖像數(shù)據(jù)中,并且將具有標(biāo)簽 的圖像數(shù)據(jù)發(fā)送至服務(wù)器11。從操作部分18輸入的元數(shù)據(jù)被寫入在 標(biāo)簽中。如圖12所示,發(fā)送至服務(wù)器11圖像數(shù)據(jù)和標(biāo)簽被通信I/F 30接收并且被存儲(chǔ)在RAM 28中。
存儲(chǔ)在RAM28中的標(biāo)簽(輸入標(biāo)簽)被讀出至記分部分32。在 記分部分32中,跳數(shù)計(jì)數(shù)器38對(duì)輸入標(biāo)簽之間的或者輸入標(biāo)簽和添 加至累積在圖像DB 36中的圖像數(shù)據(jù)的累積的標(biāo)簽之間的跳數(shù)進(jìn)行計(jì) 數(shù)。此外,出現(xiàn)頻率計(jì)數(shù)器39對(duì)每個(gè)標(biāo)簽的出現(xiàn)頻率進(jìn)行計(jì)數(shù)。并 且,等級(jí)標(biāo)簽40對(duì)每個(gè)標(biāo)簽的進(jìn)入順序進(jìn)行計(jì)數(shù)。
在對(duì)跳數(shù)、出現(xiàn)頻率和進(jìn)入順序進(jìn)行計(jì)數(shù)之后,記分部分32從 HDD 29中讀出與各個(gè)計(jì)數(shù)出來(lái)的值相對(duì)應(yīng)的評(píng)估值,并且通過(guò)用參 考值乘以評(píng)估值來(lái)計(jì)算分?jǐn)?shù)。標(biāo)簽的組合及其分?jǐn)?shù)被記錄在字典DB 37中。
在搜索圖像數(shù)據(jù)時(shí),如圖13所示,從客戶終端13的操作部分 18輸入搜索詞。經(jīng)由通信網(wǎng)絡(luò)12將搜索詞發(fā)送至服務(wù)器11。服務(wù)器 ll所接收到的搜索詞通過(guò)通信I/F 30存儲(chǔ)在R認(rèn)28中。
存儲(chǔ)在R雄28中的搜索詞被讀出至關(guān)聯(lián)詞搜索部分33。關(guān)聯(lián)詞 搜索部分33在字典DB 37中對(duì)搜索詞的關(guān)聯(lián)詞進(jìn)行搜索,并且獲取 關(guān)聯(lián)詞及其分?jǐn)?shù)。圖像搜索部分31在累積的圖像數(shù)據(jù)中搜索具有這 樣的標(biāo)簽的圖像數(shù)據(jù),即搜索詞和所有或至少一個(gè)關(guān)聯(lián)詞被寫入標(biāo)簽 中作為元數(shù)據(jù)。提取出來(lái)的圖像數(shù)據(jù)被經(jīng)由通信網(wǎng)絡(luò)12發(fā)送至客戶 終端13,并且在監(jiān)視器15上顯示為搜索結(jié)果。
當(dāng)提取出多段圖像數(shù)據(jù)時(shí),圖像數(shù)據(jù)與其分?jǐn)?shù)一起發(fā)送至客戶 終端13。在客戶終端13,例如,在監(jiān)視器15上按照分?jǐn)?shù)的降序顯示 這些多段圖像數(shù)據(jù)。還可以根據(jù)它們的分?jǐn)?shù)等級(jí)將多段圖像數(shù)據(jù)分類 成組。在這種情況下,多個(gè)圖像按組并排地顯示在監(jiān)視器15上。輪 流地顯示各組的圖像。其上添加了多個(gè)關(guān)聯(lián)詞的圖像具有較高的分 數(shù),因此具有較高關(guān)聯(lián)的圖像被優(yōu)先顯示。
在第一實(shí)施例中,元數(shù)據(jù)被寫入圖像數(shù)據(jù)的標(biāo)簽。在第二實(shí)施 例中,字符串(文本數(shù)據(jù))被加入圖像數(shù)據(jù)。參考圖14、 15和16 來(lái)解釋本發(fā)明的第二實(shí)施例。
根據(jù)第二實(shí)施例的網(wǎng)絡(luò)系統(tǒng)具有服務(wù)器41,代替圖1所示的網(wǎng) 絡(luò)系統(tǒng)14的服務(wù)器11。如圖14所示,詞提取器34、計(jì)時(shí)器35等通 過(guò)數(shù)據(jù)總線27與CPU 26連接組成服務(wù)器41。詞提取器34對(duì)添加至 圖像數(shù)據(jù)的文本數(shù)據(jù)進(jìn)行分析并且提取字。注意,與第一實(shí)施例的網(wǎng) 絡(luò)系統(tǒng)14相同的組件具有相同的標(biāo)號(hào),因此省略了對(duì)其的詳細(xì)說(shuō)明。
如圖15所示,將圖像數(shù)據(jù)(輸入圖像數(shù)據(jù))及其文本數(shù)據(jù)經(jīng)由 通信I/F 30寫入RAM 28。在讀取文本數(shù)據(jù)"日本的最高峰,被全世 界認(rèn)為是日本的象征…"時(shí),詞提取器34分析該文本數(shù)據(jù)并且提取 詞"日本"、"峰"、"世界"和"象征"。作為提取詞的方法,可 采用利用詞列表的語(yǔ)形學(xué)分析。語(yǔ)形學(xué)分析是一種公知技術(shù),因此省 略對(duì)其的詳細(xì)說(shuō)明。
CPU (元數(shù)據(jù)輸入部分)26將詞提取器34所提取的詞(元數(shù)據(jù)) 輸入至記分部分32。記分部分32確定輸入詞之間或者輸入詞和添加 至累積在圖像DB 36中的圖像數(shù)據(jù)中的累積標(biāo)簽之間的分?jǐn)?shù)。
計(jì)時(shí)器35管理服務(wù)器11內(nèi)部的時(shí)間。CPU (內(nèi)容搜集器)26
在計(jì)時(shí)器35預(yù)先設(shè)置的時(shí)間從預(yù)先設(shè)置的數(shù)據(jù)搜集位置自動(dòng)地搜集
圖像數(shù)據(jù)。經(jīng)由通信I/F30搜集的圖像數(shù)據(jù)被存儲(chǔ)在RAM28中。由 此,可以在無(wú)需用戶操作的情況下將關(guān)聯(lián)詞記錄在字典DB37中。當(dāng) 然,可與第一實(shí)施例一樣地從客戶終端13接收?qǐng)D像數(shù)據(jù)。
下文中將解釋根據(jù)第二實(shí)施例的網(wǎng)絡(luò)系統(tǒng)的操作。如圖16所示, 當(dāng)計(jì)時(shí)器35被設(shè)置時(shí),作為內(nèi)容搜集器的CPU26在預(yù)先設(shè)置的時(shí)間
從預(yù)先設(shè)置的數(shù)據(jù)搜集位置自動(dòng)地搜集圖像數(shù)據(jù),并且將搜集到的圖 像數(shù)據(jù)存儲(chǔ)在RAM28中。存儲(chǔ)在RAM28中的標(biāo)簽(輸入標(biāo)簽)被讀 出至記分部分32,并且確定標(biāo)簽的分?jǐn)?shù)。
當(dāng)存儲(chǔ)在RAM28中的圖像數(shù)據(jù)具有文本數(shù)據(jù)時(shí),文本數(shù)據(jù)被讀 取至詞提取器34,并對(duì)其迸行分析以提起詞。提取出來(lái)的詞被讀出 至記分部分32。記分部分32確定輸入詞之間或者輸入詞和添加至累 積在圖像DB 36中的圖像數(shù)據(jù)中的累積標(biāo)簽之間的分?jǐn)?shù)。
當(dāng)從客戶終端13輸入用于搜索圖像數(shù)據(jù)的搜索詞時(shí),圖像搜索 部分31搜索具有文本數(shù)據(jù)且文本數(shù)據(jù)包括搜索詞及其關(guān)聯(lián)詞的圖像 數(shù)據(jù)。將找出的圖像數(shù)據(jù)從服務(wù)器41發(fā)送至客戶終端13,并將其作 為搜索結(jié)果顯示在監(jiān)視器15上。在找出多段圖像數(shù)據(jù)時(shí),可以和第 一實(shí)施例一樣,按照分?jǐn)?shù)的降序?qū)⒍鄠€(gè)圖像顯示在監(jiān)視器15上。
雖然上述實(shí)施例中的內(nèi)容信息為靜止圖像,但是內(nèi)容信息還可 以是移動(dòng)圖像、音樂(lè)、游戲、電子書、網(wǎng)頁(yè)等等。雖然上述實(shí)施例中 輸入了一段圖像數(shù)據(jù),但是也可以輸入多段圖像數(shù)據(jù)。
在上述實(shí)施例中,記分部分32確定輸入標(biāo)簽之間或輸入標(biāo)簽和 累積標(biāo)簽之間的分?jǐn)?shù)。但是,還可以僅僅確定輸入標(biāo)簽之間的分?jǐn)?shù)。 在這種情況下,無(wú)須用于累積圖像數(shù)據(jù)的圖像DB 36。
在上述實(shí)施例中,圖像搜索部分31在服務(wù)器31中的圖像DB36 中搜索圖像數(shù)據(jù)。然而,還有可能,圖像搜索部分31通過(guò)通信網(wǎng)絡(luò) 12在所有網(wǎng)站中搜索圖像數(shù)據(jù)。
在上述實(shí)施例中,評(píng)估了跳數(shù)最大為"2"的標(biāo)簽,并將其記錄 在字典DB37中。然而,跳數(shù)為"3"或跳數(shù)更大的標(biāo)簽也可被評(píng)估。 在評(píng)估具有跳數(shù)"N"的標(biāo)簽時(shí),按照如下方式設(shè)置評(píng)估值"0"跳 為"(N+1)"分,"1"跳為"N"分,"2"跳為"(N-1)"分,…, "(N-1)"跳為"2"分,"N"跳為"1"分,其中N為計(jì)數(shù)。
在上述實(shí)施例中,通過(guò)用參考值乘以根據(jù)跳數(shù)、出現(xiàn)頻率和進(jìn) 入順序的評(píng)估值來(lái)計(jì)算分?jǐn)?shù)??梢酝ㄟ^(guò)其它算數(shù)表達(dá)式來(lái)計(jì)算分?jǐn)?shù)。 例如,可以通過(guò)對(duì)各個(gè)評(píng)估值進(jìn)行相加來(lái)獲取分?jǐn)?shù)。在這種情況下, 優(yōu)選地對(duì)每個(gè)評(píng)估值進(jìn)行加權(quán)再相加。
在上述實(shí)施例中,跳數(shù)的評(píng)估值被設(shè)置成,每當(dāng)跳數(shù)增大"l", 評(píng)估值就降低"1"分。但是,跳數(shù)的增量并不需要正比于分?jǐn)?shù)的增 大,而只要滿足隨著跳數(shù)的變大,分?jǐn)?shù)增大,并且標(biāo)簽之間的關(guān)聯(lián)變小。
在上述實(shí)施例中,出現(xiàn)頻率的評(píng)估值被設(shè)置成,每當(dāng)出現(xiàn)次數(shù) 增加"1",評(píng)估值就增加"l"分。然而,出現(xiàn)頻率無(wú)需正比于分?jǐn)?shù), 而只要分?jǐn)?shù)隨著出現(xiàn)頻率的變高而變大就行。
在上述實(shí)施例中,進(jìn)入順序的評(píng)估值被設(shè)置成,每次等級(jí)變低 "1",則評(píng)估值降低"1"分。然而,進(jìn)入順序的下降并不需要正比 于分?jǐn)?shù)的下降,而只需要分?jǐn)?shù)隨著等級(jí)的降低而減小。
在上述實(shí)施例中,分?jǐn)?shù)是基于所有的跳數(shù)、出現(xiàn)頻率和進(jìn)入順 序的評(píng)估值來(lái)計(jì)算的。但是,也可以基于跳數(shù)、出現(xiàn)頻率和進(jìn)入順序 之一的評(píng)估值,或者基于跳數(shù)、出現(xiàn)頻率和進(jìn)入順序中的兩個(gè)的評(píng)估 值來(lái)計(jì)算分?jǐn)?shù)。
在上述實(shí)施例中,輸入圖像數(shù)據(jù)被暫時(shí)地存儲(chǔ)在RAM 28中,以 便對(duì)數(shù)據(jù)施加各種處理。在處理之后,圖像數(shù)據(jù)可被累積在圖像DB36 中。
在上述實(shí)施例中,累積標(biāo)簽和該標(biāo)簽添加的次數(shù)被存儲(chǔ)在數(shù)據(jù) 表格中的HDD 29中,并且所有累積標(biāo)簽的出現(xiàn)頻率被計(jì)數(shù)。然而, 例如可以將標(biāo)簽限制為可以在跳數(shù)"2"的范圍內(nèi)從用于對(duì)出現(xiàn)頻率 進(jìn)行計(jì)數(shù)的輸入標(biāo)簽中追蹤的那些標(biāo)簽。
具體地說(shuō),圖像搜索部分31在圖像DB 36中搜索具有與輸入標(biāo) 簽相同的標(biāo)簽的累積圖像數(shù)據(jù)。取出的圖像數(shù)據(jù)及其跳數(shù)為"1"的 累積標(biāo)簽被存儲(chǔ)在R認(rèn)28中。圖像搜索部分31還在圖像DB 36中搜
索具有與存儲(chǔ)在RAM28中的跳數(shù)為"1"的標(biāo)簽相同的標(biāo)簽的累積圖 像數(shù)據(jù)。取出的圖像數(shù)據(jù)及其跳數(shù)為"2"的累積標(biāo)簽被存儲(chǔ)在RAM 28 中。跳數(shù)計(jì)數(shù)器38對(duì)存儲(chǔ)在RAM 28中的輸入標(biāo)簽以及跳數(shù)為"1" 或"2"的累積標(biāo)簽進(jìn)行計(jì)數(shù)。由此,計(jì)算出了可以在跳數(shù)"2"的范 圍內(nèi)從輸入標(biāo)簽中追蹤到的標(biāo)簽的出現(xiàn)頻率。注意,累積標(biāo)簽被被限 制為可以在跳數(shù)"0"或"1"或"3"或更大的跳數(shù)的范圍內(nèi)追蹤到 的標(biāo)簽。 '
在將圖像數(shù)據(jù)作為搜索結(jié)果顯示在監(jiān)視器15上時(shí),可以對(duì)累積 圖像數(shù)據(jù)進(jìn)行分類。可依次存儲(chǔ)圖像數(shù)據(jù),從而使得具有較高分?jǐn)?shù)的 作為標(biāo)簽的關(guān)聯(lián)詞的圖像數(shù)據(jù)優(yōu)先顯示。圖像數(shù)據(jù)還可以被分類成使 得具有較多關(guān)聯(lián)詞的圖像數(shù)據(jù)被優(yōu)先顯示。可以按照任何方式來(lái)在監(jiān) 視器15上顯示分類后的圖像數(shù)據(jù),例如從上到下或從中間到周邊, 從而恰當(dāng)?shù)仫@示出它們的分類順序。
在第二實(shí)施例中,詞提取器34通過(guò)分析添加至圖像數(shù)據(jù)的文本 數(shù)據(jù)來(lái)提取詞。但是,被分析的文本數(shù)據(jù)并不限于這些被添加至圖像 數(shù)據(jù)的文本數(shù)據(jù)。例如,通過(guò)鍵盤輸入而添加的元數(shù)據(jù)可包括在內(nèi)。
本發(fā)明可以進(jìn)行各種改變和修改,并且這些改變和修改被理解 為落入本發(fā)明的范圍。
權(quán)利要求
1.一種用于產(chǎn)生關(guān)聯(lián)詞字典的裝置,該關(guān)聯(lián)詞字典存儲(chǔ)了詞間的關(guān)聯(lián),所述裝置包括元數(shù)據(jù)輸入部分,用于輸入添加至內(nèi)容信息的多段元數(shù)據(jù);記分部分,用于確定代表了所述元數(shù)據(jù)之間的關(guān)聯(lián)程度的分?jǐn)?shù);以及關(guān)聯(lián)詞記錄部分,用于將所述元數(shù)據(jù)的組合和所述分?jǐn)?shù)相互關(guān)聯(lián)地記錄在所述關(guān)聯(lián)詞字典中。
2. 如權(quán)利要求l所述的裝置,其中所述記分部分確定所述輸入 的元數(shù)據(jù)和所述關(guān)聯(lián)詞字典中的元數(shù)據(jù)之間的所述分?jǐn)?shù)。
3. 如權(quán)利要求2所述的裝置,進(jìn)一步包括 內(nèi)容搜索部分,用于搜索與所述輸入的元數(shù)據(jù)具有相同元數(shù)據(jù)的內(nèi)容信息,其中所述記分部分確定所述輸入的元數(shù)據(jù)和添加至搜索到的內(nèi)容信 息的元數(shù)據(jù)之間的所述分?jǐn)?shù)。
4. 如權(quán)利要求l所述的裝置,進(jìn)一步包括跳數(shù)計(jì)數(shù)器,用于計(jì)算可經(jīng)由共同的元數(shù)據(jù)進(jìn)行追蹤的內(nèi)容信 息的跳數(shù),其中所述記分部分基于所述跳數(shù)來(lái)確定所述分?jǐn)?shù)。
5. 如權(quán)利要求l所述的裝置,其中所述記分部分基于所述元數(shù)據(jù)的出現(xiàn)頻率來(lái)確定所述分?jǐn)?shù)。
6. 如權(quán)利要求l所述的裝置,其中所述記分部分基于所述元數(shù) 據(jù)的等級(jí)來(lái)確定所述分?jǐn)?shù)。
7. 如權(quán)利要求l所述的裝置,進(jìn)一步包括 詞提取器,用于從字符串中提取詞,其中所述元數(shù)據(jù)輸入部分將所提取的詞作為元數(shù)據(jù)輸入。
8. 如權(quán)利要求l所述的裝置,進(jìn)一步包括內(nèi)容搜集器,用于從預(yù)先設(shè)置的數(shù)據(jù)搜集位置自動(dòng)地搜集內(nèi)容<曰息,其中所述元數(shù)據(jù)輸入部分輸入添加至所搜集的內(nèi)容信息的元數(shù)據(jù)。
9. 如權(quán)利要求l所述的裝置,進(jìn)一步包括內(nèi)容累積部分,用于對(duì)其中添加了從所述元數(shù)據(jù)輸入部分輸入 的所述元數(shù)據(jù)的內(nèi)容信息進(jìn)行累積。
10. —種用于產(chǎn)生關(guān)聯(lián)詞字典的方法,該關(guān)聯(lián)詞字典存儲(chǔ)了詞 間的關(guān)聯(lián),所述方法包括以下步驟輸入添加至內(nèi)容信息的多段元數(shù)據(jù);確定代表了所述元數(shù)據(jù)之間的關(guān)聯(lián)程度的分?jǐn)?shù);以及 將所述元數(shù)據(jù)的組合和所述分?jǐn)?shù)相互關(guān)聯(lián)地記錄在所述關(guān)聯(lián)詞 字典中。
11. 一種用于產(chǎn)生關(guān)聯(lián)詞字典的計(jì)算機(jī)程序,該關(guān)聯(lián)詞字典存 儲(chǔ)了詞間的關(guān)聯(lián),所述程序包括以下步驟輸入添加至內(nèi)容信息的多段元數(shù)據(jù); 確定代表了所述元數(shù)據(jù)之間的關(guān)聯(lián)的分?jǐn)?shù);以及 將所述元數(shù)據(jù)的組合和所述分?jǐn)?shù)相互關(guān)聯(lián)地記錄在所述關(guān)聯(lián)詞 字典中。
12. —種內(nèi)容搜索裝置,包括元數(shù)據(jù)輸入部分,用于輸入添加至內(nèi)容信息的多段元數(shù)據(jù); 記分部分,用于確定代表了所述元數(shù)據(jù)之間的關(guān)聯(lián)程度的分?jǐn)?shù);關(guān)聯(lián)詞記錄部分,用于將所述元數(shù)據(jù)的組合和所述分?jǐn)?shù)相互關(guān) 聯(lián)地記錄在所述關(guān)聯(lián)詞字典中;內(nèi)容累積部分,用于對(duì)其中添加了從所述元數(shù)據(jù)輸入部分輸入 的所述元數(shù)據(jù)的內(nèi)容信息進(jìn)行累積;搜索詞輸入部分,用于輸入搜索詞;關(guān)聯(lián)詞搜索部分,用于從所述關(guān)聯(lián)詞字典中搜索關(guān)聯(lián)詞;以及內(nèi)容搜索部分,用于從所述內(nèi)容累積部分中搜索具有所述搜索 詞和至少一個(gè)作為所述元數(shù)據(jù)的所述關(guān)聯(lián)詞的內(nèi)容信息。
13.如權(quán)利要求12所述的內(nèi)容搜索裝置,其中,當(dāng)取出多段內(nèi) 容信息時(shí),根據(jù)所述分?jǐn)?shù),按照優(yōu)先級(jí)遞減的順序?qū)⑺龆喽蝺?nèi)容信 息顯示在所述搜索詞輸入部分的監(jiān)視器上。
全文摘要
來(lái)自客戶終端的圖像數(shù)據(jù)及其標(biāo)簽被發(fā)送至服務(wù)器。在服務(wù)器,輸入標(biāo)簽之間的或者輸入標(biāo)簽和添加至累積在圖像數(shù)據(jù)庫(kù)中的圖像數(shù)據(jù)的累積的標(biāo)簽之間的跳數(shù)被計(jì)算出來(lái)。此外,計(jì)算出輸入標(biāo)簽的出現(xiàn)頻率。并且,計(jì)算出輸入標(biāo)簽的進(jìn)入順序。當(dāng)計(jì)算出跳數(shù)、出現(xiàn)頻率和進(jìn)入順序后,與計(jì)算出來(lái)的值相對(duì)應(yīng)的評(píng)估值和參考值一起被用來(lái)計(jì)算分?jǐn)?shù)。分?jǐn)?shù)和標(biāo)簽組合一起被記錄在圖像數(shù)據(jù)庫(kù)中。
文檔編號(hào)G06F17/30GK101350029SQ20081013471
公開(kāi)日2009年1月21日 申請(qǐng)日期2008年7月18日 優(yōu)先權(quán)日2007年7月18日
發(fā)明者宮坂恭正, 寺橫素 申請(qǐng)人:富士膠片株式會(huì)社