欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

內(nèi)容檢索設(shè)備和方法

文檔序號:6444131閱讀:172來源:國知局
專利名稱:內(nèi)容檢索設(shè)備和方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種內(nèi)容檢索設(shè)備和方法,用于檢索一個內(nèi)容描述,其中描述的是多媒體內(nèi)容的內(nèi)容(以下稱為內(nèi)容),諸如視頻、音頻和文本。
背景技術(shù)
作為用于檢索和過濾多媒體內(nèi)容的描述接口的MPEG-7已經(jīng)被標準化,其中所述多媒體內(nèi)容包括傳統(tǒng)上不能檢索的視頻和音頻。因此,有可能基于由W3C標準化的XML方案利用描述概要來建立各種內(nèi)容描述。因此,MPEG-7的使用即將在廣播、蜂窩通信、因特網(wǎng)等中開始。
下面說明利用MPEG-7的內(nèi)容檢索的處理。MPEG-7描述了在對每個內(nèi)容描述檢索內(nèi)容中使用的觀點(viewpoint)(關(guān)鍵字)(例如,日本公開專利公報2001-160066)。當一個客戶輸入所期望的術(shù)語(關(guān)鍵字)來作為對于內(nèi)容描述的請求詢問的時候,將由客戶輸入的請求詢問中使用的術(shù)語與提前存儲的每個內(nèi)容描述中描述的觀點相比較。然后,檢索其中描述與請求詢問相同的觀點的內(nèi)容描述。因此執(zhí)行客戶請求的內(nèi)容描述的檢索。
在MPEG-7中,可以向內(nèi)容描述分配多個觀點。因此有可能向內(nèi)容描述分配以不同語言描述的多個觀點,于是,當客戶執(zhí)行內(nèi)容檢索的時候,客戶能夠使用以不同語言表示的術(shù)語來作為在請求詢問中使用的術(shù)語。例如,當輸入名稱Yamada作為用于請求詢問的術(shù)語的時候,有可能以英語輸入“Yamada”或以日語漢字輸入“○○”。換句話說,MPEG-7支持多語言檢索功能。另外,假定“○○”是表示英語的“Yamada”的日語漢字。
而且,在MPEG-7中,可以向內(nèi)容描述分配多個具有相同含義的數(shù)據(jù)作為觀點。因此客戶有可能在執(zhí)行內(nèi)容檢索中使用具有相同含義的不同術(shù)語來作為用于請求詢問中的術(shù)語。例如,當輸入名稱YAMADA作為請求詢問的時候,有可能輸入英語的“Yamada”、作為別名的“Yama”、日語漢字的“○○”或日語平假名字符的“△△△”。另外,假定“△△△”是表示英語的“Yamada”的日語平假名字符。
但是,在MPEG-7中,當增加對應(yīng)的語言的數(shù)量的時候,有必要在內(nèi)容中描述以不同語言描述的多個觀點。換句話說,在MPEG-7中,隨著對應(yīng)語言數(shù)量的增加,要建立的內(nèi)容描述的數(shù)據(jù)量得到增加。
類似地,在MPEG-7中,當對應(yīng)術(shù)語(詞匯)的數(shù)量增加的時候,有必要在內(nèi)容中描述具有相同含義的多個術(shù)語觀點。換句話說,在MPEG-7中,隨著對應(yīng)術(shù)語數(shù)量的增加,要建立的內(nèi)容描述的數(shù)據(jù)量得到增加。
如上所述,在MPEG-7中,增加了對應(yīng)語言數(shù)量和對應(yīng)術(shù)語數(shù)量,由此增加了術(shù)語的表達形式的數(shù)量,并增加了內(nèi)容的冗余程度。結(jié)果,由于術(shù)語的表達形式的數(shù)量的增加而導(dǎo)致性能價格比惡化,并且難于管理內(nèi)容。

發(fā)明內(nèi)容
本發(fā)明的目的在于當增加術(shù)語表達形式數(shù)量的時候防止增加內(nèi)容的冗余程度。
為了實現(xiàn)上述目的,在本發(fā)明中,使用其中在每個內(nèi)容描述中包括的一個術(shù)語與另一個表示所述術(shù)語但具有不同表達形式的術(shù)語相關(guān)聯(lián)的一種術(shù)語交換描述,在所述內(nèi)容描述中包括的所述術(shù)語與所述另一個具有不同表達形式的術(shù)語相交換。


下面通過參照附圖的說明,本發(fā)明的上述和其他目的和特點將會變得更加清楚,其中一個示例通過舉例的方式來說明,其中圖1是圖解按照本發(fā)明的第一個實施例的內(nèi)容檢索設(shè)備的配置的方框圖;圖2是示出按照第一實施例的內(nèi)容描述的視圖;圖3是示出按照第一實施例的內(nèi)容描述的另一個視圖;圖4是示出按照第一實施例的術(shù)語交換描述的描述定義的視圖;圖5是示出按照第一實施例的用于術(shù)語交換描述的術(shù)語定義的MPEG-7標準規(guī)范的數(shù)據(jù)類型的視圖;圖6是示出按照第一實施例的術(shù)語交換描述的示例的視圖;
圖7是解釋按照第一實施例的內(nèi)容檢索設(shè)備的操作的流程圖;圖8是解釋按照本發(fā)明的第二實施例的內(nèi)容檢索設(shè)備的操作的流程圖;圖9是示出按照第二實施例的交換內(nèi)容描述的視圖;圖10是解釋按照本發(fā)明的第三實施例的內(nèi)容檢索設(shè)備的操作的流程圖;圖11是解釋按照本發(fā)明的第四實施例的內(nèi)容檢索設(shè)備的操作的流程圖;圖12是解釋按照本發(fā)明的第五實施例的內(nèi)容檢索設(shè)備的配置的流程圖;圖13是示出按照第五實施例的用于術(shù)語交換描述的描述定義的視圖;圖14是示出按照第五實施例的術(shù)語交換描述的一個示例的視圖;圖15是示出按照第五實施例的內(nèi)容描述的視圖;圖16是示出按照第五實施例的另一個內(nèi)容描述的視圖;圖17是示出按照第五實施例的另一個內(nèi)容描述的視圖;圖18是示出按照第五實施例的另一個內(nèi)容描述的視圖;圖19是示出按照第五實施例的詢問表達(query expression)的視圖;圖20是示出按照第五實施例的詢問結(jié)果的視圖;圖21是示出按照第五實施例的另一個詢問表達的視圖;圖22是示出按照第五實施例的另一個詢問結(jié)果的視圖;圖23是按照第五實施例的另一個詢問表達的視圖;圖24是示出按照本發(fā)明的第六實施例的術(shù)語交換描述的示例的視圖;圖25是示出按照第六實施例的內(nèi)容描述的視圖;和圖26是按照第六實施例的另一個內(nèi)容描述的視圖。
具體實施例方式
(第一實施例)下面說明按照本發(fā)明的第一實施例的內(nèi)容檢索設(shè)備。首先,參照圖1說明在第一實施例中的內(nèi)容檢索設(shè)備的配置。圖1是在第一實施例中的內(nèi)容檢索設(shè)備的方框圖。
內(nèi)容檢索設(shè)備10包括媒體連接部分100,它作為通信裝置,經(jīng)由諸如因特網(wǎng)的網(wǎng)絡(luò)20與其他媒體通信。利用媒體連接部分100,內(nèi)容檢索設(shè)備10經(jīng)由網(wǎng)絡(luò)20與存儲多個內(nèi)容描述32的內(nèi)容描述服務(wù)器30通信,并且從內(nèi)容描述服務(wù)器30獲得內(nèi)容描述32。使用媒體連接部分100,內(nèi)容檢索設(shè)備10通過網(wǎng)絡(luò)20與存儲了多個內(nèi)容33的內(nèi)容服務(wù)器34通信,并從內(nèi)容服務(wù)器34獲得內(nèi)容33。
內(nèi)容檢索設(shè)備10還包括存儲從內(nèi)容描述服務(wù)器30獲得的內(nèi)容描述的存儲部分101。圖2和圖3示出了內(nèi)容描述32的示例。圖2和圖3每個是示出按照第一實施例的內(nèi)容描述的視圖。
可以從附圖中看出,所述內(nèi)容描述基于ISO/IEC 15938-2和ISO/IEC15938-5(MPEG-7標準規(guī)范)。如附圖中的201a所示,在圖2中所示的內(nèi)容描述32a使用英語作為語言。于是,如圖中的202a所示,一個觀點被描述為英語的“Yamada”。而且,如圖中的203a所示,也描述了所述觀點的重要程度。
如圖中的201b所示,圖3所示的內(nèi)容描述32b使用日語來作為語言。因此,如圖中的202b所示,一個觀點被描述為日語漢字的“○○”。而且,如圖中的203b所示,也描述了所述觀點的重要程度。
存儲部分101存儲術(shù)語交換描述31以交換術(shù)語。在此說明術(shù)語交換描述31。用于術(shù)語交換描述31的描述定義(XML概要(schema)定義)21如圖4所示。用于術(shù)語交換描述31的描述定義21的MPEG-7標準規(guī)范的數(shù)據(jù)類型22如圖5所示。如圖中的400所示,術(shù)語交換描述31具有表示術(shù)語的<Term>(<術(shù)語>)要素。對于<Term>要素的值,有可能描述多個術(shù)語,所述術(shù)語以多種語言對同一詞匯描述。并且/或者它以不同的方式表達同一含義。
如圖中的401所示,所述<Term>要素具有表示在術(shù)語之間的相似程度的一個相似性(similarity)屬性。相似性屬性的值1.0表示簡單的術(shù)語交換。當擴展一個詞匯的時候,小于1.0被描述為相似性屬性的一個值,并且以所述屬性值描述相似程度。隨著詞匯的相似程度的提高,相似性屬性的值被提高。
而且,如圖中的402所示,<Term>要素具有一個xml1ang屬性,并且xmllang屬性的值描述語言的類型。
圖6示出了術(shù)語交換描述31的示例。在圖6的示例中,由601所示的<Term>要素描述一個英語的術(shù)語“Yamada”,還描述作為類似程度的1.0。由602所示的<Term>要素描述一個日語漢字的術(shù)語“○○”,還描述作為類似程度的1.0。由603所示的<Term>要素描述一個英語的術(shù)語“Yama”,還描述作為類似程度的0.7。由601-603所示的術(shù)語被包括在一個<術(shù)語交換>(<TermExchange>)要素中。換句話說,英語描述的“Yamada”、日語描述的“○○”和作為別名的“Yama”被描述為彼此相關(guān)的術(shù)語。“Yamada”和“○○”的相似程度1.0表示這些數(shù)據(jù)簡單地被交換?!癥ama”具有相似程度0.7,因此表示與“Yamada”和“○○”的不同表達形式。
再次參見圖1,將進一步描述內(nèi)容檢索設(shè)備10。內(nèi)容檢索設(shè)備10包括輸入部分102,如用于輸入請求詢問的術(shù)語的鍵盤。作為從輸入部分102輸入的術(shù)語的請求詢問被經(jīng)由輸入控制部分103和存儲器108輸出到檢索部分104。存儲器108是檢索部分104的工作存儲器。
檢索部分104從內(nèi)容描述32檢索具有與所輸入的請求詢問對應(yīng)的觀點的段,將所檢索的段組合來建立一個摘要,并向輸出控制部分105輸出摘要。而且,有可能檢索部分104檢測具有與所輸入的請求詢問對應(yīng)的一個觀點的內(nèi)容描述32以輸出到輸出控制部分105。另外,下面將具體描述在檢索部分104中的內(nèi)容檢索處理。
輸出控制部分105輸出包括所檢索的段并分別從存儲部分101向監(jiān)視器106和揚聲器107輸出的內(nèi)容33的摘要或內(nèi)容33的視頻和音頻數(shù)據(jù)(信號)。監(jiān)視器106顯示內(nèi)容33的摘要或內(nèi)容33的視頻,而揚聲器107輸出內(nèi)容33的摘要或內(nèi)容33的音頻。
在內(nèi)容檢索設(shè)備10中的每個處理部分與系統(tǒng)總線109連接。
下面參照圖7說明內(nèi)容檢索設(shè)備10的內(nèi)容檢索操作。圖7是解釋按照第一實施例的內(nèi)容檢索設(shè)備的操作的流程圖。
在內(nèi)容檢索設(shè)備10中,當從輸入部分102輸入一個請求詢問(RQ)的時候,所輸入的請求詢問(RQ)經(jīng)由輸入控制部分103被讀取并被存儲在存儲器108中(S1001),并且檢索部分104開始檢索。
首先,檢索部分104識別在存儲器108中的請求詢問(RQ)的描述語言(RQL)(S1002)。然后,檢索部分104讀取存儲在存儲部分101中的內(nèi)容描述32(CD)(S1003),識別每個內(nèi)容描述32(CD)的描述語言(CDL),并比較請求詢問語言(RQL)和內(nèi)容描述語言(CDL)(S1005)。
當請求詢問語言(RQL)與內(nèi)容描述語言(CDL)相同時,檢索部分104利用請求詢問(RQ)對內(nèi)容描述32(CD)執(zhí)行檢索處理。具體地,在S1006,檢索部分104從內(nèi)容描述32(CD)檢索與請求詢問(RQ)具有相同觀點的段(segment),并且組合所檢索的段以建立摘要。
另外,有可能在S1006,與請求詢問(RQ)具有相同觀點的內(nèi)容描述32(CD)被簡單地檢索,并且被輸出而不建立摘要。
同時,當請求詢問語言(RQL)與內(nèi)容描述語言(CDL)不同時,檢索部分104執(zhí)行內(nèi)容描述術(shù)語交換處理(S1007),依序執(zhí)行檢索處理,并向監(jiān)視器106和揚聲器107輸出詢問結(jié)果(S1006)。
下面具體描述內(nèi)容描述術(shù)語交換處理(S1007)。檢索部分104識別請求詢問語言(RQL)作為檢索中使用的交換目標語言(S1008)。檢索部分104讀取存儲在存儲部分101中的術(shù)語交換描述31(TD)(S1009),引用在術(shù)語交換描述31(TD)中描述的一個<Term>要素,將從存儲部分101讀取的內(nèi)容描述32(CD)與具有以交換目標語言描述的一個術(shù)語的新內(nèi)容描述進行交換,因此執(zhí)行內(nèi)容描述術(shù)語交換(S1010)。具體地,檢索部分104按照作為交換目標語言的請求詢問語言(RQL)轉(zhuǎn)換在內(nèi)容描述32中的一個xmllang要素,將在內(nèi)容描述32中描述的觀點的語言轉(zhuǎn)換為請求詢問語言(RQL),因此建立一個新的內(nèi)容描述。
例如,假定請求詢問語言(RQL)是日語,并且在內(nèi)容描述32a中的內(nèi)容描述語言(CDL)是英語描述的,在內(nèi)容術(shù)語交換處理的S1008中,日語被識別為交換目標語言(S1008),并且利用術(shù)語描述(S1009),將所述內(nèi)容與具有以作為交換目標語言的日語描述的術(shù)語的內(nèi)容描述32b交換以便將所讀取的內(nèi)容描述32(CD)的描述語言(CDL)轉(zhuǎn)換為日語,以便建立新的內(nèi)容描述(S1010)。
在S1006中,檢索部分104在分配了作為請求詢問的同一觀點的新的內(nèi)容描述中檢索段,組合所述段以建立摘要,并輸出所述摘要。另外,有可能檢索分配了作為請求詢問的相同觀點的新的內(nèi)容描述。
如上所述,按照第一實施例,當請求詢問語言與內(nèi)容描述語言不同的時候,檢索部分104使用術(shù)語交換描述31,將用于檢索的內(nèi)容描述的語言轉(zhuǎn)換為請求詢問的語言以建立新的內(nèi)容描述,并且因此對與請求詢問對應(yīng)的新的內(nèi)容描述執(zhí)行檢索。結(jié)果,使得多語言檢索、即在請求詢問中使用多種語言,成為可能。而且,因為消除了在內(nèi)容種以多種語言描述觀點的需要,因此抑制了內(nèi)容描述中的冗余,并且因此改善了性能價格比。
在第一實施例中,術(shù)語交換描述31和內(nèi)容描述32被分別描述,由此有可能分別管理術(shù)語和內(nèi)容,這簡化了對術(shù)語交換描述31和內(nèi)容描述32的管理。
按照第一實施例,有可能根據(jù)MPEG-7標準規(guī)范描述內(nèi)容描述32,并且根據(jù)MPEG-7標準規(guī)范的數(shù)據(jù)類型22來描述術(shù)語交換描述31的描述定義(XML概要定義)21。因此,根據(jù)MPEG-7描述術(shù)語交換描述31和內(nèi)容描述32提供通用的術(shù)語交換描述31和內(nèi)容描述32。
(第二實施例)在本發(fā)明的第二實施例中,利用術(shù)語交換描述31,其中一個單個術(shù)語(單個使用術(shù)語)被描述為觀點的內(nèi)容描述與其中具有同一含義的多種表達形式的術(shù)語(同義詞;多樣術(shù)語)被描述為觀點的內(nèi)容描述相交換。
下面說明按照本發(fā)明的第二實施例的內(nèi)容檢索設(shè)備。在第二實施例中的內(nèi)容檢索設(shè)備的配置與按照第一實施例的內(nèi)容檢索設(shè)備10的配置相同。因此,省略對按照第二實施例的內(nèi)容檢索設(shè)備的描述。術(shù)語交換描述31也與在第一實施例中的相同。
下面參照圖8說明按照第二實施例的內(nèi)容檢索設(shè)備中的檢索處理。圖8是解釋按照第二實施例的內(nèi)容檢索設(shè)備的操作的流程圖。
在內(nèi)容檢索設(shè)備10中,當從輸入部分102輸入一個請求詢問(RQ)的時候,所輸入的請求詢問(RQ)經(jīng)由輸入控制部分103被讀取和存儲在存儲器108中,并且檢索部分104開始檢索。
首先,檢索部分104讀取存儲在存儲部分101中的內(nèi)容描述32(CD)(S1102),并且利用術(shù)語交換描述31切換到內(nèi)容描述術(shù)語交換處理(S1103),用于將以單個術(shù)語(單個使用術(shù)語)描述的內(nèi)容描述32與以表達為具有同一含義的不同詞匯(同義詞)的術(shù)語(多樣術(shù)語)描述的內(nèi)容描述相交換。
檢索部分104識別通過一個請求詢問(RQ)指定或預(yù)先設(shè)置的交換目標詞匯(S1104)。然后,檢索部分104從存儲部分101讀取術(shù)語交換描述31(TD),并且利用所讀取的術(shù)語交換描述31(TD)來執(zhí)行內(nèi)容描述術(shù)語交換處理,用于建立具有下述的術(shù)語(同義詞)的新的內(nèi)容描述,所述術(shù)語以不同的方式來表示在內(nèi)容描述32中描述的觀點(S1006)。
具體而言,在S1106中,檢索部分104識別在所述請求詢問(RQ)中指定的交換目標詞匯和相似程度。然后,利用對于在術(shù)語交換描述31中用于交換的多個候選術(shù)語中的“以交換目標詞匯的語言并且對應(yīng)于指定的相似程度的術(shù)語”的候選術(shù)語,檢索部分104將單個使用的術(shù)語的觀點與其中每個是“以交換目標詞匯的語言并且對應(yīng)于指定的相似程度的術(shù)語”的同義詞(多樣術(shù)語)的觀點相交換,并且因此將具有單個使用的術(shù)語的觀點的交換內(nèi)容描述32與具有多樣術(shù)語的觀點的內(nèi)容描述相交換。
當假定在一個請求詢問(RQ)中指定或預(yù)先設(shè)置的交換目標詞匯的語言和相似程度分別是日語和英語與0.6或更多的時候,利用對于“日語和0.6或更多的相似程度”或“英語和0.6或更多的相似程度”的候選術(shù)語,將單個使用術(shù)語的觀點與多樣術(shù)語(同義詞)的觀點相交換,并且具有單個使用術(shù)語的觀點的內(nèi)容描述32與具有多樣術(shù)語的觀點的內(nèi)容描述相交換,因此執(zhí)行內(nèi)容描述術(shù)語交換。
例如,當利用圖6所示的術(shù)語交換描述31對圖2所示的內(nèi)容描述32a或圖3所示的內(nèi)容描述32b(每個具有一個單個使用術(shù)語)執(zhí)行內(nèi)容描述交換的時候,獲得圖9所示的內(nèi)容描述34(帶有同義詞;多樣術(shù)語)。可以從圖中看到,“Yamada”被描述為在內(nèi)容32a中由seg0指示的段中的觀點,而“○○”被描述為在內(nèi)容32b中由seg0指示的段中的觀點,因此單個術(shù)語被描述為觀點。相反,在圖9所示的內(nèi)容描述34中由seg0指示的段中描述了日語或英語的、并且具有對應(yīng)于在術(shù)語交換描述31中描述的術(shù)語中的“Yamada”或“○○”的0.6或更多的相似程度的“Yamada”、“○○”和“Yama”。
另外,雖然在這個實施例中由請求詢問(RQ)來指定交換目標詞匯的語言,但是這樣的語言可以被預(yù)先設(shè)置。
檢索部分104執(zhí)行內(nèi)容描述術(shù)語交換處理(S1103),并隨后利用所輸入的請求詢問對通過執(zhí)行內(nèi)容描述交換處理產(chǎn)生的新的內(nèi)容描述執(zhí)行檢索處理(S1107)。另外,在S1107中的檢索處理與按照第一實施例的在步驟S1006中的相同,省略其具體的描述。
以這種方式,檢索部分104輸出通過利用請求詢問對交換的新內(nèi)容描述34執(zhí)行檢索而獲得的結(jié)果。
如上所述,按照第二實施例,因為提供了術(shù)語交換描述31,當輸入的請求詢問與觀點不同的時候,可以按照術(shù)語交換描述在將要檢索的內(nèi)容描述中的觀點與不同表達形式(詞匯;同義詞)的至少一個術(shù)語相交換之后執(zhí)行檢索,因此使能了模糊內(nèi)容檢索。而且,由于不要求描述在內(nèi)容中的多個觀點,因此抑制了內(nèi)容描述的冗余,因此改善了性能價格比。
而且,在描述上術(shù)語交換描述與內(nèi)容描述相分離,其中有可能分別管理術(shù)語和內(nèi)容。
(第三實施例)在本發(fā)明的第三實施例中,利用術(shù)語交換描述31,將請求詢問的語言轉(zhuǎn)換為在內(nèi)容描述中的觀點的語言以執(zhí)行檢索。然后,在所檢索的內(nèi)容描述中的觀點被轉(zhuǎn)換為詢問結(jié)果的語言中的一種。
下面描述按照本發(fā)明的第三實施例的內(nèi)容檢索設(shè)備。在第三實施例中的內(nèi)容檢索設(shè)備的配置與按照第一實施例的內(nèi)容檢索設(shè)備10相同。因此,省略對按照第三實施例的內(nèi)容檢索設(shè)備的描述。術(shù)語交換描述31也與第一實施例中相同。
下面參照圖10說明按照第三實施例的內(nèi)容檢索設(shè)備中的檢索處理。圖10是解釋按照第三實施例的內(nèi)容檢索設(shè)備的操作的流程圖。
在內(nèi)容檢索設(shè)備10中,當從輸入部分102輸入請求詢問(RQ)的時候,所輸入的請求詢問(RQ)經(jīng)由輸入控制部分103被讀取和存儲在存儲器108中(S1201),并且檢索部分104開始檢索。
首先,檢索部分104識別在存儲器108中的請求詢問(RQ)的描述語言(RQL)(S1202)。然后,檢索部分104讀取存儲在存儲部分101中的內(nèi)容描述32(S1203),識別每個內(nèi)容描述32(CD)的描述語言(CDL)(S1204),并且將請求詢問語言(RQL)與內(nèi)容描述語言(CDL)相比較(S1205)。
當請求詢問語言(RQL)與內(nèi)容描述語言(CDL)相同時,檢索部分104對內(nèi)容描述32(CD)執(zhí)行檢索請求詢問(RQ)處理(S1206)。另外,在S1206中的檢索處理與在第一實施例中的S1006中的相同,因此省略其具體描述。
同時,當請求詢問語言(RQL)與內(nèi)容描述語言(CDL)不同的時候,檢索部分104執(zhí)行請求詢問術(shù)語交換處理(S1207),并且隨后執(zhí)行檢索處理(S1206)。
下面描述請求詢問術(shù)語交換處理(S1207)。檢索部分104識別內(nèi)容描述32的語言(CDL)作為用于檢索的交換目標語言(S1208)。檢索部分104讀取存儲在存儲部分101中的術(shù)語交換描述31(TD)(S1209)。
然后,檢索部分104引用在術(shù)語交換描述31(TD)中描述的<Term>要素,將所述術(shù)語與另一個術(shù)語交換,并且以所交換的另一個術(shù)語作為新的請求詢問(RQ)來使用請求詢問(S1210),所述另一個術(shù)語具有與以請求詢問(RQ)的描述語言(RQL)描述的術(shù)語相同的含義并且以內(nèi)容描述32的描述語言(CDL)被描述。
例如,當假定請求詢問語言(RQL)是日語并且內(nèi)容描述32的語言(CDL)是英語的時候,在請求詢問術(shù)語交換處理的S1207中,CDL(英語)被識別為交換目標語言(S1208),使用從存儲部分101讀取的術(shù)語交換描述31(TD)(S1209),并且以描述語言(RQL=日語)的請求詢問(RQ)與以作為交換目標語言的英語描述的請求詢問相交換,因此執(zhí)行請求詢問語言交換(S1210)。
利用在S1210交換的新的請求詢問,檢索部分104對內(nèi)容描述執(zhí)行檢索處理(S1206)。
然后,由于在S1206檢索的響應(yīng)詢問(RS)的語言是內(nèi)容描述語言(CDL)并且不同于作為用戶可以明白的輸入語言的請求詢問語言(RQL),因此檢索部分104切換到用于將響應(yīng)詢問(RS)的語言轉(zhuǎn)換為請求詢問語言(RQL)的處理。
為了確定是否詢問結(jié)果(RS)的語言與請求詢問語言(RQL)相同,檢索部分104將請求詢問語言(RQL)與內(nèi)容描述語言(CDL)相比較(S1211)。當請求詢問語言(RQL)與內(nèi)容描述語言(CDL)相同時,以與請求詢問語言相同的語言來描述響應(yīng)詢問(RS)。換句話說,以用戶使用的相同語言來描述響應(yīng)詢問(RS),不執(zhí)行語言交換,并且響應(yīng)詢問(RS)被輸出以完成處理。
同時,當請求詢問語言(RQL)不同于內(nèi)容描述語言(CDL)的時候,要求以與作為用戶明白的語言的請求詢問語言(RQL)相同的語言來描述響應(yīng)詢問(RS)。然后,檢索部分104切換到響應(yīng)詢問術(shù)語交換處理(S1212)。
在響應(yīng)詢問術(shù)語交換處理的S1212中,檢索部分104讀取通過以內(nèi)容描述語言(CDL)描述的請求詢問執(zhí)行對內(nèi)容描述32的檢索而獲得的響應(yīng)詢問(RS)(S1213),識別響應(yīng)詢問(RS)的描述語言(RSL)(S1214),進一步識別請求詢問語言(RQL)作為交換目標語言(S1215),從存儲部分101讀取術(shù)語交換描述31(TD)(S1216),并且利用術(shù)語交換描述31來執(zhí)行響應(yīng)詢問語言交換,用于將響應(yīng)詢問(RS)的響應(yīng)詢問語言(RSL)轉(zhuǎn)換為作為交換目標語言的請求詢問語言(RQL)(S1217)。
例如,在響應(yīng)詢問術(shù)語交換處理的S1212中,當假定內(nèi)容描述語言(CDL)是英語并且響應(yīng)詢問語言(RSL)和請求詢問語言(RQL)是日語的時候,檢索部分104識別響應(yīng)詢問語言(RSL)為日語,進一步識別RQL(日語)為交換目標語言,并且利用從存儲部分101讀取的術(shù)語交換描述31(TD)將以內(nèi)容描述語言(CDL=英語)描述的響應(yīng)詢問(RS)與以作為交換目標語言的日語描述的響應(yīng)詢問相交換,因此執(zhí)行響應(yīng)詢問語言交換。
檢索部分104輸出從響應(yīng)詢問語言交換得到的響應(yīng)詢問(RS)。
如上所述,按照第三實施例,當請求詢問語言與內(nèi)容描述語言不同的時候,檢索部分104利用術(shù)語交換描述31將用請求詢問語言寫的請求詢問轉(zhuǎn)換為用內(nèi)容描述語言寫的內(nèi)容描述,并且利用以所轉(zhuǎn)換的語言的請求詢問來對內(nèi)容描述執(zhí)行檢索。結(jié)果,有可能使用以與內(nèi)容描述32不同的語言的請求詢問。換句話說,允許多語言檢索。而且,由于消除了在內(nèi)容中以多種語言描述術(shù)語的必要,因此抑制了內(nèi)容描述的冗余,并且因此改善了性能價格比。
而且,按照第三實施例,當利用所交換的請求詢問來檢索內(nèi)容描述的時候,結(jié)果響應(yīng)的語言被轉(zhuǎn)換為請求詢問語言,然后被輸出。因此有可能將響應(yīng)詢問的語言轉(zhuǎn)換為用戶使用的語言,即用戶明白的語言。
(第四實施例)在第四實施例中,利用術(shù)語交換描述31將請求詢問與具有相同含義的不同術(shù)語相交換以執(zhí)行檢索。
下面描述按照本發(fā)明的第四實施例的內(nèi)容檢索設(shè)備。在第四實施例中的內(nèi)容檢索設(shè)備的配置與按照第一實施例的內(nèi)容檢索設(shè)備10的相同。因此省略對按照第四實施例的內(nèi)容檢索設(shè)備的說明。術(shù)語交換描述31也與第一實施例的相同。
下面參照圖11描述按照第四實施例的內(nèi)容檢索設(shè)備中檢索處理。圖11是解釋按照第四實施例的內(nèi)容檢索設(shè)備的操作的流程圖。
在內(nèi)容檢索設(shè)備10中,當從輸入部分102輸入請求詢問(RQ)的時候,所輸入的請求詢問(RQ)經(jīng)由輸入控制部分103被讀取和存儲在存儲器108中(S1301),并且檢索部分104開始檢索。
首先,檢索部分104讀取存儲在存儲部分101中的內(nèi)容描述32(CD)(S1302),并且利用術(shù)語交換描述31而切換到請求詢問術(shù)語檢索處理(S1303),用于將請求詢問(RQ)與具有相同含義的不同術(shù)語(詞匯)相交換。
在請求詢問術(shù)語交換處理的S1303中,檢索部分104識別交換目標詞匯(S1304),并且利用從存儲部分101讀取的術(shù)語交換描述31(TD)(S1305),執(zhí)行請求詢問詞匯交換(S1306)。
例如,當假定在請求詢問(RQ)中指定的交換目標詞匯的語言和相似程度分別是日語和0.6或更多的時候,利用在多個用于在術(shù)語交換描述31中交換的候選術(shù)語中的對于“日語和0.6或更多的相似程度”的候選術(shù)語,將由單個術(shù)語組成的請求詢問(單個使用術(shù)語)與具有多個術(shù)語的請求詢問(同義詞;多樣術(shù)語)相交換,因此執(zhí)行請求詢問詞匯交換。
在請求詢問術(shù)語交換處理的S1304中,檢索部分104利用作為交換的同義詞(多樣術(shù)語)的請求詢問(RQ)來對內(nèi)容描述32執(zhí)行檢索以輸出詢問結(jié)果(S1307)。而且,當在S1307獲得多個請求詢問(RQ)的時候,檢索部分104利用所有的多個請求詢問(RQ)對內(nèi)容描述32執(zhí)行檢索。
另外,由于在S1307中檢索處理與在第一實施例中的S1006的相同,因此省略其具體說明。
因此,檢索部分104提供通過利用交換的請求詢問(同義詞;多樣術(shù)語)對內(nèi)容描述32執(zhí)行檢索而獲得的詢問結(jié)果。
如上所述,按照第四實施例,有可能在利用術(shù)語交換描述31將請求詢問與至少一個不同的詞匯交換之后執(zhí)行內(nèi)容描述檢索。因此用戶有可能執(zhí)行所謂的模糊檢索,用于利用與用做在內(nèi)容描述中的觀點的一個術(shù)語具有相同含義的一個術(shù)語來執(zhí)行檢索,而不用知道作為觀點的術(shù)語。而且,因為不要求描述在內(nèi)容描述中的多個觀點,因此抑制了內(nèi)容描述的冗余,并且因此改善了性能價格比。
另外,在上述的實施例中,可以在服務(wù)器端或其他地點而不是在客戶端提供檢索部分104和術(shù)語交換描述31。而且,在經(jīng)由網(wǎng)絡(luò)從內(nèi)容描述服務(wù)器獲得內(nèi)容描述32的同時,有可能以不同的方式來獲得內(nèi)容描述32。例如,存儲在諸如CD-ROM、DVD-ROM或存儲卡的存儲介質(zhì)中的內(nèi)容描述32可以被存儲在存儲部分101中。
在本發(fā)明中使用的內(nèi)容描述32和術(shù)語交換描述31的描述方法是示例,可以使用其他各種描述。在識別交換目標詞匯的方法中,使用術(shù)語和相似程度,但是也可以使用除了相似程度以外的信息,并且其組合不限于上述內(nèi)容。
可以使用計算機通過軟件或使用具有處理功能的專用硬件來實現(xiàn)本發(fā)明的檢索部分104中的處理。
(第五實施例)在本發(fā)明的第五實施例中,將包括在內(nèi)容描述中的一個術(shù)語與以不同語言的術(shù)語相交換,以便抑制以術(shù)語的增加數(shù)量的語言抑制內(nèi)容描述的冗余。
將說明按照第五實施例的內(nèi)容檢索設(shè)備。將首先參照圖12來說明按照第五實施例的內(nèi)容檢索設(shè)備的配置。圖12是按照第五實施例的內(nèi)容檢索設(shè)備的方框圖。另外,與先前所述的那些相同的部分被分配了相同的附圖標號,并且省略其具體說明。
按照第五實施例的內(nèi)容檢索設(shè)備1200包括轉(zhuǎn)換部分1203。轉(zhuǎn)換部分1203利用存儲在存儲部分101中的術(shù)語交換描述1201來交換內(nèi)容描述1202。
內(nèi)容檢索設(shè)備1200還包括檢索部分1204,它檢索與利用存儲在存儲部分101中的詢問表達1205從輸入部分102輸入的請求詢問相對應(yīng)的內(nèi)容描述1202,并且檢索包括在所檢索的內(nèi)容描述1202中的術(shù)語。
另外,從內(nèi)容描述服務(wù)器30獲得存儲在存儲部分101中的內(nèi)容描述1202。
下面參照圖13和14來說明按照第五實施例的術(shù)語交換描述1201。首先,參見圖13,解釋術(shù)語交換描述1201的描述定義(XML概要定義)。
如圖中的1301所示,在按照第五實施例的描述定義1300中,術(shù)語交換集合(Term Exchange Collection)被定義為一個要素。
如圖中的1302所示,定義了至少一個術(shù)語交換包(Term Exchange Pack)可以被描述為在術(shù)語交換集合(Term Exchange Collection)1301中的一個要素。而且,如圖中的1306所示,定義了在術(shù)語交換包1302中描述目標內(nèi)容描述的URL。
如圖中的1304所示,定義可以在術(shù)語交換包1302中描述至少一個術(shù)語交換(Term Exchange)。
術(shù)語交換1305與在第一實施例中的相同。具體上,如圖中的400所示,術(shù)語交換1305具有指示術(shù)語的<Term>要素。作為<Term>要素的值,有可能描述多個術(shù)語,所述術(shù)語對于同一詞匯以不同的語言描述和/或以不同的方式來表達相同的含義。而且,如圖中的401所示,<Term>要素具有表示術(shù)語之間相似程度的相似性屬性。相似性屬性的值1.0表示簡單的術(shù)語交換。當擴展一個詞匯的時候,小于1.0被描述為相似性屬性的一個值,并且以所述屬性值來描述相似程度。隨著詞匯的相似程度被提高,相似性屬性的值得到提高。
通過如此定義描述定義1300,有可能利用術(shù)語交換包1302來對每個含義共同描述多個術(shù)語。以這種方式,術(shù)語交換描述1201具有多個組,每個組具有一個術(shù)語和其他以不同語言表達所述術(shù)語的其他術(shù)語。
下面參照圖14來描述術(shù)語交換描述1201的一個具體示例。圖14示出了按照第五實施例的術(shù)語交換描述。
在按照第五實施例的術(shù)語交換描述1201中描述了多個術(shù)語交換包1401a和1401b。在術(shù)語交換包1401a和1401b中分別描述了目標URL、1402a和1402b。
在術(shù)語交換包1401a中描述了多個術(shù)語交換1403a-1403d。
在術(shù)語交換1403a中描述英語的“創(chuàng)建者(Creator)”和日語的“□□□”,每個作為一個<Term>要素,并且各自的相似程度是1.0。因此,英語的“Creator”和日語的“□□□”彼此相關(guān)并被描述。另外,假定“□□□”是表達英語的“Creator”的日語漢字。
在術(shù)語交換1403b中中描述了英語的“Yamada”和日語的“○○”,每個作為一個<Term>要素,并且各自的相似程度是1.0。因此,英語的“Yamada”和日語的“○○”彼此相關(guān)并被描述。
在術(shù)語交換1403c中描述英語的“Taro”和日語的“△△”,每個作為一個<Term>要素,并且各自的相似程度是1.0。因此,英語的“Taro”和日語的“△△”彼此相關(guān)并被描述。另外,假定“△△”是表達“Taro”的日語漢字。
在術(shù)語交換1403d中描述英語的“Tokyo”和日語的“”,每個作為一個<Term>要素,并且各自的相似程度是1.0。因此,英語的“Tokyo”和日語的“”彼此相關(guān)并被描述。另外,假定“”是表達“Tokyo”的日語漢字。
在術(shù)語交換包1401b中描述了多個術(shù)語交換1403e和1403f。
在術(shù)語交換1403e中描述了術(shù)語英語的“島系列(Island series)”和日語的“○×△○×△”,每個作為一個<Term>要素,并且各自的相似程度是1.0。因此,英語的“島系列”和日語的“○×△○×△”彼此相關(guān)并被描述。另外,假定“○×△○×△”是表達英語的“島系列”的日語字。
在術(shù)語交換1403f中描述了英語術(shù)語的“體育頻道(Sports Channel)”和日語的“□△○□△○”,每個作為一個<Term>要素,并且各自的相似程度是1.0。因此,英語的“體育頻道”和日語的“□△○□△○”彼此相關(guān)并被描述。另外,假定“□△○□△○”是表達英語的“體育頻道”的日語字。
以這種方式,通過使用術(shù)語交換包1401a和1401b,有可能在一個單個術(shù)語交換描述中收集與不同內(nèi)容描述對應(yīng)的術(shù)語交換。
而且,在術(shù)語交換包1401a和1401b中描述了多個術(shù)語交換(TermExchange)1403a-1403f,由此有可能描述在目標內(nèi)容描述中包括的所有術(shù)語和與各個術(shù)語具有相同含義并且以不同的表達形式被描述的術(shù)語。
在術(shù)語交換1403e和1403f中,使用短語來作為一個術(shù)語。因此,可以在術(shù)語交換描述1201a中使用短語來作為一個術(shù)語。
下面具體描述在內(nèi)容描述轉(zhuǎn)換部分1203中的內(nèi)容描述轉(zhuǎn)換處理。
首先描述內(nèi)容描述轉(zhuǎn)換部分1203利用術(shù)語交換描述1201a將圖15所示的內(nèi)容描述1202a轉(zhuǎn)換為圖16所示的內(nèi)容描述1202b。
內(nèi)容描述轉(zhuǎn)換部分1203引用內(nèi)容描述1202a,并進一步從作為建立內(nèi)容描述1202a的人的信息的<創(chuàng)建者(Creator)>引用</創(chuàng)建者(/Creator)>。然后,內(nèi)容描述轉(zhuǎn)換部分1203檢索表示建立內(nèi)容描述1202a的人的角色的“Creator”1501、表示建立內(nèi)容描述1202a的人的名字的“Taro”1502和表示建立內(nèi)容描述1202a的人的姓的“Yamada”1503。
接著,內(nèi)容描述轉(zhuǎn)換部分1203檢索作為建立內(nèi)容描述1202a的位置的信息的“Tokyo”1504。
內(nèi)容描述轉(zhuǎn)換部分1203引用作為在術(shù)語交換描述1201a中的與內(nèi)容描述1202a對應(yīng)的部分的圖中的1403a-1403d,檢索分別以不同語言表達所檢索的“Creator”1501、“Taro”1502、“Yamada”1503和“Tokyo”1504的術(shù)語。
具體地,內(nèi)容描述轉(zhuǎn)換部分1203檢索對于“Creator”1501的“□□□”、對于“Taro”的“△△”、對于“Yamada”1503的“○○”和對于“Tokyo”1504的“”。
接著,內(nèi)容描述轉(zhuǎn)換部分1203交換“Creator”部分1501與“□□□”1601、“Taro”部分1502與“△△”1602、“Yamada”部分與“○○”1603和“Tokyo”部分與“”1604。
內(nèi)容描述轉(zhuǎn)換部分1203將表示內(nèi)容描述1202a的描述語言的<Mpeg7>要素的xml1ang屬性值的“en”1505與“ja”1605交換。
于是,內(nèi)容描述轉(zhuǎn)換部分1203將具有英語描述的術(shù)語的內(nèi)容描述1202a轉(zhuǎn)換為具有日語描述的術(shù)語的內(nèi)容描述1202b。
下面描述這樣的處理內(nèi)容描述轉(zhuǎn)換部分1203利用術(shù)語交換描述1201a將圖17所示的內(nèi)容描述1202c轉(zhuǎn)換為圖18所示的內(nèi)容描述1202d。
內(nèi)容描述轉(zhuǎn)換部分1203引用內(nèi)容描述1202c,并進一步從作為關(guān)于內(nèi)容描述1202c的信息的<Creator>引用</Creator>。然后,內(nèi)容描述轉(zhuǎn)換部分1203檢索表示內(nèi)容描述1202c的標題的“島系列”1701、表示建立內(nèi)容描述1202c的代理的名稱的“體育頻道”1702。內(nèi)容描述轉(zhuǎn)換部分1203引用作為在術(shù)語交換描述1201a中的與內(nèi)容描述1202c對應(yīng)的部分的圖中的1403e和1403f,檢索分別以不同語言表達所檢索的“島系列”1701和“體育頻道”1702的術(shù)語。
具體地,內(nèi)容描述轉(zhuǎn)換部分1203檢索對于“島系列”1701的“○×△○×△”和對于“體育頻道”1702的“□△○□△○”。
接著,內(nèi)容描述轉(zhuǎn)換部分1203交換在內(nèi)容描述1202c中的“島系列”部分1701與“○×△○×△”1801和“體育頻道”部分1702與“□△○□△○”1702。
內(nèi)容描述轉(zhuǎn)換部分1203將表示要素<題目(Title)>和<名稱(Name)>的描述語言的<Mpeg7>要素的xmllang屬性值的“en”1703和1704分別與“ja”1803和1804交換。
于是,內(nèi)容描述轉(zhuǎn)換部分1203將具有英語描述的術(shù)語的內(nèi)容描述1202c轉(zhuǎn)換為具有日語描述的術(shù)語的內(nèi)容描述1202d。
下面具體描述檢索部分1204的操作。
檢索部分1204根據(jù)W3C的Xquery標準利用詢問表達1205執(zhí)行檢索。
將具體參照圖19來描述詢問表達1205。圖19是示出按照第五實施例的詢問表達的視圖。
如圖中的2201所示,在圖19中所示的詢問表達1205a中描述了內(nèi)容描述的參考URL(http//foo/mpeg7-2.xml)和在內(nèi)容描述中的參考部分(/Mpeg7/~/Creation)。
而且,在詢問表達1205a中描述了條件表達,用于確定是否在內(nèi)容描述的題目中描述的術(shù)語是作為檢索術(shù)語的“島系列”。另外,這個示例示出了當從輸入部分102輸入“島系列”作為檢索術(shù)語時的詢問表達。
詢問表達1205a具有用于當滿足由圖中的2202所示的條件時執(zhí)行下面的處理“返回(return)”的描述。
具體地,詢問表達1205a具有一個用于將所描述的術(shù)語替換到在“返回”下面的“{}”內(nèi)的位置的描述。
在這個示例中,在圖中的2203所示的“{}”內(nèi)被替換了在內(nèi)容描述中的<Mpeg7>要素下面的<描述(Desription)>要素下面的<創(chuàng)建信息(CreatorInformation)>要素下面的<創(chuàng)建(Creation)>要素下面的<創(chuàng)建者(Creator)>要素下面的<代理(Agent)>要素下面的<名稱(Name)>要素的一個屬性的值(<Mpeg7>要素到<Creation>要素假定為變量$b)。在圖中的2204所示的“{}”內(nèi)被替換了在內(nèi)容描述中的變量$b下面的<Creator>要素下面的<Agent>要素下面的<Name>要素xmllang屬性的值。在圖中的2205所示的“{}”內(nèi)被替換了在內(nèi)容描述中的變量$b下面的<Creator>要素下面的<Agent>要素下面的<Name>要素的一個值。
另外,由于詢問表達1205a是基于XQuery的,“<>”部分被輸出作為結(jié)果。
圖20示出了通過利用圖19所示的詢問表達1205a對圖17所示的內(nèi)容1202c進行檢索而在檢索部分1204獲得的結(jié)果。
如圖20所示,檢索部分1204輸出在詢問表達1205a中描述的“<>”部分而不執(zhí)行任何處理。
檢索部分1204替換與詢問表達1205a的“{}”內(nèi)對應(yīng)的術(shù)語。
具體地,部分1204將由圖17所示的1705示出的術(shù)語替換到在圖20中由2301所示的部分,將在圖17中由1704示出的術(shù)語替換到在圖20中由2302示出的部分,并且將圖17中1702所示的術(shù)語替換到圖20中由2303所示的部分。
以這種方式,利用詢問表達1205a,檢索部分1204檢索在與輸入的檢索術(shù)語對應(yīng)的內(nèi)容描述1202c中包括的術(shù)語。
下面說明利用在圖21所示的詢問表達由檢索部分1204執(zhí)行的檢索。
圖21所示的詢問表達1205b表示“○×△○×△”被輸入作為檢索術(shù)語的情況。因此,如圖中的2400所示,在詢問表達1205b中描述了一個條件表達,用于確定是否在內(nèi)容中的“題目(Title)”中描述的術(shù)語是作為檢索術(shù)語的“○×△○×△”。
而且,因為詢問表達1205b對應(yīng)于圖18所示的內(nèi)容描述1202c,因此在圖中的2401所示的表達1205b中描述了內(nèi)容描述的參考位置。
當檢索部分1204利用圖21所示的詢問表達1205b對圖18所示的內(nèi)容描述1202d進行檢索的時候,部分1204輸出圖22所示的詢問結(jié)果。
檢索部分1204將圖18中1805所示的術(shù)語替換為圖22的2501所示的部分,將圖18中的1804所示的術(shù)語替換為圖22中2502所示的部分,并且將在圖18中1802所示的術(shù)語替換為圖22的2503所示的部分。
圖23示出了詢問表達的另一個示例。
圖23中所示的詢問表達1205c對應(yīng)于多個檢索術(shù)語。具體地,表達1205c表示“島系列”和“○×△○×△”每個作為檢索術(shù)語被輸入的情況。因此,如圖中的2600所示,在詢問表達1205c中描述了一個條件表達,用于確定是否在內(nèi)容描述中的“題目”中描述的術(shù)語是作為檢索術(shù)語的“島系列”或“○×△○×△”。
當檢索部分1204利用詢問表達1205c執(zhí)行檢索的時候,部分1204檢索內(nèi)容描述,其中“島系列”和“○×△○×△”在“題目”被描述,并進一步檢索在檢索內(nèi)容描述中包括的術(shù)語。
以這種方式,也可能利用以不同語言表達的檢索術(shù)語來進行檢索。
另外,在對“題目”執(zhí)行上述的檢索的同時,可以當轉(zhuǎn)換和擴展在行4中的“哪里(where)”的值時執(zhí)行另一個部分的檢索。
例如,可以通過將第3行重寫為“for $b in document(http//foo/mpeg7.xml)/Mpeg7/Description/MultimediaContent/Audio Visual/TemporalDecompo-sition/Audio VisualSegment(對于文件中的$b(http//foo/mpeg7.xml)/Mpeg7/描述/多媒體內(nèi)容/音頻視頻/時間分解/音視頻段)”,并進一步將第4行寫為where“$b/PointOfView/@viewpoint=’Yamada’(這里“$b/觀點/@觀點=’Yamada’)”來執(zhí)行觀點的檢索。
而且,通過將第4行重寫為where“$b/PointOfView/@viewpoint=’Yamada’(這里“$b/觀點/@觀點=’Yamada’)”和“$b/PointOfView/@viewpoint/Importance/Value>0.2($b/觀點/@觀點/重要性/值及gt;0.2)”,有可能檢索在內(nèi)容描述中具有觀點’Yamada’的值和0.2或更多的重要程度的段。
如上所述,按照第五實施例,有可能將在內(nèi)容描述中包括的術(shù)語交換為以不同語言的術(shù)語。結(jié)果,由于消除了在內(nèi)容描述中以多種不同語言描述術(shù)語的必要,因此有可能即使在增加用于一個術(shù)語的語言的數(shù)量的時候也抑制內(nèi)容描述的冗余。
另外,第五實施例也通過沒有檢索部分1204,即內(nèi)容描述轉(zhuǎn)換設(shè)備,的內(nèi)容檢索設(shè)備1200來實現(xiàn)。
(第六實施例)在本發(fā)明的第六實施例中,將包括在內(nèi)容描述中的術(shù)語與作為與所述術(shù)語具有相同含義并與所述術(shù)語具有不同表達的另一個術(shù)語的同義詞交換,以便在增加所述術(shù)語的表達形式的數(shù)量中抑制內(nèi)容描述的冗余。
下面說明按照第六實施例的內(nèi)容檢索設(shè)備。按照第六實施例的內(nèi)容檢索設(shè)備的配置與第五實施例的相同,省略其描述。
將描述按照第六實施例的術(shù)語交換描述1201。對于術(shù)語交換描述1201的描述定義(XML概要定義)與在第五實施例中所述的圖13中所示的描述定義1300相同,省略其描述。
將參照圖24說明按照第六實施例的術(shù)語交換描述的具體示例。圖24示出了按照第六實施例的術(shù)語交換描述。
在按照第六實施例的術(shù)語交換描述1201b中描述了術(shù)語交換包1901。在術(shù)語交換包1901中描述了目標URL 1902。
而且,在術(shù)語交換包1901中描述了多個術(shù)語交換1903a和1903b。
在術(shù)語交換1903a中描述了作為<Term>要素的日語的“◇◇◇◇□△×”1904a、日語的“◇◇◇◇”1904b、日語的“◎◎”1904c、英語的“美國(United States of America)”1904d、英語的“美洲(America)”1904e、英語的“U.S.A”1904f和英語的“U.S.”1904g。
另外,假定“◇◇◇◇□△×”是以日語表達英語的“美國”,“◇◇◇◇”表達英語“美國”的日語縮寫,“◎◎”以日語的漢字表達英語的“美國”。
而且,向每個術(shù)語分配相似程度如下1.0對日語的“◇◇◇◇□△×”1904a、0.8對日語的“◇◇◇◇”1904b、0.9對日語的“◎◎”1904c、1.0對英語的“美國”1904d、0.8對英語的“美洲”1904e、0.9對英語的“U.S.A”1904f、0.7對英語的“U.S.”1904g。于是描述在1904a至1904g中所示的術(shù)語。
在術(shù)語交換1903b中描述了作為<Term>要素的日語的“○□○×”1904h、英語的“總統(tǒng)選舉(Presidential election)”1904i和英語的“總統(tǒng)競選(Presidential race)”1904j。
另外,假定“○□○×”是以日語漢字表達的英語“總統(tǒng)選舉”。
而且,向每個術(shù)語分配相似程度如下1.0對日語的“○□○×”1904h、1.0對英語的“總統(tǒng)選舉”1904i、0.9對英語的“總統(tǒng)競選”1904i。于是描述了在1904h至1904j中所示的術(shù)語。
以這種方式,在術(shù)語交換包1901中描述了多個術(shù)語交換1903a和1903b,由此有可能描述在目標內(nèi)容描述中包括的所有術(shù)語、各個同義術(shù)語和以不同語言的各個術(shù)語。
下面具體描述按照第六實施例的內(nèi)容描述轉(zhuǎn)換部分1203中的內(nèi)容描述轉(zhuǎn)換處理。將描述這樣的處理內(nèi)容描述轉(zhuǎn)換部分1203利用術(shù)語交換描述1201b將圖25所示的內(nèi)容描述1202e轉(zhuǎn)換為圖26所示的內(nèi)容描述1202f。下面的描述圖解用戶利用所有的相似程度的術(shù)語通過輸入部分102執(zhí)行內(nèi)容轉(zhuǎn)換的情況。
內(nèi)容描述轉(zhuǎn)換部分1203引用內(nèi)容描述1202e,并且檢索作為內(nèi)容描述1202a的關(guān)鍵字的“美國”2001a和“總統(tǒng)選舉”2001b。
然后,內(nèi)容描述轉(zhuǎn)換部分1203引用作為在術(shù)語交換描述1201b中對應(yīng)于內(nèi)容描述1202e的部分的圖中的1903a和1904b,并且檢索分別以不同方式表達所檢索的“美國”2001a和“總統(tǒng)選舉”2001b的術(shù)語。
具體地,內(nèi)容描述轉(zhuǎn)換部分1203檢索用于“美國”2001a的“美洲”、“U.S.A”、“U.S.”、“◇◇◇◇□△×”、“◇◇◇◇”和“◎◎”以及用于“總統(tǒng)選舉”2001b的“○□○×”和“總統(tǒng)競選”。
然后,內(nèi)容描述轉(zhuǎn)換部分1203向在內(nèi)容描述1202e中的“美國”2001a和“總統(tǒng)選舉”2001b增加“美洲”2101a、“U.S.A”2101b、“U.S.”2101c、“總統(tǒng)競選”2101d、“◇◇◇◇□△×”2101e、“◇◇◇◇”2101f、“◎◎”2101g和“○□○×”2101h。
于是,內(nèi)容描述轉(zhuǎn)換部分1203將內(nèi)容描述1202e轉(zhuǎn)換為內(nèi)容描述1202f。以這種方式,在內(nèi)容描述1202f中描述以不同方式表達在內(nèi)容描述1202e中關(guān)鍵字的所有關(guān)鍵字。結(jié)果,因為有可能在內(nèi)容描述中以不同表達形式描述多個術(shù)語,進一步抑制了內(nèi)容描述的冗余。
內(nèi)容描述轉(zhuǎn)換部分1203向英語的“美國”2001a和“總統(tǒng)選舉”2001b增加“美洲”2101a、“U.S.A”2101b、“U.S.”2101c、“總統(tǒng)競選”2101d,以匯總為“en”2102a,并且進一步將“◇◇◇◇□△×”2101e、“◇◇◇◇”2101f、“◎◎”2101g和“○□○×”2101h匯總為“ja”2102b。
于是,對每種語言匯總對應(yīng)于內(nèi)容描述1202d的術(shù)語。于是允許在對應(yīng)于每種語言的內(nèi)容描述1202d的術(shù)語之間識別。
另外,雖然上面描述了用戶通過輸入部分102利用所有相似程度的術(shù)語執(zhí)行內(nèi)容描述轉(zhuǎn)換,但是用戶有可能利用任意相似程度的術(shù)語來執(zhí)行內(nèi)容描述轉(zhuǎn)換。
在這種情況下,內(nèi)容描述轉(zhuǎn)換部分1203利用大于由用戶指定的值的相似程度的術(shù)語執(zhí)行內(nèi)容轉(zhuǎn)換。例如,當在上述示例中用戶指定0.9或更多相似程度的時候,內(nèi)容描述轉(zhuǎn)換部分1203檢索對于“美國”2001a的每個具有0.9或更多相似程度的“U.S.A”1904f、“◇◇◇◇□△×”1904a和“”1904c,并且檢索對于“總統(tǒng)選舉”2001b的每個具有0.9或更多相似程度的“○□○×”1904f和“總統(tǒng)競選”1904j。然后,內(nèi)容描述轉(zhuǎn)換部分1203僅僅使用所檢索的術(shù)語來執(zhí)行內(nèi)容轉(zhuǎn)換。
如上所述,按照第六實施例,將在內(nèi)容描述中包括的術(shù)語與作為與所述術(shù)語具有相同含義并與所述術(shù)語具有不同表達的另一個術(shù)語的同義詞交換,由此在增加所述術(shù)語的表達形式的數(shù)量中抑制了內(nèi)容描述的冗余。
如上所述,按照本發(fā)明,因為有可能將內(nèi)容描述中包括的術(shù)語與以不同表達形式的術(shù)語相交換,因此消除了在內(nèi)容描述中以多種不同語言描述術(shù)語的必要,因此有可能在增加用于所述術(shù)語的表達形式的數(shù)量中抑制內(nèi)容描述的冗余。
本發(fā)明不限于上述的實施例,在不脫離本發(fā)明的范圍的情況下,各種改變和修改是可能的。
本申請基于2002年3月28日提交的日本專利申請第2002-091234號和2003年2月20日提交的第2003-043290號,其整個內(nèi)容在此合并于此作為參考。
權(quán)利要求
1.一種內(nèi)容檢索設(shè)備,包括內(nèi)容存儲部分,存儲分配到表示其內(nèi)容的觀點的內(nèi)容描述;術(shù)語交換描述存儲部分,存儲術(shù)語交換描述,其中所述觀點與以不同表達形式表示所述觀點的術(shù)語彼此相關(guān)并被描述;檢索部分,用于當被輸入來檢索所述內(nèi)容描述的請求詢問與所述觀點不同時,利用所述術(shù)語交換描述檢索對應(yīng)于所述觀點的不同表達形式的術(shù)語,建立被分配了所檢索的不同表達形式的術(shù)語的新內(nèi)容描述來作為新的觀點,并且檢索分配了與所述請求詢問相同的所述新觀點的新內(nèi)容描述。
2.按照權(quán)利要求1的設(shè)備,其中所述不同表達形式的術(shù)語是以不同語言表達所述觀點的術(shù)語。
3.按照權(quán)利要求1的設(shè)備,其中不同表達形式的所述術(shù)語是所述觀點的同義術(shù)語。
4.按照權(quán)利要求1的設(shè)備,其中所述內(nèi)容描述包括多個被分配所述觀點的段,并且所述檢索部分檢索被分配了與所述請求詢問相同的所述新觀點的段。
5.按照權(quán)利要求1的設(shè)備,其中內(nèi)容描述和術(shù)語交換描述是利用XML描述的。
6.按照權(quán)利要求1的設(shè)備,其中內(nèi)容描述是基于ISO/IEC 15938-2和ISO/IEC 15938-5描述的。
7.一種內(nèi)容檢索設(shè)備,包括內(nèi)容存儲部分,用于存儲分配到表示其內(nèi)容的觀點的內(nèi)容描述;術(shù)語交換描述存儲部分,存儲術(shù)語交換描述,其中所述觀點與以不同表達形式表示所述觀點的術(shù)語彼此相關(guān)并被描述;檢索部分,用于當被輸入來檢索所述內(nèi)容描述的請求詢問與所述觀點不同的時候,利用所述術(shù)語交換描述檢索以不同表達形式指示對應(yīng)于所述請求詢問的所述觀點的術(shù)語,將所述請求詢問與不同表達形式的所檢索的術(shù)語相交換以建立新請求詢問,并且檢索分配了與所述新請求詢問相同的所述觀點的內(nèi)容描述。
8.按照權(quán)利要求7的設(shè)備,其中所述不同表達形式的術(shù)語是以不同語言表達所述觀點的術(shù)語。
9.按照權(quán)利要求7的設(shè)備,其中不同表達形式的所述術(shù)語是所述觀點的同義術(shù)語。
10.按照權(quán)利要求7的設(shè)備,其中所述內(nèi)容描述包括多個被分配所述觀點的段,并且所述檢索部分檢索被分配了與所述新請求詢問相同的所述觀點的段。
11.按照權(quán)利要求7的設(shè)備,其中內(nèi)容描述和術(shù)語交換描述是利用XML描述的。
12.按照權(quán)利要求7的設(shè)備,其中內(nèi)容描述是基于ISO/IEC 15938-2和ISO/IEC 15938-5描述的。
13.一種方法,包括當被輸入來檢索目標內(nèi)容描述的請求詢問的語言與內(nèi)容描述的觀點的語言不同的時候,利用其中觀點和以不同表達形式指示所述觀點的術(shù)語彼此相關(guān)并被描述的術(shù)語交換描述,檢索以不同表達形式指示對應(yīng)于觀點的術(shù)語,其中所述目標內(nèi)容描述被分配了表示該內(nèi)容描述的內(nèi)容的觀點;建立被分配了所檢索的不同表達形式的術(shù)語的新內(nèi)容描述來作為新的觀點,并且檢索分配了與所述請求詢問相同的所述新觀點的新內(nèi)容描述。
14.一種方法,包括當被輸入來檢索目標內(nèi)容描述的請求詢問與觀點不同的時候,利用其中觀點和以不同表達形式指示所述觀點的術(shù)語彼此相關(guān)并被描述的術(shù)語交換描述,檢索以不同表達形式指示對應(yīng)于請求詢問的觀點的術(shù)語,其中所述目標內(nèi)容描述被分配了表示該內(nèi)容描述的內(nèi)容的觀點;創(chuàng)建作為以不同表達形式所提取的術(shù)語、并與該請求詢問進行交換的新請求詢問,并且檢索分配了與所述新請求詢問相同的所述觀點的內(nèi)容描述。
15.一種由計算機可以執(zhí)行的程序,包括當被輸入來檢索目標內(nèi)容描述的請求詢問的語言與內(nèi)容描述的觀點的語言不同的時候,利用其中觀點和以不同表達形式指示所述觀點的術(shù)語彼此相關(guān)并被描述的術(shù)語交換描述,檢索以不同表達形式指示對應(yīng)于該觀點的術(shù)語,其中所述目標內(nèi)容描述被分配了表示該內(nèi)容描述的內(nèi)容的觀點;建立被分配了所檢索的不同表達形式的術(shù)語的新內(nèi)容描述來作為新觀點,并且檢索分配了與所述請求詢問相同的所述新觀點的新內(nèi)容描述。
16.一種由計算機可以執(zhí)行的程序,包括當被輸入來檢索目標內(nèi)容描述的請求詢問與觀點不同的時候,利用其中觀點和以不同表達形式指示所述觀點的術(shù)語彼此相關(guān)并被描述的術(shù)語交換描述,檢索以不同表達形式指示對應(yīng)于請求詢問的觀點的術(shù)語,其中所述目標內(nèi)容描述被分配了表示該內(nèi)容描述的內(nèi)容的觀點;創(chuàng)建作為以不同表達形式所提取的術(shù)語、并與該請求詢問進行交換的新請求詢問,并且檢索分配了與所述該新請求詢問相同的所述觀點的內(nèi)容描述。
17.一種內(nèi)容描述轉(zhuǎn)換設(shè)備,包括內(nèi)容存儲部分,用于存儲內(nèi)容描述;術(shù)語交換描述存儲部分,用于存儲術(shù)語交換描述,其中在內(nèi)容描述中包括的術(shù)語與另一個以不同表達形式指示所述術(shù)語的另一個術(shù)語彼此相關(guān)并被描述;術(shù)語交換部分,用于利用術(shù)語交換描述將在內(nèi)容描述中包括的術(shù)語與不同表達形式的另一個術(shù)語相交換。
18.按照權(quán)利要求17的設(shè)備,其中所述術(shù)語交換描述描述了多對包括在內(nèi)容描述中的術(shù)語和不同表達形式的另一個術(shù)語。
19.按照權(quán)利要求17的設(shè)備,其中所述不同表達形式的另一個術(shù)語以不同語言表達所述觀點。
20.按照權(quán)利要求17的設(shè)備,其中不同表達形式的所述另一個術(shù)語是所述觀點的同義術(shù)語。
21.按照權(quán)利要求17的設(shè)備,其中內(nèi)容描述和術(shù)語交換描述是利用XML描述的。
22.按照權(quán)利要求17的設(shè)備,其中內(nèi)容描述是基于ISO/IEC 15938-2和ISO/IEC 15938-5描述的。
23.按照權(quán)利要求18的設(shè)備,其中所述交換部分將包括在所述內(nèi)容描述中的所述術(shù)語與包括在所述術(shù)語交換描述中的不同表達形式的多個術(shù)語相交換。
24.一種方法,包括利用其中包括在內(nèi)容描述中的另一個術(shù)語與不同表達形式的術(shù)語彼此相關(guān)并被描述的術(shù)語交換描述,檢索以不同表達形式指示與在內(nèi)容描述中包括的另一個術(shù)語對應(yīng)的另一個術(shù)語的術(shù)語;利用不同表達形式的檢索的術(shù)語,將包括在內(nèi)容描述中的另一個術(shù)語與不同表達形式的所檢索的術(shù)語相交換。
25.一種計算機可以執(zhí)行的程序,包括利用術(shù)語交換描述,檢索以不同形式指示對應(yīng)于在內(nèi)容描述中包括的另一個術(shù)語的另一個術(shù)語的術(shù)語;利用不同表達形式的檢索的術(shù)語,將包括在內(nèi)容描述中的另一個術(shù)語與不同表達形式的所檢索的術(shù)語相交換。
全文摘要
在本發(fā)明中,當請求詢問在表達上與目標內(nèi)容描述的觀點不同時,利用其中包括在內(nèi)容描述中的術(shù)語與以不同形式表示所述術(shù)語的另一個術(shù)語彼此相關(guān)并被描述的術(shù)語交換描述,將目標內(nèi)容描述的請求詢問或觀點與作為所述觀點或請求的相同術(shù)語分別交換以執(zhí)行內(nèi)容檢索。以這種方式,不用在內(nèi)容描述中描述多個觀點,有可能增加用于請求詢問的表達形式的數(shù)量,并且抑制內(nèi)容描述的冗余。
文檔編號G06F17/30GK1448869SQ03108518
公開日2003年10月15日 申請日期2003年3月28日 優(yōu)先權(quán)日2002年3月28日
發(fā)明者江村恒一, 藤川渡, 岡田雄治, 高橋克直 申請人:松下電器產(chǎn)業(yè)株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
资中县| 武清区| 郓城县| 昌黎县| 古浪县| 长子县| 金阳县| 沙雅县| 侯马市| 鸡东县| 天津市| 普陀区| 海城市| 桃园县| 肥城市| 宁化县| 汉中市| 南康市| 平定县| 天水市| 高密市| 苏尼特右旗| 磴口县| 阿合奇县| 江山市| 双桥区| 乐至县| 宣汉县| 重庆市| 宁乡县| 海门市| 凤台县| 普兰店市| 石渠县| 岢岚县| 泰州市| 大埔县| 绥宁县| 方城县| 湖南省| 芒康县|