欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

信息處理設(shè)備、信息處理方法及程序的制作方法

文檔序號:2830000閱讀:274來源:國知局
專利名稱:信息處理設(shè)備、信息處理方法及程序的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理設(shè)備、信息處理方法和信息處理程序。更具體地,本發(fā)明涉及能把最適宜的關(guān)鍵詞分配給內(nèi)容的信息處理設(shè)備、信息處理方法和信息處理程序。

背景技術(shù)
在過去引入了一種作為用于搜索音頻或視頻內(nèi)容并通過給每個內(nèi)容提供關(guān)鍵詞來對音頻和視頻內(nèi)容進(jìn)行分類的技術(shù)。這種關(guān)鍵詞通常被稱作元數(shù)據(jù)。為了給每個內(nèi)容分配關(guān)鍵詞,需要相當(dāng)大數(shù)量的人力勞動,正如例如,CDDB(CD數(shù)據(jù)庫)的情況,該CDDB用于提供諸如記錄在作為容器的每張CD(緊密盤)上的音樂內(nèi)容的名字和與音樂內(nèi)容相關(guān)的藝術(shù)家的名字的信息。在這種情況下,每當(dāng)引入新內(nèi)容時,都進(jìn)行了人力勞動來為每個內(nèi)容登記關(guān)鍵詞。
另外,曾經(jīng)特別地發(fā)展了一種用數(shù)值來表示每個單獨的音樂內(nèi)容的特征的技術(shù),作為被提供給音樂內(nèi)容等的技術(shù),還存在一種從這種數(shù)值推斷諸如關(guān)鍵詞等元數(shù)據(jù)的技術(shù)。
為了具體地表述它,還存在一種信息處理設(shè)備(諸如在專利文檔1中描述的設(shè)備),其中,根據(jù)多元技術(shù)的量化類型III,諸如提供給單獨內(nèi)容的關(guān)鍵詞的離散量被存放在連續(xù)量的空間中,在連續(xù)量空間和特征量空間中進(jìn)行規(guī)范的相關(guān)性分析,以便得到關(guān)聯(lián)連續(xù)量空間和特征量空間的關(guān)系。然后,通過利用關(guān)聯(lián)關(guān)系,從新內(nèi)容的特征量中推斷出關(guān)鍵詞。
另外,還曾經(jīng)提出了用于聚合(cluster)內(nèi)容的技術(shù)、聚合關(guān)鍵詞的技術(shù)(諸如專利文檔2中描述的技術(shù))、同時聚合內(nèi)容和關(guān)鍵詞的技術(shù)(諸如非專利文檔1中描述的技術(shù))以及推薦匹配用戶喜好或匹配環(huán)境的內(nèi)容的技術(shù)(諸如專利文檔3中描述的技術(shù))。
上面提到的參考文獻(xiàn)被羅列如下
日本專利申請公開No.Hei 11-96165
日本專利申請公開No.2002-41573
日本專利申請公開No.2001-175676
Hiroya Takamura和Yuji Matsumoto,“對于原文分類的聯(lián)合聚合”,日本信息處理會社雜志,44卷,02期,2003年2月出版。(Hiroya Takamura and YujiMatsumoto,“Co-clustering for Text Categorization”,magazine of the InformationProcessing Society of Japan,Vol.44,No.02,an issue of February 2003.)

發(fā)明內(nèi)容
[本發(fā)明要解決的問題] 然而,每當(dāng)新引入了附加內(nèi)容時,都進(jìn)行了非常大量的人力勞動來給內(nèi)容提供關(guān)鍵詞,這出現(xiàn)了永遠(yuǎn)地遭受耗費的問題。
另外,如果采用給內(nèi)容提供關(guān)鍵詞的傳統(tǒng)技術(shù),給內(nèi)容提供關(guān)鍵詞的處理就不能說是為內(nèi)容提供適合于內(nèi)容的關(guān)鍵詞的處理。
例如,在日本專利申請公開No.Hei 11-96165中公開的設(shè)備通過采用量化類型III來推斷關(guān)鍵詞。然而,由于量化類型III只能被應(yīng)用于定性數(shù)據(jù),因此這種多元技術(shù)不能被用于向例如在評論音樂內(nèi)容的文本中多次出現(xiàn)的單詞分配權(quán)重作為指示在這種文本中多次出現(xiàn)的單詞被視作重要單詞的權(quán)重。
另外,例如,在日本專利申請公開No.2002-41573和非專利文檔1中公開的技術(shù)每個都是用于聚合內(nèi)容和關(guān)鍵詞的技術(shù)。然而,這些技術(shù)不能被用于通過使用代表內(nèi)容特征和代表每個都被分配給內(nèi)容的關(guān)鍵詞的特征量來進(jìn)行聚合和建模處理。
另外,在日本專利申請公開No.2001-175676中公開的技術(shù)是用于推薦匹配用戶喜好或匹配環(huán)境的內(nèi)容的技術(shù)。然而,該技術(shù)采用一種用于推薦具有與從高增值內(nèi)容的積聚的元數(shù)據(jù)中創(chuàng)建的用戶概述(profile)的小偏差的內(nèi)容的方法。因此,由于沒有考慮關(guān)于喜好的的信息分布,該技術(shù)不能說是用于推薦最適宜內(nèi)容的技術(shù)。
對于上述問題,本發(fā)明使給內(nèi)容分配最適宜的關(guān)鍵詞成為可能。
[解決問題的手段] 依照本發(fā)明的第一方面,提供一種信息處理設(shè)備,包括 第一計算裝置,用于計算代表對于為與內(nèi)容有關(guān)的特征量和顯示內(nèi)容的屬性的屬性信息共用的第一潛在變量的概率分布性質(zhì)、對于特征量的概率分布性質(zhì)和對于屬性信息的概率分布性質(zhì)的第一參數(shù);和 存儲裝置,用于存儲所計算的第一參數(shù)。
信息處理設(shè)備可以具有配置,還包括第一抽取裝置,用于抽取特征量;和第二抽取裝置,用于抽取屬性信息。其中第一計算裝置從所抽取的特征量和所抽取的屬性信息中計算第一參數(shù)。
信息處理設(shè)備可以具有配置,其中第二抽取裝置把以自然語言書寫的句子劃分為單詞或者每個都由單詞組成的短語。
信息處理設(shè)備可以具有配置,還包括第二計算裝置,用于基于由第一計算裝置計算的第一參數(shù)來計算顯示短語和特征量之間的關(guān)系程度的特性特征(feature charasteristic);和顯示控制裝置,用于基于所抽取的特性特征來控制顯示短語的處理。
信息處理設(shè)備可以具有配置,其中第一計算裝置計算代表對于特征量的概率分布性質(zhì)、對于屬性信息的概率分布性質(zhì)和為特征量、屬性信息和被用戶用作關(guān)于利用內(nèi)容的信息的利用信息共用的第二潛在變量的概率分布性質(zhì)的第二參數(shù);和存儲裝置被用于存儲由第一計算裝置計算的第二參數(shù)。
信息處理設(shè)備可以具有配置,還包括抽取裝置,用于抽取利用信息,其中第一計算裝置從特征量、屬性信息或所抽取的利用信息中計算第二參數(shù)。
信息處理設(shè)備可以具有配置,其中第一計算裝置計算代表對于特征量的概率分布性質(zhì)、對于屬性信息的概率分布性質(zhì)和為特征量、屬性信息和被用作關(guān)于作為用戶喜好的內(nèi)容的信息的喜好信息共用的第三潛在變量的概率分布性質(zhì)的第三參數(shù);以及存儲裝置被用于存儲所計算的第三參數(shù)。
信息處理設(shè)備可以具有配置,還包括抽取裝置,用于抽取喜好信息,其中第一計算裝置從特征量、屬性信息或所抽取的喜好信息中計算第三參數(shù)。
依照本發(fā)明的第一方面,提供一種信息處理方法,包括計算步驟,用于計算代表與內(nèi)容有關(guān)的特征量和顯示內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于特征量的概率分布性質(zhì)和對于屬性信息的概率分布性質(zhì)的參數(shù);和存儲步驟,用于存儲所計算的參數(shù)。
依照本發(fā)明的第一方面,提供一種由計算機執(zhí)行的程序以進(jìn)行計算步驟,用于計算代表為與內(nèi)容有關(guān)的特征量和顯示內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于特征量的概率分布性質(zhì)和對于屬性信息的概率分布性質(zhì)的參數(shù);和存儲步驟,用于存儲所計算的參數(shù)。
依照本發(fā)明的第一方面,第一參數(shù)被計算作為代表對于為與內(nèi)容有關(guān)的特征量和顯示內(nèi)容的屬性的屬性信息共用的第一潛在變量的概率分布性質(zhì)、對于特征量的概率分布性質(zhì)和對于屬性信息的概率分布性質(zhì)的參數(shù);以及所計算的第一參數(shù)被存儲。
依照本發(fā)明的第二方面,提供一種信息處理設(shè)備,包括抽取裝置,用于抽取與內(nèi)容有關(guān)的特征量;轉(zhuǎn)換裝置,用于基于代表對于與特征量和顯示內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于特征量的概率分布性質(zhì)和對于屬性信息的概率分布性質(zhì)的參數(shù),來進(jìn)行轉(zhuǎn)換處理以把所抽取的特征量放置于潛在空間中;計算裝置,用于計算作為轉(zhuǎn)換處理結(jié)果被放置于潛在空間中的特征量和通過潛在變量與特征量潛在地關(guān)聯(lián)的屬性信息之間的偏差;和選擇裝置,用于基于所計算的偏差來選擇對于內(nèi)容的屬性。
信息處理設(shè)備可以具有配置,其中,作為對于內(nèi)容的所選屬性,選擇裝置在所有屬性中選擇所計算的偏差不高于門限值的屬性,或者選擇具有最小偏差的預(yù)定數(shù)目的屬性。
依照本發(fā)明的第二方面,提供一種信息處理方法,包括抽取步驟,用于抽取與內(nèi)容有關(guān)的特征量;轉(zhuǎn)換步驟,用于基于代表對于與特征量和顯示內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于特征量的概率分布性質(zhì)和對于屬性信息的概率分布性質(zhì)的參數(shù),來進(jìn)行轉(zhuǎn)換處理以把所抽取的特征量放置于潛在空間中;計算步驟,用于計算作為轉(zhuǎn)換處理結(jié)果被放置于潛在空間中的特征量和通過潛在變量與特征量潛在地關(guān)聯(lián)的屬性信息之間的偏差;和選擇步驟,用于根據(jù)在計算步驟所計算的偏差來選擇對于內(nèi)容的屬性。
依照本發(fā)明的第二方面,提供一種由計算機執(zhí)行的程序以進(jìn)行抽取步驟,用于抽取與內(nèi)容有關(guān)的特征量;轉(zhuǎn)換步驟,用于基于代表對于與特征量和顯示內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于特征量的概率分布性質(zhì)和對于屬性信息的概率分布性質(zhì)的參數(shù),來進(jìn)行轉(zhuǎn)換處理以把所抽取的特征量放置于潛在空間中;計算步驟,用于計算作為轉(zhuǎn)換處理結(jié)果被放置于潛在空間中的特征量和通過潛在變量與特征量潛在地關(guān)聯(lián)的屬性信息之間的偏差;和選擇步驟,用于基于所計算的偏差來選擇對于內(nèi)容的屬性。
依照本發(fā)明的第二方面抽取了與內(nèi)容有關(guān)的特征量;基于代表對于與特征量和顯示內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于特征量的概率分布性質(zhì)和對于屬性信息的概率分布性質(zhì)的參數(shù),進(jìn)行了轉(zhuǎn)換處理以把所抽取的特征量放置于潛在空間中;作為轉(zhuǎn)換處理結(jié)果被放置于潛在空間中的特征量和通過潛在變量與特征量潛在地關(guān)聯(lián)的屬性信息之間的偏差被計算;以及基于所計算的偏差來選擇對于內(nèi)容的屬性。
依照本發(fā)明的第三方面,提供一種信息處理設(shè)備,包括轉(zhuǎn)換裝置,用于基于代表對于為與內(nèi)容有關(guān)的特征量和顯示內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于特征量的概率分布性質(zhì)和對于屬性信息的概率分布性質(zhì)的參數(shù),來進(jìn)行轉(zhuǎn)換處理以把屬性信息放置于潛在空間中;計算裝置,用于計算作為轉(zhuǎn)換處理結(jié)果被放置于潛在空間中的特征量和通過潛在變量與特征量潛在地關(guān)聯(lián)的屬性信息之間的偏差;和選擇裝置,用于基于所計算的偏差選擇對于屬性信息的內(nèi)容。
信息處理設(shè)備可以具有配置,其中作為對于屬性的所選內(nèi)容,選擇裝置在所有內(nèi)容中選擇所計算的偏差不高于門限值的內(nèi)容,或者選擇具有最小偏差的預(yù)定數(shù)目的內(nèi)容。
依照本發(fā)明的第三方面,提供一種信息處理方法,包括轉(zhuǎn)換步驟,用于基于代表對于為與內(nèi)容有關(guān)的特征量和顯示內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于特征量的概率分布性質(zhì)和對于屬性信息的概率分布性質(zhì)的參數(shù),來進(jìn)行轉(zhuǎn)換處理以把屬性信息放置于潛在空間中;計算步驟,用于計算作為轉(zhuǎn)換處理結(jié)果被放置于潛在空間中的屬性信息和通過潛在變量與特征量潛在地關(guān)聯(lián)的屬性信息之間的偏差;和選擇步驟,用于基于所計算的偏差選擇對于屬性信息的內(nèi)容。
依照本發(fā)明的第三方面,提供一種由計算機執(zhí)行程序以進(jìn)行轉(zhuǎn)換步驟,用于基于代表對于為與內(nèi)容有關(guān)的特征量和顯示內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于特征量的概率分布性質(zhì)和對于屬性信息的概率分布性質(zhì)的參數(shù),來進(jìn)行轉(zhuǎn)換處理以把屬性信息放置于潛在空間中;計算步驟,用于計算作為轉(zhuǎn)換處理結(jié)果被放置于潛在空間中的屬性信息和通過潛在變量與特征量潛在地關(guān)聯(lián)的屬性信息之間的偏差;和選擇步驟,用于基于所計算的偏差選擇對于屬性信息的內(nèi)容。
依照本發(fā)明的第三個方面基于代表對于為與內(nèi)容有關(guān)的特征量和顯示內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于特征量的概率分布性質(zhì)和對于屬性信息的概率分布性質(zhì)的參數(shù),進(jìn)行了轉(zhuǎn)換處理以把屬性信息放置于潛在空間中;作為轉(zhuǎn)換處理結(jié)果被放置于潛在空間中的屬性信息和通過潛在變量與特征量潛在地關(guān)聯(lián)的屬性信息之間的偏差被計算;以及基于所計算的偏差選擇關(guān)于內(nèi)容的內(nèi)容。
如上所述,依照本發(fā)明的第一方面,最適宜的關(guān)鍵詞可以被分配給每個內(nèi)容。
此外,依照本發(fā)明的第二方面,最適宜的關(guān)鍵詞可以被分配給每個內(nèi)容。
另外,依照本發(fā)明的第三方面,可能以較高的可靠性搜索對應(yīng)于關(guān)鍵詞內(nèi)容。



圖1是顯示內(nèi)容提供設(shè)備中使用的硬件的典型配置的說明方框圖。
圖2是顯示內(nèi)容提供設(shè)備的典型功能配置的功能方框圖。
圖3顯示由圖2所示的內(nèi)容提供設(shè)備所執(zhí)行的學(xué)習(xí)處理的說明所參考的流程圖。
圖4是顯示音樂內(nèi)容的典型特征量的圖表。
圖5是顯示音樂內(nèi)容的典型標(biāo)簽信息的圖表。
圖6顯示計算關(guān)聯(lián)信息的處理的細(xì)節(jié)的說明所參考的流程圖。
圖7是顯示在潛在變量是與內(nèi)容特征量的混合正態(tài)分布(GMM)和標(biāo)簽信息的PLSA共用的變量的情況下的典型圖形模型的圖表。
圖8是顯示基于潛在空間的作為內(nèi)容的典型表述的表述的圖表。
圖9是顯示基于潛在空間的作為對于標(biāo)簽信息的典型表述的表述的圖表。
圖10是顯示對于潛在變量zk的典型先驗概率的圖表。
圖11是顯示對于潛在變量z1的典型方差-協(xié)方差矩陣S1的圖表。
圖12是顯示對于潛在變量z2的典型方差-協(xié)方差矩陣S2的圖表。
圖13是顯示由關(guān)聯(lián)信息計算單元計算的典型均值向量μ1和μ2的圖表。
圖14顯示由內(nèi)容提供設(shè)備所進(jìn)行的給特定內(nèi)容分配標(biāo)簽的處理的說明所參考的流程圖。
圖15是顯示由潛在空間偏差計算單元計算的作為內(nèi)容和標(biāo)簽之間的典型偏差的偏差的圖表。
圖16顯示由內(nèi)容提供設(shè)備所進(jìn)行的搜索內(nèi)容的處理的說明所參考的流程圖。
圖17是顯示由潛在空間偏差計算單元計算的作為內(nèi)容和標(biāo)簽之間的典型偏差的典型偏差的圖表。
圖18是顯示內(nèi)容提供設(shè)備的另一典型功能配置的功能方框圖。
圖19顯示由圖18所示的內(nèi)容提供設(shè)備所進(jìn)行的學(xué)習(xí)處理的說明所參考的流程圖。
圖20是顯示對于音樂內(nèi)容的典型環(huán)境信息的圖表。
圖21是顯示基于潛在空間的作為環(huán)境信息的典型表述的表述的圖表。
圖22是顯示內(nèi)容提供設(shè)備的再一典型功能配置的功能方框圖。
圖23顯示圖22所示的內(nèi)容提供設(shè)備所進(jìn)行的學(xué)習(xí)處理的說明所參考的流程圖。
圖24是顯示作為用戶喜好的音樂內(nèi)容的典型喜好信息的圖表。
圖25是顯示基于潛在空間的作為喜好信息的典型表述的表述的圖表。
圖26是顯示環(huán)境的典型特性特征的圖表。
圖27是顯示內(nèi)容提供設(shè)備的再一典型功能配置的功能方框圖。
圖28顯示由圖27所示的內(nèi)容提供設(shè)備所進(jìn)行的學(xué)習(xí)處理的說明所參考的流程圖。
圖29顯示計算標(biāo)簽信息的處理的細(xì)節(jié)的說明所參考的流程圖。
圖30是顯示詞素的典型分析的圖表。
圖31是顯示內(nèi)容提供設(shè)備的再一典型功能配置的功能方框圖。
圖32顯示由圖31所示的內(nèi)容提供設(shè)備所進(jìn)行的學(xué)習(xí)處理的說明所參考的流程圖。
圖33是顯示基于潛在空間的作為標(biāo)簽的典型表述的表述的圖表。
圖34是顯示每個短語的典型特性特征的圖表。
圖35是顯示展示諸如評論音樂內(nèi)容的句子的句子的典型顯示的顯示單元的圖表。
圖36是顯示用于在學(xué)習(xí)階段進(jìn)行處理的內(nèi)容提供設(shè)備的典型功能配置的功能方框圖。
圖37是顯示用于在操作階段進(jìn)行處理的客戶終端設(shè)備的典型功能配置的功能方框圖。
[參考數(shù)字說明] 1內(nèi)容提供設(shè)備 11CPU 12ROM 13RAM 16輸入單元 17輸出單元 18記錄單元 19通信單元 20驅(qū)動器 21可移動介質(zhì) 51內(nèi)容存儲單元 52內(nèi)容特征量抽取單元 53內(nèi)容特征量存儲單元 54標(biāo)簽信息抽取單元 55標(biāo)簽信息存儲單元 56關(guān)聯(lián)信息計算單元 57內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元 58標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元 59內(nèi)容特征量-潛在空間轉(zhuǎn)換單元 60標(biāo)簽信息-潛在空間轉(zhuǎn)換單元 61潛在空間偏差計算單元 62標(biāo)簽選擇單元 63內(nèi)容選擇單元 111環(huán)境信息抽取單元 112環(huán)境信息存儲單元 113環(huán)境信息-潛在空間關(guān)聯(lián)信息存儲單元 151喜好信息抽取單元 152喜好信息存儲單元 153喜好信息-潛在空間關(guān)聯(lián)信息存儲單元 171文本存儲單元 181特性-特征計算單元 182特征-短語選擇單元 183短語顯示控制單元 184顯示單元 201客戶終端設(shè)備
具體實施例方式 通過參考如下圖表來說明本發(fā)明的實施例。
圖1是顯示內(nèi)容提供設(shè)備中使用的硬件的典型配置的說明方框圖。
在圖1所示的內(nèi)容提供設(shè)備1中,CPU(中央處理單元)11通過執(zhí)行每個都存儲于ROM(只讀存儲器)12中的程序或者每個都從記錄單元18中載入RAM(隨機存取存儲器)13的程序來進(jìn)行各種處理。RAM 13還用于適當(dāng)?shù)卮鎯Ω鞣N信息,諸如在處理的執(zhí)行中CPU 11所需的數(shù)據(jù)。
CPU 11、ROM 12和RAM 13通過總線14相互連接??偩€14還被連接于輸入/輸出接口15。
輸入/輸出接口15還被連接于輸入單元16、輸出單元17、上面引用的記錄單元18和通信單元19。輸入單元16包括鍵盤和鼠標(biāo),而輸出單元17包括諸如LCD(液晶顯示器)單元的顯示單元和揚聲器。記錄單元18具有典型包括硬盤的配置。通信單元19是用于通過諸如因特網(wǎng)的網(wǎng)絡(luò)來控制與其他設(shè)備之間的通信處理的單元。
如果必要,輸入/輸出接口15還被連接于在其上安裝了可移動記錄介質(zhì)21的驅(qū)動器20??梢苿佑涗浗橘|(zhì)21可以是磁盤、光盤、磁光盤或者半導(dǎo)體存儲器。當(dāng)可移動記錄介質(zhì)21被安裝在驅(qū)動器20上時,如果必需,驅(qū)動器20從可移動記錄介質(zhì)21讀出計算機程序并把該程序安裝在記錄單元18中。
要注意,內(nèi)容提供設(shè)備1中使用的硬件的配置決不局限于圖1所示的那樣。也就是說,內(nèi)容提供設(shè)備1可以被提供有任何硬件配置,只要該硬件包括至少如稍后將參考圖2所描述的一個功能配置即可。
圖2是顯示內(nèi)容提供設(shè)備1的典型功能配置的功能方框圖。
內(nèi)容提供設(shè)備1是進(jìn)行諸如典型地從所記錄的內(nèi)容中抽取特征量的處理和把所抽取的特征量(或者稍后將描述的內(nèi)容特征量)與關(guān)鍵詞(或者稍后將描述的標(biāo)簽信息)相關(guān)聯(lián)的處理的預(yù)定處理的設(shè)備。內(nèi)容提供設(shè)備1是由本發(fā)明提供的典型的信息處理設(shè)備。
內(nèi)容提供設(shè)備1包括內(nèi)容存儲單元51、內(nèi)容特征量抽取單元52、內(nèi)容特征量存儲單元53、標(biāo)簽信息抽取單元54、標(biāo)簽信息存儲單元55、關(guān)聯(lián)信息計算單元56、內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57、標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58、內(nèi)容特征量-潛在空間轉(zhuǎn)換單元59、標(biāo)簽信息-潛在空間轉(zhuǎn)換單元60、潛在空間偏差計算單元61、標(biāo)簽選擇單元62和內(nèi)容選擇單元63。
內(nèi)容特征量抽取單元52從存儲(或保存)于內(nèi)容存儲單元51中的內(nèi)容中抽取內(nèi)容特征量。內(nèi)容特征量抽取單元52把所抽取的內(nèi)容特征量存儲于內(nèi)容特征量存儲單元53中。
在這種情況下,所存儲的內(nèi)容一般僅僅指的是內(nèi)容。內(nèi)容的示例是各種信息、書籍、句子和數(shù)據(jù)庫。作為內(nèi)容所使用的信息包括電視節(jié)目、電影、照片和音樂作品(運動圖片、靜態(tài)圖片、聲音或它們的組合)。要注意,在下面描述的實施例中,音樂內(nèi)容,即用作內(nèi)容的一段音樂,被視為典型內(nèi)容。
內(nèi)容特征量是表述內(nèi)容的特征的數(shù)值。例如,在音樂內(nèi)容的情況下,每個都由數(shù)值表述的特征作為一段音樂的特征,包括這段音樂的速度(節(jié)奏)、歡快度和聲壓。例如,音樂內(nèi)容的歡快度是用于指示一段大調(diào)音樂是一段歡快的音樂而一段小調(diào)音樂是一段憂郁的音樂。聲壓是當(dāng)相比于無聲音存在的狀態(tài)而有聲音存在時所應(yīng)用的壓力。
標(biāo)簽信息抽取單元54抽取關(guān)于存儲(或保存)于內(nèi)容存儲單元51中的內(nèi)容的標(biāo)簽信息。標(biāo)簽信息抽取單元54把所抽取的標(biāo)簽信息存儲(或保存)于標(biāo)簽信息存儲單元55中。
關(guān)于內(nèi)容的標(biāo)簽信息是顯示內(nèi)容的屬性的信息。更具體地,關(guān)于內(nèi)容的標(biāo)簽信息是顯示內(nèi)容特有的屬性的信息。關(guān)于內(nèi)容的標(biāo)簽信息可以被用于識別被包括在例如評論內(nèi)容的句子、內(nèi)容的歌詞、內(nèi)容標(biāo)題或作為內(nèi)容的運動圖片的斷續(xù)器(ticker)中的單詞、符號或標(biāo)記。關(guān)于內(nèi)容的標(biāo)簽信息還可以被用于給內(nèi)容分配諸如權(quán)重的量。
關(guān)聯(lián)信息計算單元56計算關(guān)聯(lián)存儲于內(nèi)容特征量存儲單元53中的內(nèi)容特征量和存儲于標(biāo)簽信息存儲單元55中的標(biāo)簽信息的信息。關(guān)聯(lián)信息計算單元56把所計算的對于內(nèi)容特征量的關(guān)聯(lián)信息存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57并把所計算的對于標(biāo)簽信息的關(guān)聯(lián)信息存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58。
如稍后將詳細(xì)描述的,關(guān)聯(lián)信息被定義為用于關(guān)聯(lián)內(nèi)容與標(biāo)簽信息的信息。關(guān)聯(lián)信息通過利用將稍后描述的潛在變量zk來關(guān)聯(lián)內(nèi)容與標(biāo)簽信息。
基于存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中的關(guān)聯(lián)信息,內(nèi)容特征量-潛在空間轉(zhuǎn)換單元59進(jìn)行轉(zhuǎn)換處理以把所抽取的內(nèi)容特征量放置于潛在空間中。內(nèi)容特征量-潛在空間轉(zhuǎn)換單元59把轉(zhuǎn)換處理的結(jié)果供應(yīng)給潛在空間偏差計算單元61。
基于存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中的關(guān)聯(lián)信息和從內(nèi)容特征量-潛在空間轉(zhuǎn)換單元59中接收的作為由內(nèi)容特征量-潛在空間轉(zhuǎn)換單元59進(jìn)行的以把所抽取的內(nèi)容特征量放置于潛在空間中的轉(zhuǎn)換處理的結(jié)果的轉(zhuǎn)換處理結(jié)果,潛在空間偏差計算單元61計算內(nèi)容與每個標(biāo)簽之間的偏差。潛在空間偏差計算單元61把所計算的偏差供應(yīng)給標(biāo)簽選擇單元62。
標(biāo)簽選擇單元62基于從潛在空間偏差計算單元61中接收的所計算的偏差來選擇標(biāo)簽。
基于存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中的關(guān)聯(lián)信息,標(biāo)簽信息-潛在空間轉(zhuǎn)換單元60進(jìn)行轉(zhuǎn)換處理以把所處理的標(biāo)簽放置于潛在空間中。標(biāo)簽信息-潛在空間轉(zhuǎn)換單元60把轉(zhuǎn)換處理的結(jié)果供應(yīng)給潛在空間偏差計算單元61。
基于存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中的關(guān)聯(lián)信息和從標(biāo)簽信息-潛在空間轉(zhuǎn)換單元60中接收的作為由標(biāo)簽信息-潛在空間轉(zhuǎn)換單元60進(jìn)行的以把所處理的標(biāo)簽放置于潛在空間中的轉(zhuǎn)換處理的結(jié)果的轉(zhuǎn)換處理結(jié)果,潛在空間偏差計算單元61計算每個內(nèi)容與標(biāo)簽之間的偏差。潛在空間偏差計算單元61把計算的偏差提供給內(nèi)容選擇單元63。
內(nèi)容選擇單元63基于從潛在空間偏差計算單元61中接收的所計算的偏差來選擇內(nèi)容。
在上述實施例中,內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57和標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58是彼此分離的。然而,要注意,這兩個單元還可以被集成為單一單元。在這種情況下,作為集成內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57和標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58的結(jié)果所得到的單一單元被用于存儲對于內(nèi)容特征量的關(guān)聯(lián)信息和對于標(biāo)簽信息的關(guān)聯(lián)信息。
順帶提及,由內(nèi)容提供設(shè)備1進(jìn)行的處理可以被分為兩大類。第一類是關(guān)聯(lián)內(nèi)容特征量與標(biāo)簽信息的學(xué)習(xí)處理。在下面的描述中,學(xué)習(xí)處理還被稱為學(xué)習(xí)階段。第二類是用于進(jìn)行實際操作的操作處理。在下面的描述中,操作處理還被稱為操作階段。在典型的操作處理中,通過利用在學(xué)習(xí)階段彼此關(guān)聯(lián)的內(nèi)容特征量和標(biāo)簽信息之間的關(guān)系來將標(biāo)簽貼在另一內(nèi)容上。在另一種典型的操作處理中,內(nèi)容被搜索。在本說明書中,首先,學(xué)習(xí)階段通過參考圖3至13來說明。然后,操作階段通過參考圖14至16來描述。
首先,由圖2所示的內(nèi)容提供設(shè)備1進(jìn)行的學(xué)習(xí)處理通過下面參考圖3所示的流程圖來說明。
在步驟S11,內(nèi)容特征量抽取單元52從內(nèi)容中抽取內(nèi)容特征量并把所抽取的內(nèi)容特征量存儲(或保存)于內(nèi)容特征量存儲單元53中。例如,在步驟S11,內(nèi)容特征量抽取單元52從存儲于內(nèi)容存儲單元51中的內(nèi)容中抽取諸如每個音樂內(nèi)容的速度、歡快度和聲壓的內(nèi)容特征量,并且把所抽取的內(nèi)容特征量存儲于內(nèi)容特征量存儲單元53中。
具體地,讓我們假設(shè)例如內(nèi)容1至10已經(jīng)被存儲于內(nèi)容存儲單元51中作為音樂內(nèi)容。在這種情況下,內(nèi)容特征量抽取單元52抽取如圖4所示的那些的內(nèi)容特征量。
圖4是顯示音樂內(nèi)容的典型特征量的圖表。
在圖4所示的典型表格中,第一列和第一行各自顯示項目。第一列上顯示的項目每個都是存儲于內(nèi)容存儲單元51中的音樂內(nèi)容的名字。另一方面,第一行所示的項目每個都是對于第一列上顯示的音樂內(nèi)容的內(nèi)容特征量的名字。在這種情況下,典型地,對于每個音樂內(nèi)容的內(nèi)容特征量是對于音樂內(nèi)容的速度、歡快度和聲壓。
第一行所示的作為從左側(cè)起第二個項目的項目是被稱為音樂內(nèi)容的速度的內(nèi)容特征量。該速度是表述所抽取的內(nèi)容特征量的數(shù)值。典型地,速度的數(shù)值指示,數(shù)值越接近于0,音樂內(nèi)容的速度越低(或音樂內(nèi)容的節(jié)奏越慢),而數(shù)值越接近于100,音樂內(nèi)容的速度越高(或音樂內(nèi)容的節(jié)奏越快)。
用相同的方式,第一行所示的作為從左側(cè)起第三個項目的項目是被稱為音樂內(nèi)容的歡快度的內(nèi)容特征量。典型地,歡快度的數(shù)值指示,數(shù)值越接近于0,對于音樂內(nèi)容的感覺越憂郁(或音樂內(nèi)容越接近于小調(diào)音樂),而數(shù)值越接近于100,對于音樂內(nèi)容的感覺越歡快(或音樂內(nèi)容越接近于大調(diào)音樂)。以同樣的方式,第一行所示的作為從左側(cè)起第四個項目的項目是被稱為音樂內(nèi)容的聲壓的內(nèi)容特征量。典型地,聲壓的數(shù)值指示,數(shù)值越接近于0,聲壓越低,數(shù)值越接近于100,聲壓越高。
也就是說,如圖4所示,內(nèi)容特征量抽取單元52從第二行所示的內(nèi)容1中抽取典型速度數(shù)值71、典型歡快度數(shù)值52和典型聲壓數(shù)值58,作為內(nèi)容特征量。用相同的方式,內(nèi)容特征量抽取單元52從第三行所示的內(nèi)容2中抽取典型速度數(shù)值53、典型歡快度數(shù)值65和典型聲壓數(shù)值67,作為內(nèi)容特征量。以同樣的方式,內(nèi)容特征量抽取單元52從第四行所示的內(nèi)容3中抽取典型速度數(shù)值47、典型歡快度數(shù)值75和典型聲壓數(shù)值51,作為內(nèi)容特征量。同樣地,內(nèi)容特征量抽取單元52從第五行所示的內(nèi)容4中抽取典型速度數(shù)值59、典型歡快度數(shù)值55和典型聲壓數(shù)值48,作為內(nèi)容特征量。
類似地,內(nèi)容特征量抽取單元52從第六行所示的內(nèi)容5中抽取典型速度數(shù)值57、典型歡快度數(shù)值52和典型聲壓數(shù)值59,作為內(nèi)容特征量。用相同的方式,內(nèi)容特征量抽取單元52從第七行所示的內(nèi)容6中抽取典型速度數(shù)值39、典型歡快度數(shù)值39和典型聲壓數(shù)值31,作為內(nèi)容特征量。以同樣的方式,內(nèi)容特征量抽取單元52從第八行所示的內(nèi)容7中抽取典型速度數(shù)值45、典型歡快度數(shù)值55和典型聲壓數(shù)值40,作為內(nèi)容特征量。
同樣地,內(nèi)容特征量抽取單元52從第九行所示的內(nèi)容8中抽取典型速度數(shù)值34、典型歡快度數(shù)值34和典型聲壓數(shù)值34,作為內(nèi)容特征量。類似地,內(nèi)容特征量抽取單元52從第十行所示的內(nèi)容9中抽取典型速度數(shù)值39、典型歡快度數(shù)值27和典型聲壓數(shù)值45,作為內(nèi)容特征量。用相同的方式,內(nèi)容特征量抽取單元52從第十一行所示的內(nèi)容10中抽取典型速度數(shù)值36、典型歡快度數(shù)值45和典型聲壓數(shù)值46,作為內(nèi)容特征量。
然后,內(nèi)容特征量抽取單元52把圖4所示的每個內(nèi)容特征量存儲于內(nèi)容特征量存儲單元53中作為從內(nèi)容1到10中抽取的內(nèi)容特征量。
換句話說,內(nèi)容特征量抽取單元52可以說是從存儲于內(nèi)容存儲單元51中的作為使得其上貼了標(biāo)簽信息的內(nèi)容的每個音樂內(nèi)容中抽取內(nèi)容特征量,并把所抽取的內(nèi)容特征量存儲于內(nèi)容特征量存儲單元53中作為對于音樂內(nèi)容的向量。
在上述實施例中,從音樂內(nèi)容中抽取的典型內(nèi)容特征量是內(nèi)容的速度、歡快度和聲壓。然而,要注意,本發(fā)明的實現(xiàn)決不局限于本實施例。例如,從所處理的音樂內(nèi)容中抽取的內(nèi)容特征量還可以是關(guān)于音樂內(nèi)容的另一特征量。關(guān)于音樂內(nèi)容的其它特征量的例子有音樂內(nèi)容的碼(code)、碼進(jìn)程和聲源類型。
讓我們返回參考圖3所示的流程圖。在步驟S12,標(biāo)簽信息抽取單元54抽取標(biāo)簽信息,并把所抽取的標(biāo)簽信息存儲(或保存)于標(biāo)簽信息存儲單元55中。例如,在步驟S12,標(biāo)簽信息抽取單元54從評論存儲于內(nèi)容存儲單元51中的內(nèi)容的文本中抽取標(biāo)簽信息,并且把所抽取的標(biāo)簽信息存儲于標(biāo)簽信息存儲單元55中。關(guān)于作為對于音樂內(nèi)容的標(biāo)簽信息的單詞的所抽取的標(biāo)簽信息的例子是在評論該內(nèi)容的文本中該單詞被使用的次數(shù)。
具體地,讓我們假設(shè)例如內(nèi)容1至10已經(jīng)被存儲于內(nèi)容存儲單元51中。在這種情況下,對于評論內(nèi)容1至10的文本,標(biāo)簽信息抽取單元54進(jìn)行詞素分析以把評論內(nèi)容的每個文本劃分為單詞,并抽取如圖5所示的那些的標(biāo)簽信息。如圖所示,標(biāo)簽信息是從詞素分析中得到的詞在評論內(nèi)容1到10的文本中被使用的次數(shù)。
圖5是顯示音樂內(nèi)容的典型標(biāo)簽信息的圖表。
在圖5所示的典型表格中,第一列和第一行各自顯示項目。第一列上所示的項目是存儲于內(nèi)容存儲單元51中的每個音樂內(nèi)容的名字。另一方面,第一行上所示的項目是關(guān)于第一列上所示的音樂內(nèi)容的每個標(biāo)簽信息。在該典型表格中,標(biāo)簽信息的名字是用于評論音樂內(nèi)容的每個文本中的單詞“舒適的”、“愉快的”、“瘋狂的”、“沉重的”和“輕快的”。
第一行所示的作為從左側(cè)起第二個項目的項目是用作關(guān)于每個音樂內(nèi)容的標(biāo)簽信息的單詞“舒適的”。用作關(guān)于每個音樂內(nèi)容的標(biāo)簽信息的單詞“舒適的”代表在評論一個音樂內(nèi)容的每個文本中單詞“舒適的”出現(xiàn)的次數(shù)。用相同的方式,第一行所示的作為從左側(cè)起第三個項目的項目是用作關(guān)于每個音樂內(nèi)容的標(biāo)簽信息的單詞“愉快的”。用作關(guān)于每個音樂內(nèi)容的標(biāo)簽信息的單詞“愉快的”代表在評論一個音樂內(nèi)容的每個文本中單詞“愉快的”出現(xiàn)的次數(shù)。以同樣的方式,第一行所示的作為從左側(cè)起第四、五、六個項目的其余項目是用作關(guān)于每個音樂內(nèi)容的標(biāo)簽信息的單詞“瘋狂的”、“沉重的”和“輕快的”。用作關(guān)于每個音樂內(nèi)容的標(biāo)簽信息的單詞“瘋狂的”、“沉重的”和“輕快的”各自代表在評論一個音樂內(nèi)容的每個文本中單詞“瘋狂的”、“沉重的”和“輕快的”分別出現(xiàn)的次數(shù)。
也就是說,標(biāo)簽信息抽取單元54從評論第二行所示的內(nèi)容1的文本中抽取標(biāo)簽信息,作為指示如圖5所示的在文本中單詞“瘋狂的”使用的次數(shù)典型地為2而在文本中單詞“輕快的”使用的次數(shù)典型地為2的信息。用相同的方式,由標(biāo)簽信息抽取單元54從評論第三行所示的內(nèi)容2的文本中抽取的標(biāo)簽信息指示,如圖所示,在文本中單詞“愉快的”使用的次數(shù)典型地為1,在文本中單詞“瘋狂的”使用的次數(shù)典型地為1,在文本中單詞“輕快的”使用的次數(shù)典型地為1。以同樣的方式,由標(biāo)簽信息抽取單元54從評論第四行所示的內(nèi)容3的文本中抽取的標(biāo)簽信息指示,如圖所示,在文本中單詞“愉快的”使用的次數(shù)典型地為2,在文本中單詞“瘋狂的”使用的次數(shù)典型地為2。同樣地,由標(biāo)簽信息抽取單元54從評論第五行所示的內(nèi)容4的文本中抽取的標(biāo)簽信息指示,如圖所示,在文本中單詞“瘋狂的”使用的次數(shù)典型地為1,在文本中單詞“輕快的”使用的次數(shù)典型地為1。
類似地,由標(biāo)簽信息抽取單元54從評論第六行所示的內(nèi)容5的文本中抽取的標(biāo)簽信息指示,如圖所示,在文本中單詞“瘋狂的”使用的次數(shù)典型地為1,在文本中單詞“輕快的”使用的次數(shù)典型地為1。用相同的方式,由標(biāo)簽信息抽取單元54從評論第七行所示的內(nèi)容6的文本中抽取的標(biāo)簽信息指示,如圖所示,在文本中單詞“舒適的”使用的次數(shù)典型地為1,在文本中單詞“沉重的”使用的次數(shù)典型地為1。以同樣的方式,由標(biāo)簽信息抽取單元54從評論第八行所示的內(nèi)容7的文本中抽取的標(biāo)簽信息指示,如圖所示,在文本中單詞“瘋狂的”使用的次數(shù)典型地為1。
同樣地,由標(biāo)簽信息抽取單元54從評論第九行所示的內(nèi)容8的文本中抽取的標(biāo)簽信息指示,如圖所示,在文本中單詞“舒適的”使用的次數(shù)典型地為1,而在文本中單詞“沉重的”使用的次數(shù)典型地為2。類似地,由標(biāo)簽信息抽取單元54從評論第十行所示的內(nèi)容9的文本中抽取的標(biāo)簽信息指示,如圖所示,在文本中單詞“舒適的”使用的次數(shù)典型地為1。用相同的方式,由標(biāo)簽信息抽取單元54從評論第十一行的內(nèi)容10的文本中抽取的標(biāo)簽信息指示,如圖所示,在文本中單詞“舒適的”使用的次數(shù)典型地為2。
標(biāo)簽信息抽取單元54把如圖5所示的每條信息存儲于標(biāo)簽信息存儲單元55中作為從內(nèi)容1到10中抽取的標(biāo)簽信息。
在上述實施例中,單詞“舒適的”、“愉快的”、“瘋狂的”、“沉重的”和“輕快的”都被作為標(biāo)簽信息的例子。然而,要注意,本發(fā)明的實現(xiàn)決不局限于本實施例。例如,單詞“快速的”、“放松的”和“緩慢的”也可以作為標(biāo)簽信息。也就是說,任何單詞都可以作為對于音樂內(nèi)容的標(biāo)簽信息,只要該單詞被用在評論內(nèi)容的文本中。
讓我們返回參考圖3所示的流程圖。在步驟S13,關(guān)聯(lián)信息計算單元56進(jìn)行尋找對于內(nèi)容特征量的關(guān)聯(lián)信息和對于標(biāo)簽信息的關(guān)聯(lián)信息的處理。然后,關(guān)聯(lián)信息計算單元56把對于內(nèi)容特征量的關(guān)聯(lián)信息和對于標(biāo)簽信息的關(guān)聯(lián)信息分別存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57和標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中作為處理結(jié)果。然后,學(xué)習(xí)處理最終結(jié)束。
下面參考圖6所示的流程圖來說明在步驟S13由關(guān)聯(lián)信息計算單元56進(jìn)行的尋找關(guān)聯(lián)內(nèi)容特征量與標(biāo)簽信息的信息的處理的細(xì)節(jié)。
在步驟S21,關(guān)聯(lián)信息計算單元56計算關(guān)聯(lián)存儲于內(nèi)容特征量存儲單元53中的內(nèi)容特征量和存儲于標(biāo)簽信息存儲單元55的標(biāo)簽信息的信息。
下面說明關(guān)聯(lián)內(nèi)容特征量與標(biāo)簽信息的信息的細(xì)節(jié)。通常,內(nèi)容特征量的分布不同于通過關(guān)聯(lián)信息而被關(guān)聯(lián)于內(nèi)容特征量的標(biāo)簽信息的分布。因此,必須把內(nèi)容特征量的分布與標(biāo)簽信息的分布組合起來。具體地,連續(xù)量和離散量不能在相同空間被處理。因此,存在問題即如何把具有彼此不同分布的兩個空間組合起來。例如,如果在連續(xù)內(nèi)容特征量的情況下,諸如主成分分析、因素分析和混合正態(tài)分布(GMM(高斯混合模型))的技術(shù)在過去已經(jīng)被用于對內(nèi)容特征量的分布來建模。
在混合正態(tài)分布(GMM)中,觀測點的出現(xiàn)被視作從多個潛在正態(tài)分布的出現(xiàn)。在本實施例中,觀測點是用內(nèi)容特征量表述的單獨的音樂內(nèi)容。通常,其潛在分布參數(shù)基于似然性推斷的。EM(期望最大)算法是基于似然性來推斷潛在分布參數(shù)的典型的有代表性的一種方法。基于似然性來推斷潛在分布參數(shù)的其它方法包括利用貝葉斯推論概念的變值貝葉斯方法。
另一方面,音樂內(nèi)容的潛在信息的建模法典型地包括PLSA(概率潛在語義分析)。如上所述,音樂內(nèi)容的潛在信息包括在評論音樂內(nèi)容的文本中單詞使用的次數(shù)。在PLSA中,作為潛在變量的條件概率,文本和單詞的同時出現(xiàn)被表述以便基于似然性推斷它們的條件概率。
這些算法的共同點是以下事實在每個算法中,分布參數(shù)通過利用潛在變量來確定。因此,通過使?jié)撛谧兞砍蔀楣灿米兞?,可能得到以反映分布性質(zhì)為形式的潛在概念空間。在這種情況下,成為共同變量的潛在變量是用于表述內(nèi)容特征量分布的潛在變量和用于表述標(biāo)簽信息分布的潛在變量。
因此,作為示例,下面的描述通過采用本實施例中的EM算法作為通過使?jié)撛谧兞砍蔀楣餐兞慷l(fā)展的算法來說明參數(shù)的推論。在這種情況下,成為共同變量的潛在變量是用于內(nèi)容特征量分布的混合正態(tài)分布(GMM)的潛在變量和用于標(biāo)簽信息分布的PLSA的潛在變量。
圖7是顯示在潛在變量是與內(nèi)容特征量的混合正態(tài)分布(GMM)和標(biāo)簽信息的PLSA共用的變量的情況下的典型圖形模型的圖表。
在圖7所示的典型圖形模型中,符號zk(={z1,z2,z3,zk})表示潛在變量。符號k表示獨立的潛在變量z1、z2、z3、zk的個數(shù)。通常,獨立的潛在變量z1、z2、z3、zk此后共同地僅僅被稱為潛在變量zk。符號sn表示內(nèi)容,此后被稱為內(nèi)容sn。符號wi表示標(biāo)簽,此后被稱為標(biāo)簽wi。符號p(sn|zk)表示內(nèi)容sn出現(xiàn)的條件概率。用相同的方式,符號p(wi|zk)表示標(biāo)簽wi出現(xiàn)的條件概率。由先驗概率p(zk)確定的潛在變量zk是對于條件概率p(sn|zk)和p(wi|zk)來說共用的潛在變量。
也就是說,潛在變量zk關(guān)聯(lián)內(nèi)容sn與標(biāo)簽wi。
這里,讓我們假設(shè)例如標(biāo)簽wi的出現(xiàn)是通過利用條件概率p(wi|zk)從潛在變量zk中確定的。另一方面,內(nèi)容特征量的分布是通過利用對于潛在變量zk的均值向量和方差-協(xié)方差矩陣(諸如顯示變量方差和對于所有變量組合的協(xié)方差的矩陣)確定的。在這種情況下,內(nèi)容sn和標(biāo)簽wi同時出現(xiàn)的概率通過如下給出的式(1)來表述。
[式1] 在式1中,先驗概率p(zk)等于αk(即,p(zk)=αk),并且等式p(sn|zk)通過如下給出的式(2)來表述 [式2] 在式(2)中,符號fn表示第n個內(nèi)容的內(nèi)容特征量。符號μk表示對于潛在變量zk的均值向量。在下面的描述中,對于潛在變量zk的均值向量被稱為均值向量μk。符號Sk表示對于潛在變量zk的方差-協(xié)方差矩陣。在下面的描述中,對于潛在變量zk的方差-協(xié)方差矩陣被稱為方差-協(xié)方差矩陣Sk。符號F表示內(nèi)容特征量的維數(shù)。
在這種情況下,EM算法的Q函數(shù)通過如下給出的式(3)來表述 [式3] 要注意,符號c(wi,sn)表示標(biāo)簽wi出現(xiàn)在內(nèi)容sn中的次數(shù)或權(quán)值。符號θ(t)表示在第t次重復(fù)中的參數(shù)。
因此,從式(3),E-步驟(期望步驟)通過如下給出的式(4)來表述 [式4] 另一方面,M-步驟(最大值化步驟)通過如下給出的式(5)、(6)、(7)和(8)來表述 [式5] [式6] [式7] [式8] 也就是說,即為關(guān)聯(lián)信息的均值向量μk、方差-協(xié)方差矩陣Sk、αk和p(wi|zk),分別依照式(5)、(6)、(7)和(8)來計算。
例如,在步驟S21,基于存儲于內(nèi)容特征量存儲單元53中的對于內(nèi)容1到10這10個音樂內(nèi)容的每個的內(nèi)容特征量和存儲于標(biāo)簽信息存儲單元55中的對于10個音樂內(nèi)容的每個的標(biāo)簽信息,在其中使用了兩個潛在變量z1和z2(或者使用二維潛在變量)的情況下,關(guān)聯(lián)信息計算單元56依照式(1)至(8)計算μk、Sk、αk和p(wi|zk)作為關(guān)聯(lián)信息。如圖4所示,對于每個音樂內(nèi)容的內(nèi)容特征量是音樂內(nèi)容的速度、歡快度和聲壓。另一方面,每個音樂內(nèi)容的標(biāo)簽信息涉及如圖5所示的單詞“舒適的”、“愉快的”、“瘋狂的”、“沉重的”和“輕快的”。
參考圖8至13,下面的描述更具體地說明了由關(guān)聯(lián)信息計算單元56計算的關(guān)聯(lián)信息。首先,參考圖8至10描述潛在空間中的內(nèi)容和標(biāo)簽的典型位置。
圖8是顯示基于潛在空間的作為對于內(nèi)容的典型表述的表述的圖表。更具體地,圖8顯示了音樂內(nèi)容的潛在空間表述作為根據(jù)條件概率p(zk|sn)的典型值。
在圖8所示的典型表格中,第一列和第一行各自顯示項目。第一列所示的項目每個都是存儲于內(nèi)容存儲單元51中的音樂內(nèi)容的名字。另一方面,第一行所示的項目是對于第一列所示的每個音樂內(nèi)容的兩個潛在變量。這兩個潛在變量是潛在變量z1和z2。
如圖8所示,作為潛在變量z1的值,關(guān)聯(lián)信息計算單元56產(chǎn)生對于第二行所示的內(nèi)容1的典型的計算結(jié)果0.9,對于第三行所示的內(nèi)容2的典型的計算結(jié)果0.7,對于第四行所示的內(nèi)容3的典型的計算結(jié)果0.6,對于第五行所示的內(nèi)容4的典型的計算結(jié)果0.65,對于第六行所示的內(nèi)容5的典型的計算結(jié)果0.6,對于第七行所示的內(nèi)容6的典型的計算結(jié)果0.2,對于第八行所示的內(nèi)容7的典型的計算結(jié)果0.4,對于第九行所示的內(nèi)容8的典型的計算結(jié)果0.1,對于第十行所示的內(nèi)容9的典型的計算結(jié)果0.3和對于第十一行所示的內(nèi)容10的典型的計算結(jié)果0.4。
也就是說,內(nèi)容1至10中的每個都通過潛在變量z1與標(biāo)簽關(guān)聯(lián)。
用相同的方式,如圖8所示,作為潛在變量z2的值,關(guān)聯(lián)信息計算單元56產(chǎn)生對于第二行所示的內(nèi)容1的典型的計算結(jié)果0.1,對于第三行所示的內(nèi)容2的典型的計算結(jié)果0.3,對于第四行所示的內(nèi)容3的典型的計算結(jié)果0.4,對于第五行所示的內(nèi)容4的典型的計算結(jié)果0.35,對于第六行所示的內(nèi)容5的典型的計算結(jié)果0.4,對于第七行所示的內(nèi)容6的典型的計算結(jié)果0.8,對于第八行所示的內(nèi)容7的典型的計算結(jié)果0.6,對于第九行所示的內(nèi)容8的典型的計算結(jié)果0.8,對于第十行所示的內(nèi)容9的典型的計算結(jié)果0.7和對于第十一行所示的內(nèi)容10的典型的計算結(jié)果0.6。
也就是說,內(nèi)容1至10中的每個都通過潛在變量z2與標(biāo)簽關(guān)聯(lián)。
圖9是顯示基于潛在空間的作為對于標(biāo)簽信息的典型表述的表述的圖表。具體地,圖9顯示了作為標(biāo)簽被包含在評論音樂內(nèi)容的句子中的單詞的作為條件概率p(zk|wi)的典型值的潛在空間表述。
在圖9所示的典型表格中,第一列和第一行各自顯示項目。第一列所示的項目每個都是用于評論存儲于內(nèi)容存儲單元51中的音樂內(nèi)容的句子的標(biāo)簽。另一方面,第一行所示的項目是對于第一列所示的每個標(biāo)簽的兩個潛在變量。這兩個潛在變量是潛在變量z1和z2。
如圖9所示,作為對于潛在變量z1的值,關(guān)聯(lián)信息計算單元56產(chǎn)生對于第二行所示的單詞“舒適的”的典型的計算結(jié)果0.1,對于第三行所示的單詞“愉快的”的典型的計算結(jié)果0.7,對于第四行所示的單詞“瘋狂的”的典型的計算結(jié)果0.7,對于第五行所示的單詞“沉重的”的典型的計算結(jié)果0.2,對于第六行所示的單詞“輕快的”的典型的計算結(jié)果0.9。
也就是說,每個都作為標(biāo)簽使用的每個單詞“舒適的”、“愉快的”、“瘋狂的”、“沉重的”和“輕快的”通過潛在變量z1與音樂內(nèi)容關(guān)聯(lián)。
用相同的方式,如圖9所示,作為對于潛在變量z2的值,關(guān)聯(lián)信息計算單元56產(chǎn)生對于第二行所示的單詞“舒適的”的典型的計算結(jié)果0.9,對于第三行所示的單詞“愉快的”的典型的計算結(jié)果0.3,對于第四行所示的單詞“瘋狂的”的典型的計算結(jié)果0.3,對于第五行所示的單詞“沉重的”的典型的計算結(jié)果0.8,對于第六行所示的單詞“輕快的”的典型的計算結(jié)果0.1。
也就是說,每個都作為標(biāo)簽使用的每個單詞“舒適的”、“愉快的”、“瘋狂的”、“沉重的”和“輕快的”通過潛在變量z2與音樂內(nèi)容關(guān)聯(lián)。
圖10是顯示對于潛在變量zk的典型先驗概率的圖表。具體地,圖10顯示了先驗概率p(zk)=αk的典型值。
如圖10給出的表格中的第二行所示,先驗概率p(zk)=αk對于用作兩個潛在變量zk之一的潛在變量z1,典型值為0.48,對于用作另一個潛在變量的潛在變量z2,典型值為0.52。
以這種方式,使用作為兩個潛在變量zk的潛在變量z1和z2,關(guān)聯(lián)信息計算單元56通過利用式(1)至(8)把音樂內(nèi)容(即內(nèi)容1至10)和標(biāo)簽(即,單詞“舒適的”、“愉快的”、“瘋狂的”、“沉重的”和“輕快的”)放置于潛在空間中。
此外,如上所述,關(guān)聯(lián)信息計算單元56計算均值向量μk和方差-協(xié)方差矩陣Sk作為關(guān)聯(lián)信息。通過參考圖11至13,下面的描述說明均值向量μk和方差-協(xié)方差矩陣Sk的具體例子。
首先,通過參考圖11至12,下面的描述說明通過關(guān)聯(lián)信息計算單元56輸出的作為對于潛在變量zk的矩陣的方差-協(xié)方差矩陣Sk。
圖11是顯示對于潛在變量z1的典型方差-協(xié)方差矩陣S1的圖表。
在圖11所示的典型表格中,第一列和第一行各自顯示項目。第一列所示的項目是存儲于內(nèi)容存儲單元51中的音樂內(nèi)容的內(nèi)容特征量的每個(名字)。另一方面,第一行所示的項目是存儲于內(nèi)容存儲單元51中的音樂內(nèi)容的內(nèi)容特征量的每個(名字)。
如圖11給出的表格中的第二行所示,作為方差-協(xié)方差矩陣S1的元素,關(guān)聯(lián)信息計算單元56產(chǎn)生對于速度列和速度行的典型的計算結(jié)果80,對于速度列和歡快度行的典型的計算結(jié)果-30,對于速度列和聲壓行的典型的計算結(jié)果5。
此外,用相同的方式,如圖11給出的表格中的第三行所示,作為方差-協(xié)方差矩陣S1的元素,關(guān)聯(lián)信息計算單元56產(chǎn)生對于歡快度列和速度行的典型的計算結(jié)果-30,對于歡快度列和歡快度行的典型的計算結(jié)果100,對于歡快度列和聲壓行的典型的計算結(jié)果-10。計算結(jié)果-30與第二行和第三列交叉處的元素相同。
此外,用相同的方式,如圖11給出的表格中的第四行所示,作為方差-協(xié)方差矩陣S1的元素,關(guān)聯(lián)信息計算單元56產(chǎn)生對于聲壓列和速度行的典型的計算結(jié)果5,對于聲壓列和歡快度行的典型的計算結(jié)果-10,對于聲壓列和聲壓行的典型的計算結(jié)果50。計算結(jié)果5與第二行和第四列的交叉處的元素相同,而計算結(jié)果-10與第三行和第四列的交叉處的元素相同。
圖12是顯示對于潛在變量z2的典型方差-協(xié)方差矩陣S2的圖表。
在圖12所示的典型表格中,第一列和第一行各自顯示與圖11所示的表格相同的項目。因此,省略項目的說明。
如圖12給出的表格中的第二行所示,作為方差-協(xié)方差矩陣S2的元素,關(guān)聯(lián)信息計算單元56產(chǎn)生對于速度列和速度行的典型的計算結(jié)果30,對于速度列和歡快度行的典型的計算結(jié)果30,對于速度列和聲壓行的典型的計算結(jié)果10。
此外,用相同的方式,如圖12給出的表格中的第三行所示,作為方差-協(xié)方差矩陣S2的元素,關(guān)聯(lián)信息計算單元56產(chǎn)生對于歡快度列和速度行的典型的計算結(jié)果30,對于歡快度列和歡快度行的典型的計算結(jié)果90,對于歡快度列和聲壓行的典型的計算結(jié)果0。計算結(jié)果30與第二行和第三列的交叉處的元素相同。
此外,用相同的方式,如圖12給出的表格中的第四行所示,作為方差-協(xié)方差矩陣S2的元素,關(guān)聯(lián)信息計算單元56產(chǎn)生對于聲壓列和速度行的典型的計算結(jié)果10,對于聲壓列和歡快度行的典型的計算結(jié)果0,對于聲壓列和聲壓行的典型的計算結(jié)果50。計算結(jié)果10與第二行和第四列和交叉處的元素相同,而計算結(jié)果0與第三行和第四列的交叉處的元素相同。
通過參考圖13,下面的描述說明由關(guān)聯(lián)信息計算單元56計算的均值向量μk作為對于潛在變量zk的均值向量。更具體地,圖13是顯示對于潛在變量z1的典型均值向量μ1和對于潛在變量z2的典型均值向量μ2的圖表。
如圖13給出的表格中的第二列所示,作為對于潛在變量z1的均值向量μl的值,關(guān)聯(lián)信息計算單元56產(chǎn)生對于第二行的速度的典型的計算結(jié)果58,對于第三行的歡快度的典型的計算結(jié)果63,對于第四行的聲壓的典型的計算結(jié)果59。
此外,用相同的方式,如圖13給出的表格中的第三列所示,作為對于潛在變量z2的均值向量μ2的值,關(guān)聯(lián)信息計算單元56產(chǎn)生對于第二行的速度的典型的計算結(jié)果42,對于第三行的歡快度的典型的計算結(jié)果39,對于第四行的聲壓的典型的計算結(jié)果40。
如上所述,關(guān)聯(lián)信息計算單元56計算對于潛在變量z1的方差-協(xié)方差矩陣S1和均值向量μ1以及對于潛在變量z2的方差-協(xié)方差矩陣S2和均值向量μ2。
在上述實施例中,由關(guān)聯(lián)信息計算單元56進(jìn)行的計算關(guān)聯(lián)信息的處理被解釋為混合正態(tài)分布(GMM)和PLSA的典型組合。然而,要注意,內(nèi)容特征量的分布并不總是正態(tài)分布。例如,SAM(語義聚合模型)或者另一參數(shù)分布都可以用作內(nèi)容特征量的分布。此外,用于推斷參數(shù)的模型也決不局限于上述EM算法。也就是說,用于推斷參數(shù)的模型可以采用另一技術(shù)。
讓我們返回參考圖6所示的流程圖。在步驟S22,關(guān)聯(lián)信息計算單元56把關(guān)聯(lián)內(nèi)容特征量與潛在空間的所計算的信息存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中。
例如,關(guān)聯(lián)信息計算單元56把先驗概率值αk、方差-協(xié)方差矩陣Sk和均值向量μk存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中作為對于潛在變量zk所建立的關(guān)聯(lián)信息。具體地,在上述典型的關(guān)聯(lián)信息的情況下,關(guān)聯(lián)信息計算單元56把如圖10所示的先驗概率值α1和α2、如圖11所示的方差-協(xié)方差矩陣S1、如圖12所示的方差-協(xié)方差矩陣S2以及如圖13所示的均值向量μ1和μ2存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中。
然后,在接著的步驟S23,關(guān)聯(lián)信息計算單元56把關(guān)聯(lián)標(biāo)簽信息與潛在空間的所計算的信息存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中。然后,關(guān)聯(lián)信息計算單元56最終結(jié)束計算關(guān)聯(lián)信息的處理。
例如,在步驟S23,作為關(guān)聯(lián)信息,關(guān)聯(lián)信息計算單元56把對于潛在變量zk和標(biāo)簽wi的所有組合的條件概率p(wi|zk)和先驗概率值αk=p(zk)存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中。具體地,在上述典型的關(guān)聯(lián)信息的情況下,關(guān)聯(lián)信息計算單元56存儲如圖9所示作為潛在變量z1和z2和標(biāo)簽單詞“舒適的”、“愉快的”、“瘋狂的”、“沉重的”和“輕快的”的條件概率p(wi|zk)的條件概率p(wi|zk)、以及如圖10所示的先驗概率值αk=p(zk)。
要注意,潛在空間中的內(nèi)容的表述是條件概率p(zk|sn),而潛在空間中的標(biāo)簽的表述是條件概率p(zk|wi),其中k=1,2,k。
如上所述,通過進(jìn)行學(xué)習(xí)處理,內(nèi)容提供設(shè)備1把對于內(nèi)容特征量的關(guān)聯(lián)信息存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中,而把對于標(biāo)簽信息的關(guān)聯(lián)信息存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中。
換句話說,通過進(jìn)行學(xué)習(xí)處理,內(nèi)容提供設(shè)備1通過利用潛在變量zk,把具有分布的內(nèi)容特征量和具有不同于內(nèi)容特征量分布的分布的標(biāo)簽信息組合在一個潛在空間中。結(jié)果,內(nèi)容提供設(shè)備1關(guān)聯(lián)內(nèi)容與標(biāo)簽。
以這種方式,在學(xué)習(xí)階段,內(nèi)容提供設(shè)備1通過利用潛在空間(或潛在變量zk)把具有分布的內(nèi)容特征量和具有不同于內(nèi)容特征量分布的分布的標(biāo)簽信息組合起來。
接著,參考前面提到的圖14至16來說明操作階段。操作階段的描述開始于給內(nèi)容(音樂內(nèi)容)分配標(biāo)簽的處理的說明。然后,接著通過搜索匹配所給的關(guān)鍵詞(標(biāo)簽)的內(nèi)容(音樂內(nèi)容)的處理的描述,進(jìn)行給內(nèi)容分配標(biāo)簽的處理的說明。
首先,參考圖14所示的流程圖說明由內(nèi)容提供設(shè)備1進(jìn)行的給音樂內(nèi)容分配標(biāo)簽的處理。該處理典型地開始于用戶添加新的音樂內(nèi)容時。
在步驟S31,內(nèi)容特征量抽取單元52從內(nèi)容中抽取內(nèi)容特征量并且把所抽取的內(nèi)容特征量存儲(保存)于內(nèi)容特征量存儲單元53中。
例如,在步驟S31,內(nèi)容特征量抽取單元52從新添加的音樂內(nèi)容SNEW中抽取內(nèi)容特征量fNEW=(速度,歡快度和聲壓)=(55,65,45),并且把所抽取的內(nèi)容特征量fNEW存儲于內(nèi)容特征量存儲單元53中。
換句話說,由內(nèi)容特征量抽取單元52進(jìn)行的從新添加的音樂內(nèi)容SNEW中抽取內(nèi)容特征量的處理可以被稱為把對于新添加的音樂內(nèi)容SNEW的向量存儲于內(nèi)容特征量存儲單元53中的處理。
然后,在步驟S32,基于存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中的關(guān)聯(lián)信息,內(nèi)容特征量-潛在空間轉(zhuǎn)換單元59進(jìn)行轉(zhuǎn)換處理以把所抽取的內(nèi)容特征量放置于潛在空間中,并把轉(zhuǎn)換處理的結(jié)果供應(yīng)給潛在空間偏差計算單元61。
例如,在步驟S32,內(nèi)容特征量-潛在空間轉(zhuǎn)換單元59利用方差-協(xié)方差矩陣Sk和均值向量μk進(jìn)行把所抽取的內(nèi)容特征量fNEW=(55,65,45)放置于潛在空間中的轉(zhuǎn)換處理(或映射處理)。方差-協(xié)方差矩陣Sk和均值向量μk是存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中的關(guān)聯(lián)信息。方差-協(xié)方差矩陣的例子是圖11所示的方差-協(xié)方差矩陣S1和圖12所示的方差-協(xié)方差矩陣S2,而均值向量μk的例子是圖13所示的均值向量μ1和μ2。
具體地,從內(nèi)容特征量轉(zhuǎn)換到潛在空間的處理是依照如下給出的式(9)利用從之前通過參考圖3所示的流程圖說明的學(xué)習(xí)處理得到的分布參數(shù)的計算處理。
[式9] 也就是說,每個條件概率p(z1|SNEW)和p(z2|SNEW)都依照式(9)計算。
p(z1|SNEW)=p(z1)N(fNEW,μ1,S1)=0.48×1.48×10-5=7.09×10-6 p(z2|SNEW)=p(z2)N(fNEW,μ2,S2)=0.52×2.98×10-6=1.43×10-6 然后,作為上面計算的結(jié)果得到的條件概率p(z1|SNEW)5=7.09×10-6和p(z2|SNEW)=1.43×10-6被歸一化,以給出條件概率p(z|SNEW)=(0.83,0.17)。
要注意,由于音樂內(nèi)容的先驗概率p(sn)通常不清晰,所以它們?nèi)勘蛔鳛榈雀怕蕘硖幚?。然而,所述條件概率可以通過使用所有觀測值的分布來計算。
在接下來的步驟S33,基于作為把內(nèi)容特征量放置于潛在空間中的轉(zhuǎn)換處理結(jié)果的從內(nèi)容特征量-潛在空間轉(zhuǎn)換單元59中接收的轉(zhuǎn)換處理結(jié)果和存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中的關(guān)聯(lián)信息,潛在空間偏差計算單元61計算在內(nèi)容和每個標(biāo)簽之間的偏差并把所計算的偏差供應(yīng)給標(biāo)簽選擇單元62。
具體地,依照如下給出的式(10),在內(nèi)容和標(biāo)簽之間的偏差被典型地作為標(biāo)簽的條件概率來計算。
[式10] 在內(nèi)容和標(biāo)簽之間的偏差的計算決不局限于根據(jù)上面給出的式(10)的計算。例如在內(nèi)容和標(biāo)簽之間的偏差也可以如Kullback-Leibler偏差或者此后簡稱為JS偏差的Jensen-Shannon偏差來計算。Kullback-Leibler偏差和JS偏差是代表潛在空間中的內(nèi)容的表述的條件概率p(zk|sn)和代表潛在空間中的標(biāo)簽的表述的條件概率p(zk|wi)之間的偏差。
例如,Kullback-Leibler偏差依照如下給出的式(11)來計算。
[式11] 另一方面,JS偏差典型地依照如下給出的式(12)來計算。
[式12] 要注意,實際上,即使?jié)撛诳臻g不是歐幾里得空間,為了簡化計算處理,在內(nèi)容和標(biāo)簽之間的偏差還可能例如作為歐幾里得偏差或?qū)?yīng)于K的差異之和來計算,其中K是潛在變量的個數(shù)。
也就是說,基于從內(nèi)容特征量-潛在空間轉(zhuǎn)換單元59中接收的被存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中的條件概率p(z|SNEW)=(0.83,0.17)和條件概率p(wi|zk)和先驗概率αk=p(zk),潛在空間偏差計算單元61通過利用式(12)來計算存在于潛在空間中的內(nèi)容和每個標(biāo)簽之間的偏差(或者,嚴(yán)格地說,JS偏差)。
圖15是顯示每個都由潛在空間偏差計算單元61計算的作為內(nèi)容和標(biāo)簽之間的典型偏差的偏差的圖表。
在圖15所示的典型表格中,例如,第一列顯示存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中的標(biāo)簽(或單詞)而第二列顯示由潛在空間偏差計算單元61計算的作為內(nèi)容和第一行所示的標(biāo)簽之間偏差的偏差。要注意,圖15顯示依照式(12)計算的典型偏差作為內(nèi)容和標(biāo)簽之一之間的JS偏差。
如圖15所示,潛在空間偏差計算單元61給出第二行所示的典型JS偏差0.3000作為音樂內(nèi)容SNEW和標(biāo)簽單詞“舒適的”之間的偏差,第三行所示的典型JS偏差0.0119作為音樂內(nèi)容SNEW和標(biāo)簽單詞“愉快的”之間的偏差和第四行所示的典型JS偏差0.0119作為音樂內(nèi)容SNEW和標(biāo)簽單詞“瘋狂的”之間的偏差。
用相同的方式,如圖15所示,潛在空間偏差計算單元61給出第五行所示的典型JS偏差0.2150作為音樂內(nèi)容SNEW和標(biāo)簽單詞“沉重的”之間的偏差,第六行所示的典型JS偏差0.0053作為音樂內(nèi)容SNEW和標(biāo)簽單詞“輕快的”之間的偏差。
以這種方式,例如,潛在空間偏差計算單元61產(chǎn)生圖15所示的所計算的偏差作為內(nèi)容和標(biāo)簽之間的偏差,并把偏差供應(yīng)給標(biāo)簽選擇單元62。
讓我們返回參考圖14所示的流程圖。在步驟S34,基于從潛在空間偏差計算單元61中接收的結(jié)果偏差,標(biāo)簽選擇單元62來選擇標(biāo)簽。然后,給內(nèi)容分配標(biāo)簽的處理最終結(jié)束。
讓我們假設(shè)例如從潛在空間偏差計算單元61中接收的結(jié)果偏差是圖15所示的作為內(nèi)容和標(biāo)簽之間的偏差的偏差。在這種情況下,在步驟S34,標(biāo)簽選擇單元62選擇具有典型JS偏差0.0053的標(biāo)簽單詞“輕快的”、具有典型JS偏差0.0119的標(biāo)簽單詞“愉快的”,作為每個都具有微小JS偏差的兩個標(biāo)簽,把所選標(biāo)簽分配給新添加的音樂內(nèi)容SNEW。
要注意,分配給新添加的音樂內(nèi)容SNEW的標(biāo)簽數(shù)量決不局限于上述兩個。例如,任何數(shù)量的標(biāo)簽都可以被選為內(nèi)容和標(biāo)簽之間的偏差,只要標(biāo)簽每個都具有小于門限值的偏差。作為替換,可以在所有標(biāo)簽中選擇N個標(biāo)簽作為具有最小偏差的標(biāo)簽,其中N為整數(shù)。
此外,由標(biāo)簽選擇單元62選擇的標(biāo)簽作為分配給內(nèi)容的標(biāo)簽可以典型地被顯示在輸出單元17的屏幕上,以便允許用戶直接看到標(biāo)簽。作為替換,標(biāo)簽可以被保存為元數(shù)據(jù)以便例如在應(yīng)用于搜索標(biāo)簽所分配給的內(nèi)容的處理中使用。
以這種方式,內(nèi)容提供設(shè)備1給內(nèi)容分配更適宜的標(biāo)簽。
如上所述,依靠反映內(nèi)容特征量分布性質(zhì)和標(biāo)簽信息分布性質(zhì)的潛在空間(或潛在變量),內(nèi)容提供設(shè)備1能夠甚至給沒有標(biāo)簽的內(nèi)容分配更適宜的標(biāo)簽。結(jié)果,由于減少了大量給內(nèi)容分配關(guān)鍵詞(或標(biāo)簽)的人力勞動,因此也降低了成本。
參考圖16所示的流程圖,下面的描述說明由內(nèi)容提供設(shè)備1進(jìn)行的搜索內(nèi)容的處理。要注意,本處理開始于例如用戶通過操作用戶界面來輸入命令以搜索匹配預(yù)定標(biāo)簽的內(nèi)容時。
在步驟S41,標(biāo)簽信息-潛在空間轉(zhuǎn)換單元60基于存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中的關(guān)聯(lián)信息來進(jìn)行轉(zhuǎn)換處理,以把所處理的標(biāo)簽放置于潛在空間中,并且把轉(zhuǎn)換處理的結(jié)果供應(yīng)給潛在空間偏差計算單元61。
讓我們假設(shè)例如用戶輸入標(biāo)簽單詞“愉快的”作為命令。在這種情況下,在步驟S41,基于對于潛在變量zk和標(biāo)簽wi的每個組合而存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中的條件概率p(wi|zk)和先驗概率αk=p(zk),標(biāo)簽信息-潛在空間轉(zhuǎn)換單元60進(jìn)行轉(zhuǎn)換(映射)處理以把標(biāo)簽單詞“愉快的”放置于潛在空間中,并且把條件概率p(zk|wi)供應(yīng)給潛在空間偏差計算單元61作為轉(zhuǎn)換處理的結(jié)果。
具體地,轉(zhuǎn)換(映射)處理依照如下給出的式(13)進(jìn)行。
[式13] 要注意,由于先驗概率p(wi)通常不清晰,所以它們?nèi)孔鳛榈雀怕侍幚?。然而,計算可以通過使用所有觀測值的分布來進(jìn)行。
在步驟S42,基于從標(biāo)簽信息-潛在空間轉(zhuǎn)換單元60中接收的作為把標(biāo)簽信息放置于潛在空間中的轉(zhuǎn)換處理的結(jié)果的轉(zhuǎn)換處理結(jié)果和存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中的關(guān)聯(lián)信息,潛在空間偏差計算單元61計算標(biāo)簽和內(nèi)容之間的偏差并把所計算的偏差供應(yīng)給內(nèi)容選擇單元63。
讓我們假設(shè)例如從標(biāo)簽信息-潛在空間轉(zhuǎn)換單元60中接收的轉(zhuǎn)換處理結(jié)果是條件概率p(zk|wi),而存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中的關(guān)聯(lián)信息是對于每個潛 在變量zk的先驗概率αk、方差-協(xié)方差矩陣Sk,和均值向量μk。在這種情況下,在步驟S42,潛在空間偏差計算單元61依照式(12),基于條件概率p(zk|wi)以及先驗概率αk、方差-協(xié)方差矩陣Sk,和均值向量μk,來計算存在于潛在空間中的內(nèi)容和標(biāo)簽之間的偏差。
要注意,計算內(nèi)容和標(biāo)簽之間的偏差的方法決不局限于如圖14所示的步驟S33進(jìn)行的處理的依照式(12)計算JS偏差的方法。也就是說,內(nèi)容和標(biāo)簽之間的偏差也可以作為依照式(10)的標(biāo)簽的條件概率、依照式(11)的Kullback-Leibler偏差、歐幾里得偏差或者其它偏差被計算。
圖17是當(dāng)用戶輸入單詞“愉快的”作為標(biāo)簽時顯示由潛在空間偏差計算單元計算的作為內(nèi)容和標(biāo)簽之間的典型偏差的典型偏差的圖表。
潛在空間偏差計算單元61給出圖17所示的表格的第二行的典型JS偏差0.3100作為內(nèi)容1和作為標(biāo)簽輸入的單詞“愉快的”之間的偏差。用相同的方式,潛在空間偏差計算單元61給出圖17所示的表格的第三行的典型JS偏差0.0051作為內(nèi)容2和作為標(biāo)簽輸入的單詞“愉快的”之間的偏差。以同樣的方式,潛在空間偏差計算單元61給出圖17所示的表格中的第四行的典型JS偏差0.0022作為內(nèi)容3和作為標(biāo)簽輸入的單詞“愉快的”之間的偏差。同樣,潛在空間偏差計算單元61給出圖17所示的表格的第五行的典型JS偏差0.1114作為內(nèi)容4和作為標(biāo)簽輸入的單詞“愉快的”之間的偏差。類似地,潛在空間偏差計算單元61給出圖17所示的表格的第六行的典型JS偏差0.2547作為內(nèi)容5和作為標(biāo)簽輸入的單詞“愉快的”之間的偏差。
類似地,潛在空間偏差計算單元61給出圖17所示的表格的第七行的典型JS偏差0.0947作為內(nèi)容6和作為標(biāo)簽輸入的單詞“愉快的”之間的偏差。用相同的方式,潛在空間偏差計算單元61給出圖17所示的表格的第八行的典型JS偏差0.1473作為內(nèi)容7和作為標(biāo)簽輸入的單詞“愉快的”之間的偏差。以同樣的方式,潛在空間偏差計算單元61給出圖1 7所示的表格的第九行的典型JS偏差0.4123作為內(nèi)容8和作為標(biāo)簽輸入的單詞“愉快的”之間的偏差。類似地,潛在空間偏差計算單元61給出圖17所示的表格的第十行的典型JS偏差0.1119作為內(nèi)容9和作為標(biāo)簽輸入的單詞“愉快的”之間的偏差。類似地,潛在空間偏差計算單元61給出圖17所示的表格的第十一行的典型JS偏差0.3451作為內(nèi)容10和作為標(biāo)簽輸入的單詞“愉快的”之間的偏差。
類似地,潛在空間偏差計算單元61給出圖17所示的表格的第十二行的典型JS偏差0.0049作為內(nèi)容11和作為標(biāo)簽輸入的單詞“愉快的”之間的偏差。內(nèi)容11是在圖14所示的流程圖所表示的處理中已經(jīng)被分配了作為標(biāo)簽的單詞“輕快的”和“愉快的”的新添加的音樂內(nèi)容SNEW。
如上所述,潛在空間偏差計算單元61產(chǎn)生如圖17所示的標(biāo)簽和內(nèi)容之間的偏差的典型偏差,并把偏差供應(yīng)給內(nèi)容選擇單元63。
讓我們返回參考圖16所示的流程圖。在步驟S43,基于從潛在空間偏差計算單元61中接收的作為偏差計算結(jié)果的偏差,內(nèi)容選擇單元63選擇內(nèi)容。然后,搜索內(nèi)容的處理最終結(jié)束。
讓我們假設(shè)由內(nèi)容選擇單元63從潛在空間偏差計算單元61中接收的作為偏差計算結(jié)果的偏差是圖17所示的作為標(biāo)簽和內(nèi)容間偏差的JS偏差。在這種情況下,在步驟S43,內(nèi)容選擇單元63選擇三個內(nèi)容,即具有0.0022的典型JS偏差的內(nèi)容3、具有0.0049的典型JS偏差的內(nèi)容11、具有0.005 1的典型JS偏差的內(nèi)容2,典型地在輸出單元17的屏幕上顯示關(guān)于所選內(nèi)容的信息。
要注意,所選內(nèi)容的數(shù)量決不局限于三個。例如,任何數(shù)量的內(nèi)容都可以被選擇,只要內(nèi)容每個都具有小于門限值的偏差作為內(nèi)容和標(biāo)簽之間的偏差。作為替換,可以在所有內(nèi)容中選擇N個內(nèi)容作為具有最小偏差的內(nèi)容,其中N為整數(shù)。
此外,如上所述,將被選擇的內(nèi)容也不局限于在學(xué)習(xí)階段使用的內(nèi)容。也就是說,稍后在處理階段新加入的內(nèi)容也可以作為將被選擇的內(nèi)容的候選者。稍后在操作階段新加入的內(nèi)容的例子是音樂內(nèi)容SNEW。
此外,能夠提供配置,其中,通過利用其它數(shù)據(jù)預(yù)先構(gòu)造模型作為包括大量標(biāo)簽的輔助模型。如果標(biāo)簽是單詞,則其它數(shù)據(jù)可以是總的文集和/或其內(nèi)容所屬的范圍內(nèi)的文本。在這種情況下,如果標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中不存在由用戶指定的標(biāo)簽,包括在輔助模型中的已知標(biāo)簽作為最接近所指定的未知標(biāo)簽的標(biāo)簽可以被用于給用戶的詢問中作為對于指定標(biāo)簽的替代。已知標(biāo)簽是在學(xué)習(xí)處理中所知的標(biāo)簽。
以這種方式,內(nèi)容提供設(shè)備1搜索對于特定標(biāo)簽的內(nèi)容。
如上所述,依靠反映內(nèi)容特征量的分布性質(zhì)和標(biāo)簽信息的分布性質(zhì)的潛在空間(或潛在變量),內(nèi)容提供設(shè)備1能夠搜索對于特定標(biāo)簽的內(nèi)容。
順帶提及,在上述實施例中,內(nèi)容特征量被關(guān)聯(lián)于標(biāo)簽。然而,本發(fā)明的實現(xiàn)決不局限于本實施例。例如,標(biāo)簽信息和/或內(nèi)容特征量可以與稍后描述的環(huán)境信息相關(guān)聯(lián)。作為替換,標(biāo)簽信息和/或內(nèi)容特征量可以與同樣稍后描述的喜好信息相關(guān)聯(lián)。
首先,參考圖18至21描述標(biāo)簽信息和/或內(nèi)容特征量與環(huán)境信息的關(guān)聯(lián)。
圖18是顯示內(nèi)容提供設(shè)備的另一典型功能配置的功能方框圖。
要注意,不再說明在圖18所示的配置中與圖2所示的其對應(yīng)部分的相同位置上放置的并且以相同標(biāo)號作為對應(yīng)部分表示的對應(yīng)部分的配置元件,以避免重復(fù)說明。圖18所示的內(nèi)容提供設(shè)備1通過向方框2所示的配置上添加環(huán)境信息抽取單元111、環(huán)境信息存儲單元112和環(huán)境信息-潛在空間關(guān)聯(lián)信息存儲單元113得到。
環(huán)境信息抽取單元111抽取環(huán)境信息,即涉及存儲于內(nèi)容存儲單元51中的內(nèi)容的信息。環(huán)境信息抽取單元111把所抽取的環(huán)境信息存儲(或保存)于環(huán)境信息存儲單元112中。
涉及內(nèi)容的環(huán)境信息被定義為當(dāng)用戶利用內(nèi)容時得到的作為除了關(guān)于內(nèi)容本身的信息以外的信息。環(huán)境信息的例子是關(guān)于內(nèi)容利用的場合出現(xiàn)的時間、季節(jié)、地點、天氣、感覺和人的信息。
關(guān)聯(lián)信息計算單元56計算關(guān)聯(lián)存儲于內(nèi)容特征量存儲單元53中的內(nèi)容特征量與存儲于標(biāo)簽信息存儲單元55中的標(biāo)簽信息的信息。關(guān)聯(lián)信息計算單元56把對于內(nèi)容特征量所計算的關(guān)聯(lián)信息存儲(或保存)于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中,并把對于標(biāo)簽信息所計算的關(guān)聯(lián)信息存儲(或保存)于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中。
此外,關(guān)聯(lián)信息計算單元56計算關(guān)聯(lián)存儲于環(huán)境信息存儲單元112中的環(huán)境信息與存儲于標(biāo)簽信息存儲單元55中的標(biāo)簽信息的信息。關(guān)聯(lián)信息計算單元56把對于標(biāo)簽信息所計算的關(guān)聯(lián)信息存儲(或保存)于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中,并把對于環(huán)境信息所計算的關(guān)聯(lián)信息存儲(或保存)于環(huán)境信息-潛在空間關(guān)聯(lián)信息存儲單元113中。
另外,關(guān)聯(lián)信息計算單元56計算關(guān)聯(lián)存儲于內(nèi)容特征量存儲單元53中的內(nèi)容特征量與存儲于環(huán)境信息存儲單元112中的環(huán)境信息的信息。關(guān)聯(lián)信息計算單元56把對于內(nèi)容特征量所計算的關(guān)聯(lián)信息存儲(或保存)于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中,并把對于環(huán)境信息所計算的關(guān)聯(lián)信息存儲(或保存)于環(huán)境信息-潛在空間關(guān)聯(lián)信息存儲單元113中。
要注意,在這種情況下,關(guān)聯(lián)信息彼此關(guān)聯(lián)內(nèi)容、標(biāo)簽和環(huán)境。也就是說,關(guān)聯(lián)信息通過利用潛在變量zk彼此鏈接內(nèi)容、標(biāo)簽和環(huán)境。
在上述實施例中,內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57、標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58和環(huán)境信息-潛在空間關(guān)聯(lián)信息存儲單元113彼此分離。然而,要注意,內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57、標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58和環(huán)境信息-潛在空間關(guān)聯(lián)信息存儲單元113還可以集成為單一的單元。在這種情況下,作為集成內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57、標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58和環(huán)境信息-潛在空間關(guān)聯(lián)信息存儲單元113的結(jié)果所得到的單一單元被用于存儲所有的關(guān)聯(lián)信息。
接著,如下參考圖19所示的流程圖來說明由圖18所示的內(nèi)容提供設(shè)備1進(jìn)行的學(xué)習(xí)處理。
在步驟S51和步驟S52進(jìn)行的處理分別與在圖3所示的步驟S11和步驟S12進(jìn)行的處理相同。因此,省略步驟S51和S52的說明。
在步驟S53,環(huán)境信息抽取單元111抽取關(guān)于存儲于內(nèi)容存儲單元51中的內(nèi)容的環(huán)境信息,并把所抽取的環(huán)境信息存儲(或保存)于環(huán)境信息存儲單元112中。例如,由環(huán)境信息抽取單元111在步驟S53抽取的作為關(guān)于存儲于內(nèi)容存儲單元51中的音樂內(nèi)容的環(huán)境信息,是音樂內(nèi)容被收聽的時間段或音樂內(nèi)容被收聽的地點。環(huán)境信息抽取單元111把所抽取的關(guān)于時間段的信息或所抽取的關(guān)于地點的信息存儲于環(huán)境信息存儲單元112中作為環(huán)境信息。
具體地,讓我們假設(shè)例如存儲于內(nèi)容存儲單元51中的音樂內(nèi)容是內(nèi)容1至10。在這種情況下,環(huán)境信息抽取單元111抽取如圖20所示的典型的環(huán)境信息。
圖20是顯示對于音樂內(nèi)容的典型環(huán)境信息的圖表。
在圖20所示的典型表格中,第一列和第一行各自顯示項目。第一列所示的項目每個都是存儲于內(nèi)容存儲單元51中的音樂內(nèi)容的名字。另一方面,第一行所示的項目每個都是關(guān)于第一列所示的每個音樂內(nèi)容的環(huán)境信息的名字。該環(huán)境信息的名字是早晨、白天、夜晚、家中、戶外和通勤中。早晨、白天和夜晚的環(huán)境信息是關(guān)于音樂內(nèi)容被收聽的時間段的信息。另一方面,家中、戶外和通勤中的信息是關(guān)于音樂內(nèi)容被收聽的地點的信息。
如圖20的第二行所示,環(huán)境信息抽取單元111抽取典型的環(huán)境信息,其指示內(nèi)容1在早晨、白天和夜晚時間段分別被收聽三次、四次和兩次,而在家中、戶外和通勤中的音樂收聽地域分別被收聽兩次、三次和四次。用相同的方式,如圖20的第三行所示,環(huán)境信息抽取單元111抽取典型的環(huán)境信息,其指示內(nèi)容2在早晨、白天和夜晚時間段分別被收聽五次、四次和兩次,而在家中、戶外和通勤中的音樂接聽地域分別被收聽三次、兩次和三次。以同樣的方式,如圖20的第四行所示,環(huán)境信息抽取單元111抽取典型的環(huán)境信息,其指示內(nèi)容3在早晨、白天和夜晚時間段分別被收聽三次、三次和一次,而在家中、戶外和通勤中的音樂接聽地域分別被收聽三次、三次和五次。類似地,如圖20的第五行所示,環(huán)境信息抽取單元111抽取典型的環(huán)境信息,其指示內(nèi)容4在早晨、白天和夜晚時間段分別被收聽四次、三次和兩次,而在家中、戶外和通勤中的音樂接聽地域分別被收聽兩次、三次和三次。
用相同的方式,如圖20的第六行所示,環(huán)境信息抽取單元111抽取典型的環(huán)境信息,其指示內(nèi)容5在早晨、白天和夜晚時間段分別被收聽四次、兩次和三次,而在家中、戶外和通勤中的音樂接聽地域分別被收聽兩次、兩次和四次。以同樣的方式,如圖20的第七行所示,環(huán)境信息抽取單元111抽取典型的環(huán)境信息,其指示內(nèi)容6在早晨、白天和夜晚時間段分別被收聽兩次、三次和四次,而在家中、戶外和通勤中的音樂接聽地域分別被收聽三次、三次和兩次。類似地,如圖20的第八行所示,環(huán)境信息抽取單元111抽取典型的環(huán)境信息,其指示內(nèi)容7在早晨、白天和夜晚時間段分別被收聽三次、一次和三次,而在家中、戶外和通勤中的音樂接聽地域分別被收聽三次、三次和兩次。
用相同的方式,如圖20的第九行所示,環(huán)境信息抽取單元111抽取典型的環(huán)境信息,其指示內(nèi)容8在早晨、白天和夜晚時間段分別被收聽一次、兩次和五次,而在家中、戶外和通勤中的音樂接聽地域分別被收聽四次、三次和三次。以同樣的方式,如圖20的第十行所示,環(huán)境信息抽取單元111抽取典型的環(huán)境信息,其指示內(nèi)容9在早晨、白天和夜晚時間段分別被收聽兩次、兩次和四次,而在家中、戶外和通勤中的音樂接聽地域分別被收聽五次、兩次和兩次。類似地,如圖20的第十一行所示,環(huán)境信息抽取單元111抽取典型的環(huán)境信息,其指示內(nèi)容10在早晨、白天和夜晚時間段分別被收聽一次、兩次和三次,而在家中、戶外和通勤中的音樂接聽地域分別被收聽四次、三次和三次。
讓我們返回參考圖19所示的流程圖。在步驟S54,基于存儲于內(nèi)容特征量存儲單元53中的內(nèi)容特征量、存儲于標(biāo)簽信息存儲單元55中的標(biāo)簽信息或者存儲于環(huán)境信息存儲單元112中的環(huán)境信息,關(guān)聯(lián)信息計算單元56進(jìn)行尋找對于內(nèi)容特征量、標(biāo)簽信息和環(huán)境信息的關(guān)聯(lián)信息的處理。關(guān)聯(lián)信息計算單元56把從尋找對于內(nèi)容特征量的關(guān)聯(lián)信息、對于標(biāo)簽信息的關(guān)聯(lián)信息和對于環(huán)境信息的關(guān)聯(lián)信息的處理得到的結(jié)果分別存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57、標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58和環(huán)境信息-潛在空間關(guān)聯(lián)信息存儲單元113中作為處理結(jié)果。然后,學(xué)習(xí)處理最終結(jié)束。
在這種情況下,可以以如內(nèi)容特征量和標(biāo)簽信息之間的關(guān)系一樣的上述關(guān)系的相同方式,通過利用對于具有共用的潛在變量zk并且采用與前述方法相同的方法、即與如圖3所示的步驟S13進(jìn)行的處理相同的方法的內(nèi)容特征量和標(biāo)簽信息的各自的分布關(guān)系,來計算對于內(nèi)容特征量、標(biāo)簽信息或環(huán)境信息的潛在空間表述。
也就是說,關(guān)聯(lián)信息計算單元56以與如圖3所示的S13進(jìn)行的處理相同的方式,計算對于內(nèi)容特征量、標(biāo)簽和環(huán)境的關(guān)聯(lián)信息。
具體地,環(huán)境信息被預(yù)先存儲(或保存),作為指示每個音樂內(nèi)容在早晨、白天和夜晚時間段被收聽了多少次,以及在正如圖20所示的典型環(huán)境信息的家中、戶外和通勤中的音樂接聽地域被收聽了多少次的信息。然后,關(guān)聯(lián)信息計算單元56基于圖4所示的內(nèi)容特征量、如圖5所示的標(biāo)簽信息和如圖20所示的環(huán)境信息來計算關(guān)聯(lián)信息。
圖21是顯示基于潛在空間的作為對于環(huán)境信息的表述的典型表述的圖表。
在圖21所示的典型表格中,第一列和第一行各自顯示項目。第一列所示的項目每個都是環(huán)境。另一方面,第一行所示的項目是兩個潛在變量,即對于第一列所示的每個環(huán)境的潛在變量z1和z2。
如圖21給出的表格的第二列所示,關(guān)聯(lián)信息計算單元56給出(對于潛在變量z1的)典型的條件概率值0.8作為對于第二行的早晨時間段的計算結(jié)果,(對于潛在變量z1的)典型的條件概率值0.7作為對于第三行的白天時間段的計算結(jié)果,(對于潛在變量z1的)典型的條件概率值0.23作為對于第四行的夜晚時間段的計算結(jié)果,(對于潛在變量z1的)典型的條件概率值0.3作為對于第五行的家中內(nèi)容收聽地域的計算結(jié)果,(對于潛在變量z1的)典型的條件概率值0.45作為對于第六行的戶外內(nèi)容收聽地域的計算結(jié)果,以及(對于潛在變量z1的)典型的條件概率值0.9作為對于第七行的工作地內(nèi)容收聽地域的計算結(jié)果。
也就是說,早晨、白天和夜晚、家中、戶外和通勤中環(huán)境的每一個都通過利用潛在變量z1的值與內(nèi)容或標(biāo)簽關(guān)聯(lián)。
用相同的方式,如圖21給出的表格的第三列所示,關(guān)聯(lián)信息計算單元56給出(對于潛在變量z2的)典型的條件概率值0.2作為對于第二行的早晨時間段的計算結(jié)果,(對于潛在變量z2的)典型的條件概率值0.3作為對于第三行的白天時間段的計算結(jié)果,(對于潛在變量z2的)典型的條件概率值0.77作為對于第四行的夜晚時間段的計算結(jié)果,(對于潛在變量z2的)典型的條件概率值0.7作為對于第五行的家中內(nèi)容收聽地域的計算結(jié)果,(對于潛在變量z2的)典型的條件概率值0.55作為對于第六行的戶外內(nèi)容收聽地域的計算結(jié)果,以及(對于潛在變量z2的)典型的條件概率值0.2作為對于第七行的工作地內(nèi)容收聽地域的計算結(jié)果。
也就是說,早晨、白天和夜晚、家中、戶外和通勤中環(huán)境的每一個都通過利用潛在變量z2的值與內(nèi)容或標(biāo)簽關(guān)聯(lián)。
以這種方式,依照本發(fā)明,對于諸如內(nèi)容1至10的每個音樂內(nèi)容,關(guān)于內(nèi)容在早晨、白天和夜晚時間段以及在家中、戶外和工作地的內(nèi)容接聽地域被收聽的次數(shù)的信息被預(yù)先存儲作為環(huán)境信息,以便,如上所述,環(huán)境信息可以與內(nèi)容特征量和/或標(biāo)簽信息組合。然后,通過組合環(huán)境信息、內(nèi)容特征量和標(biāo)簽信息,就可能生成反映環(huán)境信息、內(nèi)容特征量和標(biāo)簽信息的分布趨勢的潛在空間,并且如圖21所示環(huán)境被映射到潛在空間上。
這樣,在操作階段,以與圖16所示的流程圖相同的方式,例如,當(dāng)用戶輸入命令為“早晨在家中收聽的音樂內(nèi)容”時,內(nèi)容提供設(shè)備1選擇接近早晨環(huán)境和家中環(huán)境的音樂內(nèi)容。
要注意,可以與圖16所示的步驟S42相同的方式來進(jìn)行計算環(huán)境和內(nèi)容之間的偏差的處理以及計算環(huán)境和標(biāo)簽之間的偏差的處理。
此外,依賴于用戶,對于內(nèi)容的環(huán)境信息可以是關(guān)于用戶的環(huán)境信息或關(guān)于多個用戶的環(huán)境信息。
參考圖22至25,下面的描述說明了帶有標(biāo)簽信息的喜好信息和內(nèi)容特征量的關(guān)聯(lián)。
圖22是顯示內(nèi)容提供設(shè)備的再一典型功能配置的功能方框圖。
要注意,不再說明在圖22所示的配置中與圖2所示的其對應(yīng)部分的相同位置上放置的、并且以相同標(biāo)號作為對應(yīng)部分表示的對應(yīng)部分的配置元件,以避免重復(fù)說明。圖22所示的內(nèi)容提供設(shè)備1通過向方框2所示的配置上添加喜好信息抽取單元151、喜好信息存儲單元152和喜好信息-潛在空間關(guān)聯(lián)信息存儲單元153得到。
喜好信息抽取單元151抽取喜好信息,即關(guān)于存儲于內(nèi)容存儲單元51中的喜好內(nèi)容的信息。喜好信息抽取單元151把所抽取的喜好信息存儲(或保存)于喜好信息存儲單元152中。
內(nèi)容的喜好信息被定義為關(guān)于用作用戶的喜好的內(nèi)容的信息。內(nèi)容的喜好信息的例子是顯示用戶給內(nèi)容的評價的信息。也就是說,在這種情況下內(nèi)容的喜好信息是一種評價內(nèi)容的評價信息。
關(guān)聯(lián)信息計算單元56計算關(guān)聯(lián)存儲于內(nèi)容特征量存儲單元53中的內(nèi)容特征量與存儲于標(biāo)簽信息存儲單元55中的標(biāo)簽信息的信息。關(guān)聯(lián)信息計算單56把對于內(nèi)容特征量計算的關(guān)聯(lián)信息存儲(或保存)于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中,并把對于標(biāo)簽信息計算的關(guān)聯(lián)信息存儲(或保存)于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中。
此外,關(guān)聯(lián)信息計算單元56計算關(guān)聯(lián)存儲于喜好信息存儲單元152中的喜好信息與存儲于標(biāo)簽信息存儲單元55中的標(biāo)簽信息的信息。關(guān)聯(lián)信息計算單元56把對于標(biāo)簽信息計算的關(guān)聯(lián)信息存儲(或保存)于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中,并把對于喜好信息計算的關(guān)聯(lián)信息存儲(或保存)于喜好信息-潛在空間關(guān)聯(lián)信息存儲單元153中。
另外,關(guān)聯(lián)信息計算單元56計算關(guān)聯(lián)存儲于內(nèi)容特征量存儲單元53中的內(nèi)容特征量與存儲于喜好信息存儲單元152中的喜好信息的信息。關(guān)聯(lián)信息計算單56把對于內(nèi)容特征量計算的關(guān)聯(lián)信息存儲(或保存)于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中,并把對于喜好信息計算的關(guān)聯(lián)信息存儲(或保存)于喜好信息-潛在空間關(guān)聯(lián)信息存儲單元153中。
要注意,在這種情況下,關(guān)聯(lián)信息彼此關(guān)聯(lián)內(nèi)容、標(biāo)簽和喜好內(nèi)容。也就是說,關(guān)聯(lián)信息通過利用潛在變量zk彼此鏈接內(nèi)容、標(biāo)簽和喜好內(nèi)容。
在上述實施例中,內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57、標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58和喜好信息-潛在空間關(guān)聯(lián)信息存儲單元153彼此分離。然而,要注意,這些單元還可以集成為單一單元。在這種情況下,作為集成內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57、標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58和喜好信息-潛在空間關(guān)聯(lián)信息存儲單元153的結(jié)果得到的單一單元被用來存儲所有的關(guān)聯(lián)信息。
接下來,如下參考圖23所示的流程圖來說明由圖22所示的內(nèi)容提供設(shè)備1進(jìn)行的學(xué)習(xí)處理。
在步驟S61和S62進(jìn)行的處理分別與圖3所示的在步驟S11和S12進(jìn)行的處理相同。因此,省略步驟S61和S62的說明。
在步驟S63,喜好信息抽取單元151抽取關(guān)于存儲于內(nèi)容存儲單元51中的內(nèi)容的喜好信息,并將所抽取的喜好信息存儲(或保存)于喜好信息存儲單元152中。例如,由喜好信息抽取單元151在步驟S63抽取的喜好信息作為關(guān)于存儲于內(nèi)容存儲單元51中的音樂內(nèi)容的喜好信息,是顯示諸如用戶1、2、3、4和5用戶對音樂內(nèi)容給出的評價的上述的評價信息。喜好信息抽取單元151將所抽取的評價信息存儲于喜好信息存儲單元152中作為喜好信息。
具體地,讓我們假設(shè)例如存儲于內(nèi)容存儲單元51中的音樂內(nèi)容是內(nèi)容1至10。在這種情況下,喜好信息抽取單元151抽取如圖24所示的典型的喜好信息。
圖24是顯示對于音樂內(nèi)容的典型喜好信息的圖表。
在圖24所示的典型表格中,第一列和第一行各自顯示項目。第一列所示的項目每個都是存儲于內(nèi)容存儲單元51中的音樂內(nèi)容的名字。另一方面,第一行所示的項目每個都是用戶對第一列所示的音樂內(nèi)容給出的評價。在本典型喜好信息中,用戶是對音樂內(nèi)容給出五級評價作為喜好信息的用戶1、用戶2、用戶3、用戶4和用戶5。例如,在圖24所示的表格中,給音樂內(nèi)容的評價等級1指示該音樂內(nèi)容是令人厭煩的。另一方面,給音樂內(nèi)容的評價等級5指示所述音樂內(nèi)容是令人愉快的。
如圖24的第二行所示,喜好信息抽取單元151抽取指示用戶1、用戶2、用戶3、用戶4和用戶5分別給出評價等級3、4、2、2和4的喜好信息作為給內(nèi)容1的典型評價。用同樣的方式,如圖24的第三行所示,喜好信息抽取單元151抽取指示用戶1、用戶2、用戶3、用戶4和用戶5分別給出評價等級5、4、2、3和3的喜好信息作為給內(nèi)容2的典型評價。用相同的方式,如圖24的第四行所示,喜好信息抽取單元151抽取指示用戶1、用戶2、用戶3、用戶4和用戶5分別給出評價等級3、3、1、3和5的喜好信息作為給內(nèi)容3的典型評價。類似地,如圖24的第五行所示,喜好信息抽取單元151抽取指示用戶1、用戶2、用戶3、用戶4和用戶5分別給出評價等級4、3、2、2和3的喜好信息作為給內(nèi)容4的典型評價。
類似地,如圖24的第六行所示,喜好信息抽取單元151抽取指示用戶1、用戶2、用戶3、用戶4和用戶5分別給出評價等級4、2、3、2和4的喜好信息作為給內(nèi)容5的典型評價。用相同的方式,如圖24的第七行所示,喜好信息抽取單元151抽取指示用戶1、用戶2、用戶3、用戶4和用戶5分別給出評價等級2、3、4、3和2的喜好信息作為給內(nèi)容6的典型評價。以同樣的方式,如圖24的第八行所示,喜好信息抽取單元151抽取指示用戶1、用戶2、用戶3、用戶4和用戶5分別給出評價等級3、1、3、3和2的喜好信息作為給內(nèi)容7的典型評價。
類似地,如圖24的第九行所示,喜好信息抽取單元151抽取指示用戶1、用戶2、用戶3、用戶4和用戶5分別給出評價等級1、2、5、4和3的喜好信息作為給內(nèi)容8的典型評價。用相同的方式,如圖24的第十行所示,喜好信息抽取單元151抽取指示用戶1、用戶2、用戶3、用戶4和用戶5分別給出評價等級2、2、4、5和2的喜好信息作為給內(nèi)容9的典型評價。以同樣的方式,如圖24的第十一行所示,喜好信息抽取單元151抽取指示用戶1、用戶2、用戶3、用戶4和用戶5分別給出評價等級1、2、3、4和3的喜好信息作為給內(nèi)容10的典型評價。
讓我們返回參考圖23所示的流程圖。在步驟S64,基于存儲于內(nèi)容特征量存儲單元53中的內(nèi)容特征量、存儲于標(biāo)簽信息存儲單元55中的標(biāo)簽信息或者存儲于喜好信息存儲單元152中的喜好信息的,關(guān)聯(lián)信息計算單元56進(jìn)行尋找對于內(nèi)容特征量、標(biāo)簽信息和喜好信息的關(guān)聯(lián)信息的處理。關(guān)聯(lián)信息計算單元56把尋找對于內(nèi)容特征量的關(guān)聯(lián)信息、對于標(biāo)簽信息的關(guān)聯(lián)信息和對于喜好信息的關(guān)聯(lián)信息的處理得到的結(jié)果分別存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57、標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58和喜好信息-潛在空間關(guān)聯(lián)信息存儲單元153中作為處理結(jié)果。然后,學(xué)習(xí)處理最終結(jié)束。
在這種情況下,可以以如內(nèi)容特征量和標(biāo)簽信息之間的關(guān)系一樣的上述關(guān)系的相同方式,通過利用對于具有共用的潛在變量zk并且采用與前述方法相同的方法、即與如圖3所示的步驟S13進(jìn)行的處理相同的方法的內(nèi)容特征量和標(biāo)簽信息的各自的分布關(guān)系,來計算對于內(nèi)容特征量、標(biāo)簽信息或喜好信息的潛在空間表述。
也就是說,關(guān)聯(lián)信息計算單元56以與如圖3所示的S13進(jìn)行的處理相同的方式,來計算對于內(nèi)容特征量、標(biāo)簽和喜好的關(guān)聯(lián)信息。
具體地,喜好信息被預(yù)先存儲(或保存)作為指示用戶給每個音樂內(nèi)容的評價的信息,正如圖24所示的典型喜好信息。然后,關(guān)聯(lián)信息計算單元56基于圖4所示的內(nèi)容特征量、如圖5所示的標(biāo)簽信息和如圖24所示的喜好信息計算關(guān)聯(lián)信息。
圖25是顯示基于潛在空間的對于喜好信息的典型表述的圖表。
在圖25所示的典型表格中,第一列和第一行各自顯示項目。第一列所示的項目每個都是喜好信息的名字(即給音樂內(nèi)容評價的用戶的名字)。另一方面,第一行所示的項目都是對于作為給內(nèi)容評價的第一列所示的每個用戶的兩個潛在變量(即潛在變量z1和z2)。
如圖25給出的表格的第二列所示,關(guān)聯(lián)信息計算單元56給出(對于潛在變量z1的)典型的條件概率值0.8作為對于第二行的用戶1的計算結(jié)果,(對于潛在變量z1的)典型的條件概率值0.7作為對于第三行的用戶2的計算結(jié)果,(對于潛在變量z1的)典型的條件概率值0.3作為對于第四行的用戶3的計算結(jié)果,(對于潛在變量z1的)典型的條件概率值0.45作為對于第五行的用戶4的計算結(jié)果,(對于潛在變量z1的)典型的條件概率值0.9作為對于第六行的用戶5的計算結(jié)果。
也就是說,每個都作為喜好信息的名字使用的用戶1、用戶2、用戶3、用戶4和用戶5通過利用潛在變量z1的值來與內(nèi)容或標(biāo)簽關(guān)聯(lián)。
用相同的方式,如圖25給出的表格的第三列所示,關(guān)聯(lián)信息計算單元56給出(對于潛在變量z2的)典型的條件概率值0.2作為對于第二行的用戶1的計算結(jié)果,(對于潛在變量z2的)典型的條件概率值0.3作為對于第三行的用戶2的計算結(jié)果,(對于潛在變量z2的)典型的條件概率值0.7作為對于第四行的用戶3的計算結(jié)果,(對于潛在變量z2的)典型的條件概率值0.55作為對于第五行的用戶4的計算結(jié)果,(對于潛在變量z2的)典型的條件概率值0.2作為對于第六行的用戶5的計算結(jié)果。
也就是說,作為喜好信息的名字使用的用戶1、用戶2、用戶3、用戶4和用戶5通過利用潛在變量z2的值與內(nèi)容或標(biāo)簽關(guān)聯(lián)。
如上所述,依照本發(fā)明,如圖24的典型喜好信息所示,五個用戶對諸如內(nèi)容1至10的音樂內(nèi)容給出五級評價。在這種情況下,通過組合如圖24所示的作為對于音樂內(nèi)容的信息的喜好信息、如圖4所示的作為對于音樂內(nèi)容的量的內(nèi)容特征量,就可能生成最適宜的潛在變量(即,潛在變量zk),同時讓用戶的喜好趨勢和內(nèi)容特征量的趨勢相互影響,并且把如圖25所示的喜好信息放置于潛在空間中作為用戶的喜好信息。
此外,依照本發(fā)明,例如,通過推斷具有與內(nèi)容特征量和標(biāo)簽信息共用的潛在變量zk的其它分布的參數(shù),可能得到反映內(nèi)容的客觀趨勢、它們的特征和標(biāo)簽同時也反映用戶的喜好趨勢的潛在空間。內(nèi)容的特征的例子是包括在由權(quán)威人士作為評論內(nèi)容的文本書寫的文本中的單詞。
因此,在操作階段,例如,通過利用作為對于用戶的喜好信息和內(nèi)容的表述的基于潛在空間的表述,可能如用關(guān)于所有用戶的喜好的信息所喜好的聚合一樣來進(jìn)行用戶的聚合、內(nèi)容的聚合,此外,用戶和內(nèi)容的同時聚合。
以這種方式,依照本發(fā)明,可能向用戶推薦可以用作用戶喜好的內(nèi)容。
在上述實施例中,評價信息由五個用戶給出。然而,要注意,給出評價的用戶數(shù)目決不局限于五個。也就是說,可以有任意數(shù)目的用戶給出評價。例如,可能提供配置,其中,通過考慮由一個用戶給出的作為一維空間的評價信息來計算潛在空間(潛在變量zk)。
順帶提及,在本發(fā)明的情況下,還可能在處理的信息中定義特性特征作為允許把信息映射到前述的潛在空間上的特征。處理的信息可能是內(nèi)容特征量、標(biāo)簽信息、環(huán)境信息或喜好信息。具體地通過利用式(14)來定義作為潛在空間中的概率分布表述的特性特征如何能夠隨著其熵值單調(diào)減少,例如,可以計算特性特征。
[式14] 也就是說,例如,關(guān)聯(lián)信息計算單元56通過利用式(14)定義如圖20所示的環(huán)境信息作為關(guān)于音樂內(nèi)容的環(huán)境信息,以便得到如圖26所示的特性特征作為環(huán)境的特性特征。
圖26是顯示環(huán)境的典型特性特征的圖表。
圖26給出的典型表格的第一列顯示環(huán)境,而第二列顯示環(huán)境的特性特征值。
如圖26所示,作為計算結(jié)果,關(guān)聯(lián)信息計算單元56產(chǎn)生對于第二行的早晨環(huán)境項目的典型的特性特征值0.500,對于第三行的白天環(huán)境項目的典型的特性特征值0.389,對于第四行的夜晚環(huán)境項目的典型的特性特征值0.461,對于第五行的家中環(huán)境項目的典型的特性特征值0.389,對于第六行的戶外環(huán)境項目的典型的特性特征值0.311,以及對于第七行的工作地環(huán)境項目的典型的特性特征值0.675。
也就是說,正如從圖26所示的六個典型特性特征值明顯看出的,具有特性特征值0.675的通勤環(huán)境項目,具有特性特征值0.500的早晨環(huán)境項目,是圖20所示的典型環(huán)境信息所示的六個環(huán)境項目的特性特征作為對于音樂內(nèi)容的環(huán)境信息。在環(huán)境信息的情況下,特性特征是在所有環(huán)境項目中具有最大特性特征值的環(huán)境項目。這些對于音樂內(nèi)容的特性特征指示戶外環(huán)境項目對收聽音樂內(nèi)容的方式?jīng)]有影響。因此,當(dāng)用戶出現(xiàn)在戶外位置時,對于另一個音樂內(nèi)容的元數(shù)據(jù)或環(huán)境信息可能被推薦給該用戶。作為替換,由于通勤環(huán)境項目具有大的特性特征值,因此忽略其它環(huán)境項目,并且可能推薦具有僅接近作為在潛在空間中的環(huán)境信息的通勤環(huán)境項目的偏差的音樂內(nèi)容。
特性特征的概念還同樣可以用于標(biāo)簽信息。在標(biāo)簽信息的情況下,特性特征是在所有標(biāo)簽中具有最大特性特征值的標(biāo)簽。具有最大特性特征值的標(biāo)簽可以被稱為具有與音樂內(nèi)容的內(nèi)容特征量或特征標(biāo)簽最深關(guān)系的標(biāo)簽。因此,例如,這種標(biāo)簽可以被選擇并且在諸如評價音樂內(nèi)容的文本的句子中以高亮標(biāo)簽信息顯示,以便幫助讀取句子的用戶更好地理解音樂內(nèi)容。
首先,通過參考圖27至30來說明關(guān)聯(lián)標(biāo)簽與內(nèi)容的處理。本處理也可以被稱為學(xué)習(xí)處理。通過參考圖31至35的操作階段的描述接著進(jìn)行學(xué)習(xí)處理的說明。操作階段是通過利用標(biāo)簽信息與和標(biāo)簽信息關(guān)聯(lián)的內(nèi)容特征量之間的關(guān)系來選擇具有大內(nèi)容特征值的標(biāo)簽信息并顯示所選標(biāo)簽作為高亮標(biāo)簽信息。
圖27是顯示內(nèi)容提供設(shè)備的再一典型功能配置的功能方框圖。
要注意,不再說明在圖27所示的配置中與圖2所示的其對應(yīng)部分的相同位置上放置的、并且以相同標(biāo)號作為對應(yīng)部分表示的對應(yīng)部分的配置元件,以避免重復(fù)說明。在圖27所示的內(nèi)容提供設(shè)備1的配置中,文本存儲單元171被連接于標(biāo)簽信息抽取單元54,而從本配置中省略在方框圖2中顯示的內(nèi)容特征量存儲單元53、標(biāo)簽信息存儲單元55、內(nèi)容特征量-潛在空間轉(zhuǎn)換單元59、標(biāo)簽信息-潛在空間轉(zhuǎn)換單元60、潛在空間偏差計算單元61、標(biāo)簽選擇單元62和內(nèi)容選擇單元63。
文本存儲單元171是用于存儲(或保存)原文信息的單元。存儲于文本存儲單元171的原文信息是根據(jù)以自然語言書寫的句子表述的信息。原文信息是關(guān)于存儲于內(nèi)容存儲單元51中的內(nèi)容的文本。原文信息的例子是評價這種內(nèi)容的文本和描述關(guān)于內(nèi)容的印象的文本。在由標(biāo)簽信息抽取單元54進(jìn)行請求時,文本存儲單元171向標(biāo)簽信息抽取單元54供應(yīng)原文信息。
標(biāo)簽信息抽取單元54通過進(jìn)行詞素分析等等把信息劃分為用作向用戶揭示含義的單元的單詞或短語,來分解從文本存儲單元171接收的原文信息。標(biāo)簽信息抽取單元54把作為詞素分析的結(jié)果得到的信息供應(yīng)給關(guān)聯(lián)信息計算單元56作為標(biāo)簽信息。作為詞素分析的結(jié)果得到的信息是詞素。
要注意,作為向用戶揭示含義的單元被處理的短語是單詞或一串單詞。
此外,正如稍后將詳細(xì)描述的,詞素分析是一種通過利用計算機等等進(jìn)行的所謂自然語言處理的基本技術(shù)。詞素分析是通過把句子劃分為一串詞素來彼此區(qū)分用在以自然語言書寫的句子中的單詞種類的工作,這些詞素,簡單地說,每個都是揭示語言含義的最小單元。要注意,通常,通過利用包括諸如用于把以日語書寫的句子分解為詞素的“ChaSen”的詞素分析儀和諸如用于識別詞素作為一串有意義的單詞的“YamCha”的所謂的分塊儀(chunker)的設(shè)備來進(jìn)行詞素分析。“ChaSen”是由奈良高級科學(xué)和技術(shù)研究大學(xué)的松本實驗室開發(fā)的分析儀。在英語句子等等的情況下,進(jìn)行被稱為歸類(lemmatization)的處理以取得用在句子中的每個單詞的基本形式。在歸類處理中,從單詞中丟棄在每個單詞尾部觀察到的變化,僅留下單詞的基本結(jié)構(gòu)。在每個單詞尾部看到的變化是在其它中指示名詞的復(fù)數(shù)或單數(shù)或指示事件發(fā)生的過去時或現(xiàn)在時的變化。
關(guān)聯(lián)信息計算單元56計算關(guān)聯(lián)由內(nèi)容特征量抽取單元52供應(yīng)的內(nèi)容特征量與由標(biāo)簽信息抽取單元54供應(yīng)的標(biāo)簽信息的信息。關(guān)聯(lián)信息計算單元56把對于內(nèi)容特征量計算的關(guān)聯(lián)信息存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57,并把對于標(biāo)簽信息計算的關(guān)聯(lián)信息存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58。
要注意,由內(nèi)容特征量抽取單元52抽取的內(nèi)容特征量可以預(yù)先被存儲于內(nèi)容特征量存儲單元53中,而由標(biāo)簽信息抽取單元54抽取的標(biāo)簽信息以與前述實施例相同的方式預(yù)先被存儲于標(biāo)簽信息存儲單元55中。在這種情況下,計算關(guān)聯(lián)信息的關(guān)聯(lián)信息計算單元56從內(nèi)容特征量存儲單元53中讀取內(nèi)容特征量,并從標(biāo)簽信息存儲單元55中讀取標(biāo)簽信息。然而,為了簡化說明,在圖27中沒有明示利用內(nèi)容特征量存儲單元53和標(biāo)簽信息存儲單元55的操作。
如下參考圖28所示的流程圖來說明圖27所示的內(nèi)容提供設(shè)備1進(jìn)行的學(xué)習(xí)處理。
在S71進(jìn)行的處理與在圖3所示的步驟S11進(jìn)行的處理相同。因此,省略步驟S71的說明。
在步驟S72,標(biāo)簽信息抽取單元54進(jìn)行標(biāo)簽信息抽取處理,以從存儲于文本存儲單元171中的文本信息中抽取標(biāo)簽信息。
如下參考圖29所示的流程圖來說明由標(biāo)簽信息抽取單元54在步驟S72進(jìn)行的標(biāo)簽信息抽取處理的細(xì)節(jié)。
在步驟S81,標(biāo)簽信息抽取單元54從文本存儲單元171中讀出文本信息。
在步驟S82,標(biāo)簽信息抽取單元54對從文本存儲單元171中讀出的文本信息進(jìn)行詞素分析。
圖30是顯示由標(biāo)簽信息抽取單元54進(jìn)行的典型詞素分析的圖表。
在如圖30所示的典型詞素分析中,圖上方部分所示的文本信息“hitasuraakarui norinori no kyoku ga”已經(jīng)存儲于文本存儲單元171中。在這種情況下,標(biāo)簽信息抽取單元54對文本信息“hitasura akarui norinori no kyoku ga”進(jìn)行詞素分析,并得到圖下方部分所示的詞素分析結(jié)果。
圖30下方部分所示的詞素分析結(jié)果被劃分為六列。左側(cè)起第一列顯示一串字符,而第二列顯示該字符串的發(fā)音。第三列顯示該字符串的基本形式,而第四列顯示該字符串的詞類名稱。第五列顯示該字符串的利用類型,而第六列顯示該字符串的利用形式。
也就是說,作為由標(biāo)簽信息抽取單元54進(jìn)行的詞素分析的結(jié)果,在圖30上方部分顯示的文本信息“hitasura akarui norinori no kyoku ga”的例子中,如圖下方部分所示,對于字符串“hitasura”,發(fā)音為“hitasura”,基本形式為“hitasura”并且詞類名稱為副詞-一般的。對于字符串“akarui”,發(fā)音為“akarui”,基本形式為“akarui”,詞類名稱為形容詞--獨立的,利用類型為形容詞-元音階段,利用形式為基本形式。對于字符串“norinori”,發(fā)音為“norinori”,基本形式為“norinori”,詞類名稱為名詞-形容詞/動詞根。
用相同的方式,在圖30上方部分所示的文本信息“hitasura akarui norinorino kyoku ga”的例子中,如圖下方部分所示,對于字符串“no”,發(fā)音為“no”,基本形式為“no”并且詞類名稱為助詞-修飾名詞的從句。對于字符串“kyoku”,發(fā)音為“kyoku”,基本形式為“kyoku”,詞類名稱為名詞-一般的。
對于字符串“ga”,發(fā)音為“ga”,基本形式為“ga”,詞類名稱為助詞-格助詞-一般的。
要注意,標(biāo)簽信息抽取單元54還可以依照預(yù)先定義的列表來從文本信息中刪除無關(guān)緊要的單詞。該無關(guān)緊要的單詞是被認(rèn)為是對詞素分析明顯不重要的單詞的單詞。無關(guān)緊要的單詞的例子有被顯示于圖30的下方部分并且預(yù)先包含在該列表中的字符串“no”和字符串“ga”。
讓我們返回參考圖29所示的流程圖。在步驟S83,標(biāo)簽信息抽取單元54把從詞素分析得到的詞素供應(yīng)給關(guān)聯(lián)信息計算單元56作為標(biāo)簽信息。然后,標(biāo)簽信息抽取單元54最終結(jié)束抽取標(biāo)簽信息的處理。處理的流程返回如圖28所示的步驟S72以便從步驟S73繼續(xù)學(xué)習(xí)處理。
具體地,標(biāo)簽信息抽取單元54把每個字符串的基本形式作為詞素。在圖30下方部分所示的典型詞素分析結(jié)果的例子中,每個字符串的基本形式被顯示于左側(cè)起第三列中。在這個典型詞素分析結(jié)果的例子中,字符串是字符串“hitasura”、“akarui”、“norinori”、“kyoku”等等。字符串的基本形式是在串的普通使用之前的原始形式。然后,標(biāo)簽信息抽取單元54把詞素“hitasura”、“akarui”、“norinori”和“kyoku”供應(yīng)給關(guān)聯(lián)信息計算單元56。
在步驟S73,在圖3所示的步驟S11進(jìn)行的處理非常相似,關(guān)聯(lián)信息計算單元56進(jìn)行尋找對于內(nèi)容特征量的關(guān)聯(lián)信息和對于標(biāo)簽信息的關(guān)聯(lián)信息的處理。關(guān)聯(lián)信息計算單元56分別把對于內(nèi)容特征量尋找的關(guān)聯(lián)信息存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57并把對于標(biāo)簽信息尋找的關(guān)聯(lián)信息存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58作為處理結(jié)果。然后,學(xué)習(xí)處理最終結(jié)束。
例如,基于內(nèi)容特征量和標(biāo)簽信息,關(guān)聯(lián)信息計算單元56計算均值向量μk、方差-協(xié)方差矩陣Sk、先驗概率值αk和條件概率p(wi|zk)作為對于潛在變量zk的關(guān)聯(lián)信息。然后,關(guān)聯(lián)信息計算單元56典型地把均值向量μk、方差-協(xié)方差矩陣Sk和先驗概率值存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中αk作為對于潛在變量zk的關(guān)聯(lián)信息,并且典型地把條件概率p(wi|zk)和先驗概率值αk存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58作為對于潛在變量zk和標(biāo)簽wi的組合的關(guān)聯(lián)信息。
如上所述,通過進(jìn)行學(xué)習(xí)處理,內(nèi)容提供設(shè)備1把對于內(nèi)容特征量尋找的關(guān)聯(lián)信息存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中,并把對于標(biāo)簽信息尋找的關(guān)聯(lián)信息存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中。
以這種方式,通過利用包含在以自然語言書寫的文本中的短語作為文本信息,用戶通過僅僅描述句子而不用識別內(nèi)容的特征,就能夠把屬性(或短語)賦給內(nèi)容。此外,由于內(nèi)容特征量和短語之間的關(guān)系被計算,它們之間的關(guān)系可用來降低給內(nèi)容分配元數(shù)據(jù)的成本。
參考圖31至35,下面的描述說明通過利用內(nèi)容特征量和標(biāo)簽信息之間的關(guān)系來選擇特定標(biāo)簽信息以及以高亮顯示項目顯示所選標(biāo)簽信息的處理。如上所述,內(nèi)容特征量和標(biāo)簽信息在學(xué)習(xí)處理中被彼此關(guān)聯(lián)。特定標(biāo)簽信息是具有良好的代表了短語與內(nèi)容特征量之間的關(guān)系程度的特性特征的標(biāo)簽信息。
圖31是顯示內(nèi)容提供設(shè)備1的再一典型功能配置的功能方框圖。
要注意,不再說明在圖31所示的配置中與圖2所示的其對應(yīng)部分的相同位置上放置的、用于作為對應(yīng)部分進(jìn)行相同處理、并且以相同標(biāo)號作為對應(yīng)部分表示的配置元件,以避免重復(fù)說明。圖31所示的內(nèi)容提供設(shè)備1的配置通過向方框圖27所示的配置添加特性-特征計算單元181、特征-短語選擇單元182、短語顯示控制單元183和顯示單元184來得到。
特性-特征計算單元181獲得對于作為分解來自內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57和標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58的文本信息處理的結(jié)果得到的短語的關(guān)聯(lián)信息。
基于所得到的對于短語的關(guān)聯(lián)信息,然后特性-特征計算單元181依照式(14)計算代表了短語與內(nèi)容特征量之間的關(guān)系程度的特性特征。然后,特性-特征計算單元181把所計算的特性特征和與特性特征相關(guān)聯(lián)的短語供應(yīng)給特征-短語選擇單元182。特性-特征計算單元181還把作為分解文本信息處理的結(jié)果得到的短語供應(yīng)給短語顯示控制單元183。
基于從特性-特征計算單元181接收的特性特征的值,特征-短語選擇單元182從與特性特征相關(guān)聯(lián)的短語中選擇特征短語。特征短語是具有相對大的特性特征值的短語。然后,特征-短語選擇單元182把所選特征短語供應(yīng)給短語顯示控制單元183。
要注意,依照由特征-短語選擇單元182采用的選擇特征短語的方法,每個都具有大于預(yù)定門限值的特性特征值的短語每個都被選擇作為特征短語。依照由特征-短語選擇單元182采用的選擇特征短語的另一個方法,存儲從特性-特征計算單元181接收的短語以便降低特性特征值,并且然后選擇了前10%的短語。
短語顯示控制單元183比較從特征-短語選擇單元182接收的所選特征短語與從特性-特征計算單元181接收到的短語作為分解文本信息的處理結(jié)果得到的短語。然后,短語顯示控制單元183僅把從特性-特征計算單元181接收到的短語作為每個都匹配一個特征短語的短語顯示在顯示單元184上作為高亮顯示項目。
顯示單元184對應(yīng)于圖1所示的輸出單元17。顯示單元184依照由短語顯示控制單元183執(zhí)行的控制典型地顯示用作文本信息的句子。
通過參考圖32所示的流程圖,下面的描述說明由如下圖31所示的內(nèi)容提供設(shè)備1進(jìn)行的處理作為顯示短語的處理。
在步驟S91,基于對于從文本信息中切割出來的短語的關(guān)聯(lián)信息,特性-特征計算單元181依照式(14)來計算對于短語的特性特征。
要注意,在下面的描述中,用作概率分布參數(shù)(或關(guān)聯(lián)信息)的條件概率p(z=z1|z1)和p(z=z1|z1)已經(jīng)分別對于圖33的表格所示的每個短語和每個潛在變量z1和z2而計算。在表格中,短語是從圖30上方部分所示的文本信息“hitasura akarui norinori no kyoku ga”中切割出來的除了每個都是助詞的標(biāo)簽單詞wi“no”和“ga”以外的標(biāo)簽單詞wi“hitasura”、“akarui”、“norinori”和“kyoku”。所計算的條件概率p(z=z1|wi)和p(z=z2|wi)已經(jīng)被存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中。
圖33是顯示基于潛在空間的作為短語(或標(biāo)簽wi)的典型表述的表述的圖表。也就是說,該圖顯示了作為對于短語的典型表述的潛在空間,即,條件概率p(z=zk|wi)的典型值。
在圖33所示的典型表格中,第一列和第一行各自顯示項目。第一列所示的項目每個都是從諸如評價內(nèi)容的文本的原文信息中切割出來的短語。原文信息是由標(biāo)簽信息抽取單元54抽取的信息。另一方面,第一行所示的項目是兩個潛在變量,即潛在變量z1和z2。
如圖33給出的表格的第二列所示,在標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中,存儲了(對于潛在變量z1的)典型的條件概率值0.4作為對于第二行的標(biāo)簽單詞“hitasura”的計算結(jié)果,(對于潛在變量z1的)典型的條件概率值0.8作為對于第三行的標(biāo)簽單詞“akarui”的計算結(jié)果,(對于潛在變量z1的)典型的條件概率值0.7作為對于第四行的標(biāo)簽單詞“norinori”的計算結(jié)果,(對于潛在變量z1的)典型的條件概率值0.5作為對于第五行的標(biāo)簽單詞“kyoku”的計算結(jié)果,等等。
也就是說,短語“hitasura”、“akarui”、“norinori”、“kyoku”等等的每一個都通過利用潛在變量z1的值與音樂內(nèi)容關(guān)聯(lián)。
用相同的方式,如圖33所示,在標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中,存儲了(對于潛在變量z2的)典型的條件概率值0.6作為對于第二行的標(biāo)簽單詞“hitasura”的計算結(jié)果,(對于潛在變量z2的)典型的條件概率值0.2作為對于第三行的標(biāo)簽單詞“akarui”的計算結(jié)果,(對于潛在變量z2的)典型的條件概率值0.3作為對于第四行的標(biāo)簽單詞“norinori”的計算結(jié)果,(對于潛在變量z2的)典型的條件概率值0.5作為對于第五行的標(biāo)簽單詞“kyoku”的計算結(jié)果,等等。
也就是說,短語“hitasura”、“akarui”、“norinori”、“kyoku”等等的每一個都通過利用潛在變量z2的值與音樂內(nèi)容關(guān)聯(lián)。
此外,如圖33所示,例如,每個都具有與音樂內(nèi)容數(shù)據(jù)的密切聯(lián)系的短語“akarui”和“norinori”具有對于潛在變量z1和z2的大的條件概率p(z=zk|wi)值。
也就是說,基于圖33所示作為對于短語的關(guān)聯(lián)信息的關(guān)聯(lián)信息,特性-特征計算單元181依照式(14)計算如圖34所示的特性特征。
圖34是顯示每個短語(或每個標(biāo)簽wi)的典型特性特征的圖表。
在圖34所示的典型表格中,第一列顯示短語,而第二列顯示特性特征。
如圖34所示,作為計算的結(jié)果,特性-特征計算單元181產(chǎn)生對于第二行的短語“hitasura”的特性特征值0.708,對于第三行的短語“akarui”的特性特征值0.859,對于第四行的短語“norinori”的特性特征值0.816,對于第五行的短語“kyoku”的特性特征值0.699。
讓我們返回參考圖32所示的流程圖。在步驟S92,特征-短語選擇單元182從原文信息切割出來的短語中選擇特征短語。
例如,特征-短語選擇單元182從如圖34所示的短語“hitasura”、“akarui”、“norinori”、“kyoku”等等中選擇每個都具有大于0.8的特性特征值的特征短語“akarui”和“norinori”。
換句話說,由特征-短語選擇單元182進(jìn)行的以選擇每個都具有較多不成比例的概率分布參數(shù)(用作關(guān)聯(lián)信息)的特征短語“akarui”和“norinori”的操作也可以被稱為選擇每個都具有與音樂內(nèi)容數(shù)據(jù)緊密聯(lián)系的短語的操作。也就是說,在圖34所示的典型特性特征值的例子中,如果以遞增的特性特征值的順序排列短語,具有特性特征值0.699的短語“kyoku”后面依次跟著具有特性特征值0.708的短語“hitasura”、具有特性特征值0.816的短語“norinori”和具有特性特征值0.859的短語“akarui”。在這種情況下,例如,每個都具有比其它短語更加不成比例的概率分布參數(shù)(用作關(guān)聯(lián)信息)的特征短語“akarui”和“norinori”是與其它短語相比每個都具有大的特性特征值的短語。
在上述實施例中,特征-短語選擇單元182選擇每個都具有大于0.8的特性特征值的短語作為特征短語。然而,要注意,選擇特征短語的方法決不局限于上述技術(shù)。例如,每個都具有大于預(yù)先確定的門限值的特性特征值的短語每個都可以被選作特征短語,或者,作為替換,在所接收的以遞減的特性特征值的順序排列的短語中,選擇前N%的短語,其中,N為滿足關(guān)系0≤N≤100的數(shù)字。
讓我們返回參考圖32所示的流程圖。在步驟S93,短語顯示控制單元183把從原文信息中切割處理的一些短語作為匹配所選特征短語的短語顯示在顯示單元184上作為高亮顯示項目。然后,顯示短語的處理最終結(jié)束。
例如,短語顯示控制單元183把從諸如評價音樂內(nèi)容的文本的原文信息中切割出來的一些短語作為匹配由特征-短語選擇單元182選擇的所選特征短語“akarui”和“norinori”的短語顯示在顯示單元184上作為高亮顯示項目。
圖35是顯示每個都由顯示單元184輸出的、作為諸如評論音樂內(nèi)容的句子的句子的顯示的典型顯示的圖表。
如圖35的上方部分所示,由顯示單元184輸出的顯示示出了句子“hitasura akarui norinori no kyoku ga”。句子包括每個都具有大特性特征值的特征短語“akarui”和“norinori”。特征短語每個都被顯示作為帶有每個都具有大于用在其它短語中的字符尺寸的的尺寸的字符的短語。
如圖35的下方部分所示,由顯示單元184輸出的顯示示出了句子“hitasura akarui norinori no kyoku ga”。句子包括每個都具有大特性特征值的特征短語“akarui”和“norinori”。特征短語每個都被顯示作為帶有不同于其它短語的背景模式的背景模式的短語。
以這種方式,具有與內(nèi)容的特征量的緊密聯(lián)系的短語被顯示作為高亮顯示項目。因此,當(dāng)用戶讀取諸如評價內(nèi)容的文本的句子時,用戶顯然注意到作為高亮顯示項目顯示的短語。
在上述實施例中,特征短語被顯示作為帶有每個都具有大于用在其它短語中的字符尺寸的尺寸的字符的短語,或者被顯示作為帶有不同于其它短語的背景模式的背景模式的短語。然而,要注意,本發(fā)明的實現(xiàn)決不僅限于本實施例。例如,特征短語還可以被顯示作為帶有不同于其它短語的顏色的顏色的短語。重點是特征短語可以以任何方式被顯示,只要該方式不同于顯示其它短語的方式即可。
另外,依照本發(fā)明,例如,內(nèi)容和/或標(biāo)簽還可以被聚合。例如,聚合被映射到潛在空間上的內(nèi)容(和/或標(biāo)簽)的處理可以通過采用任何聚合算法來進(jìn)行。在這種情況下,由于內(nèi)容(和/或標(biāo)簽)典型地以相同的潛在空間來表述,聚合內(nèi)容和標(biāo)簽的處理不一定必須單獨地進(jìn)行。相反,內(nèi)容和標(biāo)簽可以同時聚合,以便得到其中內(nèi)容與標(biāo)簽混和的組(cluster)。
因此,在早期通過參考圖16所示的流程圖說明的內(nèi)容搜索處理中,例如,不以分開的搜索處理來搜索內(nèi)容和標(biāo)簽,包含在相同組中的內(nèi)容和標(biāo)簽可以被看作搜索內(nèi)容和標(biāo)簽的處理結(jié)果。結(jié)果,用戶能夠快速得到想要的內(nèi)容。
此外,在上述實施例中,內(nèi)容提供裝置1在學(xué)習(xí)和操作階段都進(jìn)行處理。然而,也可能提供配置,其中可以由不同于在操作階段進(jìn)行處理的設(shè)備的設(shè)備來進(jìn)行學(xué)習(xí)階段的處理。通過參考圖36至37,下面的描述說明用于在學(xué)習(xí)階段進(jìn)行處理的內(nèi)容提供設(shè)備1和用于在操作階段進(jìn)行處理作為不同于內(nèi)容提供設(shè)備1的設(shè)備的另一設(shè)備的配置。
圖36是顯示用于在學(xué)習(xí)階段進(jìn)行處理的內(nèi)容提供設(shè)備1的典型功能配置的功能方框圖。
不再說明在圖36所示的配置中與圖2所示的其對應(yīng)部分的相同位置上放置的并且以相同標(biāo)號作為對應(yīng)部分表示的配置元件,以避免重復(fù)說明。圖36所示的內(nèi)容提供設(shè)備1的配置包括用于在學(xué)習(xí)階段進(jìn)行處理的單元的內(nèi)容存儲單元51、內(nèi)容特征量抽取單元52、內(nèi)容特征量存儲單元53、標(biāo)簽信息抽取單元54、標(biāo)簽信息存儲單元55、關(guān)聯(lián)信息計算單元56、內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57、標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58。
例如,通過進(jìn)行圖3所示的學(xué)習(xí)處理,圖36所示的內(nèi)容提供設(shè)備1計算關(guān)聯(lián)存儲于內(nèi)容存儲單元51中的內(nèi)容的內(nèi)容特征量和該內(nèi)容的標(biāo)簽信息的信息,把對于內(nèi)容特征量的關(guān)聯(lián)信息存儲于內(nèi)容特征量-潛在空間關(guān)聯(lián)信息存儲單元57中,并把對于標(biāo)簽信息的關(guān)聯(lián)信息存儲于標(biāo)簽信息-潛在空間關(guān)聯(lián)信息存儲單元58中。
也就是說,圖36所示的內(nèi)容提供設(shè)備1把存儲于它本身內(nèi)的數(shù)據(jù)供應(yīng)給在操作階段進(jìn)行處理的設(shè)備。在操作階段進(jìn)行處理的設(shè)備的例子是如下參考圖37描述的客戶終端設(shè)備201。
圖37是顯示用于在操作階段進(jìn)行處理的客戶終端設(shè)備201的典型功能配置的功能方框圖。
不再說明在圖37所示的配置中與圖2所示的其對應(yīng)部分的相同位置上放置的并且以相同標(biāo)號作為對應(yīng)部分表示的對應(yīng)部分的配置元件,以避免重復(fù)說明。圖37所示的客戶終端設(shè)備201的配置包括用于在學(xué)習(xí)階段進(jìn)行處理的單元的內(nèi)容特征量抽取單元52、內(nèi)容特征量-潛在空間轉(zhuǎn)換單元59、標(biāo)簽信息-潛在空間轉(zhuǎn)換單元60、潛在空間偏差計算單元61、標(biāo)簽選擇單元62和內(nèi)容選擇單元63。客戶終端設(shè)備201是依照本發(fā)明的典型的信息處理設(shè)備。
通過進(jìn)行圖14所示的標(biāo)簽分配處理,客戶終端設(shè)備201給新添加的內(nèi)容分配標(biāo)簽??蛻艚K端設(shè)備201通過典型地從圖36所示的內(nèi)容提供設(shè)備1中獲得標(biāo)簽分配處理所需的數(shù)據(jù),來進(jìn)行標(biāo)簽分配處理。
此外,通過進(jìn)行圖16所示的內(nèi)容搜索處理,客戶終端設(shè)備201獲得存儲于圖36所示的內(nèi)容提供設(shè)備1中的內(nèi)容??蛻艚K端設(shè)備201通過典型地從圖36所示的內(nèi)容提供設(shè)備1中獲得內(nèi)容搜索處理所需的數(shù)據(jù),來進(jìn)行內(nèi)容搜索處理。
以這種方式,依照本發(fā)明,由不同于用于在操作階段進(jìn)行處理的操作階段設(shè)備的學(xué)習(xí)階段設(shè)備來進(jìn)行在學(xué)習(xí)階段的處理。
建議讀者緊記,可能提供配置,其中客戶終端設(shè)備201僅進(jìn)行圖14所示的標(biāo)簽分配處理或僅進(jìn)行圖16所示的內(nèi)容搜索處理作為在操作階段的處理。
此外,還可能提供配置,其中,圖36所示的內(nèi)容提供設(shè)備1進(jìn)行通過前面參考圖27至30說明的處理作為在學(xué)習(xí)階段的處理,而圖37所示的客戶終端設(shè)備201進(jìn)行通過前面參考圖31至35說明的處理作為在操作階段的處理。由內(nèi)容提供設(shè)備1在學(xué)習(xí)階段進(jìn)行的處理和由客戶終端設(shè)備201在操作階段進(jìn)行的處理組成了通過前面參考圖27至35說明的處理。
如上所述,依照本發(fā)明,適合于內(nèi)容的關(guān)鍵詞可以被分配給該內(nèi)容。
此外,依照本發(fā)明,依靠反映內(nèi)容特征量和標(biāo)簽信息的分布特征的潛在空間,標(biāo)簽可以被分配給甚至沒有標(biāo)簽的內(nèi)容或者分配給內(nèi)容的標(biāo)簽可被用于搜索內(nèi)容。
另外,依照本發(fā)明,依靠集成了除內(nèi)容特征量和標(biāo)簽信息之外的展示彼此不同的分布的多種信息的潛在空間,現(xiàn)在可以發(fā)明現(xiàn)存的方法未發(fā)現(xiàn)的關(guān)系作為這種信息之間的相互關(guān)系。因此,本發(fā)明也可以用于,例如,向用戶推薦內(nèi)容的系統(tǒng)。展示不同分布的信息的例子是依賴于用戶的經(jīng)驗的環(huán)境信息和喜好信息。
要注意,在上述實施例中,關(guān)聯(lián)信息是關(guān)聯(lián)內(nèi)容與標(biāo)簽的信息。關(guān)聯(lián)信息的例子是均值向量μk、方差-協(xié)方差矩陣Sk、先驗概率值αk和條件概率p(wi|zk)。均值向量μk、方差-協(xié)方差矩陣Sk、先驗概率值αk和條件概率p(wi|zk)也可以被稱為代表內(nèi)容特征量、標(biāo)簽信息和潛在變量的概率分布性質(zhì)的參數(shù)(或者,嚴(yán)格地說,概率分布參數(shù))。也就是說,關(guān)聯(lián)信息計算單元56計算這些參數(shù)作為關(guān)聯(lián)信息。
此外,在上述實施例中,內(nèi)容特征量抽取單元52、標(biāo)簽信息抽取單元54、環(huán)境信息抽取單元111和喜好信息抽取單元151分別抽取內(nèi)容特征量、標(biāo)簽信息、環(huán)境信息和喜好信息。代替利用內(nèi)容提供設(shè)備1抽取內(nèi)容特征量、標(biāo)簽信息、環(huán)境信息和喜好信息,它們還可以由不同于內(nèi)容提供設(shè)備1或由用戶給出的外部設(shè)備來抽取。
此外,在上述實施例中,為了簡化說明音樂內(nèi)容的數(shù)目是10。然而,實際上,想要處理幾千個音樂內(nèi)容。然而,可以以相同的方式在具有更大量的音樂內(nèi)容的應(yīng)用中進(jìn)行處理。
可以由硬件和/或軟件的執(zhí)行來進(jìn)行前述的處理序列。如果,由軟件的執(zhí)行來進(jìn)行上述處理序列,組成軟件的程序可以典型地從記錄介質(zhì)安裝到嵌入專用硬件的計算機、通用個人計算機等等中。在這種情況下,計算機或個人計算機用作前述的內(nèi)容提供設(shè)備1和/或客戶終端設(shè)備201。通用個人計算機是能夠通過在個人計算機上安裝各種程序使之進(jìn)行各種功能的個人計算機。
用于記錄將被安裝在計算機或通用個人計算機中作為將由計算機或通用個人計算機執(zhí)行的程序的程序的記錄介質(zhì),是如圖1所示的可移動記錄介質(zhì)21,作為從提供程序給用戶的計算機或通用個人計算機中獨立地被提供給用戶的記錄介質(zhì)。還被稱為便攜介質(zhì)的可移動記錄介質(zhì)21的例子包括諸如軟盤的磁盤、諸如CD-ROM(壓縮盤-只讀存儲器)或DVD(數(shù)字化通用盤)的光盤,諸如MD(MINI DISC,注冊商標(biāo))的磁-光盤以及半導(dǎo)體存儲器。代替安裝來自可移動記錄介質(zhì)21的程序,程序也可以預(yù)先被存儲在被包括在被提供給用戶的計算機或通用個人計算機的主要單元中的嵌入式記錄介質(zhì)中。嵌入式記錄介質(zhì)的例子是被包括在如圖1所示的記錄部分18和ROM 12中的硬盤。
被存儲于硬盤中的作為將由計算機或通用個人計算機執(zhí)行以進(jìn)行上述處理序列的程序的程序還可以是,如果需要,通過用作典型地具有路由器或調(diào)制解調(diào)器的接口,通過利用基于無線和/或有線通信的通信介質(zhì),從源下載程序到計算機或通用個人計算機,來從外部源安裝的程序?;跓o線或有線通信的通信介質(zhì)的例子是局域網(wǎng)、因特網(wǎng)和數(shù)字廣播衛(wèi)星。
要注意,在本說明書中,上述流程步驟不僅可以以沿時間軸的預(yù)先指定的順序進(jìn)行,還可以同時或獨立地進(jìn)行。
還不值得一提,本說明書中使用的技術(shù)術(shù)語“系統(tǒng)”指的是包括多個設(shè)備的集合的配置。
還要注意,本發(fā)明的實現(xiàn)決不僅局限于上述實施例。也就是說,可能對實施例進(jìn)行各種改變,只要該改變在不偏離本發(fā)明實質(zhì)的范圍內(nèi)。
權(quán)利要求
1.一種信息處理設(shè)備,包括
第一計算裝置,用于計算代表對于為與內(nèi)容有關(guān)的特征量和顯示所述內(nèi)容的屬性的屬性信息共用的第一潛在變量的概率分布性質(zhì)、對于所述特征量的概率分布性質(zhì)和對于所述屬性信息的概率分布性質(zhì)的第一參數(shù);和
存儲裝置,用于存儲所計算的第一參數(shù)。
2.如權(quán)利要求1所述的信息處理設(shè)備進(jìn)一步包括
第一抽取裝置,用于抽取所述特征量;和
第二抽取裝置,用于抽取所述屬性信息,
其中所述第一計算裝置從所抽取的特征量和所抽取的屬性信息計算所述第一參數(shù)。
3.如權(quán)利要求2所述的信息處理設(shè)備,其中,其中所述第二抽取裝置把以自然語言書寫的句子劃分為單詞或者每個都由所述單詞組成的短語。
4.如權(quán)利要求3所述的信息處理設(shè)備,進(jìn)一步包括
第二計算裝置,用于基于由所述第一計算裝置計算的所述第一參數(shù)來計算顯示所述短語和所述特征量之間的關(guān)系程度的特性特征;和
顯示控制裝置,用于基于所抽取的特性特征來控制顯示所述短語的處理。
5.如權(quán)利要求1所述的信息處理設(shè)備,其中
所述第一計算裝置計算代表對于所述特征量的概率分布性質(zhì)、對于所述屬性信息的概率分布性質(zhì)和為所述特征量、所述屬性信息和被用戶用作關(guān)于利用所述內(nèi)容的信息的利用信息共用的第二潛在變量的概率分布性質(zhì)的第二參數(shù);以及
所述存儲裝置被用于存儲由所述第一計算裝置計算的所述第二參數(shù)。
6.如權(quán)利要求5所述的信息處理設(shè)備,進(jìn)一步包括
抽取裝置,用于抽取所述利用信息,其中
所述第一計算裝置從所述特征量、所述屬性信息或由所述抽取裝置抽取的利用信息計算所述第二參數(shù)。
7.如權(quán)利要求1所述的信息處理設(shè)備,其中
所述第一計算裝置計算代表對于所述特征量的概率分布性質(zhì)、對于所述屬性信息的概率分布性質(zhì)和為所述特征量、所述屬性信息和被用作關(guān)于每個作為用戶喜好的內(nèi)容的信息的喜好信息共用的第三潛在變量的概率分布性質(zhì)的第三參數(shù);以及
所述存儲裝置被用于存儲所計算的第三參數(shù)。
8.如權(quán)利要求7所述的信息處理設(shè)備,進(jìn)一步包括
抽取裝置,用于抽取所述喜好信息,其中
所述第一計算裝置從所述特征量、所述屬性信息或所抽取的喜好信息中計算所述第三參數(shù)。
9.一種信息處理方法,包括
計算步驟,用于計算代表對于為與內(nèi)容有關(guān)的特征量和顯示所述內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于所述特征量的概率分布性質(zhì)和對于所述屬性信息的概率分布性質(zhì)的參數(shù);和
存儲步驟,用于存儲所計算的參數(shù)。
10.一種由計算機執(zhí)行的程序,以進(jìn)行
計算步驟,用于計算代表對于為與內(nèi)容有關(guān)的特征量和顯示所述內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于所述特征量的概率分布性質(zhì)和對于所述屬性信息的概率分布性質(zhì)的參數(shù);和
存儲步驟,用于存儲所計算的參數(shù)。
11.一種信息處理設(shè)備,包括
抽取裝置,用于抽取與內(nèi)容有關(guān)的特征量;
轉(zhuǎn)換裝置,用于基于代表對于為所述特征量和顯示所述內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于所述特征量的概率分布性質(zhì)和對于所述屬性信息的概率分布性質(zhì)的參數(shù),來進(jìn)行轉(zhuǎn)換處理以把所抽取的特征量放置于潛在空間中;
計算裝置,用于計算作為所述轉(zhuǎn)換處理結(jié)果被放置于所述潛在空間中的所述特征量和通過所述潛在變量與所述特征量潛在地關(guān)聯(lián)的所述屬性信息之間的偏差;和
選擇裝置,用于基于所計算的偏差來選擇對于所述內(nèi)容的屬性。
12.如權(quán)利要求11所述的信息處理設(shè)備,其中,作為對于所述內(nèi)容的所選屬性,所述選擇裝置在所有屬性中選擇所計算的偏差不高于門限值的屬性,或者選擇具有最小偏差的預(yù)定數(shù)目的屬性。
13.一種信息處理方法,包括
抽取步驟,用于抽取與內(nèi)容有關(guān)的特征量;
轉(zhuǎn)換步驟,用于基于代表對于為所述特征量和顯示所述內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于所述特征量的概率分布性質(zhì)和對于所述屬性信息的概率分布性質(zhì)的參數(shù),來進(jìn)行轉(zhuǎn)換處理以把所抽取的特征量放置于潛在空間中;
計算步驟,用于計算作為所述轉(zhuǎn)換處理結(jié)果被放置于所述潛在空間中的所述特征量和通過所述潛在變量與所述特征量潛在地關(guān)聯(lián)的所述屬性信息之間的偏差;和
選擇步驟,用于基于所計算的偏差來選擇對于所述內(nèi)容的屬性。
14.一種由計算機執(zhí)行的程序,以進(jìn)行
抽取步驟,用于抽取與內(nèi)容有關(guān)的特征量;
轉(zhuǎn)換步驟,用于基于代表對于為所述特征量和顯示所述內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于所述特征量的概率分布性質(zhì)和對于所述屬性信息的概率分布性質(zhì)的參數(shù),來進(jìn)行轉(zhuǎn)換處理以把所抽取的特征量放置于潛在空間中;
計算步驟,用于計算作為所述轉(zhuǎn)換處理結(jié)果被放置于所述潛在空間中的所述特征量和通過所述潛在變量與所述特征量潛在地關(guān)聯(lián)的所述屬性信息之間的偏差;和
選擇步驟,用于基于所計算的偏差來選擇對于所述內(nèi)容的屬性。
15.一種信息處理設(shè)備,包括
轉(zhuǎn)換裝置,用于基于代表對于為與內(nèi)容有關(guān)的特征量和顯示所述內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于所述特征量的概率分布性質(zhì)和對于所述屬性信息的概率分布性質(zhì)的參數(shù),來進(jìn)行轉(zhuǎn)換處理以把所述屬性信息放置于潛在空間中;
計算裝置,用于計算作為所述轉(zhuǎn)換處理結(jié)果被放置于所述潛在空間中的所述特征量和通過所述潛在變量與所述特征量潛在地關(guān)聯(lián)的所述屬性信息之間的偏差;和
選擇裝置,用于基于所計算的偏差選擇對于所述屬性信息的內(nèi)容。
16.如權(quán)利要求15所述的信息處理設(shè)備,其中,作為對于所述屬性的所選內(nèi)容,所述選擇裝置在所有內(nèi)容中選擇所計算的偏差不高于門限值的內(nèi)容,或者選擇具有最小偏差的預(yù)定數(shù)目的內(nèi)容。
17.一種信息處理方法,包括
轉(zhuǎn)換步驟,用于基于代表對于為與內(nèi)容有關(guān)的特征量和顯示所述內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于所述特征量的概率分布性質(zhì)和對于所述屬性信息的概率分布性質(zhì)的參數(shù),來進(jìn)行轉(zhuǎn)換處理以把所述屬性信息放置于潛在空間中;
計算步驟,用于計算作為所述轉(zhuǎn)換處理結(jié)果被放置于所述潛在空間中的所述特征量和通過所述潛在變量與所述特征量潛在地關(guān)聯(lián)的所述屬性信息之間的偏差;和
選擇步驟,用于基于所計算的偏差選擇對于所述屬性信息的內(nèi)容。
18.一種由計算機執(zhí)行的程序,以進(jìn)行
轉(zhuǎn)換步驟,用于基于代表對于為與內(nèi)容有關(guān)的特征量和顯示所述內(nèi)容的屬性的屬性信息共用的潛在變量的概率分布性質(zhì)、對于所述特征量的概率分布性質(zhì)和對于所述屬性信息的概率分布性質(zhì)的參數(shù),來進(jìn)行轉(zhuǎn)換處理以把所述屬性信息放置于潛在空間中;
計算步驟,用于計算作為所述轉(zhuǎn)換處理結(jié)果被放置于所述潛在空間中的所述特征量和通過所述潛在變量與所述特征量潛在地關(guān)聯(lián)的所述屬性信息之間的偏差;和
選擇步驟,用于基于所計算的偏差選擇對于所述屬性信息的內(nèi)容。
全文摘要
提供了能夠把最適宜的關(guān)鍵詞授予給內(nèi)容的信息處理設(shè)備、方法和程序。內(nèi)容特征量抽取部分(52)抽取關(guān)于內(nèi)容的內(nèi)容特征量。標(biāo)簽信息抽取部分(54)抽取指示關(guān)于內(nèi)容的特征的標(biāo)簽信息。相應(yīng)信息計算部分(56)分別計算指示為內(nèi)容特征量和標(biāo)簽信息共用的潛在變量zK的概率分布的參數(shù)、內(nèi)容特征量和標(biāo)簽信息。內(nèi)容特征量-潛在空間相應(yīng)信息積聚部分(57)或標(biāo)簽信息-潛在空間相應(yīng)信息積聚部分(58)積聚所計算的潛在變量zK,以便最適宜的關(guān)鍵詞可以被授予給內(nèi)容。
文檔編號G10L11/00GK101116073SQ200680004028
公開日2008年1月30日 申請日期2006年12月4日 優(yōu)先權(quán)日2005年12月5日
發(fā)明者館野啟 申請人:索尼株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
富裕县| 岳西县| 太和县| 呼玛县| 称多县| 济宁市| 神农架林区| 丽江市| 镇康县| 额济纳旗| 上思县| 呼玛县| 玛沁县| 江都市| 吴江市| 泗洪县| 高平市| 赤城县| 阿拉尔市| 金塔县| 福鼎市| 淳安县| 稻城县| 伊金霍洛旗| 习水县| 福泉市| 龙井市| 绥阳县| 南岸区| 乌恰县| 孝义市| 兖州市| 云南省| 宿迁市| 门源| 平邑县| 南乐县| 淮滨县| 衡水市| 襄垣县| 都江堰市|