欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

信息處理裝置、特征提取方法、記錄介質(zhì)以及程序的制作方法

文檔序號(hào):6566362閱讀:188來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):信息處理裝置、特征提取方法、記錄介質(zhì)以及程序的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種信息處理裝置、特征提取方法、記錄介質(zhì)以及程序,特別是涉及能夠簡(jiǎn)單且正確地提取將多個(gè)要素分類(lèi)后的類(lèi)的特征的信息處理裝置、特征提取方法、記錄介質(zhì)以及程序。
背景技術(shù)
目前,提出了如下的系統(tǒng)觀眾在視聽(tīng)節(jié)目過(guò)程中向服務(wù)器請(qǐng)求與節(jié)目關(guān)聯(lián)的信息,將與視聽(tīng)過(guò)程中的節(jié)目預(yù)先相關(guān)聯(lián)存儲(chǔ)的節(jié)目關(guān)聯(lián)信息提供給觀眾(例如,參照專(zhuān)利文獻(xiàn)1)。
另外,近年來(lái),普及了專(zhuān)利文獻(xiàn)1記載的發(fā)明那樣的系統(tǒng)、服務(wù),即,不僅響應(yīng)于用戶(hù)的要求,而且根據(jù)商品的購(gòu)入、內(nèi)容(例如電視節(jié)目、Web頁(yè)等)的視聽(tīng)等過(guò)去的用戶(hù)實(shí)績(jī),推薦符合用戶(hù)愛(ài)好的商品、內(nèi)容的系統(tǒng)、服務(wù)。
例如,提出了如下方案對(duì)構(gòu)成觀眾所選擇的節(jié)目以及未選擇的節(jié)目的節(jié)目名的語(yǔ)句進(jìn)行評(píng)價(jià),優(yōu)先顯示節(jié)目名中包括評(píng)價(jià)高的語(yǔ)句的節(jié)目候選(例如,參照專(zhuān)利文獻(xiàn)2)。
專(zhuān)利文獻(xiàn)1日本特開(kāi)2005-102109號(hào)公報(bào)專(zhuān)利文獻(xiàn)2日本特開(kāi)2001-275056號(hào)公報(bào)發(fā)明內(nèi)容發(fā)明要解決的問(wèn)題但是,在現(xiàn)有的推薦商品、內(nèi)容的系統(tǒng)、服務(wù)中,大多使用根據(jù)用戶(hù)的過(guò)去實(shí)績(jī),例如利用具有類(lèi)似購(gòu)買(mǎi)模式的其他用戶(hù)的購(gòu)買(mǎi)履歷的強(qiáng)調(diào)過(guò)濾等推薦算法,但是這種情況下難以向用戶(hù)呈現(xiàn)明確的推薦理由。
另外,例如考慮使用用來(lái)從數(shù)據(jù)集合發(fā)現(xiàn)規(guī)則或者知識(shí)的理論即粗集合理論,從用戶(hù)過(guò)去購(gòu)入的商品、視聽(tīng)的內(nèi)容等的數(shù)據(jù)屬性中,將表示用戶(hù)愛(ài)好的數(shù)據(jù)屬性的組合作為推薦理由而提取,但是算法復(fù)雜且龐大,計(jì)算量以及計(jì)算所需的存儲(chǔ)介質(zhì)的存儲(chǔ)容量很龐大。因此,需要采取以下應(yīng)對(duì)措施限制與商品、內(nèi)容等相關(guān)聯(lián)的數(shù)據(jù)屬性的數(shù)量、種類(lèi),或者準(zhǔn)備處理能力高的計(jì)算機(jī)。
另外,在專(zhuān)利文獻(xiàn)2記載的發(fā)明中,從構(gòu)成所選擇節(jié)目的節(jié)目名的語(yǔ)句中,單純地去掉構(gòu)成未選擇的節(jié)目名的語(yǔ)句,來(lái)推薦包括剩余語(yǔ)句的節(jié)目,它并不一定能正確地提取并反映用戶(hù)的愛(ài)好。
本發(fā)明是鑒于這種狀況而作出的發(fā)明,能夠簡(jiǎn)單且正確地提取將多個(gè)要素分類(lèi)后的類(lèi)的特征。
用于解決問(wèn)題的手段在本發(fā)明的一個(gè)側(cè)面的信息處理裝置中設(shè)置有特征提取單元,該特征提取單元作為將與表示各要素的特征的數(shù)據(jù)分別相關(guān)聯(lián)的多個(gè)上述要素進(jìn)行分類(lèi)后的類(lèi)的特征,在通過(guò)關(guān)于屬于成為提取特征的對(duì)象的上述類(lèi)的各個(gè)上述要素取出與上述要素相關(guān)聯(lián)的1個(gè)以上的上述數(shù)據(jù)而求出的上述數(shù)據(jù)的全部組合之中,提取在通過(guò)關(guān)于屬于其他上述類(lèi)的各個(gè)上述要素取出與上述要素相關(guān)聯(lián)的1個(gè)以上的上述數(shù)據(jù)而求出的上述數(shù)據(jù)的組合中不存在的上述數(shù)據(jù)的組合。
還可以設(shè)置特征呈現(xiàn)控制單元,該特征呈現(xiàn)控制單元控制上述類(lèi)的特征的呈現(xiàn),使得將所提取的上述數(shù)據(jù)的組合中的1個(gè)以上的組合作為上述類(lèi)的特征呈現(xiàn)給用戶(hù)。
還可以設(shè)置數(shù)據(jù)提取單元,該數(shù)據(jù)提取單元根據(jù)屬于上述類(lèi)的上述要素和上述數(shù)據(jù)之間的第1關(guān)聯(lián)度、以及屬于其他上述類(lèi)的上述要素和上述數(shù)據(jù)之間的第2關(guān)聯(lián)度與上述第1關(guān)聯(lián)度之間的差異,在提取上述數(shù)據(jù)的組合之前,提取更明確地表示屬于上述類(lèi)的上述要素的特征的上述數(shù)據(jù),上述特征提取單元提取由上述數(shù)據(jù)提取單元所提取的上述數(shù)據(jù)的組合。
在上述數(shù)據(jù)提取單元中,可根據(jù)上述第1關(guān)聯(lián)度、以及上述第2關(guān)聯(lián)度與上述第1關(guān)聯(lián)度之間的差異,求出上述類(lèi)中的上述數(shù)據(jù)的權(quán)重,提取上述權(quán)重的值是上位的規(guī)定數(shù)量的上述數(shù)據(jù)、或者上述權(quán)重的值是規(guī)定閾值以上的上述數(shù)據(jù)。
在上述數(shù)據(jù)提取單元中將tfidf(term frequency with inversedocument frequency單詞頻率/逆文檔頻率)、相互信息量、信息增益比、χ平方值、或者對(duì)數(shù)似然比中的任意一個(gè)作為上述類(lèi)中的上述數(shù)據(jù)的權(quán)重而求出。
還可以設(shè)置要素提取單元,該要素提取單元根據(jù)所提取的上述數(shù)據(jù)的組合,從屬于與由上述要素構(gòu)成的第1組不同的第2組的要素中,提取與屬于被提取了上述數(shù)據(jù)的組合的上述類(lèi)的上述要素有關(guān)聯(lián)的要素。
在上述要素提取單元中,提取與包含所提取的上述數(shù)據(jù)的組合的上述數(shù)據(jù)相關(guān)聯(lián)的屬于上述第2組的上述要素。
還可以設(shè)置要素呈現(xiàn)控制單元,該要素呈現(xiàn)控制單元控制向用戶(hù)呈現(xiàn)所提取的上述要素。
可在上述要素呈現(xiàn)控制單元中進(jìn)行控制,使得作為提取上述要素的依據(jù),進(jìn)一步呈現(xiàn)上述要素的提取中所使用的上述數(shù)據(jù)的組合。
可使上述要素是內(nèi)容,上述數(shù)據(jù)是與上述內(nèi)容有關(guān)的元數(shù)據(jù)。
還可以設(shè)置評(píng)價(jià)指標(biāo)算出單元,該評(píng)價(jià)指標(biāo)算出單元算出評(píng)價(jià)指標(biāo),該評(píng)價(jià)指標(biāo)表示所提取的上述數(shù)據(jù)的組合和屬于提取對(duì)象類(lèi)的上述要素之間的關(guān)聯(lián)度,其中,該提取對(duì)象類(lèi)是被提取了上述數(shù)據(jù)的組合的上述類(lèi)。
可在上述評(píng)價(jià)指標(biāo)算出單元中作為上述評(píng)價(jià)指標(biāo)算出F值,該F值是屬于上述提取對(duì)象類(lèi)的上述要素之中與包括上述數(shù)據(jù)的組合的上述數(shù)據(jù)相關(guān)聯(lián)的上述要素所占的比例即再現(xiàn)率、以及與包括上述數(shù)據(jù)的組合的上述數(shù)據(jù)相關(guān)聯(lián)的上述要素之中屬于上述提取對(duì)象類(lèi)的上述要素所占的比例即適合率的調(diào)和平均。
還可以設(shè)置類(lèi)分類(lèi)單元,該類(lèi)分類(lèi)單元根據(jù)對(duì)與成為分類(lèi)對(duì)象的要素相關(guān)聯(lián)的上述數(shù)據(jù)的組合的上述評(píng)價(jià)指標(biāo),將成為上述分類(lèi)對(duì)象的要素分類(lèi)到上述類(lèi)。
還可以設(shè)置類(lèi)分類(lèi)單元,該類(lèi)分類(lèi)單元根據(jù)與成為分類(lèi)對(duì)象的要素相關(guān)聯(lián)的上述數(shù)據(jù)的組合之中與從各個(gè)上述類(lèi)中提取的上述數(shù)據(jù)的組合一致的數(shù)量,將成為上述分類(lèi)對(duì)象的要素分類(lèi)到上述類(lèi)。
還可以設(shè)置特征呈現(xiàn)單元,該特征呈現(xiàn)單元根據(jù)與成為呈現(xiàn)特征的對(duì)象的要素相關(guān)聯(lián)的上述數(shù)據(jù)的組合之中與從各個(gè)上述類(lèi)中提取的上述數(shù)據(jù)的組合一致的上述數(shù)據(jù)的組合中所包含的上述數(shù)據(jù)、以及提取了一致的上述數(shù)據(jù)的組合的上述類(lèi),呈現(xiàn)成為呈現(xiàn)上述特征的對(duì)象的要素的特征。
本發(fā)明的一個(gè)側(cè)面的特征提取方法或者程序,包括如下步驟作為將與表示各要素的特征的數(shù)據(jù)分別相關(guān)聯(lián)的多個(gè)上述要素進(jìn)行分類(lèi)后的類(lèi)的特征,在通過(guò)關(guān)于屬于成為提取特征的對(duì)象的上述類(lèi)的各個(gè)上述要素取出與上述要素相關(guān)聯(lián)的1個(gè)以上的上述數(shù)據(jù)而求出的上述數(shù)據(jù)的全部組合之中,提取在通過(guò)關(guān)于屬于其他上述類(lèi)的各個(gè)上述要素取出與上述要素相關(guān)聯(lián)的1個(gè)以上的上述數(shù)據(jù)而求出的上述數(shù)據(jù)的組合中不存在的上述數(shù)據(jù)的組合。
在本發(fā)明的一個(gè)側(cè)面中,作為將與表示各要素的特征的數(shù)據(jù)分別相關(guān)聯(lián)的多個(gè)上述要素進(jìn)行分類(lèi)后的類(lèi)的特征,在通過(guò)關(guān)于屬于成為提取特征的對(duì)象的上述類(lèi)的各個(gè)上述要素取出與上述要素相關(guān)聯(lián)的1個(gè)以上的上述數(shù)據(jù)而求出的上述數(shù)據(jù)的全部組合之中,提取在通過(guò)關(guān)于屬于其他上述類(lèi)的各個(gè)上述要素取出與上述要素相關(guān)聯(lián)的1個(gè)以上的上述數(shù)據(jù)而求出的上述數(shù)據(jù)的組合中不存在的上述數(shù)據(jù)的組合。
發(fā)明的效果如上所述,根據(jù)本發(fā)明的一個(gè)側(cè)面,能夠提取將多個(gè)要素分類(lèi)后的類(lèi)的特征。另外,根據(jù)本發(fā)明的一個(gè)側(cè)面,能夠簡(jiǎn)單且正確地提取將多個(gè)要素分類(lèi)的類(lèi)的特征。


圖1是表示應(yīng)用了本發(fā)明的信息處理系統(tǒng)的第1實(shí)施方式的框圖。
圖2是表示圖2的客戶(hù)端運(yùn)算部的功能結(jié)構(gòu)的例子的框圖。
圖3是表示與內(nèi)容相關(guān)聯(lián)的元數(shù)據(jù)的例子的圖。
圖4是用于說(shuō)明由圖1的信息處理系統(tǒng)執(zhí)行的關(guān)鍵字提取處理的流程圖。
圖5是用于說(shuō)明將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的圖。
圖6是用于說(shuō)明元數(shù)據(jù)的提取的例子的圖。
圖7是用于詳細(xì)說(shuō)明圖4的步驟S3的元數(shù)據(jù)提取處理的流程圖。
圖8是將提取的關(guān)鍵字呈現(xiàn)給用戶(hù)的畫(huà)面的例子。
圖9是將提取的關(guān)鍵字呈現(xiàn)給用戶(hù)的畫(huà)面的其他例子。
圖10是用于說(shuō)明由圖1的信息處理系統(tǒng)執(zhí)行的內(nèi)容推薦處理的流程圖。
圖11是表示應(yīng)用了本發(fā)明的信息處理系統(tǒng)的第2實(shí)施方式的框圖。
圖12是表示圖11的客戶(hù)端運(yùn)算部的功能結(jié)構(gòu)的例子的框圖。
圖13是用于說(shuō)明由圖11的信息處理系統(tǒng)執(zhí)行的內(nèi)容分類(lèi)處理的第1實(shí)施方式的流程圖。
圖14是用于說(shuō)明將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的圖。
圖15是用于說(shuō)明元數(shù)據(jù)的提取的例子的圖。
圖16是用于說(shuō)明由圖11的信息處理系統(tǒng)執(zhí)行的內(nèi)容分類(lèi)處理的第2實(shí)施方式的流程圖。
圖17是表示個(gè)人計(jì)算機(jī)的結(jié)構(gòu)的例子的框圖。
附圖標(biāo)記說(shuō)明1信息處理系統(tǒng);11內(nèi)容視聽(tīng)客戶(hù)端;12上下文檢測(cè)終端;13內(nèi)容發(fā)布服務(wù)器;14內(nèi)容推薦服務(wù)器;21用戶(hù)輸入部;22客戶(hù)端運(yùn)算部;23客戶(hù)端存儲(chǔ)部;24客戶(hù)端輸出部;41內(nèi)容發(fā)布部;81內(nèi)容分類(lèi)部;82元數(shù)據(jù)提取部;83組合提取部;84關(guān)鍵字呈現(xiàn)部;85推薦內(nèi)容提取部;86推薦內(nèi)容呈現(xiàn)部;201信息處理系統(tǒng);211內(nèi)容視聽(tīng)客戶(hù)端;212上下文檢測(cè)終端;213內(nèi)容發(fā)布服務(wù)器;214內(nèi)容推薦服務(wù)器;221用戶(hù)輸入部;222客戶(hù)端運(yùn)算部;223客戶(hù)端存儲(chǔ)部;224客戶(hù)端輸出部;241內(nèi)容發(fā)布部;281內(nèi)容分類(lèi)部;282元數(shù)據(jù)提取部;283組合提取部;291內(nèi)容分類(lèi)規(guī)則生成部;292內(nèi)容自動(dòng)分類(lèi)部;293分類(lèi)結(jié)果呈現(xiàn)部;901CPU;902ROM;903RAM;908存儲(chǔ)部;910驅(qū)動(dòng)器;911可移動(dòng)介質(zhì)。
具體實(shí)施例方式
下面參照

本發(fā)明的實(shí)施方式。
圖1是表示應(yīng)用了本發(fā)明的信息處理系統(tǒng)1的一個(gè)實(shí)施方式的框圖。
信息處理系統(tǒng)1包括內(nèi)容視聽(tīng)客戶(hù)端11、上下文檢測(cè)終端12、內(nèi)容發(fā)布服務(wù)器13、以及內(nèi)容推薦服務(wù)器14。
內(nèi)容視聽(tīng)客戶(hù)端11例如由客戶(hù)端計(jì)算機(jī)、消費(fèi)者電子設(shè)備(CE設(shè)備)、便攜式信息終端等構(gòu)成。內(nèi)容視聽(tīng)客戶(hù)端11將存儲(chǔ)在客戶(hù)端存儲(chǔ)部23中的內(nèi)容呈現(xiàn)給用戶(hù),或者接收從內(nèi)容發(fā)布服務(wù)器13發(fā)布的內(nèi)容并呈現(xiàn)給用戶(hù)。
此外,在本說(shuō)明書(shū)中,內(nèi)容指除了一般被稱(chēng)為內(nèi)容的例如電視節(jié)目、電影、照片、樂(lè)曲等(運(yùn)動(dòng)圖像、靜止圖像、或聲音、或者它們的組合等)之外,還包括所有各種信息、文件、商品(含物品)、對(duì)話等用戶(hù)能夠使用的軟件或者硬件的廣的概念。但是,在內(nèi)容是物品(硬件)的情況下,例如該物品被投影為運(yùn)動(dòng)圖像、靜止圖像等而被數(shù)據(jù)化,作為內(nèi)容數(shù)據(jù)使用。
另外,由信息處理系統(tǒng)1處理的各內(nèi)容,如參照?qǐng)D3的例子所示,與表示各內(nèi)容的特征的元數(shù)據(jù)分別相關(guān)聯(lián)。
當(dāng)從功能結(jié)構(gòu)的觀點(diǎn)出發(fā)時(shí),內(nèi)容視聽(tīng)客戶(hù)端11包括用戶(hù)輸入部21、客戶(hù)端運(yùn)算部22、客戶(hù)端存儲(chǔ)部23、以及客戶(hù)端輸出部24。
用戶(hù)輸入部21是用戶(hù)用于進(jìn)行對(duì)內(nèi)容視聽(tīng)客戶(hù)端11的操作的輸入設(shè)備,例如由鍵盤(pán)、鼠標(biāo)、遙控器、觸摸面板、麥克風(fēng)等構(gòu)成。將用戶(hù)利用用戶(hù)輸入部21輸入的操作內(nèi)容、正確地說(shuō)將表示該操作內(nèi)容的信息,提供給客戶(hù)端運(yùn)算部22。
客戶(hù)端運(yùn)算部22例如在此由CPU(Central Processing Unit中央處理單元)和其執(zhí)行的程序、即硬件和軟件的組合構(gòu)成。當(dāng)然客戶(hù)端運(yùn)算部22也可以由軟件或者硬件單獨(dú)構(gòu)成。
客戶(hù)端運(yùn)算部22控制客戶(hù)端輸出部24,將存儲(chǔ)在客戶(hù)端存儲(chǔ)部23中的內(nèi)容呈現(xiàn)給用戶(hù)。另外,客戶(hù)端運(yùn)算部22根據(jù)由用戶(hù)指定的觀點(diǎn),將存儲(chǔ)在客戶(hù)端存儲(chǔ)部23中的內(nèi)容的一部分或者全部分類(lèi)到多個(gè)類(lèi)中。如參照?qǐng)D7在后面所述,客戶(hù)端運(yùn)算部22根據(jù)需要,使用從上下文檢測(cè)終端12提供的上下文信息、或者從用戶(hù)輸入部21提供的表示用戶(hù)操作內(nèi)容的信息,提取表示進(jìn)行分類(lèi)后的類(lèi)的特征的元數(shù)據(jù)的組合。客戶(hù)端運(yùn)算部22控制客戶(hù)端輸出部24,將所提取的元數(shù)據(jù)的組合作為該類(lèi)的特征而呈現(xiàn)給用戶(hù)。
另外,如參照?qǐng)D10在后面所述,客戶(hù)端運(yùn)算部22根據(jù)所提取的元數(shù)據(jù)的組合,從存儲(chǔ)在客戶(hù)端存儲(chǔ)部23中的內(nèi)容中提取推薦給用戶(hù)的內(nèi)容??蛻?hù)端運(yùn)算部22控制客戶(hù)端輸出部24,將與提取的內(nèi)容有關(guān)的信息呈現(xiàn)給用戶(hù)。
而且,客戶(hù)端運(yùn)算部22將如下信息(下面稱(chēng)為推薦內(nèi)容提取請(qǐng)求信息)存儲(chǔ)在客戶(hù)端存儲(chǔ)部23中,所述信息包含所提取的元數(shù)據(jù)的組合的一部分或者全部,用于請(qǐng)求提取根據(jù)該元數(shù)據(jù)的組合而推薦給用戶(hù)的內(nèi)容??蛻?hù)端運(yùn)算部22從客戶(hù)端存儲(chǔ)部23獲取表示針對(duì)該請(qǐng)求的提取結(jié)果的信息??蛻?hù)端運(yùn)算部22根據(jù)提取結(jié)果來(lái)控制客戶(hù)端輸出部24,將與所提取的內(nèi)容有關(guān)的信息呈現(xiàn)給用戶(hù)。
另外,客戶(hù)端運(yùn)算部22將如下信息(下面稱(chēng)為組合提取請(qǐng)求信息)存儲(chǔ)在客戶(hù)端存儲(chǔ)部23中,所述信息包括與由用戶(hù)進(jìn)行分類(lèi)后的類(lèi)有關(guān)的信息以及與屬于該類(lèi)的內(nèi)容有關(guān)的元數(shù)據(jù),用于請(qǐng)求提取表示該類(lèi)的特征的元數(shù)據(jù)的組合??蛻?hù)端運(yùn)算部22從客戶(hù)端存儲(chǔ)部23獲取表示針對(duì)組合提取請(qǐng)求信息的提取結(jié)果的信息??蛻?hù)端運(yùn)算部22根據(jù)提取結(jié)果來(lái)控制客戶(hù)端輸出部24,將所提取的元數(shù)據(jù)的組合呈現(xiàn)給用戶(hù)。
而且,客戶(hù)端運(yùn)算部22將請(qǐng)求內(nèi)容發(fā)布(發(fā)送)的信息存儲(chǔ)到客戶(hù)端存儲(chǔ)部23中。
客戶(hù)端存儲(chǔ)部23例如包括硬盤(pán)、RAM(Random AccessMemory隨機(jī)存取存儲(chǔ)器)等記錄介質(zhì)或者存儲(chǔ)介質(zhì)??蛻?hù)端存儲(chǔ)部23適當(dāng)存儲(chǔ)了客戶(hù)端運(yùn)算部22所利用的上下文信息、以及表示用戶(hù)操作指令的信息。另外,客戶(hù)端存儲(chǔ)部23根據(jù)需要,將上下文信息、表示用戶(hù)操作內(nèi)容的信息、推薦內(nèi)容提取請(qǐng)求信息、或者組合提取請(qǐng)求信息發(fā)送給內(nèi)容推薦服務(wù)器14的服務(wù)器存儲(chǔ)部51。并且,客戶(hù)端存儲(chǔ)部23將請(qǐng)求內(nèi)容發(fā)布的信息發(fā)送給內(nèi)容發(fā)布服務(wù)器13的內(nèi)容發(fā)布部41。
另外,客戶(hù)端存儲(chǔ)部23存儲(chǔ)從服務(wù)器存儲(chǔ)部51發(fā)送過(guò)來(lái)的與內(nèi)容有關(guān)的元數(shù)據(jù)、表示推薦給用戶(hù)的內(nèi)容的提取結(jié)果的信息、以及表示元數(shù)據(jù)的組合的提取結(jié)果的信息。并且,客戶(hù)端存儲(chǔ)部23存儲(chǔ)從內(nèi)容發(fā)布部41發(fā)送過(guò)來(lái)的內(nèi)容。另外,客戶(hù)端存儲(chǔ)部23將通知已接收到內(nèi)容或與內(nèi)容有關(guān)的元數(shù)據(jù)的信息提供給客戶(hù)端運(yùn)算部22。并且,客戶(hù)端運(yùn)算部23將存儲(chǔ)著的內(nèi)容、或者內(nèi)容的元數(shù)據(jù)提供給客戶(hù)端輸出部24。
客戶(hù)端輸出部24例如由監(jiān)視器或者打印機(jī)等圖像輸出設(shè)備、揚(yáng)聲器等聲音輸出設(shè)備等構(gòu)成。客戶(hù)端輸出部24通過(guò)圖像、文本信息、或聲音、或者打印有圖像或文本信息的介質(zhì)等形式,將存儲(chǔ)在客戶(hù)端存儲(chǔ)部23中的內(nèi)容呈現(xiàn)給用戶(hù)。另外,客戶(hù)端輸出部24根據(jù)客戶(hù)端運(yùn)算部22的控制,將表示對(duì)存儲(chǔ)在客戶(hù)端存儲(chǔ)部23中的內(nèi)容進(jìn)行分類(lèi)后的類(lèi)的特征的元數(shù)據(jù)組合、或者與推薦給用戶(hù)的內(nèi)容有關(guān)的信息呈現(xiàn)給用戶(hù)。
當(dāng)從功能結(jié)構(gòu)的觀點(diǎn)出發(fā)時(shí),上下文檢測(cè)終端12包括上下文檢測(cè)部31、以及上下文存儲(chǔ)部32。
上下文檢測(cè)部31例如檢測(cè)與用戶(hù)的狀態(tài)、感情、用戶(hù)所處的狀況(例如場(chǎng)所、時(shí)間等)等有關(guān)的上下文信息。具體地說(shuō),內(nèi)容檢測(cè)部31由以下部分構(gòu)成由檢測(cè)用戶(hù)當(dāng)前位置信息的GPS(GlobalPositioning System全球定位系統(tǒng))接收機(jī)、對(duì)當(dāng)前時(shí)刻進(jìn)行計(jì)時(shí)(檢測(cè))的電波表、檢測(cè)位于用戶(hù)周邊的人、物體的無(wú)線通信設(shè)備、檢測(cè)用戶(hù)的脈搏、呼吸數(shù)、發(fā)汗、或者瞳孔開(kāi)度等的各種生物體信息傳感器、照相機(jī)、或者識(shí)別各種圖像的圖像識(shí)別裝置等。上下文檢測(cè)部31實(shí)時(shí)檢測(cè)上述的上下文信息,將檢測(cè)出的上下文信息存儲(chǔ)到上下文存儲(chǔ)部32中。另外,上下文檢測(cè)終端12向內(nèi)容視聽(tīng)客戶(hù)端11的客戶(hù)端運(yùn)算部22提供檢測(cè)出的上下文信息。
上下文存儲(chǔ)部32例如包括硬盤(pán)、RAM等記錄介質(zhì)或者存儲(chǔ)介質(zhì),保存沿從上下文檢測(cè)部31提供的時(shí)間序列的上下文信息。
內(nèi)容發(fā)布服務(wù)器13例如由用于發(fā)布內(nèi)容的廣播設(shè)備、或者服務(wù)器計(jì)算機(jī)等構(gòu)成。當(dāng)從功能結(jié)構(gòu)的觀點(diǎn)出發(fā)時(shí),內(nèi)容發(fā)布服務(wù)器13包括內(nèi)容發(fā)布部41、以及內(nèi)容元數(shù)據(jù)存儲(chǔ)部42。
內(nèi)容發(fā)布部41例如在此由CPU和其執(zhí)行的程序、即硬件和軟件的組合構(gòu)成。當(dāng)然內(nèi)容發(fā)布部41也可以由軟件或者硬件單獨(dú)構(gòu)成。具體地說(shuō),例如內(nèi)容發(fā)布部41由電視廣播系統(tǒng)的發(fā)布服務(wù)器、或者因特網(wǎng)上的流式內(nèi)容服務(wù)器等構(gòu)成。內(nèi)容發(fā)布部41向內(nèi)容視聽(tīng)客戶(hù)端11的客戶(hù)端存儲(chǔ)部23發(fā)布(發(fā)送)內(nèi)容。
內(nèi)容元數(shù)據(jù)存儲(chǔ)部42例如包括硬盤(pán)、RAM等記錄介質(zhì)或者存儲(chǔ)介質(zhì),存儲(chǔ)內(nèi)容發(fā)布服務(wù)器13能夠發(fā)布的內(nèi)容、以及作為與內(nèi)容有關(guān)的數(shù)據(jù)的元數(shù)據(jù)。此外,按照內(nèi)容發(fā)布源的運(yùn)用規(guī)則等,適當(dāng)更新存儲(chǔ)在內(nèi)容元數(shù)據(jù)存儲(chǔ)部42中的內(nèi)容或者元數(shù)據(jù)。
內(nèi)容推薦服務(wù)器14例如由服務(wù)器計(jì)算機(jī)構(gòu)成。當(dāng)從功能結(jié)構(gòu)的觀點(diǎn)出發(fā)時(shí),內(nèi)容推薦服務(wù)器41包括服務(wù)器存儲(chǔ)部51、以及服務(wù)器運(yùn)算部52。
服務(wù)器存儲(chǔ)部51例如包括硬盤(pán)、RAM等記錄介質(zhì)或者存儲(chǔ)介質(zhì)。服務(wù)器存儲(chǔ)部51適當(dāng)獲取存儲(chǔ)在內(nèi)容發(fā)布服務(wù)器13的內(nèi)容元數(shù)據(jù)存儲(chǔ)部42中的各內(nèi)容的元數(shù)據(jù)進(jìn)行存儲(chǔ),并且根據(jù)需要發(fā)送到內(nèi)容視聽(tīng)客戶(hù)端11的客戶(hù)端存儲(chǔ)部23。另外,服務(wù)器存儲(chǔ)部51存儲(chǔ)從客戶(hù)端存儲(chǔ)部23發(fā)送過(guò)來(lái)的上下文信息、表示用戶(hù)操作內(nèi)容的信息、推薦內(nèi)容提取請(qǐng)求信息、或者組合提取請(qǐng)求信息。并且,服務(wù)器存儲(chǔ)部51存儲(chǔ)從服務(wù)器運(yùn)算部52提供的表示推薦給用戶(hù)的內(nèi)容的提取結(jié)果的信息、或者表示元數(shù)據(jù)的組合的提取結(jié)果的信息,并且發(fā)送到客戶(hù)端存儲(chǔ)部23或者內(nèi)容元數(shù)據(jù)存儲(chǔ)部42。
服務(wù)器運(yùn)算部52例如在此由CPU和其執(zhí)行的程序、即硬件和軟件的組合構(gòu)成。當(dāng)然服務(wù)器運(yùn)算部52也可由軟件或者硬件單獨(dú)構(gòu)成。
服務(wù)器運(yùn)算部52根據(jù)存儲(chǔ)在服務(wù)器存儲(chǔ)部51中的表示用戶(hù)操作內(nèi)容的信息、上下文信息、或者推薦內(nèi)容提取請(qǐng)求信息,從服務(wù)器存儲(chǔ)部51中存儲(chǔ)有元數(shù)據(jù)的內(nèi)容中提取推薦給用戶(hù)的內(nèi)容。服務(wù)器運(yùn)算部52將表示推薦給用戶(hù)的內(nèi)容的提取結(jié)果的信息存儲(chǔ)到服務(wù)器存儲(chǔ)部51中。
另外,服務(wù)器運(yùn)算部52根據(jù)存儲(chǔ)在服務(wù)器存儲(chǔ)部51中的表示用戶(hù)操作內(nèi)容的信息、上下文信息、或者組合提取請(qǐng)求信息,提取表示該類(lèi)的特征的元數(shù)據(jù)組合。服務(wù)器運(yùn)算部52將表示元數(shù)據(jù)組合的提取結(jié)果的信息存儲(chǔ)到服務(wù)器存儲(chǔ)部51中。
另外,圖1示出了功能結(jié)構(gòu)例,因此沒(méi)有特別圖示各裝置間的連接方式、即內(nèi)容視聽(tīng)客戶(hù)端11至內(nèi)容推薦服務(wù)器14各個(gè)之間的連接方式,但是其連接方式?jīng)]有被特別限定。即,連接方式既可以是有線也可以是無(wú)線,還可以是其組合。另外,連接方式既可以是通過(guò)網(wǎng)絡(luò)的方式,也可以是在裝置間進(jìn)行直接通信的方式,還可以是其組合。并且,在通過(guò)網(wǎng)絡(luò)的方式的情況下,網(wǎng)絡(luò)的方式也沒(méi)有被限定,例如也可以是因特網(wǎng)、內(nèi)部網(wǎng)。此時(shí),網(wǎng)絡(luò)并不限定于單一的網(wǎng)絡(luò),也可以存在多個(gè)網(wǎng)絡(luò)。因而,雖然圖1中沒(méi)有圖示,但是實(shí)際上在內(nèi)容視聽(tīng)客戶(hù)端11至內(nèi)容推薦服務(wù)器14的各個(gè)中,還設(shè)置有與所對(duì)應(yīng)的連接方式相應(yīng)的通信部。
另外,上下文檢測(cè)終端12、內(nèi)容發(fā)布服務(wù)器13、以及內(nèi)容推薦服務(wù)器14,在信息處理系統(tǒng)1中不是必須的結(jié)構(gòu)要素。即,如參照?qǐng)D4至圖10在后面所述,可以只通過(guò)內(nèi)容視聽(tīng)客戶(hù)端11來(lái)實(shí)現(xiàn)由信息處理系統(tǒng)1進(jìn)行的關(guān)鍵字提取處理以及內(nèi)容推薦處理。
圖2是表示客戶(hù)端運(yùn)算部22的功能結(jié)構(gòu)的例子的框圖??蛻?hù)端運(yùn)算部22包括內(nèi)容分類(lèi)部81、元數(shù)據(jù)提取部82、組合提取部83、關(guān)鍵字呈現(xiàn)部84、推薦內(nèi)容提取部85、以及推薦內(nèi)容呈現(xiàn)部86。
內(nèi)容分類(lèi)部81從用戶(hù)輸出部21獲取表示將用戶(hù)通過(guò)用戶(hù)輸入部21輸入的內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的信息。如參照?qǐng)D4在后面所述,內(nèi)容分類(lèi)部81根據(jù)指定的觀點(diǎn),將由存儲(chǔ)在內(nèi)容存儲(chǔ)部23中的內(nèi)容的一部分或者全部構(gòu)成的組分類(lèi)到多個(gè)類(lèi)。內(nèi)容分類(lèi)部81將與所分類(lèi)到的類(lèi)有關(guān)的信息提供給元數(shù)據(jù)提取部82。另外,內(nèi)容分類(lèi)部81根據(jù)需要,將組合提取請(qǐng)求信息通過(guò)客戶(hù)端存儲(chǔ)部23以及服務(wù)器存儲(chǔ)部51發(fā)送到服務(wù)器運(yùn)算部52。
如參照?qǐng)D4在后面所述,元數(shù)據(jù)提取部82根據(jù)屬于成為對(duì)象的類(lèi)的內(nèi)容和元數(shù)據(jù)之間的關(guān)聯(lián)度、以及屬于其他類(lèi)的內(nèi)容和元數(shù)據(jù)之間的關(guān)聯(lián)度與屬于成為對(duì)象的類(lèi)的內(nèi)容和元數(shù)據(jù)之間的關(guān)聯(lián)度的差異,提取更明確表示屬于成為對(duì)象的類(lèi)的內(nèi)容特征的元數(shù)據(jù)。元數(shù)據(jù)提取部82將表示所提取的元數(shù)據(jù)的信息提供給組合提取部83。
如參照?qǐng)D7在后面所述,組合提取部83在通過(guò)關(guān)于屬于成為提取特征的對(duì)象的類(lèi)的各個(gè)內(nèi)容取出與內(nèi)容相關(guān)聯(lián)的1個(gè)以上的元數(shù)據(jù)而求出的元數(shù)據(jù)的全部組合之中,提取在通過(guò)關(guān)于屬于其他類(lèi)的各個(gè)內(nèi)容取出與內(nèi)容相關(guān)聯(lián)的1個(gè)以上元數(shù)據(jù)而求出的元數(shù)據(jù)的組合中不存在的、由元數(shù)據(jù)提取部82提取的元數(shù)據(jù)的組合。組合提取部83將表示所提取的元數(shù)據(jù)組合的信息提供給關(guān)鍵字呈現(xiàn)部84或者推薦內(nèi)容提取部85。
另外,組合提取部83通過(guò)服務(wù)器存儲(chǔ)部51以及客戶(hù)端存儲(chǔ)部23,從服務(wù)器運(yùn)算部52接收表示針對(duì)從內(nèi)容分類(lèi)部81發(fā)送的組合提取請(qǐng)求信息的提取結(jié)果的信息。組合提取部83將表示所提取的元數(shù)據(jù)的組合的信息,提供給關(guān)鍵字呈現(xiàn)部84或者推薦內(nèi)容提取部85。
如參照?qǐng)D4在后面所述,關(guān)鍵字呈現(xiàn)部84控制客戶(hù)端輸出部24,使得將所提取的元數(shù)據(jù)組合中的1個(gè)以上的組合作為提取元數(shù)據(jù)組合的類(lèi)的特征而呈現(xiàn)給用戶(hù)。另外,關(guān)鍵字呈現(xiàn)部84從用戶(hù)輸入部21獲取用戶(hù)通過(guò)用戶(hù)輸入部21輸入的指示關(guān)鍵字的決定或者變更的信息。
如參照?qǐng)D10在后面所述,推薦內(nèi)容提取部85根據(jù)由組合提取部83提取的元數(shù)據(jù)的組合,從作為推薦給用戶(hù)的內(nèi)容而存儲(chǔ)在客戶(hù)端存儲(chǔ)部23中的內(nèi)容中,提取與屬于被提取了元數(shù)據(jù)組合的類(lèi)的內(nèi)容有關(guān)聯(lián)的內(nèi)容。推薦內(nèi)容提取部85將與所提取的內(nèi)容有關(guān)的信息提供給推薦內(nèi)容呈現(xiàn)部86。
另外,推薦內(nèi)容提取部85根據(jù)由組合提取部83提取的元數(shù)據(jù)的組合,將請(qǐng)求提取推薦給用戶(hù)的內(nèi)容的推薦內(nèi)容提取請(qǐng)求信息,通過(guò)客戶(hù)端存儲(chǔ)部23以及服務(wù)器存儲(chǔ)部51發(fā)送給服務(wù)器運(yùn)算部52。推薦內(nèi)容提取部85從服務(wù)器運(yùn)算部52通過(guò)服務(wù)器存儲(chǔ)部51以及客戶(hù)端存儲(chǔ)部23,接收表示與推薦內(nèi)容提取請(qǐng)求信息對(duì)應(yīng)的提取結(jié)果的信息。推薦內(nèi)容提取部85將與提取的內(nèi)容有關(guān)的信息提供給推薦內(nèi)容呈現(xiàn)部86。另外,推薦內(nèi)容提取部85從客戶(hù)端存儲(chǔ)部23獲取通知已接收到內(nèi)容或者與內(nèi)容有關(guān)的元數(shù)據(jù)的信息。
推薦內(nèi)容呈現(xiàn)部86控制客戶(hù)端輸出部24,使得將由推薦內(nèi)容提取部85提取的內(nèi)容作為推薦的內(nèi)容呈現(xiàn)給用戶(hù),并且作為推薦了內(nèi)容的依據(jù)(理由),呈現(xiàn)用于提取所推薦的內(nèi)容的元數(shù)據(jù)的組合。推薦內(nèi)容呈現(xiàn)部86從用戶(hù)輸入部21獲取用戶(hù)通過(guò)用戶(hù)輸入部21輸入的指示決定推薦內(nèi)容的信息。推薦內(nèi)容呈現(xiàn)部86將通知由用戶(hù)決定的內(nèi)容的信息,提供給客戶(hù)端存儲(chǔ)部23。
下面參照?qǐng)D3說(shuō)明信息處理系統(tǒng)1中處理的內(nèi)容以及與內(nèi)容相關(guān)聯(lián)的元數(shù)據(jù)的例子。圖3示出了在內(nèi)容是音樂(lè)數(shù)據(jù)的情況下的內(nèi)容、以及其元數(shù)據(jù)的例子。此外,在圖3中示出了為了使以后的說(shuō)明簡(jiǎn)單,將元數(shù)據(jù)與演奏音樂(lè)數(shù)據(jù)(樂(lè)曲)的每個(gè)藝術(shù)家相關(guān)聯(lián)的例子。即,相同藝術(shù)家的音樂(lè)數(shù)據(jù)全部與相同的元數(shù)據(jù)相關(guān)聯(lián)。當(dāng)然也能夠以樂(lè)曲為單位與元數(shù)據(jù)相關(guān)聯(lián)。
此外,下面在內(nèi)容A與元數(shù)據(jù)B相關(guān)聯(lián)的情況下,適當(dāng)使用內(nèi)容A具有元數(shù)據(jù)B、或者內(nèi)容A中設(shè)定有元數(shù)據(jù)B之類(lèi)的表述。
在圖3的例子中,各內(nèi)容(藝術(shù)家)與作為元數(shù)據(jù)的色彩、歡快、可愛(ài)、低回響音、冬天、傷感等表示該藝術(shù)家演奏的樂(lè)曲音樂(lè)特性的關(guān)鍵字相關(guān)聯(lián)。此外,該關(guān)鍵字例如由音樂(lè)評(píng)論家等以專(zhuān)家的觀點(diǎn)進(jìn)行設(shè)定,或者通過(guò)對(duì)與藝術(shù)家有關(guān)的評(píng)論文、介紹報(bào)道、或者樂(lè)曲的歌詞等文本進(jìn)行分析而提取。另外,也可以除了表示音樂(lè)特性的關(guān)鍵字以外,在元數(shù)據(jù)中使用表示音樂(lè)類(lèi)型、藝術(shù)家的年代以及出生地、從音樂(lè)數(shù)據(jù)提取的特征量、排行榜(hit chart)信息等的特征的數(shù)據(jù)。
另外,利用0或者1的2個(gè)值來(lái)表示各內(nèi)容中的元數(shù)據(jù)(關(guān)鍵字)的有無(wú)。設(shè)定了0的元數(shù)據(jù)是沒(méi)有該藝術(shù)家的元數(shù)據(jù),即,是沒(méi)有表示該藝術(shù)家特征的關(guān)鍵字。設(shè)定了1的元數(shù)據(jù)是有該藝術(shù)家的元數(shù)據(jù)、即,是表示該藝術(shù)家特征的關(guān)鍵字。此外,在原來(lái)的值取0或者1以外的2個(gè)值以外的值的情況下,以規(guī)定閾值為基準(zhǔn),將元數(shù)據(jù)變換為0或者1的2個(gè)值而使用。例如,在藝術(shù)家的初次登場(chǎng)日被設(shè)定為元數(shù)據(jù)的情況下,以規(guī)定的日子為基準(zhǔn),在初次登場(chǎng)日在該日子之前的情況下元數(shù)據(jù)被變換為0,在初次登場(chǎng)日在該日子之后的情況下元數(shù)據(jù)被變換為1。
下面參照?qǐng)D4至圖10說(shuō)明由信息處理系統(tǒng)1執(zhí)行的處理。
首先,參照?qǐng)D4說(shuō)明由信息處理系統(tǒng)1執(zhí)行的關(guān)鍵字提取處理。此外,例如在用戶(hù)通過(guò)用戶(hù)輸入部21輸入了關(guān)鍵字提取處理的開(kāi)始指令的情況下,開(kāi)始該處理。
在步驟S1中,內(nèi)容分類(lèi)部81將內(nèi)容進(jìn)行分類(lèi)。具體地說(shuō),用戶(hù)通過(guò)用戶(hù)輸入部21輸入表示用于將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的信息。用戶(hù)輸入部21將所輸入的信息提供給內(nèi)容分類(lèi)部81。
圖5是表示用于將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的例子的圖。此外,在圖5所示的表中,與圖3所示的表相比,添加了分類(lèi)的觀點(diǎn)的項(xiàng)目。
在圖5中,作為用于將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn),示出了用戶(hù)的愛(ài)好、以及是否是選擇到播放列表中的樂(lè)曲的兩個(gè)例子。此外,播放列表是指由用戶(hù)任意選擇的樂(lè)曲構(gòu)成的組,例如用戶(hù)能夠以播放列表為單位指示樂(lè)曲的播放,依次播放登記在播放列表中的樂(lè)曲。
在根據(jù)用戶(hù)愛(ài)好的觀點(diǎn)將內(nèi)容(藝術(shù)家)進(jìn)行分類(lèi)的情況下,各內(nèi)容被分類(lèi)成“喜歡”“討厭”“都不是”這3個(gè)類(lèi)。該愛(ài)好的評(píng)價(jià)既可以由用戶(hù)顯式地進(jìn)行設(shè)定,也可以例如根據(jù)將演奏用戶(hù)從與因特網(wǎng)連接的服務(wù)器等下載的樂(lè)曲的藝術(shù)家的評(píng)價(jià)設(shè)定為“喜歡”,將演奏用戶(hù)刪除了的樂(lè)曲的藝術(shù)家的評(píng)價(jià)設(shè)定為“討厭”等的用戶(hù)的操作履歷等,使內(nèi)容視聽(tīng)客戶(hù)端11學(xué)習(xí)。
在根據(jù)播放列表選擇曲目的觀點(diǎn)將內(nèi)容進(jìn)行分類(lèi)的情況下,各內(nèi)容被分類(lèi)為選擇到播放列表(選擇)、沒(méi)有選擇到播放列表(非選擇)的兩個(gè)類(lèi)中。
內(nèi)容分類(lèi)部81根據(jù)由用戶(hù)指定的觀點(diǎn),將內(nèi)容分類(lèi)到多個(gè)類(lèi)。內(nèi)容分類(lèi)部81將與分類(lèi)后的內(nèi)容的類(lèi)有關(guān)的信息提供給元數(shù)據(jù)提取部82。
此外,在下面的說(shuō)明中,對(duì)根據(jù)播放列表選擇曲目的觀點(diǎn)將內(nèi)容進(jìn)行分類(lèi)、并提取播放列表中所選擇的內(nèi)容的元數(shù)據(jù)(關(guān)鍵字)的情況的例子進(jìn)行說(shuō)明。另外,下面如圖5所示,假設(shè)屬于播放列表選擇曲目的類(lèi)的要素(內(nèi)容)為藝術(shù)家1至11,假設(shè)屬于播放列表非選擇曲目的類(lèi)的要素(內(nèi)容)為藝術(shù)家12至24。另外,下面將成為提取關(guān)鍵字的對(duì)象的類(lèi)稱(chēng)為提取對(duì)象類(lèi),將除此之外的類(lèi)稱(chēng)為比較對(duì)象類(lèi)。
在步驟S2中,元數(shù)據(jù)提取部82進(jìn)行元數(shù)據(jù)的加權(quán),提取元數(shù)據(jù)。具體地說(shuō),元數(shù)據(jù)提取部82通過(guò)以統(tǒng)計(jì)尺度來(lái)測(cè)量各內(nèi)容所具有的元數(shù)據(jù)的頻率分布,進(jìn)行元數(shù)據(jù)的加權(quán)。下面說(shuō)明用于進(jìn)行元數(shù)據(jù)加權(quán)的統(tǒng)計(jì)尺度的例子。
首先說(shuō)明使用tfidf(term frequency with inverse documentfrequency單詞頻率/逆文檔頻率)的方法。
在使用了tfidf的情況下,將屬于某類(lèi)Ci的內(nèi)容之中的具有元數(shù)據(jù)Wj的內(nèi)容的出現(xiàn)頻度設(shè)為fij、將類(lèi)的總數(shù)設(shè)為n、將具有元數(shù)據(jù)Wj的內(nèi)容所屬的類(lèi)的數(shù)量設(shè)為nj時(shí),將通過(guò)下面的式(1)算出的tfidf(Ci,Wj)設(shè)定為類(lèi)Ci中的元數(shù)據(jù)Wj的權(quán)重。
tfidf(Ci,Wj)=fij×{1+loge(n/nj)}…(1)此外,在式(1)中,將log的底設(shè)為e(自然對(duì)數(shù)),但是tfdif的值本身不是那么重要,因此也可以將底設(shè)為2或者10。
例如,在下面的條件(1)至(3)成立的情況下,如下地算出tfidf(Ci,Wj)。
(1)設(shè)將內(nèi)容(藝術(shù)家)進(jìn)行分類(lèi)后的類(lèi)的個(gè)數(shù)n=9,將各個(gè)類(lèi)設(shè)為C1至C9。
(2)設(shè)具有元數(shù)據(jù)W1(例如[傷感])的內(nèi)容所屬的類(lèi)的個(gè)數(shù)n1=8。
(3)設(shè)屬于類(lèi)C1的內(nèi)容之中,具有元數(shù)據(jù)W1的內(nèi)容的出現(xiàn)頻度(具有類(lèi)C1中的元數(shù)據(jù)W1的藝術(shù)家的個(gè)數(shù))f11=5。
此時(shí),根據(jù)下面的式(2)算出作為類(lèi)C1中的元數(shù)據(jù)W1的權(quán)重的tfidf(C1,W1)。
tfidf(C1,W1)=f11×{1+log(n/n1)}=5×{1+log(9/8)}=5.58891……(2)即tfidf(C1,W1)是在元數(shù)據(jù)Wj的頻度的局部權(quán)重fij上乘以全局權(quán)重{1+log(n/nj)}而得到的。此外,在tfidf中例如有如下的特征或者優(yōu)點(diǎn)。
·能夠考慮局部分布和全局分布的平衡,測(cè)量元數(shù)據(jù)的重要性。
·加權(quán)的計(jì)算式有各種變化,能夠根據(jù)用途而分開(kāi)使用。
·在文檔分類(lèi)中的特征語(yǔ)的加權(quán)中廣泛使用。
此外,也可以將fij設(shè)為屬于類(lèi)Ci的內(nèi)容中具有元數(shù)據(jù)Wj的內(nèi)容的比例,將n/nj設(shè)為(內(nèi)容總數(shù)/具有元數(shù)據(jù)Wj的內(nèi)容數(shù))。
下面說(shuō)明使用相互信息量的方法。
在使用相互信息量的情況下,將利用下面的式(3)算出的某類(lèi)Ci中的元數(shù)據(jù)Wj的相互信息量MI(Ci,Wj)設(shè)定為類(lèi)Ci中的元數(shù)據(jù)Wj的權(quán)重。
MI(Ci,Wj)=ΣW∈{Wj,W‾j}ΣC∈{Ci,C‾i}P(W,C)log2P(W,C)P(W)P(C)]]>=P(Wj,Ci)log2P(Wj,Ci)P(Wj)P(Ci)+P(W‾j,Ci)log2P(W‾j,Ci)P(W‾j)P(Ci)]]>+P(Wj,C‾i)log2P(Wj,C‾i)P(Wj)P(C‾i)+P(W‾j,C‾i)log2P(W‾j,C‾i)P(W‾j)P(C‾i)···(3)]]>此外,P()表示括號(hào)內(nèi)的事件產(chǎn)生的概率。
例如,在下面的條件(1)至(5)成立的情況下,如下地計(jì)算MI(Ci,Wj)。
(1)設(shè)將內(nèi)容(藝術(shù)家)進(jìn)行分類(lèi)后的類(lèi)的個(gè)數(shù)n=9,將各個(gè)類(lèi)設(shè)為C1至C9。
(2)設(shè)內(nèi)容的總數(shù)numA=80。
(3)設(shè)具有元數(shù)據(jù)W1(例如[傷感])的內(nèi)容的總數(shù)aFreqW=16。
(4)設(shè)屬于類(lèi)C1的內(nèi)容之中,具有元數(shù)據(jù)W1的內(nèi)容數(shù)aFreqWC=3。
(5)設(shè)屬于類(lèi)C1的內(nèi)容數(shù)aFreqC=11。
此外,式(3)中求出的各概率值為如下面的式(4)至(9)所示。
P(Wj)=aFreqW/numA=16/80=0.2 …(4)P(Ci)=aFreqC/numA=11/80=0.1375 …(5)P(Wj,Ci)=aFreqWC/numA=3/80=0.0375 …(6)P(Wj,Ci)=(aFreqC-aFreqWC)/numA=(11-3)/80=0.1 …(7)P(Wj,Ci)=(aFreqW-aFreqWC)/numA=(16-3)/80=0.1625 …(8)P(Wj,Gi)=1-{P(Wj,Ci)+P(Wj,Ci)+P(Wj,Ci)}=0.7…(9)因而,如下面的式(10)所示,通過(guò)將由式(4)至(9)算出的值代入式(3),求出作為類(lèi)C1中的元數(shù)據(jù)W1的權(quán)重的MI(C1,W1)的值。
MI(C1,W1)=0.0375×log2{0.0375/(0.2×0.1375)}+0.1×log2{0.1/((1-0.2)×0.1375)}+0.1625×log2{0.1625/(0.2×(1-0.1375)}+0.7×log2{0.7/((1-0.2)×(1-0.1375))}=0.01677…+(-0.01375…)+(-0.01400…)+0.01453…=0.00355……(10)即,通過(guò)得知?dú)w屬到類(lèi)Ci的元數(shù)據(jù)Wj的熵(entropy)的減少量,計(jì)算相互信息量。此外,相互信息量例如有如下特征或者優(yōu)點(diǎn)。
·利用表示事件的不確定性的信息理論的熵,容易強(qiáng)調(diào)類(lèi)間的差異。
·以權(quán)重高的語(yǔ)言制作文檔的摘要,容易得知文檔間的差異。
另外,省略了具體的計(jì)算例的說(shuō)明,但是除此之外也可以將信息增益比、χ平方值、對(duì)數(shù)似然比等作為進(jìn)行元數(shù)據(jù)加權(quán)的統(tǒng)計(jì)尺度而使用。
在使用信息增益比的情況下,將利用下面的式(11)至(14)算出的、某類(lèi)Ci中的元數(shù)據(jù)Wj的信息增益比IGR(Ci,Wj),設(shè)定為類(lèi)Ci中的元數(shù)據(jù)Wj的權(quán)重。
IGR(Ci,Wj)=info(Ci,Wj)-infodiv(Ci,Wj)split(Ci)···(11)]]>info(Ci,Wj)=ΣW∈{Wj,W‾j}p(W|Ci)log2p(W|Ci)···(12)]]>infodiv(Ci,Wj)=Σkmorph(Ck)morph(Ci)info(Ck,Wj)···(13)]]>split(Ci)=-Σkmorph(Ck)morph(Ci)logmorph(Ck)morph(Ci)···(14)]]>morph(Ci)屬于類(lèi)Ci的內(nèi)容所具有的元數(shù)據(jù)的總數(shù)即,信息增益比是將類(lèi)進(jìn)行分割之前和之后的元數(shù)據(jù)Wj的熵的減少量與關(guān)于類(lèi)分割的熵之間的比。此外,信息增益比例如有如下特征或者優(yōu)點(diǎn)。
·不僅對(duì)各個(gè)類(lèi)提供權(quán)重,而且還對(duì)相對(duì)于分類(lèi)全體(例如,愛(ài)好的分類(lèi)本身)偏向分布的元數(shù)據(jù)提供更大的權(quán)重。
·對(duì)于分層結(jié)構(gòu)的數(shù)據(jù),例如在獲知某目錄以下的特征語(yǔ)言的用途中有用。
在使用χ平方值的情況下,將利用下面的式(15)算出的、作為某類(lèi)Ci中的元數(shù)據(jù)Wj的χ平方值的χ2(Ci,Wj),設(shè)定為類(lèi)Ci中的元數(shù)據(jù)Wj的權(quán)重。

χ2(Ci,Wj)=ΣW∈{Wj,W‾j}ΣC∈{Ci,C‾i}{f(W,C|Hdep)-f(W,C|Hindep)}2f(W,C|Hindep)···(15)]]>f(Wj,Ci|Hdep)類(lèi)Ci中的具有元數(shù)據(jù)Wj的內(nèi)容數(shù)的實(shí)數(shù)f(Wj,Ci|Hindep)類(lèi)Ci中的具有元數(shù)據(jù)Wj的內(nèi)容數(shù)的期待值即,χ平方值根據(jù)屬于類(lèi)Ci的內(nèi)容之中具有元數(shù)據(jù)Wj的內(nèi)容數(shù)的實(shí)數(shù)和期待值之間的差,示出了元數(shù)據(jù)Wj對(duì)類(lèi)Ci的的依賴(lài)性。此外,χ平方值例如有如下特征或者優(yōu)點(diǎn)。
·根據(jù)元數(shù)據(jù)與統(tǒng)計(jì)期待值之間的發(fā)生關(guān)系進(jìn)行加權(quán)。
·在對(duì)各個(gè)域名分別提取專(zhuān)業(yè)用語(yǔ)等中廣泛應(yīng)用,其中域名是賦給因特網(wǎng)上存在的計(jì)算機(jī)、網(wǎng)絡(luò)的標(biāo)識(shí)符。
在使用對(duì)數(shù)似然比的情況下,將利用下面的式(16)算出的、作為某類(lèi)Ci中的元數(shù)據(jù)Wj的對(duì)數(shù)似然比的LL(Ci,Wj)設(shè)定為類(lèi)Ci中的元數(shù)據(jù)Wj的權(quán)重。
LL(Ci,Wj)=ΣW∈{Wj,W‾j}ΣC∈{Ci,C‾i}logP(W,C|Hdep)P(W,C|Hindep)···(16)]]>P(Wj,Ci|Hdep)屬于類(lèi)Ci的內(nèi)容具有元數(shù)據(jù)Wj的概率的實(shí)數(shù)P(Wj,Ci|Hindep)屬于類(lèi)Ci的內(nèi)容具有元數(shù)據(jù)Wj的概率的期待值即,對(duì)數(shù)似然比表示屬于類(lèi)Ci的內(nèi)容具有元數(shù)據(jù)Wj的概率的實(shí)數(shù)與期待值之間的比。此外,對(duì)數(shù)似然比例如有如下的特征以及優(yōu)點(diǎn)。
·根據(jù)元數(shù)據(jù)與統(tǒng)計(jì)期待值之間的發(fā)生關(guān)系進(jìn)行加權(quán)。
·在對(duì)各個(gè)域名分別提取專(zhuān)業(yè)用語(yǔ)等中廣泛應(yīng)用,其中域名是賦給因特網(wǎng)上存在的計(jì)算機(jī)、網(wǎng)絡(luò)的標(biāo)識(shí)符。
元數(shù)據(jù)提取部82使用以上方法中任意方法,求出各類(lèi)中的各元數(shù)據(jù)的權(quán)重。即,根據(jù)屬于類(lèi)A的內(nèi)容和元數(shù)據(jù)B之間的關(guān)聯(lián)度(屬于類(lèi)A的內(nèi)容和由元數(shù)據(jù)B表示的特征之間的關(guān)聯(lián)深度)、以及屬于其他類(lèi)的內(nèi)容和元數(shù)據(jù)B之間的關(guān)聯(lián)度與屬于類(lèi)A的內(nèi)容和元數(shù)據(jù)B之間的關(guān)聯(lián)度的差異,求出某類(lèi)A中的某元數(shù)據(jù)B的權(quán)重。
元數(shù)據(jù)提取部82例如對(duì)每個(gè)類(lèi)提取所設(shè)定的權(quán)重值是上位的規(guī)定數(shù)量(例如是10)的元數(shù)據(jù)、或者所設(shè)定的權(quán)重是規(guī)定閾值以上的元數(shù)據(jù)。即,對(duì)每個(gè)類(lèi)提取更明確地表示屬于該類(lèi)的內(nèi)容特征的元數(shù)據(jù)。更詳細(xì)地說(shuō),對(duì)每個(gè)類(lèi)提取如下元數(shù)據(jù),該元數(shù)據(jù)表示與屬于該類(lèi)的內(nèi)容關(guān)聯(lián)深的特征,并且表示與屬于其他類(lèi)的內(nèi)容相比關(guān)聯(lián)更深的特征。
元數(shù)據(jù)提取部82將表示對(duì)每個(gè)類(lèi)提取的元數(shù)據(jù)的信息提供給組合提取部83。此外,下面將對(duì)每個(gè)類(lèi)提取的元數(shù)據(jù)稱(chēng)為按類(lèi)重要元數(shù)據(jù)。
此外,下面,假設(shè)在步驟S2中,如圖6所示,從播放列表選擇曲目的類(lèi)、即提取對(duì)象類(lèi)中提取了[冬天][愛(ài)情][BGM][戲劇][夏天][強(qiáng)有力的][提神][演員][舒適][歡快]10個(gè)元數(shù)據(jù),從播放列表非選擇曲目的類(lèi)中提取了[愛(ài)情][傷感][夏天][懷舊][合作][舒適][戲劇][舞蹈][雄壯][溫暖]10個(gè)元數(shù)據(jù),進(jìn)行說(shuō)明。此外,對(duì)不進(jìn)行關(guān)鍵字提取的類(lèi),沒(méi)有必要必須進(jìn)行元數(shù)據(jù)的提取。
在步驟S3中,組合提取部83進(jìn)行元數(shù)據(jù)組合提取處理。在此,參照?qǐng)D7的流程圖說(shuō)明由組合提取部83執(zhí)行的元數(shù)據(jù)組合提取處理的詳細(xì)情況。
在步驟S21中,組合提取部83對(duì)邏輯式P進(jìn)行初始化。
在步驟S22中,組合提取部83判斷是否存在與比較對(duì)象類(lèi)的內(nèi)容的比較沒(méi)有完成的提取對(duì)象類(lèi)的內(nèi)容。當(dāng)判斷為存在與比較對(duì)象類(lèi)的內(nèi)容的比較沒(méi)有完成的提取對(duì)象類(lèi)的內(nèi)容的情況下,處理進(jìn)入到步驟S23。
在步驟S23中,組合提取部83選擇1個(gè)沒(méi)有完成比較的提取對(duì)象類(lèi)的內(nèi)容。此外,下面將在步驟S23中選擇的內(nèi)容稱(chēng)為提取對(duì)象內(nèi)容。
在步驟S24中,組合提取部83對(duì)邏輯式Q進(jìn)行初始化。
在步驟S25中,組合提取部83判斷是否存在與提取對(duì)象內(nèi)容的比較沒(méi)有完成的比較對(duì)象類(lèi)的內(nèi)容。在判斷為存在與提取對(duì)象內(nèi)容的比較沒(méi)有完成的比較對(duì)象類(lèi)的內(nèi)容的情況下,處理進(jìn)入到步驟S26。
在步驟S26中,組合提取部83選擇1個(gè)與提取對(duì)象內(nèi)容的比較沒(méi)有完成的比較對(duì)象類(lèi)的內(nèi)容。此外,下面將在步驟S26中選擇的內(nèi)容稱(chēng)為比較對(duì)象內(nèi)容。
在步驟S27中,組合提取部83提取出提取對(duì)象內(nèi)容所具有、而比較對(duì)象內(nèi)容沒(méi)有的元數(shù)據(jù)。具體地說(shuō),組合提取部83從提取對(duì)象類(lèi)的按類(lèi)重要元數(shù)據(jù)中提取出提取對(duì)象內(nèi)容所具有、而比較對(duì)象內(nèi)容沒(méi)有的元數(shù)據(jù)。
在步驟S28中,組合提取部83以or連接所提取的元數(shù)據(jù)而生成邏輯式R。例如,在作為提取對(duì)象類(lèi)的播放列表選擇曲目的按類(lèi)重要元數(shù)據(jù)中,作為提取對(duì)象內(nèi)容的藝術(shù)家1所具有、而作為比較對(duì)象內(nèi)容的藝術(shù)家12沒(méi)有的元數(shù)據(jù),提取了[冬天][愛(ài)情][強(qiáng)有力的][提神]以及[演員]的情況下,邏輯式R成為如下的式(17)。
R=[冬天]or[愛(ài)情]or[強(qiáng)有力的]or[提神]or[演員] …(17)此外,通過(guò)在邏輯式R中將提取出的元數(shù)據(jù)以or連接,將提取對(duì)象內(nèi)容和比較對(duì)象內(nèi)容進(jìn)行比較的情況下,可根據(jù)是否滿(mǎn)足邏輯式R來(lái)區(qū)分提取對(duì)象內(nèi)容和比較對(duì)象內(nèi)容。
在步驟S29中,組合提取部83將邏輯式R以and連結(jié)而添加到邏輯式Q。即,進(jìn)行下面的式(18)所示的邏輯運(yùn)算。
Q←Q and R…(18)之后,處理返回步驟S25,在步驟S25中,重復(fù)執(zhí)行步驟S25至S29的處理,直到判斷為不存在與提取對(duì)象內(nèi)容的比較沒(méi)有完成的比較對(duì)象類(lèi)的內(nèi)容為止。即,提取對(duì)象內(nèi)容與在比較對(duì)象類(lèi)(提取對(duì)象類(lèi)以外的類(lèi))中包含的全部?jī)?nèi)容進(jìn)行比較,在提取對(duì)象類(lèi)的按類(lèi)重要元數(shù)據(jù)之中提取出提取對(duì)象內(nèi)容具有、而比較對(duì)象內(nèi)容沒(méi)有的元數(shù)據(jù),添加到邏輯式Q。例如設(shè)屬于比較對(duì)象類(lèi)的內(nèi)容有m個(gè)、表示將提取對(duì)象內(nèi)容和比較對(duì)象類(lèi)的各內(nèi)容進(jìn)行比較的結(jié)果的邏輯式為邏輯式Ri(i=1,2,…,m)的情況下,由下面的式(19)表示邏輯式Q。
Q=R1 and R2 and…and Rm …(19)更具體地說(shuō),例如邏輯式Q成為下面的式(20)所示的那樣。
Q=([冬天]or[愛(ài)情]or[強(qiáng)有力的]or[提神]or[演員])and([冬天]or[愛(ài)情]or[戲劇]or[強(qiáng)有力的]or[演員])and([冬天]or[強(qiáng)有力的]or[提神]or[演員]or[舒適])and([冬天]or[戲劇]or[強(qiáng)有力的]or[提神]or[演員]or[舒適])and([冬天]or[愛(ài)情]or[戲劇]or[強(qiáng)有力的]or[提神]or[演員])and([演員]or[舒適])and([冬天]or[愛(ài)情]or[提神]or[演員])and([強(qiáng)有力的]or[提神]or[演員]or[舒適])and([冬天]or[戲劇]or[提神]or[演員]or[舒適])and([冬天]or[愛(ài)情]or[戲劇]or[提神]or[演員]or[舒適])…(20)此外,通過(guò)在邏輯式Q中將各邏輯式Ri以and連接,將提取對(duì)象內(nèi)容和屬于比較對(duì)象類(lèi)的內(nèi)容進(jìn)行比較的情況下,可根據(jù)是否滿(mǎn)足邏輯式Q來(lái)區(qū)分提取對(duì)象內(nèi)容和屬于比較對(duì)象類(lèi)的全部?jī)?nèi)容。
在步驟S25中,在判斷為不存在與提取對(duì)象內(nèi)容的比較沒(méi)有完成的比較對(duì)象類(lèi)的內(nèi)容的情況下、即完成了提取對(duì)象內(nèi)容和比較對(duì)象類(lèi)的全部?jī)?nèi)容的比較的情況下,處理進(jìn)入到步驟S30。
在步驟S30中,組合提取部83簡(jiǎn)化邏輯式Q。具體地說(shuō),組合提取部83將邏輯式Q變換為以最大項(xiàng)的積表示的標(biāo)準(zhǔn)和積形(standard product-of-sum)。例如,作為式(20)的最初項(xiàng)的項(xiàng)T1=([冬天]or[愛(ài)情]or[強(qiáng)有力的]or[提神]or[演員]),如下面的式(21)所示進(jìn)行變換。
T1=([冬天]or[愛(ài)情]or[強(qiáng)有力的]or[提神]or[演員]or~[BGM]or~[戲劇]oR~[夏天]or~[舒適]or~[歡快])and([冬天]or[愛(ài)情]or[強(qiáng)有力的]or[提神]or[演員]or~[BGM]or[戲劇]or~[夏天]or~[舒適]or~[歡快])and([冬天]or[愛(ài)情]or[強(qiáng)有力的]or[提神]or[演員]or[BGM]or[戲劇]or~[夏天]or~[舒適]or~[歡快])…(以下省略)…(21)此外,~是表示否定的記號(hào)。
接著,組合提取部83將變換為標(biāo)準(zhǔn)和積形的邏輯式Q變換為標(biāo)準(zhǔn)積和形。例如,如下面的式(22)所示變換項(xiàng)T1。
T1=([冬天]and[愛(ài)情]and[強(qiáng)有力的]and[提神]and[演員]and[BGM]and[戲劇]and[夏天]and[舒適]and[歡快])or([冬天]and[愛(ài)情]and[強(qiáng)有力的]and[提神]and[演員]and[BGM]and[戲劇]and[夏天]and[舒適]and~[歡快])or([冬天]and[愛(ài)情]and[強(qiáng)有力的]and[提神]and[演員]and[BGM]and[戲劇]and[夏天]and~[舒適]and[歡快])…(以下省略)…(22)并且,組合提取部83使用奎因-麥克拉斯基法(Quine-McCluskey algorithm)等簡(jiǎn)化變換為標(biāo)準(zhǔn)積和形的邏輯式Q。例如,如下面的式(23)所示簡(jiǎn)化式(20)的邏輯式Q。
Q=([演員]or([冬天]and[舒適])or([愛(ài)情]and[舒適])or([戲劇]and[提神]and[舒適])or([強(qiáng)有力的]and[提神]and[舒適])…(23)即,在式(23)的邏輯式Q中以or連結(jié)的各項(xiàng),表示通過(guò)關(guān)于屬于提取對(duì)象類(lèi)的各個(gè)內(nèi)容取出與內(nèi)容相關(guān)聯(lián)的1個(gè)以上的元數(shù)據(jù)而求出的元數(shù)據(jù)的全部組合之中,通過(guò)關(guān)于屬于比較對(duì)象類(lèi)的各個(gè)內(nèi)容取出與內(nèi)容相關(guān)聯(lián)的1個(gè)以上的元數(shù)據(jù)而求出的元數(shù)據(jù)的組合中不存在的、提取對(duì)象類(lèi)的按類(lèi)重要元數(shù)據(jù)的組合。
在步驟S31中,組合提取部83將邏輯式Q以or連結(jié)而添加到邏輯式P。即,進(jìn)行下面的式(24)所示的邏輯運(yùn)算。
P←P or Q…(24)之后,處理返回步驟S22,在步驟S22中,重復(fù)執(zhí)行步驟S22至S31的處理,直到判斷為不存在與比較對(duì)象類(lèi)的內(nèi)容的比較沒(méi)有完成的提取對(duì)象類(lèi)的內(nèi)容為止。即,將提取對(duì)象類(lèi)的全部?jī)?nèi)容與比較對(duì)象類(lèi)的全部?jī)?nèi)容進(jìn)行比較。例如,設(shè)提取對(duì)象類(lèi)的內(nèi)容有n個(gè),通過(guò)提取對(duì)象類(lèi)的各內(nèi)容的比較結(jié)果求出的邏輯式Q為Qi(i=1,2,…,n)的情況下,由下面的式(25)表示邏輯式P。
P=Q1 or Q2 or…or Qn…(25)更具體地說(shuō),例如邏輯式P成為下面的式(26)所示。
P=([BGM])or([演員])or([冬天]and[舒適])or([愛(ài)情]and[舒適])or([冬天]and[歡快])or([愛(ài)情]and[歡快])or([夏天]and[歡快])or([提神]and[歡快])or([戲劇]and[提神]and[舒適])or([強(qiáng)有力的]and[提神]and[舒適])…(26)此外,通過(guò)在邏輯式P中將各邏輯式Qi以or連結(jié),可根據(jù)是否滿(mǎn)足邏輯式P來(lái)區(qū)分是屬于提取對(duì)象類(lèi)的內(nèi)容、還是屬于比較對(duì)象類(lèi)的內(nèi)容。
在步驟S22中,在判斷為不存在與比較對(duì)象類(lèi)的內(nèi)容的比較沒(méi)有完成的提取對(duì)象類(lèi)的內(nèi)容的情況下,即關(guān)于全部提取對(duì)象類(lèi)的內(nèi)容完成了與比較對(duì)象類(lèi)的內(nèi)容的比較的情況下,處理進(jìn)入到步驟S32。
在步驟S32中,組合提取部83提取元數(shù)據(jù)的組合。具體地說(shuō),組合提取部83將邏輯式P的以or連結(jié)的各項(xiàng)作為提取對(duì)象類(lèi)的特征提取。例如,在邏輯式P是式(26)所示的值的情況下,提取下面所示的10組元數(shù)據(jù)的組合。
·[BGM]·[演員]·[冬天]and[舒適]·[愛(ài)情]and[舒適]·[冬天]and[歡快]·[愛(ài)情]and[歡快]·[夏天]and[歡快]·[提神]and[歡快]·[戲劇]and[提神]and[舒適]·[強(qiáng)有力的]and[提神]and[舒適]在步驟S33中,組合提取部83將元數(shù)據(jù)的組合存儲(chǔ)在客戶(hù)端存儲(chǔ)部23中,結(jié)束元數(shù)據(jù)組合提取處理。具體地說(shuō),組合提取部83將表示所提取的元數(shù)據(jù)組合的數(shù)據(jù)存儲(chǔ)到客戶(hù)端存儲(chǔ)部23中。另外,組合提取部83將表示所提取的元數(shù)據(jù)組合的信息提供給關(guān)鍵字呈現(xiàn)部84以及推薦內(nèi)容提取部85。
返回圖4,在步驟S4中,關(guān)鍵字呈現(xiàn)部84呈現(xiàn)關(guān)鍵字。具體地說(shuō),關(guān)鍵字呈現(xiàn)部84在步驟S3中提取的元數(shù)據(jù)的組合之中選擇1個(gè)以上的組合。例如根據(jù)下面的基準(zhǔn)選擇元數(shù)據(jù)的組合。
(1)包括的元數(shù)據(jù)的數(shù)量最多的組合(例如在步驟S32中在上述例子的情況下,是([戲劇]and[提神]and[舒適])或者([強(qiáng)有力的]and[提神]and[舒適}))(2)包括的元數(shù)據(jù)的數(shù)量最少的組合(例如在步驟S32中在上述例子的情況下,是([BGM])或者([演員]))(3)在步驟S2中設(shè)定的元數(shù)據(jù)權(quán)重的合計(jì)值或者平均值最大的組合(4)屬于提取對(duì)象類(lèi)的最多內(nèi)容所具有的組合
(5)屬于提取對(duì)象類(lèi)的特定內(nèi)容所具有的組合(6)全部組合此外,例如根據(jù)使用所提取的元數(shù)據(jù)組合的系統(tǒng)或者應(yīng)用程序等的規(guī)格、目的等,選擇上述基準(zhǔn)。
關(guān)鍵字呈現(xiàn)部84控制客戶(hù)端輸出部24,將所選擇的元數(shù)據(jù)呈現(xiàn)給用戶(hù)。例如,關(guān)鍵字呈現(xiàn)部84生成用于顯示所選擇的元數(shù)據(jù)組合的圖像數(shù)據(jù)。關(guān)鍵字呈現(xiàn)部84將所生成的圖像數(shù)據(jù)提供給客戶(hù)端輸出部24,使基于圖像數(shù)據(jù)的圖像、即表示作為提取對(duì)象類(lèi)的播放列表選擇曲目類(lèi)的特征的元數(shù)據(jù)(關(guān)鍵字)顯示在客戶(hù)端輸出部24中。
圖8是表示在步驟S4中顯示在客戶(hù)端輸出部24中的畫(huà)面的例子的圖。在圖8的例子中,將彈出窗口101與上述圖5所示的表一起顯示在客戶(hù)端輸出部24中。在彈出窗口101中,顯示了作為對(duì)播放列表選擇曲目(明確表示播放列表選擇曲目類(lèi)的特征)的關(guān)鍵字而提取的元數(shù)據(jù)的組合。另外,在彈出窗口101中顯示通知使所包含的元數(shù)據(jù)的數(shù)量多的組合優(yōu)先而提取元數(shù)據(jù)組合的消息。
并且,為了表示出選擇了播放列表選擇曲目作為將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn),例如將播放列表選擇曲目的項(xiàng)目的列的背景,設(shè)為陰影或者與其他列不同的顏色。另外,為了表示出顯示在彈出窗口101中的屬于成為關(guān)鍵字對(duì)象的類(lèi)的內(nèi)容,例如將表示表左端內(nèi)容的列的藝術(shù)家1至11欄的背景,設(shè)為陰影或者與其他列不同的顏色。
由此,用戶(hù)能夠簡(jiǎn)單地確認(rèn)自己所選擇的播放列表的特征(傾向)。
圖9是表示在步驟S4中顯示在客戶(hù)端輸出部24中的畫(huà)面的其他例子的圖。在圖9中示出了實(shí)際上在用于制作播放列表的畫(huà)面上顯示所提取的關(guān)鍵字的例子。
在標(biāo)題欄111中顯示有使該畫(huà)面顯示的軟件產(chǎn)品名等。菜單欄112中顯示有用于顯示各種操作的菜單等。在窗口113中顯示有用于調(diào)整音量、或切換動(dòng)作模式的GUI(Graphical User Interface圖形用戶(hù)界面)等。在窗口114中顯示有用于進(jìn)行內(nèi)容再現(xiàn)、停止、跳過(guò)等的GUI等。
在窗口115中顯示有播放列表中所選擇的樂(lè)曲一覽等。在樂(lè)曲一覽中顯示有序列No.、標(biāo)題、藝術(shù)家名、演奏時(shí)間、樂(lè)曲所屬的類(lèi)型、將樂(lè)曲登記到播放列表中的日期時(shí)間、作為樂(lè)曲來(lái)源的專(zhuān)輯名、來(lái)源專(zhuān)輯中的樂(lè)曲磁道No.等。
在窗口116中顯示有表示顯示在窗口115中的播放列表特征的關(guān)鍵字等。用戶(hù)通過(guò)觀看窗口116,能夠簡(jiǎn)單地確認(rèn)自己制作的播放列表的特征(傾向)。另外,用戶(hù)通過(guò)按下按鈕121,根據(jù)顯示在窗口116中的關(guān)鍵字,能夠自動(dòng)地制作例如“強(qiáng)有力的、提神、舒適的歌曲集”那樣的、適當(dāng)?shù)牟シ帕斜淼臉?biāo)題。在按下按鈕122的情況下,不進(jìn)行標(biāo)題的自動(dòng)制作,而關(guān)閉窗口116。
在步驟S5中,關(guān)鍵字呈現(xiàn)部84判斷是否改變了關(guān)鍵字。在判斷為沒(méi)有改變關(guān)鍵字的情況下,處理進(jìn)入步驟S6。
在步驟S6中,內(nèi)容分類(lèi)部81判斷是否改變了將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)。在判斷為沒(méi)有改變將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的情況下,處理進(jìn)入到步驟S7。
在步驟S7中,關(guān)鍵字呈現(xiàn)部84判斷是否決定了關(guān)鍵字。在判斷為沒(méi)有決定關(guān)鍵字的情況下,處理返回步驟S5。
之后,重復(fù)執(zhí)行步驟S5至S7的處理,直到在步驟S5中判斷為改變關(guān)鍵字、或在步驟S6中判斷為改變將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)、或在步驟S7中判斷為決定關(guān)鍵字為止。
在步驟S5中,例如在用戶(hù)想改變所呈現(xiàn)的關(guān)鍵字、通過(guò)用戶(hù)輸入部21輸入了指示改變關(guān)鍵字的信息的情況下,用戶(hù)輸入部21將獲取的信息提供給關(guān)鍵字呈現(xiàn)部84。關(guān)鍵字呈現(xiàn)部84在獲取了指示改變關(guān)鍵字的信息的情況下,判斷為改變了關(guān)鍵字,處理返回步驟S4。
之后,在步驟S4中,從在步驟S3中提取出的元數(shù)據(jù)組合中選擇其它組合,將所選擇的元數(shù)據(jù)作為表示提取對(duì)象類(lèi)的特征的關(guān)鍵字而呈現(xiàn)給客戶(hù)端輸出部24。
在步驟S6中,例如在用戶(hù)想以其它觀點(diǎn)提取將內(nèi)容進(jìn)行分類(lèi)的類(lèi)的關(guān)鍵字、通過(guò)用戶(hù)輸入部21輸入了指示改變將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的信息的情況下,用戶(hù)輸入部21將獲取的信息提供給內(nèi)容分類(lèi)部81。內(nèi)容分類(lèi)部81在獲取到指示改變將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的信息的情況下,判斷為改變了將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn),處理返回步驟S1。
之后,在步驟S1中,以新的觀點(diǎn)將內(nèi)容進(jìn)行分類(lèi)(例如,以愛(ài)好的觀點(diǎn)將內(nèi)容進(jìn)行分類(lèi)),關(guān)于進(jìn)行新分類(lèi)后的類(lèi)執(zhí)行步驟S2以后的處理。此外,既可以使用戶(hù)顯式地指定將內(nèi)容進(jìn)行分類(lèi)的新觀點(diǎn),也可以由內(nèi)容分類(lèi)部81根據(jù)預(yù)先決定的設(shè)定而自動(dòng)地進(jìn)行設(shè)定。
在步驟S7中,例如在用戶(hù)通過(guò)用戶(hù)輸入部21輸入了指示決定關(guān)鍵字的信息的情況下,用戶(hù)輸入部21將所獲取的信息提供給關(guān)鍵字呈現(xiàn)部84。關(guān)鍵字呈現(xiàn)部84在獲取到指示決定關(guān)鍵字的信息的情況下,判斷為決定了關(guān)鍵字,結(jié)束關(guān)鍵字提取處理。
此外,將關(guān)鍵字呈現(xiàn)給用戶(hù)之后,在沒(méi)有來(lái)自用戶(hù)的反應(yīng)的空閑狀態(tài)持續(xù)了規(guī)定時(shí)間的情況下,例如也可以改變自動(dòng)呈現(xiàn)的關(guān)鍵字、改變將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)。
這樣,能夠簡(jiǎn)單地提取表示根據(jù)用戶(hù)所指定的觀點(diǎn)進(jìn)行分類(lèi)后的類(lèi)的特征的元數(shù)據(jù)的組合。另外,如上所述,所提取的元數(shù)據(jù)的組合,與比較對(duì)象類(lèi)相比更帶有提取對(duì)象類(lèi)的特征,正確地示出了提取對(duì)象類(lèi)的特征。并且,通過(guò)簡(jiǎn)單的邏輯運(yùn)算,能夠提取元數(shù)據(jù)的組合。并且,在提取元數(shù)據(jù)的組合之前,提取按類(lèi)重要元數(shù)據(jù),縮減元數(shù)據(jù)的數(shù)量,由此能夠減少計(jì)算量以及計(jì)算所需的存儲(chǔ)介質(zhì)的存儲(chǔ)容量,例如在便攜式音樂(lè)播放器那樣的處理能力低的設(shè)備中也能夠容易地應(yīng)用本發(fā)明。
下面參照?qǐng)D10的流程圖說(shuō)明由信息處理系統(tǒng)1執(zhí)行的內(nèi)容推薦處理。
在步驟S41中,與圖4的步驟S1的處理相同地,將內(nèi)容進(jìn)行分類(lèi)。
在步驟S42中,與圖4的步驟S2的處理相同地,進(jìn)行元數(shù)據(jù)的加權(quán),提取按類(lèi)重要元數(shù)據(jù)。
在步驟S43中,與圖4的步驟S3的處理相同地,即按照?qǐng)D7的流程圖執(zhí)行元數(shù)據(jù)組合提取處理。
在步驟S44中,推薦內(nèi)容提取部85提取推薦給用戶(hù)的內(nèi)容。例如推薦內(nèi)容提取部85根據(jù)在步驟S43中提取的元數(shù)據(jù)的組合,從屬于與由在步驟S1中分類(lèi)的內(nèi)容構(gòu)成的組不同的組的內(nèi)容中,將與屬于提取了元數(shù)據(jù)組合的提取對(duì)象類(lèi)的內(nèi)容有關(guān)聯(lián)的內(nèi)容,作為推薦給用戶(hù)的內(nèi)容而提取。
具體地說(shuō),例如在從服務(wù)器存儲(chǔ)器51將與新到的內(nèi)容(例如,新到的電影、節(jié)目、樂(lè)曲等)有關(guān)的元數(shù)據(jù)發(fā)送到客戶(hù)端存儲(chǔ)部23的情況下,客戶(hù)端存儲(chǔ)部23存儲(chǔ)發(fā)送過(guò)來(lái)的元數(shù)據(jù),并且將表示具有新到內(nèi)容的信息提供給推薦內(nèi)容提取部85。推薦內(nèi)容提取部85從在步驟S43中提取的元數(shù)據(jù)的組合中,例如使用與在上述步驟S4中的說(shuō)明相同的基準(zhǔn),選擇用于提取推薦給用戶(hù)的內(nèi)容的元數(shù)據(jù)的組合。推薦內(nèi)容提取部85從在客戶(hù)端存儲(chǔ)部23中存儲(chǔ)有元數(shù)據(jù)的新到內(nèi)容中,提取具有元數(shù)據(jù)的內(nèi)容,該元數(shù)據(jù)包括所選擇的元數(shù)據(jù)的組合。推薦內(nèi)容提取部85將與所提取的內(nèi)容有關(guān)的信息提供給推薦內(nèi)容呈現(xiàn)部86。
另外,根據(jù)所提取的元數(shù)據(jù)的組合,將請(qǐng)求提取推薦給用戶(hù)的內(nèi)容的推薦內(nèi)容提取請(qǐng)求信息,從推薦內(nèi)容提取部85通過(guò)客戶(hù)端存儲(chǔ)部23以及服務(wù)器存儲(chǔ)部51發(fā)送到服務(wù)器運(yùn)算部52,還可以將具有元數(shù)據(jù)的內(nèi)容提取到服務(wù)器運(yùn)算部52中,其中,該元數(shù)據(jù)包含從在服務(wù)器存儲(chǔ)部51中存儲(chǔ)有元數(shù)據(jù)的內(nèi)容中提取的元數(shù)據(jù)的組合。
此外,提取推薦給用戶(hù)的內(nèi)容的方法并不限于上述的方法,例如也可以使用根據(jù)向量空間法進(jìn)行匹配、利用狀態(tài)移動(dòng)函數(shù)等的其他方法,根據(jù)所提取的元數(shù)據(jù),提取與屬于提取對(duì)象類(lèi)的內(nèi)容有關(guān)的內(nèi)容、即推薦給用戶(hù)的內(nèi)容。
在步驟S45中,推薦內(nèi)容呈現(xiàn)部86向用戶(hù)推薦內(nèi)容。具體地說(shuō),推薦內(nèi)容呈現(xiàn)部86控制客戶(hù)端輸出部24,將在步驟S44中提取的內(nèi)容作為推薦的內(nèi)容呈現(xiàn)給用戶(hù)。例如,推薦內(nèi)容呈現(xiàn)部86生成用于將在步驟S44中提取的內(nèi)容推薦給用戶(hù)的圖像數(shù)據(jù)。推薦內(nèi)容呈現(xiàn)部86將生成的圖像數(shù)據(jù)提供給客戶(hù)端輸出部24,顯示基于圖像數(shù)據(jù)的圖像、即向用戶(hù)推薦內(nèi)容的圖像。在該圖像中,例如與所推薦的內(nèi)容有關(guān)的信息(例如,標(biāo)題、概要等)一起顯示推薦內(nèi)容的依據(jù)(推薦理由)。內(nèi)容的推薦理由,例如既可以直接顯示用于提取所推薦內(nèi)容的元數(shù)據(jù)組合,也可以制作基于元數(shù)據(jù)組合的推薦文進(jìn)行顯示。
在步驟S46中,推薦內(nèi)容呈現(xiàn)部86判斷是否改變所推薦的內(nèi)容。在判斷為沒(méi)有改變所推薦的內(nèi)容的情況下,處理進(jìn)入步驟S47。
在步驟S47中,與圖4的步驟S47的處理相同地,判斷是否改變將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)。在判斷為沒(méi)有改變將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的情況下,處理進(jìn)入步驟S48。
在步驟S48中,推薦內(nèi)容呈現(xiàn)部86判斷是否決定內(nèi)容。在判斷為沒(méi)有決定內(nèi)容的情況下,處理返回步驟S46。
之后,重復(fù)執(zhí)行步驟S46至S48的處理,直到在步驟S46中判斷為改變所推薦的內(nèi)容、或在步驟S47中判斷為改變將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)、或在步驟S48中判斷為決定內(nèi)容為止。
在步驟S46中,例如在用戶(hù)想改變所推薦的內(nèi)容、通過(guò)用戶(hù)輸入部21輸入了指示改變內(nèi)容的信息的情況下,用戶(hù)輸入部21將所獲取的信息提供給推薦內(nèi)容呈現(xiàn)部86。推薦內(nèi)容呈現(xiàn)部86在獲取了指示改變所推薦的內(nèi)容的信息的情況下,判斷為改變所推薦的內(nèi)容,處理返回步驟S44。
之后,在步驟S44中,從在步驟S43中提取的元數(shù)據(jù)組合中選擇其它的組合,將根據(jù)所選擇的元數(shù)據(jù)的組合而提取的內(nèi)容推薦給用戶(hù)。
在步驟S47中,在判斷為改變將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的情況下,處理返回步驟S41。
之后,在步驟S41中以新的觀點(diǎn)將內(nèi)容進(jìn)行分類(lèi)(例如,以愛(ài)好的觀點(diǎn)將內(nèi)容進(jìn)行分類(lèi)),關(guān)于進(jìn)行新分類(lèi)后的類(lèi)執(zhí)行步驟S2以后的處理。
在步驟S48中,例如在用戶(hù)喜歡所推薦的內(nèi)容并想視聽(tīng)內(nèi)容、通過(guò)用戶(hù)輸入部21輸入了指示決定內(nèi)容的信息的情況下,用戶(hù)輸入部21將所獲取的信息提供給推薦內(nèi)容呈現(xiàn)部86。推薦內(nèi)容呈現(xiàn)部86在獲取了指示決定內(nèi)容的信息的情況下,判斷為決定內(nèi)容,結(jié)束內(nèi)容推薦處理。
之后,推薦內(nèi)容呈現(xiàn)部86將通知所決定內(nèi)容的信息提供給客戶(hù)端存儲(chǔ)部23。例如,在所決定的內(nèi)容存儲(chǔ)在客戶(hù)端存儲(chǔ)部23中的情況下,客戶(hù)端存儲(chǔ)部23將該內(nèi)容提供給客戶(hù)端輸出部24??蛻?hù)端輸出部24例如顯示基于內(nèi)容的圖像、輸出聲音。
另外,例如在所決定的內(nèi)容沒(méi)有存儲(chǔ)在客戶(hù)端存儲(chǔ)部23中的情況下,客戶(hù)端存儲(chǔ)部23將請(qǐng)求發(fā)布所決定的內(nèi)容的信息提供給內(nèi)容發(fā)布部41。內(nèi)容發(fā)布部41將請(qǐng)求的內(nèi)容發(fā)布給客戶(hù)端存儲(chǔ)部23??蛻?hù)端存儲(chǔ)部23存儲(chǔ)所發(fā)布的內(nèi)容,并且將該內(nèi)容提供給客戶(hù)端輸出部24。客戶(hù)端輸出部24例如顯示基于內(nèi)容的圖像、輸出聲音。
此外,將內(nèi)容推薦給用戶(hù)之后,在沒(méi)有來(lái)自用戶(hù)的反應(yīng)的空閑狀態(tài)持續(xù)了規(guī)定時(shí)間的情況下,例如也可以改變自動(dòng)推薦的內(nèi)容、或改變將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)。
這樣,將基于表示根據(jù)用戶(hù)所指定的觀點(diǎn)進(jìn)行分類(lèi)后的類(lèi)的特征的元數(shù)據(jù)組合而提取的內(nèi)容推薦給用戶(hù),并且能夠?qū)⑺扑]的依據(jù)(理由)明確地呈現(xiàn)給用戶(hù)。例如,通過(guò)使用從基于用戶(hù)愛(ài)好(例如,用戶(hù)的喜好等)的觀點(diǎn)進(jìn)行分類(lèi)后的類(lèi)中提取的元數(shù)據(jù)組合,能夠?qū)⒄_地反映了用戶(hù)愛(ài)好的內(nèi)容推薦給用戶(hù)。另外,通過(guò)根據(jù)與基于用戶(hù)愛(ài)好的觀點(diǎn)不同的觀點(diǎn)將內(nèi)容進(jìn)行分類(lèi),例如還能夠推薦著眼于內(nèi)容提供側(cè)的促銷(xiāo)內(nèi)容等、不依賴(lài)于用戶(hù)愛(ài)好的內(nèi)容。
下面參照?qǐng)D11至圖16說(shuō)明本發(fā)明的第2實(shí)施方式。
圖11是表示應(yīng)用了本發(fā)明的信息處理系統(tǒng)的第2實(shí)施方式的框圖。
信息處理系統(tǒng)201包括內(nèi)容視聽(tīng)客戶(hù)端211、上下文檢測(cè)終端212、內(nèi)容發(fā)布服務(wù)器213、以及內(nèi)容推薦服務(wù)器214。當(dāng)從功能結(jié)構(gòu)的觀點(diǎn)出發(fā)時(shí),內(nèi)容視聽(tīng)客戶(hù)端211包括用戶(hù)輸入部221、客戶(hù)端運(yùn)算部222、客戶(hù)端存儲(chǔ)部223、以及客戶(hù)端輸出部224。當(dāng)從功能結(jié)構(gòu)的觀點(diǎn)出發(fā)時(shí),上下文檢測(cè)終端212包括上下文檢測(cè)部231、以及上下文存儲(chǔ)部232。當(dāng)從功能結(jié)構(gòu)的觀點(diǎn)出發(fā)時(shí),內(nèi)容發(fā)布服務(wù)器213包括內(nèi)容發(fā)布部241、以及內(nèi)容元數(shù)據(jù)存儲(chǔ)部242。當(dāng)從功能結(jié)構(gòu)的觀點(diǎn)出發(fā)時(shí),內(nèi)容推薦服務(wù)器214包括服務(wù)器存儲(chǔ)部251、以及服務(wù)器運(yùn)算部252。
此外,在圖中,對(duì)于與圖1對(duì)應(yīng)的部分,在后2位標(biāo)記了相同的符號(hào),關(guān)于處理相同的部分由于其說(shuō)明重復(fù),因此省略。
如參照?qǐng)D13或者圖16在后面所述,客戶(hù)端運(yùn)算部222根據(jù)與存儲(chǔ)在客戶(hù)端存儲(chǔ)部223中的內(nèi)容以及元數(shù)據(jù)有關(guān)的信息、從上下文檢測(cè)終端212提供的上下文信息、或者表示從用戶(hù)輸入部221提供的用戶(hù)操作內(nèi)容的信息,生成用于將內(nèi)容分類(lèi)到規(guī)定類(lèi)中的內(nèi)容分類(lèi)規(guī)則,并且算出表示所生成的內(nèi)容分類(lèi)規(guī)則的可靠性的評(píng)價(jià)指標(biāo)。客戶(hù)端運(yùn)算部222根據(jù)所生成的內(nèi)容分類(lèi)規(guī)則,對(duì)由用戶(hù)等指定為分類(lèi)對(duì)象的內(nèi)容進(jìn)行分類(lèi)??蛻?hù)端運(yùn)算部222控制客戶(hù)端輸出部224,將內(nèi)容進(jìn)行分類(lèi)的結(jié)果、內(nèi)容的特征等呈現(xiàn)給用戶(hù)。另外,客戶(hù)端運(yùn)算部222將表示所生成的內(nèi)容分類(lèi)規(guī)則及其評(píng)價(jià)指標(biāo)的信息存儲(chǔ)在客戶(hù)端存儲(chǔ)部223中。
客戶(hù)端存儲(chǔ)部223存儲(chǔ)表示內(nèi)容分類(lèi)規(guī)則及其評(píng)價(jià)指標(biāo)的信息。另外,客戶(hù)端存儲(chǔ)部223將表示內(nèi)容分類(lèi)規(guī)則及其評(píng)價(jià)指標(biāo)的信息,根據(jù)需要發(fā)送到內(nèi)容推薦服務(wù)器214的服務(wù)器存儲(chǔ)部251中。
客戶(hù)端輸出部224根據(jù)客戶(hù)端運(yùn)算部222的控制,將內(nèi)容進(jìn)行分類(lèi)的結(jié)果、內(nèi)容的特征等呈現(xiàn)給用戶(hù)。
服務(wù)器存儲(chǔ)部251存儲(chǔ)從客戶(hù)端存儲(chǔ)部223發(fā)送過(guò)來(lái)的表示內(nèi)容分類(lèi)規(guī)則及其評(píng)價(jià)指標(biāo)的信息。另外,服務(wù)器存儲(chǔ)部251存儲(chǔ)從服務(wù)器運(yùn)算部252提供的表示內(nèi)容分類(lèi)規(guī)則及其評(píng)價(jià)指標(biāo)的信息、或者表示內(nèi)容分類(lèi)結(jié)果的信息。
服務(wù)器運(yùn)算部252根據(jù)存儲(chǔ)在服務(wù)器存儲(chǔ)部251中的表示用戶(hù)操作內(nèi)容的信息、以及內(nèi)容信息,生成用于將存儲(chǔ)在服務(wù)器存儲(chǔ)部251中的內(nèi)容進(jìn)行分類(lèi)的內(nèi)容分類(lèi)規(guī)則,并且算出表示所生成的內(nèi)容分類(lèi)規(guī)則的可靠性的評(píng)價(jià)指標(biāo)。服務(wù)器運(yùn)算部252根據(jù)所生成的內(nèi)容分類(lèi)規(guī)則,將存儲(chǔ)在服務(wù)器存儲(chǔ)部251中的內(nèi)容進(jìn)行分類(lèi)。服務(wù)器運(yùn)算部252將表示所生成的內(nèi)容分類(lèi)規(guī)則及其評(píng)價(jià)指標(biāo)的信息、或者表示內(nèi)容分類(lèi)結(jié)果的信息存儲(chǔ)到服務(wù)器存儲(chǔ)部251中。
另外,圖11由于示出了功能結(jié)構(gòu)例,因此沒(méi)有特別圖示各裝置間的連接方式、即內(nèi)容視聽(tīng)客戶(hù)端211至內(nèi)容推薦服務(wù)器214的各個(gè)之間的連接方式,但是沒(méi)有特別限定其連接方式。即,連接方式既可以是有線,也可以是無(wú)線,還可以是其組合。
另外,連接方式既可以是通過(guò)網(wǎng)絡(luò)的方式,也可以是在裝置間進(jìn)行直接通信的方式,還可以是其組合。并且,即使在通過(guò)網(wǎng)絡(luò)的方式的情況下,也沒(méi)有限定網(wǎng)絡(luò)的方式,例如也可以是因特網(wǎng)、內(nèi)部網(wǎng)等。此時(shí),網(wǎng)絡(luò)并不限于單一的網(wǎng)路,也可以存在多個(gè)網(wǎng)路。因而,在圖11中雖然沒(méi)有圖示,但是實(shí)際上在內(nèi)容視聽(tīng)客戶(hù)端211至內(nèi)容推薦服務(wù)器214的各個(gè)中,還設(shè)置有與所對(duì)應(yīng)的連接方式相應(yīng)的通信部。
另外,上下文檢測(cè)終端212、內(nèi)容發(fā)布服務(wù)器213、以及內(nèi)容推薦服務(wù)器214,在信息處理系統(tǒng)201中不是必須的結(jié)構(gòu)要素。即,如參照?qǐng)D13或者圖16在后面所述,能夠只通過(guò)內(nèi)容視聽(tīng)客戶(hù)端211,實(shí)現(xiàn)由信息處理系統(tǒng)201進(jìn)行的內(nèi)容分類(lèi)處理。
圖12是表示客戶(hù)端運(yùn)算部222的功能結(jié)構(gòu)例的框圖??蛻?hù)端運(yùn)算部222包括內(nèi)容分類(lèi)部281、元數(shù)據(jù)提取部282、組合提取部283、內(nèi)容分類(lèi)規(guī)則生成部291、內(nèi)容自動(dòng)分類(lèi)部292、以及分類(lèi)結(jié)果呈現(xiàn)部293。此外,在圖中,對(duì)于與圖2對(duì)應(yīng)的部分,在后2位標(biāo)記了相同的符號(hào),關(guān)于處理相同的部分由于其說(shuō)明重復(fù),因此省略。
組合提取部283將表示所提取的元數(shù)據(jù)組合的信息,提供給內(nèi)容分類(lèi)規(guī)則生成部291。
如參照?qǐng)D13在后面所述,內(nèi)容分類(lèi)規(guī)則生成部291生成內(nèi)容分類(lèi)規(guī)則,并且算出所生成的內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)。
內(nèi)容分類(lèi)規(guī)則生成部291將表示所生成的內(nèi)容分類(lèi)規(guī)則及其評(píng)價(jià)指標(biāo)的信息提供給內(nèi)容自動(dòng)分類(lèi)部292,并且存儲(chǔ)到客戶(hù)端存儲(chǔ)部223中。
內(nèi)容自動(dòng)分類(lèi)部292從用戶(hù)輸入部221獲取由用戶(hù)通過(guò)用戶(hù)輸入部221輸入的、指定成為自動(dòng)分類(lèi)對(duì)象的內(nèi)容的信息。另外,內(nèi)容自動(dòng)分類(lèi)部292從客戶(hù)端存儲(chǔ)部223獲取表示具有新到或者推薦內(nèi)容的信息。如參照?qǐng)D13或者圖16在后面所述,內(nèi)容自動(dòng)分類(lèi)部292根據(jù)內(nèi)容分類(lèi)規(guī)則,將由用戶(hù)指定的內(nèi)容、或者作為從客戶(hù)端存儲(chǔ)部223通知的新到或者推薦內(nèi)容等的分類(lèi)對(duì)象的內(nèi)容,分類(lèi)到規(guī)定的類(lèi)。內(nèi)容自動(dòng)分類(lèi)部292,將表示將內(nèi)容進(jìn)行分類(lèi)的結(jié)果的信息提供給分類(lèi)結(jié)果呈現(xiàn)部293。
分類(lèi)結(jié)果呈現(xiàn)部293控制客戶(hù)端輸出部224,使得將內(nèi)容進(jìn)行分類(lèi)的結(jié)果、內(nèi)容的特征等呈現(xiàn)給用戶(hù)。
下面參照?qǐng)D13至圖16說(shuō)明由信息處理系統(tǒng)201執(zhí)行的處理。
首先,參照?qǐng)D13的流程圖,說(shuō)明由信息處理系統(tǒng)201執(zhí)行的內(nèi)容分類(lèi)處理的第1實(shí)施方式。此外,例如當(dāng)用戶(hù)通過(guò)用戶(hù)輸入部221輸入了內(nèi)容分類(lèi)處理的開(kāi)始指令時(shí),開(kāi)始該處理。
在步驟S101中,內(nèi)容分類(lèi)部281通過(guò)與上述圖4的步驟S1相同的處理,根據(jù)由用戶(hù)指定的觀點(diǎn)將內(nèi)容分類(lèi)到多個(gè)類(lèi),將與分類(lèi)后的內(nèi)容的類(lèi)有關(guān)的信息提供給元數(shù)據(jù)提取部282。
圖14是表示用于將圖3所示的內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的例子。此外,與圖3所示的表相比,在圖14所示的表中添加了分類(lèi)觀點(diǎn)的項(xiàng)目。另外,在圖14中,作為將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn),示出了用戶(hù)愛(ài)好、以及保存有內(nèi)容的文件夾這兩個(gè)例子。關(guān)于用戶(hù)愛(ài)好的觀點(diǎn),與參照?qǐng)D5所述的例子相同。
此外,下面說(shuō)明將保存內(nèi)容的文件夾設(shè)為“流行音樂(lè)”以及“民歌”兩種情況的例子。例如,用戶(hù)根據(jù)內(nèi)容(當(dāng)前例的情況下是樂(lè)曲)的曲調(diào)等,將各內(nèi)容分類(lèi)到“流行音樂(lè)”或者“民歌”文件夾進(jìn)行管理。因而,在根據(jù)保存了內(nèi)容的文件夾的觀點(diǎn)將內(nèi)容進(jìn)行分類(lèi)的情況下,各內(nèi)容被分類(lèi)到“流行音樂(lè)”“民歌”兩個(gè)類(lèi)中。
另外,為了使說(shuō)明簡(jiǎn)單,假設(shè)在圖5的例子中屬于“播放列表選擇曲目”類(lèi)的內(nèi)容在圖14的例子中屬于“流行音樂(lè)”類(lèi),即保存在“流行音樂(lè)”的文件夾中,假設(shè)在圖5的例子中屬于“播放列表非選擇曲目”類(lèi)的內(nèi)容在圖14的例子中屬于“民歌”類(lèi),即保存在“民歌”的文件夾中。
此外,以下說(shuō)明在步驟S101中,由用戶(hù)將保存有內(nèi)容的文件夾指定為將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的情況的例子。
在步驟S102中,元數(shù)據(jù)提取部282通過(guò)與上述圖4的步驟S2相同的處理進(jìn)行元數(shù)據(jù)的加權(quán),對(duì)每類(lèi)提取按類(lèi)重要元數(shù)據(jù)。元數(shù)據(jù)提取部282將表示所提取的按類(lèi)重要元數(shù)據(jù)的信息提供給組合提取部283。
此外,下面,假設(shè)在步驟S102中,如圖15所示,從流行音樂(lè)的類(lèi)中,作為按類(lèi)重要元數(shù)據(jù)而提取了[冬天][愛(ài)情][BGM][戲劇][夏天][強(qiáng)有力的][提神][演員][舒適][歡快]10個(gè)元數(shù)據(jù),從民歌的類(lèi)中,作為按類(lèi)重要元數(shù)據(jù)而提取了[愛(ài)情][傷感][夏天][懷舊][合作][舒適][戲劇][舞蹈][雄壯][溫暖]10個(gè)元數(shù)據(jù),來(lái)進(jìn)行說(shuō)明。
在步驟S103中,組合提取部283通過(guò)與上述圖4的步驟S3相同的處理,對(duì)各類(lèi)進(jìn)行元數(shù)據(jù)組合提取處理。組合提取部283將表示所提取的元數(shù)據(jù)組合的數(shù)據(jù)存儲(chǔ)到客戶(hù)端存儲(chǔ)部223中,并且提供給內(nèi)容分類(lèi)規(guī)則生成部291。
此外,下面,假設(shè)從流行音樂(lè)的類(lèi)中提取了以下所示的10組元數(shù)據(jù)組合,進(jìn)行說(shuō)明。
·[BGM]·[演員]
·[冬天]and[舒適]·[愛(ài)情]and[舒適]·[冬天]and[歡快]·[愛(ài)情]and[歡快]·[夏天]and[歡快]·[提神]and[歡快]·[戲劇]and[提神]and[舒適]·[強(qiáng)有力的]and[提神]and[舒適]另外,下面,假設(shè)從民歌的類(lèi)中提取了以下所示的10組元數(shù)據(jù)組合,進(jìn)行說(shuō)明。
·[夏天]and[懷舊]·[懷舊]and[合作]·[戲劇]and[雄壯]·[舒適]and[雄壯]·[溫暖]and[雄壯]·[愛(ài)情]and[夏天]and[戲劇]·[傷感]and[夏天]and[戲劇]·[愛(ài)情]and[懷舊]and[舞蹈]·[傷感]and[合作]and[戲劇]·[夏天]and[合作]and[戲劇]在步驟S104中,內(nèi)容分類(lèi)規(guī)則生成部291生成內(nèi)容分類(lèi)規(guī)則。具體地說(shuō),首先,內(nèi)容分類(lèi)規(guī)則生成部291對(duì)所提取的元數(shù)據(jù)的每個(gè)組合生成內(nèi)容分類(lèi)規(guī)則,該內(nèi)容分類(lèi)規(guī)則將在步驟S103中提取的元數(shù)據(jù)組合設(shè)為條件部(If部)、將提取了該數(shù)據(jù)組合的類(lèi)設(shè)為結(jié)論部(then部)。例如,作為將流行音樂(lè)的類(lèi)設(shè)為結(jié)論部的內(nèi)容分類(lèi)規(guī)則(下面,簡(jiǎn)單表述為流行音樂(lè)的類(lèi)的內(nèi)容分類(lèi)規(guī)則),生成下面的Rp1至Rp10的10個(gè)內(nèi)容分類(lèi)規(guī)則。
規(guī)則Rp1if([BGM]=true)then(類(lèi)=“流行音樂(lè)”)規(guī)則Rp2if([演員]=true)then(類(lèi)=“流行音樂(lè)”)規(guī)則Rp3if([冬天]=true and[舒適]=ture)then(類(lèi)=“流行音樂(lè)”)規(guī)則Rp4if([愛(ài)情]=true and[舒適]=ture)then(類(lèi)=“流行音樂(lè)”)規(guī)則Rp5if([冬天]=true and[歡快]=ture)then(類(lèi)=“流行音樂(lè)”)規(guī)則Rp6if([愛(ài)情]=true and[歡快]=ture)then(類(lèi)=“流行音樂(lè)”)規(guī)則Rp7if([夏天]=true and[歡快]=ture)then(類(lèi)=“流行音樂(lè)”)規(guī)則Rp8if([提神]=true and[歡快]=ture)then(類(lèi)=“流行音樂(lè)”)規(guī)則Rp9if([戲劇]=true and[提神]=ture and[舒適]=ture)then(類(lèi)=“流行音樂(lè)”)規(guī)則Rp10if([強(qiáng)有力的]=true and[提神]=ture and[舒適]=ture)then(類(lèi)=“流行音樂(lè)”)例如,在某內(nèi)容具有[BGM]的元數(shù)據(jù)的情況下,規(guī)則Rp1表示該內(nèi)容所被分類(lèi)到的類(lèi)是“流行音樂(lè)”的規(guī)則。
同樣地,作為將民歌的類(lèi)設(shè)為結(jié)論部的內(nèi)容分類(lèi)規(guī)則(下面,簡(jiǎn)單地表述為民歌的類(lèi)的內(nèi)容分類(lèi)規(guī)則),生成下面的Rb1至Rb10的10個(gè)內(nèi)容分類(lèi)規(guī)則。
規(guī)則Rb1if([夏天]=true and[懷舊]=true)then(類(lèi)=“民歌”)規(guī)則Rb2if([懷舊]=true and[合作]=true)then(類(lèi)=“民歌”)規(guī)則Rb3if([戲劇]=true and[雄壯]=ture)then(類(lèi)=“民歌”)規(guī)則Rb4if([舒適]=true and[雄壯]=ture)then(類(lèi)=“民歌”)規(guī)則Rb5if([溫暖]=true and[雄壯]=ture)then(類(lèi)=“民歌”)規(guī)則Rb6if([愛(ài)情]=true and[夏天]=ture and[戲劇]=ture)then(類(lèi)=“民歌”)規(guī)則Rb7if([傷感]=true and[夏天]=ture and[戲劇]=ture)then(類(lèi)=“民歌”)規(guī)則Rb8if([愛(ài)情]=true and[懷舊]=ture and[舞蹈]=ture)then(類(lèi)=“民歌”)規(guī)則Rb9if([傷感]=true and[合作]=ture and[戲劇]=ture)then(類(lèi)=“民歌”)規(guī)則Rb10if([夏天]=true and[合作]=ture and[戲劇]=ture)then(類(lèi)=“民歌”)此外,下面將內(nèi)容分類(lèi)規(guī)則的條件部中所示的元數(shù)據(jù)組合,簡(jiǎn)單稱(chēng)為內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合。另外,下面將內(nèi)容分類(lèi)規(guī)則的結(jié)論部中所示的類(lèi),簡(jiǎn)單稱(chēng)為內(nèi)容分類(lèi)規(guī)則的類(lèi)。
接著,內(nèi)容分類(lèi)規(guī)則生成部291算出各內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)。
在此,說(shuō)明評(píng)價(jià)指標(biāo)的算出方法的例子。
第1方法是如下面的式(27)所示,將在內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合中包含的元數(shù)據(jù)的權(quán)重的合計(jì)值設(shè)為評(píng)價(jià)指標(biāo)的方法。
EI=∑Weight(Wi)…(27)此外,EI表示評(píng)價(jià)指標(biāo),Wi表示包括在內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合中的元數(shù)據(jù),Weight(Wi)表示內(nèi)容分類(lèi)規(guī)則的類(lèi)中的元數(shù)據(jù)Wi的權(quán)重。
例如,在規(guī)則Rp3的情況下,將類(lèi)“流行音樂(lè)”中的元數(shù)據(jù)[冬天]的權(quán)重與類(lèi)“流行音樂(lè)”中的元數(shù)據(jù)[舒適]的權(quán)重進(jìn)行合計(jì)的值為評(píng)價(jià)指標(biāo)。
在第1方法中,在內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合中包含的元數(shù)據(jù)數(shù)量越多、或者在內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合中包含的元數(shù)據(jù)權(quán)重越大,評(píng)價(jià)指標(biāo)越大。即,內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合與屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的內(nèi)容之間的關(guān)聯(lián)越深,換言之內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合表現(xiàn)出屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的內(nèi)容特征的程度越大,評(píng)價(jià)指標(biāo)越大。進(jìn)一步換言之,在內(nèi)容分類(lèi)規(guī)則的類(lèi)中,具有元數(shù)據(jù)的內(nèi)容所占比例越高,評(píng)價(jià)指標(biāo)越大,其中,所述元數(shù)據(jù)包括內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合。
第2方法是如下面的式(28)所示,將在內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合中包含的元數(shù)據(jù)權(quán)重的平均值設(shè)為評(píng)價(jià)指標(biāo)的方法。
EI={∑Weight(Wi)}÷Nc…(28)此外,Nc表示包含在內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合中的元數(shù)據(jù)的數(shù)量。
例如,在規(guī)則Rp3的情況下,將類(lèi)“流行音樂(lè)”中的元數(shù)據(jù)[冬天]的權(quán)重與類(lèi)“流行音樂(lè)”中的元數(shù)據(jù)[舒適]的權(quán)重進(jìn)行合計(jì)的值除以作為在條件部中包含的元數(shù)據(jù)數(shù)量的2的值,成為評(píng)價(jià)指標(biāo)。
在第2方法中,在內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合中包含的元數(shù)據(jù)的權(quán)重越大,評(píng)價(jià)指標(biāo)越大。即,在內(nèi)容分類(lèi)規(guī)則的條件部中包含的各個(gè)元數(shù)據(jù)與屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的內(nèi)容之間的關(guān)聯(lián)越深,換言之在內(nèi)容分類(lèi)規(guī)則的條件部中包含的各個(gè)元數(shù)據(jù)表示屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的內(nèi)容特征的程度越大,評(píng)價(jià)指標(biāo)越大。進(jìn)一步換言之,在內(nèi)容分類(lèi)規(guī)則的類(lèi)中,具有在內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合中包含的元數(shù)據(jù)中至少一個(gè)的內(nèi)容所占的比例越高,評(píng)價(jià)指標(biāo)越大。
第3方法如下面的式(29)所示,是將全部?jī)?nèi)容之中滿(mǎn)足內(nèi)容分類(lèi)規(guī)則的條件部的內(nèi)容所占的比例、換言之全部?jī)?nèi)容之中具有在內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合中包含的元數(shù)據(jù)的內(nèi)容所占比例、所謂的覆蓋率設(shè)為評(píng)價(jià)指標(biāo)的方法。此外,在此全部?jī)?nèi)容是指在步驟S 1中分類(lèi)到各類(lèi)中的內(nèi)容。
EI=Count(Condition)÷N…(29)此外,Count(Condition)表示滿(mǎn)足內(nèi)容分類(lèi)規(guī)則的條件部的內(nèi)容個(gè)數(shù),N表示內(nèi)容的全部個(gè)數(shù)。
例如,在規(guī)則Rp3的情況下,全部?jī)?nèi)容中具有元數(shù)據(jù)[冬天]和元數(shù)據(jù)[舒適]的內(nèi)容所占的比例成為評(píng)價(jià)指標(biāo)。
在第3方法中,全部?jī)?nèi)容中滿(mǎn)足內(nèi)容分類(lèi)規(guī)則的條件部的內(nèi)容所占的比例越高,評(píng)價(jià)指標(biāo)越大。
第4方法如下面的式(30)所示,是將屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)中的內(nèi)容之中滿(mǎn)足內(nèi)容分類(lèi)規(guī)則的條件部的內(nèi)容所占的比例、所謂再現(xiàn)率(Recall)設(shè)為評(píng)價(jià)指標(biāo)的方法。
EI=Recall=Count(Con dition & Decision)÷Count(Decision)…(30)此外,Count(Condition&Decision)表示屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的內(nèi)容之中滿(mǎn)足內(nèi)容分類(lèi)規(guī)則的條件部的內(nèi)容的個(gè)數(shù),Count(Decision)表示屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的內(nèi)容的個(gè)數(shù)。
例如,在規(guī)則Rp3的情況下,屬于類(lèi)“流行音樂(lè)”的內(nèi)容之中具有元數(shù)據(jù)[冬天]和元數(shù)據(jù)[舒適]的內(nèi)容所占的比例,成為評(píng)價(jià)指標(biāo)。
在第4方法中,屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的內(nèi)容具有元數(shù)據(jù)的比例越高,評(píng)價(jià)指標(biāo)越大,其中,所述元數(shù)據(jù)包括內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合。即,內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合與屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的內(nèi)容關(guān)聯(lián)越深,換言之內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)的組合表示屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的內(nèi)容特征的程度越大,評(píng)價(jià)指標(biāo)越大。
第5方法如下面的式(31)所示,是將滿(mǎn)足內(nèi)容分類(lèi)規(guī)則的條件部的內(nèi)容之中屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的內(nèi)容所占的比例、所謂的適合率(Precision)設(shè)為評(píng)價(jià)指標(biāo)的方法。
EI=Precision=Count(Condition & Decision)÷Count(Condition)…(31)例如,在規(guī)則Rp3的情況下,具有元數(shù)據(jù)[冬天]和元數(shù)據(jù)[舒適]的內(nèi)容之中屬于類(lèi)“流行音樂(lè)”的內(nèi)容所占的比例,成為評(píng)價(jià)指標(biāo)。
在第5方法中,具有元數(shù)據(jù)的內(nèi)容屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的比例越高,評(píng)價(jià)指標(biāo)越大,其中,所述元數(shù)據(jù)包括內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合。即,內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合與屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的內(nèi)容的關(guān)聯(lián)越深,換言之內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合表示屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的內(nèi)容特征的程度越大,評(píng)價(jià)指標(biāo)越大。
第6方法如下面的式(32)所示,是將由式(30)求出的再現(xiàn)率(Recall)和由式(31)求出的適合率(Precision)的調(diào)和平均、所謂的F值設(shè)為評(píng)價(jià)指標(biāo)的方法。
EI=F=2÷(1÷Recall+1÷Precision) …(32)在第6方法中,具有元數(shù)據(jù)的內(nèi)容集合、與內(nèi)容分類(lèi)規(guī)則的類(lèi)越接近,評(píng)價(jià)指標(biāo)越大,其中,所述元數(shù)據(jù)包括內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合。
第7方法如下面的式(33)所示,是將內(nèi)容分類(lèi)規(guī)則的條件部和結(jié)論部分別作為1個(gè)事件,將條件部產(chǎn)生事件的概率和結(jié)論部產(chǎn)生事件的概率的依賴(lài)性設(shè)為評(píng)價(jià)指標(biāo)的方法。
EI=Count(Condition & Decision)-Count(Condition)×Count(Decision)÷N …(33)此外,如下導(dǎo)出式(33)。
Prob(Condition)=Count(Condition)÷N …(34)Prob(Decision)=Count(Decision)÷N…(35)Prob(Condition & Decision)=Count(Condition & Decision)÷N…(36)此外,Prob(Condition)表示內(nèi)容分類(lèi)規(guī)則的條件部產(chǎn)生事件的概率,Prob(Decision)表示內(nèi)容分類(lèi)規(guī)則的結(jié)論部產(chǎn)生事件的概率,Prob(Condition & Decision)表示內(nèi)容分類(lèi)規(guī)則的條件部的事件和結(jié)論部的事件同時(shí)產(chǎn)生的概率。
根據(jù)式(34)至式(36),利用下面的式(37)求出內(nèi)容分類(lèi)規(guī)則的條件部產(chǎn)生事件的概率和結(jié)論部產(chǎn)生事件的概率的依賴(lài)性R。
R=Prob(Condition & Decision)-Prob(Condition)×Prob(Decision)
=Count(Condition & Decision)÷N-Count(Condition)×Count(Decision)÷N2…(37)并且,內(nèi)容的全部個(gè)數(shù)N是全部?jī)?nèi)容分類(lèi)規(guī)則中共用的值,因此通過(guò)在依賴(lài)性R上乘以?xún)?nèi)容的全部個(gè)數(shù)N,從而導(dǎo)出式(33)。
例如,在規(guī)則Rp3的情況下,從屬于類(lèi)“流行音樂(lè)”、且具有元數(shù)據(jù)[冬天]和元數(shù)據(jù)[舒適]的內(nèi)容的個(gè)數(shù)中,減去具有元數(shù)據(jù)[冬天]和元數(shù)據(jù)[舒適]的內(nèi)容的個(gè)數(shù)×屬于類(lèi)[流行音樂(lè)]的內(nèi)容個(gè)數(shù)÷N的值,成為評(píng)價(jià)指標(biāo)。
在第7方法中,內(nèi)容具有元數(shù)據(jù)的概率、與屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的概率的依賴(lài)性越高,評(píng)價(jià)指標(biāo)越大,其中,所述元數(shù)據(jù)包括內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合。即,內(nèi)容具有元數(shù)據(jù)的事件與屬于內(nèi)容分類(lèi)規(guī)則的類(lèi)的事件的關(guān)聯(lián)越深,評(píng)價(jià)指標(biāo)越大,其中,所述元數(shù)據(jù)包括內(nèi)容分類(lèi)規(guī)則的元數(shù)據(jù)組合。另外,在內(nèi)容分類(lèi)規(guī)則的條件部的事件和結(jié)論部的事件獨(dú)立的情況下,下面的式(38)將成立,因此評(píng)價(jià)指標(biāo)成為最小的0。
Prob(Condition & Decision)=Prob(Condition)×Prob(Decision)…(38)這樣,評(píng)價(jià)指標(biāo)表示在內(nèi)容分類(lèi)規(guī)則的條件部中包含的元數(shù)據(jù)或者其組合出現(xiàn)在屬于結(jié)論部的類(lèi)中的內(nèi)容所具有的元數(shù)據(jù)中的程度。特別是,使用第1、第2、第4至第7方法算出的評(píng)價(jià)指標(biāo),表示在內(nèi)容分類(lèi)規(guī)則的條件部中包含的元數(shù)據(jù)的組合、與屬于結(jié)論部的類(lèi)中的內(nèi)容之間的關(guān)聯(lián)度。即,使用第1、第2、第4至第7的方法算出的評(píng)價(jià)指標(biāo),表示在內(nèi)容分類(lèi)規(guī)則的條件部中包含的元數(shù)據(jù)組合表現(xiàn)出屬于結(jié)論部的類(lèi)的內(nèi)容特征的程度。
此外,下面說(shuō)明在作為算出評(píng)價(jià)指標(biāo)的方法采用了第5方法的情況、即、將評(píng)價(jià)指標(biāo)設(shè)為F值的情況的例子。另外,下面,假設(shè)各內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)EI為下面的值來(lái)進(jìn)行說(shuō)明。
EI(Rp1)=0.429EI(Rp2)=0.240EI(Rp3)=0.167EI(Rp4)=0.333EI(Rp5)=0.167EI(Rp6)=0.167EI(Rp7)=0.167EI(Rp8)=0.167EI(Rp9)=0.167EI(Rp10)=0.167EI(Rb1)=0.267EI(Rb2)=0.267EI(Rb3)=0.267EI(Rb4)=0.333EI(Rb5)=0.143EI(Rb6)=0.267EI(Rb7)=0.143EI(Rb8)=0.143EI(Rb9)=0.143EI(Rb10)=0.143內(nèi)容分類(lèi)規(guī)則生成部291將表示所生成的內(nèi)容分類(lèi)規(guī)則、以及各內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)的信息存儲(chǔ)在客戶(hù)端存儲(chǔ)部223中,并且提供給內(nèi)容自動(dòng)分類(lèi)部292。
在步驟S105中,內(nèi)容自動(dòng)分類(lèi)部292設(shè)定進(jìn)行自動(dòng)分類(lèi)的內(nèi)容。具體地說(shuō),例如在用戶(hù)通過(guò)用戶(hù)輸入部221從存儲(chǔ)在客戶(hù)端存儲(chǔ)部223中的內(nèi)容中,將1個(gè)以上的還沒(méi)有分類(lèi)到各類(lèi)的內(nèi)容(例如,用戶(hù)新購(gòu)買(mǎi)的樂(lè)曲、電影、新錄像的節(jié)目等)選擇為自動(dòng)分類(lèi)對(duì)象的情況下,用戶(hù)輸入部221將表示由用戶(hù)選擇的內(nèi)容的信息提供給內(nèi)容自動(dòng)分類(lèi)部292。內(nèi)容自動(dòng)分類(lèi)部292將由用戶(hù)選擇的內(nèi)容確定為進(jìn)行自動(dòng)分類(lèi)的對(duì)象。
另外,例如將與新到內(nèi)容(例如,新到的電影、節(jié)目、樂(lè)曲等)有關(guān)的元數(shù)據(jù)、或者與通過(guò)某種推薦算法決定的推薦內(nèi)容有關(guān)的元數(shù)據(jù)從服務(wù)器存儲(chǔ)部251發(fā)送到客戶(hù)端存儲(chǔ)部223的情況下,客戶(hù)端存儲(chǔ)部223存儲(chǔ)發(fā)送過(guò)來(lái)的元數(shù)據(jù),并且將表示具有新到或者推薦內(nèi)容的信息提供給內(nèi)容自動(dòng)分類(lèi)部292。內(nèi)容自動(dòng)分類(lèi)部292將這些新到或者推薦內(nèi)容設(shè)定為進(jìn)行自動(dòng)分類(lèi)的對(duì)象。
在步驟S106中,內(nèi)容自動(dòng)分類(lèi)部292將內(nèi)容進(jìn)行自動(dòng)分類(lèi)。具體地說(shuō),內(nèi)容自動(dòng)分類(lèi)部292根據(jù)內(nèi)容分類(lèi)規(guī)則,將在步驟S105中設(shè)定的各內(nèi)容分類(lèi)到各類(lèi),將表示所分類(lèi)的結(jié)果的信息提供給分類(lèi)結(jié)果呈現(xiàn)部293。
例如,內(nèi)容自動(dòng)分類(lèi)部292關(guān)于作為自動(dòng)分類(lèi)對(duì)象的各內(nèi)容,提取該內(nèi)容所具有的元數(shù)據(jù)組合包括條件部的元數(shù)據(jù)組合的內(nèi)容分類(lèi)規(guī)則(下面還表述為適合內(nèi)容的內(nèi)容分類(lèi)規(guī)則)。即,內(nèi)容自動(dòng)分類(lèi)部292關(guān)于作為自動(dòng)分類(lèi)對(duì)象的各內(nèi)容,提取適合該內(nèi)容的內(nèi)容分類(lèi)規(guī)則。內(nèi)容自動(dòng)分類(lèi)部292將所提取的內(nèi)容分類(lèi)規(guī)則按結(jié)論部的每類(lèi)進(jìn)行分類(lèi),統(tǒng)計(jì)其數(shù)量。內(nèi)容自動(dòng)分類(lèi)部292將該內(nèi)容分類(lèi)到適合的內(nèi)容分類(lèi)規(guī)則數(shù)量最大的類(lèi)中。
例如,在關(guān)于具有[BGM][愛(ài)情][夏天][歡快][舒適][懷舊][舞蹈]7個(gè)元數(shù)據(jù)的內(nèi)容X進(jìn)行考慮的情況下,內(nèi)容X適合Rp1、Rp4、Rp7、Rb1、Rb8這5個(gè)內(nèi)容分類(lèi)規(guī)則。而且,將適合的內(nèi)容分類(lèi)規(guī)則的數(shù)量按結(jié)論部的每類(lèi)進(jìn)行統(tǒng)計(jì)時(shí),結(jié)論部為“流行音樂(lè)”的內(nèi)容分類(lèi)規(guī)則的數(shù)量為3,結(jié)論部為“民歌”的內(nèi)容分類(lèi)規(guī)則的數(shù)量為2。
因而,這種情況下,結(jié)論部為“流行音樂(lè)”的內(nèi)容分類(lèi)規(guī)則的數(shù)量最大,因此內(nèi)容X被分類(lèi)到類(lèi)“流行音樂(lè)”中。
另外,例如關(guān)于作為自動(dòng)分類(lèi)對(duì)象的各內(nèi)容,也可以將該內(nèi)容分類(lèi)到適合的內(nèi)容分類(lèi)規(guī)則之中評(píng)價(jià)指標(biāo)最大的內(nèi)容分類(lèi)規(guī)則的類(lèi)中。
例如,在上述內(nèi)容X的情況下,內(nèi)容X適合的各內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)如下。
EI(Rp1)=0.429EI(Rp4)=0.333EI(Rp7)=0.167EI(Rb1)=0.267EI(Rb8)=0.143因而,這種情況下內(nèi)容X被分類(lèi)到評(píng)價(jià)指標(biāo)最大的0.429的內(nèi)容分類(lèi)規(guī)則Rp1的結(jié)論部的類(lèi)“流行音樂(lè)”中。
而且,例如關(guān)于作為自動(dòng)分類(lèi)對(duì)象的各內(nèi)容,也可以將適合的內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)按結(jié)論部的每類(lèi)進(jìn)行統(tǒng)計(jì),將該內(nèi)容分類(lèi)到評(píng)價(jià)指標(biāo)的合計(jì)值最大的類(lèi)中。
例如,在上述內(nèi)容X的情況下,當(dāng)將內(nèi)容X適合的各內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)按結(jié)論部的每類(lèi)進(jìn)行統(tǒng)計(jì)時(shí),如下所示。
∑EI(Rp)=EI(Rp1)+EI(Rp4)+EI(Rp7)=0.929 …(39)∑EI(Rb)=EI(Rb1)+EI(Rb8)=0.410 …(40)此外,∑EI(Rp)表示內(nèi)容X適合的內(nèi)容分類(lèi)規(guī)則之中結(jié)論部是類(lèi)“流行音樂(lè)”的內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)的合計(jì)值,∑EI(Rb)表示內(nèi)容X適合的內(nèi)容分類(lèi)規(guī)則中結(jié)論部是類(lèi)“民歌”的內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)的合計(jì)值。
因而,這種情況下,內(nèi)容X被分類(lèi)到評(píng)價(jià)指標(biāo)的合計(jì)值最大的類(lèi)“流行音樂(lè)”中。
另外,例如關(guān)于作為自動(dòng)分類(lèi)對(duì)象的各內(nèi)容,也可以分類(lèi)到適合的內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)的平均值最大的類(lèi)中。
例如,在上述內(nèi)容X的情況下,內(nèi)容X適合的內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)的、結(jié)論部的每類(lèi)的平均值如下。
EIav(Rp)=∑EI(Rp)÷3=0.929÷3=0.309… …(41)EIav(Rb)=∑EI(Rb)÷2=0.410÷2=0.205 …(42)此外,EIav(Rp)表示內(nèi)容X適合的內(nèi)容分類(lèi)規(guī)則之中結(jié)論部是類(lèi)“流行音樂(lè)”的內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)的平均值,EIav(Rp)表示內(nèi)容X適合的內(nèi)容分類(lèi)規(guī)則之中結(jié)論部是類(lèi)“民歌”的內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)的平均值。
因而,這種情況下,內(nèi)容X被分類(lèi)到評(píng)價(jià)指標(biāo)的平均值最大的類(lèi)“流行音樂(lè)”中。
此外,也可以不將各內(nèi)容分別只分類(lèi)到1個(gè)類(lèi),而將各內(nèi)容分類(lèi)到1個(gè)以上的類(lèi),并且設(shè)定表示該內(nèi)容適合該類(lèi)的程度的適合度。
例如,關(guān)于作為自動(dòng)分類(lèi)對(duì)象的各內(nèi)容,也可以將內(nèi)容分類(lèi)到在適合的內(nèi)容分類(lèi)規(guī)則的結(jié)論部中包含的全部類(lèi)中,或?qū)⒃搩?nèi)容分類(lèi)到評(píng)價(jià)指標(biāo)的合計(jì)值、評(píng)價(jià)指標(biāo)的平均值、類(lèi)內(nèi)的評(píng)價(jià)指標(biāo)的最大值等在規(guī)定閾值以上的全部類(lèi)中。而且,例如關(guān)于內(nèi)容所分類(lèi)到的各類(lèi),也可以將適合的內(nèi)容分類(lèi)規(guī)則之中結(jié)論部是該類(lèi)的內(nèi)容分類(lèi)規(guī)則的數(shù)量、或者適合的內(nèi)容分類(lèi)規(guī)則之中結(jié)論部是該類(lèi)的內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)的合計(jì)值、平均值、或最大值等,設(shè)定為適合度。
例如,在上述內(nèi)容X的情況下,也可以將內(nèi)容X分類(lèi)到在適合的內(nèi)容分類(lèi)規(guī)則的結(jié)論部中包含的“流行音樂(lè)”和“民歌”兩個(gè)類(lèi)中,并且將作為類(lèi)“流行音樂(lè)”的評(píng)價(jià)指標(biāo)的合計(jì)值的0.929設(shè)定為內(nèi)容X對(duì)類(lèi)“流行音樂(lè)”的適合度,將作為類(lèi)“民歌”的評(píng)價(jià)指標(biāo)的合計(jì)值的0.410設(shè)定為內(nèi)容X對(duì)類(lèi)“民歌”的適合度。
在步驟S107中,分類(lèi)結(jié)果呈現(xiàn)部293呈現(xiàn)自動(dòng)分類(lèi)的結(jié)果。具體地說(shuō),分類(lèi)結(jié)果呈現(xiàn)部293控制客戶(hù)端輸出部224,將在步驟S106中對(duì)內(nèi)容進(jìn)行自動(dòng)分類(lèi)的結(jié)果呈現(xiàn)給用戶(hù)。
例如,分類(lèi)結(jié)果呈現(xiàn)部293控制客戶(hù)端輸出部224,顯示下面的信息。
內(nèi)容X“流行音樂(lè)”關(guān)鍵字BGM,愛(ài)情,歡快,舒適由此,用戶(hù)能夠知道根據(jù)元數(shù)據(jù)(當(dāng)前的情況下,作為關(guān)鍵字呈現(xiàn)給用戶(hù))[BGM][愛(ài)情][歡快][舒適],將內(nèi)容X分類(lèi)到組“流行音樂(lè)”中。
此外,例如也可以在將內(nèi)容X實(shí)際進(jìn)行分類(lèi)之前,將該信息呈現(xiàn)給用戶(hù),向用戶(hù)推薦將內(nèi)容X分類(lèi)到組“流行音樂(lè)”中。
另外,也可以根據(jù)在各內(nèi)容所具有的元數(shù)據(jù)組合之中與內(nèi)容分類(lèi)規(guī)則的條件部一致的元數(shù)據(jù)組合中包含的元數(shù)據(jù)、以及與條件部一致的內(nèi)容分類(lèi)規(guī)則的結(jié)論部的類(lèi),將內(nèi)容特征呈現(xiàn)給用戶(hù)。例如,也可以根據(jù)內(nèi)容所分類(lèi)的類(lèi)名、在內(nèi)容分類(lèi)中使用的元數(shù)據(jù),將內(nèi)容的特征呈現(xiàn)給用戶(hù)。
例如,在上述內(nèi)容X的情況下,分類(lèi)結(jié)果呈現(xiàn)部293控制客戶(hù)端輸出部224,作為內(nèi)容X的特征顯示下面的信息。
內(nèi)容XBGM風(fēng)格的“流行音樂(lè)”、有懷舊感的夏天的“民歌”這樣,用戶(hù)能夠容易且具體地知道內(nèi)容X的特征。此外,該示例表示設(shè)定適合度、將內(nèi)容分類(lèi)到1個(gè)以上的類(lèi)中的情況的例子。
在步驟S108中,內(nèi)容自動(dòng)分類(lèi)部292判斷是否改變自動(dòng)分類(lèi)的內(nèi)容。例如,在用戶(hù)想對(duì)其他內(nèi)容進(jìn)行自動(dòng)分類(lèi)、通過(guò)用戶(hù)輸入部221輸入了指示改變進(jìn)行自動(dòng)分類(lèi)的內(nèi)容的信息的情況下,用戶(hù)輸入部221將所獲取的信息提供給內(nèi)容自動(dòng)分類(lèi)部292。內(nèi)容自動(dòng)分類(lèi)部292在獲取到指示改變自動(dòng)分類(lèi)的內(nèi)容的信息的情況下,判斷為改變自動(dòng)分類(lèi)的內(nèi)容,處理返回步驟S105。之后重復(fù)執(zhí)行步驟S105至S108的處理,對(duì)用戶(hù)指定的內(nèi)容進(jìn)行自動(dòng)分類(lèi),直到在步驟S108中判斷為不改變自動(dòng)分類(lèi)的內(nèi)容為止。
在步驟S108中,在判斷為不改變自動(dòng)分類(lèi)的內(nèi)容的情況下,處理進(jìn)入步驟S109。
在步驟S109中,內(nèi)容分類(lèi)部281與上述圖4的步驟S6的處理相同地,判斷是否改變將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)。在判斷為改變將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的情況下,處理返回步驟S101,之后重復(fù)執(zhí)行步驟S101至S109的處理,直到在步驟S109中判斷為不改變將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)為止。即,根據(jù)新觀點(diǎn)(例如,愛(ài)好的觀點(diǎn)),將內(nèi)容進(jìn)行自動(dòng)分類(lèi)。
在步驟S109中,在判斷為不改變將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的情況下,結(jié)束內(nèi)容分類(lèi)處理。
這樣,根據(jù)不依賴(lài)于元數(shù)據(jù)的用戶(hù)觀點(diǎn),例如根據(jù)上述愛(ài)好、文件夾等觀點(diǎn),用戶(hù)不設(shè)定用于將內(nèi)容進(jìn)行分類(lèi)的元數(shù)據(jù)條件,就能夠?qū)⒏鲀?nèi)容自動(dòng)地進(jìn)行分類(lèi)。
下面,參照?qǐng)D16的流程圖說(shuō)明由信息處理系統(tǒng)201執(zhí)行的內(nèi)容分類(lèi)處理的第2實(shí)施方式。此外,例如用戶(hù)通過(guò)用戶(hù)輸入部221輸入了指示開(kāi)始內(nèi)容分類(lèi)處理的情況下,開(kāi)始該處理。
在步驟S151中,內(nèi)容分類(lèi)部281選擇生成內(nèi)容分類(lèi)規(guī)則的觀點(diǎn)。具體地說(shuō),內(nèi)容分類(lèi)部281從還沒(méi)有生成內(nèi)容分類(lèi)規(guī)則的觀點(diǎn)中選擇1個(gè)。例如在上述圖14所示的例子的情況下,從用戶(hù)的愛(ài)好以及保存有內(nèi)容的文件夾這兩個(gè)觀點(diǎn)之中選擇1個(gè)還沒(méi)有生成內(nèi)容分類(lèi)規(guī)則的觀點(diǎn)。
在步驟S152中,內(nèi)容分類(lèi)部281通過(guò)與上述圖13的步驟S101相同的處理,根據(jù)在步驟S151中選擇的觀點(diǎn),將內(nèi)容分類(lèi)到多個(gè)類(lèi)中,將與分類(lèi)后的內(nèi)容的類(lèi)有關(guān)的信息提供給元數(shù)據(jù)提取部282。
步驟S153至步驟S155的處理與上述圖13的步驟S102至S104的處理相同,由于其說(shuō)明重復(fù)因此省略,但是如上所述,通過(guò)這些處理生成對(duì)在步驟S151中選擇的觀點(diǎn)的內(nèi)容分類(lèi)規(guī)則,并且算出對(duì)各內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)。
在步驟S156中,內(nèi)容分類(lèi)部281判斷是否關(guān)于全部觀點(diǎn)生成了內(nèi)容分類(lèi)規(guī)則。在判斷為沒(méi)有關(guān)于全部觀點(diǎn)生成內(nèi)容分類(lèi)規(guī)則的情況下,處理返回步驟S151,重復(fù)執(zhí)行步驟S151至S156的處理,直到在步驟S156中判斷為關(guān)于全部觀點(diǎn)生成了內(nèi)容分類(lèi)規(guī)則為止。即,關(guān)于全部的觀點(diǎn)生成內(nèi)容分類(lèi)規(guī)則,并且算出對(duì)各內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)。
在步驟S156中,在判斷為關(guān)于全部觀點(diǎn)生成了內(nèi)容分類(lèi)規(guī)則的情況下,處理進(jìn)入步驟S157。
在步驟S157中,與上述圖13的步驟S105的處理相同地,設(shè)定自動(dòng)分類(lèi)的內(nèi)容。
在步驟S158中,內(nèi)容自動(dòng)分類(lèi)部292將內(nèi)容進(jìn)行自動(dòng)分類(lèi)。具體地說(shuō),例如,首先關(guān)于作為自動(dòng)分類(lèi)對(duì)象的各內(nèi)容,內(nèi)容自動(dòng)分類(lèi)部292從全部的內(nèi)容分類(lèi)規(guī)則中提取適合該內(nèi)容的內(nèi)容分類(lèi)規(guī)則。內(nèi)容自動(dòng)分類(lèi)部292對(duì)結(jié)論部的每類(lèi)統(tǒng)計(jì)所提取的內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)。
接著,內(nèi)容自動(dòng)分類(lèi)部292按各觀點(diǎn)算出評(píng)價(jià)指標(biāo)的合計(jì)值最大的類(lèi)和評(píng)價(jià)指標(biāo)的合計(jì)值第2大的類(lèi)之間的評(píng)價(jià)指標(biāo)之差,選擇算出的差最大的觀點(diǎn)、即該內(nèi)容的特征最顯著表現(xiàn)的觀點(diǎn)。內(nèi)容自動(dòng)分類(lèi)部292將該內(nèi)容分類(lèi)到所選擇的觀點(diǎn)中的類(lèi)之中評(píng)價(jià)指標(biāo)合計(jì)值最大的類(lèi)中。
另外,例如關(guān)于作為自動(dòng)分類(lèi)對(duì)象的各內(nèi)容,也可以與觀點(diǎn)無(wú)關(guān)地,將該內(nèi)容分類(lèi)到適合的內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)的合計(jì)值、平均值、或者最大值最大的類(lèi)中。
并且,例如關(guān)于作為自動(dòng)分類(lèi)對(duì)象的各內(nèi)容,也可以將該內(nèi)容分類(lèi)到適合的內(nèi)容分類(lèi)規(guī)則的評(píng)價(jià)指標(biāo)的合計(jì)值、平均值、或者類(lèi)中的評(píng)價(jià)指標(biāo)的最大值在規(guī)定閾值以上的全部類(lèi)中,并且設(shè)定上述適合度。在這種情況下,有時(shí)將1個(gè)內(nèi)容分類(lèi)為屬于1個(gè)觀點(diǎn)內(nèi)的多個(gè)類(lèi),或?qū)儆诙鄠€(gè)觀點(diǎn)的類(lèi)。
內(nèi)容自動(dòng)分類(lèi)部292將表示把各內(nèi)容進(jìn)行分類(lèi)的結(jié)果的信息提供給分類(lèi)結(jié)果呈現(xiàn)部293。
在步驟S159中,與上述圖13的步驟S108的處理相同地,將自動(dòng)分類(lèi)的結(jié)果呈現(xiàn)給用戶(hù)。
在步驟S160中,與上述圖13的步驟S109的處理相同地,判斷是否改變自動(dòng)分類(lèi)的內(nèi)容。在判斷為改變自動(dòng)分類(lèi)的內(nèi)容的情況下,處理返回步驟S157,重復(fù)執(zhí)行步驟S157至S160,直到在步驟S160中判斷為不改變自動(dòng)分類(lèi)的內(nèi)容為止。
在步驟S160中,在判斷為不改變對(duì)內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)的情況下,結(jié)束內(nèi)容分類(lèi)處理。
這樣,可一次根據(jù)多個(gè)觀點(diǎn)將內(nèi)容進(jìn)行自動(dòng)分類(lèi)。
以上,在作為對(duì)與表示各要素特征的數(shù)據(jù)分別相關(guān)聯(lián)的多個(gè)要素進(jìn)行分類(lèi)后的類(lèi)的特征,在通過(guò)關(guān)于屬于作為提取特征對(duì)象的類(lèi)的各個(gè)要素取出與要素相關(guān)聯(lián)的1個(gè)以上的數(shù)據(jù)而求出的數(shù)據(jù)的全部組合之中,提取通過(guò)關(guān)于屬于其他類(lèi)的各個(gè)要素取出與要素相關(guān)聯(lián)的1個(gè)以上的數(shù)據(jù)而求出的數(shù)據(jù)的組合中不存在的數(shù)據(jù)組合的情況下,能夠提取將多個(gè)要素進(jìn)行分類(lèi)后的類(lèi)的特征。另外,能夠簡(jiǎn)單且正確地提取對(duì)多個(gè)要素進(jìn)行分類(lèi)后的類(lèi)的特征。
此外,在以上的說(shuō)明中,示出了將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)為1個(gè)的例子,但是當(dāng)然也可以組合2個(gè)以上的觀點(diǎn)。例如,如果使用圖5所示的例子,則將用戶(hù)愛(ài)好的觀點(diǎn)和播放列表選擇曲目的觀點(diǎn)進(jìn)行組合,例如能夠容易地提取表示用戶(hù)喜歡且沒(méi)有被選擇在播放列表中的內(nèi)容所屬的類(lèi)的特征的元數(shù)據(jù)組合。
另外,作為組合多個(gè)觀點(diǎn)的例子,能夠?qū)⒐芾韮?nèi)容的多層結(jié)構(gòu)的目錄、書(shū)簽用于將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn)。通過(guò)使用該分類(lèi)的觀點(diǎn),例如能夠提取表示用戶(hù)所進(jìn)行的內(nèi)容分類(lèi)(目錄或者書(shū)簽等)的粒度、詳細(xì)度的特征的元數(shù)據(jù)組合。
而且,例如也可以提取表示將內(nèi)容所屬的目錄以及用戶(hù)愛(ài)好的兩個(gè)觀點(diǎn)相組合而進(jìn)行分類(lèi)后的類(lèi)的特征的元數(shù)據(jù)組合。
此外,即使增加將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn),也不影響將內(nèi)容分類(lèi)到多個(gè)類(lèi)之后的處理,因此,能夠原樣應(yīng)用上面參照?qǐng)D4、圖7、圖10、圖13、或者圖16所述的本發(fā)明的算法。另外,通過(guò)組合多個(gè)將內(nèi)容進(jìn)行分類(lèi)的觀點(diǎn),能夠提取更精致地表示用戶(hù)愛(ài)好等的元數(shù)據(jù)組合。
另外,例如,在元數(shù)據(jù)的種類(lèi)少的情況下、或者由處理能力高的計(jì)算機(jī)等進(jìn)行處理的情況下,也可以不進(jìn)行按類(lèi)重要元數(shù)據(jù)的提取。在使用全部元數(shù)據(jù)提取元數(shù)據(jù)組合的情況下,提取更正確地表示類(lèi)特征的元數(shù)據(jù)組合的可能性變高。
并且,在以上的說(shuō)明中,示出了提取與內(nèi)容相關(guān)聯(lián)的元數(shù)據(jù)組合的例子,但是,本發(fā)明能夠應(yīng)用于例如根據(jù)與屬于各類(lèi)的學(xué)生有關(guān)的數(shù)據(jù)(例如,成績(jī)、身高、體重等)提取某學(xué)校的類(lèi)的特征,或根據(jù)與各制造商所制造的商品有關(guān)的數(shù)據(jù)(例如價(jià)格、功能、形狀、顏色等)提取制造相同產(chǎn)品的多個(gè)制造商的特征的情況等、將與表示各要素特征的數(shù)據(jù)相關(guān)聯(lián)的多個(gè)要素分類(lèi)到多個(gè)類(lèi)并根據(jù)各要素所具有的數(shù)據(jù)來(lái)提取各類(lèi)的特征的情況。
此外,本發(fā)明能夠應(yīng)用于例如向用戶(hù)推薦內(nèi)容、商品等、或者提取內(nèi)容、商品等被分類(lèi)到的類(lèi)的特征的裝置、系統(tǒng)(例如,推薦系統(tǒng)、個(gè)人計(jì)算機(jī)、便攜式電話、PDA(Personal Digital Assistant個(gè)人數(shù)字助理)、各種AV(Audio Visual視聽(tīng))設(shè)備等)、或者軟件等。
例如,通過(guò)在具有學(xué)習(xí)用戶(hù)視聽(tīng)履歷的TV節(jié)目推薦功能的裝置中應(yīng)用本發(fā)明,能夠例如像根據(jù)提取的人才(talent)A和雜耍(variety)節(jié)目的元數(shù)據(jù)組合,推薦用戶(hù)喜歡的人才A出演的雜耍節(jié)目,而不推薦用戶(hù)討厭的人才A出演的歌曲節(jié)目那樣,根據(jù)用戶(hù)的精致愛(ài)好模式,向用戶(hù)推薦節(jié)目,并且能夠呈現(xiàn)其推薦理由,能夠提高用戶(hù)對(duì)推薦節(jié)目的接受度。
另外,例如通過(guò)在由與音樂(lè)播放器協(xié)作的個(gè)人計(jì)算機(jī)執(zhí)行的樂(lè)曲文件閱覽以及編輯軟件中應(yīng)用本發(fā)明,響應(yīng)于播放列表的制作、閱覽等操作,能夠?qū)⒈硎静シ帕斜硖卣鞯脑獢?shù)據(jù)組合呈現(xiàn)給用戶(hù),能夠舒適地進(jìn)行閱覽、或編輯文件的作業(yè),并且提供進(jìn)行該作業(yè)的樂(lè)趣。
另外,本發(fā)明例如能夠應(yīng)用于將各種內(nèi)容進(jìn)行分類(lèi)管理的裝置、系統(tǒng)、或者軟件等。例如,通過(guò)將本發(fā)明的第2實(shí)施方式應(yīng)用在電子郵件的軟件中,能夠不像以往那樣將郵件的發(fā)件人、郵件名、頭信息等設(shè)定為分類(lèi)的條件,而根據(jù)郵件內(nèi)容自動(dòng)地將郵件進(jìn)行分類(lèi)。
上述一系列處理既可以由硬件執(zhí)行,也可以由軟件執(zhí)行。在由軟件執(zhí)行一系列處理的情況下,從程序記錄介質(zhì)將構(gòu)成該軟件的程序安裝到專(zhuān)用硬件中安裝的計(jì)算機(jī)中、或者通過(guò)安裝各種程序可執(zhí)行各種功能的例如通用的個(gè)人計(jì)算機(jī)等中。
圖17是表示通過(guò)程序執(zhí)行上述一系列處理的個(gè)人計(jì)算機(jī)的結(jié)構(gòu)例的框圖。CPU(Central Proce ssing Unit中央處理單元)901,根據(jù)存儲(chǔ)在ROM(Read Only Memory只讀存儲(chǔ)器)902、或者存儲(chǔ)部908中的程序,執(zhí)行各種處理。在RAM(Random Access Memory隨機(jī)存取存儲(chǔ)器)903中適當(dāng)存儲(chǔ)有CPU901執(zhí)行的程序、數(shù)據(jù)等。這些CPU901、ROM902、以及RAM903通過(guò)總線904相互連接。
在CPU901上還通過(guò)總線904連接有輸入輸出接口905。在輸入輸出接口905上連接有由鍵盤(pán)、鼠標(biāo)、麥克風(fēng)等構(gòu)成的輸入部906、由顯示器、揚(yáng)聲器等構(gòu)成的輸出部907。CPU901對(duì)應(yīng)于從輸入部906輸入的指令,執(zhí)行各種處理。并且,CPU901將處理結(jié)果輸出到輸出部907。
連接在輸入輸出接口905上的存儲(chǔ)部908例如由硬盤(pán)構(gòu)成,存儲(chǔ)CPU901所執(zhí)行的程序、各種數(shù)據(jù)。通信部909通過(guò)因特網(wǎng)、局域網(wǎng)絡(luò)等網(wǎng)絡(luò)與外部裝置進(jìn)行通信。
另外,也可以通過(guò)通信部909獲取程序,存儲(chǔ)到存儲(chǔ)部908中。
連接在輸入輸出接口905上的驅(qū)動(dòng)器910,當(dāng)安裝有磁盤(pán)、光盤(pán)、磁光盤(pán)、或者半導(dǎo)體存儲(chǔ)器等可移動(dòng)介質(zhì)911時(shí)驅(qū)動(dòng)它們,獲取記錄在那里的程序、數(shù)據(jù)等。將獲取的程序、數(shù)據(jù)根據(jù)需要傳送、存儲(chǔ)到存儲(chǔ)部908。
安裝在計(jì)算機(jī)中、并由保存設(shè)成計(jì)算機(jī)可執(zhí)行狀態(tài)的程序的程序記錄介質(zhì),如圖17所示,由可移動(dòng)介質(zhì)911、或者臨時(shí)或永久保存程序的ROM902、構(gòu)成存儲(chǔ)部908的硬盤(pán)等構(gòu)成,其中移動(dòng)介質(zhì)911是由磁盤(pán)(包含軟盤(pán))、光盤(pán)(包含CD-ROM(CompactDisk-Read Only Memory光盤(pán)只讀存儲(chǔ)器)、DVD(Digital VersatileDisk數(shù)字多功能光盤(pán)))、磁光盤(pán)、或者半導(dǎo)體存儲(chǔ)器等構(gòu)成的封裝介質(zhì)。根據(jù)需要通過(guò)作為路由器、調(diào)制解調(diào)器等的接口的通信部909,利用局域網(wǎng)、因特網(wǎng)、數(shù)字衛(wèi)星廣播之類(lèi)的有線或者無(wú)線的通信介質(zhì),在程序記錄介質(zhì)中保存程序。
此外,在本說(shuō)明書(shū)中,對(duì)保存在存儲(chǔ)介質(zhì)中的程序進(jìn)行記述的步驟,不僅包含按記載的順序按時(shí)間序列進(jìn)行的處理,而且包含未必按時(shí)間序列進(jìn)行處理、而并行或者單獨(dú)執(zhí)行的處理。
另外,在本說(shuō)明書(shū)中,系統(tǒng)表示由多個(gè)裝置構(gòu)成的裝置整體。
并且,本發(fā)明的實(shí)施方式并不限于上述實(shí)施方式,在不脫離本發(fā)明精神的范圍內(nèi),可以進(jìn)行各種變更。
權(quán)利要求
1.一種信息處理裝置,包括特征提取單元,作為將與表示各要素的特征的數(shù)據(jù)分別相關(guān)聯(lián)的多個(gè)上述要素進(jìn)行分類(lèi)后的類(lèi)的特征,該特征提取單元在通過(guò)關(guān)于屬于成為提取特征的對(duì)象的上述類(lèi)的各個(gè)上述要素取出與上述要素相關(guān)聯(lián)的1個(gè)以上的上述數(shù)據(jù)而求出的上述數(shù)據(jù)的全部組合之中,提取在通過(guò)關(guān)于屬于其他上述類(lèi)的各個(gè)上述要素取出與上述要素相關(guān)聯(lián)的1個(gè)以上的上述數(shù)據(jù)而求出的上述數(shù)據(jù)的組合中不存在的上述數(shù)據(jù)的組合。
2.根據(jù)權(quán)利要求1所述的信息處理裝置,其特征在于,還包括特征呈現(xiàn)控制單元,該特征呈現(xiàn)控制單元控制上述類(lèi)的特征的呈現(xiàn),使得將所提取的上述數(shù)據(jù)的組合中的1個(gè)以上的組合作為上述類(lèi)的特征呈現(xiàn)給用戶(hù)。
3.根據(jù)權(quán)利要求1所述的信息處理裝置,其特征在于,還包括數(shù)據(jù)提取單元,該數(shù)據(jù)提取單元根據(jù)屬于上述類(lèi)的上述要素和上述數(shù)據(jù)之間的第1關(guān)聯(lián)度、以及屬于其他上述類(lèi)的上述要素和上述數(shù)據(jù)之間的第2關(guān)聯(lián)度與上述第1關(guān)聯(lián)度之間的差異,在提取上述數(shù)據(jù)的組合之前,提取更明確地表示屬于上述類(lèi)的上述要素的特征的上述數(shù)據(jù),上述特征提取單元提取由上述數(shù)據(jù)提取單元所提取的上述數(shù)據(jù)的組合。
4.根據(jù)權(quán)利要求3所述的信息處理裝置,其特征在于,上述數(shù)據(jù)提取單元根據(jù)上述第1關(guān)聯(lián)度、以及上述第2關(guān)聯(lián)度與上述第1關(guān)聯(lián)度之間的差異,求出上述類(lèi)中的上述數(shù)據(jù)的權(quán)重,提取上述權(quán)重的值是上位的規(guī)定數(shù)量的上述數(shù)據(jù)、或者上述權(quán)重的值是規(guī)定閾值以上的上述數(shù)據(jù)。
5.根據(jù)權(quán)利要求4所述的信息處理裝置,其特征在于,上述數(shù)據(jù)提取單元將tfidf(term frequency with inversedocument frequency單詞頻率/逆文檔頻率)、相互信息量、信息增益比、x平方值、或者對(duì)數(shù)似然比中的任意一個(gè)作為上述類(lèi)中的上述數(shù)據(jù)的權(quán)重而求出。
6.根據(jù)權(quán)利要求1所述的信息處理裝置,其特征在于,還包括要素提取單元,該要素提取單元根據(jù)所提取的上述數(shù)據(jù)的組合,從屬于與由上述要素構(gòu)成的第1組不同的第2組的要素中,提取與屬于被提取了上述數(shù)據(jù)的組合的上述類(lèi)的上述要素有關(guān)聯(lián)的要素。
7.根據(jù)權(quán)利要求6所述的信息處理裝置,其特征在于,上述要素提取單元提取與包含所提取的上述數(shù)據(jù)的組合的上述數(shù)據(jù)相關(guān)聯(lián)的屬于上述第2組的上述要素。
8.根據(jù)權(quán)利要求6所述的信息處理裝置,其特征在于,還包括要素呈現(xiàn)控制單元,該要素呈現(xiàn)控制單元控制向用戶(hù)呈現(xiàn)所提取的上述要素。
9.根據(jù)權(quán)利要求8所述的信息處理裝置,其特征在于,上述要素呈現(xiàn)控制單元進(jìn)行控制,使得作為提取上述要素的依據(jù),進(jìn)一步呈現(xiàn)上述要素的提取中所使用的上述數(shù)據(jù)的組合。
10.根據(jù)權(quán)利要求1所述的信息處理裝置,其特征在于,上述要素是內(nèi)容,上述數(shù)據(jù)是與上述內(nèi)容有關(guān)的元數(shù)據(jù)。
11.根據(jù)權(quán)利要求1所述的信息處理裝置,其特征在于,還包括評(píng)價(jià)指標(biāo)算出單元,該評(píng)價(jià)指標(biāo)算出單元算出評(píng)價(jià)指標(biāo),該評(píng)價(jià)指標(biāo)表示所提取的上述數(shù)據(jù)的組合和屬于提取對(duì)象類(lèi)的上述要素之間的關(guān)聯(lián)度,其中,該提取對(duì)象類(lèi)是被提取了上述數(shù)據(jù)的組合的上述類(lèi)。
12.根據(jù)權(quán)利要求11所述的信息處理裝置,其特征在于,上述評(píng)價(jià)指標(biāo)算出單元作為上述評(píng)價(jià)指標(biāo)算出F值,該F值是屬于上述提取對(duì)象類(lèi)的上述要素之中與包括上述數(shù)據(jù)的組合的上述數(shù)據(jù)相關(guān)聯(lián)的上述要素所占的比例即再現(xiàn)率、以及與包括上述數(shù)據(jù)的組合的上述數(shù)據(jù)相關(guān)聯(lián)的上述要素之中屬于上述提取對(duì)象類(lèi)的上述要素所占的比例即適合率的調(diào)和平均。
13.根據(jù)權(quán)利要求11所述的信息處理裝置,其特征在于,還包括類(lèi)分類(lèi)單元,該類(lèi)分類(lèi)單元根據(jù)對(duì)與成為分類(lèi)對(duì)象的要素相關(guān)聯(lián)的上述數(shù)據(jù)的組合的上述評(píng)價(jià)指標(biāo),將成為上述分類(lèi)對(duì)象的要素分類(lèi)到上述類(lèi)。
14.根據(jù)權(quán)利要求1所述的信息處理裝置,其特征在于,還包括類(lèi)分類(lèi)單元,該類(lèi)分類(lèi)單元根據(jù)與成為分類(lèi)對(duì)象的要素相關(guān)聯(lián)的上述數(shù)據(jù)的組合之中與從各個(gè)上述類(lèi)中提取的上述數(shù)據(jù)的組合一致的數(shù)量,將成為上述分類(lèi)對(duì)象的要素分類(lèi)到上述類(lèi)。
15.根據(jù)權(quán)利要求1所述的信息處理裝置,其特征在于,還包括特征呈現(xiàn)單元,該特征呈現(xiàn)單元根據(jù)與成為呈現(xiàn)特征的對(duì)象的要素相關(guān)聯(lián)的上述數(shù)據(jù)的組合之中與從各個(gè)上述類(lèi)中提取的上述數(shù)據(jù)的組合一致的上述數(shù)據(jù)的組合中所包含的上述數(shù)據(jù)、以及提取了一致的上述數(shù)據(jù)的組合的上述類(lèi),呈現(xiàn)成為呈現(xiàn)上述特征的對(duì)象的要素的特征。
16.一種特征提取方法,包括如下步驟作為將與表示各要素的特征的數(shù)據(jù)分別相關(guān)聯(lián)的多個(gè)上述要素進(jìn)行分類(lèi)后的類(lèi)的特征,在通過(guò)關(guān)于屬于成為提取特征的對(duì)象的上述類(lèi)的各個(gè)上述要素取出與上述要素相關(guān)聯(lián)的1個(gè)以上的上述數(shù)據(jù)而求出的上述數(shù)據(jù)的全部組合之中,提取在通過(guò)關(guān)于屬于其他上述類(lèi)的各個(gè)上述要素取出與上述要素相關(guān)聯(lián)的1個(gè)以上的上述數(shù)據(jù)而求出的上述數(shù)據(jù)的組合中不存在的上述數(shù)據(jù)的組合。
17.一種程序,使計(jì)算機(jī)執(zhí)行如下步驟作為將與表示各要素的特征的數(shù)據(jù)分別相關(guān)聯(lián)的多個(gè)上述要素進(jìn)行分類(lèi)后的類(lèi)的特征,在通過(guò)關(guān)于屬于成為提取特征的對(duì)象的上述類(lèi)的各個(gè)上述要素取出與上述要素相關(guān)聯(lián)的1個(gè)以上的上述數(shù)據(jù)而求出的上述數(shù)據(jù)的全部組合之中,提取在通過(guò)關(guān)于屬于其他上述類(lèi)的各個(gè)上述要素取出與上述要素相關(guān)聯(lián)的1個(gè)以上的上述數(shù)據(jù)而求出的上述數(shù)據(jù)的組合中不存在的上述數(shù)據(jù)的組合。
18.一種記錄介質(zhì),記錄有權(quán)利要求17所述的程序。
全文摘要
本發(fā)明涉及一種能夠簡(jiǎn)單且正確地提取將多個(gè)要素進(jìn)行分類(lèi)后的類(lèi)的特征的信息處理裝置、特征提取方法、記錄介質(zhì)以及程序。組合提取部83,作為內(nèi)容分類(lèi)部81根據(jù)用戶(hù)的指令將多個(gè)內(nèi)容進(jìn)行分類(lèi)后的類(lèi)的特征,從屬于成為提取特征對(duì)象的特征提取對(duì)象類(lèi)的每個(gè)內(nèi)容的元數(shù)據(jù)的全部組合中,提取屬于其他類(lèi)的每個(gè)內(nèi)容的元數(shù)據(jù)的組合中不存在的元數(shù)據(jù)的組合。本發(fā)明能夠應(yīng)用在推薦系統(tǒng)中。
文檔編號(hào)G06F17/30GK101031919SQ20068000090
公開(kāi)日2007年9月5日 申請(qǐng)日期2006年7月24日 優(yōu)先權(quán)日2005年7月26日
發(fā)明者宮嵜充弘 申請(qǐng)人:索尼株式會(huì)社
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
舟曲县| 三门县| 马鞍山市| 隆回县| 重庆市| 济源市| 应城市| 乌什县| 巨鹿县| 诸暨市| 马山县| 兴宁市| 杭锦旗| 保亭| 海原县| 卫辉市| 宣武区| 堆龙德庆县| 怀安县| 眉山市| 太仆寺旗| 昌都县| 嵊泗县| 巢湖市| 蒙山县| 万宁市| 昌乐县| 全州县| 平泉县| 班玛县| 通海县| 南昌县| 大港区| 高青县| 泗水县| 安宁市| 正宁县| 陵水| 商城县| 南昌市| 南和县|