專利名稱:推薦信息生成裝置和推薦信息生成方法
技術(shù)領(lǐng)域:
本發(fā)明涉及生成推薦信息的推薦信息生成裝置和推薦信息生成方法。
背景技術(shù):
考慮如下的強(qiáng)調(diào)過(guò)濾方式根據(jù)用戶歷史與其他用戶的歷史的比較,求出類似用 戶,推薦類似用戶經(jīng)常查看的內(nèi)容。例如,在下述專利文獻(xiàn)1(日本特開2002-215665號(hào)公 報(bào))中記載有如下內(nèi)容選定具有與對(duì)象用戶最相似的嗜好的協(xié)調(diào)用戶,根據(jù)該協(xié)調(diào)用戶 的分布圖,選擇要推薦的內(nèi)容。專利文獻(xiàn)1 日本特開2002-215665號(hào)公報(bào)但是,在上述專利文獻(xiàn)1所記載的技術(shù)中,存在如果訪問(wèn)歷史不增加則無(wú)法決定 推薦信息的問(wèn)題。即,在選擇嗜好類似的用戶的情況下,需要選擇一個(gè)以上的相同內(nèi)容,所 以,如果沒(méi)有選擇相同內(nèi)容,則不認(rèn)為是類似用戶。因此,需要蓄積某種程度的訪問(wèn)歷史。因 此,在各用戶的訪問(wèn)歷史少的狀態(tài)下,難以生成基于類似用戶的推薦信息。
發(fā)明內(nèi)容
因此,本發(fā)明的目的在于,提供如下的推薦信息生成裝置和推薦信息生成方法即 使歷史信息少,也能夠可靠地選擇類似的類似用戶。為了解決上述課題,本發(fā)明的推薦信息生成裝置具有矢量取得單元,其取得各用 戶的用戶特性矢量;類似度計(jì)算單元,其根據(jù)由所述矢量取得單元取得的各用戶的用戶特 性矢量,計(jì)算用戶間的類似度;選擇單元,其根據(jù)由所述類似度計(jì)算單元計(jì)算出的類似度, 選擇與一個(gè)用戶類似的類似用戶;以及生成單元,其根據(jù)由所述選擇單元選擇出的類似用 戶的特征矢量,生成針對(duì)所述一個(gè)用戶的推薦信息。并且,本發(fā)明的推薦信息生成方法具有以下步驟矢量取得步驟,在該步驟中,取 得各用戶的用戶特性矢量;類似度計(jì)算步驟,在該步驟中,根據(jù)由所述矢量取得步驟取得的 各用戶的用戶特性矢量,計(jì)算用戶間的類似度;選擇步驟,在該步驟中,根據(jù)由所述類似度 計(jì)算步驟計(jì)算出的類似度,選擇與一個(gè)用戶類似的類似用戶;以及生成步驟,在該步驟中, 根據(jù)由所述選擇步驟選擇出的類似用戶的特征矢量,生成針對(duì)所述一個(gè)用戶的推薦信息。根據(jù)本發(fā)明,能夠取得各用戶的用戶特性矢量,根據(jù)取得的各用戶的用戶特性矢 量,計(jì)算用戶間的類似度。然后,根據(jù)計(jì)算出的類似度,選擇與一個(gè)用戶類似的類似用戶,根 據(jù)選擇出的類似用戶的特征矢量,生成針對(duì)一個(gè)用戶的推薦信息。由此,使用用戶特性矢量 來(lái)判斷用戶的類似度,從而與現(xiàn)有方法相比,不用取得大量歷史信息,就能夠判斷高精度的 類似用戶,能夠生成基于該類似用戶的推薦信息。例如,在現(xiàn)有方法中,需要根據(jù)一萬(wàn)件閱 覽歷史信息來(lái)判斷類似用戶,與此相對(duì),根據(jù)本發(fā)明,使用10件左右的閱覽歷史信息,就能 夠高精度地判斷類似用戶。并且,在本發(fā)明的推薦信息生成裝置中,優(yōu)選所述矢量取得單元由以下單元構(gòu)成 受理單元,其受理通過(guò)用戶操作從多個(gè)選擇對(duì)象項(xiàng)目中選擇一個(gè)選擇對(duì)象項(xiàng)目;存儲(chǔ)單元,其存儲(chǔ)由所述受理單元受理的選擇對(duì)象項(xiàng)目的滿意特征矢量、和未由所述受理單元受理的 選擇對(duì)象項(xiàng)目的不滿意特征矢量;以及用戶特性矢量生成單元,其將與分離平面正交的正 交矢量作為用戶特性矢量,所述分離平面用于對(duì)由所述存儲(chǔ)單元存儲(chǔ)的已選擇的選擇對(duì)象 項(xiàng)目的滿意特征矢量和未選擇的選擇對(duì)象項(xiàng)目的不滿意特征矢量進(jìn)行分離。根據(jù)本發(fā)明,能夠受理通過(guò)用戶操作從多個(gè)選擇對(duì)象項(xiàng)目中選擇一個(gè)選擇對(duì)象項(xiàng) 目,存儲(chǔ)已受理的選擇對(duì)象項(xiàng)目的滿意特征矢量、和未由所述受理單元受理的選擇對(duì)象項(xiàng) 目的不滿意特征矢量。然后,生成與分離平面正交的正交矢量作為用戶特性矢量,該分離平 面用于對(duì)所存儲(chǔ)的已選擇的選擇對(duì)象項(xiàng)目的滿意特征矢量和未選擇的選擇對(duì)象項(xiàng)目的不 滿意特征矢量進(jìn)行分離。由此,能夠生成高精度的用戶特性矢量。并且,在本發(fā)明的推薦信息生成裝置中,優(yōu)選所述矢量取得單元由以下單元構(gòu)成 受理單元,其受理通過(guò)用戶操作從多個(gè)選擇對(duì)象項(xiàng)目中選擇一個(gè)選擇對(duì)象項(xiàng)目、以及未選 擇的選擇對(duì)象項(xiàng)目;以及用戶特性矢量生成單元,其根據(jù)未由所述受理單元受理的選擇對(duì) 象項(xiàng)目的不滿意特征矢量,生成用戶特性矢量。根據(jù)本發(fā)明,受理通過(guò)用戶操作從多個(gè)選擇對(duì)象項(xiàng)目中選擇一個(gè)選擇對(duì)象項(xiàng)目、 以及未選擇的選擇對(duì)象項(xiàng)目,根據(jù)未受理的選擇對(duì)象項(xiàng)目的不滿意特征矢量,生成用戶特 性矢量,由此,能夠根據(jù)未選擇的內(nèi)容/操作等的選擇對(duì)象項(xiàng)目的傾向,生成用戶特性矢量。并且,在本發(fā)明的推薦信息生成裝置中,優(yōu)選所述生成單元根據(jù)由所述類似度計(jì) 算單元計(jì)算出的類似度、以及類似用戶的用戶特性矢量與由所述類似用戶閱覽后的閱覽 內(nèi)容的特征矢量的內(nèi)積值,評(píng)價(jià)所述閱覽內(nèi)容,根據(jù)該評(píng)價(jià),根據(jù)所述閱覽內(nèi)容生成推薦信 肩、o根據(jù)本發(fā)明,根據(jù)計(jì)算出的類似度、以及類似用戶的用戶特性矢量與由類似用戶 閱覽后的閱覽內(nèi)容的特征矢量的內(nèi)積值,評(píng)價(jià)閱覽內(nèi)容,根據(jù)該評(píng)價(jià),根據(jù)閱覽內(nèi)容生成推 薦信息,由此,能夠進(jìn)行基于類似度的加權(quán)處理,生成基于該加權(quán)處理結(jié)果的推薦信息。由 此,能夠根據(jù)類似度生成適當(dāng)?shù)耐扑]信息。根據(jù)本發(fā)明,使用用戶特性矢量來(lái)判斷用戶的類似度,從而與現(xiàn)有方法相比,不用 取得大量歷史信息,就能夠判斷高精度的類似用戶,能夠生成基于該類似用戶的推薦信息。
圖1是示出推薦信息發(fā)布系統(tǒng)的系統(tǒng)結(jié)構(gòu)的系統(tǒng)結(jié)構(gòu)圖。圖2是示出信息發(fā)布服務(wù)器200的功能結(jié)構(gòu)的框圖。圖3是信息發(fā)布服務(wù)器200的硬件結(jié)構(gòu)圖。圖4是示出在便攜電話機(jī)100中顯示的菜單畫面的一例的說(shuō)明圖。圖5是示出生成分離平面時(shí)的處理概念的概念圖。圖6是示出根據(jù)分離平面來(lái)計(jì)算用戶特性矢量時(shí)的概念的概念圖。圖7是示出內(nèi)容管理表205a的存儲(chǔ)內(nèi)容的說(shuō)明圖。圖8是示出內(nèi)容特性矢量管理表207b的存儲(chǔ)內(nèi)容的說(shuō)明圖。圖9是示出便攜電話機(jī)100的功能結(jié)構(gòu)的框圖。圖10是示出根據(jù)便攜電話機(jī)100的請(qǐng)求來(lái)發(fā)布內(nèi)容時(shí)的便攜電話機(jī)100和信息發(fā)布服務(wù)器200的處理的順序圖。圖11是示出用戶特性矢量的計(jì)算處理的流程圖。圖12是發(fā)布推薦信息時(shí)的順序圖。圖13是示出關(guān)聯(lián)度計(jì)算處理的流程圖。圖14是示出歷史事件a和歷史事件b中的菜單畫面的結(jié)構(gòu)例的說(shuō)明圖。圖15是示出在菜單畫面中選擇出的內(nèi)容的特性矢量在特征空間中的位置關(guān)系的 圖。圖16是在相對(duì)空間內(nèi)表示歷史事件a和b的內(nèi)容的特性矢量的圖。圖17是在無(wú)法生成分離平面的情況下使用相對(duì)空間進(jìn)行處理時(shí)的說(shuō)明圖。圖18是示出考慮閱覽頻度來(lái)求出特性矢量的重心的處理的概念圖。圖19是示出按照訪問(wèn)的時(shí)間序列順序,通過(guò)NN法求出用戶特性矢量的過(guò)程的概 念圖。圖20是示出與操作有關(guān)的特征空間中的特性矢量的參數(shù)的說(shuō)明圖。標(biāo)號(hào)說(shuō)明100 便攜電話機(jī);100a 便攜電話機(jī);101 瀏覽器;102 歷史發(fā)送部;103 推薦 請(qǐng)求發(fā)送部;104 發(fā)布信息顯示部;200 信息發(fā)布服務(wù)器;201 內(nèi)容請(qǐng)求接收部;202 推 薦請(qǐng)求接收部;203 歷史集合分離部;204 用戶特性矢量計(jì)算部;205 發(fā)布信息存儲(chǔ)部; 205a 內(nèi)容管理表;207 歷史存儲(chǔ)部;207a 用戶特性矢量管理表;207b 內(nèi)容特性矢量管 理表;207c 閱覽歷史表;208 內(nèi)容發(fā)送部;209 類似用戶計(jì)算部;210 關(guān)聯(lián)度評(píng)價(jià)部。
具體實(shí)施例方式參照
本發(fā)明的實(shí)施方式。在可能的情況下,對(duì)相同部分標(biāo)注相同標(biāo)號(hào),并 省略重復(fù)說(shuō)明。圖1是示出本實(shí)施方式的具有便攜電話機(jī)100和信息發(fā)布服務(wù)器200的推薦信息 發(fā)布系統(tǒng)的系統(tǒng)結(jié)構(gòu)的系統(tǒng)結(jié)構(gòu)圖。信息發(fā)布服務(wù)器200根據(jù)來(lái)自便攜電話機(jī)100的請(qǐng) 求,向便攜電話機(jī)100發(fā)布該便攜電話機(jī)100的用戶及其特性類似的用戶保持的便攜電話 機(jī)100a訪問(wèn)的內(nèi)容。這里,關(guān)于作為推薦信息發(fā)布的內(nèi)容的優(yōu)選內(nèi)容,包含對(duì)于用戶來(lái)說(shuō) 未評(píng)價(jià)的內(nèi)容,例如,除了還未查看的Web內(nèi)容以外,還包含構(gòu)成電視節(jié)目表的內(nèi)容,或者 包含介紹今后發(fā)售的新刊本等的內(nèi)容。另外,該信息發(fā)布服務(wù)器200根據(jù)來(lái)自各用戶保持 的便攜電話機(jī)100的訪問(wèn)請(qǐng)求,從其他內(nèi)容提供商取得內(nèi)容,發(fā)布所取得的內(nèi)容,此時(shí)收集 訪問(wèn)歷史。并且,也可以構(gòu)成為便攜電話機(jī)100發(fā)送訪問(wèn)歷史,信息發(fā)布服務(wù)器200取得該 歷史。使用圖2說(shuō)明這種信息發(fā)布服務(wù)器200的結(jié)構(gòu)。圖2是示出信息發(fā)布服務(wù)器200 的功能結(jié)構(gòu)的框圖。該信息發(fā)布服務(wù)器200構(gòu)成為包含內(nèi)容請(qǐng)求接收部201、推薦請(qǐng)求接 收部202、歷史集合分離部203、用戶特性矢量計(jì)算部204、發(fā)布信息存儲(chǔ)部205、歷史存儲(chǔ)部 207、內(nèi)容發(fā)送部208、類似用戶計(jì)算部209以及關(guān)聯(lián)度評(píng)價(jià)部210。圖3是信息發(fā)布服務(wù)器200的硬件結(jié)構(gòu)圖。圖2所示的信息發(fā)布服務(wù)器200在物 理上如圖3所示,構(gòu)成為包含CPU 11、主存儲(chǔ)裝置即RAMI2和ROM 13、輸入設(shè)備即鍵盤和鼠 標(biāo)等的輸入裝置14、顯示器等輸出裝置15、網(wǎng)卡等數(shù)據(jù)收發(fā)設(shè)備即通信模塊16、以及硬盤等輔助存儲(chǔ)裝置17等在內(nèi)的計(jì)算機(jī)系統(tǒng)。將規(guī)定的計(jì)算機(jī)軟件讀入到圖3所示的CPU 11、 RAM 12等硬件上,由此,在CPU 11的控制下使輸入裝置14、輸出裝置15、通信模塊16進(jìn)行 動(dòng)作,并且,進(jìn)行RAM 12和輔助存儲(chǔ)裝置17中的數(shù)據(jù)的讀出和寫入,由此,實(shí)現(xiàn)在圖2中說(shuō) 明的各功能。下面,根據(jù)圖2所示的功能框來(lái)說(shuō)明各功能框。內(nèi)容請(qǐng)求接收部201是如下部分根據(jù)來(lái)自便攜電話機(jī)100的內(nèi)容請(qǐng)求,從網(wǎng)絡(luò)上 的內(nèi)容提供商取得內(nèi)容,能夠通過(guò)從便攜電話機(jī)100接收內(nèi)容請(qǐng)求及其URL來(lái)收集訪問(wèn)歷 史。收集到的訪問(wèn)歷史(URL等)被輸出到歷史存儲(chǔ)部207。另外,該內(nèi)容請(qǐng)求接收部201 區(qū)分收集在某個(gè)菜單畫面(事件)內(nèi)實(shí)際進(jìn)行了訪問(wèn)的內(nèi)容(URL)和雖然顯示在菜單畫面 中但實(shí)際沒(méi)有訪問(wèn)的內(nèi)容,作為訪問(wèn)歷史。并且,內(nèi)容請(qǐng)求接收部201不僅接收訪問(wèn)請(qǐng)求,也可以接收在便攜電話機(jī)100中收 集到的訪問(wèn)歷史信息,將其輸出到歷史存儲(chǔ)部207。該情況下,便攜電話機(jī)100同樣地構(gòu)成 為,區(qū)分在某個(gè)菜單畫面中選擇出的內(nèi)容和未選擇的內(nèi)容,作為訪問(wèn)歷史信息,發(fā)送給信息 發(fā)布服務(wù)器200。推薦請(qǐng)求接收部202是如下部分從便攜電話機(jī)100接收推薦信息的發(fā)布請(qǐng)求以 及便攜電話機(jī)100的用戶的用戶ID。推薦請(qǐng)求接收部202接收到該發(fā)布請(qǐng)求后,向類似用 戶計(jì)算部209通知該意思,進(jìn)行指示以便提取類似用戶。另外,作為變形例,也可以向用戶 特性矢量計(jì)算部204輸出具有推薦請(qǐng)求的意思,使其計(jì)算當(dāng)前時(shí)點(diǎn)的用戶特性矢量,將其 結(jié)果通知給類似用戶計(jì)算部209,使其提取類似用戶,使內(nèi)容發(fā)送部208發(fā)布該類似用戶閱 覽后的內(nèi)容作為推薦信息。歷史集合分離部203是如下部分根據(jù)在歷史存儲(chǔ)部207 (閱覽歷史表207c)中存 儲(chǔ)的閱覽歷史信息包含的內(nèi)容的特性矢量,生成用于將內(nèi)容分離為滿意集合和不滿意集合 的分離平面。這里,滿意集合是指僅包含以能夠選擇的方式在用于訪問(wèn)某個(gè)內(nèi)容的菜單畫 面中顯示的多個(gè)內(nèi)容中、實(shí)際選擇的內(nèi)容的集合,不滿意集合是指僅包含在該菜單畫面中 未選擇的內(nèi)容的集合。該歷史集合分離部203使用SVM法或NN法,生成能夠?qū)⒏鲀?nèi)容的特 性矢量分離為滿意集合和不滿意集合的分離平面,由此,能夠?qū)@些集合進(jìn)行分離。這里, SVM (Support Vector Machine)法是將使各個(gè)集合的節(jié)點(diǎn)之間(特性矢量之間)的最小距 離最大化的平面作為分離平面的方法,NN法是將推薦把各個(gè)集合的重心之間、即根據(jù)各內(nèi) 容的特性矢量計(jì)算出的滿意集合的重心和不滿意集合的重心連接起來(lái)的直線的平面作為 分離平面的方法。另外,在NN法中,不是必須求出分離平面,也可以將從不滿意集合的重心 朝向滿意集合的重心連接起來(lái)的直線作為用戶特性矢量。這里,說(shuō)明生成分離平面的具體方法。圖4是示出在便攜電話機(jī)100中顯示的菜 單畫面的一例的說(shuō)明圖。如圖4所示,顯示有節(jié)點(diǎn)1 節(jié)點(diǎn)5。該節(jié)點(diǎn)表示選擇對(duì)象項(xiàng)目, 例如是按照網(wǎng)頁(yè)上的菜單畫面中的每個(gè)類別進(jìn)行區(qū)分的項(xiàng)目,或者是網(wǎng)頁(yè)的標(biāo)題。例如,節(jié) 點(diǎn)1是與汽車有關(guān)的內(nèi)容,節(jié)點(diǎn)2是與金融有關(guān)的內(nèi)容等。用戶通過(guò)選擇節(jié)點(diǎn)1 節(jié)點(diǎn)5 中的任意一個(gè),從而能夠閱覽對(duì)應(yīng)的內(nèi)容。圖5是示出生成分離平面時(shí)的處理概念的概念圖。圖5示出在上述圖4的菜單畫 面中由用戶選擇出的內(nèi)容和未選擇的內(nèi)容中、在特征空間內(nèi)的各內(nèi)容的特性矢量的位置關(guān) 系。如圖5所示,圓形所示的部分是滿意的內(nèi)容(節(jié)點(diǎn)3、節(jié)點(diǎn)4),三角形所示的部分是不 滿意的內(nèi)容(節(jié)點(diǎn)1、節(jié)點(diǎn)2、節(jié)點(diǎn)5),四邊形所示的部分是未知的未評(píng)價(jià)的內(nèi)容(節(jié)點(diǎn)8、節(jié)點(diǎn)7)。分離平面是為了對(duì)這些滿意內(nèi)容和不滿意內(nèi)容進(jìn)行分離而生成的。這里,在進(jìn)行分離處理時(shí)不考慮未評(píng)價(jià)的內(nèi)容。另外,圖中,為了簡(jiǎn)便,利用二維平面來(lái)表現(xiàn)特征空間,但 是,矢量軸存在構(gòu)成矢量的參數(shù)的量,通常利用二十維以上的矢量來(lái)構(gòu)成特征空間。用戶特性矢量計(jì)算部204是如下部分計(jì)算與由歷史集合分離部203生成的分離 平面正交的正交矢量,并將其作為用戶特性矢量。圖6示出其具體例。圖6是示出根據(jù)分 離平面來(lái)計(jì)算用戶特性矢量時(shí)的概念的概念圖。如圖6所示,通過(guò)用戶特性矢量計(jì)算部204 計(jì)算與分離平面正交的正交矢量即用戶特性矢量《。用戶特性矢量計(jì)算部204每當(dāng)收集閱 覽歷史時(shí)進(jìn)行計(jì)算,更新在用戶特性矢量管理表207a中存儲(chǔ)的用戶特性矢量。發(fā)布信息存儲(chǔ)部205是如下部分存儲(chǔ)由操作員預(yù)先登記的內(nèi)容、或由內(nèi)容請(qǐng)求 接收部201從各用戶即便攜電話機(jī)100和100a接收到的具有發(fā)布請(qǐng)求的內(nèi)容,存儲(chǔ)有內(nèi)容 管理表205a。圖7是示出內(nèi)容管理表205a的存儲(chǔ)內(nèi)容的說(shuō)明圖。如圖7所示,該內(nèi)容管 理表205a對(duì)應(yīng)地存儲(chǔ)用戶ID、內(nèi)容ID、類別、標(biāo)題和推薦正文。用戶ID是用于確定用戶的 識(shí)別信息,是便攜電話機(jī)100或100a的固有信息等。內(nèi)容ID是用于唯一確定內(nèi)容的識(shí)別 信息,類別表示信息類別,例如是用于表示與CD相關(guān)聯(lián)、與DVD相關(guān)聯(lián)、與書籍相關(guān)聯(lián)、與電 視節(jié)目相關(guān)聯(lián)等的信息。標(biāo)題是用于作為推薦信息顯示的索引信息。在發(fā)布推薦信息時(shí), 顯示其標(biāo)題部分。推薦正文是推薦信息的主體部分,是對(duì)用戶有用的信息。該內(nèi)容管理表 205a中存儲(chǔ)的信息可以由操作員預(yù)先輸入,也可以由內(nèi)容提供商自動(dòng)檢索/提取、并利用 規(guī)定文件夾匯集。類似用戶計(jì)算部209是如下部分對(duì)一個(gè)用戶特性矢量和其他用戶的用戶特性矢 量的類似度進(jìn)行計(jì)算,以便按照由推薦請(qǐng)求接收部202接收到的推薦請(qǐng)求,提取與發(fā)出該 推薦請(qǐng)求的用戶類似的類似用戶。具體而言,類似用戶計(jì)算部209計(jì)算在用戶特性矢量管 理表207a中存儲(chǔ)的一個(gè)用戶特性矢量和其他用戶的用戶特性矢量的內(nèi)積值,由此計(jì)算類 似度。該其他用戶大量存在,類似用戶計(jì)算部209將類似度最大的其他用戶作為類似用戶。 另外,對(duì)一個(gè)用戶、其他用戶各自的用戶特性矢量進(jìn)行標(biāo)準(zhǔn)化處理。并且,這里,設(shè)一個(gè)用戶 為便攜電話機(jī)100的用戶,設(shè)類似用戶為便攜電話機(jī)100a的用戶。關(guān)聯(lián)度評(píng)價(jià)部210是如下部分對(duì)在發(fā)布信息存儲(chǔ)部205中存儲(chǔ)的內(nèi)容中、由類 似用戶計(jì)算部209提取出的類似用戶閱覽后的內(nèi)容進(jìn)行評(píng)價(jià),然后,生成按照評(píng)價(jià)從高到 低的順序排列內(nèi)容標(biāo)題而成的推薦信息。具體而言,如以下的式(1)所示,該關(guān)聯(lián)度評(píng)價(jià)部 210分別從用戶特性矢量管理表207a、閱覽歷史表207c中提取類似用戶即便攜電話機(jī)100a 的用戶特性矢量w和該類似用戶閱覽后的已閱覽內(nèi)容的特性矢量q,計(jì)算其內(nèi)積值。然后, 對(duì)該內(nèi)積值再乘以便攜電話機(jī)100的用戶的用戶特性矢量和便攜電話機(jī)100a的用戶的用 戶特性矢量的類似度9,計(jì)算乘法值。以按照該乘法值所示的關(guān)聯(lián)度從大到小的順序顯示 內(nèi)容標(biāo)題的方式,生成推薦信息。關(guān)聯(lián)度=用戶特性矢量w 特性矢量ClX類似度e…(1)歷史存儲(chǔ)部207是存儲(chǔ)各歷史信息的部分,存儲(chǔ)有用戶特性矢量管理表207a、內(nèi) 容特性矢量管理表207b和閱覽歷史表207c。用戶特性矢量管理表207a是與用于確定用戶的用戶ID對(duì)應(yīng)地存儲(chǔ)由用戶特性矢 量計(jì)算部204計(jì)算出的用戶特性矢量的部分。內(nèi)容特性矢量管理表207b是與用于確定該內(nèi)容的信息(例如內(nèi)容ID、URL等)對(duì)應(yīng)地存儲(chǔ)在內(nèi)容管理表205a中存儲(chǔ)的由操作員預(yù)先登記的內(nèi)容的特性矢量的部分。例如, 內(nèi)容特性矢量管理表207b存儲(chǔ)有圖8所示的信息。如圖8所示,與內(nèi)容ID對(duì)應(yīng)地存儲(chǔ)有 多個(gè)構(gòu)成特性矢量的參數(shù)。在圖8中記載了 8個(gè)參數(shù),但是,通常由更多的參數(shù)來(lái)構(gòu)成特性 矢量。另外,除了規(guī)定的參數(shù)以外,還可以追加針對(duì)每個(gè)內(nèi)容按照形態(tài)要素解析提取出的關(guān) 鍵字作為參數(shù)。針對(duì)構(gòu)成特性矢量的每個(gè)參數(shù),在0 1之間記述數(shù)值,表示使哪個(gè)特性矢 量具有特征。閱覽歷史表207c是存儲(chǔ)由內(nèi)容請(qǐng)求接收部201接收到的目的地或者收集到的訪 問(wèn)歷史信息的部分,例如是對(duì)應(yīng)地存儲(chǔ)用戶ID、內(nèi)容ID (或內(nèi)容的URL)及其內(nèi)容(已閱覽 的內(nèi)容、未閱覽的內(nèi)容各自)的特性矢量的部分。內(nèi)容發(fā)送部208是發(fā)送根據(jù)由內(nèi)容請(qǐng)求接收部201接收到的內(nèi)容請(qǐng)求而取得的內(nèi) 容的部分。例如,內(nèi)容發(fā)送部208發(fā)送根據(jù)由內(nèi)容請(qǐng)求接收部201接收到的內(nèi)容請(qǐng)求而取 得的內(nèi)容,并且,對(duì)應(yīng)于推薦請(qǐng)求接收部202,發(fā)送根據(jù)在發(fā)布信息存儲(chǔ)部205中存儲(chǔ)的內(nèi) 容或在閱覽歷史表207c中存儲(chǔ)的閱覽歷史中記述的內(nèi)容,按照關(guān)聯(lián)度評(píng)價(jià)部210的評(píng)價(jià)結(jié) 果而生成的推薦信息。這樣構(gòu)成的信息發(fā)布服務(wù)器200能夠根據(jù)來(lái)自便攜電話機(jī)100的請(qǐng)求,發(fā)布包含 類似用戶即便攜電話機(jī)100a的用戶閱覽后的內(nèi)容在內(nèi)的推薦信息。由此,能夠根據(jù)用戶特 性矢量來(lái)判斷用戶的類似度,發(fā)布類似用戶閱覽后的內(nèi)容作為推薦信息,由此,即使是閱覽 歷史少的用戶彼此,也能夠判斷其類似度。另外,在本實(shí)施方式中,使用歷史集合分離部203和用戶特性矢量計(jì)算部204來(lái)計(jì) 算用戶特性矢量,并將其存儲(chǔ)在用戶特性矢量管理表207a中,但是不限于此,也可以作為 固定值而在用戶特性矢量管理表207a中存儲(chǔ)用戶特性矢量。例如,作為該固定值,可考慮 根據(jù)進(jìn)行問(wèn)卷調(diào)查等的結(jié)果而手動(dòng)生成的值。并且,也可以僅根據(jù)不滿意內(nèi)容的特性矢量來(lái)逐次計(jì)算用戶特性矢量,并將其存 儲(chǔ)在用戶特性矢量管理表207a中。例如,不使用歷史集合分離部203,用戶特性矢量計(jì)算 部204僅根據(jù)未選擇的不滿意內(nèi)容來(lái)生成用戶特性矢量,并將其存儲(chǔ)在用戶特性矢量管理 表207a中。該情況下,用戶特性矢量計(jì)算部204僅根據(jù)不滿意內(nèi)容來(lái)計(jì)算重心,將其作為 用戶特性矢量存儲(chǔ)在用戶特性矢量管理表207a中,類似用戶計(jì)算部209根據(jù)該用戶特性矢 量來(lái)判斷類似用戶。接著,說(shuō)明便攜電話機(jī)100。圖9是示出便攜電話機(jī)100的功能結(jié)構(gòu)的框圖。如圖 9所示,便攜電話機(jī)100構(gòu)成為包含瀏覽器101、歷史發(fā)送部102、推薦請(qǐng)求發(fā)送部103以及 發(fā)布信息顯示部104。該便攜電話機(jī)100由CPU、RAM、ROM等硬件構(gòu)成,CPU構(gòu)成為按照存 儲(chǔ)的程序進(jìn)行動(dòng)作。具體而言,采用與信息發(fā)布服務(wù)器200相同的結(jié)構(gòu),由圖3所示的硬件 結(jié)構(gòu)來(lái)實(shí)現(xiàn)。下面說(shuō)明各結(jié)構(gòu)。瀏覽器101是用于與因特網(wǎng)連接的應(yīng)用部分,對(duì)在因特網(wǎng)上配置的站點(diǎn)進(jìn)行訪 問(wèn),使用戶能夠閱覽在站點(diǎn)中保存的內(nèi)容。該瀏覽器101構(gòu)成為保存訪問(wèn)歷史。歷史發(fā)送部102是發(fā)送使用瀏覽器101訪問(wèn)的內(nèi)容的訪問(wèn)歷史(表示在同一菜單 畫面上選擇出的內(nèi)容和未選擇的內(nèi)容的信息)的部分。另外,在信息發(fā)布服務(wù)器200側(cè)具 有每當(dāng)進(jìn)行訪問(wèn)時(shí)就收集歷史信息的功能的情況下,該歷史發(fā)送部102不是必須的結(jié)構(gòu)。推薦請(qǐng)求發(fā)送部103是如下部分通過(guò)由用戶操作未圖示的操作部,向信息發(fā)布服務(wù)器200發(fā)送用戶ID和推薦信息的請(qǐng)求。發(fā)布信息顯示部104是顯示由瀏覽器101取得的菜單畫面和內(nèi)容(網(wǎng)頁(yè))的部分。這樣構(gòu)成的便攜電話機(jī)100能夠使用瀏覽器101訪問(wèn)因特網(wǎng),并且,保存其訪問(wèn)歷 史,歷史發(fā)送部102能夠按照來(lái)自信息發(fā)布服務(wù)器200的請(qǐng)求或者規(guī)定定時(shí)來(lái)發(fā)送訪問(wèn)歷 史。接著,說(shuō)明這些便攜電話機(jī)100和信息發(fā)布服務(wù)器200的動(dòng)作。圖10是示出根據(jù) 便攜電話機(jī)100的請(qǐng)求來(lái)發(fā)布內(nèi)容時(shí)的便攜電話機(jī)100和信息發(fā)布服務(wù)器200的處理的順序圖。如圖10所示,根據(jù)來(lái)自便攜電話機(jī)100的瀏覽器101的請(qǐng)求,通過(guò)內(nèi)容發(fā)送部208 從信息發(fā)布服務(wù)器200發(fā)布菜單畫面(S101)。便攜電話機(jī)100的用戶從該菜單畫面中選擇 任意一個(gè)內(nèi)容(相當(dāng)于上述節(jié)點(diǎn)),便攜電話機(jī)100的瀏覽器101受理該內(nèi)容后(S102),按 照內(nèi)容的連接請(qǐng)求及其目的地向信息發(fā)布服務(wù)器200發(fā)送URL(S103)。在信息發(fā)布服務(wù)器200中,通過(guò)內(nèi)容請(qǐng)求接收部201接收URL,作為訪問(wèn)歷史存儲(chǔ) 在閱覽歷史表207c中。然后,根據(jù)該訪問(wèn)歷史來(lái)計(jì)算用戶特性矢量并進(jìn)行存儲(chǔ)(S104)。然 后,通過(guò)內(nèi)容發(fā)送部208從內(nèi)容提供商(未圖示)取得基于在S103中具有請(qǐng)求的目的地的 內(nèi)容并進(jìn)行發(fā)布(S105)。另外,用戶特性矢量的計(jì)算處理和內(nèi)容的發(fā)布處理的順序也可以 相反。這里,說(shuō)明S104中的用戶特性矢量計(jì)算的詳細(xì)處理。圖11是示出用戶特性矢量 的計(jì)算處理的流程圖。如圖11所示,首先,將由內(nèi)容請(qǐng)求接收部201接收到的訪問(wèn)請(qǐng)求或 訪問(wèn)歷史所示的訪問(wèn)歷史信息作為新追加的訪問(wèn)歷史,存儲(chǔ)在閱覽歷史表207c中(S201)。然后,通過(guò)歷史集合分離部203,根據(jù)在該閱覽歷史表207c中存儲(chǔ)的訪問(wèn)歷史信 息,提取屬于各滿意集合或不滿意集合的內(nèi)容的特性矢量(S202)。然后,通過(guò)歷史集合 分離部203,根據(jù)這些特性矢量生成用于對(duì)滿意集合和不滿意集合進(jìn)行分離的分離平面 (S202)。接著,通過(guò)用戶特性矢量計(jì)算部204計(jì)算與生成的分離平面正交的正交矢量,求出 用戶特性矢量(S204)。這里求出的用戶特性矢量被保存在用戶特性矢量管理表207a中, 在發(fā)布推薦信息時(shí),對(duì)在發(fā)布信息存儲(chǔ)部205中存儲(chǔ)的內(nèi)容進(jìn)行評(píng)價(jià)時(shí)利用該用戶特性矢 量。接著,說(shuō)明本實(shí)施方式中的發(fā)布類似用戶閱覽后的內(nèi)容作為推薦信息時(shí)其關(guān)聯(lián)度 的計(jì)算處理。圖12是示出發(fā)布推薦信息時(shí)的順序圖。如圖12所示,通過(guò)便攜電話機(jī)100 的推薦請(qǐng)求發(fā)送部103發(fā)送包含用戶ID在內(nèi)的推薦請(qǐng)求,通過(guò)信息發(fā)布服務(wù)器200的推薦 請(qǐng)求接收部202接收該推薦請(qǐng)求(S301)。然后,在信息發(fā)布服務(wù)器200中,針對(duì)在發(fā)布信息 存儲(chǔ)部205中存儲(chǔ)的類似用戶閱覽后的已閱覽內(nèi)容進(jìn)行關(guān)聯(lián)度的計(jì)算處理(S302)。這里, 通過(guò)關(guān)聯(lián)度評(píng)價(jià)部210來(lái)計(jì)算關(guān)聯(lián)度,生成按照關(guān)聯(lián)度從高到低的順序排列內(nèi)容標(biāo)題而成 的推薦信息。然后,通過(guò)內(nèi)容發(fā)送部208發(fā)布這樣生成的推薦信息(S303)。這里,說(shuō)明S302的關(guān)聯(lián)度計(jì)算的更加詳細(xì)的處理。圖13是示出關(guān)聯(lián)度計(jì)算處理 的流程圖。如圖13所示,通過(guò)關(guān)聯(lián)度評(píng)價(jià)部210,根據(jù)與推薦請(qǐng)求一起發(fā)送的用戶ID,從用 戶特性矢量管理表207a中取得對(duì)應(yīng)的用戶特性矢量(S401)。接著,通過(guò)類似用戶計(jì)算部 209計(jì)算發(fā)出推薦請(qǐng)求的用戶和其他用戶的類似度。即,分別從用戶特性矢量管理表207a 中提取用戶的用戶特性矢量和其他用戶的用戶特性矢量,并計(jì)算其內(nèi)積。計(jì)算與全部其他用戶之間的內(nèi)積,決定類似度最高(內(nèi)積值最大)的用戶作為類似用戶(S402)。然后,通過(guò)關(guān)聯(lián)度評(píng)價(jià)部210,從閱覽歷史表207c中取得類似用戶已經(jīng)閱覽的內(nèi) 容的特性矢量(S403)。如上述式(1)所示,計(jì)算所取得的內(nèi)容的特性矢量和類似用戶的 特性矢量的內(nèi)積,對(duì)該內(nèi)積值再乘以在S402中計(jì)算出的類似度(內(nèi)積值),計(jì)算關(guān)聯(lián)度 (S404)。通過(guò)關(guān)聯(lián)度評(píng)價(jià)部210,生成按照該關(guān)聯(lián)度從大到小的順序排列內(nèi)容標(biāo)題而成的推 薦信息,通過(guò)內(nèi)容發(fā)送部208向用戶(便攜電話機(jī)100)發(fā)布所生成的推薦信息(S405)。這樣,能夠按照用戶特性矢量來(lái)確定類似用戶,將該類似用戶閱覽后的內(nèi)容作為 推薦信息來(lái)提供。<相對(duì)空間中的分離平面的生成>以上的分離平面的生成方法是按照絕對(duì)空間中的內(nèi)容的特性矢量來(lái)進(jìn)行的,但 是,作為精度更高的方法,可考慮利用求出相對(duì)位置關(guān)系的相對(duì)空間的方法。下面,說(shuō)明使 用相對(duì)空間來(lái)生成分離平面的方法。另外,此時(shí)的處理結(jié)構(gòu)與上述情況相同,僅歷史集合分 離部203中的處理內(nèi)容不同。圖14示出歷史事件a和歷史事件b中的菜單畫面的結(jié)構(gòu)例,圖14(a)是示出歷史 事件a中的菜單畫面的圖,該菜單畫面由節(jié)點(diǎn)1 節(jié)點(diǎn)3構(gòu)成。并且,圖14(b)是示出歷史 事件b中的菜單畫面的圖,該菜單畫面由節(jié)點(diǎn)6 節(jié)點(diǎn)9構(gòu)成。在圖14(a)中示出選擇了 節(jié)點(diǎn)3的情況,在圖14(b)中示出選擇了節(jié)點(diǎn)9的情況。圖15是示出在圖14所示的各個(gè)菜單畫面中選擇出的內(nèi)容的特性矢量在特征空間 中的位置關(guān)系的圖。圖15(a)是示出在歷史事件a中選擇出的內(nèi)容的特征空間(絕對(duì)空間) 的圖,圖15(b)是示出在歷史事件b中選擇出的內(nèi)容的特征空間(絕對(duì)空間)的圖。與上 述情況相同,能夠?qū)⑦x擇出的內(nèi)容定義為滿意內(nèi)容,將未選擇的內(nèi)容定義為不滿意內(nèi)容,分 別分類為滿意集合、不滿意集合。圖16是在同一特征空間上表示各個(gè)歷史事件a和b的內(nèi)容的特性矢量的圖,是示 出在取不滿意內(nèi)容的特性矢量為原點(diǎn)的情況下表示滿意內(nèi)容的特性矢量的位置的相對(duì)空 間的圖。例如,為了進(jìn)行節(jié)點(diǎn)2和節(jié)點(diǎn)3的相對(duì)比較、節(jié)點(diǎn)1和節(jié)點(diǎn)3的相對(duì)比較,設(shè)表示 分別以節(jié)點(diǎn)1、節(jié)點(diǎn)2為原點(diǎn)時(shí)的節(jié)點(diǎn)3的位置的特征空間為相對(duì)空間。更具體而言,從節(jié) 點(diǎn)3的特性矢量中減去節(jié)點(diǎn)1的特性矢量,由此,能夠形成相對(duì)空間。其他節(jié)點(diǎn)也同樣,通 過(guò)進(jìn)行減去作為對(duì)象的內(nèi)容的特性矢量的處理,能夠形成相對(duì)空間。在該相對(duì)空間中,如圖16所示,根據(jù)這種滿意內(nèi)容的特性矢量、不滿意內(nèi)容的特 性矢量,通過(guò)歷史集合分離部203生成用于分離為滿意集合和不滿意集合的分離平面。然 后,通過(guò)用戶特性矢量計(jì)算部204計(jì)算與該分離平面正交的正交矢量即用戶特性矢量w。這樣,在歷史事件不同的情況下,也能夠利用相對(duì)空間生成用戶特性矢量,能夠生 成識(shí)別性更高的用戶特性矢量。這樣,使用相對(duì)空間生成分離平面,由此,能夠生成用戶特性矢量。但是,關(guān)于圖 15 圖17,作為絕對(duì)空間進(jìn)行處理也能夠生成分離平面,但是,還可考慮由無(wú)法生成分離 平面的特性矢量構(gòu)成的特征空間。該情況下,能夠利用上述相對(duì)空間來(lái)生成分離平面。下 面說(shuō)明該方法。圖17(a)是示出絕對(duì)空間中的內(nèi)容的特性矢量的圖。在該圖17(a)中,以節(jié)點(diǎn)1 和節(jié)點(diǎn)4是存在于相同事件(菜單畫面)中的內(nèi)容、節(jié)點(diǎn)2和節(jié)點(diǎn)3是存在于相同事件中的內(nèi)容為前提。另外,圓形是選擇出的內(nèi)容的特性矢量(滿意集合),三角形是未選擇的內(nèi) 容的特性矢量(不滿意集合)。根據(jù)圖17(a)可知,在絕對(duì)空間中,針對(duì)取這種位置關(guān)系的特性矢量的內(nèi)容,無(wú)法 生成分離平面。分離平面是用于對(duì)滿意集合和不滿意集合進(jìn)行分離的平面,在圖17(a)的 例子中,無(wú)法不多不少地分離兩者。由此,需要轉(zhuǎn)換為表示相對(duì)位置關(guān)系的相對(duì)空間,以便 能夠生成分離平面。圖17(b)是示出相對(duì)空間內(nèi)的內(nèi)容的特性矢量的圖,為了使節(jié)點(diǎn)1和節(jié)點(diǎn)2處于 相同位置,在圖17(b)的例子中,使與節(jié)點(diǎn)2對(duì)應(yīng)的節(jié)點(diǎn)3平行移動(dòng),以使該節(jié)點(diǎn)2平行移 動(dòng)。這樣轉(zhuǎn)換為相對(duì)空間,由此,能夠生成對(duì)不滿意內(nèi)容即節(jié)點(diǎn)1(節(jié)點(diǎn)2)與滿意內(nèi)容即節(jié) 點(diǎn)3和節(jié)點(diǎn)4進(jìn)行分離的分離平面v。如上所述,在絕對(duì)空間中,在無(wú)法生成分離平面的情況下,也能夠通過(guò)轉(zhuǎn)換為相對(duì) 空間來(lái)生成分離平面,由此,能夠計(jì)算用戶特性矢量。<考慮到閱覽頻度的分離平面的生成方法>接著,說(shuō)明進(jìn)行使用了內(nèi)容的閱覽頻度的加權(quán)處理,并使用該加權(quán)處理后的特性 矢量來(lái)生成分離平面時(shí)的歷史集合分離部203的處理。另外,這里說(shuō)明使用了 NN法的分離 平面的生成。圖18是示出考慮閱覽頻度來(lái)求出特性矢量的重心的處理的概念圖,是示出表示 與節(jié)點(diǎn)A C對(duì)應(yīng)的內(nèi)容Cl c3的特性矢量的位置的特征空間的概念圖。設(shè)內(nèi)容Cl的閱 覽頻度是3次,內(nèi)容c2的閱覽頻度是1次,內(nèi)容c3的閱覽頻度是10次。另外,閱覽歷史表 207c優(yōu)選存儲(chǔ)已閱覽的內(nèi)容的閱覽歷史、未閱覽的內(nèi)容的未閱覽歷史,并需要以能夠保存 或計(jì)算的方式存儲(chǔ)各個(gè)頻度。該情況下,通過(guò)以下的式(2)來(lái)計(jì)算這些內(nèi)容Cl c3的重心。
權(quán)利要求
一種推薦信息生成裝置,其中,該推薦信息生成裝置具有矢量取得單元,其取得各用戶的用戶特性矢量;類似度計(jì)算單元,其根據(jù)由所述矢量取得單元取得的各用戶的用戶特性矢量,計(jì)算用戶間的類似度;選擇單元,其根據(jù)由所述類似度計(jì)算單元計(jì)算出的類似度,選擇與一個(gè)用戶類似的類似用戶;以及生成單元,其根據(jù)由所述選擇單元選擇出的類似用戶的特征矢量,生成針對(duì)所述一個(gè)用戶的推薦信息。
2.根據(jù)權(quán)利要求1所述的推薦信息生成裝置,其特征在于, 所述矢量取得單元由以下單元構(gòu)成受理單元,其受理通過(guò)用戶操作從多個(gè)選擇對(duì)象項(xiàng)目中選擇一個(gè)選擇對(duì)象項(xiàng)目; 存儲(chǔ)單元,其存儲(chǔ)由所述受理單元受理的選擇對(duì)象項(xiàng)目的滿意特征矢量、和未由所述 受理單元受理的選擇對(duì)象項(xiàng)目的不滿意特征矢量;以及用戶特性矢量生成單元,其將與分離平面正交的正交矢量作為用戶特性矢量,所述分 離平面用于對(duì)由所述存儲(chǔ)單元存儲(chǔ)的已選擇的選擇對(duì)象項(xiàng)目的滿意特征矢量和未選擇的 選擇對(duì)象項(xiàng)目的不滿意特征矢量進(jìn)行分離。
3.根據(jù)權(quán)利要求1所述的推薦信息生成裝置,其特征在于, 所述矢量取得單元由以下單元構(gòu)成受理單元,其受理通過(guò)用戶操作從多個(gè)選擇對(duì)象項(xiàng)目中選擇一個(gè)選擇對(duì)象項(xiàng)目、以及 未選擇的選擇對(duì)象項(xiàng)目;以及用戶特性矢量生成單元,其根據(jù)未由所述受理單元受理的選擇對(duì)象項(xiàng)目的不滿意特征 矢量,生成用戶特性矢量。
4.根據(jù)權(quán)利要求1 3中的任意一項(xiàng)所述的推薦信息生成裝置,其特征在于,所述生成單元根據(jù)由所述類似度計(jì)算單元計(jì)算出的類似度、以及類似用戶的用戶特性 矢量與所述類似用戶所閱覽的閱覽內(nèi)容的特征矢量的內(nèi)積值,評(píng)價(jià)所述閱覽內(nèi)容,根據(jù)該 評(píng)價(jià),根據(jù)所述閱覽內(nèi)容生成推薦信息。
5. 一種推薦信息生成方法,其中,該推薦信息生成方法具有以下步驟 矢量取得步驟,在該步驟中,取得各用戶的用戶特性矢量;類似度計(jì)算步驟,在該步驟中,根據(jù)由所述矢量取得步驟取得的各用戶的用戶特性矢 量,計(jì)算用戶間的類似度;選擇步驟,在該步驟中,根據(jù)由所述類似度計(jì)算步驟計(jì)算出的類似度,選擇與一個(gè)用戶 類似的類似用戶;以及生成步驟,在該步驟中,根據(jù)由所述選擇步驟選擇出的類似用戶的特征矢量,生成針對(duì) 所述一個(gè)用戶的推薦信息。
全文摘要
本發(fā)明提供如下的推薦信息生成裝置和推薦信息生成方法即使歷史信息少,也能夠可靠地選擇類似的類似用戶。在該信息發(fā)布服務(wù)器(200)中,用戶特性矢量計(jì)算部(204)計(jì)算各用戶的用戶特性矢量,類似用戶計(jì)算部(209)根據(jù)上述計(jì)算出的各用戶的用戶特性矢量,計(jì)算用戶間的類似度。然后,類似用戶計(jì)算部(209)根據(jù)計(jì)算出的類似度,選擇與一個(gè)用戶類似的類似用戶,關(guān)聯(lián)度評(píng)價(jià)部(210)根據(jù)選擇出的類似用戶的特性矢量,生成針對(duì)一個(gè)用戶的推薦信息。
文檔編號(hào)G06F17/30GK101990668SQ20098011263
公開日2011年3月23日 申請(qǐng)日期2009年4月2日 優(yōu)先權(quán)日2008年4月10日
發(fā)明者上野英俊, 倉(cāng)掛正治, 原未來(lái), 大野木碧, 小野木雅, 深澤佑介, 長(zhǎng)沼武史 申請(qǐng)人:株式會(huì)社Ntt都科摩