一種特征抽取方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種特征抽取方法和裝置,應(yīng)用于一電子設(shè)備中,所述方法包括:所述電子設(shè)備接收來自服務(wù)器所采集的用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù);將所述統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)在存儲(chǔ)模塊中;對(duì)所述用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù)進(jìn)行非負(fù)用戶行為特征抽取,獲得特征抽取數(shù)據(jù);將所述特征抽取數(shù)據(jù)存儲(chǔ)在所述存儲(chǔ)模塊中,解決了現(xiàn)有技術(shù)中存在不能抽取出能夠保證對(duì)已知數(shù)據(jù)的良好還原性和非負(fù)性,不能夠良好地表征用戶行為規(guī)律的用戶行為特征的技術(shù)問題,實(shí)現(xiàn)了能抽取出能夠保證對(duì)已知數(shù)據(jù)的良好還原性和非負(fù)性,能夠良好地表征用戶行為規(guī)律的用戶行為特征的技術(shù)效果。
【專利說明】一種特征抽取方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)數(shù)據(jù)處理領(lǐng)域,尤其涉及大數(shù)據(jù)環(huán)境中特征抽取方法和裝置?!颈尘凹夹g(shù)】
[0002]現(xiàn)代大型信息系統(tǒng),尤其是運(yùn)營(yíng)較為成功的商業(yè)系統(tǒng),如大型電子商務(wù)系統(tǒng)、搜索系統(tǒng)、社會(huì)網(wǎng)絡(luò)服務(wù)系統(tǒng),其用戶數(shù)量和信息數(shù)量十分巨大。在此類系統(tǒng)中,用戶的各種客觀歷史行為,如點(diǎn)擊、瀏覽、評(píng)論、搜索等等,隨著系統(tǒng)運(yùn)營(yíng)時(shí)間的積累,會(huì)匯集成為龐大的用戶歷史行為數(shù)據(jù)集,數(shù)據(jù)量至少在TB量級(jí),形成典型的大數(shù)據(jù)環(huán)境。在此類環(huán)境中,一種典型的數(shù)據(jù)描述方式是使用用戶-項(xiàng)目歷史行為統(tǒng)計(jì)矩陣,該矩陣中的每一行對(duì)應(yīng)于一個(gè)特定用戶;每一列對(duì)應(yīng)于一個(gè)特定項(xiàng)目,其中項(xiàng)目指系統(tǒng)中任何可能由用戶操作的客觀物體,如新聞、圖片、商品等等;每一個(gè)矩陣元素對(duì)應(yīng)于一個(gè)特定用戶對(duì)一個(gè)特定項(xiàng)目的歷史行為量化數(shù)據(jù),該數(shù)據(jù)是使用該特定用戶對(duì)該特定項(xiàng)目的客觀歷史行為數(shù)據(jù),利用符合自然規(guī)律的數(shù)學(xué)統(tǒng)計(jì)模型進(jìn)行量化計(jì)算構(gòu)成。大型商業(yè)系統(tǒng)中,用戶和項(xiàng)目數(shù)量十分巨大,因此,其對(duì)應(yīng)的用戶-項(xiàng)目歷史行為統(tǒng)計(jì)矩陣也是十分巨大的。同時(shí),在通常情況下,一個(gè)用戶不可能窮盡瀏覽所有的項(xiàng)目,一個(gè)項(xiàng)目也不可能被所有的用戶點(diǎn)擊;因此,一般而言,用戶-項(xiàng)目歷史行為統(tǒng)計(jì)矩陣中的已知數(shù)據(jù)往往遠(yuǎn)遠(yuǎn)少于未知數(shù)據(jù),即,用戶-項(xiàng)目歷史行為統(tǒng)計(jì)矩陣是極端稀疏的。
[0003]在信息系統(tǒng)運(yùn)營(yíng)過程中,基于用戶-項(xiàng)目歷史行為統(tǒng)計(jì)矩陣中的已知數(shù)據(jù),從中抽取用戶行為特征,可以對(duì)用戶的行為規(guī)律進(jìn)行有效的分析,從而為系統(tǒng)在運(yùn)營(yíng)過程中的信息組織和營(yíng)銷策略的制訂提供重要的依據(jù)。在用戶行為特征的抽取過程中,如何保持用戶行為特征的非負(fù)性,是一個(gè)關(guān)鍵問題。這是因?yàn)榉秦?fù)的用戶特征更加符合信息系統(tǒng)中用戶行為的自然規(guī)律,能夠更好地對(duì)用戶行為進(jìn)行表征。
[0004]非負(fù)特征抽取多用于計(jì)算機(jī)視覺領(lǐng)域,其基本特點(diǎn)是對(duì)于給定的圖形或者圖像,將其視為一個(gè)滿秩矩陣,并對(duì)其進(jìn)行非負(fù)條件限制下的矩陣因式分解,從而抽取出該圖形或圖像的局部物體特征。但是,信息系統(tǒng)中的非負(fù)用戶行為提取問題,與計(jì)算機(jī)視覺中的非負(fù)物體特征抽取問題,具備很大的區(qū)別。這是因?yàn)橛?jì)算機(jī)視覺中的非負(fù)物體特征抽取所處理的圖形、圖像所轉(zhuǎn)化的矩陣是滿秩矩陣,且不具備缺失值,此類矩陣的非負(fù)矩陣因式分解問題可以借助常規(guī)的矩陣迭代運(yùn)算進(jìn)行處理;而信息系統(tǒng)中的非負(fù)用戶行為抽取問題,所處理的用戶-項(xiàng)目歷史行為統(tǒng)計(jì)矩陣,通常情況下是極端稀疏的,其中具備大量的缺失值,無法使用傳統(tǒng)的矩陣迭代運(yùn)算進(jìn)行處理。因此,如何針對(duì)大型信息系統(tǒng)中的、具備大量缺失值的用戶-項(xiàng)目歷史行為統(tǒng)計(jì)矩陣,進(jìn)行非負(fù)條件限制下的矩陣因式分解,抽取出能夠保證對(duì)已知數(shù)據(jù)的良好還原性和非負(fù)性,能夠良好地表征用戶行為規(guī)律的用戶行為特征,是對(duì)現(xiàn)代大型信息系統(tǒng)所產(chǎn)生的海量數(shù)據(jù)進(jìn)行分析所需要處理的一個(gè)關(guān)鍵問題。
[0005]綜上所述,本申請(qǐng)發(fā)明人在實(shí)現(xiàn)本申請(qǐng)實(shí)施例中發(fā)明技術(shù)方案的過程中,發(fā)現(xiàn)上述技術(shù)至少存在如下技術(shù)問題:
在現(xiàn)有技術(shù)中,由于現(xiàn)在現(xiàn)有的信息系統(tǒng)中進(jìn)行非負(fù)用戶行為抽取時(shí),所處理的用戶-項(xiàng)目歷史行為統(tǒng)計(jì)矩陣,通常情況下是極端稀疏的,其中具備大量的缺失值,無法使用傳統(tǒng)的矩陣迭代運(yùn)算進(jìn)行處理,所以,現(xiàn)有技術(shù)存在不能抽取出能夠保證對(duì)已知數(shù)據(jù)的良好還原性和非負(fù)性,不能夠良好地表征用戶行為規(guī)律的用戶行為特征的技術(shù)問題,進(jìn)而不能對(duì)用戶的行為規(guī)律進(jìn)行有效的分析,從而不能為系統(tǒng)在運(yùn)營(yíng)過程中的信息組織和營(yíng)銷策略的制訂提供重要的依據(jù)。
【發(fā)明內(nèi)容】
[0006]本申請(qǐng)實(shí)施例通過提供一種特征抽取方法和裝置,解決了現(xiàn)有技術(shù)中存在不能抽取出能夠保證對(duì)已知數(shù)據(jù)的良好還原性和非負(fù)性,不能夠良好地表征用戶行為規(guī)律的用戶行為特征的技術(shù)問題,實(shí)現(xiàn)了能抽取出能夠保證對(duì)已知數(shù)據(jù)的良好還原性和非負(fù)性,能夠良好地表征用戶行為規(guī)律的用戶行為特征的技術(shù)效果。
[0007]為解決上述技術(shù)問題,本申請(qǐng)實(shí)施例一方面提供了一種特征抽取方法,應(yīng)用于一電子設(shè)備中,所述方法包括:
所述電子設(shè)備接收來自服務(wù)器所采集的用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù);
將所述統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)在存儲(chǔ)模塊中;
對(duì)所述用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù)進(jìn)行非負(fù)用戶行為特征抽取,獲得特征抽取數(shù)
據(jù);
將所述特征抽取數(shù)據(jù)存儲(chǔ)在所述存儲(chǔ)模塊中。
[0008]其中,所述對(duì)所述統(tǒng)計(jì)數(shù)據(jù)進(jìn)行特征抽取,具體為:對(duì)所述統(tǒng)計(jì)數(shù)據(jù)進(jìn)行處理稀疏矩陣的非負(fù)用戶特征抽取。
[0009]進(jìn)一步地,所述對(duì)所述統(tǒng)計(jì)數(shù)據(jù)進(jìn)行特征抽取,獲得特征抽取數(shù)據(jù),具體包括: 首先,對(duì)特征抽取過程所需要的參數(shù)進(jìn)行初始化獲得第一參數(shù);
然后,基于所述統(tǒng)計(jì)數(shù)據(jù)和所述第一參數(shù),訓(xùn)練構(gòu)造特征數(shù)據(jù);
最后,通過迭代訓(xùn)練所述特征數(shù)據(jù),獲得特征抽取數(shù)據(jù)。
[0010]其中,所述特征數(shù)據(jù)具體為非負(fù)用戶行為特征數(shù)據(jù),其中,所述非負(fù)用戶行為特征數(shù)據(jù)具體包括:用戶特征矩陣和項(xiàng)目特征矩陣。
[0011]另一方面,本申請(qǐng)實(shí)例還提供一種特征抽取裝置,所述特征抽取裝置包括:
數(shù)據(jù)接收模塊,用于接收來自服務(wù)器所采集的用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù)來; 特征抽取模塊,用于對(duì)所述用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù)進(jìn)行非負(fù)用戶行為特征抽
取,獲得特征抽取數(shù)據(jù);
存儲(chǔ)模塊,用于存儲(chǔ)所述統(tǒng)計(jì)數(shù)據(jù)和所述特征抽取數(shù)據(jù)。
[0012]其中,所述特征抽取模塊具體為:對(duì)所述統(tǒng)計(jì)數(shù)據(jù)進(jìn)行處理稀疏矩陣的非負(fù)用戶特征抽取的模塊。
[0013]其中,所述特征抽取模塊具體包括:
參數(shù)初始化單元,用于對(duì)特征抽取過程所需要的參數(shù)進(jìn)行初始化獲得第一參數(shù); 特征訓(xùn)練單元,用于基于所述統(tǒng)計(jì)數(shù)據(jù)和所述第一參數(shù),訓(xùn)練構(gòu)造特征數(shù)據(jù);
迭代訓(xùn)練單元,用于通過迭代訓(xùn)練所述特征數(shù)據(jù),獲得特征抽取數(shù)據(jù)。
[0014]其中,所述特征數(shù)據(jù)具體為非負(fù)用戶行為特征數(shù)據(jù),其中,所述非負(fù)用戶行為特征數(shù)據(jù)具體包括:用戶特征矩陣和項(xiàng)目特征矩陣。[0015]本申請(qǐng)實(shí)施例中提供的一個(gè)或多個(gè)技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點(diǎn):
1、由于采用了首先所述電子設(shè)備接收來自服務(wù)器所采集的統(tǒng)計(jì)數(shù)據(jù),然后將所述統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)在存儲(chǔ)模塊中,然后對(duì)所述統(tǒng)計(jì)數(shù)據(jù)進(jìn)行特征抽取,獲得特征抽取數(shù)據(jù),最后將所述特征抽取數(shù)據(jù)存儲(chǔ)在所述存儲(chǔ)模塊中的技術(shù)方案,即通過單元素依賴迭代訓(xùn)練,基于用戶-項(xiàng)目歷史行為統(tǒng)計(jì)矩陣中的已知數(shù)據(jù)集合,抽取非負(fù)用戶歷史行為特征,所以有效解決了現(xiàn)有技術(shù)存在不能抽取出能夠保證對(duì)已知數(shù)據(jù)的良好還原性和非負(fù)性,不能夠良好地表征用戶行為規(guī)律的用戶行為特征的技術(shù)問題,進(jìn)而實(shí)現(xiàn)了能抽取出能夠保證對(duì)已知數(shù)據(jù)的良好還原性和非負(fù)性,能夠良好地表征用戶行為規(guī)律的用戶行為特征的技術(shù)效果。
[0016]2、由于采用了首先所述電子設(shè)備接收來自服務(wù)器所采集的統(tǒng)計(jì)數(shù)據(jù),然后將所述統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)在存儲(chǔ)模塊中,然后對(duì)所述統(tǒng)計(jì)數(shù)據(jù)進(jìn)行特征抽取,獲得特征抽取數(shù)據(jù),最后將所述特征抽取數(shù)據(jù)存儲(chǔ)在所述存儲(chǔ)模塊中的技術(shù)方案,即通過單元素依賴迭代訓(xùn)練,基于用戶-項(xiàng)目歷史行為統(tǒng)計(jì)矩陣中的已知數(shù)據(jù)集合,抽取非負(fù)用戶歷史行為特征,所以有效解決了現(xiàn)有技術(shù)存在不能對(duì)用戶的行為規(guī)律進(jìn)行有效的分析,從而不能為系統(tǒng)在運(yùn)營(yíng)過程中的信息組織和營(yíng)銷策略的制訂提供重要的依據(jù)的技術(shù)問題,進(jìn)而實(shí)現(xiàn)了能對(duì)用戶的行為規(guī)律進(jìn)行有效的分析,進(jìn)而能為系統(tǒng)在運(yùn)營(yíng)過程中的信息組織和營(yíng)銷策略的制訂提供重要的依據(jù)的技術(shù)效果。
【專利附圖】
【附圖說明】
[0017]圖1為本申請(qǐng)實(shí)施例中特征抽取方法的流程圖;
圖2為本申請(qǐng)實(shí)施例中特征抽取裝置的結(jié)構(gòu)圖;
圖3為本申請(qǐng)實(shí)施例中特征抽取模塊的結(jié)構(gòu)圖;
圖4為本申請(qǐng)實(shí)施例中用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)流程圖;
圖5為本申請(qǐng)實(shí)施例中非負(fù)用戶行為特征抽取流程圖。
【具體實(shí)施方式】
[0018]本申請(qǐng)實(shí)施例通過提供一種特征抽取方法和裝置,解決了現(xiàn)有技術(shù)中存在不能抽取出能夠保證對(duì)已知數(shù)據(jù)的良好還原性和非負(fù)性,不能夠良好地表征用戶行為規(guī)律的用戶行為特征的技術(shù)問題,實(shí)現(xiàn)了能抽取出能夠保證對(duì)已知數(shù)據(jù)的良好還原性和非負(fù)性,能夠良好地表征用戶行為規(guī)律的用戶行為特征的技術(shù)效果。
[0019]本申請(qǐng)實(shí)施中的技術(shù)方案為解決上述技術(shù)問題??傮w思路如下:
首先所述電子設(shè)備接收來自服務(wù)器所采集的統(tǒng)計(jì)數(shù)據(jù),然后將所述統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)在存儲(chǔ)模塊中,然后對(duì)所述統(tǒng)計(jì)數(shù)據(jù)進(jìn)行特征抽取,獲得特征抽取數(shù)據(jù),最后將所述特征抽取數(shù)據(jù)存儲(chǔ)在所述存儲(chǔ)模塊中的技術(shù)方案,即通過單元素依賴迭代訓(xùn)練,基于用戶-項(xiàng)目歷史行為統(tǒng)計(jì)矩陣中的已知數(shù)據(jù)集合,抽取非負(fù)用戶歷史行為特征,所以有效解決了現(xiàn)有技術(shù)存在不能抽取出能夠保證對(duì)已知數(shù)據(jù)的良好還原性和非負(fù)性,不能夠良好地表征用戶行為規(guī)律的用戶行為特征的技術(shù)問題,進(jìn)而實(shí)現(xiàn)了能抽取出能夠保證對(duì)已知數(shù)據(jù)的良好還原性和非負(fù)性,能夠良好地表征用戶行為規(guī)律的用戶行為特征的技術(shù)效果。
[0020]為了更好的理解上述技術(shù)方案,下面將結(jié)合說明書附圖以及具體的實(shí)施方式對(duì)上述技術(shù)方案進(jìn)行詳細(xì)的說明。[0021]實(shí)施例一
在實(shí)施例一中,提供了特征抽取方法,應(yīng)用在一電子設(shè)備中,其中,所述電子設(shè)備可以是臺(tái)式電腦,可以筆記本電腦,可以是平板電腦,也可以是手機(jī),在本申請(qǐng)實(shí)施例中,在此就不再一一舉例了。請(qǐng)參考圖1,本申請(qǐng)實(shí)施例中的特征抽取方法具體包括:
SAl,所述電子設(shè)備接收來自服務(wù)器所采集的用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù)。
[0022]在步驟SAl之后,本申請(qǐng)實(shí)施例的方法便進(jìn)入步驟SA2,即:將所述統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)在存儲(chǔ)模塊中。
[0023]在本申請(qǐng)實(shí)例中,電子設(shè)備接收服務(wù)器采集的用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù),并根據(jù)目前裝置的存儲(chǔ)模塊內(nèi)存儲(chǔ)的數(shù)據(jù)情況,選取適當(dāng)?shù)拇鎯?chǔ)方式,對(duì)接收的服務(wù)器采集數(shù)據(jù)進(jìn)行存儲(chǔ)。在具體實(shí)施例中,假設(shè)電子設(shè)備為一電腦,并且從服務(wù)器中獲得統(tǒng)計(jì)數(shù)據(jù),然后將統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)在電腦的存儲(chǔ)設(shè)備中方便后續(xù)使用。在具體實(shí)施例中,存儲(chǔ)模塊具體可以是各式存儲(chǔ)器,如RAM、ROM等,本申請(qǐng)不做具體限制。
[0024]在步驟SA2之后,本申請(qǐng)實(shí)施例的方法便進(jìn)入步驟SA3,即:對(duì)所述用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù)進(jìn)行非負(fù)用戶行為特征抽取,獲得特征抽取數(shù)據(jù)。
[0025]在本申請(qǐng)實(shí)例中,所述對(duì)所述統(tǒng)計(jì)數(shù)據(jù)進(jìn)行特征抽取,具體為:對(duì)所述統(tǒng)計(jì)數(shù)據(jù)進(jìn)行處理稀疏矩陣的非負(fù)用戶特征抽取。
[0026]在本申請(qǐng)實(shí)例中,所述對(duì)所述統(tǒng)計(jì)數(shù)據(jù)進(jìn)行特征抽取,獲得特征抽取數(shù)據(jù),具體包括:
首先,對(duì)特征抽取過程所需要的參數(shù)進(jìn)行初始化獲得第一參數(shù);
然后,基于所述統(tǒng)計(jì)數(shù)據(jù)和所述第一參數(shù),訓(xùn)練構(gòu)造特征數(shù)據(jù);
最后,通過迭代訓(xùn)練所述特征數(shù)據(jù),獲得特征抽取數(shù)據(jù)。
[0027]在本申請(qǐng)實(shí)例中,所述特征數(shù)據(jù)具體為非負(fù)用戶行為特征數(shù)據(jù),其中,所述非負(fù)用戶行為特征數(shù)據(jù)具體包括:用戶特征矩陣和項(xiàng)目特征矩陣。
[0028]在本申請(qǐng)實(shí)例中,電子設(shè)備接收到服務(wù)器根據(jù)當(dāng)前收集的用戶-項(xiàng)目行為統(tǒng)計(jì)數(shù)據(jù),進(jìn)行非負(fù)用戶行為特征抽取的指令后,執(zhí)行處理稀疏矩陣的非負(fù)用戶特征抽取過程,并將抽取的非負(fù)用戶行為特征數(shù)據(jù)存入存儲(chǔ)模塊中的非負(fù)用戶行為特征存儲(chǔ)單元。
[0029]其中,在本申請(qǐng)實(shí)例中,對(duì)特征抽取過程所需要的參數(shù)進(jìn)行初始化獲得第一參數(shù)具體為:初始化處理稀疏矩陣的非負(fù)用戶特征抽取過程所依賴的相關(guān)參數(shù),所述第一參數(shù)包括特征空間維數(shù)f、Tikhonov規(guī)約因子λ P和λ Q、用戶特征矩陣P、用戶特征訓(xùn)練輔助矩陣UserUP和UserDOWN、項(xiàng)目特征矩陣P、項(xiàng)目特征訓(xùn)練輔助矩陣ItemUP和ItemDOWN、迭代訓(xùn)練控制變量t、迭代訓(xùn)練上限η和迭代收斂判定閾值Y。其中,用戶特征矩陣P、用戶特征訓(xùn)練輔助矩陣UserUP和UserDOWN是根據(jù)當(dāng)前用戶集合U,和當(dāng)前特征空間維數(shù)f,建立的|U|行,|f|列的矩陣;用戶特征矩陣P中每個(gè)元素的初始值為開區(qū)間(0,0.4)范圍內(nèi)的隨機(jī)數(shù),用戶特征訓(xùn)練輔助矩陣UserUP和UserDOWN中每個(gè)元素的初始值為O。項(xiàng)目特征矩陣Q、項(xiàng)目特征訓(xùn)練輔助矩陣ItemUP和ItemDOWN是根據(jù)當(dāng)前項(xiàng)目集合I,和當(dāng)前特征空間維數(shù)f,建立的|1|行,|f|列的矩陣;項(xiàng)目特征矩陣P中每個(gè)元素的初始值為開區(qū)間(0,
0.4)范圍內(nèi)的隨機(jī)數(shù),項(xiàng)目特征訓(xùn)練輔助矩陣ItemUP和ItemDOWN中每個(gè)元素的初始值為O0
[0030]其中,在本申請(qǐng)實(shí)例中,所述基于所述統(tǒng)計(jì)數(shù)據(jù)和所述第一參數(shù),訓(xùn)練構(gòu)造特征數(shù)據(jù)具體為:根據(jù)存儲(chǔ)模塊中,用戶-項(xiàng)目歷史行為存儲(chǔ)單元存儲(chǔ)的已知用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù),和參數(shù)初始化單元初始化的訓(xùn)練參數(shù),訓(xùn)練構(gòu)造非負(fù)用戶行為特征數(shù)據(jù)。其中,非負(fù)用戶行為特征數(shù)據(jù)包括用戶特征矩陣P和項(xiàng)目特征矩陣Q。P中的每一個(gè)行向量對(duì)應(yīng)于一個(gè)用戶的非負(fù)行為特征;9中的每一個(gè)行向量對(duì)應(yīng)于已知全部用戶對(duì)于一個(gè)項(xiàng)目進(jìn)行操作的非負(fù)歷史行為特征。訓(xùn)練構(gòu)造非負(fù)用戶行為特征數(shù)據(jù)進(jìn)一步包括,特征訓(xùn)練單元首先構(gòu)造累積絕對(duì)誤差ε,ε以公式(I)表示。
【權(quán)利要求】
1.一種特征抽取方法,應(yīng)用于一電子設(shè)備中,其特征在于,所述方法包括: 所述電子設(shè)備接收來自服務(wù)器所采集的用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù); 將所述統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)在存儲(chǔ)模塊中; 對(duì)所述用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù)進(jìn)行非負(fù)用戶行為特征抽取,獲得特征抽取數(shù)據(jù); 將所述特征抽取數(shù)據(jù)存儲(chǔ)在所述存儲(chǔ)模塊中。
2.如權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述統(tǒng)計(jì)數(shù)據(jù)進(jìn)行特征抽取,具體為:對(duì)所述統(tǒng)計(jì)數(shù)據(jù)進(jìn)行處理稀疏矩陣的非負(fù)用戶行為特征抽取。
3.如權(quán)利要求2所述的方法,其特征在于,所述對(duì)所述用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù)進(jìn)行非負(fù)用戶行為特征抽取,獲得特征抽取數(shù)據(jù),具體包括: 對(duì)特征抽取過程所需要的參數(shù)進(jìn)行初始化獲得第一參數(shù); 基于所述統(tǒng)計(jì)數(shù)據(jù)和所述第一參數(shù),訓(xùn)練構(gòu)造特征數(shù)據(jù); 通過迭代訓(xùn)練所述特征數(shù)據(jù),獲得特征抽取數(shù)據(jù)。
4.如權(quán)利要求3所述的方法,其特征在于,所述特征數(shù)據(jù)具體為非負(fù)用戶行為特征數(shù)據(jù),其中,所述非負(fù)用戶行為特征數(shù)據(jù)具體包括:用戶特征矩陣和項(xiàng)目特征矩陣。
5.一種特征抽取裝置,其特征在于,所述特征抽取裝置包括: 數(shù)據(jù)接收模塊,用于接收來自服務(wù)器所采集的用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù)來;特征抽取模塊,用于對(duì)所述用戶-項(xiàng)目歷史行為統(tǒng)計(jì)數(shù)據(jù)進(jìn)行非負(fù)用戶行為特征抽取,獲得特征抽取數(shù)據(jù); 存儲(chǔ)模塊,用于存儲(chǔ)所述統(tǒng)計(jì)數(shù)據(jù)和所述特征抽取數(shù)據(jù)。
6.如權(quán)利要求5所述的裝置,其特征在于,所述特征抽取模塊具體為:對(duì)所述統(tǒng)計(jì)數(shù)據(jù)進(jìn)行處理稀疏矩陣的非負(fù)用戶特征抽取的模塊。
7.如權(quán)利要求6所述的裝置,其特征在于,所述特征抽取模塊具體包括: 參數(shù)初始化單元,用于對(duì)特征抽取過程所需要的參數(shù)進(jìn)行初始化獲得第一參數(shù); 特征訓(xùn)練單元,用于基于所述統(tǒng)計(jì)數(shù)據(jù)和所述第一參數(shù),訓(xùn)練構(gòu)造特征數(shù)據(jù); 迭代訓(xùn)練單元,用于通過迭代訓(xùn)練所述特征數(shù)據(jù),獲得特征抽取數(shù)據(jù)。
8.如權(quán)利要求7所述的裝置,其特征在于,所述特征數(shù)據(jù)具體為非負(fù)用戶行為特征數(shù)據(jù),其中,所述非負(fù)用戶行為特征數(shù)據(jù)具體包括:用戶特征矩陣和項(xiàng)目特征矩陣。
【文檔編號(hào)】G06F17/30GK103700011SQ201410013846
【公開日】2014年4月2日 申請(qǐng)日期:2014年1月13日 優(yōu)先權(quán)日:2014年1月13日
【發(fā)明者】羅辛, 夏云霓, 陳鵬, 吳磊 申請(qǐng)人:重慶大學(xué), 成都國(guó)科海博信息技術(shù)股份有限公司