本發(fā)明涉及金融券商產(chǎn)品推薦領(lǐng)域,具體涉及一種基于混合協(xié)同過濾的券商產(chǎn)品推薦方法。
背景技術(shù):
產(chǎn)品推薦在實(shí)際市場中應(yīng)用場景非常廣泛。比如亞馬遜商城、淘寶、京東等(您可能感興趣的圖書、音像、服裝、電子設(shè)備…)電商物品投放、今日頭條等新聞?wù)军c(diǎn)相關(guān)題材內(nèi)容資訊展示。企業(yè)通過使用產(chǎn)品推薦,可增強(qiáng)用戶體驗(yàn)、實(shí)現(xiàn)更好的交叉銷售、提高營業(yè)額度。對于用戶來說,我們每天都面臨著大量事件的抉擇,在沒有有效輔助決策信息之前,從其他用戶反饋信息中了解某事物的特性,可以加快我們抉擇的過程。如:我們到?jīng)]有買產(chǎn)品之前,選擇是否購買該產(chǎn)品以及相關(guān)產(chǎn)品,都可以通過企業(yè)產(chǎn)品推薦系統(tǒng)提供的信息得到很好的參考解答。
發(fā)明人在實(shí)現(xiàn)本發(fā)明的過程中發(fā)現(xiàn),券商積累了大量的用戶(user)對金融產(chǎn)品(item)的購買行為和產(chǎn)品調(diào)查反饋記錄,但是對這些記錄未能充分地進(jìn)行定量的挖掘分析,未發(fā)現(xiàn)其中的隱藏的潛在業(yè)務(wù)特點(diǎn)和購買規(guī)律,亦未梳理形成有效的決策輔助依據(jù)來支撐市場部門的業(yè)務(wù)銷售拓展。
聯(lián)系其他互聯(lián)網(wǎng)電商、新聞、視頻等產(chǎn)品推薦難點(diǎn),券商產(chǎn)品推薦面臨的挑戰(zhàn)主要有以下幾個:
規(guī)模。因?yàn)楹茈y獲得用戶滿意度的真實(shí)信息,現(xiàn)有絕大多數(shù)可行的推薦算法在處理券商產(chǎn)品推薦就力不從心了。
新鮮度。券商產(chǎn)品不斷推陳出新,老的產(chǎn)品不斷停售,新的產(chǎn)品在原來的基礎(chǔ)上略加改動就重新推出。產(chǎn)品推薦時要及時針對新推廣的產(chǎn)品進(jìn)行分析建模,同時要兼顧已有老產(chǎn)品和新產(chǎn)品的平衡。
噪聲。由于用戶購買券商金融產(chǎn)品行為的稀疏性和不可觀測的影響因素,用戶的歷史記錄本質(zhì)上難以準(zhǔn)確預(yù)測。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本申請?zhí)峁┝嘶诨旌蠀f(xié)同過濾的券商產(chǎn)品推薦方法,以增強(qiáng)券商在產(chǎn)品銷售方面的能力,拓展產(chǎn)品市場空間并獲取更高的營業(yè)利潤。
為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
基于混合協(xié)同過濾的券商產(chǎn)品推薦方法,包括:
輸入現(xiàn)有券商售賣中的金融產(chǎn)品信息以及若干用戶購買相關(guān)金融產(chǎn)品記錄及售后數(shù)據(jù),并形成初始數(shù)據(jù)庫;
推廣老產(chǎn)品時:
提取初始數(shù)據(jù)庫中若干用戶購買相關(guān)金融產(chǎn)品記錄,運(yùn)用關(guān)聯(lián)規(guī)則分析方法分析相關(guān)金融產(chǎn)品之間的關(guān)聯(lián)關(guān)系;以及運(yùn)用協(xié)同過濾算法計(jì)算相關(guān)金融產(chǎn)品之間的相似特征;
將運(yùn)用關(guān)聯(lián)規(guī)則分析方法和協(xié)同過濾算法中得到的產(chǎn)品之間的關(guān)聯(lián)性高和相似特征多的產(chǎn)品構(gòu)成一個產(chǎn)品集合;
對所述產(chǎn)品集合進(jìn)行篩選后對用戶進(jìn)行推薦。
在本發(fā)明的一個優(yōu)選實(shí)施例中,所述售賣中的金融產(chǎn)品信息包括固定收益類產(chǎn)品、現(xiàn)金類產(chǎn)品、權(quán)益類產(chǎn)品。
在本發(fā)明的一個優(yōu)選實(shí)施例中,運(yùn)用關(guān)聯(lián)規(guī)則分析方法和協(xié)同過濾算法之前還包括對初始數(shù)據(jù)庫進(jìn)行輸入特征提取,所述輸入特征包括但不限于以下:咨詢次數(shù)、購買次數(shù)、滿意度指數(shù)、是否會購買同類產(chǎn)品。
在本發(fā)明的一個優(yōu)選實(shí)施例中,對所述產(chǎn)品集合進(jìn)行篩選包括:針對每個用戶,梳理其已經(jīng)購買的產(chǎn)品,為其推薦未購買的產(chǎn)品集合中的產(chǎn)品以及推薦值。
在本發(fā)明的一個優(yōu)選實(shí)施例中,還包括新產(chǎn)品的推廣:
建立新產(chǎn)品的數(shù)據(jù)庫,該數(shù)據(jù)庫包括用戶新購買的金融產(chǎn)品信息及用戶購買相關(guān)金融產(chǎn)品記錄及售后數(shù)據(jù);
根據(jù)新產(chǎn)品的數(shù)據(jù)庫中新產(chǎn)品信息提取輸入特征形成分析數(shù)據(jù),并對該分析數(shù)據(jù)進(jìn)行奇異值svd降維分解,選擇達(dá)到總能量閾值比例的前幾個元素及數(shù)據(jù);并根據(jù)處理后的數(shù)據(jù)計(jì)算相似度,并找出相似的用戶群體;
根據(jù)用戶信息直接計(jì)算相似度,產(chǎn)生相似的用戶群體;
合并上述新產(chǎn)品信息和用戶信息獲取的相似的用戶群體構(gòu)成用戶集合;
對所述用戶集合進(jìn)行篩選后對用戶進(jìn)行推薦。
在本發(fā)明的一個優(yōu)選實(shí)施例中,將推廣老產(chǎn)品時獲取的產(chǎn)品集合以及推廣新產(chǎn)品時獲取的用戶集合進(jìn)行合并,形成候選的推薦列表;
依據(jù)推薦的準(zhǔn)確度和覆蓋率指標(biāo),對推薦算法進(jìn)行評價和完善。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
圖1為本申請實(shí)施例提供的基于混合協(xié)同過濾的金融產(chǎn)品推薦方法的一種實(shí)現(xiàn)流程圖;
圖2為本申請實(shí)施例提供的對推廣老產(chǎn)品基于關(guān)聯(lián)規(guī)則和基于item協(xié)同過濾推薦的一種實(shí)現(xiàn)流程圖;
圖3為本申請實(shí)施例提供的對推廣新產(chǎn)品基于內(nèi)容推薦和基于user協(xié)同過濾推薦的一種實(shí)現(xiàn)流程圖;
圖4為步驟s11中具體數(shù)據(jù)分析列表;
圖5為步驟s21中的數(shù)據(jù)表格;
圖6為步驟s22中通過關(guān)聯(lián)算法發(fā)現(xiàn)的規(guī)律;
圖7為步驟s23中的數(shù)據(jù)表格;
圖8為步驟s31中的基于內(nèi)容推薦的輸入特征表;
圖9為步驟s31中將步驟s11轉(zhuǎn)置后得到的數(shù)據(jù)表。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明通過對券商產(chǎn)品銷售數(shù)據(jù)的整理,運(yùn)用機(jī)器學(xué)習(xí)中的協(xié)同過濾分析方法,探尋了客戶特征與產(chǎn)品之間以及不同產(chǎn)品分類之間銷售的規(guī)律性,發(fā)現(xiàn)產(chǎn)品銷售中不同商品之間的聯(lián)系,找出不同顧客群體之間的相似性以及群體購買行為規(guī)律,為券商理財(cái)產(chǎn)品交叉銷售、捆綁銷售策略的確定提供決策支持。
通過對券商歷史理財(cái)產(chǎn)品銷售情況分析,發(fā)現(xiàn)三個方面的規(guī)律性:
一是,產(chǎn)品大類之間的相似性規(guī)則;
二是,產(chǎn)品小類之間的相似性規(guī)則;
三是,具體產(chǎn)品之間的相似規(guī)則。
假設(shè)當(dāng)前購買用戶的消費(fèi)喜好和其他某些用戶的消費(fèi)喜好相似,且這種喜好在最近一段時間以及未來一段時間內(nèi)保持穩(wěn)定。
一方面,根據(jù)當(dāng)前用戶的消費(fèi)喜好,找到與其喜好相似的其他客戶,分析他們有哪些產(chǎn)品對當(dāng)前用戶而言尚未購買,將這些產(chǎn)品推薦給當(dāng)前用戶。
同時,根據(jù)當(dāng)前已出售產(chǎn)品的分布情況,分析與其比較相似的產(chǎn)品,將這些產(chǎn)品推薦給未購買者。
一般來說,券商產(chǎn)品銷售中,促成客戶的首次購買,開拓一個新的客戶,它所付出的成本是比較高的。保持一個老客戶,并使他們繼續(xù)購買更多的保障,相對成本比較低。但是在對老客戶進(jìn)行二次銷售的時候,不能盲目進(jìn)行。如果能夠根據(jù)產(chǎn)品間的關(guān)聯(lián)性,有針對性地銷售,或者進(jìn)行產(chǎn)品捆綁銷售,將能夠大大提高銷售的成功率。
此外,在使用混合協(xié)同過濾分析券商理財(cái)產(chǎn)品銷售情況的時候,必須注意到產(chǎn)品的一些特點(diǎn):投資期限、風(fēng)險水平、收益的差異性;同時,券商產(chǎn)品不斷推陳出新,老的產(chǎn)品不斷停售,新的產(chǎn)品在原來的基礎(chǔ)上略加改動就重新推出,即便在同一時期銷售的產(chǎn)品,也有不少是屬于同一類的產(chǎn)品。
請參閱圖1,圖1為本發(fā)明實(shí)施例提供的基于混合協(xié)同過濾的金融產(chǎn)品推薦方法的一種實(shí)現(xiàn)流程圖,可以包括:
步驟s11:輸入券商固定收益類item(產(chǎn)品)、現(xiàn)金類item、權(quán)益類item及user購買、評價等數(shù)據(jù);
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,基于券商業(yè)務(wù)劃分考慮,劃定的產(chǎn)品大類包括:固定收益類、現(xiàn)金類、權(quán)益類,產(chǎn)品大類的劃分適用于所有券商;產(chǎn)品小類以及具體產(chǎn)品(某券商銷量最好的前10款產(chǎn)品)根據(jù)券商具體產(chǎn)品情況進(jìn)行選擇。
所選取時間區(qū)間為2015.09.01至2016.03.31,所選取數(shù)據(jù)范圍為理財(cái)產(chǎn)品持倉、交易流水、otc產(chǎn)品信息等數(shù)據(jù)。
基于的客戶數(shù)量選擇某證券公司購買產(chǎn)品的46292個客戶及其購買、評價等數(shù)據(jù)作為分析對象。
參照圖4,其中矩陣中的行為用戶,列表示產(chǎn)品。矩陣中元素為用戶對產(chǎn)品的評價分?jǐn)?shù),0表示沒有購買過該物品。
步驟s12:對推廣的老item,按照“基于關(guān)聯(lián)規(guī)則”+“基于item的協(xié)同過濾算法”形成推薦;
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,考慮到老item的數(shù)據(jù)量歷時時間較長、且顧客購買記錄比較稀疏,所以采取基于關(guān)聯(lián)規(guī)則:首先將item的大類、小類和具體產(chǎn)品之間的分析范圍進(jìn)行大致鎖定。同時,考慮產(chǎn)品之間的相似性進(jìn)行預(yù)測推薦。如知道產(chǎn)品a和c非常相似;
判斷產(chǎn)品a和c相似度,實(shí)現(xiàn)方式有很多,比如余弦距離、歐式距離等,此處根據(jù)tanimoto系數(shù)計(jì)算,具體公式見s23因?yàn)橄矚ga的用戶a同時也喜歡c,所以當(dāng)該用戶只購買了a時,將c也推薦給該用戶a。
步驟s13:對推廣的新item,按照“基于內(nèi)容推薦”+“基于user的協(xié)同過濾算法”形成推薦;
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,考慮到新推廣產(chǎn)品的記錄較少,因此首先基于內(nèi)容推薦來解決冷啟動的問題。將推薦看出搜索問題,通過各種標(biāo)簽來標(biāo)記產(chǎn)品,比如低風(fēng)險、短周期、收益穩(wěn)定等屬性。將這些屬性作為相似度計(jì)算需要的數(shù)據(jù)進(jìn)行預(yù)測推薦。同時,考慮用戶相似性去推廣這些新產(chǎn)品。如用戶a喜歡物品a,用戶b喜歡物品a、b、c,用戶c喜歡a、c,則認(rèn)為用戶a、用戶b、用戶c是相似的,所以將c推薦給用戶a。
步驟s14:按照并聯(lián)的思路融合上述兩種方法,形成候選的推薦列表;
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,對于新、老產(chǎn)品都可以找到對應(yīng)的用戶。如上述例子,產(chǎn)品和用戶的匹配關(guān)系為,產(chǎn)品c和用戶a匹配。
步驟s15:依據(jù)推薦的準(zhǔn)確度和覆蓋率指標(biāo),對推薦算法進(jìn)行評價和完善。
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,將所有產(chǎn)品和對應(yīng)的用戶進(jìn)行匹配,并在實(shí)際中驗(yàn)證一下,這些用戶對推薦產(chǎn)品的響應(yīng)情況,若響應(yīng)率和覆蓋率很高,則認(rèn)為這一套流程實(shí)現(xiàn)過程合理。否則,對推薦過程進(jìn)行調(diào)優(yōu)。
若是推薦不合適,調(diào)優(yōu)即需要優(yōu)化迭代整個過程,需要調(diào)整整個全流程中的各個環(huán)節(jié),如產(chǎn)品類型的劃分、產(chǎn)品新/老的界定時長、用戶對產(chǎn)品的數(shù)據(jù)輸入特征的擴(kuò)展調(diào)整、產(chǎn)品自身的數(shù)據(jù)特性的擴(kuò)展調(diào)整、相似度計(jì)算方式的調(diào)整等等。
如上述例子,產(chǎn)品和用戶的匹配關(guān)系為,產(chǎn)品c和用戶a匹配,在實(shí)際業(yè)務(wù)產(chǎn)品營銷中a用戶確實(shí)購買了產(chǎn)品c,則認(rèn)為這一切是合理科學(xué)的。
本發(fā)明研究發(fā)現(xiàn)產(chǎn)品銷售中不同商品之間的聯(lián)系,找出顧客購買行為模式。將混合協(xié)同過濾方法應(yīng)用到券商產(chǎn)品銷售分析中,可為券商產(chǎn)品銷售策略的確定提供決策支持。
請參閱圖2,圖2為本發(fā)明實(shí)施例提供的對推廣老產(chǎn)品基于關(guān)聯(lián)規(guī)則和基于item協(xié)同過濾推薦的一種實(shí)現(xiàn)流程圖,可以包括:
步驟s21:對推廣的老item,根據(jù)相關(guān)的user在這些item上的購買行為等提取輸入特征。
參照圖5,詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,將根據(jù)s22步驟的方法不同,輸入存在差異。對于關(guān)聯(lián)規(guī)則的輸入特征為下表的示例格式(t表示客戶購買此類別產(chǎn)品,f表示客戶未購買此類別產(chǎn)品):
對于基于item協(xié)同過濾的輸入特征見s11中輸入所示表格(附圖4)。
步驟s22:基于關(guān)聯(lián)規(guī)則梳理出user偏好的item集合;
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,數(shù)據(jù)探索主要針對客戶對產(chǎn)品購買情況的統(tǒng)計(jì)分析,掌握不同類別(產(chǎn)品)數(shù)據(jù)情況。本發(fā)明的數(shù)據(jù)探索主要包括如下幾方面:(1)單個類別(產(chǎn)品)的購買情況統(tǒng)計(jì);(2)類別(產(chǎn)品)組合的購買情況統(tǒng)計(jì)。通過產(chǎn)品信息表統(tǒng)計(jì),某證券公司共有固定收益類產(chǎn)品397款、權(quán)益類產(chǎn)品38款、現(xiàn)金類產(chǎn)品25款。
本發(fā)明通過對券商產(chǎn)品銷售數(shù)據(jù)的整理,運(yùn)用apriori關(guān)聯(lián)規(guī)則分析方法,探尋了客戶特征與產(chǎn)品之間以及不同產(chǎn)品分類之間銷售的規(guī)律性。置信度和支持度的設(shè)置,一方面,如果置信度設(shè)置太低,就可能會被大量不可靠的規(guī)則淹沒;另一方面,如果將置信度和支持度設(shè)置的太高,會被顯而易見或者不可避免的規(guī)則所限制。在實(shí)際應(yīng)用中的解決方案:不斷調(diào)整置信度和支持度設(shè)置參數(shù),消除不可靠規(guī)則,同時為針對性的營銷提供合理規(guī)則的空間。通過關(guān)聯(lián)算法發(fā)現(xiàn)的規(guī)律如附圖6所示:
通過關(guān)聯(lián)規(guī)則挖掘,還是發(fā)現(xiàn)一些產(chǎn)品之間的關(guān)聯(lián)關(guān)系,而這些關(guān)聯(lián)關(guān)系對于未來的產(chǎn)品營銷活動有支持和指導(dǎo)作用。
觀察附圖6的表格,關(guān)聯(lián)的主要作用就是分析出產(chǎn)品大類、產(chǎn)品小類、具體產(chǎn)品之間的關(guān)系緊密度,根據(jù)關(guān)聯(lián)強(qiáng)的產(chǎn)品,券商可以有針對性的進(jìn)行組合銷售和捆綁銷售,提高客戶對產(chǎn)品的忠誠度和駐留貢獻(xiàn)。
步驟s23:基于item的協(xié)同過濾算法梳理相似item集合;
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,首先計(jì)算物品之間的相似度,這里計(jì)算的方法為tanimoto系數(shù)的相似度計(jì)算:
其中x,y分別代表不同產(chǎn)品,i為該產(chǎn)品的輸入特征;
參照圖7,舉例詳細(xì)說明上述公式含義。若x,y分別代表下表產(chǎn)品列表中任意2個不同產(chǎn)品,如x為item1、y為item2,i為產(chǎn)品的對應(yīng)輸入特征,這里假設(shè)僅包含被咨詢次數(shù)、被購買次數(shù)、調(diào)查滿意度。因此按照tanimoto系數(shù)的相似度計(jì)算的公式,
即x為item1和y為item2之間的相似性為0.64。
步驟s24:合并形成候選推薦item集合;
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,將關(guān)聯(lián)規(guī)則中得到的產(chǎn)品之間的關(guān)聯(lián)性和相似產(chǎn)品構(gòu)成一個item的集合。
步驟s25:對于每個user,梳理其已經(jīng)購買的item,為其推薦未購買的item集合中的item以及推薦值。
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,鑒于實(shí)際業(yè)務(wù)中,出現(xiàn)給用戶同一時間重復(fù)推薦同一已購金融產(chǎn)品的情況,造成用戶困擾和投訴,此處只推薦用戶未購買的item。
請參閱圖3,圖3為本發(fā)明實(shí)施例提供的推廣新產(chǎn)品基于內(nèi)容推薦和基于user協(xié)同過濾推薦的一種實(shí)現(xiàn)流程圖,可以包括:
步驟s31:對推廣的新item,根據(jù)相關(guān)的user在這些item上的購買行為等提取輸入特征;
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,基于內(nèi)容推薦的輸入特征見附圖8:
基于user協(xié)同過濾的輸入特征見步驟s11中的表格,詳細(xì)舉例說明此表格。此處將s11轉(zhuǎn)置后得到下表(6行4列的表,可以擴(kuò)展行、列,一般行>列):
參照圖9,如果m代表產(chǎn)品個數(shù),n代表用戶個數(shù),矩陣值代表評分,0表示未評分。
步驟s32:對這些數(shù)據(jù)進(jìn)行奇異值svd降維分解,選擇達(dá)到總能量閾值比例的前幾個元素及數(shù)據(jù);
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,另一方面,對于“基于user的協(xié)同過濾”輸入,考慮到不同于特征值分解只針對方陣限制,奇異值分解能適用于任意矩陣。對于s31步驟中的表格進(jìn)行奇異值分解:
舉例詳細(xì)說明上述公式含義。按照步驟s31中的描述,則u矩陣每行代表產(chǎn)品屬性,現(xiàn)在通過降維u矩陣后,每個產(chǎn)品的屬性可以用更低的維度表示(假設(shè)k維)。
假設(shè)
分解矩陣之后,可以看到σ很特別,是個對角線矩陣。每個元素非負(fù),而且依次減小,元素值代表該矩陣向著某個特征值對應(yīng)的特征向量的方向的變化權(quán)重。找到能量貢獻(xiàn)占比高的奇異值對應(yīng)的元素(因?yàn)槠娈愔迪陆岛芸?,前幾個或前10%奇異值之和所占所有奇異值之和總能量就可以快速達(dá)到90%),即可得到降維后特征輸入,為進(jìn)一步的計(jì)算相似度提供支撐。
這里所取σ對角線上前2個元素(此時前2個元素占總能量比例已達(dá)85%),則σ(6*4)降維σ(2*2),u(6*6)降維u(6*2),vt(4*4)降維為vt(2*4),從而將a近似地變?yōu)?imgfile="bda0001267294840000095.gif"wi="67"he="62"img-content="drawing"img-format="gif"orientation="portrait"inline="no"/>具體如下:
貢獻(xiàn)比較高的輸入特征為u矩陣的前2列,和步驟s31中“名稱”無關(guān),基于的表格是s31中的第二個表格,和步驟s11中的表格一樣
假設(shè)現(xiàn)在有個新用戶a,并且已知這個用戶a對6個產(chǎn)品列表的評分向量為:[550005]t,(此向量為列向量)。通過奇異值分解后計(jì)算出新用戶a的降維后近似向量:
用戶
類似地,可以計(jì)算出示例表格中用戶1、用戶2、用戶3、用戶4的降維后向量,如下:
用戶
用戶2=[-0.4275-0.5172]1*2用戶3=[-0.38460.8246]1*2
用戶4=[-0.58590.0532]1*2用戶2=[-0.4275-0.5172]1*2
步驟s33:基于內(nèi)容推薦梳理出相似user集合;
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,針對s31中表格,直接計(jì)算相似度(類似于s23中的計(jì)算過程,此處不再贅述),產(chǎn)生相似的用戶群體,確定每個用戶的近鄰。
步驟s34:基于user的協(xié)同過濾算法梳理相似user集合;
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,將s32中的特征作為輸入。直接計(jì)算相似度(類似于s23中的計(jì)算過程,此處不再贅述),產(chǎn)生相似的用戶群體,確定每個用戶的近鄰。
以步驟s32中的主要輸入特征為優(yōu)先級高,降維中去掉的輸入特征優(yōu)先級忽略。
詳細(xì)說明此步驟。券商的客戶經(jīng)理要對用戶a做出個性化的推薦??梢栽谝延杏脩?、用戶2、用戶3、用戶4中,利用新用戶a的降維后向量[-0.3775-0.0802]1*2找出該用戶a的相似用戶。此處計(jì)算向量的相似度,根據(jù)tanimoto系數(shù)的相似度計(jì)算的公式,
則可以看出新用戶a和用戶1-用戶4中最相似的為用戶1,二者的相似度為0.801589,為后續(xù)步驟中的推薦值。
當(dāng)然,本發(fā)明在實(shí)際中可適當(dāng)降低相似度閾值,將用戶2也納入推薦user集合中,推薦值為0.77987。
步驟s35:合并形成候選推薦user集合;
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,合并s33和s34中的用戶群體,生成候選的用戶群。且候選用戶群內(nèi)的用戶之間的相似度是根據(jù)s34計(jì)算出來的。
步驟s36:對于每個item,梳理其已經(jīng)匹配的user,為其匹配集合中未購買它的user以及匹配值;
詳細(xì)說明此步驟。本發(fā)明實(shí)施例中,本發(fā)明實(shí)施例中,鑒于實(shí)際業(yè)務(wù)中,出現(xiàn)給用戶同一時間重復(fù)推薦同一已購金融產(chǎn)品的情況,造成用戶困擾和投訴,此處只推薦未購買該item的用戶。
如在s34的示例中,觀察用戶1的評分向量為:[553055]t,對比新用戶a的評分向量:[550005]t。然后找出用戶1評分過而新用戶a未評分的產(chǎn)品并排序,即{產(chǎn)品5:5,產(chǎn)品3:3}。即推薦給新用戶a的產(chǎn)品為產(chǎn)品5和產(chǎn)品3,對于用戶a已經(jīng)購買過的產(chǎn)品1、產(chǎn)2、產(chǎn)品6則不做推薦。
本專利考慮了協(xié)同過濾算法在金融產(chǎn)品推薦中的應(yīng)用,充分利用了用戶群體的智慧,基于的前提是興趣相近的用戶對同樣的產(chǎn)品感興趣。或者用戶比較偏愛與其已購買產(chǎn)品類似的產(chǎn)品。這樣極大地促進(jìn)了券商金融產(chǎn)品推薦的主觀性,更多地從統(tǒng)計(jì)意義上去發(fā)掘產(chǎn)品銷售規(guī)律,為券商提升業(yè)績提供強(qiáng)有力決策支持。
本說明書中各個實(shí)施例采用遞進(jìn)的方式描述,每個實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個實(shí)施例之間相同相似部分互相參見即可。對于實(shí)施例公開的裝置而言,由于其與實(shí)施例公開的方法相對應(yīng),所以描述的比較簡單,相關(guān)之處參見方法部分說明即可。
結(jié)合本文中所公開的實(shí)施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來實(shí)施。軟件模塊可以置于隨機(jī)存儲器(ram)、內(nèi)存、只讀存儲器(rom)、電可編程rom、電可擦除可編程rom、寄存器、硬盤、可移動磁盤、cd-rom、或技術(shù)領(lǐng)域內(nèi)所公知的任意其它形式的存儲介質(zhì)中。
上述方法,優(yōu)選的,對推廣的老item推薦方法包含:
對推廣的老item,根據(jù)相關(guān)的user在這些item上的購買行為等提取輸入特征。1、輸入特征可以包括但不限于以下:咨詢次數(shù)、購買次數(shù)、滿意度指數(shù)、是否會購買同類產(chǎn)品等;2、數(shù)據(jù)提取方式:線上的信息系統(tǒng)和線下的電話+問卷調(diào)查;3、具體實(shí)施中是按照同一級別的產(chǎn)品分類下,進(jìn)行推薦;
基于關(guān)聯(lián)規(guī)則梳理出user偏好的item集合;
基于item的協(xié)同過濾算法梳理相似item集合;
合并形成候選推薦item集合;
對于每個user,梳理其已經(jīng)購買的item,為其推薦未購買的item集合中的item以及推薦值,其中推薦值主要是0-1之間的數(shù)值,表示的是這個user和item的吻合度,越接近1表示吻合度越高,越接近0表示吻合度越低,該指標(biāo)通過item相似性計(jì)算得到,計(jì)算公式見步驟s23中的tanimoto系數(shù)。
上述方法,優(yōu)選的,對推廣的新item推薦方法包含:
對推廣的新item,根據(jù)相關(guān)的user在這些item(這里的item和上文的item不一樣,此處的item最主要是新推廣的產(chǎn)品。上文的item是推廣的老產(chǎn)品。差異在于新item沒有太多的用戶購買數(shù)據(jù))上的購買行為等提取輸入特征;
對這些數(shù)據(jù)進(jìn)行奇異值svd降維分解,svd的降維是一種通用的降維方式,在此處的目的是為了簡化計(jì)算復(fù)雜度,提高推薦效率;
選擇達(dá)到總能量閾值比例的前幾個元素及數(shù)據(jù);
基于內(nèi)容推薦梳理出相似user集合;
基于user的協(xié)同過濾算法梳理相似user集合;
合并形成候選推薦user集合;
對于每個item,梳理其已經(jīng)匹配的user,為其匹配集合中未購買它的user以及匹配值;
經(jīng)由上述的技術(shù)方案可知,本發(fā)明實(shí)施例公開的一種混合協(xié)同過濾的金融產(chǎn)品推薦方法,針對新、老產(chǎn)品推廣時已有的數(shù)據(jù)積累和特征差異,分別采用了基于內(nèi)容推薦+基于user協(xié)同過濾、基于關(guān)聯(lián)推薦+基于item推薦,并且針對新item的數(shù)量較大的情況,在計(jì)算相似性之前先利用奇異值分解進(jìn)行降維,簡化數(shù)據(jù),去除噪聲,為后續(xù)提高算法性能提供基礎(chǔ)支撐。
然后將這些新老產(chǎn)品推薦結(jié)果按照并聯(lián)的方式融合起來,形成整體的推薦候選列表。按照評價指標(biāo)對這些候選列表進(jìn)行評價和完善,得到最優(yōu)的推薦結(jié)果。
可以看出,這些推薦細(xì)化了實(shí)際業(yè)務(wù)中各種金融產(chǎn)品的推廣特點(diǎn),在模型性能和推廣應(yīng)用性上具備較好的平衡性,可以大大提升券商客戶經(jīng)理在銷售產(chǎn)品時用戶的響應(yīng)率,從而為券商開拓更廣的市場空間提供有力武器。
對所公開的實(shí)施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對這些實(shí)施例的多種修改對本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開的原理和新穎特點(diǎn)相一致的最寬的范圍。
說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”、“第三”“第四”等(如果存在)是用于區(qū)別類似的部分,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本申請的實(shí)施例能夠以除了在這里圖示的以外的順序?qū)嵤?/p>