本發(fā)明屬于基于內(nèi)容的推薦領域,尤其涉及一種基于內(nèi)容的新車型評分預測方法。
背景技術(shù):
汽車4s店銷售業(yè)務是4s店的主要業(yè)務之一。采取科學的預測方法,建立數(shù)學模型,以新車型配置參數(shù)為基礎,給出新車型相關(guān)的評分預測和關(guān)注度預測,可使企業(yè)管理者掌握和了解新車型潛在的市場需求,獲得潛在的收益,最大化各個細分市場的收益。
現(xiàn)有的推薦系統(tǒng)大致可分為2類:協(xié)同過濾推薦以及基于內(nèi)容的推薦。協(xié)同過濾的推薦,需要龐大的用戶評分矩陣,同時在本汽車推薦系統(tǒng)中,由于新車型無評分信息、關(guān)注度信息,存在冷啟動問題和評分矩陣稀疏問題,故無法用于對新車型的評分預測。
而基于內(nèi)容的推薦方法,通過抽取物品的屬性特征,以物品屬性為基礎求得相似度進而展開相應的計算。不需要巨大的用戶群體和評分記錄,僅需新車型錄入時輸入的配置信息,以新車型內(nèi)容,即新車型配置信息為基礎,通過相應計算求出預測評分結(jié)果,預測結(jié)果不受用戶和評分影響,只與車型配置信息有關(guān)。
現(xiàn)有的與評分預測推薦相關(guān)的方法和系統(tǒng)包括:
1)中國專利cn106326390a公開了一種基于協(xié)同過濾的推薦方法,該方法中通過計算項目間相似度構(gòu)建項目相似度矩陣,并根據(jù)相似度矩陣獲得各項目的最近鄰居集合,再根據(jù)最近鄰居集合計算用戶對項目的預測評分。
此方法存在的問題是:需要構(gòu)建龐大的項目相似度矩陣、最近鄰居集合來求得用戶對項目的預測評分,計算復雜,且無法解決冷啟動問題,即對新項目的出現(xiàn)無法立即生成評分預測進行推薦。
2)中國專利cn105430505a提供了一種基于組合策略的iptv節(jié)目推薦方法,該方法提出通過用戶評分數(shù)據(jù)庫,使用基于內(nèi)容的推薦方法進行推薦,解決冷啟動問題。
此方法存在的問題是:推薦結(jié)果為最相似的前n個節(jié)目,未繼續(xù)通過加權(quán)計算等方式求得預測評分等更直觀的推薦結(jié)果。
3)中國專利cn104866490a公開了一種視頻智能推薦方法,該方法中提出通過數(shù)據(jù)預處理生成影視信息,結(jié)合使用基于內(nèi)容和基于協(xié)同的推薦方法,生成針對用戶的最佳個性化推薦列表,具有較好的推薦效果。
此方法存在的問題是:結(jié)合使用基于內(nèi)容和基于協(xié)同的推薦方法雖然提高了推薦效果,但同時也增加了響應時間,向量構(gòu)建的公式復雜也給代碼精煉帶來了難度。
通過以上例舉可以看出,現(xiàn)有對物品評分的預測與推薦方法,公式復雜、計算時間開銷大、需要大量用戶評分記錄,且存在冷啟動等問題。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種基于內(nèi)容的新車型評分預測方法,該方法計算簡單、代碼精煉、分塊預測評分增加了預測準確度,有較好的研究意義與應用價值。
為解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案是:
一種基于內(nèi)容的新車型評分預測方法,包括以下步驟:
步驟1:收集汽車各車型配置信息,包括基本信息和評分信息;
步驟2:錄入新車型配置信息,包括質(zhì)量參數(shù)和舒適性參數(shù);
步驟3:將新車型配置信息,依次與數(shù)據(jù)庫中已知車型配置信息進行比較,轉(zhuǎn)化為0-1向量表;
即設新車型配置信息為n1,數(shù)據(jù)庫中已知車型配置信息為sk(k=1,2,…,n);創(chuàng)建向量將n1,s1向量化為0-1向量表,第一列表示車型配置特征,第二列表示n1所包含配置特征,第三列表示s1所包含配置特征,0表示無此配置特征,1表示有此配置特征;
對轉(zhuǎn)化后的n1、s1進行余弦法計算:
步驟4:遍歷新車型與數(shù)據(jù)庫中其他車型配置信息,向量化并求得新車型與數(shù)據(jù)庫中所有已知車型的質(zhì)量相似度和舒適性相似度,得到質(zhì)量相似度列表和舒適性相似度列表;
步驟5:根據(jù)質(zhì)量相似度列表,取出前k個相似度較高車型的質(zhì)量評分、關(guān)注度及對應的質(zhì)量相似度;根據(jù)舒適性相似度列表,取前k個相似度較高車型的舒適性評分、關(guān)注度及對應的舒適性相似度;
步驟6:根據(jù)步驟5求得的數(shù)據(jù),求出新車型的預測質(zhì)量評分,即:
質(zhì)量評分:r1=a×m;
其中,a=(a1,a2,a3,..,ak)為步驟5質(zhì)量相似度列表前k個車型的質(zhì)量評分;m=(m1,m2,m3...,mk)為步驟5質(zhì)量相似度列表前k個車型的質(zhì)量相似度。
進一步的,所述車型配置信息的基本信息包括質(zhì)量參數(shù)、舒適性參數(shù),評分信息包括質(zhì)量評分、舒適性評分和關(guān)注度評分。
進一步的,還包括預測舒適性評分,即:
舒適性評分:r2=b×n;
其中b=(b1,b2,b3,..,bk)為步驟5舒適性相似度列表前k個車型的舒適性評分;n=(n1,n2,n3,..,nk)為步驟5舒適性相似度列表前k個車型的舒適性相似度。
進一步的,還包括預測關(guān)注度,即:
關(guān)注度:h1=p×m,h2=q×n,
其中,p=(p1,p2,p3,..,pk)為步驟5質(zhì)量相似度列表前k個車型的關(guān)注度;q=(q1,q2,q3,..,qk)為步驟5舒適性相似度列表前k個車型的關(guān)注度,二者合成新車型預測關(guān)注度h。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:1)具有響應時間短、編碼簡單、代碼精煉的優(yōu)勢;2)有效解決冷啟動問題,新車型可立即得到評分預測;3)無需大量用戶群體和評分記錄;4)向量構(gòu)建所占空間小,計算簡單,無復雜公式計算;5)車型配置信息分為質(zhì)量參數(shù)和舒適性參數(shù),通過計算相應的質(zhì)量相似度和舒適性相似度,得到對應的質(zhì)量評分預測、舒適性評分預測,增加了評分預測準確度。
附圖說明
圖1為本發(fā)明方法的流程示意圖。
圖2為部分車型配置信息圖。
圖3為部分車型關(guān)注度、質(zhì)量評分和舒適性評分圖。
圖4為例子中新車型n1與已知車型s1比較后的0-1向量表。
圖5為質(zhì)量相似度排序后的列表。
圖6為舒適性相似度排序后的列表。
具體實施方式
下面結(jié)合附圖和具體實施方式對本發(fā)明作進一步的說明。如圖1所示,基于內(nèi)容的新車評分預測方法包含以下步驟:
步驟一:收集汽車各車型配置信息的基本信息和評分信息(圖2為部分配置信息,圖3為部分關(guān)注度、質(zhì)量評分和舒適性評分)。其中車型配置信息包括質(zhì)量參數(shù)(變速箱、發(fā)動機等)、舒適性參數(shù)(車身結(jié)構(gòu),座椅類型等),評分信息包括質(zhì)量評分、舒適性評分和關(guān)注度。
步驟二:錄入新車型配置信息(質(zhì)量參數(shù)和舒適性參數(shù))。
步驟三:將新車型配置信息,依次與數(shù)據(jù)庫中已知車型配置信息進行比較,轉(zhuǎn)化為0-1向量表。設新車型配置信息為n1,數(shù)據(jù)庫中已知車型配置信息為sk(k=1,2,…,n),以新車型與數(shù)據(jù)庫中第一個車型比較為例,設n1={a1,a2,a3,a4,a5,a6,a7,a8},s1={a1,a2,a4,a5,a7,b1,b2},其中ak,bk均表示車型配置特征。
創(chuàng)建向量空間如圖4所示,將n1,s1向量化為0-1向量表;第一列表示車型配置特征,第二列表示n1所包含配置特征,第三列表示s1所包含配置特征,0表示無此配置特征,1表示有此配置特征。此例中n1轉(zhuǎn)化為{1,1,1,1,1,1,1,1,0,0},s1轉(zhuǎn)化為{1,1,0,1,1,0,1,0,1,1}。本發(fā)明方法有效減小了0-1向量表長度,減小了計算復雜度。
對轉(zhuǎn)化后的n1、s1進行余弦法計算:
遍歷新車型與數(shù)據(jù)庫中其他車型配置信息,向量化并求得新車型與數(shù)據(jù)庫中所有已知車型的質(zhì)量相似度和舒適性相似度,得到質(zhì)量相似度列表和舒適性相似度列表,分別由高到低進行排序;
步驟四:根據(jù)質(zhì)量相似度排序后的列表,取出前k個相似度較高車型的質(zhì)量評分、關(guān)注度及對應的質(zhì)量相似度,如圖5所示。同理,根據(jù)舒適性相似度排序后的列表,取前k個相似度較高車型的舒適性評分、關(guān)注度及對應的舒適性相似度,如圖6所示。
步驟五:根據(jù)步驟四求得的數(shù)據(jù),分別求出新車型的預測質(zhì)量評分、預測舒適性評分和預測關(guān)注度,具體計算公式如表1所示。
表1評分預測結(jié)果計算公式
步驟五具體計算過程為:
質(zhì)量評分:r1=a×m
其中,a=(a1,a2,a3,..,ak)為步驟四質(zhì)量相似度排序后的列表前k個車型的質(zhì)量評分,m=(m1,m2,m3...,mk)為步驟四質(zhì)量相似度排序后的列表前k個車型的質(zhì)量相似度。
預測舒適性評分:r2=b×n
其中,b=(b1,b2,b3,..,bk)表示步驟四舒適性相似度排序后列表前k個車型的舒適性評分,n=(n1,n2,n3,..,nk)表示步驟四舒適性相似度排序后列表前k個車型的舒適性相似度。
預測關(guān)注度:h1=p×m,h2=q×n,
其中,p=(p1,p2,p3,..,pk)為步驟四質(zhì)量相似度排序后列表前k個車型的關(guān)注度,q=(q1,q2,q3,..,qk)為步驟四舒適性相似度排序后列表前k個車型的關(guān)注度,二者合成新車型預測關(guān)注度h。