本發(fā)明涉及大數(shù)據(jù)分析技術(shù)領(lǐng)域,尤其涉及一種大數(shù)據(jù)平臺的價格信息優(yōu)化組合方法與系統(tǒng)。
背景技術(shù):
對于網(wǎng)絡(luò)商品交易平臺來說,對商品相關(guān)信息的統(tǒng)計和分析是大數(shù)據(jù)技術(shù)所應(yīng)用的一個重要方面。價格信息是商品相關(guān)信息當中一個關(guān)鍵的參量,圍繞價格信息大數(shù)據(jù)所進行的各種網(wǎng)絡(luò)平臺功能的開發(fā)對方便用戶選擇、提升用戶體驗具有重要價值。
價格排序篩選、比價、價格走勢預(yù)測是現(xiàn)有的各類網(wǎng)絡(luò)商品交易平臺上與價格信息大數(shù)據(jù)相關(guān)的典型功能。價格排序篩選是以價格由低到高、由高到低或?qū)儆谀骋粎^(qū)間范圍為依據(jù),對商品進行排序顯示或部分顯示。比價是從不同的交易平臺等多個數(shù)據(jù)源上提取相同或同類產(chǎn)品的價格信息并共同顯示,以及推薦對同一商品或同類商品提供了最優(yōu)惠價格的交易平臺,以供用戶對比分析。價格走勢預(yù)測是建立價格與某種參量之間的聯(lián)系,將價格作為該參量的函數(shù),進而根據(jù)該參量的發(fā)展變化而相應(yīng)地做出對價格趨勢的預(yù)測。例如,將某種時合商品的價格與交易平臺上該種商品的供應(yīng)量聯(lián)系起來,價格隨著供應(yīng)量的增加而線性或非線性地下降,形成二者的函數(shù)表達式,進而,就可以通過實時或非實時統(tǒng)計交易平臺上該種商品的供應(yīng)量并代入該表達式而預(yù)測對應(yīng)的價格。以上幾種功能最為常見,實現(xiàn)的技術(shù)手段也比較簡單。
上述大數(shù)據(jù)價格分析功能針對各類商品在價格的維度上提供了強大的功能。但是,顯然,大多數(shù)情況下,價格并不是用戶在網(wǎng)絡(luò)商品交易平臺進行選擇時所依據(jù)的唯一的維度。除了價格維度之外,用戶往往還會基于商品質(zhì)量和性能、服務(wù)、歷史評價、供貨的及時性和穩(wěn)定性、交易的各種附加優(yōu)惠措施和限制措施等維度,進行綜合考量。
而在大數(shù)據(jù)技術(shù)的基礎(chǔ)上,網(wǎng)絡(luò)商品交易平臺相比于傳統(tǒng)的商場等線下購物平臺,其主要的優(yōu)勢就在于能夠通過聚合平臺上全部商品供應(yīng)方和全部消費者等海量信息資源,除了價格維度,在以上各個其它維度上也均可以提供準確、充足和多源的數(shù)據(jù),從根本上消除了信息不對稱,最終能夠最優(yōu)化地實現(xiàn)商品交易。
為了使網(wǎng)絡(luò)商品交易平臺的大數(shù)據(jù)資源能夠服務(wù)于用戶在價格維度和其它各個維度之上的綜合考量,現(xiàn)有的平臺在前文介紹的價格排序、比價、預(yù)測價格等基本分析功能之上,又將商品在其它維度上的狀態(tài)作為參量納入到價格分析功能中來。例如,在價格排序中將商品的質(zhì)量等級、性能參數(shù)、服務(wù)滿意度或好評度作為預(yù)置篩選條件,排除在這些維度上不符合系統(tǒng)定義或用戶自定義的基本要求的商品,然后將符合要求的商品進行價格排序;或者將這些維度作為排序的二級依據(jù),當某些商品的價格相同或足夠接近時,就根據(jù)這些維度上的參量進行排序。又例如,在比價功能中,也首先判斷商品在質(zhì)量等級、性能參數(shù)、服務(wù)滿意度或好評度等維度上是否滿足相同或足夠近似,在滿足的前提下再去執(zhí)行價格維度的比較。以上優(yōu)化后的分析功能避免了將兩種性能、質(zhì)量、服務(wù)或口碑相差懸殊的商品單純進行價格排序或比較所帶來的誤導效應(yīng)。
對于同一用戶而言,各種作為交易對象的商品往往不是彼此孤立的,而是具有直接明顯聯(lián)系或間接潛在聯(lián)系的組合對象。由兩種或兩種以上類型的交易商品形成組合對象,組合對象包括成套組合配件、共同應(yīng)用場景、存在關(guān)聯(lián)因素等多種關(guān)系形態(tài)。例如,用戶購買了某一品牌和型號的單反相機后往往還要購置與其品牌型號匹配的可更換式長焦、中焦、廣角鏡頭,由此形成的組合對象屬于成套配件等情形。用戶購買了汽車之后,又常常會繼續(xù)購買汽車坐墊、車內(nèi)飾品、車載電話、車用清潔保養(yǎng)工具等;以上商品的組合對象并不是主配件關(guān)系,坐墊、飾品、電話及工具的品牌、型號、產(chǎn)品形態(tài)和功能與汽車本身的品牌和車型并沒有直接的匹配要求;但以上商品的組合對象具有較為明顯的共同應(yīng)用場景,故而屬于共同應(yīng)用;用戶為冬天御寒而購置皮靴、帽子、手套、羽絨服也屬于與之類似的共同應(yīng)用的情形。又例如,某用戶為應(yīng)付夏季炎熱暴曬而購買了空調(diào)、防曬霜、冷飲,以上商品雖然未必具有或并不具有共同的應(yīng)用場景,但是是基于同一個驅(qū)動因素而產(chǎn)生的交易,因而可以認為屬于存在關(guān)聯(lián)因素的組合對象。
對于上述各類情況下,在大數(shù)據(jù)基礎(chǔ)之上,如何由多種類型的交易商品形成組合方案,進而綜合考量價格維度和其它維度而形成優(yōu)化的組合對象,這是網(wǎng)絡(luò)商品交易平臺所面臨的一個比較難以解決的技術(shù)問題。例如,用戶購買了汽車之后就會考慮購置車用設(shè)施的問題;以上文提及的汽車坐墊、車內(nèi)飾品、車載電話、車用清潔保養(yǎng)工具為例,這些類型的車用設(shè)施哪些類型不買,哪些類型買,如果買各類型分別買幾件,這就涉及到形成組合方案的問題;進而,在決定了組合方案以后,對于組合方案中包括的商品類型,如何在海量的品牌、商家、產(chǎn)品型號中實現(xiàn)合理化的選擇,確定購買的具體對象,這就進一步涉及到通過綜合考量而形成優(yōu)化組合對象的問題。
對于成套組合配件的情形,因其選擇的自由度小,可能的組合方案較為有限,平臺可以利用排列組合算法窮舉列出全部的組合方案,再在每一種組合方案下基于前文所述的在價格維度和其它維度的綜合考量之下的價格排序、比價等分析功能,形成優(yōu)化的組合對象,為用戶提供購買推薦等平臺服務(wù)。
但是對于前文所述的共同應(yīng)用場景、存在關(guān)聯(lián)因素等很多情形下,由于選擇自由度極大,組合方案就處于具有高度靈活性和不確定性的狀態(tài);而且,在確定了組合方案之后,對于該方案中每一商品類型,在決定該類型中所購買的具體對象(即購買平臺上哪個商家提供的哪一個具體商品)時,又不僅需要考量該具體對象本身在價格維度和其他維度上的狀態(tài)優(yōu)化,更要考慮該具體對象與其他類型中的具體對象之間的相互影響,并保證由此形成的組合對象整體在價格維度和其他維度之上的狀態(tài)優(yōu)化。
可見,對于形成交易商品的優(yōu)化組合這一問題,由于上述自由度大、不確定性強和相互影響關(guān)系復雜的原因,現(xiàn)有網(wǎng)絡(luò)商品交易平臺基于價格維度和其它維度的狀態(tài)實現(xiàn)的排序、比價等大數(shù)據(jù)分析功能還難以提供對用戶真正有幫助的解決方式。
技術(shù)實現(xiàn)要素:
鑒于上述現(xiàn)有技術(shù)中存在的以上問題,本發(fā)明目的在于提供一種大數(shù)據(jù)平臺的價格信息優(yōu)化組合方法與系統(tǒng)。本發(fā)明作為網(wǎng)絡(luò)商品交易平臺的后臺支撐,能夠在收集、聚合、提取、分析各種商品類型下的各個具體商品在價格維度和其它維度上的狀態(tài)與屬性的基礎(chǔ)之上,根據(jù)邊界條件和用戶趨向而形成在價格維度和其它維度上得到優(yōu)化的交易具體商品組合對象,從而為用戶在平臺選擇商品的過程中提供個性化推薦等形式的輔助。
本發(fā)明提供的價格信息優(yōu)化組合方法,其特征在于,包括以下步驟:
步驟1:根據(jù)用戶在網(wǎng)絡(luò)平臺上的操作,觸發(fā)組合對象的生成過程,該組合對象是在價格維度和其它維度上得到優(yōu)化的、由一組具體對象構(gòu)成的組合;并且,根據(jù)用戶的操作,獲得備選對象類型集合;
步驟2,從網(wǎng)絡(luò)平臺的大數(shù)據(jù)信息中獲得備選對象類型下的每一具體對象在價格維度上的價格值,以及從網(wǎng)絡(luò)平臺的大數(shù)據(jù)信息中獲得每一具體對象在至少一個其它維度上的狀態(tài)并量化轉(zhuǎn)換為屬性值;
步驟3,獲得預(yù)算邊界參數(shù)以及用戶價格-屬性趨向參數(shù);
步驟4,針對每一個備選對象類型下的全部具體對象在價格維度上的價格值,劃分若干價格區(qū)間;并且根據(jù)每個具體對象的價格值,確定歸屬到各個價格區(qū)間對應(yīng)的對象集合;篩選出符合用戶的預(yù)算邊界參數(shù)限制的備選對象類型的價格區(qū)間
步驟5,針對被篩選出來的每一個備選對象類型的每一個價格區(qū)間,分析歸屬于該價格區(qū)間相應(yīng)對象集合的具體對象在至少一個其它維度上的屬性值,獲取每個價格區(qū)間相應(yīng)對象集合的區(qū)間屬性分布特征;
步驟6,基于被篩選出來的每一個備選對象類型的每一個價格區(qū)間對應(yīng)對象集合的區(qū)間屬性分布特征,對這些對象集合內(nèi)的具體對象的歸屬進行重新劃分,形成每一個備選對象類型的屬性-價格區(qū)間及歸屬于每個屬性-價格區(qū)間的對象集合;
步驟7,對于每一個備選對象類型的每一個屬性-價格區(qū)間及歸屬于每個屬性-價格區(qū)間的對象集合,根據(jù)用戶的價格-屬性趨向參數(shù),為每一個對象集合的屬性-價格區(qū)間生成備選具體對象,并且在滿足預(yù)算邊界參數(shù)的前提下,通過對不同備選對象類型的備選具體對象進行組合而生成所述組合對象。
優(yōu)選的是,步驟1中,觸發(fā)組合對象的生成過程的操作包括但不限于:用戶在網(wǎng)絡(luò)平臺上針對具體對象所執(zhí)行的交易操作,用戶在網(wǎng)絡(luò)平臺上針對具體對象所執(zhí)行的鎖定操作或信息獲取操作,用戶在網(wǎng)絡(luò)平臺上針對特定對象類型所執(zhí)行的鎖定操作或信息獲取操作,用戶主動請求提供組合對象推薦的操作。
優(yōu)選的是,步驟2中,所述至少一個其它維度上的屬性值包括但不限于:商品的自身屬性維度上的屬性值、服務(wù)屬性維度上的屬性值、評價屬性維度上的屬性值、交易相關(guān)時間屬性維度和數(shù)量屬性維度上的屬性值、商品交易的附加值屬性維度上的屬性值。
優(yōu)選的是,步驟2中,當具體對象具有一個或多個所述其它維度上的兩個或兩個以上的屬性值時,所述屬性值具有優(yōu)先度排序。
優(yōu)選的是,步驟5中,各個其它維度作為空間坐標系,而將具體對象在各個其它維度上的屬性值作為坐標,從而將每個具體對象表征為在該空間坐標系上的向量VID
其中上標ID表示某一具體對象的標識符;表示該具體對象在價格維度以外的第一其它維度上的屬性值,w1表示該第一其它維度的權(quán)重值,權(quán)重值由屬性值的優(yōu)先度排序決定,優(yōu)先度排序越高則權(quán)重值越大,表示該具體對象在第一其它維度上的坐標值;相類似地,表示該具體對象在價格維度以外的第二、第三直至第k其它維度上的屬性值,w2,w3...wk表示第二、第三直至第k其它維度的權(quán)重值,表示該具體對象在第二、第三直至第k其它維度上的坐標值;
將表示兩個具體對象的向量VID1和VID2的內(nèi)積距離或者余弦距離作為兩個具體對象的距離H;
基于具體對象的向量之間的距離,利用K-means聚類算法通過對任一價格區(qū)間上的具體對象聚類而生成所述區(qū)間屬性分布特征。
進一步優(yōu)選的是,步驟5中,對于任一價格區(qū)間上的具體對象,任意選取其中K個具體對象作為初始的簇中心點;計算該價格區(qū)間上的各具體對象與各簇中心點之間的距離,將每個具體對象歸入與其距離最近的簇中心點對應(yīng)的聚類簇中;在所有具體對象歸入完畢之后,重新確定各個聚類簇的簇中心點,并且判斷重新確定的簇中心點相對于原簇中心點有無變化;若有變化則再次計算該價格區(qū)間上的各具體對象與各重新確定的簇中心點之間的距離,將每個具體對象歸入與其距離最近的簇中心點對應(yīng)的聚類簇中,并再次重新確定簇中心點并判斷簇中心點是否有變化;若重新確定的簇中心點相對于原簇中心點無變化,則完成聚類,獲得K個由具體對象組成的聚類簇;從K個聚類簇中選取含具體對象的數(shù)量最多的N個聚類簇,將這N個聚類簇作為主要聚類簇,將主要聚類簇的簇中心點及其簇半徑作為該價格區(qū)間相應(yīng)對象集合的區(qū)間屬性分布特征。
優(yōu)選的是,步驟6中,判斷每一價格區(qū)間相應(yīng)對象集合中的每一個具體對象與其它價格區(qū)間相應(yīng)對象集合的區(qū)間屬性分布特征是否匹配,若匹配則將該具體對象重新劃分至歸屬于其它價格區(qū)間相應(yīng)對象集合所對應(yīng)的對象集合,重新劃分后的對象集合作為所述歸屬于每個屬性-價格區(qū)間的對象集合。
優(yōu)選的是,步驟6中,在完成針對所有具體對象歸屬的重新劃分之后,針對重新劃分之后新形成的各對象集合,確定每個對象集合中的具體對象的價格值分布區(qū)間和在至少一個其它維度上的屬性值分布區(qū)間,每個對象集合的價格值分布區(qū)間和屬性值分布區(qū)間共同作為該對象集合的屬性-價格區(qū)間。
優(yōu)選的是,步驟7中,對于價格-屬性趨向參數(shù)采用屬性優(yōu)先的用戶,在每一個對象集合中選取在該集合的屬性值分布區(qū)間上具有最優(yōu)屬性值的具體對象,作為備選具體對象;在滿足預(yù)算邊界參數(shù)的前提下,通過對不同備選對象類型的備選具體對象進行組合,而生成所述組合對象;對于價格-屬性趨向參數(shù)采用價格優(yōu)先的用戶,在每一個對象集合中選取在該集合的價格值分布區(qū)間上具有最低價格值的具體對象,作為備選具體對象,在滿足預(yù)算邊界參數(shù)的前提下,通過對不同備選對象類型的備選具體對象進行組合,而生成所述組合對象。
本發(fā)明進而提供了一種大數(shù)據(jù)平臺的價格信息優(yōu)化組合系統(tǒng),包括:大數(shù)據(jù)信息庫以及價格信息優(yōu)化組合部件;
所述大數(shù)據(jù)信息庫用于從網(wǎng)絡(luò)平臺獲得并存儲關(guān)于每一個具體對象在價格維度上的價格值和其它維度上的狀態(tài)的大數(shù)據(jù)信息;
所述價格信息優(yōu)化組合部件用于從所述大數(shù)據(jù)信息庫獲取關(guān)于每一個具體對象在價格維度上的價格值和其它維度上的狀態(tài)的大數(shù)據(jù)信息,并且執(zhí)行上述價格信息優(yōu)化組合方法以便獲得組合對象。
本發(fā)明有效解決了基于各種具體商品在價格維度和其它維度上的狀態(tài)如何形成兩種或更多的具體商品的優(yōu)化組合的問題。本發(fā)明能夠在收集、聚合、提取、分析各種商品類型下的各個具體商品在價格維度和其它維度上的狀態(tài)與屬性的基礎(chǔ)之上,根據(jù)邊界條件和用戶趨向而形成在價格維度和其它維度上得到優(yōu)化的交易具體商品組合對象,適用于在網(wǎng)絡(luò)商品交易平臺上實現(xiàn)商品組合的推薦等應(yīng)用場景。
附圖說明
圖1是本發(fā)明所述價格信息優(yōu)化組合方法示意圖;
圖2是本發(fā)明所述價格信息優(yōu)化組合系統(tǒng)的示意圖。
具體實施方式
下面通過實施例,對本發(fā)明的技術(shù)方案做進一步具體的說明。
本發(fā)明提供的價格信息優(yōu)化組合方法旨在提供由網(wǎng)絡(luò)商品交易平臺提供的可交易的一組具體商品(下稱具體對象)構(gòu)成的組合對象;其中,所述組合對象在價格維度上和其它維度上得到了優(yōu)化,且符合邊界條件和用戶趨向。下面按步驟順序介紹本發(fā)明的該方法。
步驟1,根據(jù)用戶在網(wǎng)絡(luò)平臺上的操作,觸發(fā)組合對象的生成過程;并且,根據(jù)用戶的操作,獲得備選對象類型集合。能夠觸發(fā)組合對象生成過程的操作包括但不限于:用戶在網(wǎng)絡(luò)平臺上針對具體對象所執(zhí)行的交易操作(例如,加入購物車、生成訂單、支付訂單等),用戶在網(wǎng)絡(luò)平臺上針對具體對象所執(zhí)行的鎖定操作或信息獲取操作(例如,加為關(guān)注商品、加為喜歡的商品、進入商品主頁瀏覽詳情等),用戶在網(wǎng)絡(luò)平臺上針對特定對象類型所執(zhí)行的鎖定操作或信息獲取操作(例如,搜索某一類型中的商品、訂閱關(guān)于某一類型商品的新聞和推送等),用戶主動請求提供組合對象推薦的操作(例如,用戶點擊“推薦與汽車相關(guān)的商品套裝”或“推薦冬季服裝套裝”等鏈接從而請求平臺提供對應(yīng)的組合對象)。
在生成過程被觸發(fā)之后,獲得備選對象類型集合,該集合中的備選對象類型與用戶的操作所針對的具體對象或特定對象類型是相關(guān)聯(lián)的,該關(guān)聯(lián)體現(xiàn)在備選對象類型與該具體對象或特定對象類型具備共同應(yīng)用場景或存在關(guān)聯(lián)因素,且希望該集合在具備關(guān)聯(lián)性的前提下包含盡可能多的商品類型,以此為原則由平臺預(yù)先設(shè)定好每一種商品類型或具體商品對應(yīng)的備選對象類型集合。例如,用戶在網(wǎng)絡(luò)平臺訂購了一輛汽車,在該平臺中預(yù)先設(shè)定了與汽車相關(guān)聯(lián)的備選對象類型的集合,該集合根據(jù)共同應(yīng)用場景方面的關(guān)聯(lián)性而包含了汽車坐墊、車內(nèi)飾品、車載電話、車用清潔保養(yǎng)工具、汽車音響、行車記錄儀、GPS導航儀等等備選商品類型,乃至汽車維修服務(wù)、汽車保險理賠等虛擬化的備選商品類型,從而根據(jù)用戶的操作可以獲得該與汽車相關(guān)聯(lián)的備選對象類型集合。又例如,可以根據(jù)用戶在一定時間段以內(nèi)的全部操作,或者是連續(xù)若干次操作,來確定相關(guān)聯(lián)的備選對象類型集合;用戶在平臺上連續(xù)訂購了空調(diào)、防曬霜、冷飲,則根據(jù)以上具體商品所具有的相同驅(qū)動因素,可以獲得與防暑降溫相關(guān)聯(lián)的備選對象類型的集合,包括電風扇、電冰箱、遮陽帽、涼鞋、冰袋、雪糕等備選對象類型。
步驟2,從網(wǎng)絡(luò)平臺的大數(shù)據(jù)信息中獲得備選對象類型下的每一具體對象在價格維度上的價格值,以及從網(wǎng)絡(luò)平臺的大數(shù)據(jù)信息中獲得每一具體對象在至少一個其它維度上的狀態(tài)并量化轉(zhuǎn)換為屬性值。
在網(wǎng)絡(luò)平臺上,在所述備選對象類型集合中的每一個備選對象類型下,都存在著海量的可供選擇的具體對象(即具體商品);包括不同品牌不同型號的具體商品;即便是同一品牌同一型號的具體商品,由不同的商家經(jīng)銷,其在價格、售后服務(wù)、用戶評價、供貨時間、附贈品等方面也難免或多或少存在差異,因而也屬于不同的具體對象。對于備選對象類型下的每一具體對象,利用網(wǎng)絡(luò)平臺提供的大數(shù)據(jù)信息能夠定量、全面、精確地記錄了其在價格維度和其它各個維度上的狀態(tài)這一有利條件,本步驟中,可以獲得每一具體對象在價格維度上的價格值,即每一具體商品在該網(wǎng)絡(luò)平臺上登記的售價。
同時,本步驟中,還獲得每一具體對象在至少一個其它維度上的狀態(tài),并將其狀態(tài)量化表征為該維度上的屬性值,下面具體介紹本發(fā)明所考量的每個其它維度上的屬性值:1.商品的自身屬性維度上的屬性值,商品自身屬性維度包括但不限于商品的品牌、配置、功能,將每一具體對象在以上品牌、配置、功能方面的狀態(tài)按照量化打分規(guī)則轉(zhuǎn)化為屬性值。例如,對于品牌,根據(jù)平臺預(yù)設(shè)的品牌-打分轉(zhuǎn)換表,將每種品牌轉(zhuǎn)換為一定的品牌打分,知名品牌相對于一般品牌打分更高;對于配置,也可以根據(jù)平臺預(yù)設(shè)的配置-打分轉(zhuǎn)換表,將具體商品所具有的每一項配置轉(zhuǎn)換為一定的配置打分,例如,前文提到的汽車音響,配備了高保真音箱的具體商品相比普通音箱的商品在該項配置上打分更高;功能的打分與配置類似,例如,具備音樂播放功能的行車記錄儀相對于沒有該功能的行車記錄儀在該項功能上的打分更高;將上述品牌、配置、功能上的打分分別作為本維度上的屬性值;或者,對品牌、配置、功能上的打分按照不同的權(quán)重累加或求其均值,即可以量化獲得商品自身屬性維度上的屬性值。2.商品相關(guān)的服務(wù)屬性維度上的屬性值,商品服務(wù)屬性維度包括但不限于商品的退貨期、換貨期、免費保修期、客戶服務(wù)滿意度,可以將退貨期、換貨期、免費保修期的時長以及客戶服務(wù)滿意度的統(tǒng)計均值作為在商品服務(wù)屬性維度上的量化屬性值。3.商品相關(guān)的評價屬性維度上的屬性值,商品評價屬性維度包括但不限于商品歷史銷量、用戶好評度得分、專家好評度得分,將以上銷量值和得分作為商品評價屬性維度上的屬性值。4.商品交易相關(guān)時間屬性維度和數(shù)量屬性維度上的屬性值;時間屬性維度包括但不限于商品可供貨的最早時間、商品穩(wěn)定供貨的可持續(xù)時間、商品運輸時間,將這些時間長度作為商品交易相關(guān)的時間屬性維度上的量化屬性值;數(shù)量屬性維度包括但不限于商品最大交易限量、最低交易限量、每日/每周/每月/每季度/每年的最大供貨量和最低供貨量等,將這些限量或數(shù)量作為商品交易相關(guān)的數(shù)量屬性維度上的量化屬性值。5.商品交易的附加值屬性維度上的屬性值,附加值屬性維度包括但不限于商品附贈消費券、商品附贈品、延長保修期等商品附贈服務(wù),將消費券額度、附贈品價格以及延保時長作為商品交易的附加值屬性維度上的量化屬性值。
對于所涉及到的每一個具體對象,可以選取上述其它維度中的至少一個維度上的至少一個屬性值來代表該具體對象的屬性,進行后續(xù)的優(yōu)化組合過程。當需要從一個或多個維度上選取兩個或兩個以上的屬性值來代表該具體對象的屬性時,可以根據(jù)不同的情況,決定考量這些屬性值時候的優(yōu)先度排序。例如,我們選取了具體商品的自身屬性維度上的屬性值(取品牌、配置、功能的加權(quán)均值)、服務(wù)屬性維度上的免費保修期屬性值、評價屬性維度上的商品歷史銷量以及商品交易相關(guān)時間屬性維度上的商品運輸時間來代表每個具體商品的屬性;并且,決定優(yōu)先度排序為自身屬性維度屬性值最優(yōu)先、商品歷史銷量屬性值其次、免費保修期屬性值再次、商品運輸時間屬性值最后。則在后續(xù)的優(yōu)化組合過程中,涉及各個具體商品的排序時,首先比較具體商品的自身屬性維度屬性值并根據(jù)該屬性值排序;當兩個具體商品的自身屬性維度屬性值相同時,再根據(jù)商品歷史銷量屬性值對二者進行排序,以此類推。
步驟3,獲得預(yù)算邊界參數(shù)以及用戶價格-屬性趨向參數(shù)。本發(fā)明對于各類型下的各種具體對象基于價格維度和其它維度優(yōu)化為組合對象的過程,是以組合對象中包含的具體對象的總價格值不超過一固定的預(yù)算作為其邊界條件的,該預(yù)算即為預(yù)算邊界參數(shù)??梢杂捎脩糨斎牖蜻x定該預(yù)算邊界參數(shù),例如,用戶點擊“推薦與汽車相關(guān)的商品套裝”后顯示“500元以內(nèi)套裝”、“1000元以內(nèi)套裝”、“3000元以內(nèi)套裝”等子選項供用戶選擇。該預(yù)算邊界參數(shù)也可以是由網(wǎng)絡(luò)平臺基于用戶大數(shù)據(jù)而設(shè)定的,例如經(jīng)統(tǒng)計海量用戶的消費記錄數(shù)據(jù),500元以內(nèi)汽車相關(guān)商品套裝的銷售量占比最大,則當某個用戶訂購了汽車而觸發(fā)了生成汽車相關(guān)商品套裝推薦的優(yōu)化組合過程之后,平臺將預(yù)算邊界參數(shù)默認設(shè)定為500元以內(nèi)。也可以使預(yù)算邊界參數(shù)與某一用戶觸發(fā)優(yōu)化組合過程的操作所針對的具體對象的價格相匹配,例如,用戶訂購的汽車的價格越高,則生成汽車相關(guān)商品套裝推薦的過程中平臺默認的預(yù)算邊界參數(shù)也越高,二者具有一定的正比例換算率。
進而,確定用戶價格-屬性趨向參數(shù)。用戶價格-屬性趨向參數(shù)可以取屬性優(yōu)先與價格優(yōu)先二者中的任何一個。屬性優(yōu)先指的是在生成優(yōu)化的組合對象過程中,在備選對象類型中優(yōu)先選取屬性值最優(yōu)的具體對象加入該組合對象;在不超過預(yù)算邊界的前提下,屬性優(yōu)先往往造成組合對象中包含的具體對象類型和數(shù)量較少但每個具體對象的屬性狀況較優(yōu)。相反,價格優(yōu)先指的是在備選對象類型中優(yōu)先選取價格值最低的具體對象加入組合對象;價格優(yōu)先往往使得組合對象中包含的具體對象的類型和數(shù)量較多,但每個具體對象的屬性狀況無法達到最優(yōu)。用戶價格-屬性趨向可以由用戶根據(jù)自身的主觀傾向和經(jīng)濟能力決定,并且網(wǎng)絡(luò)平臺在用戶注冊或每次執(zhí)行推薦時提供交互頁面或選項以便采集用戶的用戶價格-屬性趨向參數(shù)。當然,在不明確用戶趨向的情況下,也可以按照屬性優(yōu)先與價格優(yōu)先分別生成相應(yīng)的優(yōu)化的組合對象,以供用戶選擇;并且,將用戶對按照屬性優(yōu)先與價格優(yōu)先分別生成的組合對象的選擇記錄下來,以便供下一次進行優(yōu)化組合推薦時判斷用戶的趨向。
步驟4,針對每一個備選對象類型下的全部具體對象在價格維度上的價格值,劃分若干價格區(qū)間,并且根據(jù)每個具體對象的價格值,確定歸屬到各個價格區(qū)間對應(yīng)的對象集合。例如,對于與汽車相關(guān)聯(lián)的備選對象類型集合中的汽車音響這一備選對象類型,利用平臺在價格維度上的大數(shù)據(jù)進行統(tǒng)計,發(fā)現(xiàn)汽車音響類型下的各個具體商品的價格值分布在799元至3580元的數(shù)值范圍之上,則可以劃分為799-999、1000-1999、2000-2999、3000-3580的價格區(qū)間,并且如果某個具體的汽車音響商品的價格值為1500元,則將該具體對象歸屬到1000-1999的價格區(qū)間對應(yīng)的對象集合,依次類推,直至將所有具體的汽車音響商品都依據(jù)價格值歸屬到相應(yīng)價格區(qū)間的對象集合。又例如,GPS導航儀這一備選對象類型下的各種具體對象的價格值分布在205元-675元的數(shù)據(jù)范圍上,則劃分為205-299、300-399、400-499、500-599、600-675的價格區(qū)間,并將所有的GPS導航儀類型具體商品都歸屬到相應(yīng)價格區(qū)間的對象集合。相類似的,汽車坐墊這一備選對象類型下的各種具體對象的價格值分布在55元-298元的數(shù)據(jù)范圍上,則劃分為55-99、100-199、200-298的價格區(qū)間,并且將所有的汽車坐墊類型的具體商品歸屬至相應(yīng)價格區(qū)間的對象集合內(nèi)。
并且,在步驟4中,篩選出符合用戶的預(yù)算邊界參數(shù)限制的備選對象類型的價格區(qū)間,在后續(xù)的優(yōu)化組合過程中納入考量。例如,用戶的預(yù)算邊界參數(shù)設(shè)定為500元以內(nèi),則汽車音響類型下的所有價格區(qū)間均不符合該參數(shù)的限制,則在后續(xù)計算中排除汽車音響這一備選對象類型。對于GPS導航儀這一備選對象類型,篩選出205-299、300-399、400-499三個價格區(qū)間。對于汽車坐墊,經(jīng)篩選其全部價格區(qū)間55-99、100-199、200-298均符合用戶的預(yù)算邊界參數(shù)。如圖1所示,其中P1、P2、P3表示針對某一個備選對象類型(如GPS導航儀這一備選對象類型)篩選出來的價格區(qū)間,每個價格區(qū)間相應(yīng)的具體對象集合為G1、G2、G3。
步驟5,針對被篩選出來的每一個備選對象類型的每一個價格區(qū)間,分析歸屬于該價格區(qū)間相應(yīng)對象集合的具體對象在至少一個其它維度上的屬性值,獲取每個價格區(qū)間相應(yīng)對象集合的區(qū)間屬性分布特征。
前文中已經(jīng)提到,對于每一個具體對象,以價格維度以外的至少一個其它維度上的至少一個屬性值來代表該具體對象的屬性;并且當具體對象以從一個或多個維度上選取兩個或兩個以上的屬性值來代表時,這些屬性值具有與之對應(yīng)的優(yōu)先度排序??梢詫⒏鱾€其它維度作為空間坐標系,而將具體對象在各個其它維度上的屬性值作為坐標,從而將每個具體對象表征為在該空間坐標系上的向量,即
其中上標ID表示某一具體對象的標識符;表示該具體對象在價格維度以外的第一其它維度上的屬性值,w1表示該第一其它維度的權(quán)重值,權(quán)重值由屬性值的優(yōu)先度排序決定,優(yōu)先度排序越高則權(quán)重值越大,表示該具體對象在第一其它維度上的坐標值;相類似地,表示該具體對象在價格維度以外的第二、第三直至第k其它維度上的屬性值,w2,w3...wk表示第二、第三直至第k其它維度的權(quán)重值,表示該具體對象在第二、第三直至第k其它維度上的坐標值,從而就將某一標識符為ID的具體對象表征為被選擇作為考量因素的其它維度所形成的空間坐標系中的一個向量VID。舉例來說,第一其它維度可以是商品的自身屬性維度,取品牌、配置、功能打分的加權(quán)均值作為第一其它維度上的屬性值自身屬性維度的優(yōu)先度排序最高,相而相應(yīng)的w1值最大;第二其它維度是服務(wù)屬性維度,將免費保修期作為該第二其它維度上的屬性值第三其它維度是評價屬性維度,將商品歷史銷量值作為第三其它維度上的屬性值第四其它維度是商品交易相關(guān)時間屬性維度,將商品運輸時間作為第三其它維度上的屬性值按照上述公式,計算該具體商品的向量
當然,如果在某一個或某幾個其它維度上選擇了兩個或更多屬性值,則可以為該具體對象建立兩個或更多的VID,再求該兩個或更多的VID的合向量,作為表示該具體對象屬性的向量。例如,選取了退貨期和免費保修期兩個屬性值來代表某個標識符為ID的具體對象在服務(wù)屬性維度上的屬性,則我們可以為該具體對象建立兩個向量VID和V′ID。其中,在作為第二其它維度的服務(wù)屬性維度上的屬性值取免費保修期;其中作為第二其它維度的服務(wù)屬性維度上的屬性值取退貨期;進而,求兩個向量VID和V′ID的合向量,作為最終表示該具體對象的向量。
對于標識符分別為ID1和ID2的兩個具體對象,在求得了各自的向量VID1和VID2之后;將這兩個向量VID1和VID2的內(nèi)積距離或者余弦距離作為兩個具體對象的距離H。
對于每個價格區(qū)間上的具體對象,可以利用K-means聚類算法,將其劃分為若干聚類簇,并提取其中主要聚類簇的簇中心點及其簇半徑,作為該價格區(qū)間的區(qū)間屬性分布特征。具體來說,對于任一價格區(qū)間上的具體對象,任意選取其中K個具體對象(K為預(yù)定義值)作為初始的簇中心點;計算該價格區(qū)間上的各具體對象與各簇中心點之間的距離,將每個具體對象歸入與其距離最近的簇中心點對應(yīng)的聚類簇中;在所有具體對象歸入完畢之后,重新確定各個聚類簇的簇中心點,并且判斷重新確定的簇中心點相對于原簇中心點有無變化;若有變化則再次計算該價格區(qū)間上的各具體對象與各重新確定的簇中心點之間的距離,將每個具體對象歸入與其距離最近的簇中心點對應(yīng)的聚類簇中,并再次重新確定簇中心點并判斷簇中心點是否有變化;若重新確定的簇中心點相對于原簇中心點無變化,則完成聚類,獲得K個由具體對象組成的聚類簇;從K個聚類簇中選取含具體對象的數(shù)量最多的N個聚類簇(N小于K,如,可使N取2-3),將這N個聚類簇作為主要聚類簇,將主要聚類簇的簇中心點及其簇半徑(即該聚類簇中各具體對象與簇中心點之間的最大距離)作為該價格區(qū)間相應(yīng)對象集合區(qū)間屬性分布特征。如圖1所示,對于價格區(qū)間P1、P2、P3,相對應(yīng)的對象集合為G1、G2、G3,為其中的每一個確定區(qū)間屬性分布特征。
步驟6,基于被篩選出來的每一個備選對象類型的每一個價格區(qū)間對應(yīng)對象集合的區(qū)間屬性分布特征,對這些對象集合內(nèi)的具體對象的歸屬進行重新劃分,形成每一個備選對象類型的屬性-價格區(qū)間及歸屬于每個屬性-價格區(qū)間的對象集合。具體來說,基于價格區(qū)間P3對應(yīng)的對象集合G3的區(qū)間屬性分布特征,判斷價格區(qū)間P1、P2對應(yīng)的G1、G2中的每一個具體對象與作為G3的區(qū)間屬性分布特征的簇中心點之間的距離是否在作為G3的區(qū)間屬性分布特征的簇半徑以內(nèi);例如,若G2中標識符為ID1的具體對象與G3的簇中心點之間的距離在G3的簇半徑以內(nèi),則將該標識符為ID1的具體對象重新劃分至歸屬于P3對應(yīng)的對象集合G3;相類似地,將P2對應(yīng)的G2中標識符為ID2的具體對象重新劃分至歸屬于P1對應(yīng)的對象集合G1;將P3對應(yīng)的G3中標識符為ID3的具體對象重新劃分至歸屬于P2對應(yīng)的對象集合G2;將P1對應(yīng)的G1中標識符為ID4的具體對象重新劃分至歸屬于P2對應(yīng)的對象集合G2。在完成針對所有具體對象歸屬的重新劃分之后,針對重新劃分之后新形成的各對象集合G1’、G2’、G3’,確定每個對象集合中的具體對象的價格值分布區(qū)間P1’、P2’、P3’和在至少一個其它維度上的屬性值分布區(qū)間D1’、D2’、D3’。每個對象集合的價格值分布區(qū)間和屬性值分布區(qū)間共同作為該對象集合的屬性-價格區(qū)間。例如,對于GPS導航儀這一備選對象類型,重新劃分后形成的三個對象集合的價格值分布區(qū)間調(diào)整為205-380、275-415、370-499。對于汽車坐墊,重新劃分后形成的三個對象集合的價格值分布區(qū)間調(diào)整為55-120、90-220、195-298。
步驟7,對于每一個備選對象類型的每一個屬性-價格區(qū)間及歸屬于每個屬性-價格區(qū)間的對象集合,根據(jù)用戶的價格-屬性趨向參數(shù),為每一個對象集合的屬性-價格區(qū)間生成備選具體對象,并且在滿足預(yù)算邊界參數(shù)的前提下,通過對不同備選對象類型的備選具體對象進行組合而生成所述組合對象。
對于價格-屬性趨向參數(shù)采用屬性優(yōu)先的用戶,在每一個對象集合中選取在該集合的屬性值分布區(qū)間上具有最優(yōu)屬性值的具體對象,作為備選具體對象。例如,分別在D1’、D2’、D3’中選取屬性值最優(yōu)的具體對象S1、S2、S3作為每個對象集合的備選具體對象。當D1’、D2’、D3’只包括一個維度上的屬性值(例如只包括自身屬性維度上的屬性值)時,則按照該維度上屬性值的大小進行最優(yōu)屬性值的確定。當D1’、D2’、D3’包括兩個或更多維度上的屬性值時,按照前文所介紹的優(yōu)先度排序,選取在最優(yōu)先維度上的屬性值最優(yōu)的具體對象,當最優(yōu)先維度上兩上或更多具體對象的屬性值相同時,再根據(jù)次優(yōu)先維度上屬性值的大小選取具體對象。當兩個或更多的具體對象在D1’、D2’、D3’所包含的各個維度上屬性值均相同且均為最優(yōu)時,則根據(jù)這個具體對象的價格值,從價格值最低的具體對象中任意選取一個作為備選具體對象S1、S2、S3。例如,對于GPS導航儀這一備選對象類型,按照屬性優(yōu)先,為三個對象集合分別選取的備選具體對象S1、S2、S3的價格值分別為285、350、455;同理,對于汽車坐墊,這一備選對象類型,按照屬性優(yōu)先,為三個對象集合分別選取的備選具體對象S1’、S2’、S3’的價格值分別為80、145、225。
對于所選定的每一種備選對象類型,預(yù)先定義一個類型重要度的排序。例如,與汽車相關(guān)聯(lián)的備選對象類型的集合當中,可定義GPS導航儀的類型重要度最高,汽車座墊的類型重要度次高,行車記錄儀的類型重要度再次。
接下來,在滿足預(yù)算邊界參數(shù)的前提下,通過對不同備選對象類型的備選具體對象進行組合,而生成所述組合對象。首先選取類型重要度最高和次高的兩種備選對象類型,使這兩種類型下的備選具體對象S1、S2、S3中的每一個與備選具體對象S1’、S2’、S3’中的每一個進行兩兩組合,并且排除組合后形成的組合對象的總價格值超過了預(yù)算邊界參數(shù)500的情形,保留滿足預(yù)算邊界參數(shù)的情形,包括S1+S1’、S1+S2’、S2+S1’、S2+S2’。在屬性優(yōu)選的前提下,從上述滿足預(yù)算邊界參數(shù)的組合對象當中選取使類型重要度最高的備選具體對象的屬性值最優(yōu)的組合對象,作為本發(fā)明最終實現(xiàn)的優(yōu)化組合;如果有兩種或更多的組合對象中類型重要度最高的備選具體對象的屬性值相同,則繼續(xù)選取使類型重要度次高的備選具體對象的屬性值最優(yōu)組合對象,作為本發(fā)明最終實現(xiàn)的優(yōu)化組合。
另一種情況下,對于價格-屬性趨向參數(shù)采用價格優(yōu)先的用戶,在每一個對象集合中選取在該集合的價格值分布區(qū)間上具有最低價格值的具體對象,作為備選具體對象。例如,分別在P1’、P2’、P3’中選取價格值最低的具體對象S1、S2、S3作為每個對象集合的備選具體對象。當兩個或更多的具體對象在P1’、P2’、P3’上的價格值均相同且均為最低時,則從價格值最低的具體對象中選取其中屬性值最優(yōu)的具體對象中的任意一個作為備選具體對象S1、S2、S3。例如,對于GPS導航儀這一備選對象類型,按照價格優(yōu)先,為三個對象集合分別選取的備選具體對象S1、S2、S3的價格值分別為205、275、370;同理,對于汽車坐墊,這一備選對象類型,按照價格優(yōu)先,為三個對象集合分別選取的備選具體對象S1’、S2’、S3’的價格值分別為55、90、195。
接下來,在滿足預(yù)算邊界參數(shù)的前提下,通過對不同備選對象類型的備選具體對象進行組合,而生成所述組合對象。首先選取類型重要度最高和次高的兩種備選對象類型,使這兩種類型下的備選具體對象S1、S2、S3中的每一個與備選具體對象S1’、S2’、S3’中的每一個進行兩兩組合,并且排除組合后形成的組合對象的總價格值超過了預(yù)算邊界參數(shù)500的情形,保留滿足預(yù)算邊界參數(shù)的情形,包括S1+S1’、S1+S2’、S1+S3’、S2+S1’、S2+S2’、S2+S3’、S3+S1’、S3+S2’。在價格優(yōu)先的前提下,從上述滿足預(yù)算邊界參數(shù)的組合對象當中選取使總價格值最低的組合對象,例如,S1+S1’作為本發(fā)明最終實現(xiàn)的優(yōu)化組合。并且,由于該總價格值最低的組合對象S1+S1’仍然低于預(yù)算邊界參數(shù),可以繼續(xù)選取下一個類型重要度的備選對象類型(即行車記錄儀)中按照價格優(yōu)先所確定的備選具體對象,繼續(xù)與S1+S1’按照使組合后的組合對象總價格值最低的規(guī)則進行組合,直至在不超出預(yù)算邊界條件的前提下生成包含盡可能多的備選對象類型的具體對象的組合對象。
本發(fā)明進而提供了一種大數(shù)據(jù)平臺的價格信息優(yōu)化組合系統(tǒng),如圖2所示,包括:大數(shù)據(jù)信息庫21以及價格信息優(yōu)化組合部件22;
所述大數(shù)據(jù)信息庫21用于從網(wǎng)絡(luò)平臺獲得并存儲關(guān)于每一個具體對象在價格維度上的價格值和其它維度上的狀態(tài)的大數(shù)據(jù)信息;
所述價格信息優(yōu)化組合部件22用于從所述大數(shù)據(jù)信息庫獲取關(guān)于每一個具體對象在價格維度上的價格值和其它維度上的狀態(tài)的大數(shù)據(jù)信息,并且執(zhí)行上述價格信息優(yōu)化組合方法以便獲得組合對象。
以上實施例僅用于說明本發(fā)明,而并非對本發(fā)明的限制,有關(guān)技術(shù)領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明的精神和范圍的情況下,還可以做出各種變化和變型,因此所有等同的技術(shù)方案也屬于本發(fā)明的范疇,本發(fā)明的專利保護范圍應(yīng)由權(quán)利要求限定。