本發(fā)明涉及數(shù)據(jù)挖掘領(lǐng)域,具體涉及一種網(wǎng)站提供對象的推薦方法和裝置。
背景技術(shù):
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,人們每天花在瀏覽網(wǎng)絡(luò)上的時間也越來越多,同時更希望瀏覽到自己感興趣的內(nèi)容。在瀏覽網(wǎng)站時,用戶或多或少會體現(xiàn)出自己的某些習(xí)慣,對用戶行為的挖掘可以使得網(wǎng)站開發(fā)者更好地了解用戶的差異和不同需求,提供更符合用戶需求的對象。傳統(tǒng)的預(yù)測方法是采用有預(yù)測的機器學(xué)習(xí),對樣本數(shù)量和樣本質(zhì)量要求很高。而用戶瀏覽網(wǎng)站提供對象的行為很難通過注冊信息或填寫問卷得到大量符合要求的樣本,故需要一種對用戶瀏覽網(wǎng)站提供對象的行為進行挖掘的方法以便網(wǎng)站開發(fā)者更好地為用戶提供對象。
技術(shù)實現(xiàn)要素:
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的網(wǎng)站提供對象的推薦方法和裝置。
依據(jù)本發(fā)明的一個方面,提供了一種網(wǎng)站提供對象的推薦方法,其中,該方法包括:
將網(wǎng)站所提供對象劃分為多個類目;
為所述多個類目分別設(shè)置權(quán)重值;
對于每個類目,將該類目下的所有網(wǎng)站提供對象按照獲取對象所需的代價值進行排序,并按照代價值的排序劃分為多個代價區(qū)間;
根據(jù)用戶在預(yù)設(shè)時間段內(nèi)瀏覽的網(wǎng)站提供對象、網(wǎng)站提供對象所屬類目的權(quán)重值以及網(wǎng)站提供對象所屬的代價區(qū)間,獲得該用戶的代價能力代表值;
根據(jù)該用戶的代價能力代表值,在網(wǎng)站上向該用戶輸出推薦相應(yīng)的網(wǎng)站提供對象的內(nèi)容。
可選地,為所述多個類目分別設(shè)置權(quán)重值包括:
對于每個類目,將該類目下的所有對象的代價值的中間值或平均值取對數(shù)后作為該類目的權(quán)重值。
可選地,該方法進一步包括:
對于每個類目,將該類目下的所有對象按照代價值的排序劃分為多個代價區(qū)間之后,為每個代價區(qū)間賦予相應(yīng)的區(qū)間代表值;其中,代價區(qū)間的排序序號越高,對應(yīng)的區(qū)間代表值越大。
可選地,根據(jù)用戶在預(yù)設(shè)時間段內(nèi)瀏覽的網(wǎng)站提供對象、網(wǎng)站提供對象所屬類目的權(quán)重值以及網(wǎng)站提供對象所屬的代價區(qū)間,獲得該用戶的代價能力代表值包括:
對于該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的每個網(wǎng)站提供對象,獲取該網(wǎng)站提供對象的代價值在其對應(yīng)代價區(qū)間上的位置偏移量;
根據(jù)如下公式計算該用戶的代價能力代表值S(u):
其中,i表示該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的網(wǎng)站提供對象的序號,awardi是該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值在其對應(yīng)代價區(qū)間上的位置偏移量,是該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值對應(yīng)的代價區(qū)間的區(qū)間代表值,是該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象所屬類別的權(quán)重值。
可選地,對于該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的每個網(wǎng)站提供對象,獲取該網(wǎng)站提供對象的代價值在其對應(yīng)代價區(qū)間上的位置偏移量包括:
根據(jù)如下公式計算該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值在其對應(yīng)代價區(qū)間上的位置偏移量awardi:
其中,pricei為該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值,L為該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值對應(yīng)的代價區(qū)間的序號,M為排序序號最高的代價區(qū)間的序號,a和b時序號為L的區(qū)間(a,b]的邊界值。
可選地,各個類目分別劃分為數(shù)目相同的多個區(qū)間。
可選地,所述根據(jù)該用戶的代價能力代表值,在網(wǎng)站上向該用戶輸出推薦相應(yīng)的網(wǎng)站提供對象的內(nèi)容包括:
根據(jù)該用戶的代價能力代表值確定各類目中對應(yīng)的代價區(qū)間;
從所確定的各類目中對應(yīng)的代價區(qū)間中選擇網(wǎng)站提供對象;
在網(wǎng)站上向該用戶輸出推薦所選擇的網(wǎng)站提供對象的內(nèi)容。
依據(jù)本發(fā)明的另一方面,提供了一種網(wǎng)站提供對象的推薦裝置,其中,該裝置包括:
類目劃分單元,適于將網(wǎng)站所提供對象劃分為多個類目;
權(quán)值設(shè)置單元,適于為所述多個類目分別設(shè)置權(quán)重值;
區(qū)間劃分單元,適于對于每個類目,將該類目下的所有網(wǎng)站提供對象按照獲取對象所需的代價值進行排序,并按照代價值的排序劃分為多個代價區(qū)間;
代價能力挖掘單元,適于根據(jù)用戶在預(yù)設(shè)時間段內(nèi)瀏覽的網(wǎng)站提供對象、網(wǎng)站提供對象所屬類目的權(quán)重值以及網(wǎng)站提供對象所屬的代價區(qū)間,獲得該用戶的代價能力代表值;
推薦單元,適于根據(jù)該用戶的代價能力代表值,在網(wǎng)站上向該用戶輸出推薦相應(yīng)的網(wǎng)站提供對象的內(nèi)容。
可選地,所述權(quán)值設(shè)置單元,適于對于每個類目,將該類目下的所有對象的代價值的中間值或平均值取對數(shù)后作為該類目的權(quán)重值。
可選地,所述區(qū)間劃分單元,適于對于每個類目,將該類目下的所有對象按照代價值的排序劃分為多個代價區(qū)間之后,進一步為每個代價區(qū)間賦予相應(yīng)的區(qū)間代表值;其中,代價區(qū)間的排序序號越高,對應(yīng)的區(qū)間代表值越大。
可選地,所述代價能力挖掘單元,適于對于該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的每個網(wǎng)站提供對象,獲取該網(wǎng)站提供對象的代價值在其對應(yīng)代價區(qū)間上的位置偏移量;以及根據(jù)如下公式計算該用戶的代價能力代表值S(u):
其中,i表示該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的網(wǎng)站提供對象的序號,awardi是該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值在其對應(yīng)代價區(qū)間上的位置偏移量,是該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值對應(yīng)的代價區(qū)間的區(qū)間代表值,是該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象所屬類別的權(quán)重值。
可選地,所述代價能力挖掘單元,適于根據(jù)如下公式計算該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值在其對應(yīng)代價區(qū)間上的位置偏移量awardi:
其中,pricei為該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值,L為該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值對應(yīng)的代價區(qū)間的序號,M為排序序號最高的代價區(qū)間的序號,a和b時序號為L的區(qū)間(a,b]的邊界值。
可選地,所述區(qū)間劃分單元,適于將各個類目分別劃分為數(shù)目相同的多個區(qū)間。
可選地,所述推薦單元,適于根據(jù)該用戶的代價能力代表值確定各類目中對應(yīng)的代價區(qū)間,從所確定的各類目中對應(yīng)的代價區(qū)間中選擇網(wǎng)站提供對象,在網(wǎng)站上向該用戶輸出推薦所選擇的網(wǎng)站提供對象的內(nèi)容。
根據(jù)本發(fā)明的技術(shù)方案可以將網(wǎng)站所提供的對象劃分為多個類目,分別為每個類目設(shè)置權(quán)重值,并對該類目下所有網(wǎng)站提供對象按照獲取對象所需的代價值進行排序,以及按照代價值的排序劃分為多個代價區(qū)間,根據(jù)用戶在預(yù)設(shè)時間段內(nèi)瀏覽的網(wǎng)站提供對象、網(wǎng)站提供對象所屬類目的權(quán)重值以及 網(wǎng)站提供對象所屬的代價區(qū)間,獲得該用戶的代價能力代表值,最終根據(jù)該用戶的代價能力代表值,在網(wǎng)站上向該用戶輸出推薦相應(yīng)的網(wǎng)站提供對象的內(nèi)容。此方法能夠通過對用戶瀏覽網(wǎng)站提供對象的行為進行挖掘,獲知用戶的需求,向用戶輸出推薦相應(yīng)的網(wǎng)絡(luò)提供對象內(nèi)容,不需要向用戶發(fā)起調(diào)查便可獲得更高質(zhì)量的樣本數(shù)據(jù),進一步還提高了用戶的體驗。
上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式。
附圖說明
通過閱讀下文優(yōu)選實施方式的詳細(xì)描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
圖1示出了本發(fā)明一個實施例提供的一種網(wǎng)站提供對象的推薦方法的流程圖;
圖2示出了本發(fā)明一個實施例提供的一種網(wǎng)站提供對象的推薦裝置的結(jié)構(gòu)圖。
具體實施方式
下面將參照附圖更詳細(xì)地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應(yīng)當(dāng)理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
圖1示出了本發(fā)明一個實施例提供的一種網(wǎng)站提供對象的推薦方法的流程圖,如圖1所示,該方法包括:
步驟S110,將網(wǎng)站所提供對象劃分為多個類目。
在本發(fā)明的實施例中,網(wǎng)站所提供的對象是指網(wǎng)站向用戶提供的對象,如購物網(wǎng)站提供的是待銷售的商品。將網(wǎng)站所提供的對象劃分為多個類目具體是指按照商品分類,如汽車、家具、圖書、化妝品等分類。
步驟S120,為所述多個類目分別設(shè)置權(quán)重值。
各個類目的對象獲取的代價值,如價格是不同的,汽車的價格一般遠(yuǎn)高于圖書,所以為各個類目分別設(shè)置權(quán)重值才能保證結(jié)果更貼近用戶實際需求。
步驟S130,對于每個類目,將該類目下的所有網(wǎng)站提供對象按照獲取對象所需的代價值進行排序,并按照代價值的排序劃分為多個代價區(qū)間。
在本發(fā)明的實施例中,網(wǎng)站提供對象的代價值是為獲取該網(wǎng)站提供對象用戶所需付出的代價。對于購物網(wǎng)站來說,網(wǎng)站提供對象的代價值即為價格。如汽車的價格從幾萬元到上百萬元,那么按照由低到高的價格進行排序,劃分多個價位區(qū)間,如2萬元到10萬元為一個區(qū)間,10萬元到30萬元為一個區(qū)間,等等,最后一個區(qū)間通常不包括上限,如500萬元以上劃分為最后一個區(qū)間。
步驟S140,根據(jù)用戶在預(yù)設(shè)時間段內(nèi)瀏覽的網(wǎng)站提供對象、網(wǎng)站提供對象所屬類目的權(quán)重值以及網(wǎng)站提供對象所屬的代價區(qū)間,獲得該用戶的代價能力代表值。
在本步驟中,對于網(wǎng)站的一個用戶,根據(jù)該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的網(wǎng)站提供對象、網(wǎng)站提供對象所屬類目的權(quán)重值以及網(wǎng)站提供對象所屬的代價區(qū)間,獲得該用戶的代價能力代表值。
在本發(fā)明的實施例中,用戶的代價能力代表值是指用戶為獲得網(wǎng)站提供對象所能付出的代價,如用戶的購買力。例如一個用戶在1小時內(nèi)瀏覽了多個網(wǎng)頁,其中包括汽車和圖書,汽車瀏覽了在10萬元-30萬元之間的三種款式,圖書瀏覽了50元-100元之間的五本書,其中汽車的權(quán)重值為5,圖書的權(quán)重值為2,那么根據(jù)以上數(shù)據(jù)和相關(guān)預(yù)設(shè)公式可以計算出用戶的代價能力代表值,在此例中具體為商品購買力。
步驟S150,根據(jù)該用戶的代價能力代表值,在網(wǎng)站上向該用戶輸出推薦相應(yīng)的網(wǎng)站提供對象的內(nèi)容。
例如,該用戶的商品購買力為3,代表用戶購買水平為中等,那么可以在網(wǎng)站上向用戶推薦中檔價位的圖書和汽車等商品,也可以推薦其他類目下如化妝品等商品,推薦的價位也為中檔。
根據(jù)此種方法,在不向用戶發(fā)放調(diào)查問卷或要求用戶填寫信息的情況下即可從用戶的網(wǎng)站瀏覽行為中挖掘用戶實際需求,在樣本數(shù)據(jù)的獲取上更為方便及真實,并且不干擾用戶正常對網(wǎng)絡(luò)提供對象的瀏覽,通過已瀏覽的網(wǎng)站提供對象推薦更貼近用戶需求的網(wǎng)站提供對象,提升了用戶體驗。
在本發(fā)明的又一個實施例中,圖1所示的方法中,為所述多個類目分別設(shè)置權(quán)重值包括:對于每個類目,將該類目下的所有對象的代價值的中間值或平均值取對數(shù)后作為該類目的權(quán)重值。
例如,汽車類目下不同類型汽車的價格從2萬到500萬不等,則取所有汽車價格的中間值251萬,取對數(shù)后log(2510000)=6.4,將其作為汽車類目的權(quán)重值。同樣也可以統(tǒng)計所有汽車價格取其平均值后再取對數(shù),可在實際中根據(jù)測試樣本數(shù)據(jù)準(zhǔn)確度進行選擇。
在本發(fā)明的又一個實施例中,圖1所示的方法進一步包括:對于每個類目,將該類目下的所有對象按照代價值的排序劃分為多個代價區(qū)間之后,為每個代價區(qū)間賦予相應(yīng)的區(qū)間代表值;其中,代價區(qū)間的排序序號越高,對應(yīng)的區(qū)間代表值越大。
例如,將所有汽車的價格劃分為五個區(qū)間,分別為低檔、中低檔、中高檔、高檔和超高檔,按價格由低到高分別記為1、2、3、4、5檔,1、2、3、4、5分別為每個價格區(qū)間的區(qū)間代表值。
在本發(fā)明的又一個實施例中,上述方法中,根據(jù)用戶在預(yù)設(shè)時間段內(nèi)瀏覽的網(wǎng)站提供對象、網(wǎng)站提供對象所屬類目的權(quán)重值以及網(wǎng)站提供對象所屬的代價區(qū)間,獲得該用戶的代價能力代表值包括:
對于該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的每個網(wǎng)站提供對象,獲取該網(wǎng)站提供對象的代價值在其對應(yīng)代價區(qū)間上的位置偏移量;
根據(jù)如下公式計算該用戶的代價能力代表值s(u):
其中,i表示該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的網(wǎng)站提供對象的序號,awardi是該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值在其對應(yīng)代價區(qū)間上的位置偏移量,是該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值對應(yīng)的代價區(qū)間的區(qū)間代表值,是該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象所屬類別的權(quán)重值。
例如一個用戶在1小時內(nèi)瀏覽了多個網(wǎng)頁,其中包括汽車和圖書,瀏覽的網(wǎng)頁中提供汽車的價格最低為2萬元,最高價格區(qū)間在500萬元以上;圖書的價格最低為2元,最高價格區(qū)間在1000元以上;用戶實際瀏覽了在10萬元-30萬元之間的三種款式的汽車,每款汽車在該價格區(qū)間的位置偏移量分別為0.4,0.5和0.6,該價格區(qū)間在汽車類目下為第2檔,即區(qū)間代表值為2;以及30萬元-50萬元之間的兩種款式的汽車,每款汽車在該價格區(qū)間的位置偏移量分別為0.1和0.2,該價格區(qū)間在汽車類目下為第3檔,即區(qū)間代表值為3;以及瀏覽了50元-100元之間的五本圖書,每本圖書在該價格區(qū)間的位置偏移量分別為0.1,0.1,0.2,0.3和0.4,該價格區(qū)間在圖書類目下為第3檔,即區(qū)間代表值為3;通過前述方法,選擇價格中間值計算各類別權(quán)重,則汽車的權(quán)重值為log(2510000)=6.4,圖書的權(quán)重值為log(501)=2.7,那么根據(jù)以上數(shù)據(jù)和預(yù)設(shè)公式可以計算出用戶的代價能力代表值s(u)=3,即在此例中用戶的商品購買力為3,可以看出與用戶實際瀏覽的價格區(qū)間代表值基本符合。
在本發(fā)明的又一個實施例中,上述方法中,對于該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的每個網(wǎng)站提供對象,獲取該網(wǎng)站提供對象的代價值在其對應(yīng)代價區(qū)間上的位置偏移量包括:
根據(jù)如下公式計算該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值在其對應(yīng)代價區(qū)間上的位置偏移量awardi:
其中,pricei為該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值,L為該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值對應(yīng)的代 價區(qū)間的序號,M為排序序號最高的代價區(qū)間的序號,a和b時序號為L的區(qū)間(a,b]的邊界值。
例如,用戶瀏覽了汽車類目下一款價格為32萬的汽車,落入30萬-50萬的價格區(qū)間,此時位置偏移量awardi=(32-30)/(50-30)=0.1。用戶瀏覽了圖書類目下一本1500元的圖書,落入1000元以上的價格區(qū)間,此時(1500-1000)/1000=0.5<1,所以此時位置偏移量awardi=0.5。
在本發(fā)明的又一個實施例中,上述方法中,各個類目分別劃分為數(shù)目相同的多個區(qū)間。如果汽車類目劃分為5檔,而圖書類目劃分為7檔,在計算時會造成結(jié)果的不準(zhǔn)確,也無法準(zhǔn)確確定用戶的代價能力代表值,在該例中表現(xiàn)為用戶購買力。如計算得出用戶購買力為6,而汽車類目只有五檔,則無法正確地向用戶輸出推薦汽車的相關(guān)內(nèi)容。
在本發(fā)明的又一個實施例中,上述方法中,所述根據(jù)該用戶的代價能力代表值,在網(wǎng)站上向該用戶輸出推薦相應(yīng)的網(wǎng)站提供對象的內(nèi)容包括:根據(jù)該用戶的代價能力代表值確定各類目中對應(yīng)的代價區(qū)間;從所確定的各類目中對應(yīng)的代價區(qū)間中選擇網(wǎng)站提供對象;在網(wǎng)站上向該用戶輸出推薦所選擇的網(wǎng)站提供對象的內(nèi)容。
例如,一個用戶的代價能力代表值具體表現(xiàn)為商品購買力,為3,則據(jù)此從已確定的各類目如汽車、手表、化妝品中選擇區(qū)間代表值為3的價格區(qū)間中的商品,在網(wǎng)站上向該用戶以廣告等形式進行提供。
圖2示出了本發(fā)明一個實施例提供的一種網(wǎng)站提供對象的推薦裝置的結(jié)構(gòu)圖,如圖所示,網(wǎng)站提供對象的推薦裝置200包括:
類目劃分單元210,適于將網(wǎng)站所提供對象劃分為多個類目。如汽車、家具、圖書、化妝品等。
權(quán)值設(shè)置單元220,適于為所述多個類目分別設(shè)置權(quán)重值。各個類目的對象獲取的代價值,如價格是不同的,汽車的價格一般遠(yuǎn)高于圖書,所以為各個類目分別設(shè)置權(quán)重值才能保證結(jié)果更貼近用戶實際需求。
區(qū)間劃分單元230,適于對于每個類目,將該類目下的所有網(wǎng)站提供對象按照獲取對象所需的代價值進行排序,并按照代價值的排序劃分為多個代價區(qū)間。如汽車的價格從幾萬元到上百萬元,那么按照由低到高的價格進行 排序,劃分多個價位區(qū)間,如2萬元到10萬元為一個區(qū)間,10萬元到30萬元為一個區(qū)間,等等,最后一個區(qū)間通常不包括上限,如500萬元以上劃分為最后一個區(qū)間。
代價能力挖掘單元240,適于根據(jù)用戶在預(yù)設(shè)時間段內(nèi)瀏覽的網(wǎng)站提供對象、網(wǎng)站提供對象所屬類目的權(quán)重值以及網(wǎng)站提供對象所屬的代價區(qū)間,獲得該用戶的代價能力代表值。例如一個用戶在1小時內(nèi)瀏覽了多個網(wǎng)頁,其中包括汽車和圖書,汽車瀏覽了在10萬元-30萬元之間的三種款式,圖書瀏覽了50元-100元之間的五本書,其中汽車的權(quán)重值為5,圖書的權(quán)重值為2,那么根據(jù)以上數(shù)據(jù)和相關(guān)預(yù)設(shè)公式可以計算出用戶的代價能力代表值,在此例中具體為商品購買力。
推薦單元250,適于根據(jù)該用戶的代價能力代表值,在網(wǎng)站上向該用戶輸出推薦相應(yīng)的網(wǎng)站提供對象的內(nèi)容。例如,該用戶的商品購買力為3,代表用戶購買水平為中等,那么可以在網(wǎng)站上向用戶推薦中檔價位的圖書和汽車等商品,也可以推薦其他類目下如化妝品等商品,推薦的價位也為中檔。
圖2所示的裝置,在不向用戶發(fā)放調(diào)查問卷或要求用戶填寫信息的情況下即可從用戶的網(wǎng)站瀏覽行為中挖掘用戶實際需求,在樣本數(shù)據(jù)的獲取上更為方便及真實,并且不干擾用戶正常對網(wǎng)絡(luò)提供對象的瀏覽,通過已瀏覽的網(wǎng)站提供對象推薦更貼近用戶需求的網(wǎng)站提供對象,提升了用戶體驗。
在本發(fā)明的又一個實施例中,圖2所示的裝置中,所述權(quán)值設(shè)置單元220,適于對于每個類目,將該類目下的所有對象的代價值的中間值或平均值取對數(shù)后作為該類目的權(quán)重值。
例如,汽車類目下不同類型汽車的價格從2萬到500萬不等,則取所有汽車價格的中間值251萬,取對數(shù)后log(2510000)=6.4,將其作為汽車類目的權(quán)重值。同樣也可以統(tǒng)計所有汽車價格取其平均值后再取對數(shù),可在實際中根據(jù)測試樣本數(shù)據(jù)準(zhǔn)確度進行選擇。
在本發(fā)明的又一個實施例中,圖2所示的裝置中,所述區(qū)間劃分單元230,適于對于每個類目,將該類目下的所有對象按照代價值的排序劃分為多個代價區(qū)間之后,進一步為每個代價區(qū)間賦予相應(yīng)的區(qū)間代表值;其中,代價區(qū)間的排序序號越高,對應(yīng)的區(qū)間代表值越大。
例如,將所有汽車的價格劃分為五個區(qū)間,分別為低檔、中低檔、中高檔、高檔和超高檔,按價格由低到高分別記為1、2、3、4、5檔,1、2、3、4、5分別為每個價格區(qū)間的區(qū)間代表值。
在本發(fā)明的又一個實施例中,上述裝置中,所述代價能力挖掘單元240,適于對于該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的每個網(wǎng)站提供對象,獲取該網(wǎng)站提供對象的代價值在其對應(yīng)代價區(qū)間上的位置偏移量;以及根據(jù)如下公式計算該用戶的代價能力代表值S(u):
其中,i表示該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的網(wǎng)站提供對象的序號,awardi是該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值在其對應(yīng)代價區(qū)間上的位置偏移量,是該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值對應(yīng)的代價區(qū)間的區(qū)間代表值,是該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象所屬類別的權(quán)重值。
例如一個用戶在1小時內(nèi)瀏覽了多個網(wǎng)頁,其中包括汽車和圖書,瀏覽的網(wǎng)頁中提供汽車的價格最低為2萬元,最高價格區(qū)間在500萬元以上;圖書的價格最低為2元,最高價格區(qū)間在1000元以上;用戶實際瀏覽了在10萬元-30萬元之間的三種款式的汽車,每款汽車在該價格區(qū)間的位置偏移量分別為0.4,0.5和0.6,該價格區(qū)間在汽車類目下為第2檔,即區(qū)間代表值為2;以及30萬元-50萬元之間的兩種款式的汽車,每款汽車在該價格區(qū)間的位置偏移量分別為0.1和0.2,該價格區(qū)間在汽車類目下為第3檔,即區(qū)間代表值為3;以及瀏覽了50元-100元之間的五本圖書,每本圖書在該價格區(qū)間的位置偏移量分別為0.1,0.1,0.2,0.3和0.4,該價格區(qū)間在圖書類目下為第3檔,即區(qū)間代表值為3;通過前述方法,選擇價格中間值計算各類別權(quán)重,則汽車的權(quán)重值為log(2510000)=6.4,圖書的權(quán)重值為log(501)=2.7,那么根據(jù)以上數(shù)據(jù)和預(yù)設(shè)公式可以計算出用戶的代價能力代表值s(u)=3,即在此例中用戶的商品購買力為3,可以看出與用戶實際瀏覽的價格區(qū)間代表值基本符合。
在本發(fā)明的又一個實施例中,上述裝置中,所述代價能力挖掘單元240, 適于根據(jù)如下公式計算該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值在其對應(yīng)代價區(qū)間上的位置偏移量awardi:
其中,pricei為該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值,L為該用戶在預(yù)設(shè)時間段內(nèi)瀏覽的第i個網(wǎng)站提供對象的代價值對應(yīng)的代價區(qū)間的序號,M為排序序號最高的代價區(qū)間的序號,a和b時序號為L的區(qū)間(a,b]的邊界值。
例如,用戶瀏覽了汽車類目下一款價格為32萬的汽車,落入30萬-50萬的價格區(qū)間,此時位置偏移量awardi=(32-30)/(50-30)=0.1。用戶瀏覽了圖書類目下一本1500元的圖書,落入1000元以上的價格區(qū)間,此時(1500-1000)/1000=0.5<1,所以此時位置偏移量awardi=0.5。
在本發(fā)明的又一個實施例中,上述裝置中,所述區(qū)間劃分單元210,適于將各個類目分別劃分為數(shù)目相同的多個區(qū)間。
如果汽車類目劃分為5檔,而圖書類目劃分為7檔,在計算時會造成結(jié)果的不準(zhǔn)確,也無法準(zhǔn)確確定用戶的代價能力代表值,在該例中表現(xiàn)為用戶購買力。如計算得出用戶購買力為6,而汽車類目只有五檔,則無法正確地向用戶輸出推薦汽車的相關(guān)內(nèi)容。
在本發(fā)明的又一個實施例中,上述裝置中,所述推薦單元250,適于根據(jù)該用戶的代價能力代表值確定各類目中對應(yīng)的代價區(qū)間,從所確定的各類目中對應(yīng)的代價區(qū)間中選擇網(wǎng)站提供對象,在網(wǎng)站上向該用戶輸出推薦所選擇的網(wǎng)站提供對象的內(nèi)容。
需要說明的是:
在此提供的算法和顯示不與任何特定計算機、虛擬裝置或者其它設(shè)備固有相關(guān)。各種通用裝置也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類裝置所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。
在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細(xì)節(jié)的情況下實踐。在一些實例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循具體實施方式的權(quán)利要求書由此明確地并入該具體實施方式,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。
本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設(shè)備中的模塊進行自適應(yīng)性地改變并且把它們設(shè)置在與該實施例不同的一個或多個設(shè)備中??梢园褜嵤├械哪K或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在下面的權(quán)利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的網(wǎng)站提供對象的推薦裝置中的一些或者全部部件的一些或 者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
應(yīng)該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序。可將這些單詞解釋為名稱。