欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

酒店備選池的推薦方法和系統(tǒng)與流程

文檔序號(hào):12804554閱讀:256來(lái)源:國(guó)知局
酒店備選池的推薦方法和系統(tǒng)與流程

本發(fā)明涉及ota(onlinetravelagent,在線旅游社)技術(shù)領(lǐng)域,特別涉及一種酒店備選池的推薦方法和系統(tǒng)。



背景技術(shù):

隨著互聯(lián)網(wǎng)和大數(shù)據(jù)的技術(shù)的快速發(fā)展,推薦系統(tǒng)已經(jīng)被越來(lái)越多的應(yīng)用到各行各業(yè),對(duì)于ota行業(yè)來(lái)說(shuō),離線的周邊酒店備選池對(duì)于整個(gè)酒店推薦系統(tǒng)起著至關(guān)重要的作用,備選池的準(zhǔn)確度直接決定了整個(gè)推薦系統(tǒng)模型的性能和效率。

目前酒店推薦系統(tǒng)的備選池推薦算法大多采用協(xié)同過濾算法,包括基于用戶的方法和基于物品的方法,兩種方法采用用戶對(duì)物品或者信息的偏好,發(fā)現(xiàn)用戶和用戶之間以及物品和物品之間的相似度。由于酒店是一種低頻消費(fèi)的商品,所以構(gòu)造的用戶對(duì)物品的評(píng)分矩陣就會(huì)異常稀疏,很難達(dá)到理想的推薦效果。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明要解決的技術(shù)問題是為了克服現(xiàn)有技術(shù)中ota行業(yè)的離線的周邊酒店備選池的推薦效果不理想的缺陷,提供一種能夠有效地提高酒店備選池的推薦的準(zhǔn)確度的酒店備選池的推薦方法和系統(tǒng)。

本發(fā)明是通過下述技術(shù)方案來(lái)解決上述技術(shù)問題:

一種酒店備選池的推薦方法,其特點(diǎn)在于,包括以下步驟:s1、根據(jù)所有酒店的歷史訂單采用bow(bagofwords,詞袋)模型構(gòu)建訂單字典,所述訂單字典包括n個(gè)訂單字,每個(gè)所述訂單字包括性別、年齡區(qū)間、酒店星級(jí)區(qū)間和/或酒店價(jià)格區(qū)間;s2、分別對(duì)每家酒店初始化總維數(shù)為n、值均為0的直方圖,一個(gè)維數(shù)對(duì)應(yīng)一個(gè)所述訂單字,分別計(jì)算每家酒店中每個(gè)歷史訂單與每個(gè)所述訂單字的距離,距離所述歷史訂單最近的所述訂單字對(duì)應(yīng)的所述直方圖的計(jì)數(shù)加一;s3、使用酒店的所述直方圖分別計(jì)算兩兩酒店之間的相似度;s4、分別為每家酒店選取相似度最高的若干家酒店作為該酒店的酒店備選池。

本方案中,通過所有酒店的歷史訂單全面綜合酒店產(chǎn)品的各種特征及其表達(dá)方式,不僅考慮了酒店的星級(jí)、價(jià)格等因素,還充分利用了訂購(gòu)過酒店的每個(gè)用戶的信息如性別、年齡等,運(yùn)用bow模型的方法把它們構(gòu)建成訂單字典,其中處理后的訂單相當(dāng)于bow模型中的words(字),每家酒店可以作為裝這些words的bag(袋子)。然后,再對(duì)每家酒店使用訂單字典中的訂單字進(jìn)行直方圖表示,最后對(duì)兩兩酒店的直方圖進(jìn)行相似度的計(jì)算,根據(jù)相似度的高低來(lái)選擇酒店的備選池,在此基礎(chǔ)上能夠向用戶推薦符合用戶偏好的酒店。與現(xiàn)有的備選池推薦方法相比,本推薦方法對(duì)酒店這種低頻消費(fèi)的商品表現(xiàn)出很好的效果,構(gòu)建的訂單字典的準(zhǔn)確性和充分性大大優(yōu)于協(xié)同過濾算法的評(píng)分矩陣,達(dá)到理想的推薦效果,最終有效地提高了酒店備選池選擇的準(zhǔn)確度。

較佳地,步驟s1包括以下子步驟:s11、設(shè)置所述訂單字典的大小為n個(gè);s12、采用k-means(一種硬聚類算法)算法對(duì)所有酒店的所述歷史訂單進(jìn)行聚類,以獲取n個(gè)聚類中心,所述聚類中心為所述訂單字。

本方案中,根據(jù)所有歷史訂單的情況設(shè)置適當(dāng)?shù)挠唵巫值涞拇笮?,采用k-means算法對(duì)所有的歷史訂單進(jìn)行聚類,等k均值收斂時(shí),即得到每一個(gè)聚類的聚類中心,也就是訂單字,從而完成訂單字典的構(gòu)建。

較佳地,步驟s11中采用直線搜索的方法設(shè)置所述訂單字典的大小。

本方案中,訂單字典的大小n的設(shè)置涉及到計(jì)算相似度的準(zhǔn)確性,如果n設(shè)置的太大,每個(gè)訂單就一個(gè)word,又會(huì)遇到數(shù)據(jù)異常稀疏的問題;如果n設(shè)置的比較小,又無(wú)法區(qū)分訂單之間的區(qū)別(如n設(shè)置為2,那么所有的訂單都用兩個(gè)words來(lái)表示),因此n的設(shè)置對(duì)整個(gè)推薦方法的有效性影響非常大。本方案中,采用直線搜索的迭代方法,n從1開始,隨著n的增大,推薦的準(zhǔn)確性越來(lái)越高,直到達(dá)到一個(gè)最高值。

較佳地,步驟s3中采用余弦距離計(jì)算兩兩酒店之間的相似度,計(jì)算公式如下:

其中hi=[wi1,wi2,……,win,hif1,hif2,hif3,……],hi(i=1,2,……,n)用于表示第i個(gè)酒店的直方圖的值和酒店的屬性,wik(k=1,2,……,n)代表每第i個(gè)酒店中對(duì)應(yīng)的第k個(gè)訂單字的計(jì)數(shù)個(gè)數(shù),hifm(m=1,2,……)代表第i個(gè)酒店的第m個(gè)屬性;hj=[wj1,wj2,……,wjn,hjf1,hjf2,hjf3,……],hj(j=1,2,……,n)用于表示第j個(gè)酒店的直方圖的值和酒店的屬性,wjl(k=1,2,……,n)代表每第j個(gè)酒店中對(duì)應(yīng)的第l個(gè)訂單字的計(jì)數(shù)個(gè)數(shù),hjfn(n=1,2,……)代表第j個(gè)酒店的第n個(gè)屬性;similary(hi,hj)表示第i個(gè)酒店和第j個(gè)酒店的相似度,所述酒店的屬性包括星級(jí)、訂單量和/或評(píng)分。

本方案采用余弦距離計(jì)算兩兩酒店的相似度,計(jì)算時(shí)結(jié)合了酒店的直方圖的值和酒店的屬性兩個(gè)維度,計(jì)算出的相似度更合理,進(jìn)而能夠有效地提高酒店備選池選擇的準(zhǔn)確度。

較佳地,步驟s1之前還包括以下步驟:獲取酒店的歷史訂單,每張所述歷史訂單包括用戶信息和酒店信息。

本方案中,采用酒店的歷史訂單中的用戶信息和酒店信息,全面綜合了酒店產(chǎn)品的各種特征及其表達(dá)方式,形成基于bow的酒店產(chǎn)品表征,在此基礎(chǔ)上能夠向用戶推薦符合用戶偏好的酒店。

本發(fā)明還提供一種酒店備選池的推薦系統(tǒng),其特點(diǎn)在于,包括:訂單字典構(gòu)建模塊,用于根據(jù)所有酒店的歷史訂單采用bow模型構(gòu)建訂單字典,所述訂單字典包括n個(gè)訂單字,每個(gè)所述訂單字包括性別、年齡區(qū)間、酒店星級(jí)區(qū)間和/或酒店價(jià)格區(qū)間;酒店字典表示模塊,用于分別對(duì)每家酒店初始化總維數(shù)為n、值均為0的直方圖,一個(gè)維數(shù)對(duì)應(yīng)一個(gè)所述訂單字,分別計(jì)算每家酒店中每個(gè)歷史訂單與每個(gè)所述訂單字的距離,距離所述歷史訂單最近的所述訂單字對(duì)應(yīng)的所述直方圖的計(jì)數(shù)加一;相似度計(jì)算模塊,用于使用酒店的所述直方圖分別計(jì)算兩兩酒店之間的相似度;酒店備選池生成模塊,用于分別為每家酒店選取相似度最高的若干家酒店作為該酒店的酒店備選池。

較佳地,所述訂單字典構(gòu)建模塊包括:設(shè)置模塊,用于設(shè)置所述訂單字典的大小為n個(gè);聚類模塊,用于采用k-means算法對(duì)所有酒店的所述歷史訂單進(jìn)行聚類,以獲取n個(gè)聚類中心,所述聚類中心為所述訂單字。

較佳地,所述設(shè)置模塊采用直線搜索的方法設(shè)置所述訂單字典的大小。

較佳地,所述相似度計(jì)算模塊中采用余弦距離計(jì)算兩兩酒店之間的相似度,計(jì)算公式如下:

其中hi=[wi1,wi2,……,win,hif1,hif2,hif3,……],hi(i=1,2,……,n)用于表示第i個(gè)酒店的直方圖的值和酒店的屬性,wik(k=1,2,……,n)代表每第i個(gè)酒店中對(duì)應(yīng)的第k個(gè)訂單字的計(jì)數(shù)個(gè)數(shù),hifm(m=1,2,……)代表第i個(gè)酒店的第m個(gè)屬性;hj=[wj1,wj2,……,wjn,hjf1,hjf2,hjf3,……],hj(j=1,2,……,n)用于表示第j個(gè)酒店的直方圖的值和酒店的屬性,wjl(k=1,2,……,n)代表每第j個(gè)酒店中對(duì)應(yīng)的第l個(gè)訂單字的計(jì)數(shù)個(gè)數(shù),hjfn(n=1,2,……)代表第j個(gè)酒店的第n個(gè)屬性;similary(hi,hj)表示第i個(gè)酒店和第j個(gè)酒店的相似度,所述酒店的屬性包括星級(jí)、訂單量和/或評(píng)分。

較佳地,所述推薦系統(tǒng)還包括歷史訂單獲取模塊,所述歷史訂單獲取模塊用于獲取酒店的歷史訂單,每張所述歷史訂單包括用戶信息和酒店信息。

本發(fā)明的積極進(jìn)步效果在于:本發(fā)明提供的酒店備選池的推薦方法和系統(tǒng)通過所有酒店的歷史訂單全面綜合酒店產(chǎn)品的各種特征及其表達(dá)方式,不僅考慮了酒店的星級(jí)、價(jià)格等因素,還充分利用了訂購(gòu)過酒店的每個(gè)用戶的信息如性別、年齡等,運(yùn)用bow模型的方法把它們構(gòu)建成訂單字典,對(duì)每家酒店使用訂單字典中的訂單字進(jìn)行直方圖表示,最后對(duì)兩兩酒店的直方圖進(jìn)行相似度的計(jì)算,根據(jù)相似度的高低來(lái)選擇酒店的備選池,在此基礎(chǔ)上能夠向用戶推薦符合用戶偏好的酒店。與現(xiàn)有的備選池推薦方法相比,本推薦方法對(duì)酒店這種低頻消費(fèi)的商品表現(xiàn)出很好的效果,構(gòu)建的訂單字典的準(zhǔn)確性和充分性大大優(yōu)于協(xié)同過濾算法的評(píng)分矩陣,達(dá)到理想的推薦效果,最終有效地提高了酒店備選池選擇的準(zhǔn)確度。

附圖說(shuō)明

圖1為本發(fā)明實(shí)施例1的酒店備選池的推薦方法的流程圖。

圖2為本發(fā)明實(shí)施例2的酒店備選池的推薦系統(tǒng)的示意圖。

具體實(shí)施方式

下面通過實(shí)施例的方式進(jìn)一步說(shuō)明本發(fā)明,但并不因此將本發(fā)明限制在所述的實(shí)施例范圍之中。

實(shí)施例1

如圖1所示,一種酒店備選池的推薦方法,包括以下步驟:

步驟101、獲取酒店的歷史訂單,每張歷史訂單包括用戶信息和酒店信息。

步驟102、根據(jù)所有酒店的歷史訂單采用bow模型構(gòu)建訂單字典,具體步驟為采用直線搜索的方法設(shè)置訂單字典的大小為n個(gè);采用k-means算法對(duì)所有酒店的歷史訂單進(jìn)行聚類,以獲取n個(gè)聚類中心,其中聚類中心為訂單字典中的訂單字,每個(gè)訂單字包括性別、年齡區(qū)間、酒店星級(jí)區(qū)間和酒店價(jià)格區(qū)間。

步驟103、分別對(duì)每家酒店初始化總維數(shù)為n、值均為0的直方圖,一個(gè)維數(shù)對(duì)應(yīng)一個(gè)訂單字,分別計(jì)算每家酒店中每個(gè)歷史訂單與每個(gè)訂單字的距離,距離該歷史訂單最近的訂單字對(duì)應(yīng)的直方圖的計(jì)數(shù)加一。

步驟104、使用酒店的直方圖分別采用余弦距離計(jì)算兩兩酒店之間的相似度,計(jì)算公式如下:

其中hi=[wi1,wi2,……,win,hif1,hif2,hif3,……],hi(i=1,2,……,n)用于表示第i個(gè)酒店的直方圖的值和酒店的屬性,wik(k=1,2,……,n)代表每第i個(gè)酒店中對(duì)應(yīng)的第k個(gè)訂單字的計(jì)數(shù)個(gè)數(shù),hifm(m=1,2,……)代表第i個(gè)酒店的第m個(gè)屬性;hj=[wj1,wj2,……,wjn,hjf1,hjf2,hjf3,……],hj(j=1,2,……,n)用于表示第j個(gè)酒店的直方圖的值和酒店的屬性,wjl(k=1,2,……,n)代表每第j個(gè)酒店中對(duì)應(yīng)的第l個(gè)訂單字的計(jì)數(shù)個(gè)數(shù),hjfn(n=1,2,……)代表第j個(gè)酒店的第n個(gè)屬性;similary(hi,hj)表示第i個(gè)酒店和第j個(gè)酒店的相似度,所述酒店的屬性包括酒店標(biāo)識(shí)、星級(jí)、訂單量、評(píng)分和銷量等。

步驟105、分別為每家酒店選取相似度最高的若干家酒店作為該酒店的酒店備選池。

本實(shí)施例中,基于bow模型進(jìn)行酒店備選池推薦,將每個(gè)酒店看成一個(gè)bag,將歷史訂單進(jìn)行聚類后生成字典中的字,也就是words,再對(duì)每家酒店的歷史訂單進(jìn)行字典表示,生成該酒店的直方圖表示,采用直方圖結(jié)合酒店信息進(jìn)行兩兩酒店的相似度計(jì)算,根據(jù)計(jì)算出的相似度的值選出若干家酒店作為酒店備選池,推薦給用戶。

本實(shí)施例提供的酒店備選池的推薦方法采用所有酒店的歷史訂單全面綜合酒店產(chǎn)品的各種特征及其表達(dá)方式,不僅考慮了酒店的星級(jí)、價(jià)格等因素,還充分利用了訂購(gòu)過酒店的每個(gè)用戶的信息如性別、年齡等,運(yùn)用bow模型的方法把它們構(gòu)建成訂單字典,對(duì)每家酒店使用訂單字典中的訂單字進(jìn)行直方圖表示,最后對(duì)兩兩酒店的直方圖進(jìn)行相似度的計(jì)算,根據(jù)相似度的高低來(lái)選擇酒店的備選池,在此基礎(chǔ)上能夠向用戶推薦符合用戶偏好的酒店。與現(xiàn)有的備選池推薦方法相比,本推薦方法對(duì)酒店這種低頻消費(fèi)的商品表現(xiàn)出很好的效果,構(gòu)建的訂單字典的準(zhǔn)確性和充分性大大優(yōu)于協(xié)同過濾算法的評(píng)分矩陣,達(dá)到理想的推薦效果,最終有效地提高了酒店備選池選擇的準(zhǔn)確度。

實(shí)施例2

如圖2所示,一種酒店備選池的推薦系統(tǒng),該系統(tǒng)包括歷史訂單獲取模塊1、訂單字典構(gòu)建模塊2、酒店字典表示模塊3、相似度計(jì)算模塊4和酒店備選池生成模塊5。

其中,歷史訂單獲取模塊1用于獲取酒店的歷史訂單,每張歷史訂單包括用戶信息和酒店信息。

訂單字典構(gòu)建模塊2用于根據(jù)所有酒店的歷史訂單采用bow模型構(gòu)建訂單字典,訂單字典包括n個(gè)訂單字,每個(gè)訂單字包括性別、年齡區(qū)間、酒店星級(jí)區(qū)間和酒店價(jià)格區(qū)間;訂單字典構(gòu)建模塊2包括設(shè)置模塊201和聚類模塊202,設(shè)置模塊201用于采用直線搜索的方法設(shè)置訂單字典的大小為n個(gè);聚類模塊202用于采用k-means算法對(duì)所有酒店的所述歷史訂單進(jìn)行聚類,以獲取n個(gè)聚類中心,聚類中心為所述訂單字。

酒店字典表示模塊3用于分別對(duì)每家酒店初始化總維數(shù)為n、值均為0的直方圖,一個(gè)維數(shù)對(duì)應(yīng)一個(gè)所述訂單字,分別計(jì)算每家酒店中每個(gè)歷史訂單與每個(gè)訂單字的距離,距離該歷史訂單最近的訂單字對(duì)應(yīng)的直方圖的計(jì)數(shù)加一。

相似度計(jì)算模塊4用于使用酒店的直方圖采用余弦距離分別計(jì)算兩兩酒店之間的相似度,計(jì)算公式如下:

其中hi=[wi1,wi2,……,win,hif1,hif2,hif3,……],hi(i=1,2,……,n)用于表示第i個(gè)酒店的直方圖的值和酒店的屬性,wik(k=1,2,……,n)代表每第i個(gè)酒店中對(duì)應(yīng)的第k個(gè)訂單字的計(jì)數(shù)個(gè)數(shù),hifm(m=1,2,……)代表第i個(gè)酒店的第m個(gè)屬性;hj=[wj1,wj2,……,wjn,hjf1,hjf2,hjf3,……],hj(j=1,2,……,n)用于表示第j個(gè)酒店的直方圖的值和酒店的屬性,wjl(k=1,2,……,n)代表每第j個(gè)酒店中對(duì)應(yīng)的第l個(gè)訂單字的計(jì)數(shù)個(gè)數(shù),hjfn(n=1,2,……)代表第j個(gè)酒店的第n個(gè)屬性;similary(hi,hj)表示第i個(gè)酒店和第j個(gè)酒店的相似度,酒店的屬性包括星級(jí)、訂單量和/或評(píng)分。

酒店備選池生成模塊5用于分別為每家酒店選取相似度最高的若干家酒店作為該酒店的酒店備選池。

下面繼續(xù)通過具體的例子,進(jìn)一步說(shuō)明本發(fā)明的技術(shù)方案和技術(shù)效果。

當(dāng)用戶打開ota客戶端后,首先會(huì)進(jìn)入主頁(yè)菜單,此時(shí)系統(tǒng)會(huì)根據(jù)用戶相應(yīng)信息從數(shù)據(jù)庫(kù)中獲取該用戶的信息。用戶點(diǎn)擊進(jìn)入酒店模塊,在對(duì)應(yīng)的搜索頁(yè)面中進(jìn)行相應(yīng)搜索。酒店推薦系統(tǒng)的周邊酒店備選池是一個(gè)用于存放著與每家酒店相似度最高的k家酒店的備選集,當(dāng)一家酒店被推薦為用戶的最佳選擇時(shí),ota客戶端會(huì)從本推薦系統(tǒng)離線生成的酒店備選池中提取該酒店相似度最高的k家酒店,作為這家酒店的備選推薦進(jìn)行展示。本推薦系統(tǒng)對(duì)酒店這種低頻消費(fèi)的商品表現(xiàn)出很好的效果,構(gòu)建的訂單字典的準(zhǔn)確性和充分性大大優(yōu)于協(xié)同過濾算法的評(píng)分矩陣,達(dá)到理想的推薦效果,最終有效地提高了酒店備選池選擇的準(zhǔn)確度。

雖然以上描述了本發(fā)明的具體實(shí)施方式,但是本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這僅是舉例說(shuō)明,本發(fā)明的保護(hù)范圍是由所附權(quán)利要求書限定的。本領(lǐng)域的技術(shù)人員在不背離本發(fā)明的原理和實(shí)質(zhì)的前提下,可以對(duì)這些實(shí)施方式做出多種變更或修改,但這些變更和修改均落入本發(fā)明的保護(hù)范圍。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
聊城市| 西安市| 武清区| 华亭县| 内丘县| 军事| 枣强县| 雅江县| 徐汇区| 汝南县| 西城区| 阳朔县| 鄂托克旗| 揭西县| 鹿邑县| 禹城市| 永年县| 北安市| 甘孜| 弋阳县| 五常市| 犍为县| 左权县| 蒙阴县| 安吉县| 屯门区| 河北省| 蒙自县| 凭祥市| 许昌县| 三明市| 延寿县| 韶关市| 临武县| 阳信县| 海宁市| 抚顺县| 深州市| 镇安县| 聂拉木县| 白水县|