欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于文檔的用戶偏好分析方法與流程

文檔序號(hào):12124246閱讀:386來源:國知局
一種基于文檔的用戶偏好分析方法與流程

本發(fā)明涉及用戶行為偏好分析領(lǐng)域,尤其涉及一種基于文檔的用戶偏好分析方法。



背景技術(shù):

隨著互聯(lián)網(wǎng)的逐漸普及和網(wǎng)絡(luò)信息資源的日益豐富,人們逐漸從信息匱乏時(shí)代走進(jìn)信息過載時(shí)代,信息量的不斷增大使得無論是信息生產(chǎn)者還是信息消費(fèi)者都遇到了很大的困難和挑戰(zhàn):從海量的信息里找到自己需求的信息已經(jīng)變得越來越困難。與此同時(shí),想讓產(chǎn)品在眾多信息中脫穎而出,得到消費(fèi)者的關(guān)注也越來越困難。以前常用的方法是讓用戶自己輸入關(guān)鍵詞搜索,搜索引擎會(huì)根據(jù)用戶所提交的關(guān)鍵詞在數(shù)據(jù)庫里遍歷,以找到合適的信息進(jìn)行推薦。這種方法的缺點(diǎn)是:需要用戶明確自己的需求,而且需要用戶主動(dòng)檢索。

為了高效率、快速、主動(dòng)給用戶提供推薦信息,從海量數(shù)據(jù)中挖掘到用戶所需信息并向用戶推薦,節(jié)省用戶獲取有用信息的時(shí)間,個(gè)性化推薦服務(wù)應(yīng)運(yùn)而生,個(gè)性化推薦服務(wù)首先會(huì)根據(jù)用戶行為數(shù)據(jù)進(jìn)行相應(yīng)的用戶行為偏好分析,常用的方法是通過用戶行為分析建立一個(gè)用戶偏好模型,將用戶的行為轉(zhuǎn)換為用戶的偏好。目前對(duì)用戶行為偏好建模多是在信息搜索引擎、網(wǎng)購平臺(tái)等對(duì)用戶信息搜索關(guān)鍵字、搜索信息,網(wǎng)購商品信息、網(wǎng)購評(píng)價(jià)信息等方面進(jìn)行偏好分析。

本發(fā)明人在研發(fā)本發(fā)明的時(shí)候發(fā)現(xiàn),目前市面上還沒有基于文檔的用戶行為偏好分析方法和用戶行為偏好分析模型,但是用戶花了大量時(shí)間和精力精心制作的文檔中包含了用戶行為偏好的大量信息,例如用戶對(duì)文檔字體的選擇,文檔顏色的設(shè)置,文檔藝術(shù)字的使用等等,都能反映出用戶的行為偏好,這就導(dǎo)致了互聯(lián)網(wǎng)文檔在用戶行為偏好分析這一領(lǐng)域的空白以及互聯(lián)網(wǎng)文檔資源使用上的一種浪費(fèi)。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例的目的是提供一種基于文檔的用戶偏好分析方法,能夠豐富用戶行為偏好分析的來源數(shù)據(jù)庫及提高互聯(lián)網(wǎng)文檔資源的利用率,同時(shí)填補(bǔ)用戶行為偏好分析在文檔這一領(lǐng)域的空白。

為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供了一種基于文檔的用戶偏好分析方法,包括:

接收用戶文檔;

根據(jù)預(yù)設(shè)的文檔分析模型提取所述用戶文檔中的每個(gè)維度的對(duì)應(yīng)信息并進(jìn)行計(jì)算,從而得到用戶總偏好值;其中,所述文檔分析模型為:H(x)=V1S1+V2S2+V3S3+V4S4+…+VnSn,其中,H(x)表示用戶對(duì)于特定方面的用戶總偏好值,V1、V2、……Vn分別表示所述特定方面的每個(gè)維度的用戶偏好值,每個(gè)維度的用戶偏好值基于獲取的所述對(duì)應(yīng)信息并通過預(yù)設(shè)公式計(jì)算得到;S1、S2、……Sn表示每個(gè)維度對(duì)應(yīng)預(yù)設(shè)的權(quán)重系數(shù),n≥2;

利用計(jì)算得到的所述用戶總偏好值對(duì)已保存的用戶總偏好值進(jìn)行更新。

與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例根據(jù)預(yù)設(shè)的文檔分析模型將用戶文檔劃分為多個(gè)維度,提取每一個(gè)維度的文檔對(duì)應(yīng)信息,并基于預(yù)設(shè)的公式對(duì)每一個(gè)維度的文檔對(duì)應(yīng)信息計(jì)算得到每個(gè)維度的用戶偏好值,從而得到用戶對(duì)于特定方面(例如文檔設(shè)計(jì)風(fēng)格)的用戶總偏好值并進(jìn)行更新。通過本實(shí)施例提供的基于文檔的用戶偏好分析方法得到最新的用戶在特定方面(例如文檔設(shè)計(jì)風(fēng)格)的用戶總偏好值后,能夠利用該最新的用戶總偏好值來提供相應(yīng)的個(gè)性化服務(wù)資源(例如,提供符合用戶在文檔設(shè)計(jì)風(fēng)格的偏好的服務(wù)資源)。因此,本實(shí)施例提供的基于文檔的用戶偏好分析方法既能豐富用戶行為偏好分析的來源數(shù)據(jù)庫,提高互聯(lián)網(wǎng)文檔資源的利用率,也填補(bǔ)了用戶行為偏好分析在文檔這一領(lǐng)域的空白,同時(shí)為個(gè)性化推薦服務(wù)資源提供了新的來源。

作為上述方案的改進(jìn),還包括步驟:

在推送服務(wù)資源時(shí),根據(jù)更新后的所述用戶總偏好值推送符合用戶在所述特定方面的偏好的服務(wù)資源。

作為上述方案的改進(jìn),所述特定方面包括文檔設(shè)計(jì)風(fēng)格,所述文檔設(shè)計(jì)風(fēng)格包括文檔字體、文檔顏色、文檔藝術(shù)字三個(gè)維度,所述用戶文檔中的每個(gè)維度的對(duì)應(yīng)信息包括文檔字體信息、文檔顏色信息以及文檔藝術(shù)字信息。

作為上述方案的改進(jìn),預(yù)先設(shè)置所述文檔設(shè)計(jì)風(fēng)格的用戶總偏好值的最大閾值和最小閾值,所述最大閾值對(duì)應(yīng)的文檔設(shè)計(jì)風(fēng)格為極復(fù)雜化風(fēng)格,所述最小閾值對(duì)應(yīng)的文檔設(shè)計(jì)風(fēng)格為極簡(jiǎn)化風(fēng)格,所述最大閾值和所述最小閾值之間的每個(gè)值對(duì)應(yīng)所述極復(fù)雜化風(fēng)格和極簡(jiǎn)化風(fēng)格之間的每一種文檔設(shè)計(jì)風(fēng)格。

作為上述方案的改進(jìn),通過以下步驟提取所述文檔字體信息及計(jì)算對(duì)應(yīng)的用戶偏好值:

獲取文檔中每個(gè)字符的字體,統(tǒng)計(jì)文檔中使用對(duì)應(yīng)字體的字符個(gè)數(shù),通過公式P=(a1*b1+a2*b2+…+ai*bi)/(b1+b2+…bi)計(jì)算文檔中字符的平均粗細(xì)值,其中,a1、a2…ai表示特定字體的粗細(xì)值;b1、b2…bi表示使用對(duì)應(yīng)字體的字符個(gè)數(shù),P表示所述文檔中字符的平均粗細(xì)值,i≥1;

通過公式P(f)=PQ計(jì)算文檔字體的用戶偏好值,其中:P(f)表示所述文檔字體的用戶偏好值,Q表示粗細(xì)權(quán)重系數(shù),Q=|1.5-P|;

將所述用戶偏好值P(f)歸一化到所述最大閾值和所述最小閾值之間的閾值范圍內(nèi),從而得到用戶偏好值V1。

作為上述方案的改進(jìn),通過以下步驟提取所述文檔顏色信息及計(jì)算對(duì)應(yīng)的用戶偏好值:

對(duì)所述文檔每頁進(jìn)行截圖,通過對(duì)每幅截圖進(jìn)行圖像處理得到所述文檔每個(gè)像素的深淺度值,從而得到所述文檔中每一顏色的深淺度值,并通過公式P(c)=Y(jié)1A1+Y2A2+Y3A3+Y4A4+…+YjAj計(jì)算文檔顏色的用戶偏好值,其中:P(c)表示所述文檔顏色的用戶偏好值,Y1、Y2……Yj表示每一顏色的深淺度值,A1、A2……Aj表示每一顏色深淺度值占整個(gè)文檔的面積比例,j≥1;

將所述用戶偏好值P(c)歸一化到所述最大閾值和所述最小閾值之間的閾值范圍內(nèi),從而得到用戶偏好值V2

作為上述方案的改進(jìn),通過以下步驟計(jì)算每一顏色深淺度值占整個(gè)文檔的面積比例:

對(duì)所述文檔每頁進(jìn)行截圖,通過對(duì)每幅截圖進(jìn)行圖像處理得到所述文檔每個(gè)像素的深淺度值;

將深淺度值相同的像素累加后與文檔總像素的比值,作為每一顏色深淺度值占整個(gè)文檔的面積比例。

作為上述方案的改進(jìn),通過公式Y(jié)j=Rm+Gb+Bk計(jì)算每一顏色的深淺度值,其中:Yj表示所述文檔中的每一顏色的深淺度值,R、G、B分別表示每一像素中RGB通道的數(shù)值,m、b、k表示所述RGB通道的系數(shù)。

作為上述方案的改進(jìn),m=0.299,b=0.587,k=0.114。

作為上述方案的改進(jìn),通過以下步驟提取所述文檔藝術(shù)字信息及計(jì)算對(duì)應(yīng)的用戶偏好值:

獲取文檔中每一種藝術(shù)字的字符個(gè)數(shù),通過公式P(a)=U1C1+U2C2+U3C3…+UtCt計(jì)算文檔藝術(shù)字的用戶偏好值,其中:P(a)表示所述文檔藝術(shù)字的用戶偏好值,U1、U2……Ut表示所述每一種藝術(shù)字的字符個(gè)數(shù),C1、C2……Ct表示對(duì)應(yīng)的每一種藝術(shù)字的預(yù)設(shè)偏好權(quán)重系數(shù),t≥1;

將所述用戶偏好值P(a)歸一化到所述最大閾值和所述最小閾值之間的閾值范圍內(nèi),從而得到用戶偏好值V3

附圖說明

圖1是本發(fā)明實(shí)施例1中一種基于文檔的用戶偏好分析方法的流程圖;

圖2是圖1中步驟S2的具體流程示意圖;

圖3是圖2中步驟S201中文檔設(shè)計(jì)風(fēng)格用戶總偏好值閾值設(shè)置示意圖;

圖4是圖2中步驟S202的具體流程示意圖;

圖5是圖2中步驟S203的具體流程示意圖;

圖6是圖2中步驟S204的具體流程示意圖;

圖7是本發(fā)明實(shí)施例2中一種基于文檔的用戶偏好分析方法的流程圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

參見圖1,是本發(fā)明實(shí)施例1提供的一種基于文檔的用戶偏好分析方法的流程圖。本發(fā)明實(shí)施例1提供的一種基于文檔的用戶偏好分析方法包括步驟S1~S3:

S1:接收用戶文檔。

具體實(shí)施時(shí),接收的可以是用戶實(shí)時(shí)制作并同步保存至互聯(lián)網(wǎng)云端的文檔,或者是用戶實(shí)時(shí)制作以用于進(jìn)行用戶偏好分析的文檔,還可以是用戶已保存在本地或者云端的并提取出來用于進(jìn)行用戶偏好分析的文檔。在本實(shí)施例中,為了及時(shí)且自動(dòng)獲得用戶最新的偏好,優(yōu)選為接收用戶實(shí)時(shí)制作并同步保存至互聯(lián)網(wǎng)云端的文檔以用于進(jìn)行用戶偏好分析。

S2:根據(jù)預(yù)設(shè)的文檔分析模型提取所述用戶文檔中的每個(gè)維度的對(duì)應(yīng)信息并進(jìn)行計(jì)算,從而得到用戶總偏好值;其中,所述文檔分析模型為:H(x)=V1S1+V2S2+V3S3+V4S4+…+VnSn,其中,H(x)表示用戶對(duì)于特定方面的用戶總偏好值,V1、V2、……Vn分別表示所述特定方面的每個(gè)維度的用戶偏好值,每個(gè)維度的用戶偏好值基于獲取的所述對(duì)應(yīng)信息并通過預(yù)設(shè)公式計(jì)算得到;S1、S2、……Sn表示每個(gè)維度對(duì)應(yīng)預(yù)設(shè)的權(quán)重系數(shù),n≥2。

在該步驟中提供了基于文檔的用戶行為偏好分析模型及計(jì)算方法,具體的,在該步驟中,所述特定方面的用戶總偏好值H(x)包括但不限于文檔設(shè)計(jì)風(fēng)格,所述文檔設(shè)計(jì)風(fēng)格的維度包括但不限于文檔字體、文檔顏色、文檔藝術(shù)字,文檔字體維度的對(duì)應(yīng)信息包括文檔字體信息,文檔顏色維度的對(duì)應(yīng)信息包括文檔顏色信息,文檔藝術(shù)字的對(duì)應(yīng)信息包括文檔藝術(shù)字信息。

S3:利用計(jì)算得到的所述用戶總偏好值對(duì)已保存的用戶總偏好值進(jìn)行更新。

具體的,在每次使用文檔分析模型分析用戶的文檔后,將每次計(jì)算得到的用戶總偏好值進(jìn)行更新,即將最新的用戶總偏好值計(jì)算結(jié)果對(duì)已保存的用戶總偏好值進(jìn)行更新。

本發(fā)明實(shí)施例1根據(jù)預(yù)設(shè)的文檔分析模型將用戶文檔劃分為多個(gè)維度,提取每一個(gè)維度的文檔對(duì)應(yīng)信息,并基于預(yù)設(shè)的公式對(duì)每一個(gè)維度的文檔對(duì)應(yīng)信息計(jì)算得到每個(gè)維度的用戶偏好值,從而得到用戶對(duì)于特定方面(例如文檔設(shè)計(jì)風(fēng)格)的用戶總偏好值并進(jìn)行更新。通過本實(shí)施例1提供的基于文檔的用戶偏好分析方法得到最新的用戶在特定方面(例如文檔設(shè)計(jì)風(fēng)格)的用戶總偏好值后,能夠利用該最新的用戶總偏好值來提供相應(yīng)的個(gè)性化服務(wù)資源(例如,提供符合用戶在文檔設(shè)計(jì)風(fēng)格的偏好的服務(wù)資源)。因此,本發(fā)明實(shí)施例1提供的基于文檔的用戶偏好分析方法既能豐富用戶行為偏好分析的來源數(shù)據(jù)庫,提高互聯(lián)網(wǎng)文檔資源的利用率,也填補(bǔ)了用戶行為偏好分析在文檔這一領(lǐng)域的空白,同時(shí)為個(gè)性化推薦服務(wù)資源提供了新的來源。

為了方便理解步驟S2中文檔分析模型的建立和用戶文檔中每個(gè)維度的對(duì)應(yīng)信息的提取過程,下面舉文檔設(shè)計(jì)風(fēng)格,維度分別為文檔字體、文檔顏色、文檔藝術(shù)字為例,詳細(xì)說明如何計(jì)算確定用戶在文檔設(shè)計(jì)風(fēng)格的用戶總偏好值。

參見圖2,通過計(jì)算確定用戶在文檔設(shè)計(jì)風(fēng)格的用戶總偏好值包括步驟S201~S205,其中:

S201:預(yù)先設(shè)置所述文檔設(shè)計(jì)風(fēng)格的用戶總偏好值的最大閾值和最小閾值,所述最大閾值對(duì)應(yīng)的文檔設(shè)計(jì)風(fēng)格為極復(fù)雜化風(fēng)格,所述最小閾值對(duì)應(yīng)的文檔設(shè)計(jì)風(fēng)格為極簡(jiǎn)化風(fēng)格,所述最大閾值和所述最小閾值之間的每個(gè)值對(duì)應(yīng)所述極復(fù)雜化風(fēng)格和極簡(jiǎn)化風(fēng)格之間的每一種文檔設(shè)計(jì)風(fēng)格。

具體的,為了更加方便直觀的表示所述文檔設(shè)計(jì)風(fēng)格的簡(jiǎn)約或復(fù)雜,參見圖3,圖3是圖2中步驟S201中文檔設(shè)計(jì)風(fēng)格閾值設(shè)置示意圖,將用戶總偏好值設(shè)置最小閾值為0、最大閾值為100,最小閾值0對(duì)應(yīng)極簡(jiǎn)化風(fēng)格,最大閾值100對(duì)應(yīng)極復(fù)雜化風(fēng)格,最小閾值0到最大閾值100區(qū)間之間的每個(gè)值對(duì)應(yīng)所述極簡(jiǎn)化風(fēng)格和極復(fù)雜化風(fēng)格之間的每一種文檔設(shè)計(jì)風(fēng)格??梢岳斫獾?,該最小閾值和最大閾值設(shè)置的具體數(shù)值可根據(jù)實(shí)際情況和需求進(jìn)行設(shè)置,如也可設(shè)置最小閾值為0、最大閾值為10,在此不做具體限制。

S202:提取所述文檔中的文檔字體信息,根據(jù)預(yù)設(shè)公式計(jì)算用戶對(duì)于文檔字體的用戶偏好值,并將計(jì)算得到的用戶偏好值歸一化到所述最大閾值和所述最小閾值之間的閾值范圍內(nèi)。

具體的,參見圖,4,該步驟可以通過以下步驟實(shí)現(xiàn),包括步驟S2021~S2023,其中:

S2021:獲取文檔中每個(gè)字符的字體,統(tǒng)計(jì)文檔中使用對(duì)應(yīng)字體的字符個(gè)數(shù),通過公式P=(a1*b1+a2*b2+…+ai*bi)/(b1+b2+…bi)計(jì)算文檔中字符的平均粗細(xì)值,其中,a1、a2…ai表示特定字體的粗細(xì)值;b1、b2…bi表示使用對(duì)應(yīng)字體的字符個(gè)數(shù),P表示所述文檔中字符的平均粗細(xì)值,i≥1。

具體的,每一種字體都對(duì)應(yīng)一個(gè)粗細(xì)值,這是寫入到每種字體中的,可以直接獲取到,通過獲取文檔中每個(gè)字符的字體可以得到文檔中每個(gè)字符的粗細(xì)值,統(tǒng)計(jì)文檔中具有相同粗細(xì)值的字符個(gè)數(shù),計(jì)算可得到文檔中字符的平均粗細(xì)值。

S2022:通過公式P(f)=PQ計(jì)算文檔字體的用戶偏好值,其中:P(f)表示所述文檔字體的用戶偏好值,Q表示粗細(xì)權(quán)重系數(shù),Q=|1.5-P|。

具體的,粗細(xì)權(quán)重系數(shù)Q表示的是對(duì)于某一個(gè)平均粗細(xì)值,它對(duì)文檔風(fēng)格的影響情況,每一個(gè)粗細(xì)值都對(duì)應(yīng)一個(gè)粗細(xì)權(quán)重系數(shù),簡(jiǎn)約風(fēng)格的字體粗細(xì)值偏向較小,定義平均粗細(xì)值為1.5時(shí),最符合簡(jiǎn)約風(fēng)格的要求。

S2023:將所述用戶偏好值P(f)歸一化到所述最大閾值和所述最小閾值之間的閾值范圍內(nèi),從而得到用戶偏好值V1。

該步驟用于將計(jì)算得到的文檔字體用戶偏好值P(f)歸一化到預(yù)先設(shè)置的文檔設(shè)計(jì)風(fēng)格的用戶總偏好值的最大閾值和最小閾值的閾值范圍內(nèi),使得文檔字體這一維度用戶偏好值計(jì)算結(jié)果在文檔設(shè)計(jì)風(fēng)格用戶總偏好值范圍內(nèi),使得文檔字體用戶偏好值與文檔設(shè)計(jì)風(fēng)格用戶總偏好值具有統(tǒng)一的衡量標(biāo)準(zhǔn)。

具體的,由于每一種字體都對(duì)應(yīng)一個(gè)粗細(xì)值(粗細(xì)值范圍已定),例如用1.5-2.0分別表示每一種字體的粗細(xì)值范圍,1.5最小,2.0最大。根據(jù)步驟S2021中的計(jì)算公式可以得到所述文檔中字符的平均粗細(xì)值P的范圍也是1.5~2.0,因此通過公式P(f)=PQ得到文檔字體的用戶偏好值P(f)的范圍是0~1。然后,將范圍為0~1的用戶偏好值P(f)通過映射歸一化到預(yù)先設(shè)置的文檔設(shè)計(jì)風(fēng)格的用戶總偏好值的最大閾值和最小閾值的閾值范圍(例如,0~100)內(nèi),從而得到所述用戶偏好值P(f)歸一化到所述閾值范圍內(nèi)的用戶偏好值V1

S203:提取所述文檔中的文檔顏色信息,根據(jù)預(yù)設(shè)公式計(jì)算用戶對(duì)于文檔字體的用戶偏好值,并將計(jì)算得到的用戶偏好值歸一化到所述最大閾值和所述最小閾值之間的閾值范圍內(nèi)。

具體的,參見圖5,該步驟可以通過以下步驟實(shí)現(xiàn),包括步驟S2031~S2032,其中:

S2031:對(duì)所述文檔每頁進(jìn)行截圖,通過對(duì)每個(gè)截圖進(jìn)行圖像處理得到所述文檔每個(gè)像素的深淺度值,從而得到所述文檔中每一顏色的深淺度值,并通過公式P(c)=Y(jié)1A1+Y2A2+Y3A3+Y4A4+…+YjAj計(jì)算文檔顏色的用戶偏好值,其中:P(c)表示所述文檔顏色的用戶偏好值,Y1、Y2……Yj表示每一顏色的深淺度值,A1、A2……Aj表示每一顏色深淺度值占整個(gè)文檔的面積比例,j≥1。

具體的,簡(jiǎn)約風(fēng)格的文檔整體顏色偏淺色,對(duì)文檔每頁進(jìn)行截圖,對(duì)文檔的每張截圖進(jìn)行圖像處理,得到每個(gè)像素的深淺度值,從而得到所述文檔中每一顏色的深淺度值,具體的,通過公式Y(jié)j=Rm+Gb+Bk計(jì)算每一顏色的深淺度值,其中:Yj表示所述文檔中的每一顏色的深淺度值,R、G、B分別表示每一像素中RGB通道的數(shù)值,m、b、k表示所述RGB通道的系數(shù),m=0.299,b=0.587,k=0.114。RGB通道的數(shù)值不同,則像素的深淺度值不同,即每種顏色的深淺度值不同,每一種深淺度值分別對(duì)應(yīng)一種顏色,則通過每個(gè)像素的深淺度值可以得到文檔使用的所有顏色,以及每一種顏色對(duì)應(yīng)的深淺度值,通過將所述每個(gè)深淺度值相同的像素進(jìn)行累加得到累加值,累加值與文檔總像素的比值即為每一顏色深淺度值占整個(gè)文檔的面積比例。

S2032:將所述用戶偏好值P(c)歸一化到所述最大閾值和所述最小閾值之間的閾值范圍內(nèi),從而得到用戶偏好值V2。

該步驟用于將計(jì)算得到的文檔顏色用戶偏好值P(c)歸一化到預(yù)先設(shè)置的文檔設(shè)計(jì)風(fēng)格的用戶總偏好值的最大閾值和最小閾值的閾值范圍內(nèi),使得文檔顏色這一維度用戶偏好值計(jì)算結(jié)果在文檔設(shè)計(jì)風(fēng)格用戶總偏好值范圍內(nèi),使得文檔顏色用戶偏好值與文檔設(shè)計(jì)風(fēng)格用戶總偏好值具有統(tǒng)一的衡量標(biāo)準(zhǔn)。

具體的,黑色的RGB通道的數(shù)值為(0,0,0),白色的RGB通道的數(shù)值為(255,255,255),根據(jù)步驟S2031中公式Y(jié)j=Rm+Gb+Bk可以得到每一顏色的深淺度值的范圍為0~255,根據(jù)步驟S2031中公式P(c)=Y(jié)1A1+Y2A2+Y3A3+Y4A4+…+YjAj可以得到文檔顏色用戶偏好值P(c)的范圍為0~255,將范圍為0~255的用戶偏好值P(c)通過映射歸一化到預(yù)先設(shè)置的文檔設(shè)計(jì)風(fēng)格的用戶總偏好值的最大閾值和最小閾值的閾值范圍(例如,0~100)內(nèi),從而得到所述用戶偏好值P(c)歸一化到所述閾值范圍內(nèi)的用戶偏好值V2。

S204:提取所述文檔中的文檔藝術(shù)字信息,根據(jù)預(yù)設(shè)公式計(jì)算用戶對(duì)于文檔字體的用戶偏好值,并將計(jì)算得到的用戶偏好值歸一化到所述最大閾值和所述最小閾值之間的閾值范圍內(nèi)

具體的,參見圖6,該步驟可以通過以下步驟實(shí)現(xiàn),包括步驟S2041~S2042,其中:

S2041:獲取文檔中每一種藝術(shù)字的字符個(gè)數(shù),通過公式P(a)=U1C1+U2C2+U3C3…+UtCt計(jì)算文檔藝術(shù)字的用戶偏好值,其中:P(a)表示所述文檔藝術(shù)字的用戶偏好值,U1、U2……Ut表示所述每一種藝術(shù)字的字符個(gè)數(shù),C1、C2……Ct表示對(duì)應(yīng)的每一種藝術(shù)字的預(yù)設(shè)偏好權(quán)重系數(shù),t≥1;

具體的,確定文檔中使用的藝術(shù)字的種類及使用對(duì)應(yīng)的每一種藝術(shù)字的字符個(gè)數(shù),由于藝術(shù)字的效果是確定的,且每一種藝術(shù)字都有對(duì)應(yīng)的風(fēng)格屬性,根據(jù)經(jīng)驗(yàn)定義每一種藝術(shù)字的預(yù)設(shè)偏好權(quán)重系數(shù)。

S2042:將所述用戶偏好值P(a)歸一化到所述最大閾值和所述最小閾值之間的閾值范圍內(nèi),從而得到用戶偏好值V3。

該步驟用于將計(jì)算得到的文檔藝術(shù)字用戶偏好值P(a)歸一化到預(yù)先設(shè)置的文檔設(shè)計(jì)風(fēng)格的用戶總偏好值的最大閾值和最小閾值的閾值范圍內(nèi),使得文檔藝術(shù)字這一維度用戶偏好值計(jì)算結(jié)果在文檔設(shè)計(jì)風(fēng)格用戶總偏好值范圍內(nèi),使得文檔藝術(shù)字用戶偏好值與文檔設(shè)計(jì)風(fēng)格用戶總偏好值具有統(tǒng)一的衡量標(biāo)準(zhǔn)。

具體的,由于分析的文檔中字符個(gè)數(shù)是確定、有限的,則文檔中使用藝術(shù)字的種類及使用對(duì)應(yīng)的每一種藝術(shù)字的字符個(gè)數(shù)也是有限的,根據(jù)步驟S2041中公式計(jì)算得到的文檔藝術(shù)字的用戶偏好值范圍也是有限的,設(shè)定文檔藝術(shù)字的用戶偏好值P(a)范圍為0~1,0表示文檔中未使用藝術(shù)字,1表示文檔中字符全部使用極復(fù)雜化風(fēng)格的藝術(shù)字,然后,將范圍為0~1的用戶偏好值P(a)通過映射歸一化到預(yù)先設(shè)置的文檔設(shè)計(jì)風(fēng)格的用戶總偏好值的最大閾值和最小閾值的閾值范圍(例如,0-100)內(nèi),從而得到所述用戶偏好值P(a)歸一化到所述閾值范圍內(nèi)的用戶偏好值V3。

S205:將步驟S202~S204分別得到的用戶偏好值V1、用戶偏好值V2、用戶偏好值V3代入文檔分析模型H(x)=V1S1+V2S2+V3S3中,從而計(jì)算得到用戶對(duì)于文檔設(shè)計(jì)風(fēng)格的用戶總偏好值。

在該步驟中,H(x)表示用戶對(duì)于文檔設(shè)計(jì)風(fēng)格的用戶總偏好值,V1、V2、V3分別表示用戶對(duì)于文檔設(shè)計(jì)風(fēng)格中的文檔字體、文檔顏色、文檔藝術(shù)字三個(gè)維度的用戶偏好值,而S1、S2、S3表示每個(gè)維度對(duì)應(yīng)預(yù)設(shè)的權(quán)重系數(shù)??梢岳斫獾?,由于S1、S2、S3表示每個(gè)維度對(duì)應(yīng)預(yù)設(shè)的權(quán)重系數(shù),S1、S2、S3三個(gè)系數(shù)的和為1。

參見圖7,是本發(fā)明實(shí)施例2提供的一種基于文檔的用戶偏好分析方法的流程圖。本發(fā)明實(shí)施例2提供的一種基于文檔的用戶偏好分析方法包括步驟S21~S24:

S21:接收用戶文檔。

具體實(shí)施時(shí),接收的可以是用戶實(shí)時(shí)制作并同步保存至互聯(lián)網(wǎng)云端的文檔,或者是用戶實(shí)時(shí)制作以用于進(jìn)行用戶偏好分析的文檔,還可以是用戶已保存在本地或者云端的并提取出來用于進(jìn)行用戶偏好分析的文檔。在本實(shí)施例中,為了及時(shí)且自動(dòng)獲得用戶最新的偏好,優(yōu)選為接收用戶實(shí)時(shí)制作并同步保存至互聯(lián)網(wǎng)云端的文檔以用于進(jìn)行用戶偏好分析。

S22:根據(jù)預(yù)設(shè)的文檔分析模型提取所述用戶文檔中的每個(gè)維度的對(duì)應(yīng)信息并進(jìn)行計(jì)算,從而得到用戶總偏好值;其中,所述文檔分析模型為:H(x)=V1S1+V2S2+V3S3+V4S4+…+VnSn,其中,H(x)表示用戶對(duì)于特定方面的用戶總偏好值,V1、V2、……Vn分別表示所述特定方面的每個(gè)維度的用戶偏好值,每個(gè)維度的用戶偏好值基于獲取的所述對(duì)應(yīng)信息并通過預(yù)設(shè)公式計(jì)算得到;S1、S2、……Sn表示每個(gè)維度對(duì)應(yīng)預(yù)設(shè)的權(quán)重系數(shù),n≥2。;

具體的,在該步驟中,所述特定方面的用戶總偏好值H(x)包括但不限于文檔設(shè)計(jì)風(fēng)格,所述文檔設(shè)計(jì)風(fēng)格的維度包括但不限于文檔字體、文檔顏色、文檔藝術(shù)字,文檔字體維度的對(duì)應(yīng)信息包括文檔字體信息,文檔顏色維度的對(duì)應(yīng)信息包括文檔顏色信息,文檔藝術(shù)字的對(duì)應(yīng)信息包括文檔藝術(shù)字信息。

S23:利用計(jì)算得到的所述用戶總偏好值對(duì)已保存的用戶總偏好值進(jìn)行更新。

具體的,在每次使用文檔分析模型分析用戶的文檔后,將每次計(jì)算得到的用戶總偏好值進(jìn)行更新,即將最新的用戶總偏好值計(jì)算結(jié)果對(duì)已保存的用戶總偏好值進(jìn)行更新。

S24:在推送服務(wù)資源時(shí),根據(jù)更新后的所述用戶總偏好值推送符合用戶在所述特定方面的偏好的服務(wù)資源。

具體的,該步驟用于將文檔分析用戶總偏好值計(jì)算結(jié)果應(yīng)用于個(gè)性化推薦服務(wù)領(lǐng)域中,根據(jù)本發(fā)明實(shí)施例2提供的文檔分析模型計(jì)算得到的用戶總偏好值可以給用戶推送服務(wù)資源,例如在購物、觀影等方面給客戶提供資源推送。

本發(fā)明實(shí)施例2提供的一種基于文檔的用戶偏好分析方法中步驟S21~S23與本發(fā)明實(shí)施例1提供的一種基于文檔的用戶偏好分析方法中步驟S1~S3相同,本發(fā)明實(shí)施例2中步驟S21~S23具體實(shí)施過程與本發(fā)明實(shí)施例1中步驟S1~S3相同,在此不再贅述。

與實(shí)施例1相比,本發(fā)明實(shí)施例2提供的一種基于文檔的用戶偏好分析方法增加了步驟S24,具體實(shí)施時(shí)該步驟用于將文檔分析用戶總偏好值計(jì)算結(jié)果應(yīng)用于個(gè)性化推薦服務(wù)領(lǐng)域中,根據(jù)本發(fā)明實(shí)施例2提供的文檔分析模型計(jì)算得到的用戶總偏好值可以給用戶推送服務(wù)資源,例如在購物、觀影等方面給客戶提供資源推送。

與實(shí)施例1相比,本發(fā)明實(shí)施例2提供的一種基于文檔的用戶偏好分析方法將根據(jù)本發(fā)明建立的文檔分析模型分析計(jì)算得到的用戶總偏好值計(jì)算結(jié)果應(yīng)用于個(gè)性化推薦服務(wù)領(lǐng)域中,豐富了個(gè)性化推薦的來源數(shù)據(jù)庫,為個(gè)性化推薦服務(wù)資源提供了新的來源。

以上所述是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也視為本發(fā)明的保護(hù)范圍。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
肃南| 凤凰县| 商洛市| 石首市| 沂水县| 凤凰县| 上栗县| 商南县| 屏东县| 来宾市| 石楼县| 石楼县| 建始县| 通河县| 罗甸县| 康乐县| 建水县| 屏东市| 尼玛县| 西畴县| 夏河县| 达孜县| 朝阳市| 镶黄旗| 隆回县| 瑞昌市| 玉门市| 菏泽市| 台湾省| 塘沽区| 桃源县| 九龙坡区| 禹城市| 团风县| 太白县| 金沙县| 九龙坡区| 樟树市| 柏乡县| 浦北县| 汽车|