欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于支持向量機(jī)原理的用戶(hù)行為識(shí)別方法

文檔序號(hào):8282968閱讀:237來(lái)源:國(guó)知局
一種基于支持向量機(jī)原理的用戶(hù)行為識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)挖掘領(lǐng)域,具體涉及一種基于支持向量機(jī)原理的用戶(hù)行為識(shí)別方 法,是一種針對(duì)電商購(gòu)物網(wǎng)站用戶(hù),用于分析其購(gòu)物行為模式的一項(xiàng)模式識(shí)別技術(shù)。
【背景技術(shù)】
[0002] 伴隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,電子商務(wù)領(lǐng)域迅速崛起,越來(lái)越多的人開(kāi)始參與 網(wǎng)絡(luò)購(gòu)物,甚至對(duì)于許多群體而言,網(wǎng)絡(luò)購(gòu)物已經(jīng)成為不可替代的重要消費(fèi)方式。據(jù)艾瑞咨 詢(xún)統(tǒng)計(jì)數(shù)據(jù)顯示,2013年中國(guó)電子商務(wù)市場(chǎng)交易規(guī)模100720. 4億元(其中網(wǎng)絡(luò)購(gòu)物交易規(guī) 模18409. 5億元),同比增長(zhǎng)22. 6 %。而伴隨著參與人數(shù)和交易規(guī)模的上漲,海量的用戶(hù)行 為數(shù)據(jù)被儲(chǔ)存下來(lái)。越來(lái)越多的人已經(jīng)意識(shí)到,在這個(gè)海量的信息空間中蘊(yùn)藏著巨大的價(jià) 值,許多學(xué)者、業(yè)內(nèi)人士和科研機(jī)構(gòu)都已經(jīng)參與到這場(chǎng)轟轟烈烈的尋寶運(yùn)動(dòng)中來(lái),探索一切 可能的挖掘數(shù)據(jù)中所蘊(yùn)含價(jià)值的方法。

【發(fā)明內(nèi)容】

[0003] 本發(fā)明要解決的技術(shù)問(wèn)題是:本發(fā)明首先分析用戶(hù)行為數(shù)據(jù)的特點(diǎn),基于支持向 量機(jī)分類(lèi)原理,利用用戶(hù)在瀏覽產(chǎn)品頁(yè)面時(shí)所留下的歷史行為數(shù)據(jù)進(jìn)行訓(xùn)練,通過(guò)訓(xùn)練出 的分類(lèi)超平面對(duì)未來(lái)用戶(hù)短期內(nèi)購(gòu)買(mǎi)產(chǎn)品所屬品牌進(jìn)行識(shí)別。
[0004] 本發(fā)明所采用的技術(shù)方案為:
[0005] 一種基于支持向量機(jī)原理的用戶(hù)行為識(shí)別方法,所述方法首先分析電商用戶(hù)行為 數(shù)據(jù)的特點(diǎn),基于支持向量機(jī)分類(lèi)原理,利用用戶(hù)在瀏覽產(chǎn)品頁(yè)面時(shí)所留下的非平衡性歷 史行為數(shù)據(jù)進(jìn)行訓(xùn)練,通過(guò)訓(xùn)練出的分類(lèi)超平面對(duì)未來(lái)用戶(hù)短期內(nèi)購(gòu)買(mǎi)產(chǎn)品所屬品牌進(jìn)行 識(shí)別。
[0006] 所述方法針對(duì)電商用戶(hù)行為數(shù)據(jù)的特點(diǎn)從原始數(shù)據(jù)中提取特征,使其能夠適用于 支持向量機(jī)的分類(lèi)模型,再通過(guò)調(diào)整懲罰參數(shù)相對(duì)值的方式進(jìn)行參數(shù)尋優(yōu),并在測(cè)試數(shù)據(jù) 集中進(jìn)行分析驗(yàn)證。
[0007] 所述識(shí)別方法實(shí)現(xiàn)方式如下:
[0008] 1)、對(duì)于已經(jīng)收集到的原始數(shù)據(jù),要首先對(duì)其所具備的特點(diǎn)進(jìn)行分析,數(shù)據(jù)所具備 的結(jié)構(gòu)特征、體積以及噪聲的含量等信息,會(huì)影響甚至決定著應(yīng)采用怎樣的方法去處理分 析這些數(shù)據(jù);
[0009] 2)、針對(duì)已獲取數(shù)據(jù)的特點(diǎn),基于支持向量機(jī)原理,提取特征,建立適合于該數(shù)據(jù) 的,并且能夠達(dá)到預(yù)期功能的支持向量機(jī)分析模型;
[0010] 3)、編寫(xiě)程序,導(dǎo)入數(shù)據(jù),完成模型的計(jì)算,得到分析結(jié)果,并對(duì)結(jié)果予以展示。
[0011] 所述識(shí)別方法的具體操作步驟如下:
[0012] 1)獲取原始數(shù)據(jù),并儲(chǔ)存在數(shù)據(jù)庫(kù)中;
[0013] 2)總覽原始數(shù)據(jù),分析總結(jié)原始數(shù)據(jù)的特點(diǎn);
[0014] 3)提出可行的基于支持向量機(jī)原理的分析模型;
[0015] 4)選取特征并建立評(píng)價(jià)指標(biāo);
[0016] 5)利用相關(guān)專(zhuān)業(yè)軟件,同時(shí)編寫(xiě)核心程序,完成模型的計(jì)算;
[0017] 6)展示識(shí)別結(jié)果。
[0018] 本發(fā)明的有益效果為:本發(fā)明有效地利用用戶(hù)在瀏覽商品網(wǎng)頁(yè)時(shí)所產(chǎn)生的點(diǎn)擊、 收藏和加入購(gòu)物車(chē)三類(lèi)行為,來(lái)識(shí)別用戶(hù)是否購(gòu)買(mǎi)該產(chǎn)品或該品牌,在未來(lái)大數(shù)據(jù)時(shí)代背 景下具有良好的應(yīng)用前景。
【附圖說(shuō)明】
[0019] 圖1為原始數(shù)據(jù)字段表;
[0020] 圖2為特征數(shù)據(jù)字段表;
[0021] 圖3為數(shù)據(jù)集混淆矩陣;
[0022] 圖4為分析結(jié)果數(shù)據(jù)表;
[0023] 圖5為分類(lèi)超平面變化趨勢(shì)示意圖;
[0024] 圖6為本發(fā)明功能實(shí)現(xiàn)流程圖。
【具體實(shí)施方式】
[0025] 下面參照附圖所示,通過(guò)【具體實(shí)施方式】對(duì)本發(fā)明進(jìn)一步說(shuō)明:
[0026] 如圖6所示,所述方法實(shí)施步驟如下:
[0027] (1)、使用常用的SQL數(shù)據(jù)庫(kù)軟件儲(chǔ)存網(wǎng)站中的用戶(hù)行為日志,編寫(xiě)SQL語(yǔ)句組織 并提取數(shù)據(jù),構(gòu)成數(shù)據(jù)的原始形式。
[0028] (2)、原始數(shù)據(jù)的特點(diǎn)如下:
[0029] a)體積龐大
[0030] 據(jù)估算,淘寶網(wǎng)單日訪問(wèn)量可突破一億次,經(jīng)營(yíng)狀態(tài)較好的網(wǎng)店單日訪問(wèn)量可達(dá) 數(shù)百萬(wàn)次,用戶(hù)每次點(diǎn)擊瀏覽網(wǎng)站中的商品頁(yè)面,或?qū)υ撋唐愤M(jìn)行其它操作或標(biāo)記時(shí),其行 為都會(huì)被記錄下來(lái)儲(chǔ)存在數(shù)據(jù)庫(kù)中。可見(jiàn),當(dāng)今的用戶(hù)行為數(shù)據(jù)體積龐大,一方面表現(xiàn)在海 量的存量,另一方面也表現(xiàn)為高速的增量。
[0031] b)特征維度低
[0032] 人們?cè)跒g覽商品時(shí),能夠?qū)ι唐愤M(jìn)行的操作其實(shí)是有限的,最常用的無(wú)非是點(diǎn)擊、 購(gòu)買(mǎi)、收藏和加入購(gòu)物車(chē)四種形式,人們對(duì)商品品類(lèi)的偏好信息,往往就是蘊(yùn)藏在這四種看 似簡(jiǎn)單行為的循環(huán)往復(fù)之中。
[0033] c)稀疏性和非平衡性
[0034] 在用戶(hù)行為數(shù)據(jù)矩陣中存在大量零元素,這樣的稀疏數(shù)據(jù)大大阻礙了像協(xié)同過(guò)濾 這樣的基于相似性度量的推薦方法的效果。另一方面,用戶(hù)所產(chǎn)生的大量行為之中,購(gòu)買(mǎi)行 為只占非常小的一部分,這就導(dǎo)致了購(gòu)買(mǎi)與非購(gòu)買(mǎi)的兩類(lèi)產(chǎn)品之間具有極強(qiáng)的非平衡性。
[0035] (3)、構(gòu)建基于支持向量機(jī)原理的模型
[0036] 支持向量機(jī)(簡(jiǎn)稱(chēng)SVM)是由Vapnik等人在1992到1995年期間提出的,該方法 是建立在統(tǒng)計(jì)學(xué)習(xí)理論中結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則和最優(yōu)化問(wèn)題基礎(chǔ)上的,具有堅(jiān)實(shí)的理論基 礎(chǔ)、較強(qiáng)的泛化能力等優(yōu)點(diǎn),被廣泛應(yīng)用于模式識(shí)別、數(shù)據(jù)挖掘、人工智能、機(jī)器學(xué)習(xí)等領(lǐng) 域。
[0037] 考慮在n+1維輸入空間上的1個(gè)樣本點(diǎn)組成的集合:
[0038] T = {(x1; Y1),......, (Xi, Yi)} (I)
[0039] 其中x是輸入向量,Xi e R n,yie {-1,1}是χ i的類(lèi)標(biāo)。求解如下優(yōu)化問(wèn)題:
【主權(quán)項(xiàng)】
1. 一種基于支持向量機(jī)原理的用戶(hù)行為識(shí)別方法,其特征在于;所述方法首先分析電 商用戶(hù)行為數(shù)據(jù)的特點(diǎn),基于支持向量機(jī)分類(lèi)原理,利用用戶(hù)在瀏覽產(chǎn)品頁(yè)面時(shí)所留下的 非平衡性歷史行為數(shù)據(jù)進(jìn)行訓(xùn)練,通過(guò)訓(xùn)練出的分類(lèi)超平面對(duì)未來(lái)用戶(hù)短期內(nèi)購(gòu)買(mǎi)產(chǎn)品所 屬品牌進(jìn)行識(shí)別。
2. 根據(jù)權(quán)利要求1所述的一種基于支持向量機(jī)原理的用戶(hù)行為識(shí)別方法,其特征在 于,所述識(shí)別方法實(shí)現(xiàn)方式如下: 1) 、對(duì)于已經(jīng)收集到的原始數(shù)據(jù),要首先對(duì)其所具備的特點(diǎn)進(jìn)行分析; 2) 、針對(duì)已獲取數(shù)據(jù)的特點(diǎn),基于支持向量機(jī)原理,提取特征,建立適合于該數(shù)據(jù)的,并 且能夠達(dá)到預(yù)期功能的支持向量機(jī)分析模型; 3) 、編寫(xiě)程序,導(dǎo)入數(shù)據(jù),完成模型的計(jì)算,得到分析結(jié)果,并對(duì)結(jié)果予W展示。
3. 根據(jù)權(quán)利要求1或2所述的一種基于支持向量機(jī)原理的用戶(hù)行為識(shí)別方法,其特征 在于,所述識(shí)別方法的具體操作步驟如下: 1) 獲取原始數(shù)據(jù),并儲(chǔ)存在數(shù)據(jù)庫(kù)中; 2) 總覽原始數(shù)據(jù),分析總結(jié)原始數(shù)據(jù)的特點(diǎn); 3) 提出可行的基于支持向量機(jī)原理的分析模型; 4) 選取特征并建立評(píng)價(jià)指標(biāo); 5) 利用相關(guān)專(zhuān)業(yè)軟件,同時(shí)編寫(xiě)核屯、程序,完成模型的計(jì)算; 6) 展示識(shí)別結(jié)果。
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于支持向量機(jī)原理的用戶(hù)行為識(shí)別方法,所述方法首先分析電商用戶(hù)行為數(shù)據(jù)的特點(diǎn),基于支持向量機(jī)分類(lèi)原理,利用用戶(hù)在瀏覽產(chǎn)品頁(yè)面時(shí)所留下的非平衡性歷史行為數(shù)據(jù)進(jìn)行訓(xùn)練,通過(guò)訓(xùn)練出的分類(lèi)超平面對(duì)未來(lái)用戶(hù)短期內(nèi)購(gòu)買(mǎi)產(chǎn)品所屬品牌進(jìn)行識(shí)別。本發(fā)明有效地利用用戶(hù)在瀏覽商品網(wǎng)頁(yè)時(shí)所產(chǎn)生的點(diǎn)擊、收藏和加入購(gòu)物車(chē)三類(lèi)行為,來(lái)識(shí)別用戶(hù)是否購(gòu)買(mǎi)該產(chǎn)品或該品牌,在未來(lái)大數(shù)據(jù)時(shí)代背景下具有良好的應(yīng)用前景。
【IPC分類(lèi)】G06Q30-02
【公開(kāi)號(hào)】CN104599159
【申請(qǐng)?zhí)枴緾N201510063343
【發(fā)明人】焦裕朋, 范瑩, 于治樓
【申請(qǐng)人】浪潮集團(tuán)有限公司
【公開(kāi)日】2015年5月6日
【申請(qǐng)日】2015年2月6日
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
白朗县| 昌都县| 晋州市| 赞皇县| 横峰县| 水城县| 乐安县| 松阳县| 大化| 陇川县| 苗栗县| 铁力市| 周至县| 宽城| 蓬溪县| 濉溪县| 汾西县| 榆树市| 海伦市| 嫩江县| 深圳市| 高台县| 东乡| 依安县| 台中市| 榆社县| 曲麻莱县| 深泽县| 宜兰市| 台湾省| 巴彦淖尔市| 温宿县| 包头市| 赣州市| 蒙城县| 涪陵区| 郎溪县| 纳雍县| 南京市| 枣庄市| 盖州市|