欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于游戲日志確定用戶性別的方法及系統(tǒng)與流程

文檔序號:12667294閱讀:225來源:國知局
一種基于游戲日志確定用戶性別的方法及系統(tǒng)與流程
本發(fā)明涉及用戶群分析領(lǐng)域,尤其涉及一種基于游戲日志確定用戶性別的方法及對應(yīng)系統(tǒng)。
背景技術(shù)
:用戶群定位是游戲設(shè)計的重要環(huán)節(jié),而性別則是其中一個重要的群體劃分標(biāo)準(zhǔn)。不同的游戲分類,如角色扮演、動作游戲、策略戰(zhàn)棋、益智休閑、賽車游戲、飛行游戲、養(yǎng)成游戲、體育運動、冒險游戲、射擊游戲、棋牌游戲、模擬經(jīng)營、格斗游戲,等,往往都有各自所針對的用戶群體。一款游戲面世后,往往男女比例有嚴(yán)重的不均衡性。例如,男性更喜歡積極激烈的活動,他們喜歡尋求刺激,喜歡占主導(dǎo)地位,喜歡冒險;而女性則喜歡多愁善感,喜歡保守,他們喜歡尋求穩(wěn)定而不是刺激,他們喜歡被主導(dǎo),喜歡‘小鳥依人’。由此男性相對更愛玩動作冒險類游戲,女性則相對更喜歡趣味類游戲。為了提高游戲推薦的效果,應(yīng)當(dāng)向不同性別的用戶推薦不同類型的游戲。比如戰(zhàn)爭類游戲多為男性所偏愛,如果向女性用戶推薦則會往往沒有效果。如果能夠針對用戶性別進(jìn)行精準(zhǔn)的游戲推送,往往能夠優(yōu)化用戶體驗,并同時提高推送的成功率?,F(xiàn)有的游戲平臺通常只能夠通過用戶填寫的注冊信息直接獲得用戶性別。但實際進(jìn)行游戲推送時,如果用戶沒有提供性別信息,或者用戶是異網(wǎng)用戶,現(xiàn)有的技術(shù)往往無法獲得用戶性別,進(jìn)而無法有針對性地對用戶進(jìn)行有效的推送。目前,針對用戶性別,在用戶群體數(shù)據(jù)分析領(lǐng)域通常需要先通過構(gòu)建數(shù)據(jù)挖掘模型進(jìn)行訓(xùn)練,再使用訓(xùn)練得到的模型對用戶數(shù)據(jù)分析才能實現(xiàn)對用戶性別的預(yù)測。這種方式的計算量消耗非常大,且需要分布式編程才能夠?qū)崿F(xiàn)精確建模,增加了程序開發(fā)、運作的成本。因而目前急需一種通過簡單的運算即可實現(xiàn)用戶性別數(shù)據(jù)挖掘的方法,從而擺脫傳統(tǒng)數(shù)據(jù)挖掘方法而給推送系統(tǒng)帶來的運算負(fù)荷。技術(shù)實現(xiàn)要素:為了解決現(xiàn)有技術(shù)存在的不足,本發(fā)明的目的在于提供一種基于游戲日志確定用戶性別的方法及系統(tǒng)。首先,為實現(xiàn)上述目的,提出一種基于游戲日志確定用戶性別的方法,包括以下步驟:數(shù)據(jù)預(yù)處理:篩選游戲日志數(shù)據(jù),對篩選出的有效數(shù)據(jù)建立統(tǒng)計表,所述統(tǒng)計表包括已知性別用戶分表以及未知性別用戶分表,所述已知性別用戶分表和未知性別用戶分表內(nèi)均包括用戶的IMSI(國際移動用戶識別碼,InternationalMobileSubscriberIdentificationNumber)數(shù)據(jù)以及每一位用戶所使用的游戲名稱;統(tǒng)計游戲性別極性:統(tǒng)計所述已知性別分表中各款游戲出現(xiàn)的比例,得到各款游戲的性別極性G(game_i);預(yù)測未知用戶性別:遍歷所述未知性別用戶分表,統(tǒng)計每一位未知性別用戶使用每一款游戲的頻率P(game_i),并根據(jù)如下公式計算每一位用戶的性別概率其中,n為統(tǒng)計表中游戲的總數(shù)量,根據(jù)所述每一位用戶的性別概率Pgender預(yù)測對應(yīng)用戶的性別。進(jìn)一步,上述方法中,所述篩選游戲日志數(shù)據(jù)的步驟包括:通過業(yè)務(wù)口徑,由正則表達(dá)式判斷數(shù)據(jù)是否有效,篩選掉被判斷為無效的數(shù)據(jù)。所述無效的數(shù)據(jù)包含空數(shù)據(jù)、亂碼數(shù)據(jù)或非460開頭且長度不等于15位的數(shù)據(jù)。進(jìn)一步,上述方法中,所述統(tǒng)計表中的數(shù)據(jù)還包括:每一位用戶使用每一款游戲的次數(shù)或頻率。進(jìn)一步,上述方法中,所述已知性別用戶分表僅包括男性用戶的有效數(shù)據(jù),或僅包括女性用戶的有效數(shù)據(jù)。尤其,由于游戲日志數(shù)據(jù)中男性用戶所占比例大約有70%,因而著重對男性用戶數(shù)據(jù)進(jìn)行處理,即可直接根據(jù)男性用戶的概率推知女性用戶。進(jìn)一步,上述方法中,所述統(tǒng)計游戲性別極性的步驟包括:第一步,將所述已知性別分表中的用戶隨機分為兩組,統(tǒng)計其中第一組中各款游戲出現(xiàn)的比例,得到各款游戲的性別極性預(yù)測值G′(game_i);其中,第一組中用戶的數(shù)目占所述已知性別分表中用戶總數(shù)的70%;第二步,使用所述性別極性預(yù)測值G′(game_i)按照所述預(yù)測未知用戶性別的方法,預(yù)測第二組中各用戶的性別,并將預(yù)測的性別與所述第二組中各用戶標(biāo)記的性別進(jìn)行比較,評估預(yù)測未知用戶性別的準(zhǔn)確度。進(jìn)一步,上述方法中,所述用戶使用每一款游戲的頻率P(game_i)為所述未知性別用戶分表中標(biāo)記的每一位用戶使用每一款游戲的次數(shù)占該用戶使用游戲總次數(shù)的比例,或者為所述未知性別用戶分表中標(biāo)記的每一位用戶使用每一款游戲的頻率,或者為所述未知性別用戶分表中每一位用戶使用游戲的總數(shù)量的倒數(shù)。其次,為實現(xiàn)精確推送游戲的目的,還在上述方法中增加根據(jù)用戶性別推薦游戲的步驟,具體方法為:遍歷所述統(tǒng)計表,根據(jù)所述統(tǒng)計表中標(biāo)記的用戶性別或根據(jù)預(yù)測得到的用戶性別,查詢游戲目錄,推送性別極性G(game_i)與對應(yīng)用戶相匹配的游戲。其中,所述根據(jù)用戶性別推薦游戲的步驟中,推送所述游戲的順序還根據(jù)用戶使用每一種類游戲的頻率進(jìn)行排序,用戶使用頻率高的游戲種類推送時排序靠前,用戶使用頻率低的游戲種類推送時排序靠后。同時,為實現(xiàn)精確推送游戲的目的,還提出一種基于游戲日志確定用戶性別的系統(tǒng),包括依次順序連接的:游戲日志數(shù)據(jù)接口模塊、數(shù)據(jù)預(yù)處理模塊、統(tǒng)計表存儲單元、游戲性別極性統(tǒng)計單元、未知用戶性別預(yù)測模塊;所述游戲日志數(shù)據(jù)接口模塊用于讀取游戲日志數(shù)據(jù);所述數(shù)據(jù)預(yù)處理模塊用于篩選游戲日志數(shù)據(jù)接口所讀取的游戲日志數(shù)據(jù),并對篩選出的有效數(shù)據(jù)建立統(tǒng)計表,將所述統(tǒng)計表存儲于所述統(tǒng)計表存儲單元;所述統(tǒng)計表存儲單元用于存儲所述統(tǒng)計表內(nèi)的數(shù)據(jù);所述統(tǒng)計表包括已知性別用戶分表以及未知性別用戶分表,所述已知性別用戶分表和未知性別用戶分表內(nèi)均包括用戶的IMSI數(shù)據(jù)以及每一位用戶所使用的游戲名稱;所述游戲性別極性統(tǒng)計單元用于統(tǒng)計所述已知性別分表中各款游戲出現(xiàn)的比例,并將所述比例存儲為各款游戲?qū)?yīng)的性別極性G(game_i)數(shù)據(jù);所述未知用戶性別預(yù)測模塊用于遍歷所述未知性別用戶分表,統(tǒng)計每一位未知性別用戶使用每一款游戲的頻率P(game_i),并根據(jù)如下公式計算每一位用戶的性別概率其中,n為統(tǒng)計表中游戲的總數(shù)量,最后根據(jù)所述每一位用戶的性別概率Pgender預(yù)測對應(yīng)用戶的性別。進(jìn)一步,所述系統(tǒng),在所述未知用戶性別預(yù)測模塊后還連接有推薦系統(tǒng),所述推薦系統(tǒng)遍歷所述統(tǒng)計表,根據(jù)所述統(tǒng)計表中標(biāo)記的用戶性別或根據(jù)預(yù)測得到的用戶性別,查詢游戲目錄,推送性別極性G(game_i)與對應(yīng)用戶相匹配的游戲。有益效果本發(fā)明針對游戲日志內(nèi)靜態(tài)存儲的數(shù)據(jù)類別數(shù)據(jù)進(jìn)行統(tǒng)計分析。由于僅針對靜態(tài)數(shù)據(jù)進(jìn)行分析,而減輕了對用戶行為數(shù)據(jù)(如訪問內(nèi)容、訪問頻次、行為時間、行為載體)進(jìn)行分析時所產(chǎn)生的非必要的額外運算負(fù)荷。此外,本方法主要運用全概率公式的思想,并對根據(jù)游戲日志數(shù)據(jù)的特點,對全概率公式的計算進(jìn)行了簡化。具體而言,通過對已知性別用戶的有效數(shù)據(jù)進(jìn)行統(tǒng)計,得到各款游戲的性別極性G(game_i),用以取代全概率公式中的條件概率。本方法在進(jìn)行未知用戶性別預(yù)測時,計算方法簡單高效,運算資源消耗更少,無需對系統(tǒng)程序進(jìn)行大范圍的改進(jìn),即可使性別預(yù)測的準(zhǔn)確率至少達(dá)到71.4%。若同時結(jié)合模型融合方法,加入其它模型,即可將預(yù)測準(zhǔn)確率提升至81.2%以上。為進(jìn)一步簡化運算,本方法中的已知性別用戶分表僅包括男性(或僅包括女性)用戶的有效數(shù)據(jù),通過設(shè)置0.5的閾值對計算得到的用戶的性別概率Pgender進(jìn)行判斷。這樣,在根據(jù)男性用戶數(shù)據(jù)判斷用戶性別為男性的概率Pgender后,即可得出相應(yīng)的性別為女性的概率(1-Pgender)。根據(jù)女性用戶數(shù)據(jù)進(jìn)行計算也類似,可通過簡單運算得到相應(yīng)的性別為男性的概率。尤其,由于游戲日志數(shù)據(jù)中男性用戶所占比例更大,因而著重對男性用戶數(shù)據(jù)進(jìn)行處理。這樣,由于樣本本身更大,由此得到的男性用戶的概率也會更為準(zhǔn)確。同時,為了能夠方便地評估本方法預(yù)測未知用戶性別的準(zhǔn)確度,本方法在統(tǒng)計游戲性別極性的步驟中優(yōu)先利用70%的已知性別分表中用戶數(shù)據(jù)進(jìn)行訓(xùn)練,并通過剩下的30%的已知性別分表中的用戶數(shù)據(jù)來評估模型效果。進(jìn)一步,本方法所統(tǒng)計的各款游戲的性別極性G(game_i)還為現(xiàn)有游戲推送系統(tǒng)所利用,稱為選擇推送游戲時的一個考核維度。推送性別極性G(game_i)與對應(yīng)用戶相匹配的游戲(例如,計算或統(tǒng)計得到某用戶為男性的概率為Pgender,則向該用戶推送性別極性G(game_i)在接近Pgender數(shù)值的游戲),這樣推送更加符合用戶使用游戲的傾向,推送游戲的成功率會更高,同時,用戶接受程度也會更高。本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。附圖說明附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,并與本發(fā)明的實施例一起,用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:圖1為根據(jù)本發(fā)明實施例的基于游戲日志確定用戶性別的系統(tǒng)結(jié)構(gòu)圖;圖2為根據(jù)本發(fā)明實施例的游戲極性示意圖。具體實施方式以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例進(jìn)行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。圖1為基于游戲日志確定用戶性別的系統(tǒng)結(jié)構(gòu)圖,包括以下步驟:依次順序連接的:游戲日志數(shù)據(jù)接口模塊、數(shù)據(jù)預(yù)處理模塊、統(tǒng)計表存儲單元、游戲性別極性統(tǒng)計單元、未知用戶性別預(yù)測模塊;所述游戲日志數(shù)據(jù)接口模塊用于讀取游戲日志數(shù)據(jù);所述數(shù)據(jù)預(yù)處理模塊用于篩選游戲日志數(shù)據(jù)接口所讀取的游戲日志數(shù)據(jù),并對篩選出的有效數(shù)據(jù)建立統(tǒng)計表,將所述統(tǒng)計表存儲于所述統(tǒng)計表存儲單元;所述統(tǒng)計表存儲單元用于存儲所述統(tǒng)計表內(nèi)的數(shù)據(jù);所述統(tǒng)計表包括已知性別用戶分表以及未知性別用戶分表,所述已知性別用戶分表和未知性別用戶分表內(nèi)均包括用戶的IMSI數(shù)據(jù)以及每一位用戶所使用的游戲名稱;所述游戲性別極性統(tǒng)計單元用于統(tǒng)計所述已知性別分表中各款游戲出現(xiàn)的比例,并將所述比例存儲為各款游戲?qū)?yīng)的性別極性G(game_i)數(shù)據(jù);所述未知用戶性別預(yù)測模塊用于遍歷所述未知性別用戶分表,統(tǒng)計每一位未知性別用戶使用每一款游戲的頻率P(game_i),并根據(jù)如下公式計算每一位用戶的性別概率其中,n為統(tǒng)計表中游戲的總數(shù)量,最后根據(jù)所述每一位用戶的性別概率Pgender預(yù)測對應(yīng)用戶的性別。本實施例中,為實現(xiàn)精確推送游戲的目的,上述系統(tǒng)在在所述未知用戶性別預(yù)測模塊后還連接有推薦系統(tǒng),所述推薦系統(tǒng)遍歷所述統(tǒng)計表,根據(jù)所述統(tǒng)計表中標(biāo)記的用戶性別或根據(jù)預(yù)測得到的用戶性別,查詢游戲目錄,推送性別極性G(game_i)與對應(yīng)用戶相匹配的游戲。所述系統(tǒng)按照如下方法進(jìn)行工作:步驟一,數(shù)據(jù)預(yù)處理:篩選游戲日志數(shù)據(jù),對篩選出的有效數(shù)據(jù)建立統(tǒng)計表,所述統(tǒng)計表包括已知性別用戶分表以及未知性別用戶分表,所述已知性別用戶分表和未知性別用戶分表內(nèi)均包括用戶的IMSI(國際移動用戶識別碼,InternationalMobileSubscriberIdentificationNumber)數(shù)據(jù)以及每一位用戶所使用的游戲名稱;步驟二,統(tǒng)計游戲性別極性:統(tǒng)計所述已知性別分表中各款游戲出現(xiàn)的比例,得到各款游戲的性別極性G(game_i);步驟三,預(yù)測未知用戶性別:遍歷所述未知性別用戶分表,統(tǒng)計每一位未知性別用戶使用每一款游戲的頻率P(game_i),并根據(jù)如下公式計算每一位用戶的性別概率其中,n為統(tǒng)計表中游戲的總數(shù)量,根據(jù)所述每一位用戶的性別概率Pgender預(yù)測對應(yīng)用戶的性別。例如,以男性用戶數(shù)據(jù)為例,如果計算得到的某一位用戶的性別概率Pgender不小于0.5,則判斷該用戶為男性;否則,判斷該用戶為女性。其中,上述方法的步驟一中,所述篩選游戲日志數(shù)據(jù)的步驟包括:通過業(yè)務(wù)口徑,由正則表達(dá)式判斷數(shù)據(jù)是否有效,篩選掉被判斷為無效的數(shù)據(jù)。所述無效的數(shù)據(jù)包含空數(shù)據(jù)、亂碼數(shù)據(jù)或非460開頭且長度不等于15位的數(shù)據(jù),例如imsi是0000000000000,或者13456778等。獨立使用上述步驟即可得到用戶的性別概率Pgender。進(jìn)一步,為簡化計算,上述方法的步驟一中,所述已知性別用戶分表僅包括男性用戶的有效數(shù)據(jù),或僅包括女性用戶的有效數(shù)據(jù)。尤其,由于游戲日志數(shù)據(jù)中男性用戶所占比例大約有70%,因而著重對男性用戶數(shù)據(jù)進(jìn)行處理,即可直接根據(jù)男性用戶的概率推知女性用戶。若方法中的已知性別用戶分表僅包括男性用戶的有效數(shù)據(jù),通過設(shè)置0.5的閾值對計算得到的用戶的性別概率Pgender進(jìn)行判斷:當(dāng)用戶性別為男性的概率Pgender≥0.5時,即可判斷對應(yīng)用戶為男性。這樣,在根據(jù)男性用戶數(shù)據(jù)判斷用戶性別為男性的概率Pgender后,即可得出相應(yīng)的性別為女性的概率(1-Pgender)。對應(yīng)的,若方法中的已知性別用戶分表僅包括女性用戶的有效數(shù)據(jù),通過設(shè)置0.5的閾值對計算得到的用戶的性別概率Pgender進(jìn)行判斷:當(dāng)用戶性別為女性的概率Pgender≥0.5時,即可判斷對應(yīng)用戶為女性。這樣,在根據(jù)男性用戶數(shù)據(jù)判斷用戶性別為女性的概率Pgender后,即可得出相應(yīng)的性別為男性的概率(1-Pgender)。不過,由于游戲日志數(shù)據(jù)中男性用戶的樣本更多,以男性用戶作為基準(zhǔn)進(jìn)行統(tǒng)計、計算,得到的結(jié)果會更為準(zhǔn)確。進(jìn)一步,為增加計算的準(zhǔn)確度,上述方法的步驟一中,所述統(tǒng)計表中的數(shù)據(jù)還可以包括:每一位用戶使用每一款游戲的次數(shù)或頻率。這樣在步驟三的計算中可通過所述每一位用戶使用每一款游戲的次數(shù)或頻率,通過簡單處理,得到用戶使用每一款游戲的頻率P(game_i)。進(jìn)一步,為量化用戶性別預(yù)測的準(zhǔn)確度,上述方法的步驟二,統(tǒng)計游戲性別極性的步驟包括:第一步,將所述已知性別分表中的用戶隨機分為兩組,統(tǒng)計其中第一組中各款游戲出現(xiàn)的比例,得到各款游戲的性別極性預(yù)測值G′(game_i);其中,第一組中用戶的數(shù)目占所述已知性別分表中用戶總數(shù)的70%;第二步,使用所述性別極性預(yù)測值G′(game_i)按照所述預(yù)測未知用戶性別的方法,預(yù)測第二組中各用戶的性別,并將預(yù)測的性別與所述第二組中各用戶標(biāo)記的性別進(jìn)行比較,評估預(yù)測未知用戶性別的準(zhǔn)確度。進(jìn)一步,為簡化計算,上述方法的步驟三中,所述用戶使用每一款游戲的頻率P(game_i)為所述未知性別用戶分表中標(biāo)記的每一位用戶使用每一款游戲的次數(shù)占該用戶使用游戲總次數(shù)的比例,或者為所述未知性別用戶分表中標(biāo)記的每一位用戶使用每一款游戲的頻率,或者為所述未知性別用戶分表中每一位用戶使用游戲的總數(shù)量的倒數(shù)。其次,為實現(xiàn)精確推送游戲的目的,還在上述方法中增加根據(jù)用戶性別推薦游戲的步驟,具體方法為:遍歷所述統(tǒng)計表,根據(jù)所述統(tǒng)計表中標(biāo)記的用戶性別或根據(jù)預(yù)測得到的用戶性別,查詢游戲目錄,推送性別極性G(game_i)與對應(yīng)用戶相匹配的游戲。其中,所述根據(jù)用戶性別推薦游戲的步驟中,推送所述游戲的順序還根據(jù)用戶使用每一種類游戲的頻率進(jìn)行排序,用戶使用頻率高的游戲種類推送時排序靠前,用戶使用頻率低的游戲種類推送時排序靠后。使用中,具體計算實例如下:步驟二中,通過已有性別標(biāo)簽的游戲日志數(shù)據(jù)計算各款游戲的性別極性G(game_i)的過程中,假設(shè)日志數(shù)據(jù)篩選出標(biāo)簽為'男'的用戶如下:用戶游戲游戲游戲游戲游戲性別user1愛情女神中國象棋極品飛車連連看男user2中國象棋愛情女神極品飛車連連看男user3大富翁愛情女神王牌飛行男user4愛情女神王牌飛行中國象棋連連看男user5王牌飛行愛情女神連連看極品飛車男user6愛情女神極品飛車中國象棋王牌飛行男user7中國象棋愛情女神大富翁極品飛車男user8中國象棋男user9大富翁王牌飛行極品飛車愛情女神男user10大富翁愛情女神連連看極品飛車中國象棋男G(game_'大富翁')=0.4,G(game_'連連看')=0.5G(game_'愛情女神')=0.9,G(game_'極品飛車')=0.7可計算得到G(game_'中國象棋')=0.7,G(game_'王牌飛行')=0.9則,根據(jù)公式得到user1....user10每個用戶為男的概率分別為0.7,0.7,0.6,0.65,0.65,0.7,0.675,0.7,0.625,0.64。以user10為例,具體計算過程為:游戲日志表中每個用戶使用游戲的數(shù)量,表示一段時間內(nèi)用戶使用游戲的次數(shù)。游戲日志表中統(tǒng)計的時間的長短越長越好,越長越準(zhǔn)確,實際應(yīng)用中,一般能夠統(tǒng)計用戶7天內(nèi)的數(shù)據(jù)。本發(fā)明可以通過圖2的數(shù)據(jù)圖直觀地對用戶的性別進(jìn)行判斷。以用戶B為例,其使用的“極品飛車”、“中國象棋”和“王牌飛行”都具備明顯的性別極性,因而,可通過上述公式預(yù)測其為男性。與其實際性別對比,即可判斷所述性別極性數(shù)據(jù)是否可靠,是否需要進(jìn)行修正。本發(fā)明技術(shù)方案的優(yōu)點主要體現(xiàn)在于:本發(fā)明應(yīng)用全概率公式的思想,直接對游戲用戶的日志數(shù)據(jù)進(jìn)行篩選統(tǒng)計,通過簡單計算即可準(zhǔn)確推測出用戶性別。本方法無需對現(xiàn)有用戶信息構(gòu)數(shù)據(jù)挖掘模型,也無需對模型進(jìn)行特殊訓(xùn)練,僅通過簡單統(tǒng)計以及運算即可準(zhǔn)確獲知對應(yīng)用戶的性別,從而降低了因構(gòu)造分布式方程訓(xùn)練而造成的額外的運算成本,并同時提高了運算效率。通過本方法,游戲運營商可通過自身日志信息,僅花費很小的成本即可對用戶進(jìn)行準(zhǔn)確的用戶群定位,從而有針對性地進(jìn)行游戲推送,運營成本大大降低,而同時,用戶體驗卻可以有所提升。具體而言:1)本方法所用數(shù)據(jù)簡單,可以直接從運營日志獲取,這類數(shù)據(jù)在每一個游戲公司應(yīng)該都有,是最初級的日志數(shù)據(jù)。2)本方法實現(xiàn)相對容易本專利預(yù)測出來的用戶性別準(zhǔn)確度為71.4%,再結(jié)合模型融合方法加入其它模型,最后提升到81.2%計算量成本較低,一般數(shù)據(jù)挖掘模型先通過構(gòu)建數(shù)據(jù)挖掘模型來訓(xùn)練得到模型再根據(jù)模型來對數(shù)據(jù)進(jìn)行男女預(yù)測,計算量消耗非常大,且需要分布式編程增加了編程難度,這種方法只需要簡單的公式即可實現(xiàn),沒有因傳統(tǒng)的數(shù)據(jù)挖掘方法而有所約束。3)本方法的數(shù)據(jù)模型容易理解,尤其相比較于傳統(tǒng)的數(shù)據(jù)挖掘算法而言,本方法更為簡單,很好理解,系統(tǒng)實現(xiàn)難度也更小。本領(lǐng)域普通技術(shù)人員可以理解:以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,盡管參照前述實施例對本發(fā)明進(jìn)行了詳細(xì)的說明,對于本領(lǐng)域的技術(shù)人員來說,其依然可以對前述各實施例記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
神农架林区| 芜湖市| 益阳市| 凤山县| 缙云县| 巴马| 广丰县| 丹凤县| 永福县| 石棉县| 巴塘县| 许昌县| 白城市| 云南省| 邹城市| 巴彦淖尔市| 万州区| 侯马市| 梁山县| 华蓥市| 额济纳旗| 长治市| 江西省| 青川县| 英超| 红桥区| 灵武市| 岳普湖县| 孙吴县| 凉城县| 宁强县| 临武县| 渭南市| 邳州市| 疏勒县| 咸宁市| 南昌市| 同心县| 麻城市| 淮安市| 绿春县|