本發(fā)明涉及煙草銷量的預(yù)測方法,尤其針對基于煙草銷量影響因素分析而構(gòu)建的煙草銷量預(yù)測方法。
背景技術(shù):
我國煙草行業(yè)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展仍處于初級階段,數(shù)據(jù)商業(yè)應(yīng)用敏感度低,沒有建立完善、科學(xué)的基礎(chǔ)零售戶數(shù)據(jù)庫??蛻粼u價(jià)標(biāo)準(zhǔn)還不統(tǒng)一。卷煙營銷 V3 系統(tǒng)使用的客戶組別管理,主要從客戶訂購的數(shù)量、金額、品牌規(guī)格幾個(gè)指標(biāo)進(jìn)行評定,評價(jià)方式比較粗放,評價(jià)結(jié)果難以全面、客觀的反映客戶的貢獻(xiàn)度、成長率等;手段過時(shí)??蛻艚?jīng)理的移動辦公系統(tǒng),雖然將手工工作轉(zhuǎn)換為系統(tǒng)操作,但僅限于線下客戶拜訪和跟蹤訂單等一些簡單功能,沒有發(fā)揮互聯(lián)網(wǎng)對市場信息的感知和對客戶需求采集及分析的作用;數(shù)據(jù)庫多為傳統(tǒng)事務(wù)型數(shù)據(jù)庫,無法很好的進(jìn)行數(shù)據(jù)挖掘,限制了對營銷數(shù)據(jù)的分析和利用;數(shù)據(jù)的分析主要依靠電子表格,當(dāng)樣本數(shù)據(jù)量稍大或者計(jì)算較多時(shí),分析過程會十分繁瑣且效率低下;分析結(jié)果多以文字為主,無法做到一目了然,無法直接用于問題查找和輔助決策。
專利號201410183598.2公開了一種基于協(xié)同過濾的零售點(diǎn)產(chǎn)品銷量預(yù)測方法,利用已知的產(chǎn)品(規(guī)格)在不同零售點(diǎn)的銷量數(shù)據(jù),通過協(xié)同過濾技術(shù)計(jì)算出未知的產(chǎn)品(規(guī)格)在零售點(diǎn)的銷量預(yù)測。該方法涉及的自變量因素較少且自變量的域比較大,其最終的預(yù)測結(jié)果并不一定理想。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是針對現(xiàn)有煙草銷量預(yù)測方式粗放、參照的自變量因素少的不足,提出一種.基于因素評分的煙草銷量預(yù)測方法。
為了解決上述技術(shù)問題,本發(fā)明的基于因素評分的煙草銷量預(yù)測方法,步驟一,選擇至少一個(gè)因素類,所述因素類至少包含兩組自變量因素,收集自變量因素在N個(gè)時(shí)間段的數(shù)據(jù)及對應(yīng)煙草銷量數(shù)據(jù);建立關(guān)于自變量因素?cái)?shù)據(jù)與煙草銷量數(shù)據(jù)的數(shù)據(jù)庫,對因素?cái)?shù)據(jù)進(jìn)行定量處理;將自變量因素?cái)?shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,使因素類中的每組自變量因素?cái)?shù)據(jù)均值為0且Pearson相關(guān)系數(shù)為0;利用Gram-Schmidt變換,對因素類中的自變量因素?cái)?shù)據(jù)組進(jìn)行變量篩選。
步驟二,對篩選出的自變量因素?cái)?shù)據(jù)組運(yùn)用協(xié)同過濾計(jì)算方法,采用基于煙草的標(biāo)準(zhǔn)正態(tài)變換,獲得相應(yīng)的因素評分。
步驟三,使用協(xié)同過濾算法計(jì)算出煙草在零售網(wǎng)點(diǎn)的未知銷量的對應(yīng)評分。
步驟四,使用步驟二所選取的因素評分變換所對應(yīng)的逆變換,作用于步驟三計(jì)算出的未知因素評分估計(jì),根據(jù)各自變量因素組所占權(quán)重的大小,計(jì)算出未知銷量的預(yù)測值。
上述技術(shù)方案中,所述步驟二至步驟四的一種實(shí)施方式為記為卷煙產(chǎn)品擁有已知影響因素的數(shù)據(jù)集合,為各因素的數(shù)據(jù)矩陣,為已知卷煙銷量和因素?cái)?shù)值,為卷煙產(chǎn)品的因素評分,,,則卷煙產(chǎn)品的銷量基于煙草的標(biāo)準(zhǔn)正態(tài)變換按以下公式計(jì)算:,對應(yīng)的獲得銷量預(yù)測的逆變換為:,為預(yù)測的銷量。
上述技術(shù)方案中,所述的一個(gè)因素類為自我因素類,所述自我因素類中包含消費(fèi)者的收入水平、年齡、性別、職業(yè)、文化程度、愛好及風(fēng)俗習(xí)慣、消費(fèi)者對卷煙的購買偏好、消費(fèi)者群體聚集度自變量因素組。
上述技術(shù)方案中,所述的一個(gè)因素類為產(chǎn)品因素類,所述產(chǎn)品因素類中包含卷煙的功效、品質(zhì)、品牌形象、服務(wù)水平及價(jià)格自變量因素組。
上述技術(shù)方案中,所述一個(gè)因素類為社會因素類,所述社會因素類中包含消費(fèi)者生活圈子、地區(qū)文化、社會潮流及節(jié)假日需求自變量因素組。
上述技術(shù)方案中,所述一個(gè)因素類為經(jīng)濟(jì)因素類,所述經(jīng)濟(jì)因素類中包含地區(qū)GDP、人均GDP、第一、二、三產(chǎn)業(yè)比重、第一、二、三產(chǎn)業(yè)值、該地區(qū)在崗職工年均工資、居民消費(fèi)價(jià)格指數(shù)、商品零售價(jià)格指數(shù)、人均年可支配收入及人均年消費(fèi)性支出自變量因素組。
上述技術(shù)方案中,包含四個(gè)因素類,分別是自我因素類,所述自我因素類中包含消費(fèi)者的收入水平、年齡、性別、職業(yè)、文化程度、愛好及風(fēng)俗習(xí)慣、消費(fèi)者對卷煙的購買偏好、消費(fèi)者群體聚集度自變量因素組;產(chǎn)品因素類,所述產(chǎn)品因素類中包含卷煙的功效、品質(zhì)、品牌形象、服務(wù)水平及價(jià)格自變量因素組;社會因素類,所述社會因素類中包含消費(fèi)者生活圈子、地區(qū)文化、社會潮流及節(jié)假日需求自變量因素組;經(jīng)濟(jì)因素類,所述經(jīng)濟(jì)因素類中包含地區(qū)GDP、人均GDP、第一、二、三產(chǎn)業(yè)比重、第一、二、三產(chǎn)業(yè)值、該地區(qū)在崗職工年均工資、居民消費(fèi)價(jià)格指數(shù)、商品零售價(jià)格指數(shù)、人均年可支配收入及人均年消費(fèi)性支出自變量因素組。
本發(fā)明的方法可以利用互聯(lián)網(wǎng)平臺,建立起與煙草零售戶及消費(fèi)者的聯(lián)系,及時(shí)獲取消費(fèi)者信息,通過對各影響因素進(jìn)行評分賦值,從而預(yù)測卷煙銷量,實(shí)現(xiàn)精準(zhǔn)營銷,促進(jìn)煙草行業(yè)改革。
附圖說明
圖1為煙草銷售預(yù)測方法流程圖。
具體實(shí)施方式
結(jié)合圖1,本發(fā)明的基于因素評分的煙草銷量預(yù)測方法的一種實(shí)施方式包含有如下幾個(gè)步驟:
一、數(shù)據(jù)采集
1.確定影響銷量的因素類
根據(jù)問卷調(diào)查的設(shè)計(jì),將影響消費(fèi)者購買動機(jī)轉(zhuǎn)化為購買行為的因素類主要分為自我因素、產(chǎn)品因素、社會因素和經(jīng)濟(jì)因素四大類型。
自我因素細(xì)分為:消費(fèi)者的收入水平、年齡、性別、職業(yè)、文化程度、愛好及風(fēng)俗習(xí)慣,消費(fèi)者對卷煙的購買偏好,消費(fèi)者群體聚集度。
產(chǎn)品因素細(xì)分為卷煙的功效、品質(zhì)、品牌形象、服務(wù)水平及價(jià)格。
社會因素細(xì)分為消費(fèi)者生活圈子,地區(qū)文化,社會潮流及節(jié)假日需求。
經(jīng)濟(jì)因素細(xì)分為該地區(qū)GDP,人均GDP,第一、二、三產(chǎn)業(yè)比重,第一、二、三產(chǎn)業(yè)值,該地區(qū)在崗職工年均工資、居民消費(fèi)價(jià)格指數(shù)、商品零售價(jià)格指數(shù)、人均年可支配收入及人均年消費(fèi)性支出。
2.建立數(shù)據(jù)庫
通過網(wǎng)絡(luò)平臺發(fā)放調(diào)查問卷,得到不同時(shí)期以上因素?cái)?shù)據(jù)。對于定性因素進(jìn)行打分定量處理,轉(zhuǎn)化為相應(yīng)數(shù)據(jù)。收集各個(gè)零售點(diǎn)對應(yīng)時(shí)期的銷量數(shù)據(jù)。其中,經(jīng)濟(jì)因素的指標(biāo)數(shù)據(jù)可以采集各地區(qū)統(tǒng)計(jì)局官方數(shù)據(jù),具有一定的客觀性和真實(shí)性。
二、數(shù)據(jù)處理
將自變量因素分成4組,在第組中有個(gè)變量。對每組變量進(jìn)行次觀測,由此構(gòu)成的數(shù)據(jù)表X可以表示成一個(gè)維的矩陣
其中,,被稱為第個(gè)樣本點(diǎn)。,被稱為第個(gè)變量,表示所有樣本點(diǎn)在第個(gè)指標(biāo)上的取值分布。
以第一組為例,設(shè)中心化后的因變量(銷量)為,自變量為。將所有變量做中心化處理。使新坐標(biāo)的原點(diǎn)與樣本點(diǎn)的重心重合,每一個(gè)變量的均值為0,保證當(dāng)兩個(gè)變量是正交變量時(shí),它們之間的Pearson相關(guān)系數(shù)等于0。
為方便起見,中心化后的變量仍為。
三、模型建立
利用Gram-Schmidt變換,對每組自變量集合進(jìn)行變量篩選。
設(shè)第一步的備選變量集合為。分別建立關(guān)于的一元線性回歸模型。在通過檢驗(yàn)的自變量中,選統(tǒng)計(jì)量的絕對值最大的G-S變量進(jìn)入模型。不妨設(shè)第一個(gè)被選中的關(guān)聯(lián)變量為,即。
令第二步的備選變量集合為
分別求關(guān)于和的二元線性回歸模型。在通過檢驗(yàn)的自變量中,選中統(tǒng)計(jì)量的絕對值最大的G-S變量進(jìn)入模型。不妨設(shè)第二個(gè)被選中的關(guān)聯(lián)變量為,即。
令第三步的備選變量集合為
分別求關(guān)于和的三元線性回歸模型。在通過檢驗(yàn)的自變量中,選中統(tǒng)計(jì)量的絕對值最大的量進(jìn)入模型。不妨設(shè)第三個(gè)被選中的關(guān)聯(lián)變量為,即。重復(fù)上面步驟,直到模型外邊的所有變量經(jīng)Gram-Schmidt變換處理后都不能通過檢驗(yàn)為止。
四、構(gòu)建因素評分機(jī)制
步驟1:利用上述數(shù)據(jù)采集的步驟過程,采集煙草已知銷量和影響因素類等數(shù)據(jù)。煙草已知銷量是指在考察期內(nèi)具有銷售成績的銷量數(shù)據(jù),或零售網(wǎng)點(diǎn)實(shí)際銷售的卷煙數(shù)量。
步驟2:將經(jīng)過檢驗(yàn)后的所有變量,也就是篩選后的自變量因素?cái)?shù)據(jù)組運(yùn)用協(xié)同過濾的計(jì)算方法,選擇一種因素變換法作用于已知銷量和影響因素,將銷量和各影響因素轉(zhuǎn)換成具有統(tǒng)一標(biāo)準(zhǔn)的可比評分?jǐn)?shù)值。采用基于卷煙的標(biāo)準(zhǔn)正態(tài)變換,獲得相應(yīng)的因素評分。
步驟3:使用協(xié)同過濾算法計(jì)算出煙草在零售網(wǎng)點(diǎn)的未知銷量對應(yīng)的評分。這里的未知銷量是指以產(chǎn)品、零售網(wǎng)點(diǎn)這兩個(gè)維度的銷量因素矩陣中,去除已知銷量對應(yīng)元素的其他元素所對應(yīng)的銷量數(shù)據(jù)。
步驟4:使用步驟2所選取的因素評分變換所對應(yīng)的逆變換,作用于步驟3計(jì)算出的未知因素評分估計(jì),根據(jù)各因素所占權(quán)重的大小,從而計(jì)算出未知銷量的預(yù)測值。
卷煙因素標(biāo)準(zhǔn)正態(tài)變換法如下:
記為卷煙產(chǎn)品擁有已知影響因素的數(shù)據(jù)集合,也就是經(jīng)過t檢驗(yàn)后自變量因素?cái)?shù)據(jù)集合,為各因素的數(shù)據(jù)矩陣,為已知卷煙銷量和因素?cái)?shù)值,也就是所有因素類數(shù)值,為卷煙產(chǎn)品的因素評分,也就是量化對應(yīng)后的銷量值。,,則卷煙產(chǎn)品的銷量基于產(chǎn)品的標(biāo)準(zhǔn)正態(tài)變換按以下公式計(jì)算:,對應(yīng)的獲得銷量預(yù)測的逆變換為:,為預(yù)測的銷量。