本發(fā)明涉及數(shù)據(jù)分析,特別是一種基于人工智能的公共服務(wù)數(shù)據(jù)分析系統(tǒng)。
背景技術(shù):
1、公共服務(wù)數(shù)據(jù),涵蓋環(huán)境數(shù)據(jù)、交通數(shù)據(jù)、社會(huì)活動(dòng)數(shù)據(jù)等,通過對這些數(shù)據(jù)的深入分析,可以為公共服務(wù)機(jī)構(gòu)提供有力的決策支持,在城市中人們通常會(huì)根據(jù)個(gè)人作息選擇出行,除了人們的出行意愿,通常出行經(jīng)歷的好壞也容易受環(huán)境數(shù)據(jù)、交通數(shù)據(jù)的影響;
2、盡管人工智能技術(shù)在公共服務(wù)數(shù)據(jù)分析中的應(yīng)用前景廣闊,但是依舊沒有與城市的公共服務(wù)數(shù)據(jù)進(jìn)行結(jié)合,尤其在環(huán)境數(shù)據(jù)和交通數(shù)據(jù)的使用中不便綜合分析,并為行人的出行提供有效建議,進(jìn)而在交通擁堵和環(huán)境惡劣時(shí)不能及時(shí)為人們提供準(zhǔn)確和及時(shí)的預(yù)測和推薦,影響行人出行的同時(shí)增加了交通和環(huán)境公共服務(wù)的壓力。
技術(shù)實(shí)現(xiàn)思路
1、鑒于上述現(xiàn)有的基于人工智能的公共服務(wù)數(shù)據(jù)分析系統(tǒng)中存在的問題,提出了本發(fā)明。
2、因此,本發(fā)明所要解決的問題在于在環(huán)境數(shù)據(jù)和交通數(shù)據(jù)的使用中不便綜合分析,并為行人的出行提供有效建議,進(jìn)而在交通擁堵和環(huán)境惡劣時(shí)不能及時(shí)為人們提供準(zhǔn)確和及時(shí)的預(yù)測和推薦,影響行人出行的同時(shí)增加了交通和環(huán)境公共服務(wù)的壓力。
3、為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:一種基于人工智能的公共服務(wù)數(shù)據(jù)分析系統(tǒng),其包括,
4、數(shù)據(jù)處理模塊,基于公共服務(wù)數(shù)據(jù)和個(gè)人用戶信息,并提取數(shù)據(jù)特征;
5、數(shù)據(jù)分析模塊,構(gòu)建回歸模型,分析公共服務(wù)數(shù)據(jù)預(yù)測環(huán)境評分,基于個(gè)人用戶信息分析用戶出行行為,分析用戶行為強(qiáng)度;
6、綜合評分模塊,綜合環(huán)境評分和用戶行為強(qiáng)度,分析出行的綜合評分,動(dòng)態(tài)優(yōu)化閾值,根據(jù)綜合評分判斷出行推薦;
7、數(shù)據(jù)管理模塊,基于云服務(wù)存儲(chǔ)平臺進(jìn)行分層存儲(chǔ)和備份,基于存儲(chǔ)數(shù)據(jù)自動(dòng)生成報(bào)表,定期更新數(shù)據(jù)。
8、作為本發(fā)明所述基于人工智能的公共服務(wù)數(shù)據(jù)分析系統(tǒng)的一種優(yōu)選方案,其中:所述基于公共服務(wù)數(shù)據(jù)和個(gè)人用戶信息,并提取特征數(shù)據(jù),包括,
9、基于公共服務(wù)數(shù)據(jù)中針對環(huán)境數(shù)據(jù)和交通數(shù)據(jù)進(jìn)行特征提取,包括pm2.5、溫度、濕度、紫外線強(qiáng)度和交通流量數(shù)據(jù),針對pm2.5進(jìn)行對數(shù)變化,針對溫度、濕度、紫外線強(qiáng)度和交通流量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,構(gòu)成環(huán)境特征向量e;
10、收集個(gè)人用戶信息,包括用戶在不同時(shí)間的位置信息、出行位移數(shù)據(jù)和歷史出行時(shí)間數(shù)據(jù),進(jìn)行標(biāo)準(zhǔn)化處理,構(gòu)成用戶特征向量r。
11、作為本發(fā)明所述基于人工智能的公共服務(wù)數(shù)據(jù)分析系統(tǒng)的一種優(yōu)選方案,其中:所述構(gòu)建回歸模型,分析公共服務(wù)數(shù)據(jù)預(yù)測環(huán)境評分,包括,
12、基于環(huán)境特征向量e,構(gòu)建回歸模型,針對目標(biāo)公共服務(wù)場景進(jìn)行環(huán)境評分,表示為:
13、;
14、其中表示預(yù)測的環(huán)境評分,表示頻分時(shí)間的區(qū)間上限,表示第i個(gè)環(huán)境特征的權(quán)重系數(shù),表示第i個(gè)環(huán)境特征的調(diào)節(jié)系數(shù),表示第i個(gè)特征的頻率系數(shù),表示時(shí)間t的第i個(gè)特征值,n表示特征數(shù)目;
15、使用訓(xùn)練集訓(xùn)練模型,并設(shè)定均方誤差損失函數(shù);
16、使用梯度下降法來最小化損失函數(shù),以更新和確定參數(shù)、和;
17、使用新收集的特征數(shù)據(jù)輸入模型,得到當(dāng)前的環(huán)境評分。
18、作為本發(fā)明所述基于人工智能的公共服務(wù)數(shù)據(jù)分析系統(tǒng)的一種優(yōu)選方案,其中:所述基于個(gè)人用戶信息分析用戶出行行為,分析用戶行為強(qiáng)度,包括,
19、基于用戶特征向量r,對用戶行為強(qiáng)度進(jìn)行計(jì)算,表示為:
20、;
21、其中表示第i個(gè)用戶在時(shí)間t的行為強(qiáng)度,表示第i個(gè)用戶周期性行為強(qiáng)度的調(diào)節(jié)系數(shù),t表示時(shí)間周長,l表示常駐位置的參考距離,表示用戶i當(dāng)前位置與常駐位置的距離,表示用戶i當(dāng)前行為的時(shí)間均值,表示用戶i當(dāng)前行為的時(shí)間標(biāo)準(zhǔn)差,表示用戶i歷史行動(dòng)數(shù)據(jù)的調(diào)節(jié)系數(shù),表示第k個(gè)歷史行為的時(shí)間均值,表示第k個(gè)歷史行為的時(shí)間標(biāo)準(zhǔn)差,為時(shí)間段長度,k表示歷史行為事件總數(shù);
22、通過收集歷史數(shù)據(jù),并根據(jù)用戶行為標(biāo)定歷史用戶行為強(qiáng)度的數(shù)據(jù)作為訓(xùn)練集數(shù)據(jù),設(shè)置均方誤差損失函數(shù),使用梯度下降法最小化損失函數(shù),調(diào)整并確認(rèn)和;
23、使用新收集的用戶特征數(shù)據(jù),預(yù)測用戶的行為強(qiáng)度。
24、作為本發(fā)明所述基于人工智能的公共服務(wù)數(shù)據(jù)分析系統(tǒng)的一種優(yōu)選方案,其中:所述綜合環(huán)境評分和用戶行為強(qiáng)度,分析出行的綜合評分,包括,
25、根據(jù)預(yù)測的環(huán)境評分和用戶行為強(qiáng)度,計(jì)算綜合評分,表示為:
26、;
27、其中s表示綜合評分,表示環(huán)境評分調(diào)節(jié)系數(shù),表示用戶行為強(qiáng)度調(diào)節(jié)系數(shù),表示環(huán)境評分和用戶行為強(qiáng)度的交互系數(shù);
28、通過收集歷史數(shù)據(jù),根據(jù)不同天氣環(huán)境數(shù)據(jù)和用戶的實(shí)際行為定義歷史綜合評分作為訓(xùn)練集,使用均方誤差作為目標(biāo)函數(shù)并定義參數(shù)范圍,通過k折交叉驗(yàn)證,將數(shù)據(jù)集分為k個(gè)子集,每次用k-1個(gè)子集進(jìn)行訓(xùn)練,用剩下的一個(gè)子集進(jìn)行驗(yàn)證,重復(fù)k次,取平均值作為目標(biāo)函數(shù)的值,使用最小化目標(biāo)函數(shù)的值確認(rèn)、和;
29、使用新預(yù)測的環(huán)境評分和用戶行為強(qiáng)度,計(jì)算綜合評分。
30、作為本發(fā)明所述基于人工智能的公共服務(wù)數(shù)據(jù)分析系統(tǒng)的一種優(yōu)選方案,其中:所述動(dòng)態(tài)優(yōu)化閾值,根據(jù)綜合評分判斷出行推薦,包括,
31、計(jì)算用戶歷史出行數(shù)據(jù)中的綜合評分s的統(tǒng)計(jì)量,包括均值和標(biāo)準(zhǔn)差以及中位數(shù),并將均值和標(biāo)準(zhǔn)差相加作為初步閾值;
32、根據(jù)歷史出行數(shù)據(jù)計(jì)算實(shí)際出行用戶被正確預(yù)測的出行比例tpr,計(jì)算不出行用戶被正確預(yù)測的不出行比例tnr;
33、逐步調(diào)整閾值并驗(yàn)證tnr和tpr的正確預(yù)測比例均達(dá)到最大時(shí),確定閾值;
34、根據(jù)確定后的閾值,若綜合評分s大于閾值,則推薦用戶出行,若綜合評分s小于等于閾值,則不推薦用戶出行。
35、作為本發(fā)明所述基于人工智能的公共服務(wù)數(shù)據(jù)分析系統(tǒng)的一種優(yōu)選方案,其中:所述基于云服務(wù)存儲(chǔ)平臺進(jìn)行分層存儲(chǔ)和備份,包括,
36、將包括歷史數(shù)據(jù)、用戶行為數(shù)據(jù)和綜合評分?jǐn)?shù)據(jù)通過無線網(wǎng)絡(luò)遠(yuǎn)程傳輸至云服務(wù)存儲(chǔ)平臺,通過aws?s3公式定期備份數(shù)據(jù);
37、使用云存儲(chǔ)服務(wù)將數(shù)據(jù)進(jìn)行單獨(dú)存儲(chǔ),并根據(jù)數(shù)據(jù)訪問頻率和重要性,采用分層存儲(chǔ)策略;
38、其中將歷史數(shù)據(jù)和備份數(shù)據(jù)采用aws?s3作為冷數(shù)據(jù)存儲(chǔ),將實(shí)時(shí)的綜合評分和用戶行為數(shù)據(jù)采用aws?s3作為熱點(diǎn)數(shù)據(jù)存儲(chǔ)。
39、作為本發(fā)明所述基于人工智能的公共服務(wù)數(shù)據(jù)分析系統(tǒng)的一種優(yōu)選方案,其中:所述基于存儲(chǔ)數(shù)據(jù)自動(dòng)生成報(bào)表,定期更新數(shù)據(jù),包括,
40、使用基于云服務(wù)平臺的aws?quicksight作為報(bào)表生成工具,將云存儲(chǔ)中的數(shù)據(jù)與報(bào)表生成工具集成,構(gòu)建數(shù)據(jù)模型和報(bào)表;
41、使用aws?quicksight配置spice數(shù)據(jù)集的自動(dòng)刷新策略,定期同步數(shù)據(jù)并配置報(bào)表生成工具的自動(dòng)化更新功能,定期刷新數(shù)據(jù)和報(bào)表。
42、一種計(jì)算機(jī)設(shè)備,包括:存儲(chǔ)器和處理器;所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述基于人工智能的公共服務(wù)數(shù)據(jù)分析系統(tǒng)的步驟。
43、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述基于人工智能的公共服務(wù)數(shù)據(jù)分析系統(tǒng)的步驟。
44、本發(fā)明有益效果為:通過基于公共服務(wù)數(shù)據(jù)的采集和標(biāo)準(zhǔn)化處理,為公共場所的環(huán)境評分的預(yù)測提供基礎(chǔ),通過結(jié)合環(huán)境評分、用戶行為強(qiáng)度和兩者的交互效應(yīng),綜合考慮了用戶的個(gè)性化行為模式和環(huán)境影響,保留了個(gè)人出行意愿的考慮,同時(shí)基于公共服務(wù)數(shù)據(jù)可以及時(shí)將因?yàn)榻煌ê铜h(huán)境因素造成的出行影響反映在綜合評分中,達(dá)到了基于人工智能綜合分析公共服務(wù)數(shù)據(jù)和識別用戶行為,為用戶提供出行預(yù)測和推薦的效果,為用戶的出行提供心理預(yù)期,降低對用戶行人的影響,并降低了對交通和環(huán)境公共服務(wù)的壓力。