本申請(qǐng)涉及數(shù)據(jù)分析,尤其涉及一種基于多維數(shù)據(jù)融合分析的跨平臺(tái)門店匹配方法及系統(tǒng)。
背景技術(shù):
1、隨著o2o(online?to?offline,線上到線下)行業(yè)的蓬勃發(fā)展,越來越多的企業(yè)依賴線上與線下的數(shù)據(jù)聯(lián)動(dòng),以提升用戶體驗(yàn)、優(yōu)化服務(wù)流程及進(jìn)行精準(zhǔn)營銷。這其中,門店數(shù)據(jù)的匹配成為了一個(gè)關(guān)鍵環(huán)節(jié)。品牌商通常在多個(gè)線上平臺(tái)開展業(yè)務(wù),各平臺(tái)對(duì)門店名稱的記錄方式各異,加之品牌自身的命名規(guī)則并不統(tǒng)一,使得跨平臺(tái)的門店數(shù)據(jù)匹配難度加大。
2、舉例來說,一個(gè)餐飲品牌可能在不同平臺(tái)上使用略有不同的名稱:“abc餐廳(總部店)”在平臺(tái)a上可能被記錄為“abc餐飲公司總店”,而在平臺(tái)b上則可能以“abc主店”命名。這些差異盡管在用戶角度上是容易辨別的,但對(duì)于自動(dòng)化的數(shù)據(jù)系統(tǒng)來說,進(jìn)行高效、精準(zhǔn)的匹配卻是一個(gè)技術(shù)挑戰(zhàn)。因此,導(dǎo)致o2o服務(wù)商在進(jìn)行數(shù)據(jù)整合時(shí),往往面臨品牌線下門店與各個(gè)平臺(tái)線上門店不一致的問題,嚴(yán)重影響了后續(xù)的數(shù)據(jù)分析和服務(wù)優(yōu)化。
3、此外,門店的地理位置數(shù)據(jù)、品牌特征數(shù)據(jù)(如門店的月銷、評(píng)分等)在不同平臺(tái)上可能以不同的格式或標(biāo)準(zhǔn)存在,也進(jìn)一步增加了門店匹配的復(fù)雜性。
4、針對(duì)上述問題,目前業(yè)界暫未提出較佳的技術(shù)解決方案。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)?zhí)峁┮环N基于多維數(shù)據(jù)融合分析的跨平臺(tái)門店匹配方法、系統(tǒng)、存儲(chǔ)介質(zhì)、計(jì)算機(jī)程序產(chǎn)品及電子設(shè)備,用以至少解決目前相關(guān)技術(shù)中門店數(shù)據(jù)在不同平臺(tái)間因命名規(guī)則不一致而導(dǎo)致跨平臺(tái)門店數(shù)據(jù)難以有效聯(lián)動(dòng)的問題。
2、第一方面,本申請(qǐng)實(shí)施例提供一種基于多維數(shù)據(jù)融合分析的跨平臺(tái)門店匹配方法,包括:從多個(gè)數(shù)據(jù)平臺(tái)分別獲取平臺(tái)門店多維數(shù)據(jù),所述平臺(tái)門店多維數(shù)據(jù)包含平臺(tái)門店名稱、平臺(tái)門店地理位置和平臺(tái)門店活躍時(shí)間;提取各個(gè)平臺(tái)門店多維數(shù)據(jù)所分別對(duì)應(yīng)的門店綜合特征;對(duì)各個(gè)所述門店綜合特征進(jìn)行加權(quán)聚類,以確定相應(yīng)的多個(gè)聚類簇;在加權(quán)聚類的過程中,根據(jù)每個(gè)門店綜合特征與各個(gè)聚類簇之間的歐式距離計(jì)算相應(yīng)的隸屬度;針對(duì)各個(gè)所述門店綜合特征,根據(jù)對(duì)應(yīng)最大隸屬度的聚類簇確定所述門店綜合特征的匹配聚類簇,并將所述匹配聚類簇確定為相應(yīng)平臺(tái)門店多維數(shù)據(jù)的跨平臺(tái)門店匹配結(jié)果。
3、第二方面,本申請(qǐng)實(shí)施例提供一種基于多維數(shù)據(jù)融合分析的跨平臺(tái)門店匹配系統(tǒng),包括:數(shù)據(jù)獲取單元,用于從多個(gè)數(shù)據(jù)平臺(tái)分別獲取平臺(tái)門店多維數(shù)據(jù),所述平臺(tái)門店多維數(shù)據(jù)包含平臺(tái)門店名稱、平臺(tái)門店地理位置和平臺(tái)門店活躍時(shí)間;特征提取單元,用于提取各個(gè)平臺(tái)門店多維數(shù)據(jù)所分別對(duì)應(yīng)的門店綜合特征;特征聚類單元,用于對(duì)各個(gè)所述門店綜合特征進(jìn)行加權(quán)聚類,以確定相應(yīng)的多個(gè)聚類簇;在加權(quán)聚類的過程中,根據(jù)每個(gè)門店綜合特征與各個(gè)聚類簇之間的歐式距離計(jì)算相應(yīng)的隸屬度;跨平臺(tái)匹配單元,用于針對(duì)各個(gè)所述門店綜合特征,根據(jù)對(duì)應(yīng)最大隸屬度的聚類簇確定所述門店綜合特征的匹配聚類簇,并將所述匹配聚類簇確定為相應(yīng)平臺(tái)門店多維數(shù)據(jù)的跨平臺(tái)門店匹配結(jié)果。
4、第三方面,提供一種電子設(shè)備,其包括:至少一個(gè)處理器,以及與所述至少一個(gè)處理器通信連接的存儲(chǔ)器,其中,所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行本申請(qǐng)任一實(shí)施例的基于多維數(shù)據(jù)融合分析的跨平臺(tái)門店匹配方法的步驟。
5、第四方面,本申請(qǐng)實(shí)施例提供一種存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)本申請(qǐng)任一實(shí)施例的基于多維數(shù)據(jù)融合分析的跨平臺(tái)門店匹配方法的步驟。
6、第五方面,本申請(qǐng)實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)本申請(qǐng)任一實(shí)施例的基于多維數(shù)據(jù)融合分析的跨平臺(tái)門店匹配方法的步驟。
7、通過本申請(qǐng)?zhí)峁┑囊环N基于多維數(shù)據(jù)融合分析的跨平臺(tái)門店匹配方法,能夠至少產(chǎn)生如下的技術(shù)效果:
8、(1)通過從多個(gè)平臺(tái)獲取的多維數(shù)據(jù),包括平臺(tái)門店名稱、地理位置和活躍時(shí)間等,構(gòu)建了更為完整的門店綜合特征,避免了單一維度數(shù)據(jù)可能帶來的誤差。例如,即便不同平臺(tái)上門店名稱存在較大差異(如“abc餐飲公司總店”和“abc主店”),也能夠通過地理位置、活躍時(shí)間等其他維度信息,識(shí)別出它們實(shí)際上對(duì)應(yīng)相同的門店。由此,通過多維數(shù)據(jù)的綜合分析,解決了因命名規(guī)則不一致帶來的匹配困難,有效提升了跨平臺(tái)門店匹配的準(zhǔn)確性。
9、(2)門店名稱在各個(gè)平臺(tái)上的記錄方式不統(tǒng)一是門店匹配的主要挑戰(zhàn)之一,利用加權(quán)聚類算法,通過歐式距離計(jì)算門店綜合特征與各個(gè)聚類簇之間的隸屬度,當(dāng)某個(gè)門店綜合特征與多個(gè)聚類簇存在一定的相似性時(shí),系統(tǒng)會(huì)根據(jù)隸屬度最大化原則進(jìn)行最終的匹配判斷,即使不同平臺(tái)使用不同命名規(guī)則,也能夠有效識(shí)別出名稱不同但本質(zhì)相同的門店,顯著降低誤匹配的風(fēng)險(xiǎn)。
10、(3)通過加權(quán)聚類的聚類方式,允許對(duì)不同維度數(shù)據(jù)根據(jù)實(shí)際情況進(jìn)行加權(quán)調(diào)整。比如,某些門店地理位置較為密集的區(qū)域,可以增加“門店名稱”和“活躍時(shí)間”的特征影響權(quán)重,減少地理位置的影響。而對(duì)于名稱差異較大的情況下,可以增強(qiáng)“地理位置”和“活躍時(shí)間”的特征影響權(quán)重。由此,通過靈活的權(quán)重調(diào)整機(jī)制,使得匹配算法具有動(dòng)態(tài)自適應(yīng)性,可以根據(jù)不同應(yīng)用場(chǎng)景下的特征差異做出智能調(diào)整,進(jìn)一步提升跨平臺(tái)門店匹配結(jié)果的精確度。
11、通過本技術(shù)方案,通過多維數(shù)據(jù)的聚合綜合分析,輸出最優(yōu)的匹配結(jié)果,能夠確保跨平臺(tái)匹配結(jié)果的一致性,減少跨平臺(tái)數(shù)據(jù)分析和處理中的冗余問題,有效優(yōu)化了o2o服務(wù)商后續(xù)的數(shù)據(jù)分析和服務(wù)流程。
1.一種基于多維數(shù)據(jù)融合分析的跨平臺(tái)門店匹配方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,通過以下方式來提取平臺(tái)門店多維數(shù)據(jù)所對(duì)應(yīng)的門店綜合特征:
3.根據(jù)權(quán)利要求1所述的方法,其中,所述對(duì)各個(gè)所述門店綜合特征進(jìn)行加權(quán)聚類,以確定相應(yīng)的多個(gè)聚類簇,包括:
4.根據(jù)權(quán)利要求3所述的方法,其中,模糊指數(shù)m通過以下方式而自適應(yīng)確定:
5.根據(jù)權(quán)利要求3所述的方法,其中,通過以下方式來確定匹配聚類簇:
6.根據(jù)權(quán)利要求5所述的方法,其中,在將所述匹配置信度與預(yù)設(shè)的置信度閾值τ進(jìn)行比較之后,所述方法還包括:
7.一種基于多維數(shù)據(jù)融合分析的跨平臺(tái)門店匹配系統(tǒng),包括: