用于獲取用戶屬性信息的方法、裝置及服務(wù)器的制造方法
【技術(shù)領(lǐng)域】
[0001]本申請涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及終端技術(shù)領(lǐng)域,尤其涉及用于獲取用戶屬性信息的方法、裝置及服務(wù)器。
【背景技術(shù)】
[0002]用戶畫像可以是用戶屬性信息的集合,可以用一個(gè)模型來描述用戶的特征?,F(xiàn)有技術(shù)中,用戶畫像構(gòu)建的主要方法是基于用戶的線上搜索行為分析用戶的屬性信息。在這種方法中,由于用戶的線上搜索行為中可能存在因惡意用戶偽造的搜索信息等虛擬的用戶搜索行為而造成的噪音,導(dǎo)致用戶畫像的構(gòu)建結(jié)果不準(zhǔn)確。此外,基于用戶的線上搜索行為的畫像構(gòu)建還可能存在文本語義分歧的問題,同一搜索詞可能指向不同的用戶特征,例如用戶搜索“廬山”,可能是關(guān)注旅游信息,也可能是喜歡與廬山相關(guān)的電影。
[0003]另外,現(xiàn)有技術(shù)中還有基于用戶實(shí)際交易數(shù)據(jù)的用戶畫像構(gòu)建方法,基于用戶的線上交易數(shù)據(jù)進(jìn)行構(gòu)建。用戶的線上交易在用戶的行為中為低頻行為,因此無法據(jù)其得出全面、完整、準(zhǔn)確的用戶屬性信息。
【發(fā)明內(nèi)容】
[0004]鑒于上述現(xiàn)有技術(shù)中的缺陷或不足,期望能夠提供一種全面、準(zhǔn)確的用戶屬性信息的獲取方法。本申請?zhí)峁┝擞糜讷@取用戶屬性信息的方法、裝置及服務(wù)器。
[0005]第一方面,本申請?zhí)峁┝艘环N用于獲取用戶屬性信息的方法,包括:獲取地圖日志信息、定位日志信息和搜索引擎的日志信息;對地圖日志信息、定位日志信息和搜索引擎的日志信息進(jìn)行預(yù)處理,以獲取用戶的相關(guān)數(shù)據(jù);基于用戶的相關(guān)數(shù)據(jù)獲取用戶的行為特征;以及基于用戶的行為特征確定用戶屬性信息。
[0006]在某些實(shí)現(xiàn)方式中,對地圖日志信息、定位日志信息和搜索引擎的日志信息進(jìn)行預(yù)處理,包括:對地圖日志信息、定位日志信息和搜索引擎的日志信息所包含的數(shù)據(jù)進(jìn)行分析;提取地圖日志信息、定位日志信息和搜索引擎的日志信息中與地理位置和用戶行為相關(guān)的數(shù)據(jù),作為用戶的相關(guān)數(shù)據(jù)。
[0007]在進(jìn)一步的實(shí)現(xiàn)方式中,對地圖日志信息、定位日志信息和搜索引擎的日志信息進(jìn)行預(yù)處理,還包括:通過網(wǎng)絡(luò)查找出與地圖日志信息、定位日志信息和搜索引擎的日志信息包含的數(shù)據(jù)相關(guān)的信息作為用戶的相關(guān)數(shù)據(jù)。
[0008]在某些實(shí)現(xiàn)方式中,用戶的相關(guān)數(shù)據(jù)至少包括位置檢索數(shù)據(jù)和/或定位數(shù)據(jù)。其中,位置檢索數(shù)據(jù)包括以下至少一項(xiàng):目標(biāo)位置搜索數(shù)據(jù)、路線搜索數(shù)據(jù)和對應(yīng)的線路信息;以及目標(biāo)位置的周邊數(shù)據(jù)。
[0009]在進(jìn)一步的實(shí)現(xiàn)方式中,目標(biāo)位置搜索數(shù)據(jù)包括以下至少一項(xiàng):搜索的目的地、搜索的時(shí)刻、用戶當(dāng)前地理位置;路線搜索數(shù)據(jù)包括以下至少一項(xiàng):用戶檢索路線的時(shí)刻、起始地理位置、目標(biāo)地理位置、軌跡數(shù)據(jù)以及對應(yīng)的出行方式;目標(biāo)位置的周邊數(shù)據(jù)包括以下至少一項(xiàng):目標(biāo)位置周邊的建筑物數(shù)據(jù)、交通站點(diǎn)數(shù)據(jù)、停車場數(shù)據(jù)。
[0010]在某些實(shí)現(xiàn)方式中,基于用戶的相關(guān)數(shù)據(jù)獲取用戶的行為特征,包括以下至少一項(xiàng):基于定位數(shù)據(jù)對用戶停留的地理位置的分布進(jìn)行統(tǒng)計(jì)和分析,以確定用戶固定活動(dòng)的地點(diǎn);基于位置檢索數(shù)據(jù)獲取用戶的興趣點(diǎn)信息;基于位置檢索數(shù)據(jù)對用戶的出行方式進(jìn)行統(tǒng)計(jì)和分析,以確定用戶偏好的出行方式;基于定位數(shù)據(jù)計(jì)算用戶之間的相關(guān)度,以確定多個(gè)用戶的親密程度。
[0011 ] 在某些實(shí)現(xiàn)方式中,基于用戶的行為特征確定用戶屬性信息,包括:基于用戶的行為特征,采用已訓(xùn)練的模型確定用戶屬性信息。
[0012]在某些實(shí)現(xiàn)方式中,用戶屬性信息包括以下至少一項(xiàng):用戶的年齡段、性別、職業(yè)、興趣、收入水平、消費(fèi)習(xí)慣、健康狀況、社會(huì)關(guān)系以及固定資產(chǎn)狀況。
[0013]第二方面,本申請?zhí)峁┝艘环N用于獲取用戶屬性信息的裝置,包括:第一獲取單元,用于獲取地圖日志信息、定位日志信息和搜索引擎的日志信息;預(yù)處理單元,用于對地圖日志信息、定位日志信息和搜索引擎的日志信息進(jìn)行預(yù)處理,以獲取用戶的相關(guān)數(shù)據(jù);第二獲取單元,用于基于用戶的相關(guān)數(shù)據(jù)獲取用戶的行為特征;以及確定單元,用于基于用戶的行為特征確定用戶屬性信息。
[0014]在某些實(shí)現(xiàn)方式中,預(yù)處理單元用于按如下方式對地圖日志信息、定位日志信息和搜索引擎的日志信息進(jìn)行預(yù)處理:對地圖日志信息、定位日志信息和搜索引擎的日志信息所包含的數(shù)據(jù)進(jìn)行分析;提取地圖日志信息、定位日志信息和搜索引擎的日志信息中與地理位置和用戶行為相關(guān)的數(shù)據(jù),作為用戶的相關(guān)數(shù)據(jù)。
[0015]在進(jìn)一步的實(shí)現(xiàn)方式中,預(yù)處理單元還用于按如下方式對地圖日志信息、定位日志信息和搜索引擎的日志信息進(jìn)行預(yù)處理:通過網(wǎng)絡(luò)查找出與地圖日志信息、定位日志信息和搜索引擎的日志信息包含的數(shù)據(jù)相關(guān)的信息作為用戶的相關(guān)數(shù)據(jù)。
[0016]在某些實(shí)現(xiàn)方式中,用戶的相關(guān)數(shù)據(jù)至少包括位置檢索數(shù)據(jù)和/或定位數(shù)據(jù)。其中,位置檢索數(shù)據(jù)包括以下至少一項(xiàng):目標(biāo)位置搜索數(shù)據(jù)、路線搜索數(shù)據(jù)和對應(yīng)的線路信息;以及目標(biāo)位置的周邊數(shù)據(jù)。
[0017]在進(jìn)一步的實(shí)現(xiàn)方式中,目標(biāo)位置搜索數(shù)據(jù)包括以下至少一項(xiàng):搜索的目的地、搜索的時(shí)刻、用戶當(dāng)前地理位置;路線搜索數(shù)據(jù)包括以下至少一項(xiàng):用戶檢索路線的時(shí)刻、起始地理位置、目標(biāo)地理位置、軌跡數(shù)據(jù)以及對應(yīng)的出行方式;目標(biāo)位置的周邊數(shù)據(jù)包括以下至少一項(xiàng):目標(biāo)位置周邊的建筑物數(shù)據(jù)、交通站點(diǎn)數(shù)據(jù)、停車場數(shù)據(jù)。
[0018]在進(jìn)一步的實(shí)現(xiàn)方式中,第二獲取單元用于按如下至少一種方式獲取用戶的行為特征:基于定位數(shù)據(jù)對用戶停留的地理位置的分布進(jìn)行統(tǒng)計(jì)和分析,以確定用戶固定活動(dòng)的地點(diǎn);基于位置檢索數(shù)據(jù)獲取用戶的興趣點(diǎn)信息;基于位置檢索數(shù)據(jù)對用戶的出行方式進(jìn)行統(tǒng)計(jì)和分析,以確定用戶偏好的出行方式;基于定位數(shù)據(jù)計(jì)算用戶之間的相關(guān)度,以確定多個(gè)用戶的親密程度。
[0019]在某些實(shí)現(xiàn)方式中,確定單元基于用戶的行為特征,采用已訓(xùn)練的模型確定用戶屬性信息。
[0020]在某些實(shí)現(xiàn)方式中,用戶屬性信息包括以下至少一項(xiàng):用戶的年齡段、性別、職業(yè)、興趣、收入水平、消費(fèi)習(xí)慣、健康狀況、社會(huì)關(guān)系以及固定資產(chǎn)狀況。
[0021]第三方面,本申請?zhí)峁┝艘环N服務(wù)器,包括本申請第二方面所提供的用于獲取用戶屬性信息的裝置。
[0022]本申請?zhí)峁┑挠糜讷@取用戶屬性信息的方法、裝置及服務(wù)器,通過獲取地圖日志信息、定位日志信息和搜索引擎的日志信息,隨后對地圖日志信息、定位日志信息和搜索引擎的日志信息進(jìn)行預(yù)處理,以獲取用戶的相關(guān)數(shù)據(jù),之后基于用戶的相關(guān)數(shù)據(jù)獲取用戶的行為特征,最后基于用戶的行為特征確定用戶屬性信息,充分利用了用戶的定位、地圖搜索等信息分析用戶屬性信息,提升了所獲取的用戶屬性信息的全面性和準(zhǔn)確性。
【附圖說明】
[0023]通過閱讀參照以下附圖所作的對非限制性實(shí)施例詳細(xì)描述,本申請的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0024]圖1是本申請實(shí)施例提供的用于獲取用戶屬性信息的方法的一個(gè)實(shí)施例的流程圖;
[0025]圖2是本申請實(shí)施例提供的對地圖日志信息、定位日志信息和搜索引擎的日志信息進(jìn)行預(yù)處理的方法的一個(gè)實(shí)施例的流程圖;
[0026]圖3是本申請實(shí)施例提供的用于獲取用戶屬性信息的裝置的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;
[0027]圖4是可以應(yīng)用本申請實(shí)施例的示例性系統(tǒng)架構(gòu)示意圖;
[0028]圖5是適于用來實(shí)現(xiàn)本申請實(shí)施例的服務(wù)器的計(jì)算機(jī)系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0029]下面結(jié)合附圖和實(shí)施例對本申請作進(jìn)一步的詳細(xì)說明??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅僅用于解釋相關(guān)發(fā)明,而非對該發(fā)明的限定。另外,為了便于描述,附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。
[0030]需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本申請。
[0031]本申請所涉及終端可以包括但不限于智能手機(jī)、平板電腦、個(gè)人數(shù)字助理、智能穿戴設(shè)備及膝上型便攜計(jì)算機(jī)等等。出于示例描述目的以及為了簡潔起見,在接下來的討論中,結(jié)合安裝有電子地圖、瀏覽器、具有定位功能的終端來描述本申請的示例性實(shí)施例。
[0032]請參考圖1,其示出了根據(jù)本申請的用于獲取用戶屬性信息方法的一個(gè)實(shí)施例的流程。該方法可以由服務(wù)器來執(zhí)行。
[0033]如圖1所示,在步驟101中,獲取地圖日志信息、定位日志信息和搜索引擎的日志信息。
[0034]一般來說,當(dāng)用戶通過地圖查詢目標(biāo)地址、路線信息時(shí),終端可以與地圖服務(wù)器建立通信連接,以獲取用戶所查詢的地圖數(shù)據(jù);用戶在通過終端的瀏覽器訪問網(wǎng)頁或進(jìn)行檢索時(shí),終端可以與網(wǎng)頁服務(wù)器建立通信連接,以獲取用戶所要訪問的網(wǎng)頁信息;用戶打開終端的定位功能時(shí),終端可以與定位服務(wù)器建立通信連接,以獲取當(dāng)前的定位數(shù)據(jù)。終端在向用戶反饋查詢結(jié)果、訪問結(jié)果和定位結(jié)果的同時(shí),可以將查詢、訪問和定位相關(guān)的信息保存至終端的存儲(chǔ)器中,也可以將查詢、訪問和定位相關(guān)的信息上傳至對應(yīng)的服務(wù)器,生成日志信息并保存。具體地,用戶通過地圖查詢的相關(guān)信息(例如查詢時(shí)間、查詢內(nèi)容)可以保存為地圖日志信息;終端通過GPS等方式定位的相關(guān)信息(例如終端的三維地理位置數(shù)據(jù)以及定位時(shí)間)可以保存為定位日志信息;用戶通過瀏覽器上的搜索引擎進(jìn)行檢索的相關(guān)信息(例如檢索內(nèi)容、檢索的時(shí)間)可以保存為搜索引擎的日志信息。
[0035]在本實(shí)施例中,如果上述日志信息保存在終端的存儲(chǔ)器中,則服務(wù)器可以通過網(wǎng)絡(luò)從終端獲取地圖日志信息、定位日志信息和搜索引擎的日志信息。如果上述日志信息保存在對應(yīng)的服務(wù)器中,則服務(wù)器可以分別從地圖服務(wù)器獲取地圖日志信息