欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于大數(shù)據(jù)倉儲、挖掘技術(shù)的地址數(shù)據(jù)匹配挖掘平臺的制作方法

文檔序號:6518955閱讀:474來源:國知局
一種基于大數(shù)據(jù)倉儲、挖掘技術(shù)的地址數(shù)據(jù)匹配挖掘平臺的制作方法
【專利摘要】一種基于大數(shù)據(jù)倉儲、挖掘技術(shù)的地址數(shù)據(jù)匹配挖掘平臺,包括如下步驟:(1)基礎(chǔ)準(zhǔn)備工作:建立分詞庫與片段庫;建立匹配憑據(jù)庫;同時建立高效索引引擎;(2)作業(yè)準(zhǔn)備:自動完成待匹配門址數(shù)據(jù)的接納、管理、檢核等工作;(3)匹配作業(yè):基于非結(jié)構(gòu)化數(shù)據(jù)的中文語義解讀技術(shù)、數(shù)據(jù)倉儲挖掘和地址匹配技術(shù),對數(shù)據(jù)準(zhǔn)備階段做好的任務(wù)包進(jìn)行加工處理;(4)審核校驗:完成待審任務(wù)包的領(lǐng)取、檢查校核、批誤、確錯等作業(yè),在完成校核工作后提交作業(yè)經(jīng)理進(jìn)行審核入庫或者提交作業(yè)人員消除錯誤;(5)終校入庫:將完成的作業(yè)按照內(nèi)容不同分別進(jìn)行入庫處理。該專利具有自動化程度高,操作簡單易學(xué)等優(yōu)點。
【專利說明】一種基于大數(shù)據(jù)倉儲、挖掘技術(shù)的地址數(shù)據(jù)匹配挖掘平臺
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種地址數(shù)據(jù)匹配挖掘平臺,尤其是一種基于大數(shù)據(jù)倉儲、挖掘技術(shù)的地址數(shù)據(jù)匹配挖掘平臺。
【背景技術(shù)】
[0002]地址匹配指建立地理位置坐標(biāo)與給定地址一致性的過程。也是指在地圖上找到并標(biāo)明每條地址所對應(yīng)的位置。地址匹配要求能夠?qū)⑷魏螖?shù)據(jù)移植到空間坐標(biāo)系中,這個過程包括對數(shù)據(jù)的準(zhǔn)確分類和注冊,以及使所有的數(shù)據(jù)能夠與一個空間坐標(biāo)系建立關(guān)聯(lián)。
[0003]這些工作如以人工的方式在地圖數(shù)據(jù)中加以標(biāo)示的話,將會需要相當(dāng)?shù)娜肆ξ锪Γ掖嬖谳^大的主觀因素,不易檢查其正確性。如果這些地址資料通過地址匹配功能,和GIS聯(lián)系則可以很快在地圖上標(biāo)示要素在空間的分布情況,以及周圍的公共設(shè)施等。因此,地理匹配在城市空間定位和分析領(lǐng)域內(nèi)具有非常廣泛的應(yīng)用。
[0004]中國現(xiàn)有的地名、地址體系異常復(fù)雜,地名相對混亂、無序,規(guī)律性低和缺乏統(tǒng)一的標(biāo)準(zhǔn)。市場上同類產(chǎn)品通常依據(jù)地址字符串智能地匹配出地理坐標(biāo)值。但是地址編碼管理器采用的地址模型太過復(fù)雜,加上軟件功能開發(fā)太過簡單,在具體應(yīng)用中地址匹配率很低,匹配準(zhǔn)確性差,通常不超過10%,仍需通過大量的人工現(xiàn)場采集來提高匹配的準(zhǔn)確率。

【發(fā)明內(nèi)容】

[0005]為解決上述問題,本發(fā)明提供了一種自動化程度高,操作簡單易學(xué)基于大數(shù)據(jù)倉儲、挖掘技術(shù)的地址數(shù)據(jù)匹配挖掘平臺。
[0006]實現(xiàn)本發(fā)明目的的一種自動化程度高的基于大數(shù)據(jù)倉儲、挖掘技術(shù)的地址數(shù)據(jù)匹配挖掘平臺,包括如下步驟:
[0007](1)基礎(chǔ)準(zhǔn)備工作:建立基于地址門址的、具有空間屬性的分詞庫與片段庫;建立基于海量非結(jié)構(gòu)化數(shù)據(jù)的多層級的匹配憑據(jù)庫;同時建立基于地理空間信息平臺的高效索引引擎;
[0008](2)作業(yè)準(zhǔn)備:自動完成待匹配門址數(shù)據(jù)的接納、管理、檢核等工作,并根據(jù)工程進(jìn)度需要提交作業(yè)計劃書,將項目任務(wù)分解成為滿覆蓋的作業(yè)包;分配好的作業(yè)包,將作為匹配作業(yè)階段的最小工作單元而進(jìn)行下一步的工作。
[0009](3)匹配作業(yè):基于非結(jié)構(gòu)化數(shù)據(jù)的中文語義解讀技術(shù)、數(shù)據(jù)倉儲挖掘和地址匹配技術(shù),對數(shù)據(jù)準(zhǔn)備階段做好的任務(wù)包進(jìn)行加工處理,實現(xiàn)文本地址到地理位置的轉(zhuǎn)變;該階段包括上圖作業(yè)、人工查誤、糾誤等一系列作業(yè)流程,以先進(jìn)的技術(shù)和嚴(yán)格的管理保證了地址匹配的準(zhǔn)確性,在完成作業(yè)內(nèi)容后,匹配結(jié)果還將提交檢校人員進(jìn)行審核。
[0010](4)審核校驗:完成待審任務(wù)包的領(lǐng)取、檢查校核、批誤、確錯等作業(yè),在完成校核工作后提交作業(yè)經(jīng)理進(jìn)行審核入庫或者提交作業(yè)人員消除錯誤。
[0011](5)終校入庫:將完成的作業(yè)按照內(nèi)容不同分別進(jìn)行入庫處理,已經(jīng)確認(rèn)無誤的數(shù)據(jù),在入庫的同時還將進(jìn)行反編碼,實現(xiàn)本文數(shù)據(jù)倉庫與地理數(shù)據(jù)的一一對應(yīng),一方面可以把歷史匹配結(jié)果投放進(jìn)入匹配憑據(jù)庫,作為新門址的匹配依據(jù),同時還可以為應(yīng)用系統(tǒng)的各種查詢定位操作做好準(zhǔn)備。
[0012]本產(chǎn)品采用基于大數(shù)據(jù)倉儲、挖掘的地址匹配技術(shù)來進(jìn)行地址的檢索、定位。核心技術(shù)包含了元數(shù)據(jù)倉儲、非結(jié)構(gòu)化數(shù)據(jù)全文檢索引擎、要素層級匹配法、正則表達(dá)式法以及基于自然語言理解的中文地址匹配法,來建立空間關(guān)系地址模型、地址庫邏輯模型,實現(xiàn)了地址信息的空間知識表達(dá)。
[0013]本產(chǎn)品的發(fā)明可以大大提高自動匹配的效率,減少以往人工采集地理位置的工作,節(jié)約大量人力物力。
【專利附圖】

【附圖說明】
[0014]圖1為本發(fā)明的總體流程圖【具體實施方式】
[0015]如圖1所示,本發(fā)明的一種基于大數(shù)據(jù)倉儲、挖掘技術(shù)的地址數(shù)據(jù)匹配挖掘平臺,包括如下步驟:
[0016](1)基礎(chǔ)準(zhǔn)備工作:建立基于地址門址的、具有空間屬性的分詞庫與片段庫;建立基于海量非結(jié)構(gòu)化數(shù)據(jù)的多層級的匹配憑據(jù)庫;同時建立基于地理空間信息平臺的高效索引引擎;
[0017](2)作業(yè)準(zhǔn)備:自動完成待匹配門址數(shù)據(jù)的接納、管理、檢核等工作,并根據(jù)工程進(jìn)度需要提交作業(yè)計劃書,將項目任務(wù)分解成為滿覆蓋的作業(yè)包;分配好的作業(yè)包,將作為匹配作業(yè)階段的最小工作單元而進(jìn)行下一步的工作。
[0018](3)匹配作業(yè):基于非結(jié)構(gòu)化數(shù)據(jù)的中文語義解讀技術(shù)、數(shù)據(jù)倉儲挖掘和地址匹配技術(shù),對數(shù)據(jù)準(zhǔn)備階段做好的任務(wù)包進(jìn)行加工處理,實現(xiàn)文本地址到地理位置的轉(zhuǎn)變;該階段包括上圖作業(yè)、人工查誤、糾誤等一系列作業(yè)流程,以先進(jìn)的技術(shù)和嚴(yán)格的管理保證了地址匹配的準(zhǔn)確性,在完成作業(yè)內(nèi)容后,匹配結(jié)果還將提交檢校人員進(jìn)行審核。
[0019](4)審核校驗:完成待審任務(wù)包的領(lǐng)取、檢查校核、批誤、確錯等作業(yè),在完成校核工作后提交作業(yè)經(jīng)理進(jìn)行審核入庫或者提交作業(yè)人員消除錯誤。
[0020](5)終校入庫:將完成的作業(yè)按照內(nèi)容不同分別進(jìn)行入庫處理,已經(jīng)確認(rèn)無誤的數(shù)據(jù),在入庫的同時還將進(jìn)行反編碼,實現(xiàn)本文數(shù)據(jù)倉庫與地理數(shù)據(jù)的一一對應(yīng),一方面可以把歷史匹配結(jié)果投放進(jìn)入匹配憑據(jù)庫,作為新門址的匹配依據(jù),同時還可以為應(yīng)用系統(tǒng)的各種查詢定位操作做好準(zhǔn)備。
[0021]上面所述的實施例僅僅是對本發(fā)明的優(yōu)選實施方式進(jìn)行描述,并非對本發(fā)明的范圍進(jìn)行限定,在不脫離本發(fā)明設(shè)計精神前提下,本領(lǐng)域普通工程技術(shù)人員對本發(fā)明技術(shù)方案做出的各種變形和改進(jìn),均應(yīng)落入本發(fā)明的權(quán)利要求書確定的保護(hù)范圍內(nèi)。
【權(quán)利要求】
1.一種基于大數(shù)據(jù)倉儲、挖掘技術(shù)的地址數(shù)據(jù)匹配挖掘平臺,其特征在于:包括如下步驟:(1)基礎(chǔ)準(zhǔn)備工作:建立基于地址門址的、具有空間屬性的分詞庫與片段庫;建立基于海量非結(jié)構(gòu)化數(shù)據(jù)的多層級的匹配憑據(jù)庫;同時建立基于地理空間信息平臺的高效索引引擎;(2)作業(yè)準(zhǔn)備:自動完成待匹配門址的接納、管理、檢核等工作,并根據(jù)工程進(jìn)度需要提交作業(yè)計劃書,將項目任務(wù)分解成為滿覆蓋的作業(yè)包;分配好的作業(yè)包,將作為匹配作業(yè)階段的最小工作單元而進(jìn)行下一步的工作;(3)匹配作業(yè):基于非結(jié)構(gòu)化數(shù)據(jù)的中文語義解讀技術(shù)、數(shù)據(jù)倉儲挖掘和地址匹配技術(shù),對數(shù)據(jù)準(zhǔn)備階段做好的任務(wù)包進(jìn)行加工處理,實現(xiàn)文本地址到地理位置信息的轉(zhuǎn)變;該階段包括上圖作業(yè)、人工查誤、糾誤等一系列作業(yè)流程,以先進(jìn)的技術(shù)和嚴(yán)格的管理保證了地址匹配的準(zhǔn)確性,在完成作業(yè)內(nèi)容后,匹配結(jié)果還將提交檢校人員進(jìn)行審核;(4)審核校驗:完成待審任務(wù)包的領(lǐng)取、檢查校核、批誤、確錯等作業(yè),在完成校核工作后提交作業(yè)經(jīng)理進(jìn)行審核入庫或者提交作業(yè)人員消除錯誤;(5)終校入庫:將完成的作業(yè)按照內(nèi)容不同分別進(jìn)行入庫處理,已經(jīng)確認(rèn)無誤的數(shù)據(jù),在入庫的同時還將進(jìn)行反編碼,實現(xiàn)本文數(shù)據(jù)倉庫與地理數(shù)據(jù)的一一對應(yīng),另一方面可以把歷史匹配結(jié)果投放進(jìn)入匹配憑據(jù)庫,作為新門址的匹配依據(jù),同時還可以為應(yīng)用系統(tǒng)的各種查詢定位操作做好準(zhǔn)備。
【文檔編號】G06F17/30GK103744854SQ201310567022
【公開日】2014年4月23日 申請日期:2013年11月15日 優(yōu)先權(quán)日:2013年11月15日
【發(fā)明者】張鵬, 曾汀, 朱軍 申請人:北京正圖數(shù)創(chuàng)信息技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
遵义市| 保靖县| 东光县| 婺源县| 陵川县| 隆子县| 诏安县| 措勤县| 江华| 罗城| 寿光市| 祁门县| 丰城市| 武义县| 镇原县| 临清市| 平利县| 喀喇| 资溪县| 黄陵县| 额济纳旗| 分宜县| 高安市| 兴城市| 凌源市| 象州县| 淅川县| 呼伦贝尔市| 永仁县| 嵊泗县| 永昌县| 翁牛特旗| 铁岭市| 台江县| 阳泉市| 绥化市| 闽侯县| 健康| 三门峡市| 青阳县| 汉阴县|