一種定位方法與系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種定位方法與系統(tǒng),遍歷全地址,解析獲得多個字符,將相同類型字符組合為相同塊,再采用正向最大分詞算法對塊進行逐塊分詞,之后根據(jù)行政區(qū)域行政區(qū)域?qū)Ψ衷~進行分組,計算分組積分,選取積分最大的分組,解析該分組,獲取地址實現(xiàn)定位。整個過程處理嚴(yán)謹(jǐn)、由字符、塊、分詞以及分組實現(xiàn)定位,并且采用正向最大分詞算法、考慮不同行政區(qū)域的權(quán)重系數(shù)真實準(zhǔn)確獲取地址,不需要用戶的參與,其定位準(zhǔn)確度高、定位成功率高。
【專利說明】一種定位方法與系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及位置服務(wù)【技術(shù)領(lǐng)域】,特別是涉及一種定位方法與系統(tǒng)。
【背景技術(shù)】
[0002]目前市場中普遍的分詞算法是基于地址位置服務(wù)的應(yīng)用,主要的實現(xiàn)是通過關(guān)鍵詞與字典的模糊匹配進行分詞,將所有的分詞結(jié)果反饋到前端由用戶判斷,上述方法需要前端用戶的參與或者僅能應(yīng)用于對定位精度要求不高的場景。
[0003]隨著人們對定位服務(wù)的需求以及要求不斷提高,對定位精度的要求以及定位成功率的要求也在不斷提高,上述方法僅能實現(xiàn)簡單定位,且還需要前端用戶的參與,顯然無法滿足人們需求,無法推廣應(yīng)用到各個定位場景服務(wù)中。
【發(fā)明內(nèi)容】
[0004]基于此,有必要針對現(xiàn)有分詞定位方法定位精度低且需要前端用戶參與的問題,提供一種定位精度高、定位成功率高的一種定位方法與系統(tǒng)。
[0005]一種定位方法,包括步驟:
[0006]解析輸入全地址,獲得多個字符;
[0007]識別所述多個字符的類型,將相同類型的字符合并為相同塊,其中,所述字符類型包括中文字符、英文字符、數(shù)字字符和特殊字符;
[0008]采用正向最大分詞算法對每個塊進行逐塊分詞;
[0009]根據(jù)行政區(qū)域?qū)Ψ衷~進行分組,并根據(jù)行政區(qū)域預(yù)設(shè)權(quán)重系數(shù)計算各分組的積分;
[0010]選取積分最大的分組;
[0011]解析所述積分最大的分組,獲得定位地址。
[0012]一種定位系統(tǒng),包括:
[0013]字符獲取模塊,用于解析輸入全地址,獲得多個字符;
[0014]合并模塊,用于識別所述多個字符的類型,并將相同類型的字符合并為相同塊,其中,所述字符類型包括中文字符、英文字符、數(shù)字字符和特殊字符;
[0015]分詞模塊,用于采用正向最大分詞算法對每個塊進行逐塊分詞;
[0016]積分計算模塊,用于根據(jù)行政區(qū)域?qū)Ψ衷~進行分組,并根據(jù)行政區(qū)域預(yù)設(shè)權(quán)重系數(shù)計算各分組的積分;
[0017]分組選取模塊,用于選取積分最大的分組;
[0018]定位模塊,用于解析所述積分最大的分組,獲得定位地址。
[0019]本發(fā)明一種定位方法與系統(tǒng),遍歷全地址,解析獲得多個字符,將相同類型字符組合為相同塊,再采用正向最大分詞算法對塊進行逐塊分詞,之后根據(jù)行政區(qū)域行政區(qū)域?qū)Ψ衷~進行分組,計算分組積分,選取積分最大的分組,解析該分組,獲取地址實現(xiàn)定位。整個過程處理嚴(yán)謹(jǐn)、由字符、塊、分詞以及分組實現(xiàn)定位,并且采用正向最大分詞算法、考慮不同行政區(qū)域的權(quán)重系數(shù)真實準(zhǔn)確獲取地址,不需要用戶的參與,其定位準(zhǔn)確度高、定位成功率聞。
【專利附圖】
【附圖說明】
[0020]圖1為本發(fā)明一種定位方法第一個實施例的流程示意圖;
[0021]圖2為本發(fā)明一種定位方法第二個實施例的流程示意圖;
[0022]圖3為本發(fā)明一種定位系統(tǒng)第一個實施例的結(jié)構(gòu)示意圖;
[0023]圖4為本發(fā)明一種定位系統(tǒng)第二個實施例的結(jié)構(gòu)示意圖。
【具體實施方式】
[0024]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下根據(jù)附圖及實施例,對本發(fā)明進行進一步詳細說明。應(yīng)當(dāng)理解,此處所描述的具體實施僅僅用以解釋本發(fā)明,并不限定本發(fā)明。
[0025]如圖1所示,一種定位方法,包括步驟:
[0026]SlOO:解析輸入全地址,獲得多個字符。
[0027]解析輸入的全地址獲得多個字符,全地址的組成可以包括漢字、英文、數(shù)字以及特出符號,具體包括哪些種類需要根據(jù)實際情況而定,解析后獲得的字符類型也可以包括多種種類。
[0028]S200:識別所述多個字符的類型,并將相同類型的字符合并為相同塊,其中,所述字符類型包括中文字符、英文字符、數(shù)字字符和特殊字符。
[0029]解析后獲得字符類型有多種,具體來說,字符類型包括中文字符、英文字符、數(shù)字字符和特殊字符等,在這里需要識別每個字符的類型,以便在后續(xù)步驟中進行區(qū)分。逐步將相同類型的字符合并為相同的一個塊,以便在后續(xù)步驟中進一步處理。
[0030]S300:采用正向最大分詞算法對每個塊進行逐塊分詞。
[0031]最大正向分詞算法是一種成熟的基于中文分詞解析算法,具體來說,每次取最長設(shè)定的字符串,從字典查找,如果沒有,從右邊減少一個字符匹配,直至完全匹配字典。字典可以理解為一個數(shù)據(jù)庫。
[0032]S400:根據(jù)行政區(qū)域?qū)Ψ衷~進行分組,并根據(jù)行政區(qū)域預(yù)設(shè)權(quán)重系數(shù)計算各分組的積分。
[0033]行政區(qū)域有不同的等級,例如就我國而言行政區(qū)域為省份(直轄市)、二級行政區(qū)域為市、三級行政區(qū)域為縣(區(qū))等依次類推,在這里首先根據(jù)行政區(qū)域?qū)Ψ衷~進行分組,之后再根據(jù)行政區(qū)域預(yù)設(shè)權(quán)重系數(shù)計算各分組的積分,考慮行政區(qū)域的權(quán)重,真實準(zhǔn)確評判各分組的積分。行政區(qū)域預(yù)設(shè)權(quán)重系數(shù)是預(yù)先設(shè)定可以根據(jù)實際應(yīng)用環(huán)境的需求進行設(shè)定或者修改。
[0034]S500:選取積分最大的分組。
[0035]每個分組都計算有對應(yīng)的積分,選取所有分組中積分最大的分組。
[0036]S600:解析所述積分最大的分組,獲得定位地址。
[0037]解析積分最大的分組,獲得該分組所指代的地址,實現(xiàn)精準(zhǔn)定位。
[0038]本發(fā)明一種定位方法,遍歷全地址,解析獲得多個字符,將相同類型字符組合為相同塊,再采用正向最大分詞算法對塊進行逐塊分詞,之后根據(jù)行政區(qū)域行政區(qū)域?qū)Ψ衷~進行分組,計算分組積分,選取積分最大的分組,解析該分組,獲取地址實現(xiàn)定位。整個過程處理嚴(yán)謹(jǐn)、由字符、塊、分詞以及分組實現(xiàn)定位,并且采用正向最大分詞算法、考慮不同行政區(qū)域的權(quán)重系數(shù)真實準(zhǔn)確獲取地址,不需要用戶的參與,其定位準(zhǔn)確度高、定位成功率高。
[0039]如圖2所示,在其中一個實施例中,所述S400具體包括:
[0040]S420:根據(jù)行政區(qū)域?qū)Ψ衷~進行分組;
[0041]S440:識別每個分組中行政區(qū)域等級種類;
[0042]S460:根據(jù)分組中行政區(qū)域等級種類以及行政區(qū)域預(yù)設(shè)權(quán)重系數(shù)計算各分組的積分。
[0043]由于行政區(qū)域等級有多種,在本實施例中,對分組中行政區(qū)域等級種類進一步細化,綜合考慮分組中行政區(qū)域等級種類以及行政區(qū)域預(yù)設(shè)權(quán)重系數(shù),進一步提高了定位精度。例如,首先根據(jù)省份對分詞進行分組,之后識別每個分組行政區(qū)域等級種類(市、縣、鎮(zhèn)等)最后根據(jù)省市縣鎮(zhèn)和各個行政區(qū)域預(yù)設(shè)權(quán)重系數(shù)計算各分組的積分。
[0044]如圖2所示,在其中一個實施例中,所述S600具體包括步驟:
[0045]S620:按區(qū)域和城市細化所述積分最大的分組, [0046]S640:解析細化后的積分最大的分組,獲得唯--組地址。
[0047]在本實施例中,按區(qū)域和城市進一步細化積分最大的分組,再解析細化后的最大分組獲得唯一一組地址。進一步細化分組能夠進一步提高定位的準(zhǔn)確度。
[0048]在其中一個是私立中,所述選取積分最大的分組具體為:
[0049]獲取積分大于或等于預(yù)設(shè)積分閾值且積分最大的分組。
[0050]在本實施例中,只有積分大于或等于預(yù)設(shè)積分閾值的分組才為有效分組,才能參與選取積分最大分組。剔除了異常分組,提高了定位準(zhǔn)確性和定位成功率。
[0051]為了更進一步詳細解釋本發(fā)明一種定位方法的技術(shù)方案及其帶來的效果,下面將采用實例進行說明。
[0052]將以“廣東廣州荔灣花海街20號”為例
[0053]1、遍歷地址,解析結(jié)果[廣,1],[東,1],[,1]...[2,3],[0,3],[號,I]
[0054]2、遍歷解析結(jié)果分塊,分塊結(jié)果[廣東廣州荔灣花海街,I],[20,3],[號,I]
[0055]3、步驟2拆分了 3個詞塊,設(shè)定bl =廣東廣州荔灣花海街,b2 = 20,b3 =號,取bl[l]字符(廣),取bl[2]字符(東),判斷地址字典是否存在廣,東開頭的地址數(shù)據(jù)。
[0056]4、如果不存在分塊索引位+1 (從東開始解析)。
[0057]5、如果存在取bl[3]_bl[7]字符(廣州荔灣花),從地址字典查找廣東開頭的所有地址,是否有“廣州荔灣花”。
[0058]6、如果地址字典無“廣州荔灣花”,查詢位減1,取bl[3]_bl[6]字符(廣州荔灣),
重復(fù)5步驟。
[0059]7、如果地址字典有“廣州荔灣”,則地址匹配成功,解析地址為“廣東廣州荔灣”,索引位+地址匹配(廣州荔灣)長度,即從bl[7]開始重復(fù)執(zhí)行3。(4、5、6、7為正向最大分詞算法對每個塊進行逐塊分詞的步驟詳解)
[0060]8、分詞解析完成后,結(jié)果為:[廣東][廣州][荔灣][花海街][20][號]。
[0061]9、假設(shè)對應(yīng)編碼分別為[101101],[101101001], [101101001001],[101101202001],[102102001001],編碼設(shè)定自由規(guī)則,每個層級都有一定關(guān)聯(lián)關(guān)系,方便
只通過編碼進行地址編碼分組及層級關(guān)系。
[0062]10、針對地址編碼結(jié)構(gòu)特點,調(diào)用權(quán)重篩選模塊.按省份分組:keyll: [101101,101101001, 101101001001,101101202001], key22: [102102001001],計算權(quán)重得分公式如
下。K的取值為當(dāng)前地址解析系統(tǒng)的地址最大精度(當(dāng)前解析到四級地址,則k = 4),U為
地址編碼,S為編碼對應(yīng)權(quán)重分值。計算總和為地址分值
【權(quán)利要求】
1.一種定位方法,其特征在于,包括步驟: 解析輸入全地址,獲得多個字符; 識別所述多個字符的類型,將相同類型的字符合并為相同塊,其中,所述字符類型包括中文字符、英文字符、數(shù)字字符和特殊字符; 采用正向最大分詞算法對每個塊進行逐塊分詞; 根據(jù)行政區(qū)域?qū)Ψ衷~進行分組,并根據(jù)行政區(qū)域預(yù)設(shè)權(quán)重系數(shù)計算各分組的積分; 選取積分最大的分組; 解析所述積分最大的分組,獲得定位地址。
2.根據(jù)權(quán)利要求1所述的一種定位方法,其特征在于,所述根據(jù)行政區(qū)域?qū)Ψ衷~進行分組,并根據(jù)行政區(qū)域預(yù)設(shè)權(quán)重系數(shù)計算各分組的積分具體包括步驟: 根據(jù)行政區(qū)域?qū)Ψ衷~進行分組; 識別每個分組中行政區(qū)域等級種類; 根據(jù)分組中行政區(qū)域等級種類以及行政區(qū)域預(yù)設(shè)權(quán)重系數(shù)計算各分組的積分。
3.根據(jù)權(quán)利要求1或2所述的一種定位方法,所述解析所述積分最大的分組,獲得定位地址具體包括步驟: 按區(qū)域和城市細化所述積分最大的分組, 解析細化后的積分最大的分組,獲得唯一一組地址。
4.根據(jù)權(quán)利要求1或2所述的一種定位方法,其特征在于,所述選取積分最大的分組具體為: 獲取積分大于或等于預(yù)設(shè)積分閾值且積分最大的分組。
5.一種定位系統(tǒng),其特征在于,包括: 字符獲取模塊,用于解析輸入全地址,獲得多個字符; 合并模塊,用于識別所述多個字符的類型,將相同類型的字符合并為相同塊,其中,所述字符類型包括中文字符、英文字符、數(shù)字字符和特殊字符; 分詞模塊,用于采用正向最大分詞算法對每個塊進行逐塊分詞; 積分計算模塊,用于根據(jù)行政區(qū)域?qū)Ψ衷~進行分組,并根據(jù)行政區(qū)域預(yù)設(shè)權(quán)重系數(shù)計算各分組的積分; 分組選取模塊,用于選取積分最大的分組; 定位模塊,用于解析所述積分最大的分組,獲得定位地址。
6.根據(jù)權(quán)利要求5所述的一種定位系統(tǒng),其特征在于,所述積分計算模塊具體包括: 分組單元,用于根據(jù)行政區(qū)域?qū)Ψ衷~進行分組; 行政區(qū)域等級種類識別單元,用于識別每個分組中行政區(qū)域等級種類; 計算單元,用于根據(jù)分組中行政區(qū)域等級種類以及行政區(qū)域預(yù)設(shè)權(quán)重系數(shù)計算各分組的積分。
7.根據(jù)權(quán)利要求5或6所述的一種定位系統(tǒng),所述定位模塊具體包括: 細化單元,用于按區(qū)域和城市細化所述積分最大的分組, 定位單元,用于解析細化后的積分最大的分組,獲得唯一一組地址。
8.根據(jù)權(quán)利要求5或6所述的一種定位系統(tǒng),其特征在于,所述分組選取模塊具體用于,獲取積分大于或等于預(yù)設(shè)積分閾值且積分最大的分組。
【文檔編號】G06F17/30GK104021184SQ201410255891
【公開日】2014年9月3日 申請日期:2014年6月10日 優(yōu)先權(quán)日:2014年6月10日
【發(fā)明者】何宇新, 瞿卓誠 申請人:廣州品唯軟件有限公司