欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種地址匹配方法及相關(guān)裝置與流程

文檔序號:40452963發(fā)布日期:2024-12-27 09:18閱讀:10來源:國知局
一種地址匹配方法及相關(guān)裝置與流程

本技術(shù)涉及人工智能領(lǐng)域,尤其涉及一種地址匹配方法及相關(guān)裝置。


背景技術(shù):

1、人工智能(artificial?intelligence,ai)是利用數(shù)字計算機或者數(shù)字計算機控制的機器模擬、延伸和擴展人的智能,感知環(huán)境、獲取知識并使用知識獲得最佳結(jié)果的理論、方法、技術(shù)及應(yīng)用系統(tǒng)。換句話說,人工智能是計算機科學(xué)的一個分支,它企圖了解智能的實質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器。人工智能也就是研究各種智能機器的設(shè)計原理與實現(xiàn)方法,使機器具有感知、推理與決策的功能。

2、基于人工智能的地址匹配技術(shù)的應(yīng)用場景非常廣泛,導(dǎo)航、物流、金融風控等領(lǐng)域都能見到地址匹配技術(shù)的身影。目前,在進行地址匹配時,一般是將地址類文本作為沒有語義的字符串進行相似度匹配。但是,該方法一般缺乏在標準地址結(jié)構(gòu)上的語義限制,例如,“這部電影非常好看,非常期待第二部”與“這部電影非常難看,有第二部也不會看了”,在計算這兩句話的語義相似度時無需考慮層級上的限制,可以直接拿全句的語義來進行計算。但是,地址類文本比較特殊,例如,“遼寧省朝陽市朝陽縣希爾頓酒店”與“北京市朝陽區(qū)希爾頓酒店”兩段文本的重合度非常高,但是基于標準地址結(jié)構(gòu)的限制,兩者之間的相似度非常低,如果直接基于字符串進行匹配,地址匹配的效果較差。


技術(shù)實現(xiàn)思路

1、本技術(shù)提供了一種地址匹配方法及相關(guān)裝置,能夠提高地址匹配的準確度。

2、第一方面,本技術(shù)提供了一種地址匹配方法,該方法可以應(yīng)用于人工智能領(lǐng)域,主要包括:

3、首先,獲取基于地址層級解析后的第一地址信息。接著,將第一地址信息輸入第一模型,得到第一特征信息,其中,第一模型為基于地址層級解析后的樣本庫訓(xùn)練得到。然后,獲取地址庫內(nèi)的每一條地址信息對應(yīng)的第二特征信息。最后,根據(jù)第一特征信息和地址庫內(nèi)的每一條地址信息對應(yīng)的第二特征信息進行相似度計算,得到地址匹配結(jié)果。

4、在本技術(shù)中,第一方面,相比于直接基于地址類文本對應(yīng)的字符串信息進行特征信息的提取,本技術(shù)采用顯性的地址層級的提示信息,將基于地址層級解析后的第一地址信息作為第一模型的輸入信息,輸出對應(yīng)的第一特征信息,從而降低了模型的訓(xùn)練難度,提高了第一模型的訓(xùn)練效果,提升了第一模型的訓(xùn)練精度。第二方面,基于地址層級解析后的樣本庫對第一模型進行訓(xùn)練,降低了第一模型對地址層級進行識別和解析的學(xué)習(xí)難度,提高了第一模型對地址信息的識別準確度,從而進一步提高地址匹配的準確度。第三方面,通過提前將地址庫內(nèi)的每一條地址信息輸入到第一模型中進行特征輸出,使得在線實時輸入第一地址信息時,可以與地址庫內(nèi)的每一條地址信息對應(yīng)的第二特征信息直接進行相似度的匹配計算,實時輸出地址匹配結(jié)果,從而滿足了線上化部署的性能要求,降低了時延,實現(xiàn)了適用場景的廣泛性。

5、在第一方面的一種可能的實現(xiàn)方式中,第一模型為采用第一損失函數(shù)訓(xùn)練得到,第一損失函數(shù)是基于兩個樣本之間的相似度的預(yù)測值與真實值之間的差值得到的,真實值是基于兩個樣本之間的相似度的預(yù)測值與預(yù)設(shè)閾值之間的大小關(guān)系得到。

6、該種可能的實現(xiàn)方式中,采用第一損失函數(shù)來訓(xùn)練第一模型,使得樣本的相似度的預(yù)測值與真實值之間的差值不斷減小,增強第一模型的合理性和解釋性。另外,采用預(yù)設(shè)閾值來設(shè)定兩個樣本之間的相似度的真實值,可以靈活設(shè)定地址匹配最終達到的效果。

7、在第一方面的一種可能的實現(xiàn)方式中,第一模型為采用第一損失函數(shù)訓(xùn)練得到,第一損失函數(shù)用于指示第一樣本對的相似度與第二樣本對的相似度在排序上的真實順序與預(yù)測順序之間的差異。

8、該種可能的實現(xiàn)方式中,第一損失函數(shù)用于指示兩個樣本的相似度在排序上的真實順序與預(yù)測順序之間的差異,以評估排序結(jié)果是否一致,從而使得第一模型適用于地址排序的場景,即地址匹配結(jié)果對應(yīng)的是與輸入的地址信息最為相似的排序結(jié)果。

9、在第一方面的一種可能的實現(xiàn)方式中,獲取基于地址層級解析后的第一地址信息,包括:

10、獲取待匹配的第二地址信息;

11、將待匹配的第二地址信息按照地址層級進行解析,得到解析后的第二地址信息;

12、基于預(yù)設(shè)行政區(qū)劃的名稱和編碼對解析后的第二地址信息進行修正,得到修正后的第二地址信息;

13、基于地址層級對修正后的第二地址信息進行補全,得到基于地址層級解析后的第一地址信息。

14、該種可能的實現(xiàn)方式中,在獲取到待匹配的第二地址信息后,采用地址層級對第二地址信息進行解析,以保證地址解析的穩(wěn)定性。隨后,基于預(yù)設(shè)行政區(qū)劃的名稱和編碼對解析后的第二地址信息進行修正,以基于預(yù)設(shè)行政區(qū)劃的名稱和編碼完善解析后的第二地址信息。最后,基于地址層級對修正后的第二地址信息進行補全,以基于地址層級實現(xiàn)第二地址信息的信息補全,統(tǒng)一輸入到第一模型的地址信息,實現(xiàn)第一模型的信息輸入的標準化。

15、在第一方面的一種可能的實現(xiàn)方式中,基于預(yù)設(shè)行政區(qū)劃的名稱和編碼對解析后的第二地址信息進行修正,得到修正后的第二地址信息,包括:

16、對于解析后的第二地址信息中包含的每一地址信息,判斷地址信息是否存在于字典樹中,得到判斷結(jié)果,字典樹基于預(yù)設(shè)行政區(qū)劃的名稱構(gòu)成;

17、若判斷結(jié)果為是,則判斷地址信息在字典樹中是否唯一;

18、若是,則將地址信息對應(yīng)的預(yù)設(shè)行政區(qū)劃的名稱和編碼添加到第二地址信息中,得到修正后的第二地址信息;

19、若否,則根據(jù)地址信息的父節(jié)點或者子節(jié)點的地址信息對解析后的第二地址信息進行修正,得到修正后的第二地址信息;

20、若判斷結(jié)果為否,則將地址信息修改為默認信息。

21、該種可能的實現(xiàn)方式中,對于解析后的第二地址信息,由于第二地址信息基于地址層級解析得到,對應(yīng)于不同的地址層級,包含多個地址信息,而對于每一地址信息,可能在基于預(yù)設(shè)行政區(qū)劃的名稱構(gòu)成的字典樹中對應(yīng)有多個名稱,因此,在判斷到解析后的第二地址信息存在于字典樹中時,需要判斷該地址信息在字典樹中是否唯一。若不唯一,則可以通過校驗該地址信息的父節(jié)點或者子節(jié)點的地址信息來確定該地址信息對應(yīng)的名稱,以確定該地址信息對應(yīng)在預(yù)設(shè)行政區(qū)劃中對應(yīng)的名稱,完善解析后的第二地址信息。

22、在第一方面的一種可能的實現(xiàn)方式中,基于地址層級對修正后的第二地址信息進行補全,得到基于地址層級解析后的第一地址信息,包括:

23、基于地址層級的分級順序,對修正后的第二地址信息進行分級排序,得到分級排序后的第二地址信息;

24、判斷分級排序后的第二地址信息是否包含每一級的地址信息;

25、若否,則從分級排序后的第二地址信息中篩選出至少一個缺失的級別,并根據(jù)每一缺失的級別對應(yīng)的至少一個父節(jié)點的地址信息對缺失的級別進行補全,得到基于地址層級解析后的第一地址信息。

26、該種可能的實現(xiàn)方式中,首先基于地址層級的分級順序,對修正后的第二地址信息進行分級排序,以基于地址層級中的每一層地址信息從修正后的第二地址信息篩選出缺失的層級信息。對于缺失的層級信息,可以進一步通過校驗對應(yīng)的父節(jié)點的地址信息進行補全,以得到完善后的第一地址信息,實現(xiàn)地址信息的補全。

27、在第一方面的一種可能的實現(xiàn)方式中,地址庫包括風險地址庫。

28、該種可能的實現(xiàn)方式中,在地址庫中添加風險地址庫,可以基于風險地址庫對輸入的第二地址信息進行風險地址識別,進一步擴展了使用場景。

29、第二方面,本技術(shù)提供了一種模型的訓(xùn)練方法,方法用于對第一模型進行訓(xùn)練,方法包括:

30、獲取基于地址層級解析后的第一地址信息;

31、將第一地址信息輸入第一模型,得到第一特征信息,其中,第一模型為基于地址層級解析后的樣本庫訓(xùn)練得到;

32、獲取地址庫內(nèi)的每一條地址信息對應(yīng)的第二特征信息;

33、根據(jù)第一特征信息和地址庫內(nèi)的每一條地址信息對應(yīng)的第二特征信息進行相似度計算,得到地址匹配結(jié)果;

34、根據(jù)第一損失函數(shù)對第一模型進行訓(xùn)練,直至滿足預(yù)設(shè)條件,得到訓(xùn)練后的第一模型。

35、在第二方面的一種可能的實現(xiàn)方式中,第一損失函數(shù)是基于兩個樣本之間的相似度的預(yù)測值與真實值之間的差值得到的,真實值是基于兩個樣本之間的相似度的預(yù)測值與預(yù)設(shè)閾值之間的大小關(guān)系得到。

36、在第二方面的一種可能的實現(xiàn)方式中,第一損失函數(shù)用于指示第一樣本對的相似度與第二樣本對的相似度在排序上的真實順序與預(yù)測順序之間的差異。

37、在第二方面的一種可能的實現(xiàn)方式中,獲取基于地址層級解析后的第一地址信息,包括:

38、獲取待匹配的第二地址信息;

39、將待匹配的第二地址信息按照地址層級進行解析,得到解析后的第二地址信息;

40、基于預(yù)設(shè)行政區(qū)劃的名稱和編碼對解析后的第二地址信息進行修正,得到修正后的第二地址信息;

41、基于地址層級對修正后的第二地址信息進行補全,得到基于地址層級解析后的第一地址信息。

42、在第二方面的一種可能的實現(xiàn)方式中,基于預(yù)設(shè)行政區(qū)劃的名稱和編碼對解析后的第二地址信息進行修正,得到修正后的第二地址信息,包括:

43、對于解析后的第二地址信息中包含的每一地址信息,判斷地址信息是否存在于字典樹中,得到判斷結(jié)果,字典樹基于預(yù)設(shè)行政區(qū)劃的名稱構(gòu)成;

44、若判斷結(jié)果為是,則判斷地址信息在字典樹中是否唯一;

45、若是,則將地址信息對應(yīng)的預(yù)設(shè)行政區(qū)劃的名稱和編碼添加到第二地址信息中,得到修正后的第二地址信息;

46、若否,則根據(jù)地址信息的父節(jié)點或者子節(jié)點的地址信息對解析后的第二地址信息進行修正,得到修正后的第二地址信息;

47、若判斷結(jié)果為否,則將地址信息修改為默認信息。

48、在第二方面的一種可能的實現(xiàn)方式中,基于地址層級對修正后的第二地址信息進行補全,得到基于地址層級解析后的第一地址信息,包括:

49、基于地址層級的分級順序,對修正后的第二地址信息進行分級排序,得到分級排序后的第二地址信息;

50、判斷分級排序后的第二地址信息是否包含每一級的地址信息;

51、若否,則從分級排序后的第二地址信息中篩選出至少一個缺失的級別,并根據(jù)每一缺失的級別對應(yīng)的至少一個父節(jié)點的地址信息對缺失的級別進行補全,得到基于地址層級解析后的第一地址信息。

52、在第二方面的一種可能的實現(xiàn)方式中,地址庫包括風險地址庫。

53、本技術(shù)中,模型的訓(xùn)練方法可以用于實現(xiàn)第一方面各種可能實現(xiàn)方式中的步驟,對于本技術(shù)實施例第二方面以及第二方面的各種可能實現(xiàn)方式中某些步驟的具體實現(xiàn)方式,以及每種可能實現(xiàn)方式所帶來的有益效果,均可以參考第一方面中各種可能的實現(xiàn)方式中的描述,此處不再一一贅述。

54、第三方面,本技術(shù)提供了一種地址匹配裝置,包括:

55、地址信息獲取模塊,用于獲取基于地址層級解析后的第一地址信息;

56、特征信息獲取模塊,用于將第一地址信息輸入第一模型,得到第一特征信息,其中,第一模型為基于地址層級解析后的樣本庫訓(xùn)練得到;

57、特征信息獲取模塊,還用于獲取地址庫內(nèi)的每一條地址信息對應(yīng)的第二特征信息;

58、地址信息匹配模塊,用于根據(jù)第一特征信息和地址庫內(nèi)的每一條地址信息對應(yīng)的第二特征信息進行相似度計算,得到地址匹配結(jié)果。

59、在第三方面的一種可能的實現(xiàn)方式中,第一模型為采用第一損失函數(shù)訓(xùn)練得到,第一損失函數(shù)是基于兩個樣本之間的相似度的預(yù)測值與真實值之間的差值得到的,真實值是基于兩個樣本之間的相似度的預(yù)測值與預(yù)設(shè)閾值之間的大小關(guān)系得到。

60、在第三方面的一種可能的實現(xiàn)方式中,第一模型為采用第一損失函數(shù)訓(xùn)練得到,第一損失函數(shù)用于指示第一樣本對的相似度與第二樣本對的相似度在排序上的真實順序與預(yù)測順序之間的差異。

61、在第三方面的一種可能的實現(xiàn)方式中,地址信息獲取模塊還用于:

62、獲取待匹配的第二地址信息;

63、將待匹配的第二地址信息按照地址層級進行解析,得到解析后的第二地址信息;

64、基于預(yù)設(shè)行政區(qū)劃的名稱和編碼對解析后的第二地址信息進行修正,得到修正后的第二地址信息;

65、基于地址層級對修正后的第二地址信息進行補全,得到基于地址層級解析后的第一地址信息。

66、在第三方面的一種可能的實現(xiàn)方式中,地址信息獲取模塊還用于:

67、對于解析后的第二地址信息中包含的每一地址信息,判斷地址信息是否存在于字典樹中,得到判斷結(jié)果,字典樹基于預(yù)設(shè)行政區(qū)劃的名稱構(gòu)成;

68、若判斷結(jié)果為是,則判斷地址信息在字典樹中是否唯一;

69、若是,則將地址信息對應(yīng)的預(yù)設(shè)行政區(qū)劃的名稱和編碼添加到第二地址信息中,得到修正后的第二地址信息;

70、若否,則根據(jù)地址信息的父節(jié)點或者子節(jié)點的地址信息對解析后的第二地址信息進行修正,得到修正后的第二地址信息;

71、若判斷結(jié)果為否,則將地址信息修改為默認信息。

72、在第三方面的一種可能的實現(xiàn)方式中,地址信息獲取模塊還用于:

73、基于地址層級的分級順序,對修正后的第二地址信息進行分級排序,得到分級排序后的第二地址信息;

74、判斷分級排序后的第二地址信息是否包含每一級的地址信息;

75、若否,則從分級排序后的第二地址信息中篩選出至少一個缺失的級別,并根據(jù)每一缺失的級別對應(yīng)的至少一個父節(jié)點的地址信息對缺失的級別進行補全,得到基于地址層級解析后的第一地址信息。

76、在第三方面的一種可能的實現(xiàn)方式中,地址庫包括風險地址庫。

77、本技術(shù)第三方面中,地址匹配裝置包括的各個模塊還可以用于實現(xiàn)第一方面各種可能的實現(xiàn)方式中的步驟,對于本技術(shù)實施例第三方面以及第三方面的各種可能的實現(xiàn)方式中某些步驟的具體實現(xiàn)方式,以及每種可能的實現(xiàn)方式所帶來的有益效果,均可以參考第一方面中各種可能的實現(xiàn)方式中的描述,此處不再一一贅述。

78、第四方面,本技術(shù)提供了一種模型的訓(xùn)練裝置,模型的訓(xùn)練裝置用于對第一模型進行訓(xùn)練,裝置包括:

79、地址信息獲取模塊,用于獲取基于地址層級解析后的第一地址信息;

80、特征信息獲取模塊,用于將第一地址信息輸入第一模型,得到第一特征信息,其中,第一模型為基于地址層級解析后的樣本庫訓(xùn)練得到;

81、特征信息獲取模塊,還用于獲取地址庫內(nèi)的每一條地址信息對應(yīng)的第二特征信息;

82、地址信息匹配模塊,用于根據(jù)第一特征信息和地址庫內(nèi)的每一條地址信息對應(yīng)的第二特征信息進行相似度計算,得到地址匹配結(jié)果;

83、第一模型訓(xùn)練模塊,用于根據(jù)第一損失函數(shù)對第一模型進行訓(xùn)練,直至滿足預(yù)設(shè)條件,得到訓(xùn)練后的第一模型。

84、在第四方面的一種可能的實現(xiàn)方式中,第一損失函數(shù)是基于兩個樣本之間的相似度的預(yù)測值與真實值之間的差值得到的,真實值是基于兩個樣本之間的相似度的預(yù)測值與預(yù)設(shè)閾值之間的大小關(guān)系得到。

85、在第四方面的一種可能的實現(xiàn)方式中,第一損失函數(shù)用于指示第一樣本對的相似度與第二樣本對的相似度在排序上的真實順序與預(yù)測順序之間的差異。

86、在第四方面的一種可能的實現(xiàn)方式中,地址信息獲取模塊還用于:

87、獲取待匹配的第二地址信息;

88、將待匹配的第二地址信息按照地址層級進行解析,得到解析后的第二地址信息;

89、基于預(yù)設(shè)行政區(qū)劃的名稱和編碼對解析后的第二地址信息進行修正,得到修正后的第二地址信息;

90、基于地址層級對修正后的第二地址信息進行補全,得到基于地址層級解析后的第一地址信息。

91、在第四方面的一種可能的實現(xiàn)方式中,地址信息獲取模塊還用于:

92、對于解析后的第二地址信息中包含的每一地址信息,判斷地址信息是否存在于字典樹中,得到判斷結(jié)果,字典樹基于預(yù)設(shè)行政區(qū)劃的名稱構(gòu)成;

93、若判斷結(jié)果為是,則判斷地址信息在字典樹中是否唯一;

94、若是,則將地址信息對應(yīng)的預(yù)設(shè)行政區(qū)劃的名稱和編碼添加到第二地址信息中,得到修正后的第二地址信息;

95、若否,則根據(jù)地址信息的父節(jié)點或者子節(jié)點的地址信息對解析后的第二地址信息進行修正,得到修正后的第二地址信息;

96、若判斷結(jié)果為否,則將地址信息修改為默認信息。

97、在第四方面的一種可能的實現(xiàn)方式中,地址信息獲取模塊還用于:

98、基于地址層級的分級順序,對修正后的第二地址信息進行分級排序,得到分級排序后的第二地址信息;

99、判斷分級排序后的第二地址信息是否包含每一級的地址信息;

100、若否,則從分級排序后的第二地址信息中篩選出至少一個缺失的級別,并根據(jù)每一缺失的級別對應(yīng)的至少一個父節(jié)點的地址信息對缺失的級別進行補全,得到基于地址層級解析后的第一地址信息。

101、在第四方面的一種可能的實現(xiàn)方式中,地址庫包括風險地址庫。

102、本技術(shù)第四方面中,模型的訓(xùn)練裝置包括的各個模塊還可以用于實現(xiàn)第二方面各種可能的實現(xiàn)方式中的步驟,對于本技術(shù)實施例第四方面以及第四方面的各種可能的實現(xiàn)方式中某些步驟的具體實現(xiàn)方式,以及每種可能的實現(xiàn)方式所帶來的有益效果,均可以參考第二方面中各種可能的實現(xiàn)方式中的描述,此處不再一一贅述。

103、第五方面,本技術(shù)實施例提供了一種執(zhí)行設(shè)備,可以包括處理器,處理器和存儲器耦合,存儲器存儲有程序指令,當存儲器存儲的程序指令被處理器執(zhí)行時實現(xiàn)上述第一方面的地址匹配方法。對于處理器執(zhí)行第一方面的各個可能實現(xiàn)方式中執(zhí)行設(shè)備執(zhí)行的步驟,具體均可以參閱上述第一方面,此處不再贅述。

104、第六方面,本技術(shù)實施例提供了一種訓(xùn)練設(shè)備,可以包括處理器,處理器和存儲器耦合,存儲器存儲有程序指令,當存儲器存儲的程序指令被處理器執(zhí)行時實現(xiàn)上述第二方面的模型的訓(xùn)練方法。對于處理器執(zhí)行第二方面的各個可能實現(xiàn)方式中訓(xùn)練設(shè)備執(zhí)行的步驟,具體均可以參閱第二方面,此處不再贅述。

105、第七方面,本技術(shù)實施例提供了一種計算機可讀存儲介質(zhì),計算機可讀存儲介質(zhì)中存儲有計算機程序,當其在計算機上行駛時,使得計算機執(zhí)行上述第一方面或第一方面的任一種可能實現(xiàn)方式的方法,或者,使得計算機執(zhí)行上述第二方面或第二方面的任一種可能實現(xiàn)方式的方法。

106、第八方面,本技術(shù)實施例提供了一種電路系統(tǒng),電路系統(tǒng)包括處理電路,處理電路配置為執(zhí)行上述第一方面或第一方面的任一種可能實現(xiàn)方式的方法,或者,處理電路配置為執(zhí)行上述第二方面或第二方面的任一種可能實現(xiàn)方式的方法。

107、第九方面,本技術(shù)實施例提供了一種計算機程序產(chǎn)品,當其在計算機上運行時,使得計算機執(zhí)行上述第一方面或第一方面的任一種可能實現(xiàn)方式的方法,或者,使得計算機執(zhí)行上述第二方面或第二方面的任一種可能實現(xiàn)方式的方法。

108、第十方面,本技術(shù)提供了一種芯片系統(tǒng),包括處理器和存儲器,存儲器用于存儲計算機程序,處理器用于調(diào)用并運行存儲器中存儲的計算機程序,以執(zhí)行如上述第一方面或第一方面的任一種可能實現(xiàn)方式的方法,或者,使得計算機執(zhí)行上述第二方面或第二方面的任一種可能實現(xiàn)方式的方法。該芯片系統(tǒng),可以由芯片構(gòu)成,也可以包括芯片和其他分立器件。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
鹤峰县| 嵊泗县| 临猗县| 屯门区| 涿州市| 孝义市| 铁力市| 建德市| 庄河市| 龙里县| 泗水县| 龙门县| 库尔勒市| 梅州市| 仙游县| 广宁县| 新野县| 安徽省| 安庆市| 榆社县| 新津县| 黎城县| 丹阳市| 南丹县| 陆川县| 崇左市| 长春市| 汨罗市| 萨嘎县| 镇巴县| 仁寿县| 竹溪县| 兴国县| 吉安县| 正安县| 呼伦贝尔市| 尉氏县| 湟中县| 富民县| 盐源县| 邵武市|