欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

文本匹配方法、系統(tǒng)及相關(guān)產(chǎn)品與流程

文檔序號(hào):40630135發(fā)布日期:2025-01-10 18:36閱讀:3來(lái)源:國(guó)知局
文本匹配方法、系統(tǒng)及相關(guān)產(chǎn)品與流程

本申請(qǐng)實(shí)施例涉及信息處理,尤其涉及文本匹配方法、系統(tǒng)及相關(guān)產(chǎn)品。


背景技術(shù):

1、數(shù)據(jù)即服務(wù)(daas,data?as?a?service),是一種云計(jì)算服務(wù)模式,它提供了一種基于云的數(shù)據(jù)管理解決方案,使得用戶能夠通過(guò)網(wǎng)絡(luò)訪問(wèn)和共享數(shù)據(jù),而無(wú)需在本地存儲(chǔ)和處理數(shù)據(jù)。

2、在daas應(yīng)用中,服務(wù)端可對(duì)外提供數(shù)據(jù)訂閱和數(shù)據(jù)消費(fèi)。例如,在企業(yè)信息校準(zhǔn)、企業(yè)認(rèn)證準(zhǔn)入、企業(yè)信息自動(dòng)補(bǔ)錄以及企業(yè)畫(huà)像分析等企業(yè)服務(wù)(tob,business?tobusiness)場(chǎng)景中,用戶可提交企業(yè)名稱到服務(wù)端,從而查詢或調(diào)用該企業(yè)的詳細(xì)信息。

3、但實(shí)際情況中,用戶提交的企業(yè)名稱大概率是企業(yè)簡(jiǎn)稱(包括非標(biāo)準(zhǔn)名稱),且企業(yè)簡(jiǎn)稱往往是根據(jù)用戶習(xí)慣約定而成的,沒(méi)有標(biāo)準(zhǔn)的形式,故通過(guò)企業(yè)簡(jiǎn)稱進(jìn)行模糊查詢,其查詢結(jié)果的準(zhǔn)確度很難保證,容易匹配到較多相關(guān)度不高甚至不相關(guān)的企業(yè)信息結(jié)果。


技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)實(shí)施例提供了文本匹配方法、系統(tǒng)及相關(guān)產(chǎn)品,用于提高對(duì)待匹配文本的匹配準(zhǔn)確度。

2、本申請(qǐng)實(shí)施例第一方面提供一種文本匹配方法,包括:

3、獲取文本標(biāo)簽字典;所述文本標(biāo)簽字典包含一部分的對(duì)象全稱分別對(duì)應(yīng)所屬的文本標(biāo)簽;

4、識(shí)別待匹配文本在所述文本標(biāo)簽字典中對(duì)應(yīng)所屬的目標(biāo)文本標(biāo)簽;

5、確定所述目標(biāo)文本標(biāo)簽與每一備選全稱的文本標(biāo)簽之間的標(biāo)簽交集度;所述備選全稱包含所述一部分的對(duì)象全稱;

6、基于每一所述備選全稱對(duì)應(yīng)的所述標(biāo)簽交集度,計(jì)算每一所述備選全稱與所述待匹配文本之間的匹配度評(píng)分;

7、將所述匹配度評(píng)分居高的預(yù)設(shè)數(shù)目的所述備選全稱,作為與所述待匹配文本相匹配的目標(biāo)對(duì)象全稱。

8、可選地,所述獲取文本標(biāo)簽字典,包括:

9、從全稱庫(kù)中抽取一部分的對(duì)象全稱作為樣本進(jìn)行分詞和詞義分析,以歸納出文本標(biāo)簽初始字典;所述文本標(biāo)簽初始字典用于,記載各所述樣本在不同標(biāo)簽類型下分別對(duì)應(yīng)有的文本標(biāo)簽;

10、對(duì)于每一所述標(biāo)簽類型,收集所述標(biāo)簽類型在歷史時(shí)段內(nèi)歸屬有的文本標(biāo)簽,并將收集到的所述文本標(biāo)簽補(bǔ)充到所述文本標(biāo)簽初始字典中,得到文本標(biāo)簽更完備的文本標(biāo)簽字典。

11、可選地,確定所述目標(biāo)文本標(biāo)簽與每一備選全稱的文本標(biāo)簽之間的標(biāo)簽交集度之前,所述方法還包括:

12、對(duì)全稱庫(kù)中,除所述一部分的對(duì)象全稱之外的其他對(duì)象全稱進(jìn)行分詞,并對(duì)所述分詞結(jié)果進(jìn)行詞義分析;

13、結(jié)合所述詞義分析結(jié)果,使用所述文本標(biāo)簽字典對(duì)所述分詞結(jié)果進(jìn)行文本標(biāo)簽識(shí)別,以得到所述其他對(duì)象全稱對(duì)應(yīng)所屬的文本標(biāo)簽。

14、可選地,所述基于每一所述備選全稱對(duì)應(yīng)的所述標(biāo)簽交集度,計(jì)算每一所述備選全稱與所述待匹配文本之間的匹配度評(píng)分,包括:

15、獲取所述待匹配文本與每一所述備選全稱之間的文本相似度;

16、基于每一所述備選全稱分別對(duì)應(yīng)的所述標(biāo)簽交集度和所述文本相似度,計(jì)算每一所述備選全稱與所述待匹配文本之間的匹配度評(píng)分。

17、可選地,基于每一所述備選全稱對(duì)應(yīng)的所述標(biāo)簽交集度,計(jì)算每一所述備選全稱與所述待匹配文本之間的匹配度評(píng)分之后,所述方法還包括:

18、對(duì)于所述匹配度評(píng)分居高的預(yù)設(shè)數(shù)量的所述備選全稱,獲取所述預(yù)設(shè)數(shù)量的所述備選全稱的相關(guān)索引信息;其中,所述預(yù)設(shè)數(shù)量大于等于所述預(yù)設(shè)數(shù)目,所述相關(guān)索引信息以不同于所述文本標(biāo)簽的角度描述所述備選全稱的對(duì)象詳情;

19、將所述相關(guān)索引信息作為影響因子,調(diào)整每一所述備選全稱的所述匹配度評(píng)分,得到新匹配度評(píng)分;所述新匹配度評(píng)分用于選取出所述目標(biāo)對(duì)象全稱。

20、可選地,將所述匹配度評(píng)分居高的預(yù)設(shè)數(shù)目的所述備選全稱,作為與所述待匹配文本相匹配的目標(biāo)對(duì)象全稱之后,所述方法還包括:

21、從所述預(yù)設(shè)數(shù)目的所述備選全稱中,篩選出至少一所述備選全稱;

22、將篩選出的至少一所述備選全稱,和/或,篩選出的至少一所述備選全稱的詳情信息返回給所述待匹配文本的輸入端。

23、可選地,當(dāng)所述備選全稱和所述待匹配文本均為企業(yè)名稱描述文本時(shí),所述文本標(biāo)簽所屬的標(biāo)簽類型包含:

24、企業(yè)所屬地區(qū)、企業(yè)所屬行業(yè)、企業(yè)名稱關(guān)鍵字和企業(yè)名稱后綴中的至少一類。

25、本申請(qǐng)第一方面所述的方法在具體實(shí)施時(shí),可采用本申請(qǐng)第二方面所述的內(nèi)容實(shí)現(xiàn)。

26、本申請(qǐng)實(shí)施例第二方面提供一種文本匹配系統(tǒng),包括:獲取單元和處理單元;

27、所述獲取單元,用于獲取文本標(biāo)簽字典;所述文本標(biāo)簽字典包含一部分的對(duì)象全稱分別對(duì)應(yīng)所屬的文本標(biāo)簽;

28、所述處理單元,用于識(shí)別待匹配文本在所述文本標(biāo)簽字典中對(duì)應(yīng)所屬的目標(biāo)文本標(biāo)簽;

29、所述處理單元,還用于確定所述目標(biāo)文本標(biāo)簽與每一備選全稱的文本標(biāo)簽之間的標(biāo)簽交集度;所述備選全稱包含所述一部分的對(duì)象全稱;

30、所述處理單元,還用于基于每一所述備選全稱對(duì)應(yīng)的所述標(biāo)簽交集度,計(jì)算每一所述備選全稱與所述待匹配文本之間的匹配度評(píng)分;

31、所述處理單元,還用于將所述匹配度評(píng)分居高的預(yù)設(shè)數(shù)目的所述備選全稱,作為與所述待匹配文本相匹配的目標(biāo)對(duì)象全稱。

32、本申請(qǐng)實(shí)施例第三方面提供一種電子設(shè)備,包括:處理器及存儲(chǔ)器;

33、所述處理器配置為與所述存儲(chǔ)器通信,并執(zhí)行所述存儲(chǔ)器中的指令以實(shí)現(xiàn)本申請(qǐng)實(shí)施例第一方面或第一方面的任一具體實(shí)現(xiàn)方式所描述的方法。

34、本申請(qǐng)實(shí)施例第四方面提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本申請(qǐng)實(shí)施例第一方面或第一方面的任一具體實(shí)現(xiàn)方式所描述的方法。

35、本申請(qǐng)實(shí)施例第五方面提供一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本申請(qǐng)實(shí)施例第一方面或第一方面的任一具體實(shí)現(xiàn)方式所描述的方法。

36、從以上技術(shù)方案可以看出,本申請(qǐng)實(shí)施例至少具有以下優(yōu)點(diǎn):

37、本申請(qǐng)實(shí)施例以文本標(biāo)簽而非文本本身為切入點(diǎn),確定目標(biāo)文本標(biāo)簽與每一備選全稱的文本標(biāo)簽之間的標(biāo)簽交集度,從而計(jì)算每一備選全稱與所述待匹配文本之間的匹配度評(píng)分,可有效規(guī)避用戶輸入的待匹配文本為非標(biāo)準(zhǔn)格式的模糊用語(yǔ)(如簡(jiǎn)稱)時(shí),直接或僅僅引用待匹配文本本身算文本間的匹配度,會(huì)引發(fā)通過(guò)待匹配文本得到的匹配結(jié)果準(zhǔn)確度不高的問(wèn)題。簡(jiǎn)言之,本申請(qǐng)實(shí)施例以文本標(biāo)簽為要點(diǎn),可提高通過(guò)待匹配文本進(jìn)行模糊匹配的準(zhǔn)確度,促使關(guān)聯(lián)查找到的待匹配文本的詳情信息與用戶需求高度相關(guān),提升用戶體驗(yàn)。



技術(shù)特征:

1.一種文本匹配方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的文本匹配方法,其特征在于,所述獲取文本標(biāo)簽字典,包括:

3.根據(jù)權(quán)利要求1所述的文本匹配方法,其特征在于,確定所述目標(biāo)文本標(biāo)簽與每一備選全稱的文本標(biāo)簽之間的標(biāo)簽交集度之前,所述方法還包括:

4.根據(jù)權(quán)利要求1所述的文本匹配方法,其特征在于,所述基于每一所述備選全稱對(duì)應(yīng)的所述標(biāo)簽交集度,計(jì)算每一所述備選全稱與所述待匹配文本之間的匹配度評(píng)分,包括:

5.根據(jù)權(quán)利要求1所述的文本匹配方法,其特征在于,基于每一所述備選全稱對(duì)應(yīng)的所述標(biāo)簽交集度,計(jì)算每一所述備選全稱與所述待匹配文本之間的匹配度評(píng)分之后,所述方法還包括:

6.根據(jù)權(quán)利要求1或5所述的文本匹配方法,其特征在于,將所述匹配度評(píng)分居高的預(yù)設(shè)數(shù)目的所述備選全稱,作為與所述待匹配文本相匹配的目標(biāo)對(duì)象全稱之后,所述方法還包括:

7.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的文本匹配方法,其特征在于,當(dāng)所述備選全稱和所述待匹配文本均為企業(yè)名稱描述文本時(shí),所述文本標(biāo)簽所屬的標(biāo)簽類型包含:

8.一種文本匹配系統(tǒng),其特征在于,包括:獲取單元和處理單元;

9.一種電子設(shè)備,其特征在于,包括:處理器及存儲(chǔ)器;

10.一種可讀存儲(chǔ)介質(zhì),其特征在于,所述可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任意一項(xiàng)所述的方法。

11.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任意一項(xiàng)所述的方法。


技術(shù)總結(jié)
本申請(qǐng)實(shí)施例公開(kāi)了文本匹配方法、系統(tǒng)及相關(guān)產(chǎn)品,此方法包括:獲取文本標(biāo)簽字典;文本標(biāo)簽字典包含一部分的對(duì)象全稱分別對(duì)應(yīng)所屬的文本標(biāo)簽;識(shí)別待匹配文本在文本標(biāo)簽字典中對(duì)應(yīng)所屬的目標(biāo)文本標(biāo)簽;確定目標(biāo)文本標(biāo)簽與全稱庫(kù)中每一備選全稱的文本標(biāo)簽之間的標(biāo)簽交集度;基于每一備選全稱對(duì)應(yīng)的標(biāo)簽交集度,計(jì)算每一備選全稱與待匹配文本之間的匹配度評(píng)分;將匹配度評(píng)分居高的預(yù)設(shè)數(shù)目的備選全稱,作為與待匹配文本相匹配的目標(biāo)對(duì)象全稱。本申請(qǐng)實(shí)施例引入文本標(biāo)簽為要點(diǎn),可提高通過(guò)待匹配文本進(jìn)行模糊匹配的準(zhǔn)確度,促使關(guān)聯(lián)查找到的待匹配文本的詳情信息與用戶需求高度相關(guān),提升用戶體驗(yàn)。

技術(shù)研發(fā)人員:黃能權(quán),邱浩新,徐向陽(yáng),肖鋼
受保護(hù)的技術(shù)使用者:金蝶軟件(中國(guó))有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/9
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
蓝田县| 巴彦淖尔市| 澄城县| 临城县| 沙田区| 陕西省| 辽宁省| 五华县| 五华县| 金塔县| 南安市| 施甸县| 青川县| 岳西县| 五指山市| 治多县| 布尔津县| 灵丘县| 迁安市| 富蕴县| 古浪县| 巴南区| 沐川县| 沁阳市| 蚌埠市| 长治市| 罗田县| 通道| 永泰县| 绥阳县| 林甸县| 贞丰县| 新源县| 探索| 东乡| 佛坪县| 阳江市| 达拉特旗| 遂宁市| 娱乐| 长治市|