欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于結(jié)構(gòu)特征和演變模式的小樣本古文字識別方法

文檔序號:40531577發(fā)布日期:2024-12-31 13:46閱讀:45來源:國知局
一種基于結(jié)構(gòu)特征和演變模式的小樣本古文字識別方法

本發(fā)明屬于漢字識別,具體涉及一種基于結(jié)構(gòu)特征和演變模式的小樣本古文字識別方法。


背景技術(shù):

1、古文字識別是一項具有挑戰(zhàn)性的任務(wù),傳統(tǒng)的計算機視覺任務(wù)通常需要大量的訓(xùn)練數(shù)據(jù),這在古文字識別任務(wù)中很難得到滿足。對于新出土的文物或文獻,其中的古文字往往缺乏足夠的參考文獻,導(dǎo)致難以獲得大量的標注數(shù)據(jù)。此外,對于一些場景的古文字,可獲得的數(shù)據(jù)量非常少。而小樣本學(xué)習(xí)僅使用少量數(shù)據(jù)就能有效地訓(xùn)練出具有良好泛化性能的模型,可以很好的解決問題。

2、現(xiàn)有的小樣本學(xué)習(xí)方法大致可以分為三類:基于優(yōu)化的方法、基于模型的方法和基于度量的方法?;趦?yōu)化的方法尋求良好的初始化參數(shù),使模型能夠快速適應(yīng)新的任務(wù)。在面對復(fù)雜的古文字識別任務(wù)時,有限的樣本數(shù)量可能導(dǎo)致過擬合?;谀P偷姆椒ㄖ荚谕ㄟ^設(shè)計模型結(jié)構(gòu),直接建立輸入值與預(yù)測值之間的映射函數(shù),在少量樣本上快速更新參數(shù),但是由于古文字結(jié)構(gòu)復(fù)雜、字體多變,很難設(shè)計出能夠有效捕捉這些特征的模型。基于度量的方法學(xué)習(xí)一個度量空間,在這個空間中,相似的數(shù)據(jù)點之間的距離較近,而不相似的數(shù)據(jù)點之間的距離較遠?,F(xiàn)有的基于度量的小樣本方法通常是為miniimagenet等通用數(shù)據(jù)集設(shè)計的,這些數(shù)據(jù)集和古文字的數(shù)據(jù)集有很大的不同,特別是古文字具有特殊的結(jié)構(gòu)特征,共有13種結(jié)構(gòu),還有特殊的演變模式,這些特點都不在miniimagenet等通用數(shù)據(jù)集中。所以現(xiàn)有的基于度量的小樣本方法沒有有效地利用漢字的結(jié)構(gòu)特征和演變模式,導(dǎo)致漢字識別任務(wù)的性能不佳。


技術(shù)實現(xiàn)思路

1、針對現(xiàn)有技術(shù)中的上述不足,本發(fā)明提供的基于結(jié)構(gòu)特征和演變模式的小樣本古文字識別方法解決了現(xiàn)有的小樣本學(xué)習(xí)由于數(shù)據(jù)量過少,在古文字識別領(lǐng)域過擬合,特征提取不全,識別準確率較低的問題。

2、為了達到上述發(fā)明目的,本發(fā)明采用的技術(shù)方案為:一種基于結(jié)構(gòu)特征和演變模式的小樣本古文字識別方法,包括以下步驟:

3、s1、采集古文字字符圖像,構(gòu)建數(shù)據(jù)集,并對其進行數(shù)據(jù)增強處理;

4、s2、使用數(shù)據(jù)增強后的數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò),得到小樣本古文字識別模型;

5、所述小樣本古文字識別模型包括特征提取模塊、字符分類模塊和對比學(xué)習(xí)模塊;其中,所述特征提取模塊用于提取數(shù)據(jù)集中字符圖像的特征圖;所述字符分類模塊用于對特征圖進行自注意力增強,并對獲得的包含局部特征的增強后的特征圖進行平均池化操作得到全局特征,進而根據(jù)全局特征和局部特征評價字符圖像之間的相似性,確定字符圖像類別;所述對比學(xué)習(xí)模塊用于根據(jù)類標簽,對數(shù)據(jù)增強后的字符圖像的全局特征進行對比學(xué)習(xí),獲取有判別性的特征;

6、s3、將目標古文字字符圖像輸入到小樣本古文字識別模型,進而輸出古文字識別結(jié)果。

7、進一步地,所述步驟s1中,所述數(shù)據(jù)增強處理包括顏色抖動、輕微旋轉(zhuǎn)、輕微剪切以及輕微縮放。

8、進一步地,所述步驟s2中,在所述小樣本古文字識別模型中,所述特征提取模塊提取全局特征和局部特征的方法具體為:

9、s2-a1、通過卷積神經(jīng)網(wǎng)絡(luò)提取輸入字符圖像包含局部特征的特征圖;

10、s2-a2、將包含局部特征的特征圖進行均勻網(wǎng)格分割,確定對應(yīng)的局部空間特征;

11、s2-a3、利用全局平均池化操作將局部空間特征聚合,獲得全局特征。

12、進一步地,所述步驟s2中,在所述小樣本古文字識別模型中,所述字符分類模塊評價字符圖像之間的相似性的方法具體為:

13、s2-b1、對支持集中的每一類特征圖進行自注意力增強,得到自注意力增強特征圖;

14、s2-b2、對查詢集中的每一個查詢圖像進行自注意力增強,得到增強查詢特征圖;

15、s2-b3、分別計算自注意力增強特征圖和增強查詢特征圖的全局相似度和局部相似度;

16、s2-b4、根據(jù)全局相似度和局部相似度,確定查詢圖像與支持集中各類字符圖像的相似度,進而確定查詢圖像的字符類別;

17、所述數(shù)據(jù)增強后的數(shù)據(jù)集根據(jù)分類任務(wù)識別的古文字字符類別劃分出支持集和查詢集。

18、進一步地,所述步驟s2-b1包括以下分步驟:

19、b11、對支持集中每一類特征圖取平均值,得到類特征圖;

20、b12、對類特征圖使用自注意力機制處理,獲得類注意力特征圖;

21、b13、將類特征圖和類注意力特征圖結(jié)合,得到自注意力增強特征圖。

22、進一步地,所述步驟s2-b3中,所述自注意力增強特征圖和增強查詢特征圖的全局相似度simg為:

23、

24、所述自注意力增強特征圖和增強查詢特征圖中每個位置的局部相似度simpos為:

25、simpos=α·cos(aij,bij)+β·cos(aij,rij)

26、式中,fi表示對支持集中每個類的特征進行平均,得到的每個類對應(yīng)的一個原型,表

27、示第i個查詢圖像的特征使用自注意力機制增強后再全局池化得到的特征,表示針對類別為cj的支持圖像的類增強特征,cosinesimilarity(·)表示余弦相似度,sim(·)表示相似性度量;

28、aij和bij分別表示第i個查詢圖像對應(yīng)的增強查詢特征圖和支持集中的第cj類自注意力增強特征圖,rij表示aij對應(yīng)的邊界區(qū)域特征。

29、進一步地,所述步驟s2-b4中,第i個查詢圖像與支持集中第cj類字符圖像的相似度sim表示為:

30、sim=λ·simg+siml

31、式中,simg表示全局相似度,λ表示全局相似度的縮放權(quán)重,siml表示局部相似度。

32、進一步地,在所述小樣本古文字識別模型訓(xùn)練過程中,字符分類模塊的損失函數(shù)lce為:

33、

34、式中,nq表示查詢圖像的個數(shù),c表示類的數(shù)量,yqi表示第q個圖像的第i個類的真實標簽值,pqi表示分類識別模塊預(yù)測的第q個圖像屬于第i類的概率。

35、進一步地,在所述小樣本古文字識別模型訓(xùn)練過程中,所述對比學(xué)習(xí)模塊的損失函數(shù)為:

36、

37、式中,2nyi表示標簽為yi的圖像數(shù)量,1cond∈{0,1}表示當(dāng)條件滿足時取值為1,i≠j表示取不同的樣本,yi=y(tǒng)j表示兩個樣本的標簽相同,n表示支持集樣本數(shù)量,lij表示樣本i和j之間的損失,fi表示第i個樣本的特征向量,τ表示標量溫度參數(shù)。

38、本發(fā)明的有益效果為:

39、(1)本發(fā)明所提出的用于識別古文字的小樣本識別方法,在數(shù)據(jù)集cced和數(shù)據(jù)集oracle-241上的識別率都優(yōu)于現(xiàn)有相關(guān)方法;

40、(2)本發(fā)明所使用的數(shù)據(jù)增強效果相比于現(xiàn)有的常規(guī)數(shù)據(jù)增強方法,在古文字識別領(lǐng)域上有明顯的性能優(yōu)勢;

41、(3)本發(fā)明是一種適合于古文字識別任務(wù)的短時間學(xué)習(xí)方法,訓(xùn)練時間是比較短的;

42、(4)本發(fā)明在識別中國古文字上同時考慮到全局特征和局部特征,以及漢字的結(jié)構(gòu)特點和演變規(guī)律,針對古文字的特征提取具有創(chuàng)新性;

43、(5)本發(fā)明使用了數(shù)據(jù)量較少的數(shù)據(jù)集,得到了優(yōu)良的性能,很好地解決了古文字數(shù)據(jù)稀缺的問題。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
凯里市| 德清县| 邛崃市| 松滋市| 邹城市| 苏尼特左旗| 武邑县| 阳新县| 庐江县| 凤台县| 聂拉木县| 长葛市| 洛宁县| 色达县| 电白县| 陆丰市| 镇巴县| 滦平县| 阳高县| 呼玛县| 黑水县| 澄迈县| 冀州市| 双桥区| 迁安市| 宕昌县| 安泽县| 自贡市| 江北区| 承德县| 丰城市| 丰都县| 九龙坡区| 桐柏县| 新建县| 桐乡市| 泰兴市| 淄博市| 秭归县| 左云县| 石棉县|