欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種OCR識別模型訓練中的動態(tài)數據增強方法與流程

文檔序號:40521108發(fā)布日期:2024-12-31 13:30閱讀:10來源:國知局
一種OCR識別模型訓練中的動態(tài)數據增強方法與流程

本發(fā)明涉及文字訓練,具體為一種ocr識別模型訓練中的動態(tài)數據增強方法。


背景技術:

1、ocr識別模型是一種專門用于將圖像中的文字信息轉換為可編輯的文本格式的模型;它通過對圖像中的字符形狀、結構等特征進行分析和識別,從而將文字從圖像背景中提取出來。

2、其模型訓練識別時,一般優(yōu)先定義各種字符的模板,在識別時將輸入圖像中的字符與模板進行匹配;例如,對于數字0-9和字母a-z的手寫體或印刷體,都有對應的標準模板;識別過程中,計算輸入字符與各個模板之間的相似度,如采用最小距離法等度量方式,將最相似的模板對應的字符作為識別結果。

3、在ocr識別模型的實際應用場景下,常常會遇到動態(tài)圖像的文字提取與關聯(lián)識別任務。針對動態(tài)圖像進行關聯(lián)訓練時,傳統(tǒng)的做法通常是對圖像進行移動或者轉動操作,以此來確定用于訓練的特征,進而展開動態(tài)數據識別過程中的增強工作;然而,這種原始的增強方式存在一定的局限性。它僅僅側重于對圖像移動或者轉動這兩種單一情況的考量,并沒有針對動態(tài)圖像既可能發(fā)生移動同時又可能發(fā)生轉動的復雜綜合情況進行全面深入的分析;這種片面性致使在模型訓練過程中,針對動態(tài)數據增強的效果不盡如人意。


技術實現(xiàn)思路

1、針對現(xiàn)有技術的不足,本發(fā)明提供了一種ocr識別模型訓練中的動態(tài)數據增強方法,解決了沒有針對動態(tài)圖像既可能發(fā)生移動同時又可能發(fā)生轉動的復雜綜合情況進行全面深入的分析的問題。

2、為實現(xiàn)以上目的,本發(fā)明通過以下技術方案予以實現(xiàn):一種ocr識別模型訓練中的動態(tài)數據增強方法,包括以下步驟:

3、步驟一、基于所設定的訓練方向,此訓練方向包括水平移動方向以及旋轉方向,隨機選取一組訓練方向對此模型進行訓練,每次訓練過程中關聯(lián)的移動速度以及移動加速度均不同,針對于具體的訓練結果,確定達標方向或不達標方向,訓練方式為:

4、s11、將所設定的水平移動方向記作關聯(lián)方向,使訓練圖像向關聯(lián)方向移動,其每個不同移動階段所對應的移動初速度以及移動加速度均不同,其訓練圖像為預設圖像,其移動初速度以及移動加速度均由操作人員提前擬定,此水平移動方向存在一組或多組,故針對于每個不同的水平移動方向均需要記作關聯(lián)方向并進行相關處理;

5、s12、記錄對應移動階段所產出的文字數據,其文字數據包括文字以及時間值,此時間值為訓練圖像移動時開始至模型輸出文字時止之間的時段,將每個移動階段所產生的文字以及時間值均一一進行記錄,并基于本關聯(lián)方向所產生的大量文字數據,確認此關聯(lián)方向是否為達標方向,具體子步驟為:

6、s121、從大量文字數據中識別文字的準確率,將文字數據中的文字與標準文字比對,完全一致時確定準確的文字,其標準文字為提前預設的文字,將準確的文字標定為達標文字,記錄達標文字占比全部文字個數的占比率,其占比率=達標文字總數÷全部文字總數,若占比率≥97%,則代表本關聯(lián)方向文字識別達標,反之,代表其關聯(lián)方向文字識別不達標;

7、s122、再將所記錄的若干個不同移動階段所對應的時間值進行均值處理,確定關聯(lián)均值,若關聯(lián)均值≥y1,其中y1為預設值,代表本關聯(lián)方向時間間隔不達標,反之,代表其關聯(lián)方向時間間隔達標;

8、s123、將存在時間間隔以及文字識別同時達標的關聯(lián)方向標定為達標方向,反之,將對應的關聯(lián)方向標定為不達標方向,此達標方向為達標水平移動方向,此不達標方向為不達標水平移動方向;

9、針對于訓練方向為旋轉方向時模型的訓練方式為:

10、將所設定的旋轉方向記作關聯(lián)方向,使訓練圖像向關聯(lián)方向移動,其每個不同移動階段所對應的轉動初速度以及轉動加速度均不同,此旋轉方向存在一組或多組,故針對于每個不同的旋轉方向均需要記作關聯(lián)方向并進行相關處理,再采用步驟s12以及s121-s123相同的方式確認此關聯(lián)方向是否為達標方向,此達標方向為達標旋轉方向,此不達標方向為不達標旋轉方向;

11、步驟二、基于所確定的不達標方向,在此模型內確定此不達標方向所關聯(lián)的模型區(qū),通過對此模型區(qū)的原有深度以及寬度進行增強,并在增強過程中實時訓練,使不達標方向轉變?yōu)檫_標方向時停止增強,具體子步驟為:

12、s21、基于所確定的不達標方向,從此模型內鎖定關于此不達標方向對應的模型區(qū),并記錄此模型區(qū)的原有深度以及寬度,確認此不達標方向的不達標原因:

13、若不達標原因為文字識別不達標,則對此模型區(qū)的原有深度進行增強,新增此模型區(qū)內所不存在的卷積層,使卷積層的數量在原有基礎上得到增加,至不達標方向轉變?yōu)檫_標方向時停止新增;

14、若不達標原因為時間間隔不達標,則對此模型區(qū)的原有寬度進行增強,提升此模型區(qū)內神經元的個數,使神經元的個數在原有基礎上得到增加,至不達標方向轉變?yōu)檫_標方向時停止新增;

15、若不達標原因不僅存在文字識別不達標,同步存在時間間隔不達標時,則同步增強對應模型區(qū)的深度以及寬度,至不達標方向轉變?yōu)檫_標方向時停止增強;

16、步驟三、基于所確定的達標方向,從達標方向中確定融合方向,并基于所確定的融合方向對此模型進行融合訓練,優(yōu)先識別其訓練階段是否達標,若達標,則無需進行關聯(lián)增強,若未達標,則通過分配所關聯(lián)的cpu利用率進行關聯(lián)增強,具體子步驟為:

17、s31、從達標方向中隨機選取一組達標水平移動方向以及一組達標旋轉方向進行組合記作融合方向,使訓練圖像按照此達標水平移動方向進行移動的同時按照達標旋轉方向進行旋轉,其移動以及旋轉過程中的移動速度以及旋轉速度均提前設定,且每個不同移動階段所對應的移動速度以及旋轉速度均不同,此移動階段不設定移動加速度以及旋轉加速度;

18、s32、記錄對應移動階段所產出的時間值,其時間值為訓練圖像移動時開始至模型輸出文字時止之間的時段,并將每個不同移動階段所關聯(lián)的時間值進行均值處理,確定相關均值,并識別相關均值是否滿足:相關均值≥y2,其y2>y1,且y2為預設值;

19、若滿足,則代表此融合方向不達標,需進行關聯(lián)增強;

20、若未滿足,則代表此融合方向達標,無需進行任何處理;

21、針對于融合方向不達標時的關聯(lián)增強方式為:

22、s321、優(yōu)先記錄當前訓練時刻對應融合方向所占用的cpu利用率ly,從此模型的cpu緩沖區(qū)內進行關聯(lián)提取,此cpu緩沖區(qū)內的部分利用率屬于未被使用的資源,供訓練時進行調用,使ly進行提升,其提升的數值為一個單位的利用率,其單位為預設單位;

23、s322、識別ly提升一個單位的利用率后相關均值的變化差值:此變化差值=利用率提升前的相關均值-利用率提升后的相關均值,將所確定的變化差值標定為bz,再識別利用率提升前的相關均值與預設值y2之間的總差值zc,其zc=y2-利用率提升前的相關均值,采用zc÷bz=ts確認待提升的單位利用率,再將ly提升(ts-1)個單位的利用率,并鎖定提升后的相關均值jj:

24、若jj<y2,則逐步降低變化后的ly使jj滿足:jj<y2且y2與jj之間的差值最小,并鎖定停止時刻前一時刻所對應的ly值記作執(zhí)行值,后續(xù)依據此執(zhí)行值對此融合方向進行數據識別;

25、若jj=y2,則直接將當前時刻所提升的ly值作為執(zhí)行值,后續(xù)依據此執(zhí)行值對此融合方向進行數據識別;

26、若jj>y2,則再次逐步提升ly,并識別提升后對應的jj是否低于提升前對應的jj:

27、若是,則逐步提升ly至jj滿足:jj≤y2或jj不降低時止;

28、若否,則停止提升ly,并將當前時刻所提升的ly值作為執(zhí)行值,后續(xù)依據此執(zhí)行值對此融合方向進行數據識別。

29、本發(fā)明提供了一種ocr識別模型訓練中的動態(tài)數據增強方法。與現(xiàn)有技術相比具備以下有益效果:

30、本發(fā)明通過對所設定的訓練方向進行依次訓練,基于具體的訓練結果,識別其標準的達標方向以及不達標方向,基于所確定的不達標方向,對指定模型區(qū)的關聯(lián)深度以及寬度進行等比增強,基于具體的增強過程使對應的不達標方向轉變?yōu)檫_標方向,以此來提升此模型的綜合識別能力,對動態(tài)數據的識別能力進行初步增強;

31、后續(xù)基于所確認的達標方向,來確定對應的融合方向,再通過融合方向進行關聯(lián)訓練,并基于具體的訓練過程,確定對應的訓練數據,從訓練數據中識別其時間間隔是否達標,針對于不達標的情況,通過分配對應的cpu利用率的關聯(lián)方式,進行關聯(lián)增強,并基于具體的分配進程,使對應模型在對應融合方向上的訓練能力達到最佳狀態(tài),后續(xù)再次對此融合方向進行動態(tài)分析時,可充分保障其對應的分析能力,使動態(tài)數據的輸出能力達到最強狀態(tài)。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
福建省| 庆城县| 洛川县| 阿瓦提县| 南通市| 长白| 新沂市| 孟村| 洛扎县| 和林格尔县| 观塘区| 武汉市| 钟祥市| 绥中县| 北川| 安康市| 渑池县| 西峡县| 鲁山县| 曲阜市| 翼城县| 平遥县| 建湖县| 静乐县| 芒康县| 紫云| 达拉特旗| 凌云县| 卢湾区| 桃江县| 江华| 阿拉善左旗| 天气| 凤翔县| 阳朔县| 都昌县| 襄垣县| 十堰市| 越西县| 乐亭县| 积石山|