紙張紋理圖像生成方法及裝置與流程

文檔序號(hào)：40620446發(fā)布日期：2025-01-10 18:26閱讀：3來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及圖像處理，尤其涉及一種紙張紋理圖像生成方法及裝置。

背景技術(shù)：

1、隨著計(jì)算機(jī)視覺(jué)的發(fā)展，文本檢測(cè)是計(jì)算機(jī)視覺(jué)的一個(gè)重要的應(yīng)用領(lǐng)域。文本檢測(cè)是基于深度學(xué)習(xí)模型對(duì)帶有紙張紋理的文本圖像進(jìn)行檢測(cè)，深度學(xué)習(xí)模型關(guān)注帶有紙張紋理的文本圖像的局部特征，使得文本檢測(cè)具有較好的效果。然而，深度學(xué)習(xí)模型需要大量的訓(xùn)練數(shù)據(jù)支撐才能取得良好的效果。

2、相關(guān)技術(shù)中，渲染紙張紋理圖像的方法包括：第一種方法，使用建模軟件(例如三維圖形圖像軟件(blender))渲染出紙張紋理；第二種方法，使用空白的紙張圖像作為底圖，在紙張圖像上渲染文字。然而，第一種方法很難渲染出紙張背面文字通過(guò)紙張顯現(xiàn)在紙張正面的效果的紙張紋理圖像，第二種方法需要人工收集大量空白的紙張圖像，或者提前使用第一種方法渲染出大量空白的紙張圖像。

3、而現(xiàn)實(shí)是在文檔圖像上進(jìn)行文本檢測(cè)任務(wù)時(shí)，由于紙張圖像背面的文字以及紙張圖像底面的文字對(duì)紙張圖像正面的文字檢測(cè)存在影響較大的干擾。雖然上述第二種方法通過(guò)收集空白的紙張圖像作為底圖的方法，能有效地解決此類問(wèn)題，但是由于收集的底圖數(shù)量和多樣性不足，導(dǎo)致模型的泛化能力比較弱，從而導(dǎo)致文本檢測(cè)的準(zhǔn)確性低。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明提供一種紙張紋理圖像生成方法及裝置，用以解決由于收集的底圖數(shù)量和多樣性不足，導(dǎo)致模型的泛化能力比較弱，從而導(dǎo)致文本檢測(cè)的準(zhǔn)確性低的問(wèn)題。

2、本發(fā)明提供一種紙張紋理圖像生成方法，包括：

3、分別對(duì)第一紙張圖像和第二紙張圖像進(jìn)行預(yù)處理，得到所述第一紙張圖像對(duì)應(yīng)的第三紙張圖像和所述第二紙張圖像對(duì)應(yīng)的第四紙張圖像；所述第一紙張圖像為紙張背面是空白的圖像，所述第三紙張圖像用于作為紙張紋理圖像的正面圖像，所述第四紙張圖像用于作為所述紙張紋理圖像的背面圖像；

4、對(duì)所述第四紙張圖像進(jìn)行模糊處理，得到模糊圖像；

5、對(duì)所述第三紙張圖像進(jìn)行歸一化處理，得到歸一化圖像；

6、基于所述模糊圖像和所述歸一化圖像，生成所述紙張紋理圖像。

7、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法，所述對(duì)所述第四紙張圖像進(jìn)行模糊處理，得到模糊圖像，包括以下任一項(xiàng)：

8、對(duì)所述第四紙張圖像進(jìn)行高斯模糊，得到高斯模糊圖像；所述高斯模糊圖像用于作為所述模糊圖像；

9、對(duì)所述第四紙張圖像進(jìn)行中值模糊，得到中值模糊圖像；所述中值模糊圖像用于作為所述模糊圖像；

10、對(duì)所述第四紙張圖像進(jìn)行高斯模糊，得到高斯模糊圖像；對(duì)所述第四紙張圖像進(jìn)行中值模糊，得到中值模糊圖像；基于所述高斯模糊圖像和所述中值模糊圖像，確定所述模糊圖像。

11、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法，所述基于所述高斯模糊圖像和所述中值模糊圖像，確定所述模糊圖像，包括：

12、確定所述高斯模糊圖像對(duì)應(yīng)的第一比例和所述中值模糊圖像對(duì)應(yīng)的第二比例；所述第一比例和所述第二比例之和為預(yù)設(shè)閾值；

13、將所述高斯模糊圖像中每個(gè)像素點(diǎn)的像素值和所述第一比例相乘，得到每個(gè)像素點(diǎn)對(duì)應(yīng)的第一乘積；

14、將所述中值模糊圖像中每個(gè)像素點(diǎn)的像素值和所述第二比例相乘，得到每個(gè)像素點(diǎn)對(duì)應(yīng)的第二乘積；

15、基于所述第一乘積和所述第二乘積，確定所述模糊圖像。

16、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法，將同一位置像素點(diǎn)對(duì)應(yīng)的所述第一乘積和所述第二乘積進(jìn)行相加，得到所述同一位置像素點(diǎn)對(duì)應(yīng)的和值；

17、基于各所述和值，確定所述模糊圖像。

18、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法，所述對(duì)所述第三紙張圖像進(jìn)行歸一化處理，得到歸一化圖像，包括：

19、將所述第三紙張圖像中每個(gè)像素點(diǎn)的像素值除以所述第三紙張圖像的色彩深度值，得到每個(gè)像素點(diǎn)的歸一化值；

20、基于每個(gè)像素點(diǎn)的歸一化值，確定所述歸一化圖像。

21、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法，所述基于所述模糊圖像和所述歸一化圖像，生成所述紙張紋理圖像，包括：

22、將所述模糊圖像中每個(gè)像素點(diǎn)的像素值和所述歸一化圖像中同一位置像素點(diǎn)的像素值相乘，得到每個(gè)像素點(diǎn)的乘積；

23、基于每個(gè)像素點(diǎn)的乘積，確定所述紙張紋理圖像。

24、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法，所述分別對(duì)所述第一紙張圖像和所述第二紙張圖像進(jìn)行預(yù)處理，得到所述第一紙張圖像對(duì)應(yīng)的第三紙張圖像和所述第二紙張圖像對(duì)應(yīng)的第四紙張圖像，包括：

25、分別對(duì)所述第一紙張圖像和所述第二紙張圖像進(jìn)行格式統(tǒng)一處理，得到所述第一紙張圖像對(duì)應(yīng)的第五紙張圖像和所述第二紙張圖像對(duì)應(yīng)的第六紙張圖像；

26、對(duì)所述第五紙張圖像添加噪聲，得到所述第三紙張圖像；

27、對(duì)所述第六紙張圖像進(jìn)行翻轉(zhuǎn)處理，得到所述第四紙張圖像。

28、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法，所述分別對(duì)所述第一紙張圖像和所述第二紙張圖像進(jìn)行格式統(tǒng)一處理，得到所述第一紙張圖像對(duì)應(yīng)的第五紙張圖像和所述第二紙張圖像對(duì)應(yīng)的第六紙張圖像，包括：

29、分別對(duì)所述第一紙張圖像和/或所述第二紙張圖像進(jìn)行旋轉(zhuǎn)；

30、對(duì)旋轉(zhuǎn)后的第一紙張圖像進(jìn)行裁剪，得到所述第一紙張圖像對(duì)應(yīng)的第五紙張圖像；

31、對(duì)旋轉(zhuǎn)后的第二紙張圖像進(jìn)行裁剪，得到所述第二紙張圖像對(duì)應(yīng)的第六紙張圖像。

32、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法，所述對(duì)所述第五紙張圖像添加噪聲，得到所述第三紙張圖像，包括：

33、對(duì)所述第五紙張圖像添加噪聲，得到噪聲圖像；

34、降低所述噪聲圖像的亮度，得到所述第三紙張圖像。

35、本發(fā)明還提供一種紙張紋理圖像生成裝置，包括：

36、預(yù)處理模塊，用于分別對(duì)第一紙張圖像和第二紙張圖像進(jìn)行預(yù)處理，得到所述第一紙張圖像對(duì)應(yīng)的第三紙張圖像和所述第二紙張圖像對(duì)應(yīng)的第四紙張圖像；所述第一紙張圖像為紙張背面是空白的圖像，所述第三紙張圖像用于作為紙張紋理圖像的正面圖像，所述第四紙張圖像用于作為所述紙張紋理圖像的背面圖像；

37、模糊處理模塊，用于對(duì)所述第四紙張圖像進(jìn)行模糊處理，得到模糊圖像；

38、歸一化處理模塊，用于對(duì)所述第三紙張圖像進(jìn)行歸一化處理，得到歸一化圖像；

39、生成模塊，用于基于所述模糊圖像和所述歸一化圖像，生成所述紙張紋理圖像。

40、本發(fā)明還提供一種電子設(shè)備，包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序，所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如上述任一種所述紙張紋理圖像生成方法。

41、本發(fā)明還提供一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述紙張紋理圖像生成方法。

42、本發(fā)明還提供一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述紙張紋理圖像生成方法。

43、本發(fā)明提供的紙張紋理圖像生成方法及裝置，通過(guò)分別對(duì)第一紙張圖像和第二紙張圖像進(jìn)行預(yù)處理，得到第一紙張圖像對(duì)應(yīng)的第三紙張圖像和第二紙張圖像對(duì)應(yīng)的第四紙張圖像；由于第三紙張圖像用于作為紙張紋理圖像的正面圖像，第四紙張圖像用于作為紙張紋理圖像的背面圖像，對(duì)第四紙張圖像進(jìn)行模糊處理，模擬不同的紙張厚度下紙張背面文字對(duì)紙張正面的影響；對(duì)第三紙張圖像進(jìn)行歸一化處理，使得紙張紋理圖像的正面更加均勻，進(jìn)而實(shí)現(xiàn)了紙張紋理圖像的生成，在生成用于文本檢測(cè)模型訓(xùn)練的紙張紋理圖像時(shí)，能夠使得生成的紙張紋理圖像更加多樣化，擴(kuò)大了模型訓(xùn)練的樣本圖像的多樣性和數(shù)量，進(jìn)而在使用紙張紋理圖像對(duì)模型進(jìn)行訓(xùn)練時(shí)，能夠提升模型的泛化能力，從而可以提升文本檢測(cè)的準(zhǔn)確性。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：林露樾,段紀(jì)偉,黃達(dá)一
技術(shù)所有人：珠海金山辦公軟件有限公司
我是此專利的發(fā)明人

上一篇：一種數(shù)控鏜銑加工中心的定位鎖定裝置的制作方法
上一篇：掃描頭的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

紙張紋理圖像生成方法及裝置與流程