本發(fā)明涉及圖像處理,尤其涉及一種紙張紋理圖像生成方法及裝置。
背景技術(shù):
1、隨著計(jì)算機(jī)視覺(jué)的發(fā)展,文本檢測(cè)是計(jì)算機(jī)視覺(jué)的一個(gè)重要的應(yīng)用領(lǐng)域。文本檢測(cè)是基于深度學(xué)習(xí)模型對(duì)帶有紙張紋理的文本圖像進(jìn)行檢測(cè),深度學(xué)習(xí)模型關(guān)注帶有紙張紋理的文本圖像的局部特征,使得文本檢測(cè)具有較好的效果。然而,深度學(xué)習(xí)模型需要大量的訓(xùn)練數(shù)據(jù)支撐才能取得良好的效果。
2、相關(guān)技術(shù)中,渲染紙張紋理圖像的方法包括:第一種方法,使用建模軟件(例如三維圖形圖像軟件(blender))渲染出紙張紋理;第二種方法,使用空白的紙張圖像作為底圖,在紙張圖像上渲染文字。然而,第一種方法很難渲染出紙張背面文字通過(guò)紙張顯現(xiàn)在紙張正面的效果的紙張紋理圖像,第二種方法需要人工收集大量空白的紙張圖像,或者提前使用第一種方法渲染出大量空白的紙張圖像。
3、而現(xiàn)實(shí)是在文檔圖像上進(jìn)行文本檢測(cè)任務(wù)時(shí),由于紙張圖像背面的文字以及紙張圖像底面的文字對(duì)紙張圖像正面的文字檢測(cè)存在影響較大的干擾。雖然上述第二種方法通過(guò)收集空白的紙張圖像作為底圖的方法,能有效地解決此類問(wèn)題,但是由于收集的底圖數(shù)量和多樣性不足,導(dǎo)致模型的泛化能力比較弱,從而導(dǎo)致文本檢測(cè)的準(zhǔn)確性低。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種紙張紋理圖像生成方法及裝置,用以解決由于收集的底圖數(shù)量和多樣性不足,導(dǎo)致模型的泛化能力比較弱,從而導(dǎo)致文本檢測(cè)的準(zhǔn)確性低的問(wèn)題。
2、本發(fā)明提供一種紙張紋理圖像生成方法,包括:
3、分別對(duì)第一紙張圖像和第二紙張圖像進(jìn)行預(yù)處理,得到所述第一紙張圖像對(duì)應(yīng)的第三紙張圖像和所述第二紙張圖像對(duì)應(yīng)的第四紙張圖像;所述第一紙張圖像為紙張背面是空白的圖像,所述第三紙張圖像用于作為紙張紋理圖像的正面圖像,所述第四紙張圖像用于作為所述紙張紋理圖像的背面圖像;
4、對(duì)所述第四紙張圖像進(jìn)行模糊處理,得到模糊圖像;
5、對(duì)所述第三紙張圖像進(jìn)行歸一化處理,得到歸一化圖像;
6、基于所述模糊圖像和所述歸一化圖像,生成所述紙張紋理圖像。
7、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法,所述對(duì)所述第四紙張圖像進(jìn)行模糊處理,得到模糊圖像,包括以下任一項(xiàng):
8、對(duì)所述第四紙張圖像進(jìn)行高斯模糊,得到高斯模糊圖像;所述高斯模糊圖像用于作為所述模糊圖像;
9、對(duì)所述第四紙張圖像進(jìn)行中值模糊,得到中值模糊圖像;所述中值模糊圖像用于作為所述模糊圖像;
10、對(duì)所述第四紙張圖像進(jìn)行高斯模糊,得到高斯模糊圖像;對(duì)所述第四紙張圖像進(jìn)行中值模糊,得到中值模糊圖像;基于所述高斯模糊圖像和所述中值模糊圖像,確定所述模糊圖像。
11、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法,所述基于所述高斯模糊圖像和所述中值模糊圖像,確定所述模糊圖像,包括:
12、確定所述高斯模糊圖像對(duì)應(yīng)的第一比例和所述中值模糊圖像對(duì)應(yīng)的第二比例;所述第一比例和所述第二比例之和為預(yù)設(shè)閾值;
13、將所述高斯模糊圖像中每個(gè)像素點(diǎn)的像素值和所述第一比例相乘,得到每個(gè)像素點(diǎn)對(duì)應(yīng)的第一乘積;
14、將所述中值模糊圖像中每個(gè)像素點(diǎn)的像素值和所述第二比例相乘,得到每個(gè)像素點(diǎn)對(duì)應(yīng)的第二乘積;
15、基于所述第一乘積和所述第二乘積,確定所述模糊圖像。
16、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法,將同一位置像素點(diǎn)對(duì)應(yīng)的所述第一乘積和所述第二乘積進(jìn)行相加,得到所述同一位置像素點(diǎn)對(duì)應(yīng)的和值;
17、基于各所述和值,確定所述模糊圖像。
18、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法,所述對(duì)所述第三紙張圖像進(jìn)行歸一化處理,得到歸一化圖像,包括:
19、將所述第三紙張圖像中每個(gè)像素點(diǎn)的像素值除以所述第三紙張圖像的色彩深度值,得到每個(gè)像素點(diǎn)的歸一化值;
20、基于每個(gè)像素點(diǎn)的歸一化值,確定所述歸一化圖像。
21、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法,所述基于所述模糊圖像和所述歸一化圖像,生成所述紙張紋理圖像,包括:
22、將所述模糊圖像中每個(gè)像素點(diǎn)的像素值和所述歸一化圖像中同一位置像素點(diǎn)的像素值相乘,得到每個(gè)像素點(diǎn)的乘積;
23、基于每個(gè)像素點(diǎn)的乘積,確定所述紙張紋理圖像。
24、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法,所述分別對(duì)所述第一紙張圖像和所述第二紙張圖像進(jìn)行預(yù)處理,得到所述第一紙張圖像對(duì)應(yīng)的第三紙張圖像和所述第二紙張圖像對(duì)應(yīng)的第四紙張圖像,包括:
25、分別對(duì)所述第一紙張圖像和所述第二紙張圖像進(jìn)行格式統(tǒng)一處理,得到所述第一紙張圖像對(duì)應(yīng)的第五紙張圖像和所述第二紙張圖像對(duì)應(yīng)的第六紙張圖像;
26、對(duì)所述第五紙張圖像添加噪聲,得到所述第三紙張圖像;
27、對(duì)所述第六紙張圖像進(jìn)行翻轉(zhuǎn)處理,得到所述第四紙張圖像。
28、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法,所述分別對(duì)所述第一紙張圖像和所述第二紙張圖像進(jìn)行格式統(tǒng)一處理,得到所述第一紙張圖像對(duì)應(yīng)的第五紙張圖像和所述第二紙張圖像對(duì)應(yīng)的第六紙張圖像,包括:
29、分別對(duì)所述第一紙張圖像和/或所述第二紙張圖像進(jìn)行旋轉(zhuǎn);
30、對(duì)旋轉(zhuǎn)后的第一紙張圖像進(jìn)行裁剪,得到所述第一紙張圖像對(duì)應(yīng)的第五紙張圖像;
31、對(duì)旋轉(zhuǎn)后的第二紙張圖像進(jìn)行裁剪,得到所述第二紙張圖像對(duì)應(yīng)的第六紙張圖像。
32、根據(jù)本發(fā)明提供的一種紙張紋理圖像生成方法,所述對(duì)所述第五紙張圖像添加噪聲,得到所述第三紙張圖像,包括:
33、對(duì)所述第五紙張圖像添加噪聲,得到噪聲圖像;
34、降低所述噪聲圖像的亮度,得到所述第三紙張圖像。
35、本發(fā)明還提供一種紙張紋理圖像生成裝置,包括:
36、預(yù)處理模塊,用于分別對(duì)第一紙張圖像和第二紙張圖像進(jìn)行預(yù)處理,得到所述第一紙張圖像對(duì)應(yīng)的第三紙張圖像和所述第二紙張圖像對(duì)應(yīng)的第四紙張圖像;所述第一紙張圖像為紙張背面是空白的圖像,所述第三紙張圖像用于作為紙張紋理圖像的正面圖像,所述第四紙張圖像用于作為所述紙張紋理圖像的背面圖像;
37、模糊處理模塊,用于對(duì)所述第四紙張圖像進(jìn)行模糊處理,得到模糊圖像;
38、歸一化處理模塊,用于對(duì)所述第三紙張圖像進(jìn)行歸一化處理,得到歸一化圖像;
39、生成模塊,用于基于所述模糊圖像和所述歸一化圖像,生成所述紙張紋理圖像。
40、本發(fā)明還提供一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如上述任一種所述紙張紋理圖像生成方法。
41、本發(fā)明還提供一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述紙張紋理圖像生成方法。
42、本發(fā)明還提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述紙張紋理圖像生成方法。
43、本發(fā)明提供的紙張紋理圖像生成方法及裝置,通過(guò)分別對(duì)第一紙張圖像和第二紙張圖像進(jìn)行預(yù)處理,得到第一紙張圖像對(duì)應(yīng)的第三紙張圖像和第二紙張圖像對(duì)應(yīng)的第四紙張圖像;由于第三紙張圖像用于作為紙張紋理圖像的正面圖像,第四紙張圖像用于作為紙張紋理圖像的背面圖像,對(duì)第四紙張圖像進(jìn)行模糊處理,模擬不同的紙張厚度下紙張背面文字對(duì)紙張正面的影響;對(duì)第三紙張圖像進(jìn)行歸一化處理,使得紙張紋理圖像的正面更加均勻,進(jìn)而實(shí)現(xiàn)了紙張紋理圖像的生成,在生成用于文本檢測(cè)模型訓(xùn)練的紙張紋理圖像時(shí),能夠使得生成的紙張紋理圖像更加多樣化,擴(kuò)大了模型訓(xùn)練的樣本圖像的多樣性和數(shù)量,進(jìn)而在使用紙張紋理圖像對(duì)模型進(jìn)行訓(xùn)練時(shí),能夠提升模型的泛化能力,從而可以提升文本檢測(cè)的準(zhǔn)確性。