本發(fā)明涉及邊緣計算,尤其涉及一種基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理方法、系統(tǒng)、終端及計算機可讀存儲介質(zhì)。
背景技術(shù):
1、隨著人工智能和物聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,邊緣計算設(shè)備在處理實時、大規(guī)模數(shù)據(jù)方面(例如圖像識別、自然語言處理以及傳感器數(shù)據(jù)分析)發(fā)揮著越來越重要的作用。然而,邊緣設(shè)備有限的計算資源和存儲能力難以滿足深度學習模型的高性能需求。
2、為解決上述問題,現(xiàn)有技術(shù)中提出利用cuda(compute?unified?devicearchitecture,統(tǒng)一計算設(shè)備架構(gòu))在gpu(graphic?processing?unit,圖形處理器)上實現(xiàn)深度學習網(wǎng)絡(luò)的加速,但是現(xiàn)有技術(shù)中在邊緣端通過cuda來加速深度學習網(wǎng)絡(luò)模型的處理效率的方式存在模型優(yōu)化困難,計算性能低的問題,從而導(dǎo)致輸出的數(shù)據(jù)解析結(jié)果效率低以及準確度不高。
3、因此,現(xiàn)有技術(shù)還有待于改進和發(fā)展。
技術(shù)實現(xiàn)思路
1、本發(fā)明的主要目的在于提供一種基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理方法、系統(tǒng)、終端及計算機可讀存儲介質(zhì),旨在解決現(xiàn)有技術(shù)中在邊緣端通過cuda來加速深度學習網(wǎng)絡(luò)模型的處理效率存在優(yōu)化困難、計算性能低,從而導(dǎo)致輸出的數(shù)據(jù)解析結(jié)果效率低以及準確度不高的問題。
2、為實現(xiàn)上述目的,本發(fā)明提供一種基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理方法,所述基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理方法包括如下步驟:
3、獲取原始深度學習網(wǎng)絡(luò)模型,對所述原始深度學習網(wǎng)絡(luò)模型進行矢量轉(zhuǎn)換處理以及行向量計算處理,得到第一優(yōu)化結(jié)果;
4、對所述第一優(yōu)化結(jié)果進行量化加速處理,得到第二優(yōu)化結(jié)果;
5、對所述第二優(yōu)化結(jié)果進行間接緩沖區(qū)構(gòu)建處理,得到第三優(yōu)化結(jié)果;
6、根據(jù)所述第三優(yōu)化結(jié)果對所述原始深度學習網(wǎng)絡(luò)模型進行深度學習框架重構(gòu)處理,得到目標深度神經(jīng)網(wǎng)絡(luò)模型;
7、獲取目標圖像數(shù)據(jù),并將所述目標圖像數(shù)據(jù)輸入至所述目標深度神經(jīng)網(wǎng)絡(luò)模型,輸出目標圖像解析結(jié)果。
8、可選地,所述的基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理方法,其中,所述獲取原始深度學習網(wǎng)絡(luò)模型,對所述原始深度學習網(wǎng)絡(luò)模型進行矢量轉(zhuǎn)換處理以及行向量計算處理,得到第一優(yōu)化結(jié)果,具體包括:
9、獲取原始深度學習網(wǎng)絡(luò)模型以及目標三維數(shù)據(jù),并將所述目標三維數(shù)據(jù)輸入至所述原始深度學習網(wǎng)絡(luò)模型;
10、獲取圖像向量化函數(shù),并采用并行計算設(shè)備架構(gòu)編程對所述圖像向量化函數(shù)進行重寫處理,得到重寫圖像向量化函數(shù);
11、根據(jù)所述重寫圖像向量化函數(shù)對輸入所述原始深度學習網(wǎng)絡(luò)模型中的目標三維數(shù)據(jù)進行矢量轉(zhuǎn)換處理,得到目標二維矩陣;
12、采用通用矩陣乘法優(yōu)化策略對所述目標二維矩陣進行行向量計算處理,得到第一優(yōu)化結(jié)果。
13、可選地,所述的基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理方法,其中,所述對所述第一優(yōu)化結(jié)果進行量化加速處理,得到第二優(yōu)化結(jié)果,具體包括:
14、獲取量化神經(jīng)網(wǎng)絡(luò)包,并根據(jù)所述量化神經(jīng)網(wǎng)絡(luò)包構(gòu)建微內(nèi)核基元;
15、采用高性能矩陣乘法根據(jù)所述微內(nèi)核基元對所述第一優(yōu)化結(jié)果進行量化加速處理,得到第二優(yōu)化結(jié)果。
16、可選地,所述的基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理方法,其中,所述對所述第二優(yōu)化結(jié)果進行間接緩沖區(qū)構(gòu)建處理,得到第三優(yōu)化結(jié)果,具體包括:
17、獲取所述原始深度學習網(wǎng)絡(luò)模型的輸入緩沖區(qū),并采用間接卷積算法根據(jù)所述輸入緩沖區(qū)構(gòu)建得到間接緩沖區(qū);
18、采用指針模擬方法根據(jù)所述間接緩沖區(qū)對所述第二優(yōu)化結(jié)果進行訪存模擬處理,得到第三優(yōu)化結(jié)果。
19、可選地,所述的基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理方法,其中,所述根據(jù)所述第三優(yōu)化結(jié)果對所述原始深度學習網(wǎng)絡(luò)模型進行深度學習框架重構(gòu)處理,得到目標深度神經(jīng)網(wǎng)絡(luò)模型,具體包括:
20、獲取深度學習推理參數(shù),根據(jù)所述深度學習推理參數(shù)對所述第三優(yōu)化結(jié)果進行矩陣矢量化處理,得到矢量化結(jié)果,其中,所述深度學習推理參數(shù)包括工作空間大小、輸入圖像矩陣格式以及量化浮點操作;
21、根據(jù)所述并行計算設(shè)備架構(gòu)編程對所述矢量化結(jié)果進行深度學習框架重構(gòu)處理,得到目標深度神經(jīng)網(wǎng)絡(luò)框架。
22、可選地,所述的基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理方法,其中,所述獲取目標圖像數(shù)據(jù),并將所述目標圖像數(shù)據(jù)輸入至所述目標深度神經(jīng)網(wǎng)絡(luò)模型,輸出目標圖像解析結(jié)果,具體包括:
23、獲取目標圖像數(shù)據(jù),并將所述目標圖像數(shù)據(jù)輸入至所述目標深度神經(jīng)網(wǎng)絡(luò)模型;
24、通過所述目標深度神經(jīng)網(wǎng)絡(luò)模型對所述目標圖像數(shù)據(jù)進行圖像解析處理,輸出目標圖像解析結(jié)果。
25、可選地,所述的基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理方法,其中,所述通用矩陣乘法優(yōu)化策略包括地址偏移處理、簡化循環(huán)處理以及內(nèi)存對齊處理。
26、此外,為實現(xiàn)上述目的,本發(fā)明還提供一種基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理系統(tǒng),其中,所述基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理系統(tǒng)包括:
27、第一優(yōu)化處理模塊,用于獲取原始深度學習網(wǎng)絡(luò)模型,對所述原始深度學習網(wǎng)絡(luò)模型進行矢量轉(zhuǎn)換處理以及行向量計算處理,得到第一優(yōu)化結(jié)果;
28、第二優(yōu)化處理模塊,用于對所述第一優(yōu)化結(jié)果進行量化加速處理,得到第二優(yōu)化結(jié)果;
29、第三優(yōu)化處理模塊,用于對所述第二優(yōu)化結(jié)果進行間接緩沖區(qū)構(gòu)建處理,得到第三優(yōu)化結(jié)果;
30、深度學習框架重構(gòu)模塊,用于根據(jù)所述第三優(yōu)化結(jié)果對所述原始深度學習網(wǎng)絡(luò)模型進行深度學習框架重構(gòu)處理,得到目標深度神經(jīng)網(wǎng)絡(luò)模型;
31、圖像結(jié)果輸出模塊,用于獲取目標圖像數(shù)據(jù),并將所述目標圖像數(shù)據(jù)輸入至所述目標深度神經(jīng)網(wǎng)絡(luò)模型,輸出目標圖像解析結(jié)果。
32、此外,為實現(xiàn)上述目的,本發(fā)明還提供一種終端,其中,所述終端包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理程序,所述基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理程序被所述處理器執(zhí)行時實現(xiàn)如上所述的基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理方法的步驟。
33、此外,為實現(xiàn)上述目的,本發(fā)明還提供一種計算機可讀存儲介質(zhì),其中,所述計算機可讀存儲介質(zhì)存儲有基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理程序,所述基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理程序被處理器執(zhí)行時實現(xiàn)如上所述的基于邊緣計算的深度學習網(wǎng)絡(luò)模型的圖像處理方法的步驟。
34、本發(fā)明中,獲取原始深度學習網(wǎng)絡(luò)模型,對所述原始深度學習網(wǎng)絡(luò)模型進行矢量轉(zhuǎn)換處理以及行向量計算處理,得到第一優(yōu)化結(jié)果;對所述第一優(yōu)化結(jié)果進行量化加速處理,得到第二優(yōu)化結(jié)果;對所述第二優(yōu)化結(jié)果進行間接緩沖區(qū)構(gòu)建處理,得到第三優(yōu)化結(jié)果;根據(jù)所述第三優(yōu)化結(jié)果對所述原始深度學習網(wǎng)絡(luò)模型進行深度學習框架重構(gòu)處理,得到目標深度神經(jīng)網(wǎng)絡(luò)模型;獲取目標圖像數(shù)據(jù),并將所述目標圖像數(shù)據(jù)輸入至所述目標深度神經(jīng)網(wǎng)絡(luò)模型,輸出目標圖像解析結(jié)果。本發(fā)明基于gemm(通用矩陣乘法)矢量計算、cuda(并行計算設(shè)備架構(gòu))量化編程和tensorrt(深度學習推理參數(shù))張量推理等技術(shù)性處理,有效地解決了現(xiàn)有技術(shù)中在邊緣計算cuda加速深度學習網(wǎng)絡(luò)模型的學習成本高、邊緣設(shè)備計算性能低和模型優(yōu)化困難等問題。同時,實現(xiàn)了深度學習模型在邊緣計算設(shè)備中實時計算、快速高效的學習推理任務(wù),有效提高了圖像數(shù)據(jù)在邊緣端的處理效率以及準確性。