1. 基于FPGA+ARM多層卷積神經(jīng)網(wǎng)絡(luò)的手寫體字符識(shí)別方法,其特征在于:基于一個(gè)6層卷積神經(jīng)網(wǎng)絡(luò)模型,該卷積神經(jīng)網(wǎng)絡(luò)模型包括:1個(gè)輸入層,2個(gè)卷積層,2個(gè)池化層,1個(gè)全連接層;卷積核大小為5×5,卷積核滑動(dòng)步長(zhǎng)為1;池化層采用均值法,其滑動(dòng)窗口大小為2×2,滑動(dòng)步長(zhǎng)為2;其中,卷積層和池化層的計(jì)算在FPGA端實(shí)現(xiàn),輸入層和全連接層的計(jì)算在ARM端實(shí)現(xiàn);具體步驟為:
步驟一、模型參數(shù)處理與加載
(1)離線訓(xùn)練所使用的多層卷積神經(jīng)網(wǎng)絡(luò)模型;
(2)算法模型離線訓(xùn)練完畢后,將卷積層的參數(shù)包括卷積核與偏置量取負(fù),并保存在ARM端;
(3)系統(tǒng)運(yùn)行后,首先加載算法模型參數(shù),并通過APB總線傳輸并緩存至FPGA端;
步驟二、待識(shí)別圖像預(yù)處理
(1)選擇待識(shí)別的手寫字符體圖像;
(2)對(duì)輸入圖像進(jìn)行歸一化處理,使其滿足模型的計(jì)算需要;
(3)ARM端將歸一化結(jié)果通過APB總線傳輸?shù)紽PGA端,經(jīng)FIFO緩存后,存放到Block RAM(塊隨機(jī)存儲(chǔ)器)中;
步驟三、卷積和池化計(jì)算
在FPGA端對(duì)輸入圖像數(shù)據(jù)進(jìn)行卷積層和池化層計(jì)算,算法模型設(shè)定有2個(gè)卷積層和2個(gè)池化層,具體步驟為:
(1)第1個(gè)卷積層與池化層計(jì)算
對(duì)圖像數(shù)據(jù)與網(wǎng)絡(luò)模型中第1個(gè)卷積層的卷積核進(jìn)行卷積計(jì)算,將結(jié)果矩陣的各元素加上網(wǎng)絡(luò)模型第1層的偏置參數(shù),利用網(wǎng)絡(luò)模型中的激活函數(shù)Sigmoid激活, 激活函數(shù)Sigmoid的數(shù)學(xué)公式如下:
(1)
第1個(gè)卷積層采用1個(gè)卷積核,大小為5×5的矩陣;卷積時(shí),滑動(dòng)窗尺度與卷積核大小相同,橫向與縱向滑動(dòng)步長(zhǎng)均為1;
然后對(duì)第1個(gè)卷積層計(jì)算結(jié)果進(jìn)行池化計(jì)算,采用平均值池化方法,滑動(dòng)窗尺度為2×2,步長(zhǎng)為2,將滑動(dòng)窗口中的4個(gè)數(shù)值相加后取均值;將第1個(gè)卷積層結(jié)果將存入Block RAM;
(2)第2個(gè)卷積層與池化層計(jì)算
將第1個(gè)池化層計(jì)算結(jié)果矩陣作為第2個(gè)卷積層計(jì)算的輸入數(shù)據(jù),參照第(1)步的實(shí)現(xiàn)過程,進(jìn)行第2個(gè)卷積層和第2個(gè)池化層計(jì)算;將第2個(gè)池化層結(jié)果存入Block RAM;
步驟四、分類識(shí)別計(jì)算
(1)特征向量從FPGA端傳回ARM端
在FPGA端,將兩層卷積計(jì)算與池化計(jì)算的結(jié)果,即輸入圖像的特征向量傳回ARM端;具體步驟為:將Block RAM中存儲(chǔ)的結(jié)果矩陣,經(jīng)過FIFO緩存后,通過APB總線傳輸回ARM端;
(2)Softmax計(jì)算獲得識(shí)別結(jié)果
第(1)步返回的特征向量與網(wǎng)絡(luò)模型中的Softmax相關(guān)數(shù)據(jù)進(jìn)行計(jì)算并得出結(jié)果;具體步驟為:用Softmax權(quán)值參數(shù)矩陣乘以特征向量,加上Softmax偏置參數(shù),并通過公式(1)的Sigmoid函數(shù)計(jì)算,在結(jié)果中取最大值對(duì)應(yīng)的索引作為結(jié)果輸出;
(3)往復(fù)循環(huán),實(shí)現(xiàn)多個(gè)手寫體字符圖像的識(shí)別。