技術(shù)總結(jié)
本發(fā)明屬于計(jì)算機(jī)視覺領(lǐng)域,基于多層信息融合的注視點(diǎn)檢測(cè)方法。由顏色等底層信息得到底層信息檢測(cè)結(jié)果圖。利用像素點(diǎn)的空間位置得到中心先驗(yàn)圖。對(duì)原始圖像提取候選目標(biāo)框及其CNN深度特征,利用詞袋模型編碼,編碼后的視覺特征送入訓(xùn)練好的多示例RMI?SVM分類器中得到打分,對(duì)框中心高斯平滑后根據(jù)目標(biāo)框的打分進(jìn)行加權(quán)疊加得到目標(biāo)級(jí)別的檢測(cè)結(jié)果圖。對(duì)原始圖像本身提取描述圖像整體內(nèi)容的特征,訓(xùn)練softmax回歸器得到融合權(quán)值,采用這個(gè)權(quán)值對(duì)上述結(jié)果圖進(jìn)行加權(quán)融合。本發(fā)明綜合利用顏色對(duì)比度,顯著目標(biāo),空間位置這三方面信息,并針對(duì)不同的圖像調(diào)節(jié)各種信息占的比重,針對(duì)于包含各種內(nèi)容的圖像,本發(fā)明都有較好的檢測(cè)率。
技術(shù)研發(fā)人員:李建華;肖迪;盧湖川
受保護(hù)的技術(shù)使用者:大連理工大學(xué)
文檔號(hào)碼:201710024963
技術(shù)研發(fā)日:2017.01.16
技術(shù)公布日:2017.06.09