技術編號:40599774
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明屬于視覺問答,尤其涉及一種基于環(huán)境感知和知識庫的視覺問答方法。背景技術、視覺問答(visual?question?answer)是一種融合計算機視覺和自然語言處理的交叉學科任務,其主要目的是讓機器能夠基于圖像或視頻內容回答自然語言的問題。首先,傳統(tǒng)的視覺問答系統(tǒng)在面對復雜或動態(tài)環(huán)境時表現出一定的局限性。年garderes等使用conceptnet作為知識源,并將實體信息嵌入到語言的表示中。年cheng等人利用雙線性池化的方法把外部知識嵌入圖像表達之中。年liu等人...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。