技術特征:
技術總結
本發(fā)明的各實施例總體上涉及使用弱監(jiān)督為圖像配字幕。具體地,本文中描述了用于使用弱監(jiān)督為圖像配字幕的技術。在實現(xiàn)中,獲取關于目標圖像的弱監(jiān)督數(shù)據(jù)并且使用其提供補充被獲得用于圖像配字幕的全局圖像概念的細節(jié)信息。弱監(jiān)督數(shù)據(jù)是指沒有被緊密地監(jiān)管并且可能包括誤差的噪聲數(shù)據(jù)。給定目標圖像,可以從弱注釋的圖像的源、諸如在線社交網(wǎng)絡采集在視覺上相似的圖像的弱監(jiān)督數(shù)據(jù)。通常,在線發(fā)布的圖像包括由用戶添加的標簽、標題、標注和短描述形式的“弱”注釋。通過提取在不同源中發(fā)現(xiàn)的在視覺上相似的圖像的關鍵詞來生成目標圖像的弱監(jiān)督數(shù)據(jù)。然后在圖像配字幕分析期間采用弱監(jiān)督數(shù)據(jù)中包括的關鍵詞來調(diào)制被應用于概率分類的權重。
技術研發(fā)人員:王兆聞;尤全增;金海琳;方晨
受保護的技術使用者:奧多比公司
技術研發(fā)日:2016.11.11
技術公布日:2017.07.21