一種基于環(huán)境感知和知識(shí)庫(kù)的視覺(jué)問(wèn)答方法

文檔序號(hào)：40599774發(fā)布日期：2025-01-07 20:40閱讀：來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>一種基于環(huán)境感知和知識(shí)庫(kù)的視覺(jué)問(wèn)答方法

技術(shù)特征：

1.一種基于環(huán)境感知和知識(shí)庫(kù)的視覺(jué)問(wèn)答方法，其特征包括以下步驟：

2.根據(jù)權(quán)利要求1所述的一種基于環(huán)境感知和知識(shí)庫(kù)的視覺(jué)問(wèn)答方法，其特征在于，所述步驟1中，將輸入的圖像調(diào)整到固定尺寸（224×224），該過(guò)程包括圖像的裁剪、縮放和填充;對(duì)調(diào)整后的圖像進(jìn)行像素值的歸一化處理，將其標(biāo)準(zhǔn)化到一個(gè)固定的范圍[-1,1];

3.根據(jù)權(quán)利要求1所述的一種基于環(huán)境感知和知識(shí)庫(kù)的視覺(jué)問(wèn)答方法，其特征在于，所述步驟2中，對(duì)用戶輸入的問(wèn)題進(jìn)行文本規(guī)范化處理，以去除多余的空格和標(biāo)準(zhǔn)化標(biāo)點(diǎn)符號(hào)，并將文本統(tǒng)一為小寫(xiě)；使用bert的分詞器將輸入的問(wèn)題分解為子詞單元，以處理未登錄詞和詞綴;

4.根據(jù)權(quán)利要求1所述的一種基于環(huán)境感知和知識(shí)庫(kù)的視覺(jué)問(wèn)答方法，其特征在于，所述步驟3中，使用傳感器網(wǎng)絡(luò)獲取環(huán)境數(shù)據(jù)，包括時(shí)間信息、地點(diǎn)信息、光照條件、天氣信息、溫度和濕度信息以及聲音環(huán)境;對(duì)采集到的環(huán)境數(shù)據(jù)進(jìn)行預(yù)處理和特征提取，將時(shí)間信息通過(guò)正弦和余弦函數(shù)進(jìn)行周期性編碼，光照條件通過(guò)亮度分析提取，地點(diǎn)信息通過(guò)gps定位或wi-fi獲取，天氣信息通過(guò)天氣api接口獲取，溫度和濕度信息通過(guò)溫濕度傳感器獲取，聲音環(huán)境通過(guò)音頻信號(hào)處理提取;

5.根據(jù)權(quán)利要求1所述的一種基于環(huán)境感知和知識(shí)庫(kù)的視覺(jué)問(wèn)答方法，其特征在于，所述步驟4中，接收視覺(jué)特征、文本特征和環(huán)境特征，并將其特征用如下向量表示：

6.根據(jù)權(quán)利要求1所述的一種基于環(huán)境感知和知識(shí)庫(kù)的視覺(jué)問(wèn)答方法，其特征在于，所述步驟5中，首先會(huì)接收多模態(tài)融合的綜合特征向量:

技術(shù)總結(jié)
本發(fā)明公開(kāi)了一種基于環(huán)境感知和知識(shí)庫(kù)的視覺(jué)問(wèn)答方法，旨在通過(guò)整合現(xiàn)場(chǎng)特定環(huán)境信息和知識(shí)庫(kù)信息的推理技術(shù)，實(shí)現(xiàn)精準(zhǔn)的視覺(jué)問(wèn)答功能。首先，視覺(jué)特征提取利用ResNet模型提取圖像特征，文本特征提取利用BERT模型提取文本特征，并通過(guò)多模態(tài)融合將這些特征與由環(huán)境感知模塊獲取的上下文信息進(jìn)行綜合處理。然后，基于融合后的多模態(tài)特征，通過(guò)Wikidata知識(shí)庫(kù)和Seq2Seq的結(jié)合，以文本形式輸出回答，并可提供可視化反饋。通過(guò)環(huán)境感知，系統(tǒng)能夠?qū)崟r(shí)調(diào)整回答，以確保其高度適應(yīng)當(dāng)前場(chǎng)景，應(yīng)用于智能助手、輔助駕駛、家庭機(jī)器人等領(lǐng)域。

技術(shù)研發(fā)人員：周?chē)?guó)清,鄭嘯林
受保護(hù)的技術(shù)使用者：桂林理工大學(xué)
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/6

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁(yè)1 2

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于環(huán)境感知和知識(shí)庫(kù)的視覺(jué)問(wèn)答方法