所屬的技術(shù)人員能夠理解,本技術(shù)的各個方面可以實(shí)現(xiàn)為系統(tǒng)、方法或程序產(chǎn)品。因此,本技術(shù)的各個方面可以具體實(shí)現(xiàn)為以下形式,即:完全的硬件實(shí)施方式、完全的軟件實(shí)施方式(包括固件、微代碼等),或硬件和軟件方面結(jié)合的實(shí)施方式,這里可以統(tǒng)稱為“電路”、“模塊”或“系統(tǒng)”。與上述方法實(shí)施例基于同一發(fā)明構(gòu)思,本技術(shù)實(shí)施例中還提供了一種計算機(jī)設(shè)備。在一種實(shí)施例中,該計算機(jī)設(shè)備可以是服務(wù)器,如圖2a所示的服務(wù)器230。在該實(shí)施例中,計算機(jī)設(shè)備的結(jié)構(gòu)如圖8所示,可以至少包括存儲器801、通訊模塊803,以及至少一個處理器802。存儲器801,用于存儲處理器802執(zhí)行的計算機(jī)程序。存儲器801可主要包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng),以及運(yùn)行即時通訊功能所需的程序等;存儲數(shù)據(jù)區(qū)可存儲各種即時通訊信息和操作指令集等。存儲器801可以是易失性存儲器(volatile?memory),例如隨機(jī)存取存儲器(random-access?memory,ram);存儲器801也可以是非易失性存儲器(non-volatilememory),例如只讀存儲器,快閃存儲器(flash?memory),硬盤(hard?disk?drive,hdd)或固態(tài)硬盤(solid-state?drive,ssd);或者存儲器801是能夠用于攜帶或存儲具有指令或數(shù)據(jù)結(jié)構(gòu)形式的期望的計算機(jī)程序并能夠由計算機(jī)存取的任何其他介質(zhì),但不限于此。存儲器801可以是上述存儲器的組合。處理器802,可以包括一個或多個中央處理單元(central?processing?unit,cpu)或者為數(shù)字處理單元等等。處理器802,用于調(diào)用存儲器801中存儲的計算機(jī)程序時實(shí)現(xiàn)上述圖像檢索方法。通訊模塊803用于與終端設(shè)備和其他服務(wù)器進(jìn)行通信。本技術(shù)實(shí)施例中不限定上述存儲器801、通訊模塊803和處理器802之間的具體連接介質(zhì)。本技術(shù)實(shí)施例在圖8中以存儲器801和處理器802之間通過總線804連接,總線804在圖8中以粗線描述,其它部件之間的連接方式,僅是進(jìn)行示意性說明,并不引以為限??偩€804可以分為地址總線、數(shù)據(jù)總線、控制總線等。為便于描述,圖8中僅用一條粗線描述,但并不描述僅有一根總線或一種類型的總線。存儲器801中存儲有計算機(jī)存儲介質(zhì),計算機(jī)存儲介質(zhì)中存儲有計算機(jī)可執(zhí)行指令,計算機(jī)可執(zhí)行指令用于實(shí)現(xiàn)本技術(shù)實(shí)施例的圖像檢索方法。處理器802用于執(zhí)行上述的圖像檢索方法,如圖3a所示。在另一種實(shí)施例中,計算機(jī)設(shè)備也可以是其他計算機(jī)設(shè)備,如圖2a所示的終端設(shè)備210。在該實(shí)施例中,計算機(jī)設(shè)備的結(jié)構(gòu)可以如圖9所示,包括:通信組件910、存儲器920、顯示單元930、攝像頭940、傳感器950、音頻電路960、藍(lán)牙模塊970、處理器980等部件。通信組件910用于與服務(wù)器進(jìn)行通信。在一些實(shí)施例中,可以包括電路無線保真(wireless?fidelity,wifi)模塊,wifi模塊屬于短距離無線傳輸技術(shù),電子設(shè)備通過wifi模塊可以幫助對象收發(fā)信息。存儲器920可用于存儲軟件程序及數(shù)據(jù)。處理器980通過運(yùn)行存儲在存儲器920的軟件程序或數(shù)據(jù),從而執(zhí)行終端設(shè)備210的各種功能以及數(shù)據(jù)處理。存儲器920可以包括高速隨機(jī)存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他易失性固態(tài)存儲器件。存儲器920存儲有使得終端設(shè)備210能運(yùn)行的操作系統(tǒng)。本技術(shù)中存儲器920可以存儲操作系統(tǒng)及各種應(yīng)用程序,還可以存儲執(zhí)行本技術(shù)實(shí)施例圖像檢索方法的計算機(jī)程序。顯示單元930還可用于顯示由對象輸入的信息或提供給對象的信息以及終端設(shè)備210的各種菜單的圖形用戶界面(graphical?user?interface,gui)。具體地,顯示單元930可以包括設(shè)置在終端設(shè)備210正面的顯示屏932。其中,顯示屏932可以采用液晶顯示器、發(fā)光二極管等形式來配置。顯示單元930可以用于顯示本技術(shù)實(shí)施例中的缺陷檢測界面、模型訓(xùn)練界面等。顯示單元930還可用于接收輸入的數(shù)字或字符信息,產(chǎn)生與終端設(shè)備210的對象設(shè)置以及功能控制有關(guān)的信號輸入,具體地,顯示單元930可以包括設(shè)置在終端設(shè)備210正面的觸控屏931,可收集對象在其上或附近的觸摸操作,例如點(diǎn)擊按鈕,拖動滾動框等。其中,觸控屏931可以覆蓋在顯示屏932之上,也可以將觸控屏931與顯示屏932集成而實(shí)現(xiàn)終端設(shè)備210的輸入和輸出功能,集成后可以簡稱觸摸顯示屏。本技術(shù)中顯示單元930可以顯示應(yīng)用程序以及對應(yīng)的操作步驟。攝像頭940可用于捕獲靜態(tài)圖像,對象可以將攝像頭940拍攝的圖像通過應(yīng)用發(fā)布。攝像頭940可以是一個,也可以是多個。物體通過鏡頭生成光學(xué)圖像投射到感光元件。感光元件可以是電荷耦合器件(charge?coupled?device,ccd)或互補(bǔ)金屬氧化物半導(dǎo)體(complementary?metal-oxide-semiconductor,cmos)光電晶體管。感光元件把光信號轉(zhuǎn)換成電信號,之后將電信號傳遞給處理器980轉(zhuǎn)換成數(shù)字圖像信號。終端設(shè)備還可以包括至少一種傳感器950,比如加速度傳感器951、距離傳感器952、指紋傳感器953、溫度傳感器954。終端設(shè)備還可配置有陀螺儀、氣壓計、濕度計、溫度計、紅外線傳感器、光傳感器、運(yùn)動傳感器等其他傳感器。音頻電路960、揚(yáng)聲器961、傳聲器962可提供對象與終端設(shè)備210之間的音頻接口。音頻電路960可將接收到的音頻數(shù)據(jù)轉(zhuǎn)換后的電信號,傳輸?shù)綋P(yáng)聲器961,由揚(yáng)聲器961轉(zhuǎn)換為聲音信號輸出。終端設(shè)備210還可配置音量按鈕,用于調(diào)節(jié)聲音信號的音量。另一方面,傳聲器962將收集的聲音信號轉(zhuǎn)換為電信號,由音頻電路960接收后轉(zhuǎn)換為音頻數(shù)據(jù),再將音頻數(shù)據(jù)輸出至通信組件910以發(fā)送給比如另一終端設(shè)備210,或者將音頻數(shù)據(jù)輸出至存儲器920以便進(jìn)一步處理。藍(lán)牙模塊970用于通過藍(lán)牙協(xié)議來與其他具有藍(lán)牙模塊的藍(lán)牙設(shè)備進(jìn)行信息交互。例如,終端設(shè)備可以通過藍(lán)牙模塊970與同樣具備藍(lán)牙模塊的可穿戴電子設(shè)備(例如智能手表)建立藍(lán)牙連接,從而進(jìn)行數(shù)據(jù)交互。處理器980是終端設(shè)備的控制中心,利用各種接口和線路連接整個終端的各個部分,通過運(yùn)行或執(zhí)行存儲在存儲器920內(nèi)的軟件程序,以及調(diào)用存儲在存儲器920內(nèi)的數(shù)據(jù),執(zhí)行終端設(shè)備的各種功能和處理數(shù)據(jù)。在一些實(shí)施例中,處理器980可包括一個或多個處理單元;處理器980還可以集成應(yīng)用處理器和基帶處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,基帶處理器主要處理無線通信??梢岳斫獾氖牵鲜龌鶐幚砥饕部梢圆患傻教幚砥?80中。本技術(shù)中處理器980可以運(yùn)行操作系統(tǒng)、應(yīng)用程序、用戶界面顯示及觸控響應(yīng),以及本技術(shù)實(shí)施例的圖像檢索方法。另外,處理器980與顯示單元930耦接。在一些可能的實(shí)施方式中,本技術(shù)提供的圖像檢索方法的各個方面還可以實(shí)現(xiàn)為一種程序產(chǎn)品的形式,其包括計算機(jī)程序,當(dāng)程序產(chǎn)品在計算機(jī)設(shè)備上運(yùn)行時,計算機(jī)程序用于使計算機(jī)設(shè)備執(zhí)行本說明書上述描述的根據(jù)本技術(shù)各種示例性實(shí)施方式的圖像檢索方法中的步驟,例如,計算機(jī)設(shè)備可以執(zhí)行如圖3a中所示的步驟。程序產(chǎn)品可以采用一個或多個可讀介質(zhì)的任意組合??勺x介質(zhì)可以是可讀信號介質(zhì)或者可讀存儲介質(zhì)??勺x存儲介質(zhì)例如可以是但不限于電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合??勺x存儲介質(zhì)的更具體地例子(非窮舉的列表)包括:具有一個或多個導(dǎo)線的電連接、便攜式盤、硬盤、隨機(jī)存取存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或閃存)、光纖、便攜式緊湊盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。本技術(shù)的實(shí)施方式的程序產(chǎn)品可以采用便攜式緊湊盤只讀存儲器(cd-rom)并包括計算機(jī)程序,并可以在電子設(shè)備上運(yùn)行。然而,本技術(shù)的程序產(chǎn)品不限于此,在本文件中,可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被命令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用??勺x信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了可讀計算機(jī)程序。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括但不限于電磁信號、光信號或上述的任意合適的組合??勺x信號介質(zhì)還可以是可讀存儲介質(zhì)以外的任何可讀介質(zhì),該可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由命令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序??勺x介質(zhì)上包含的計算機(jī)程序可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括但不限于無線、有線、光纜、rf等等,或者上述的任意合適的組合。可以以一種或多種程序設(shè)計語言的任意組合來編寫用于執(zhí)行本技術(shù)操作的計算機(jī)程序,程序設(shè)計語言包括面向?qū)ο蟮某绦蛟O(shè)計語言—諸如java、c++等,還包括常規(guī)的過程式程序設(shè)計語言—諸如“c”語言或類似的程序設(shè)計語言。計算機(jī)程序可以完全地在用戶計算機(jī)設(shè)備上執(zhí)行、部分地在用戶計算機(jī)設(shè)備上執(zhí)行、作為一個獨(dú)立的軟件包執(zhí)行、部分在用戶計算機(jī)設(shè)備上部分在遠(yuǎn)程計算機(jī)設(shè)備上執(zhí)行、或者完全在遠(yuǎn)程計算機(jī)設(shè)備上執(zhí)行。在涉及遠(yuǎn)程計算機(jī)設(shè)備的情形中,遠(yuǎn)程計算機(jī)設(shè)備可以通過任意種類的網(wǎng)絡(luò)包括局域網(wǎng)(lan)或廣域網(wǎng)(wan)連接到用戶計算機(jī)設(shè)備,或者,可以連接到外部計算機(jī)設(shè)備(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。應(yīng)當(dāng)注意,盡管在上文詳細(xì)描述中提及了裝置的若干單元或子單元,但是這種劃分僅僅是示例性的并非強(qiáng)制性的。實(shí)際上,根據(jù)本技術(shù)的實(shí)施方式,上文描述的兩個或更多單元的特征和功能可以在一個單元中具體化。反之,上文描述的一個單元的特征和功能可以進(jìn)一步劃分為由多個單元來具體化。此外,盡管在附圖中以特定順序描述了本技術(shù)方法的操作,但是,這并非要求或者暗示必須按照該特定順序來執(zhí)行這些操作,或是必須執(zhí)行全部所示的操作才能實(shí)現(xiàn)期望的結(jié)果。附加地或備選地,可以省略某些步驟,將多個步驟合并為一個步驟執(zhí)行,和/或?qū)⒁粋€步驟分解為多個步驟執(zhí)行。本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本技術(shù)的實(shí)施例可提供為方法、系統(tǒng)、或計算機(jī)程序產(chǎn)品。因此,本技術(shù)可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本技術(shù)可采用在一個或多個其中包含有計算機(jī)可用計算機(jī)程序的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學(xué)存儲器等)上實(shí)施的計算機(jī)程序產(chǎn)品的形式。本技術(shù)是參照根據(jù)本技術(shù)實(shí)施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序命令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機(jī)程序命令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的命令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。這些計算機(jī)程序命令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的命令產(chǎn)生包括命令裝置的制造品,該命令裝置實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。這些計算機(jī)程序命令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實(shí)現(xiàn)的處理,從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的命令提供用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。盡管已描述了本技術(shù)的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實(shí)施例做出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本技術(shù)范圍的所有變更和修改。顯然,本領(lǐng)域的技術(shù)人員可以對本技術(shù)進(jìn)行各種改動和變型而不脫離本技術(shù)的精神和范圍。這樣,倘若本技術(shù)的這些修改和變型屬于本技術(shù)權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本技術(shù)也意圖包含這些改動和變型在內(nèi)。
背景技術(shù):
1、如今,圖像方面的信息在網(wǎng)絡(luò)中占據(jù)了越來越大的比重,為了滿足人們?nèi)找嬖鲩L的圖像搜索需求,常使用基于文本的圖像搜索技術(shù)執(zhí)行圖像檢索任務(wù)。
2、對比性的語言-圖像預(yù)訓(xùn)練(contrastive?language-image?pretraining,clip)模型作為一種機(jī)器學(xué)習(xí)模型,在自然語言理解、圖像分類、圖像檢索等任務(wù)中取得了良好的表現(xiàn)。其中,在執(zhí)行圖像檢索任務(wù)時,clip模型分別對目標(biāo)對象輸入的檢索文本與圖庫中各張原始檢索圖像進(jìn)行特征提取,獲得文本特征矩陣與各自的圖像特征矩陣,再基于文本特征矩陣與各圖像特征矩陣之間的余弦相似度,在多張原始檢索圖像中檢索得到符合檢索文本要求的目標(biāo)檢索圖像。
3、但是,由于圖庫中收錄的圖像數(shù)量有限,在圖庫中未收錄檢索文本描述的類型圖像時,針對圖庫中已收錄圖像進(jìn)行圖像檢索任務(wù)時,各原始檢索圖像與檢索文本之間的余弦相似度均未超過設(shè)定閾值,檢索文本難以檢索到與檢索文本精準(zhǔn)匹配的目標(biāo)圖像,影響模型的圖像檢索精度。例如,檢索文本為“一把手柄上有蝴蝶結(jié)的粉色剪刀”,由于圖庫中未收錄該類型的剪刀圖片,導(dǎo)致clip模型未檢索到與檢索文本描述一致的剪刀圖片。
4、因此,為了克服目前圖像檢索精度低的問題,本技術(shù)又提出了一種新的圖像檢索方法。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例提供了一種圖像檢索方法、裝置、設(shè)備及存儲介質(zhì),以解決圖像檢索精度低的問題。
2、第一方面,本技術(shù)實(shí)施例提供了一種圖像檢索方法,包括:
3、基于目標(biāo)對象發(fā)送的原始檢索文本,獲得至少一張候選檢索圖像;
4、在確定所述至少一張候選檢索圖像與所述原始檢索文本間的匹配度低于第一設(shè)定閾值時,在所述原始檢索文本中添加表征所述目標(biāo)對象意向的提示詞,并基于獲得的各所述提示詞,生成目標(biāo)檢索文本;
5、針對檢索文本匹配度低于所述第一設(shè)定閾值的各候選檢索圖像,分別執(zhí)行以下操作:
6、將一張候選檢索圖像與所述目標(biāo)檢索文本進(jìn)行注意力交互,獲得所述一張候選檢索圖像中與所述目標(biāo)檢索文本相關(guān)聯(lián)的待繪制區(qū)域;
7、在所述待繪制區(qū)域中重新繪制所述目標(biāo)檢索文本描述的圖像內(nèi)容,獲得相應(yīng)的目標(biāo)檢索圖像。
8、第二方面,本技術(shù)實(shí)施例還提供了一種圖像檢索裝置,包括:
9、圖像檢索模塊,用于基于目標(biāo)對象發(fā)送的原始檢索文本,獲得至少一張候選檢索圖像;
10、處理模塊,用于在確定所述至少一張候選檢索圖像與所述原始檢索文本間的匹配度低于第一設(shè)定閾值時,在所述原始檢索文本中添加表征所述目標(biāo)對象意向的提示詞,并基于獲得的各所述提示詞,生成目標(biāo)檢索文本;
11、圖像繪制模塊,用于針對檢索文本匹配度低于所述第一設(shè)定閾值的各候選檢索圖像,分別執(zhí)行以下操作:
12、將一張候選檢索圖像與所述目標(biāo)檢索文本進(jìn)行注意力交互,獲得所述一張候選檢索圖像中與所述目標(biāo)檢索文本相關(guān)聯(lián)的待繪制區(qū)域;
13、在所述待繪制區(qū)域中重新繪制所述目標(biāo)檢索文本描述的圖像內(nèi)容,獲得相應(yīng)的目標(biāo)檢索圖像。
14、可選的,在基于各文本特征與各圖像特征,獲得多個注意力權(quán)重特征之前,所述圖像檢索裝置還包括預(yù)處理模塊,所述預(yù)處理模塊用于:
15、基于預(yù)先構(gòu)建的第一全連接層與第二全連接層,將所述各文本特征與所述各圖像特征進(jìn)行維度對齊,獲得具有相同維度的所述各文本特征與所述各圖像特征。
16、可選的,所述所述圖像繪制模塊針對每個所述像素點(diǎn)的圖像特征及相應(yīng)的注意力權(quán)重特征,執(zhí)行以下操作:
17、將一個圖像特征中各個維度的圖像向量,分別與一個像素點(diǎn)對應(yīng)注意力權(quán)重特征中同一維度的注意力權(quán)重向量相乘,獲得一個含有多維向量的多模態(tài)注意力特征。
18、可選的,所述處理模塊用于:
19、分別對所述原始檢索文本中的各原始詞進(jìn)行詞性檢測,獲得各自的詞性類型;
20、在詞性類型為名詞的第一原始詞后面,添加表征所述目標(biāo)對象意向的提示詞;
21、在確定所述第一原始詞相鄰的第二原始詞為修飾詞時,在所述第二原始詞后面添加所述提示詞。
22、可選的,所述圖像繪制模塊用于:
23、按照所述目標(biāo)檢索文本,調(diào)整所述待繪制區(qū)域中各像素點(diǎn)的像素值,繪制得到所述目標(biāo)檢索文本描述的圖像內(nèi)容;
24、重新渲染包含所述圖像內(nèi)容的候選檢索圖像,生成相應(yīng)的目標(biāo)檢索圖像。
25、第三方面,本技術(shù)實(shí)施例還提供了一種計算機(jī)設(shè)備,包括處理器和存儲器,其中,所述存儲器存儲有程序代碼,當(dāng)所述程序代碼被所述處理器執(zhí)行時,使得所述處理器執(zhí)行上述任意一種圖像檢索方法的步驟。
26、第四方面,本技術(shù)實(shí)施例還提供了一種計算機(jī)可讀存儲介質(zhì),其包括程序代碼,當(dāng)程序產(chǎn)品在計算機(jī)設(shè)備上運(yùn)行時,所述程序代碼用于使所述計算機(jī)設(shè)備執(zhí)行上述任意一種圖像檢索方法的步驟。
27、第五方面,本技術(shù)實(shí)施例還提供了一種計算機(jī)程序產(chǎn)品,包括計算機(jī)指令,計算機(jī)指令被處理器執(zhí)行上述任意一種圖像檢索方法的步驟。
28、本技術(shù)有益效果如下:
29、本技術(shù)實(shí)施例提供了一種圖像檢索方法、裝置、設(shè)備及存儲介質(zhì),該方法包括:在確定存在至少一張與文本匹配度較低的候選檢索圖像時,在原始檢索文本中添加提示詞,生成相應(yīng)的目標(biāo)檢索文本,以幫助模型更好地理解自然語言,有助于提高模型的檢測精度與檢索精度;進(jìn)一步地,基于目標(biāo)檢索文本的文本特征與上述候選檢索圖像的圖像特征之間的注意力交互,對上述候選檢索圖像進(jìn)行圖像檢測,引導(dǎo)模型將注意力放在與目標(biāo)檢索文本的文本特征關(guān)聯(lián)程度較高的圖像特征上,確定圖像中與目標(biāo)檢索文本相關(guān)聯(lián)的待繪制區(qū)域,也有助于生成圖文相符的目標(biāo)檢索圖像;最終,按照目標(biāo)檢索文本描述的文本內(nèi)容,在相似圖像的待繪制區(qū)域中重新繪制相關(guān)的圖像內(nèi)容,生成圖文精準(zhǔn)匹配的目標(biāo)檢索圖像,突破傳統(tǒng)圖像檢索方法中圖庫數(shù)據(jù)量對檢索范圍的制約,實(shí)現(xiàn)基于語言模型的圖文自動關(guān)聯(lián),在現(xiàn)有圖庫的基礎(chǔ)上,根據(jù)目標(biāo)對象輸入的文本內(nèi)容,對相似圖像進(jìn)行重新繪制,生成更加符合語義內(nèi)容的圖像,在未增加檢索數(shù)量的情況下,實(shí)現(xiàn)了提高模型的圖像檢索精度的需求。
30、本技術(shù)的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本技術(shù)而了解。本技術(shù)的目的和其他優(yōu)點(diǎn)可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。