用于搜索圖像的方法和裝置與流程

文檔序號：11288616閱讀：237來源：國知局

本公開涉及電子裝置上的圖像，更具體地，涉及用于搜索圖像的方法和裝置。

背景技術：

隨著時間的推移，更多的電子裝置被引入給公眾。這些電子裝置中的許多電子裝置允許用戶拍攝視頻和靜止圖像(統(tǒng)稱為圖像)，以及允許用戶下載圖像并還允許用戶將圖像復制到電子裝置。在與這些電子裝置相關聯(lián)的存儲器容易達到多個千兆字節(jié)，以及針對許多臺式個人計算機(pc)的多個千兆字節(jié)的情況下，當用戶尋找特定的圖片或視頻時可能需要搜索的圖像的絕對數(shù)量可能是巨大的。

技術實現(xiàn)要素：

技術問題

用戶可碰到多種類型的圖像，但是用戶喜歡的圖像可能與這些圖像不同。此外，用戶可能對圖像的特定部分感興趣。

解決方案

提供了用于在圖像數(shù)據(jù)庫中搜索圖像的方法和裝置。將在下面的描述中部分地闡述各個方面，并且從描述中這些方面將變得明顯，并/或可通過提出的示例性實施例的實踐被了解。

根據(jù)示例性實施例的一方面，搜索圖像的方法包括接收用于在顯示的圖像中選擇感興趣區(qū)域的用戶輸入，并顯示用于示出感興趣區(qū)域的指示符。隨后，可確定搜索詞，其中，搜索詞包括針對感興趣區(qū)域的至少一條識別信息。搜索詞可被用于在圖像數(shù)據(jù)庫中搜索至少一個目標圖像。當搜索詞與目標圖像中的任何一個的識別信息適當?shù)仄ヅ鋾r，目標圖像被稱作發(fā)現(xiàn)的圖像，并顯示發(fā)現(xiàn)的圖像。

指示符可通過突出顯示感興趣區(qū)域的邊界線、改變感興趣區(qū)域的大小和改變感興趣區(qū)域的深度信息中的至少一個被顯示。

第一用戶輸入是在顯示的圖像的一部分上的用戶觸摸。

感興趣區(qū)域的大小可根據(jù)用戶觸摸的持續(xù)時間被改變。

感興趣區(qū)域的大小可根據(jù)持續(xù)時間的增加而增加。

感興趣區(qū)域可以是圖像中包括的對象、背景和文本中的至少一個。

所述方法還包括顯示針對感興趣區(qū)域的識別信息。

搜索詞可由用于選擇顯示的識別信息中的至少一條的用戶輸入確定。

當搜索詞是正搜索詞時，發(fā)現(xiàn)的圖像是至少一個目標圖像中的具有作為一條識別信息的所述搜索詞的任何一個目標圖像。

當搜索詞是負搜索詞時，發(fā)現(xiàn)的圖像是至少一個目標圖像中的不具有作為一條識別信息的所述搜索詞的任何一個目標圖像。

發(fā)現(xiàn)的圖像可基于感興趣區(qū)域的屬性信息和圖像的圖像分析信息中的至少一個被獲得。

圖像可包括第一圖像和第二圖像，其中，感興趣區(qū)域包括第一圖像的第一部分圖像和第二圖像的第二部分圖像。

所述方法還可包括：接收文本并將文本確定為搜索詞。

圖像數(shù)據(jù)庫可被存儲在網(wǎng)絡服務器、云服務器、社交網(wǎng)絡服務(sns)服務器和便攜式裝置中的任何一個中。

顯示的圖像可以是實時取景圖像、靜止圖像和運動圖像幀中的至少一個。

發(fā)現(xiàn)的圖像可以是運動圖像幀，當存在多個發(fā)現(xiàn)的圖像時，顯示發(fā)現(xiàn)的圖像的步驟包括順序地顯示運動圖像幀。

根據(jù)另一示例性實施例的一方面，一種裝置，包括：顯示單元，被配置為顯示顯示的圖像，用戶輸入單元，被配置為接收用于選擇感興趣區(qū)域的用戶輸入，控制單元，被配置為控制顯示單元顯示關于感興趣區(qū)域的指示符。

裝置還包括：數(shù)據(jù)庫，被配置為存儲圖像，其中，控制單元還被配置為基于從用戶輸入單元接收到的結果確定針對感興趣區(qū)域的至少一條識別信息，并被配置為使用與搜索詞相應的識別信息搜索目標圖像。

識別信息可以是感興趣區(qū)域中包括的人的姿勢。

當搜索詞是正搜索詞時，發(fā)現(xiàn)的圖像是具有與搜索詞相應的識別信息的目標圖像，當搜索詞是負搜索詞時，發(fā)現(xiàn)的圖像是具有不與搜索詞相應的識別信息的目標圖像。

附圖說明

從以下結合附圖的示例性實施例的描述，這些和/或其他方面將變得明顯并容易理解，其中:

圖1a到圖1e是根據(jù)示例性實施例的裝置的框圖。

圖1f是根據(jù)示例性實施例的搜索圖像的方法的流程圖；

圖2是用于說明根據(jù)示例性實施例的向對象提供指示符的方法的參考圖；

圖3是用于說明根據(jù)示例性實施例的通過改變對象的大小提供針對對象的指示符的方法的參考圖；

圖4是用于說明根據(jù)示例性實施例的通過改變感興趣區(qū)域的深度信息來提供針對對象的指示符的方法的參考圖；

圖5是用于說明根據(jù)示例性實施例的在單個圖像上選擇多個對象作為感興趣區(qū)域的方法的參考圖；

圖6是用于說明根據(jù)另一個示例性實施例的在單個圖像上選擇多個對象作為感興趣區(qū)域的方法的參考圖；

圖7是用于說明根據(jù)示例性實施例的選擇背景作為感興趣區(qū)域的方法的參考圖；

圖8是用于說明根據(jù)示例性實施例的使用多個圖像選擇感興趣區(qū)域的方法的參考圖；

圖9是根據(jù)示例性實施例的由裝置使用的從識別信息確定搜索詞的方法的流程圖；

圖10是根據(jù)示例性實施例的由裝置使用的產(chǎn)生識別信息的方法的流程圖；

圖11示出根據(jù)示例性實施例的圖像的屬性信息；

圖12是用于說明裝置基于圖像的屬性信息產(chǎn)生圖像的識別信息的示例的參考圖；

圖13是用于說明裝置通過使用圖像分析信息產(chǎn)生識別信息的示例的參考圖；

圖14示出根據(jù)示例性實施例的裝置顯示識別信息列表的示例；

圖15是用于說明根據(jù)示例性實施例的從識別信息確定搜索詞的方法的參考圖；

圖16是用于說明根據(jù)示例性實施例的從多個圖像中確定搜索詞的方法的參考圖；

圖17是用于說明根據(jù)示例性實施例的由裝置使用的包括諸如搜索詞的文本的方法的參考圖；

圖18a到圖18d是用于說明根據(jù)示例性實施例的提供搜索結果的方法的參考圖。

具體實施方式

現(xiàn)在將詳細參考實施例，實施例的示例在附圖中被示出，在附圖中，相同的標號始終指示相同的元件。在這方面，本實施例可具有不同的形式并不應被理解為限制這里闡述的描述。因此，下面僅通過參考附圖來描述實施例以解釋本描述的一些方面。

盡管目前廣泛使用的一般術語是考慮到本公開的功能而被選擇用于描述本公開的，但是這些一般術語可根據(jù)本領域的普通技術人員的意圖、案件先例、新技術的出現(xiàn)等而改變。一些具有特定含義的特定術語也被用于本公開。當一個術語的含義有疑問時，應當首先基于陳述的定義，或如果沒有定義則基于術語在上下文中的使用，在包括權利要求和附圖的本公開中尋找定義。其后，術語的定義應是本領域的普通技術人員在本公開的上下文中將理解的定義。

術語“包括”、“包含”指定存在所陳述的元件，但不排除存在其他元件，無論它們是否與所陳述的元件具有相同類型。術語“單元”和“模塊”在本公開中使用時是指執(zhí)行至少一個功能或操作的單元，并且“單元”和“模塊”可被實現(xiàn)為硬件、軟件或硬件和軟件的組合。軟件可包括任何可執(zhí)行代碼，無論是編譯的還是可判讀的，例如，任何可被執(zhí)行以執(zhí)行期望的操作的可執(zhí)行代碼。

貫穿本公開，“圖像”可包括對象和背景。對象是可通過圖像處理等與具有輪廓線的背景區(qū)分的部分圖像。對象可以是圖像的一部分，諸如，例如，人類、動物、建筑物、車輛等。圖像減去對象可被認為是背景。

因此，對象或背景可以是部分圖像，并且它們可能不是固定的，而是相對的。例如，在具有人類、車輛、天空的圖像中，人類和車輛的可以是對象，并且天空可以是背景。在包括人類和車輛的圖像中，人類可以是對象，并且車輛可以是背景。人類的面部和人類的全部身體可以是對象。然而，針對對象的部分圖像的大小通常小于針對背景的部分圖像的大小，盡管這可能有例外。每個裝置可使用它們自己先前定義的用于區(qū)分對象和背景的標準。

貫穿本公開，圖像可以是靜止圖像(例如，圖片或圖畫)、運動圖像(例如，tv程序圖像、視頻點播(vod)、用戶創(chuàng)建內容(ucc))、音樂視頻或youtube圖像)、實時取景圖像、菜單圖像等。圖像中的感興趣區(qū)域可以是諸如圖像的對象或背景的部分圖像。

現(xiàn)在將描述能夠搜索圖像的圖像系統(tǒng)。圖像系統(tǒng)可包括能夠再現(xiàn)并存儲圖像的裝置，并還可包括存儲圖像的外部裝置(例如，服務器)。當圖像系統(tǒng)包括外部裝置時，裝置和外部裝置可相互作用以搜索一個或更多個圖像。

根據(jù)示例性實施例的裝置可以是目前可用的各種類型之一，但也可包括將在未來開發(fā)的裝置。目前可用的裝置可以是，例如，臺式計算機、移動電話、智能電話、膝上型計算機、平板個人計算機(pc)、電子書終端、數(shù)字廣播終端、個人數(shù)字助理(pda)、便攜式多媒體播放器(pmp)、導航、mp3播放器、數(shù)碼相機、攝像機、互聯(lián)網(wǎng)協(xié)議電視(iptv)、數(shù)字電視(dtv)、消費電子(ce)設備(例如，均包括顯示器的電冰箱和空調)等，但實施例不限于此。裝置也可以是用戶可穿戴裝置。例如，裝置可以是手表、眼鏡、戒指、手鐲、項鏈等。

圖1a到圖1e是根據(jù)各種實施例的裝置100的框圖。

如圖1a所示，根據(jù)示例性實施例的裝置100可包括用戶輸入單元110、控制單元120、顯示單元130和存儲器140。裝置100可向在存儲器140中存儲的靜止圖像和運動圖像提供效果。裝置100可使用在顯示單元130上顯示的圖像的感興趣區(qū)域來搜索在存儲器140中存儲的圖像。

可選地，如圖1b所示，根據(jù)示例性實施例的裝置100可包括用戶輸入單元110、控制單元120、顯示單元130和通信單元150。裝置100可使用在顯示單元130上顯示的圖像的感興趣區(qū)域來搜索在外部電子裝置中存儲的圖像。也可從外部裝置接收在顯示單元130上顯示的圖像。

可選地，如圖1c和1d所示，根據(jù)示例性實施例的裝置100還可包括相機160。裝置100可使用由相機160捕捉的實時取景圖像來選擇感興趣區(qū)域。所有示出的組件都是非必須的。裝置100可包括比圖1a到圖1d中示出的組件更多或更少的組件。

如圖1e所示，根據(jù)示例性實施例的電子裝置100除了可包括圖1a到圖1d中的每一個裝置100的組件以外，還可包括輸出單元170、感測單元180和麥克風190。現(xiàn)在將詳細描述上述組件。

用戶輸入單元110是指用戶輸入用于控制裝置100的數(shù)據(jù)所通過的單元。例如，用戶輸入單元110可以是，但不限于，鍵盤、圓頂開關、觸摸板(例如，電容覆蓋型、電阻覆蓋型、紅外線型、積分應變計(integralstraingauge)型、表面聲波型、壓電型等)、滾輪或滾輪開關。

用戶輸入單元110可接收在圖像上選擇感興趣區(qū)域的用戶輸入。根據(jù)本公開的示例性實施例，選擇感興趣區(qū)域的用戶輸入可不同。例如，用戶輸入可以是鍵輸入、觸摸輸入、動作輸入、彎曲輸入、語音輸入或多點輸入。

根據(jù)本公開的示例性實施例，用戶輸入單元110可從圖像接收感興趣區(qū)域。

用戶輸入單元110可接收從識別信息列表選擇至少一條識別信息的輸入。

控制單元120通?？刂蒲b置100的所有操作。例如，控制單元120可通過執(zhí)行存儲器140中存儲的程序來控制用戶輸入單元110、輸出單元170、通信單元150、感測單元180和麥克風190。

控制單元120可獲得識別選擇的感興趣區(qū)域的至少一條識別信息。例如，控制單元120可通過檢查選擇的感興趣區(qū)域的屬性信息并概括屬性信息來產(chǎn)生識別信息?？刂茊卧?20可通過使用關于選擇的感興趣區(qū)域的圖像分析信息來檢測識別信息?？刂茊卧?20除了可獲得感興趣區(qū)域的識別信息之外，還可獲得第二圖像的識別信息。

控制單元120可顯示用于示出感興趣區(qū)域的指示符。指示符可包括突出顯示感興趣區(qū)域的邊界線、改變感興趣區(qū)域的大小、改變感興趣區(qū)域的深度信息等。

顯示單元130可顯示由裝置100處理過的信息。例如，顯示單元130可顯示靜止圖像、運動圖像或實時取景圖像。顯示單元130也可顯示識別感興趣區(qū)域的識別信息。顯示單元130也可顯示通過搜索處理發(fā)現(xiàn)的圖像。

當顯示單元130與觸摸板一起形成層結構以構建觸摸屏時，顯示單元130不僅可被用作輸入裝置還可被用作輸出裝置。顯示單元130可包括從液晶顯示器(lcd)、薄膜晶體管液晶顯示器(tft-lcd)、有源發(fā)光二極管(oled)、柔性顯示器、3d顯示器和電泳顯示器中選擇的至少一個。根據(jù)本公開的一些實施例，裝置100可包括兩個或更多個顯示單元130。

存儲器140可存儲可由控制單元120運行以執(zhí)行處理和控制的程序，還可存儲輸入/輸出數(shù)據(jù)(例如，多個圖像、多個文件夾和首選文件夾列表)。

存儲器140可包括例如，閃存類型、硬盤類型、多媒體卡類型、卡類型存儲器(例如，安全數(shù)字(sd)或極限數(shù)字(xd)存儲器)、隨機存取存儲器(ram)、靜態(tài)隨機存取存儲器(sram)、只讀存儲器(rom)、電可擦除可編程rom(eeprom)、可編程rom(prom)、磁存儲器、磁盤和光學磁盤之中的至少一個類型的存儲介質。裝置100可在互聯(lián)網(wǎng)上操作執(zhí)行存儲器140的存儲功能的網(wǎng)絡存儲器。

在存儲器140中存儲的程序可根據(jù)它們的功能被分類到多個模塊，例如，用戶接口(ui)模塊141、通知模塊142和圖像處理模塊143。

ui模塊141可提供專用于每個應用并與裝置100互相操作的ui、圖像ui(gui)等。通知模塊142可產(chǎn)生用于通知在裝置100中已產(chǎn)生事件的信號。通知模塊142可通過顯示單元130可以以視頻信號的形式輸出通知信號、通過音頻輸出單元172以音頻信號形式輸出通知信號或通過振動電機173以振動信號形式輸出通知信號。

圖像處理模塊143可通過分析捕捉到的圖像獲得捕捉到的圖像中包括的對象信息、邊緣信息、氛圍信息、顏色信息等。

根據(jù)本公開的示例性實施例，圖像處理模塊143可檢測捕捉到的圖像中的對象的邊界線。根據(jù)本公開的示例性實施例，圖像處理模塊143可通過將圖像中包括的對象的輪廓線與預先定義的模板進行比較來獲得對象的類型、名字等。例如，當對象的輪廓線與車輛的模板相似時，圖像處理模塊143可將圖像中包括的對象識別為車輛。

根據(jù)本公開的示例性實施例，圖像處理模塊143對圖像中包括的對象執(zhí)行面部識別。例如，圖像處理模塊143可從圖像檢測人的面部區(qū)域。面部區(qū)域檢測方法的示例可包括基于知識的方法、基于特征的方法、模板匹配方法和基于外觀的方法，但實施例不限于此。

圖像處理模塊143也可從檢測到的面部區(qū)域中提取面部特征(例如，作為面部的主要部分的眼睛、鼻子和嘴的形狀)。為了從面部區(qū)域提取面部特征，可使用gabor濾波器、局部二值模式(lbp)等，但實施例不限于此。

圖像處理模塊143可將從圖像內的面部區(qū)域中提取的面部特征與預注冊用戶的面部特征進行比較。例如，當提取的面部特征與預注冊的第一注冊人(例如，tom)的面部特征相似時，圖像處理模塊143可確定第一用戶的圖像被包括在圖像中。

根據(jù)本公開的示例性實施例，圖像處理模塊143可將圖像的某一區(qū)域與顏色圖(顏色直方圖)進行比較并提取視覺特征(諸如顏色分布、圖案和圖像氛圍)作為圖像分析信息。

通信單元150可包括使裝置100能夠與云服務器、外部裝置、社交網(wǎng)絡服務(sns)服務器或外部可穿戴裝置執(zhí)行數(shù)據(jù)通信的至少一個組件。例如，通知單元150可包括短距離無線通信單元151、移動通信單元152和廣播接收單元153。

短距離無線通信單元151可包括，但不限于，藍牙通信單元、低功耗藍牙(ble)通信器、近場通信(nfc)單元、無線局域網(wǎng)(wlan)(例如，wi-fi)通信單元、zigbee通信單元、紅外線數(shù)據(jù)協(xié)會(irda)通信單元、wi-fi直連(wfd)通信單元、超寬帶(uwb)通信單元、ant+通信單元等。

移動通信單元152可在移動通信網(wǎng)絡上與基站、外部終端和服務器中的至少一個交換無線信號。無線信號的示例可包括語音呼叫信號、視頻呼叫信號和在短消息服務(sms)/多媒體消息服務(mms)期間產(chǎn)生的各種數(shù)據(jù)。

廣播接收單元153可通過廣播信道從外部資源接收廣播信號和/或廣播相關信息。廣播通道可以是衛(wèi)星信道、地面電波信道等。[最后一句已經(jīng)被移到另一端以使該句更為普通]

通信單元150可與外部裝置共享第一和第二圖像、效果圖像、效果圖像的效果文件夾和識別信息中的至少一個。外部裝置可以是與裝置100連接的云服務器、sns服務器、同一用戶的另一裝置100、另一用戶的裝置100中的至少一個，但實施例不限于此。

例如，通信單元150可接收在外部裝置中存儲的靜止圖像或運動圖像或可從外部裝置接收由外部裝置捕捉的實時取景圖像。通信單元150可發(fā)送用于搜索與搜索詞相應的圖像的命令并接收發(fā)送結果。

由相機160獲得的圖像幀可被存儲在存儲器140中或可通過通信單元150被發(fā)送到外部。裝置100的一些實施例可包括兩個或更多個相機160。

輸出單元170輸出音頻信號、視頻信號或振動信號，并可包括音頻輸出單元172和振動電機173。

音頻輸出單元172可輸出從通信單元150接收到的或在存儲器140中存儲的音頻數(shù)據(jù)。音頻輸出單元172也可輸出與裝置100的功能有關的音頻信號(例如，呼叫信號接收聲音、消息接收聲音、通知聲音)。音頻輸出單元172可包括揚聲器、蜂鳴器等。

振動電機173可輸出振動信號。例如，振動電機173可輸出與音頻數(shù)據(jù)或視頻數(shù)據(jù)的輸出(例如，呼叫信號接收聲音或消息接收聲音)相應的振動信號。當觸摸屏被觸摸時振動電機173也可輸出振動信號。

感測單元180可感測裝置100的狀態(tài)、裝置100的周圍的狀態(tài)或穿戴裝置100的用戶的狀態(tài)，并可將與感測到的狀態(tài)相應的信息發(fā)送到控制單元120。

感測單元180可包括，但不限于，從磁性傳感器181、加速度傳感器182、傾斜傳感器183、紅外傳感器184、陀螺儀傳感器185、位置傳感器(例如，gps)186、大氣壓傳感器187、接近傳感器188和光學傳感器189中選擇的至少一個。感測單元180可包括，例如，溫度傳感器、照度傳感器、壓力傳感器和虹膜識別傳感器。本領域的普通技術人員將根據(jù)大部分傳感器的名稱而直觀地理解它們的功能，因此在這里將省略對大部分傳感器的詳細描述。

麥克風190可被包括作為音頻/視頻(a/v)輸入單元。麥克風190接收外部音頻信號并將外部音頻信號轉換為電音頻信號。例如，麥克風190可從外部裝置或正在講話的人接收音頻信號。麥克風190可使用各種去噪算法以便去除在接收外部音頻信號時產(chǎn)生的噪聲。

如上所述，不僅可對裝置100中存儲的圖像，還可對外部裝置中存儲的圖像提供效果。外部電子裝置可以是，例如，社交網(wǎng)絡服務(sns)服務器、云服務器或另一用戶使用的裝置100。裝置100的一些實施例可不包括描述的元件(例如，廣播接收單元153)中的一部分元件，然而其他實施例可包括其他類型的元件。

圖1f是根據(jù)示例性實施例的搜索圖像的方法的流程圖。

在操作s110中，裝置100可顯示圖像。圖像可包括對象和背景，并可以是靜止圖像、運動圖像、實時取景圖像、菜單圖像等。根據(jù)本公開的示例性實施例，在裝置100上顯示的圖像可以是在嵌入在裝置100中的存儲器中存儲的靜止圖像或運動圖像、由嵌入在裝置100中的相機160捕捉的實時取景圖像、在外部裝置(例如，由另一用戶使用的便攜式終端、社交網(wǎng)絡服務(sns)服務器、云服務器或網(wǎng)絡服務器)中存儲的靜止圖像或運動圖像，或可以是由外部裝置捕捉的實時取景圖像。

在操作s120中，裝置100可選擇感興趣區(qū)域。感興趣區(qū)域是顯示的圖像的部分圖像，并可以是對象或背景。例如，裝置100可從多個對象中選擇一個對象作為感興趣區(qū)域，或可從多個對象中選擇至少兩個對象作為感興趣區(qū)域?？蛇x地，裝置100可選擇圖像的背景作為感興趣區(qū)域。

用于也可選擇感興趣區(qū)域。例如，裝置100可接收在圖像上選擇部分區(qū)域的用戶輸入，并使用進一步的用戶輸入確定選擇的感興趣區(qū)域應該是對象還是背景。

根據(jù)本公開的示例性實施例，用于選擇感興趣區(qū)域的用戶輸入可不同。在本說明書中，用戶輸入可以是鍵輸入、觸摸輸入、動作輸入、彎曲輸入、語音輸入、多點輸入等。

“觸摸輸入”是指用戶在觸摸屏上作出的控制裝置100的手勢等。觸摸輸入的示例可包括輕擊、觸摸并保持、雙擊、拖拽、平移、輕彈和拖放。

“輕擊”是指用戶使用指尖或觸摸工具(例如，電子筆)觸摸屏幕并隨后在沒有移動的情況下非?？焖俚貜钠聊惶鹬讣饣蛴|摸工具的動作。

“觸摸并保持”是指用戶在使用指尖或觸摸工具(例如，電子筆)觸摸屏幕之后保持觸摸輸入超過臨界時間段(例如，兩秒)。例如，這個動作指示在觸摸接觸時間和觸摸釋放時間之間的時間差大于臨界時間段(例如，兩秒)的情況。為了允許用戶確定觸摸輸入是輕擊還是觸摸并保持，當觸摸輸入保持了超過臨界時間段時，可是視覺地、可聽見地或觸覺地提供反饋信號。臨界時間段可根據(jù)實施例而不同。

“雙擊”是指用戶使用指尖或觸摸工具(例如，電子筆)快速地觸摸屏幕兩次的動作。

“拖拽”是指用戶使用指尖或觸摸工具觸摸屏幕并在觸摸屏幕的同時在屏幕上將指尖或觸摸工具移動到其他位置的動作。當使用這個動作使用拖拽動作移動對象時，這可被稱為“拖放”。當對象沒有被拖拽時，這個動作可被稱作“平移”。

“平移”是指用戶在沒有選擇任何對象的情況下執(zhí)行拖拽動作的動作。由于平移動作不選擇特定的對象，在頁面中沒有對象移動。替代地，整個頁面在屏幕上移動，或一組對象在頁面中移動。

“輕彈”是指用戶以臨界速度(例如，100像素/秒)使用指尖或觸摸工具執(zhí)行拖拽動作的動作?；谥讣饣蛴|摸工具的移動的速度是否大于臨界速度(例如，100像素/秒)，可區(qū)分輕彈動作和拖拽(或平移)動作。

“拖放”是指用戶使用指尖或觸摸工具將對象拖放到屏幕內的預定位置的動作。

“捏”是指用戶使用多個指尖或觸摸工具觸摸屏幕并在觸摸屏幕的同時拉大或縮小多個指尖或觸摸工具之間的距離的動作。“捏放”是指用戶使用兩個手指(諸如大拇指和食指)觸摸屏幕并在觸摸屏幕的同時拉大兩個手指之間的距離的動作，并且“捏合”是指用戶使用兩個手指觸摸屏幕并在觸摸屏幕的同時縮小兩個手指直接的距離的動作。拉大值或縮小值可根據(jù)兩個手指之間的距離被確定。

“滑動”是指用戶在使用指尖或觸摸工具在屏幕上觸摸對象的同時，將指尖或觸摸工具在屏幕上移動特定的距離的動作。

“動作輸入”是指用戶施加到裝置100的控制裝置100的動作。例如，動作輸入可以是用戶旋轉裝置100、傾斜裝置100或水平或垂直地移動裝置100的輸入。裝置100可通過使用加速度傳感器、傾斜傳感器、陀螺儀傳感器、3軸磁性傳感器等來感測由用戶預先設置的動作輸入。

“彎曲輸入”是指當裝置100是柔性顯示裝置時用戶彎曲裝置100的一部分或彎曲整個裝置100以控制裝置100的輸入。根據(jù)本公開的示例性實施例，裝置100可通過使用彎曲傳感器來感測，例如，彎曲位置(坐標值)、彎曲方向、彎曲角度、彎曲速度、被彎曲的次數(shù)、發(fā)生彎曲時的時間點和保持彎曲的時間段。

“鍵輸入”是指通過使用附接于裝置100的物理鍵或在屏幕上顯示的虛擬鍵盤來控制裝置100的用戶輸入。

“多點輸入”是指至少兩種輸入方法的組合。例如，裝置100可從用戶接收觸摸輸入和動作輸入，或可從用戶接收觸摸輸入和語音輸入?？蛇x地，裝置100可從用戶接收觸摸輸入和眼球輸入。眼球輸入就指用戶由于眼睛眨動、凝視一個位置、眼球移動速度等以控制裝置100的輸入。

為了方便說明，現(xiàn)在將描述用戶輸入是鍵輸入或觸摸輸入的情況。

根據(jù)示例性實施例，裝置100可接收選擇預設按鈕的用戶輸入。預設按鈕可以是附接于裝置100的物理按鈕或具有圖形用戶界面(gui)形式的虛擬按鈕。例如，當用戶選擇第一按鈕(例如，主頁按鈕)和第二按鈕(例如，音量控制按鈕)時，裝置100可在屏幕上選擇部分區(qū)域。

裝置100可接收觸摸在屏幕上顯示的圖像的部分區(qū)域的用戶輸入。例如，裝置100可接收觸摸顯示的圖像的一部分區(qū)域達預定時間段(例如，兩秒)或更長的時間段的輸入，或可接收觸摸部分區(qū)域達預定次數(shù)或更多次數(shù)(例如，雙擊)的輸入。隨后，裝置100可將包括被觸摸的部分區(qū)域的背景或對象確定為感興趣區(qū)域。

裝置100可通過使用圖像分析信息確定圖像中的感興趣區(qū)域。例如，裝置100可使用圖像分析信息檢測圖像的各部分的邊界線。裝置100可確定包括被觸摸區(qū)域的邊界線，并將被觸摸區(qū)域確定為感興趣區(qū)域。

可選地，裝置100可通過將圖像的某一區(qū)域與顏色圖(顏色直方圖)進行比較來使用視覺特征(諸如顏色布置或圖案)來提取邊界線。

在操作s130中，裝置100可將感興趣區(qū)域的至少一條識別信息確定為搜索詞。裝置100可在確定搜索詞之前獲得感興趣區(qū)域的識別信息。例如，由裝置100使用的面部識別軟件可確定感興趣區(qū)域是人臉，并因此可將識別信息“面部”與感興趣區(qū)域關聯(lián)。將在后面描述獲得識別信息的方法。

裝置100可通過用戶輸入顯示獲得的識別信息并將至少一條識別信息確定為搜索詞。搜索詞可包括正搜索詞和負搜索詞。正搜索詞可以是需要被包括在找到的圖像中作為識別信息的搜索詞。負搜索詞可以是不需要被包括在找到的圖像中作為識別信息的搜索詞。

在操作s140中，裝置100可搜索與搜索詞相應的圖像。存儲圖像(在下文中稱為“目標圖像”)的數(shù)據(jù)庫(在下文中稱為“圖像數(shù)據(jù)庫”)可由用戶輸入確定。例如，圖像數(shù)據(jù)庫可被包括在裝置100、網(wǎng)絡服務器、云服務器、sns服務器等中。

圖像數(shù)據(jù)庫可以預先定義目標圖像的識別信息或者也可以不預先定義目標圖像的識別信息。當目標圖像的識別信息被預先定義時，裝置100可通過將目標圖像的識別信息與搜索詞進行比較來搜索圖像。當目標圖像的識別信息沒有被預先定義時，裝置100可產(chǎn)生目標圖像的識別信息。裝置100可將產(chǎn)生的目標圖像的識別信息與搜索詞進行比較。

當搜索詞是正搜索詞時，裝置100可從圖像數(shù)據(jù)庫中選擇具有相同的正搜索詞的目標圖像。當搜索詞是負搜索詞時，裝置100可從圖像數(shù)據(jù)庫中選擇不具有負搜索詞的目標圖像。

在操作s1510，裝置100可顯示選擇的圖像。當發(fā)現(xiàn)了多個圖像時，裝置100可在單個屏幕上顯示多個圖像，或可順序地顯示多個圖像。裝置100可產(chǎn)生與選擇的圖像相應的文件夾并在文件夾中存儲圖像。裝置100也可接收用戶輸入以顯示文件夾中存儲的圖像。

裝置100可搜索圖像，但本公開不僅僅限于此。例如，裝置100和外部裝置可協(xié)作搜索圖像。例如，裝置100可顯示圖像(操作s110)、選擇感興趣區(qū)域(操作s120)，并將感興趣區(qū)域的識別信息確定為搜索詞(操作s130)。隨后，外部裝置可搜索與搜索詞相應的圖像(操作s140)，并且裝置100可顯示由外部裝置發(fā)現(xiàn)的圖像(操作s150)。

可選地，外部裝置可產(chǎn)生針對感興趣區(qū)域的識別信息，并且裝置100可在識別信息中確定搜索詞。裝置100和外部裝置可使用其他方法分離并執(zhí)行搜索圖像的功能。為了方便說明，下面將描述僅裝置100搜索圖像的方法。

下面將描述在感興趣區(qū)域上顯示指示符的方法。

圖2是用于說明根據(jù)示例性實施例的提供針對對象210的指示符220的方法的參考圖。如圖2的200-1所示，當執(zhí)行特定的應用(例如，圖像相冊應用)時，裝置100可顯示至少一個圖像。裝置100可接收用戶輸入以選擇對象210作為感興趣區(qū)域。用戶可通過，例如，使用手指或觸摸工具觸摸顯示了對象210的區(qū)域并隨后在不移動手指的情況下快速地抬起手指或觸摸工具的輕擊動作來選擇顯示了對象210的部分區(qū)域。裝置100可通過使用圖像分割方法、級別設置方法等將在觸摸區(qū)域上顯示的對象與圖像的其余部分區(qū)分。

如圖2的200-2所示，裝置100可顯示指示對象210是感興趣區(qū)域的指示符220，其中指示符220突出顯示對象210的邊界?？墒褂酶鞣N其它類型的指示符來標識感興趣區(qū)域。

圖3是用于說明根據(jù)示例性實施例的通過改變對象310的大小提供針對對象310的指示符的方法的參考圖。

參照圖3的300-1，裝置100可接收用于選擇對象310作為感興趣區(qū)域的用戶輸入。例如，用戶可觸摸對象310的區(qū)域。響應于用戶輸入，如圖3的300-2所示，裝置100可選擇對象310作為感興趣區(qū)域，并顯示放大的對象320。對象310的放大可以是指示感興趣區(qū)域的指示符。選擇的對象310被放大，然而圖像的剩余部分保持原樣。

圖4是用于說明根據(jù)示例性實施例的通過改變感興趣區(qū)域的深度信息來提供針對對象410的指示符420的方法的參考圖。參照圖4的400-1，裝置100可接收選擇對象410作為感興趣區(qū)域的用戶輸入。隨后，裝置100可將對象410的邊界確定為感興趣區(qū)域，并且，如圖4的400-2所示，裝置100可提供改變對象410的深度的指示符420，使得對象410在被選擇之前被顯示。存在各種方法指示感興趣區(qū)域，然而這里僅提及了一些方法作為示例。因此，本公開的各種實施例可通過與使用到目前為止討論的方法不同地指示感興趣區(qū)域。

多個對象可被選擇作為感興趣區(qū)域。圖5是用于說明根據(jù)示例性實施例的在單個圖像上選擇多個對象511和512作為感興趣區(qū)域的方法的參考圖。參照圖5的500-1，裝置100可接收在圖像上選擇對象511作為感興趣區(qū)域的用戶輸入。例如，用戶可觸摸顯示了對象511的圖像的一個區(qū)域。隨后，如圖5的500-2所示，裝置100可顯示指示對象511是感興趣區(qū)域的第一指示符521。用戶可選擇添加圖標531并隨后圖像中的觸摸顯示對象512的區(qū)域。裝置100隨后可將用戶的這種動作確定為用于將對象512添加為感興趣區(qū)域的用戶輸入，并且如圖5的500-3所示，裝置100可顯示指示對象512也是感興趣區(qū)域的第二指示符522。

感興趣區(qū)域也可被改變。在圖5的500-2中，用戶可觸摸刪除圖標532，并且隨后選擇對象511，在對象511上顯示了第一指示框521。用戶的這種動作可提示裝置100刪除作為感興趣區(qū)域的對象511，并移除第一指示符521。裝置100隨后可確定僅對象512是感興趣區(qū)域。

一次用戶操作可被用于選擇多個對象作為感興趣區(qū)域。

圖6是用于說明根據(jù)另一個示例性實施例的在單個圖像上選擇多個對象作為感興趣區(qū)域的方法的參考圖。參照圖6的600-1，用戶可觸摸顯示了面部612的區(qū)域。裝置100可使用圖像分析信息檢測邊界線并將面部612確定為感興趣區(qū)域。裝置100可顯示指示感興趣區(qū)域的指示符622，如圖6的600-1所示。

裝置100可與觸摸時間成比例地增加感興趣區(qū)域的區(qū)域。例如，用戶持續(xù)觸摸顯示了面部612的區(qū)域，如圖6的600-2所示，則裝置100可確定面部612與人614相關聯(lián)。因此，裝置100可指定人614是感興趣區(qū)域，并顯示指示整個人614是感興趣區(qū)域的指示符624。

上面描述了通過觸摸選擇感興趣區(qū)域的方法，但本公開的各種實施例不限于此。例如，可通過拖拽動作選擇感興趣區(qū)域。面部612的區(qū)域可被觸摸并隨后被拖拽到顯示了人614的身體的區(qū)域。裝置100可使用這種輸入以選擇人614作為感興趣區(qū)域并顯示指示人614是感興趣區(qū)域的指示符624。

感興趣區(qū)域不僅可被應用于圖像的對象，還可被應用于圖像的背景。圖7是用于說明根據(jù)示例性實施例的選擇背景作為感興趣區(qū)域的參考圖。如圖7的700-1所示，用戶可觸摸天空712的區(qū)域，并且裝置100可使用圖像分析信息等確定與用戶觸摸的區(qū)域有關的邊界線。如圖7的700-2所示，可顯示指示天空712是感興趣區(qū)域的指示符722。如果用戶觸摸時間增加，裝置100可確定山和天空712是感興趣區(qū)域。

當背景被選作感興趣區(qū)域時，感興趣區(qū)域的擴展可被限制于背景。當對象是感興趣區(qū)域時，感興趣區(qū)域的擴展可被限制對象。然而，示例性實施例不限于此。感興趣區(qū)域可由與用戶選擇的區(qū)域有關的邊界線定義，并因此感興趣區(qū)域可被擴大到包括對象或背景。

也可使用多個圖像選擇感興趣區(qū)域。圖8是用于說明根據(jù)示例性實施例的使用第一圖像810和第二圖像820選擇感興趣區(qū)域的方法的參考圖。參照圖8，裝置100可顯示多個圖像。裝置100可接收選擇第一圖像810的第一部分圖像812作為感興趣區(qū)域的用戶輸入和選擇第二圖像820的第二部分圖像822作為感興趣區(qū)域的用戶輸入。隨后，裝置100可顯示指示第一部分圖像812是感興趣區(qū)域的第一指示符832和指示第二部分圖像822是感興趣區(qū)域的第二指示符834。

盡管第一部分圖像812作為第一圖像810的對象被示出，第二部分圖像822作為第二圖像820的背景被示出，但這僅是為了方便描述，并且第一部分圖像812和第二部分圖像822不限于此。選擇的第一部分圖像812和第二部分圖像822中的任何一個均可是對象或背景。第一圖像810和第二圖像820可以是相同的圖像。如上所示，由于感興趣區(qū)域可在對象或背景之間擴大，當一個圖像的對象和背景都被選作感興趣區(qū)域時，裝置100可顯示兩個第一圖像并根據(jù)用戶輸入在一個圖像中選擇對象在另一個圖像中選擇背景。

當選擇了感興趣區(qū)域時，裝置100可獲得感興趣區(qū)域的識別信息。

在本說明書中，“識別信息”是指識別圖像的關鍵詞、關鍵短語等，并且識別信息可針對每個對象和每個背景被定義。例如，對象和背景均可具有至少一條識別信息。根據(jù)本公開的示例性實施例，可使用圖像的屬性信息或圖像的圖像分析信息來獲得識別信息。

圖9是根據(jù)示例性實施例的裝置100從識別信息確定搜索詞的方法的流程圖。

在操作s910中，裝置100可從圖像選擇感興趣區(qū)域。例如，如上所述，裝置100可顯示圖像并響應于用戶輸入選擇圖像內的對象或背景作為感興趣區(qū)域。裝置100可提供指示感興趣區(qū)域的指示符。圖像可以是靜止圖像、作為運動圖像的一部分的運動圖像幀(即，運動圖像的靜止圖像)或實時取景圖像。當圖像是靜止圖像或運動圖像幀時，靜止圖像或運動圖像可以是在裝置100中預存儲的圖像，或可以是在外部裝置存儲并從外部裝置發(fā)送的圖像。當圖像是實時取景圖像時，實時取景圖像可以是由嵌入在裝置100中的相機捕捉的圖像，或由作為外部裝置的相機捕捉并發(fā)送的圖像。

在操作s920中，裝置100可確定在選擇的感興趣區(qū)域中是否定義了識別信息。例如，當圖像被存儲時，分別描述圖像中包括的對象和背景的若干條識別信息可與圖像匹配并被存儲。在這種情況下，裝置100可確定在選擇的感興趣區(qū)域中定義了識別信息。根據(jù)本公開的示例性實施例，分別與對象和背景相應的若干條識別信息可以以針對每個圖像的元數(shù)據(jù)的形式被存儲。

在操作s930，如果在選擇的感興趣區(qū)域中沒有定義識別信息，則裝置100可產(chǎn)生識別信息。例如，裝置100可通過使用以元數(shù)據(jù)的形式存儲的屬性信息或通過使用通過對圖像執(zhí)行圖像處理而獲得的圖像分析信息來產(chǎn)生識別信息。隨后操作s930將參照圖10進行更詳細的描述。

在操作s940中，裝置100可根據(jù)用戶輸入將識別信息中的至少一條確定為搜索詞。搜索詞可包括需要作為目標圖像的識別信息被包括的正搜索詞和不需要作為目標圖像的識別信息被包括的負搜索詞?？筛鶕?jù)用戶輸入確定搜索詞是正搜索詞還是負搜索詞。

圖10是根據(jù)示例性實施例的裝置100產(chǎn)生識別信息的方法的流程圖。圖10示出圖像中的感興趣區(qū)域的識別信息沒有被預定義的情況。圖10的識別信息產(chǎn)生方法也可適用于產(chǎn)生了目標圖像的識別信息的情況。

在操作s1010中，裝置100可確定是否存在與感興趣區(qū)域相應的屬性信息。例如，裝置100可檢測與感興趣區(qū)域相應的元數(shù)據(jù)。裝置100可從元數(shù)據(jù)中提取感興趣區(qū)域的屬性信息。

根據(jù)示例性實施例，屬性信息表示圖像的屬性，并可包括關于圖像的格式的信息、關于圖像的大小的信息、關于圖像中包括的對象的信息(例如，對象的類型、名字、狀態(tài)等)、圖像的源信息、由用戶添加的注釋信息、與圖像產(chǎn)生相關聯(lián)的情境信息(天氣、溫度等)等中的至少一個。

在操作s1020和s1040中，裝置100可概括圖像的屬性信息并產(chǎn)生識別信息。在一個實施例中，概括屬性信息可表示基于wordnet(分層術語參考系統(tǒng))在上層語言中表達屬性信息。其他實施例可使用其他方法或數(shù)據(jù)庫表達并存儲信息。

‘wordnet’是提供詞語的定義或使用模式并建立詞語之間的關系的數(shù)據(jù)庫。wordnet的基本結構包括具有語義相當?shù)脑~語的列表的邏輯組(被稱為同義詞集)和這些同義詞集之間的語義關系。同義詞關系包括上位詞、下位詞、部分關系和整體詞。wordnet中包括的名詞具有作為最上層的詞語的實體，并通過根據(jù)意思擴展實體形成下位詞。因此，通過對概念詞匯進行分類和定義，wordnet也可被稱作具有層次結構的本體(ontology)。

‘本體’是指共同概念化的正式和明確的規(guī)范。本體可被認為是一種由詞語和關系組成的詞典。在本體中，與特定域相關聯(lián)的詞語被分層次地表達，并且包括用于擴展詞語的推理規(guī)則。

例如，當感興趣區(qū)域是背景時，裝置100可將屬性信息中包括的位置信息分類為上級信息并產(chǎn)生識別信息。例如，裝置100可將全球定位系統(tǒng)(gps)坐標值(緯度：37.4872222,經(jīng)度：127.0530792)表達為上位概念(諸如，區(qū)域、建筑物、地址、地區(qū)名字、城市名字或國家名字)。在這種情況下，建筑物、地區(qū)名字、城市名字、國家名字等可作為背景的識別信息被產(chǎn)生。

在操作s1030和s1040中，如果與感興趣區(qū)域相應的屬性信息不存在時，裝置100可獲得感興趣區(qū)域的圖像分析信息，并可通過使用圖像信息產(chǎn)生感興趣區(qū)域的識別信息。

根據(jù)本公開的示例性實施例，圖像分析信息是與分析通過圖像處理獲得的數(shù)據(jù)的結果相應的信息。例如，圖像分析信息可包括關于在圖像上顯示的對象的信息(例如，對象的類型、狀態(tài)和名字)、關于圖像上示出的位置的信息、關于圖像上示出的季節(jié)或時間的信息和關于圖像上示出的氛圍或情緒的信息，但實施例不限于此。

例如，當感興趣區(qū)域是對象時，裝置100可檢測圖像中的對象的邊界線。根據(jù)本公開的示例性實施例，裝置100可將圖像中包括的對象的邊界線與預定義的模板進行比較并獲得可用于對象的類型、名字和任何其他信息。例如，當對象的邊界線與車輛的模板相似時，裝置100可將圖像中包括的對象識別為車輛。在這種情況下，裝置100可通過使用關于圖像中包括的對象的信息顯示識別信息‘汽車’。

可選地，裝置100可對圖像中包括的對象執(zhí)行面部識別。例如，裝置100可從圖像中檢測人的面部區(qū)域。面部區(qū)域檢測方法的示例可包括基于知識的方法、基于特征的方法、模板匹配方法和基于外觀的方法，但實施例不限于此。

裝置100可從檢測到的面部區(qū)域中提取面部特征(例如，作為面部主要部分的眼睛、鼻子和嘴的形狀)。為了從面部區(qū)域提取面部特征，可使用gabor濾波器、局部二值模式(lbp)等，但實施例不限于此。

裝置100可將從圖像內的面部區(qū)域提取出的面部特征與預注冊的用戶的面部特征進行比較。例如，當提取出的面部特征與預注冊的第一用戶的面部特征相似時，裝置100可確定第一用戶作為選擇的圖像中的部分圖像被包括。在這種情況下，裝置100可基于面部識別的結果產(chǎn)生識別信息‘第一用戶’。

可選地，當選擇的對象是人時，裝置100可識別人的姿勢。例如，裝置100可基于身體部位模型，確定對象的身體部位，組合確定的身體部位，并確定對象的姿勢。

身體部位模型可以是，例如，邊緣模型和部位模型中的至少一個。邊緣模型可以是包括普通人的輪廓信息的模型。部位模型可以是包括普通人的體積或部位信息的模型。

作為示例性實施例，身體部位可被劃分為十個部位。即，身體部位可被劃分為面部、軀干、左上手臂、左下手臂、右上手臂、右下手臂、左上腿部、左下腿部、右上腿部和右下腿部。

裝置100可使用確定的身體部位和基本身體部位位置信息確定對象的姿勢。例如，裝置100可使用基本身體部位位置信息(諸如面部位于軀干的上側的信息或面部和腿部位于人身體的相對的兩端的信息)確定對象的姿勢。

根據(jù)本公開的示例性實施例，裝置100可將圖像的某一區(qū)域與顏色圖(顏色直方圖)進行比較并提取視覺特征(諸如圖像的顏色分布、圖案和氛圍)作為圖像分析信息。裝置100可通過使用圖像的視覺特征來產(chǎn)生識別信息。例如，當圖像包括天空背景時，裝置100可通過使用天空背景的視覺特征來產(chǎn)生識別信息‘天空’。

根據(jù)本公開的示例性實施例，裝置100可以以區(qū)域為單位劃分圖像，搜索與每個區(qū)域最相似的群集，并產(chǎn)生與發(fā)現(xiàn)的群集相關聯(lián)的識別信息。

如果不存在與圖像相應的屬性信息，則裝置100可獲得圖像的圖像分析信息并通過使用圖像分析信息產(chǎn)生圖像的識別信息。

同時，圖10示出當圖像的屬性信息不存在時(但不限于此)裝置100獲得圖像的圖像分析信息的示例性實施例。

例如，裝置100可通過僅使用圖像分析信息或僅使用屬性信息來產(chǎn)生識別信息?？蛇x地，即使當存在屬性信息時，裝置100還可獲得圖像分析信息。在這種情況下，裝置100可通過使用屬性信息和圖像分析信息兩者來產(chǎn)生識別信息。

根據(jù)本公開的示例性實施例，裝置100可將基于屬性信息產(chǎn)生的若干條識別信息與基于圖像分析信息產(chǎn)生的若干條識別信息進行比較，并將相同的識別信息作為最終的識別信息。相同的識別信息可比不相同的識別信息具有更高的可靠性?？煽啃允侵笍膱D像中提取出的若干條識別信息被確認是合適的識別信息的程度。

圖11示出根據(jù)示例性實施例的圖像的屬性信息。如圖11所示，圖像的屬性信息可以以元數(shù)據(jù)的形式被存儲。例如，諸如類型1110、時間1111、gps1112、分辨率1113、大小1114和收集裝置1117的數(shù)據(jù)可作為針對每個圖像的屬性信息被存儲。

根據(jù)本公開的示例性實施例，在圖像產(chǎn)生期間使用的情境信息也可以以元數(shù)據(jù)的形式被存儲。例如，當裝置100產(chǎn)生第一圖像1101時，裝置109可天氣應用收集在產(chǎn)生第一圖像1101時的天氣信息(例如，多云)、溫度信息(例如，20攝氏度)等。裝置100可將天氣信息1115和溫度信息1116存儲作為屬性信息of01。裝置100可從日程應用收集在產(chǎn)生第一圖像1101時的事件信息(未示出)。在這種情況下，裝置100可將事件信息作為第一圖像1101的屬性信息存儲。

根據(jù)本公開的示例性實施例，由用戶輸入的用戶附加信息1118也可以以元數(shù)據(jù)的形式被存儲。例如，用戶附加信息1118可包括由用戶輸入的用于說明圖像的注釋信息和關于由用戶說明的對象的信息。

根據(jù)本公開的示例性實施例，作為關于圖像的圖像處理的結果而獲得的圖像分析信息(例如，對象信息1119等)可以以元數(shù)據(jù)的形式被存儲。例如，裝置100可將關于第一圖像110中包括的對象(例如，用戶1、用戶2、我和椅子)的信息作為關于第一圖像1101的屬性信息存儲。

圖12是用于說明裝置100基于圖像的屬性信息產(chǎn)生圖像的識別信息的示例的參考圖。

根據(jù)本公開的示例性實施例，裝置100可基于用戶輸入選擇圖像1210的背景1212作為感興趣區(qū)域。在這種情況下，裝置100可在圖像1210的屬性信息1220內的選擇的背景1212的屬性信息。裝置100可通過使用選擇的背景1212的屬性信息來檢測識別信息1230。

例如，當選擇作為感興趣區(qū)域的區(qū)域是背景時，裝置100可從屬性信息1220中檢測與背景相關聯(lián)的信息。裝置100可通過使用時間信息(例如，2012.5.3.15:13)產(chǎn)生關于季節(jié)‘春天’的識別信息，通過使用屬性信息1220內的位置信息(例如，緯度：37；25；26.928，經(jīng)度：126；35；31.235)來產(chǎn)生識別信息‘公園’，并通過使用屬性信息1220內的天氣信息(例如，多云)來產(chǎn)生識別信息‘多云’。

圖13是用于說明裝置100通過使用圖像分析信息產(chǎn)生識別信息的示例的參考圖。根據(jù)本公開的示例性實施例，裝置100可基于用戶輸入選擇圖像1310的第一對象1312作為感興趣區(qū)域。在這種情況下，裝置100可通過對第一對象1312執(zhí)行圖像分析來產(chǎn)生描述第一對象1312的識別信息(例如，人和笑臉)。

例如，裝置100可從感興趣區(qū)域中檢測人的面部區(qū)域。裝置100可從檢測到的面部區(qū)域中提取面部特征。裝置100可將提取出的面部特征與預注冊用戶的面部特征進行比較，并產(chǎn)生表示選擇的第一對象1312是用戶1的識別信息。裝置100也可基于檢測到的面部區(qū)域中的嘴唇形狀來產(chǎn)生識別信息‘微笑’。隨后，裝置100可從識別信息1320中獲得‘用戶1’和‘微笑’。

裝置100可顯示感興趣區(qū)域的識別信息?？墒÷燥@示識別信息。當存在多條感興趣區(qū)域的識別信息時，裝置100可選擇識別信息的至少一部分作為搜索詞。圖14示出根據(jù)示例性實施例的裝置100顯示識別信息列表1432的示例。用戶可觸摸顯示了面部1412的區(qū)域。裝置100可使用圖像分析信息檢測邊界線，確定面部1412是感興趣區(qū)域，并顯示指示感興趣區(qū)域的指示符1422。此外，裝置100可使用面部識別算法、圖像分析信息等獲得面部1412的識別信息，并且，如圖14的1400-1所示，顯示識別信息列表1432。

如果用戶持續(xù)觸摸面部1412，則裝置100可確定整個人1414是感興趣區(qū)域。在獲得整個人1414的識別信息之后，裝置100可顯示識別信息列表1432，如圖14的1400-2所示。此外，如果用戶持續(xù)觸摸，則裝置100可嘗試確定圖像中除了人1414之外是否還存在任何對象。如果沒有其他對象存在，則，如圖14的1400-3所示，裝置100獲得指示圖像是小孩1的圖片的識別信息并顯示識別信息列表1432。

裝置100可將獲得的識別信息中的至少一條信息確定為搜索詞。圖15是用于說明根據(jù)示例性實施例的從識別信息確定搜索詞的方法的參考圖。參照圖15的1500-1，裝置100可基于用戶輸入選擇圖像中的第一對象1512作為感興趣區(qū)域。裝置100可顯示指示第一對象1512是感興趣區(qū)域的指示符1522，獲得第一對象1512的識別信息，并顯示識別信息列表1530。例如，裝置100可獲得諸如詞語微笑、母親和眨眼的識別信息。

裝置100可從識別信息列表1530接收選擇至少一條信息的用戶輸入。如果用戶選擇正(+)圖標1542并且從識別信息中選擇詞語“母親”，則裝置100可確定詞語“母親”為正搜索詞，并且如圖15的1500-2所示，裝置100可顯示確定結果1532。如果用戶選擇負(-)圖標1544并且從識別信息中選擇詞語“長頭發(fā)”，則裝置100可使用詞語“長頭發(fā)”作為負搜索詞，并且，如圖15的1500-2所示，裝置100可顯示確定結果1534。

如上所述，可從多個圖像中確定搜索詞。圖16是用于說明根據(jù)示例性實施例的從多個圖像中確定搜索詞的方法的參考圖。

參照圖16的1600-1，裝置100可基于用戶輸入選擇第一圖像1610中的第一對象1612作為感興趣區(qū)域，獲得針對感興趣區(qū)域的識別信息，并顯示獲得結果1620。同樣地，裝置100可基于用戶輸入選擇第二圖像1630中的第二對象1630作為感興趣區(qū)域，獲得感興趣區(qū)域的識別信息，并顯示獲得結果1640。

裝置100可將第一對象1612的識別信息中的“天空”確定為負搜索詞，并且如圖1600-2所示，顯示確定結果1622。例如，如果用戶觸摸負圖標并隨后觸摸“天空”，則裝置100可將“天空”確定為負搜索詞。此外，裝置100可將第二對象1632的識別信息中的“母親”和“站姿”確定為正搜索詞并顯示確定結果1642。

當搜索圖像時，除了圖像的識別信息之外，裝置100可將直接由用戶輸入的文本添加為搜索詞。圖17是用于說明根據(jù)示例性實施例的裝置100將文本作為搜索詞包括的方法的參考圖。

參照圖17的1700-1，裝置100可基于用戶輸入選擇圖像1710中的第一對象1712作為感興趣區(qū)域，并顯示關于感興趣區(qū)域的識別信息列表1720。同時，當識別信息列表1720不包括將被搜索的搜索詞的識別信息時，用戶可選擇輸入窗口圖標1730。隨后，如圖17的1700-2所示，輸入窗口1740可被顯示為彈出窗口。用戶可在輸入窗口1740中描述識別信息。在圖17的1700-2中，用戶輸入文本1724“坐姿”。如圖17的1700-3所示，裝置100可顯示識別信息列表1720中包括的文本1724。識別信息在圖17中被描述為文本，但不限于此。用戶可畫畫，并且裝置100可從在輸入窗口1740上顯示的畫中獲得識別信息。

當確定了搜索詞時，裝置100可從圖像數(shù)據(jù)庫中搜索與搜索詞相應的圖像。圖18a到圖18d是用于說明根據(jù)示例性實施例的提供搜索結果的方法的參考圖。

如圖18a所示，裝置100可顯示關于圖像中的感興趣區(qū)域的識別信息列表1810，并通過用戶輸入確定至少一條識別信息。用戶可選擇確認按鈕(ok)1820。

隨后，如圖18b所示，裝置100可顯示圖像數(shù)據(jù)庫列表1830。裝置100可通過選擇圖像數(shù)據(jù)庫列表1830的至少一部分的用戶輸入來確定圖像數(shù)據(jù)庫。

裝置100可將確定的圖像數(shù)據(jù)庫的目標圖像的識別信息與搜索詞進行比較，并搜索與搜索詞相應的圖像。當目標圖像是靜止圖像時，裝置100可在靜止圖像單元中搜索圖像。當目標圖像是運動圖像時，裝置100可在運動圖像幀單元中搜索圖像。當搜索詞是正搜索詞時，裝置100可從圖像數(shù)據(jù)庫中搜索具有作為識別信息的正搜索詞的圖像。當搜索詞是負搜索詞時，裝置100可從圖像數(shù)據(jù)庫中搜索不具有作為識別信息的負搜索詞的圖像。

識別信息可以在圖像數(shù)據(jù)庫中包括的目標圖像中被預定義，或者也可在圖像數(shù)據(jù)庫中包括的目標圖像中不被預定義。如果識別信息在目標圖像中被預定義，則裝置100可基于目標圖像的識別信息是否適當?shù)嘏c搜索詞正匹配或負匹配來搜索圖像。如果在目標圖像中沒有預定義識別信息，則裝置100可產(chǎn)生目標圖像的識別信息。裝置100可基于搜索詞是否適當?shù)嘏c目標圖像的識別信息匹配來搜索圖像。然而，即使如上所述，識別信息被預定義，但本公開的各種實施例可添加附加的詞語作為識別信息。

如圖18c所示，裝置100可顯示發(fā)現(xiàn)的圖像1840。當存在多個發(fā)現(xiàn)的圖像1840時，裝置100可基于圖像產(chǎn)生時間信息、圖像產(chǎn)生位置信息、圖像的容量信息、圖像的分辨率信息和搜索順序中的至少一個來布置多個發(fā)現(xiàn)的圖像1840。可選地，裝置100可按時間順序顯示多個發(fā)現(xiàn)的圖像1840?？蛇x地，當目標圖像是運動圖像時，與搜索詞相應的圖像可以是運動圖像幀。因此，裝置100可使用運動圖像再現(xiàn)方法僅顯示與搜索詞相應的圖像。

可選地，如圖18d所示，裝置100可產(chǎn)生并顯示包括與搜索詞相應的圖像的第一文件夾1852和包括其他圖像的第二文件夾1854。圖像和圖像的鏈接信息可被存儲在第一文件夾1852和第二文件夾1854中。

應理解的是，這里描述的示例性實施例應被視為僅是描述性意義，而不是為了限制的目的。每個示例性實施例中對特征或方面的描述應通常應被視為可用于其它示例性實施例中的其他相似特征或方面。

雖然已經(jīng)參照附圖描述了一個或更多個示例性實施例，但本領域的普通技術人員將理解，在不脫離權利要求定義的精神和范圍的情況下，可在形式和細節(jié)上做出各種改變。

完整全部詳細技術資料下載

當前第1頁1 2

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：金惠善;裵秀晶;李圣午;鄭文植;車賢熙;崔成燾;崔賢秀;
技術所有人：三星電子株式會社;
我是此專利的發(fā)明人

上一篇：基于藍牙的校園智能門禁系統(tǒng)的制造方法與工藝
上一篇：具有人性化的電子通道系統(tǒng)的制造方法與工藝

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于搜索圖像的方法和裝置與流程