專利名稱:用于移動終端的視頻圖像信息搜索方法、系統(tǒng)及移動終端的制作方法
技術領域:
本發(fā)明涉及移動終端制造領域,特別涉及一種用于移動終端的視頻圖像信息搜索方法、系統(tǒng)及移動終端。
背景技術:
用戶在觀看視頻時經常會想要了解視頻中感興趣的事物的相關信息,比如想要了解影片中某個不知名字的演員的,想要知道視頻中某個風景秀麗的地方的具體位置,但是很難用文字信息準確的描述這些事物,使得用文字信息搜索這些事物的相關信息非常困難。目前,雖然有利用圖像識別技術查找相似圖片或者包含相似圖片的網頁的方法,但是需要開啟瀏覽器手動搜索這些事物的相關信息,不能自動執(zhí)行搜索,影響了用戶觀看視頻的連續(xù)性,用戶體驗差。
發(fā)明內容
本發(fā)明的目的旨在至少解決所述技術缺陷之一。為此,本發(fā)明的第一個目的在于提出一種用于移動終端的視頻圖像信息搜索方法,該方法滿足了用戶在連續(xù)觀看視頻的同時可以隨時獲取感興趣的對象的相關信息信息的需求,方便、智能,用戶體驗好。本發(fā)明的第二個目的在于提出一種用于移動終端的視頻圖像信息搜索系統(tǒng)。本發(fā)明的第三個目的在于提出一種移動終端。為達到所述目的,本發(fā)明第一方面的實施例公開了一種用于移動終端的視頻圖像信息搜索方法,包括以下步驟移動終端接收用戶輸入的視頻文件中的興趣圖像區(qū)域;獲取所述興趣圖像區(qū)域中的圖像對象,并將所述圖像對象上傳至服務器;所述服務器接收所述圖像對象,并查找與所述圖像對象相關的信息;以及所述服務器將所述與所述圖像對象相關的信息返回至所述移動終端。根據(jù)本發(fā)明實施例的用于移動終端的視頻圖像信息搜索方法,可以自動將視頻文件中用戶感興趣的圖像上傳至服務器并搜索相關信息返回給用戶,無需用戶手動搜索,滿足了用戶在連續(xù)觀看視頻的同時可以隨時獲取感興趣的對象的相關信息信息的需求,方便、智能,用戶體驗好。為達到所述目的,本發(fā)明第二方面的實施例公開了一種用于移動終端的視頻圖像信息搜索系統(tǒng),包括移動終端,用于接收用戶輸入的視頻文件中的興趣圖像區(qū)域,并獲取所述興趣圖像區(qū)域中的圖像對象,以及上傳所述圖像對象;以及服務器,用于接收所述移動終端上傳的所述圖像對象,并查找所述與所述圖像對象相關的信息,以及將所述與所述圖像對象相關的信息返回至所述移動終端。根據(jù)本發(fā)明實施例的用于移動終端的視頻圖像信息搜索系統(tǒng),自動將視頻文件中用戶感興趣的圖像相關信息返回給用戶,無需用戶手動搜索,并且通過用戶輸入的輔助信息對圖像對象進行區(qū)分,分別提取特征值,減少了移動終端對圖像對象識別的數(shù)據(jù)量,提高了對圖像對象識別的準確性,方便、智能、快捷,用戶體驗好。為達到所述目的,本發(fā)明第三方面的實施例公開了一種移動終端,包括輸入模塊,用于接收用戶輸入的視頻文件中的興趣圖像區(qū)域;獲取模塊,用于獲取所述興趣圖像區(qū)域中的圖像對象;上傳模塊,用于將所述圖像對象上傳至服務器;以及接收模塊,用于接收服務器返回的與所述圖像對象相關的信息。根據(jù)本發(fā)明實施例的移動終端,使用戶可以自動將視頻文件中用戶感興趣的圖像上傳至服務器并搜索相關信息返回給用戶,無需手動搜索,滿足了用戶在連續(xù)觀看視頻的同時可以隨時獲取感興趣的對象的相關信息信息的需求,使用方便、智能,用戶體驗好。本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
本發(fā)明所述的和/或附加的方面和優(yōu)點從下面結合附圖對實施例的描述中將變得明顯和容易理解,其中圖1為根據(jù)本發(fā)明一個實施例的用于移動終端的視頻圖像信息搜索方法的流程圖;圖2為根據(jù)本發(fā)明又一個實施例的用于移動終端的視頻圖像信息搜索方法的流程圖;圖3為根據(jù)本發(fā)明再一個實施例的用于移動終端的視頻圖像信息搜索方法的流程圖;圖4為根據(jù)本發(fā)明一個具體實施例的用于移動終端的視頻圖像信息搜索方法的流程圖;圖5為根據(jù)本發(fā)明以實施例的視頻圖像信息搜索系統(tǒng)的結構框圖;圖6為根據(jù)本發(fā)明一個實施例的移動終端的結構框圖。圖7為根據(jù)本發(fā)明又一個實施例的移動終端的結構框圖。圖8為根據(jù)本發(fā)明再一個實施例的移動終端的結構框圖。圖9為根據(jù)本發(fā)明一個具體實施例的移動終端的結構框圖。
具體實施例方式下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能解釋為對本發(fā)明的限制。相反,本發(fā)明的實施例包括落入所附加權利要求書的精神和內涵范圍內的所有變化、修改和等同物。在本發(fā)明的描述中,除非另有說明,“多個”的含義是兩個或兩個以上。流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用于實現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實施方式的范圍包括另外的實現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,這應被本發(fā)明的實施例所屬技術領域的技術人員所理解。下面參考附圖描述根據(jù)本發(fā)明實施例的用于移動終端的視頻圖像信息搜索方法、系統(tǒng)和移動終端?!N用于移動終端的視頻圖像信息搜索方法,包括以下步驟移動終端接收用戶輸入的視頻文件中的興趣圖像區(qū)域;獲取興趣圖像區(qū)域中的圖像對象,并將圖像對象上傳至服務器;服務器接收圖像對象,并查找與圖像對象相關的信息;以及服務器將與圖像對象相關的信息返回至移動終端。圖1為根據(jù)本發(fā)明一個實施例的用于移動終端的視頻圖像信息搜索方法的流程圖。如圖1所示,根據(jù)本發(fā)明實施例的用于移動終端的視頻圖像信息搜索方法包括下述步驟。步驟SlOl,移動終端接收用戶輸入的視頻文件中的興趣圖像區(qū)域。具體地,用戶在觀看視頻時,看到感興趣的圖像對象,可以暫停視頻,用手指或手寫筆在屏幕上圈出對象所在的興趣圖像區(qū)域,如果用戶覺得該對象在當前幀圖像不夠清晰,可以先通過視頻的前進或后退功能找到該對象的清晰圖像幀,然后再圈出該對象所在的興趣圖像區(qū)域,其中用戶感興趣的對象可以為視頻中出現(xiàn)的人、動物、建筑物、交通工具、槍械、風景等。步驟S102,獲取興趣圖像區(qū)域中的圖像對象,并將圖像對象上傳至服務器。步驟S103,服務器接收圖像對象,并查找與圖像對象相關的信息。具體地,服務器接收到移動終端發(fā)送的圖像對象后,查找與圖像對象相近或相關的圖像,或者包含圖像對象的網頁。步驟S104,服務器將與圖像對象相關的信息返回至移動終端。具體地,服務器將查找到的圖像或者網頁的鏈接返回給移動終端,便于用戶查看。根據(jù)本發(fā)明實施例的用于移動終端的視頻圖像信息搜索方法,可以自動將視頻文件中用戶感興趣的圖像上傳至服務器并搜索相關信息返回給用戶,無需用戶手動搜索,滿足了用戶在連續(xù)觀看視頻的同時可以隨時獲取感興趣的對象的相關信息信息的需求,方便、智能,用戶體驗好。圖2為根據(jù)本發(fā)明又一個實施例的用于移動終端的視頻圖像信息搜索方法的流程圖。如圖2所示,根據(jù)本發(fā)明實施例的視頻文件的搜索排序方法包括下述步驟。步驟S201,移動終端接收用戶輸入的縮放請求,并根據(jù)縮放請求對視頻文件進行預定比例的縮放。具體地,用戶在觀看視頻時,有可能會根據(jù)需要對視頻進行縮放,例如,當用戶需要全屏觀看時,就需要按照一定比例將視頻放大至屏幕大小。步驟S202,接收用戶在縮放后的視頻文件中輸入的興趣圖像區(qū)域。具體地,用戶在看到感興趣的圖像對象,可以暫??s放后的視頻,用手指或手寫筆在屏幕上圈出對象所在的興趣圖像區(qū)域,如果用戶覺得該對象在當前幀圖像不夠清晰,可以先通過視頻的前進或后退功能找到該對象的清晰圖像幀,然后再圈出該對象所在的興趣圖像區(qū)域,其中用戶感興趣的對象可以為視頻中出現(xiàn)的人、動物、建筑物、交通工具、槍械、風景等。步驟S203,根據(jù)縮放后的興趣圖像區(qū)域在視頻文件中按預定比例獲取圖像對象,并將圖像對象上傳至服務器。具體地,對于縮小的興趣圖像區(qū)域,則將其按照預定比例放大,然后獲取在視頻文件中對應的圖像對象,對于放大的興趣圖像區(qū)域,則將其按照預定比例縮小,然后獲取在視頻文件中對應的圖像對象。步驟S204,服務器接收圖像對象,并查找與圖像對象相關的信息。具體地,服務器接收到移動終端發(fā)送的圖像對象后,查找與圖像對象相近或相關的圖像,或者包含圖像對象的網頁。步驟S205,服務器將與圖像對象相關的信息返回至移動終端。具體地,服務器將查找到的圖像或者網頁的鏈接返回給移動終端,便于用戶查看。根據(jù)本發(fā)明實施例的用于移動終端的視頻圖像信息搜索方法,可以對視頻文件進行縮放,方便用戶獲取興趣圖像區(qū)域,滿足用戶觀看視頻的不同需求,提升用戶體驗。圖3為根據(jù)本發(fā)明再一個實施例的用于移動終端的視頻圖像信息搜索方法的流程圖。如圖3所示,根據(jù)本發(fā)明實施例的視頻文件的搜索排序方法包括下述步驟。步驟S301,移動終端接收用戶輸入的縮放請求,并根據(jù)縮放請求對視頻文件進行預定比例的縮放。具體地,用戶在觀看視頻時,有可能會根據(jù)需要對視頻進行縮放,例如,當用戶需要全屏觀看時,就需要按照一定比例將視頻放大至屏幕大小。步驟S302,接收用戶在縮放后的視頻文件中輸入的興趣圖像區(qū)域。具體地,用戶在看到感興趣的圖像對象,可以暫??s放后的視頻,用手指或手寫筆在屏幕上圈出對象所在的興趣圖像區(qū)域,如果用戶覺得該對象在當前幀圖像不夠清晰,可以先通過視頻的前進或后退功能找到該對象的清晰圖像幀,然后再圈出該對象所在的興趣圖像區(qū)域,其中用戶感興趣的對象可以為視頻中出現(xiàn)的人、動物、建筑物、交通工具、槍械、風景等。步驟S303,根據(jù)縮放后的興趣圖像區(qū)域在視頻文件中按預定比例獲取圖像對象。具體地,對于縮小的興趣圖像區(qū)域,則將其按照預定比例放大,然后獲取在視頻文件中對應的圖像對象,對于放大的興趣圖像區(qū)域,則將其按照預定比例縮小,然后獲取在視頻文件中對應的圖像對象。步驟S304,對圖像對象進行特征提取,獲得圖像對象的特征值,并將圖像對象的特征值發(fā)送至服務器。步驟S305,服務器接收特征值,并查找與圖像對象的特征值相關的信息。具體地,服務器接收到移動終端發(fā)送的圖像對象的特征值后,查找與圖像對象的特征值相近或相關的圖像,或者包含圖像對象的特征值的網頁。步驟S306,服務器將與圖像對象的特征值相關的信息返回至移動終端。具體地,服務器將查找到的圖像或者網頁的鏈接返回給移動終端,便于用戶查看。根據(jù)本發(fā)明實施例的用于移動終端的視頻圖像信息搜索方法,通過對圖像對象進行特征提取,并將圖像對象的特征值發(fā)送至服務器查找相關信息,減小了網絡傳輸?shù)呢摵?,也提高了服務器的查找效率,?jié)省圖像對象搜索時間,進一步提升用戶體驗。圖4為根據(jù)本發(fā)明一個具體實施例的用于移動終端的視頻圖像信息搜索方法的流程圖。如圖4所示,根據(jù)本發(fā)明實施例的視頻文件的搜索排序方法包括下述步驟。步驟S401,移動終端接收用戶輸入的縮放請求,并根據(jù)縮放請求對視頻文件進行預定比例的縮放。具體地,用戶在觀看視頻時,有可能會根據(jù)需要對視頻進行縮放,例如,當用戶需要全屏觀看時,就需要按照一定比例將視頻放大至屏幕大小。步驟S402,接收用戶在縮放后的視頻文件中輸入的興趣圖像區(qū)域。具體地,用戶在看到感興趣的圖像對象,可以暫??s放后的視頻,用手指或手寫筆在屏幕上圈出對象所在的興趣圖像區(qū)域,如果用戶覺得該對象在當前幀圖像不夠清晰,可以先通過視頻的前進或后退功能找到該對象的清晰圖像幀,然后再圈出該對象所在的興趣圖像區(qū)域,其中用戶感興趣的對象可以為視頻中出現(xiàn)的人、動物、建筑物、交通工具、槍械、風景等。步驟S403,根據(jù)縮放后的興趣圖像區(qū)域在視頻文件中按預定比例獲取圖像對象。具體地,對于縮小的興趣圖像區(qū)域,則將其按照預定比例放大,然后獲取在視頻文件中對應的圖像對象,對于放大的興趣圖像區(qū)域,則將其按照預定比例縮小,然后獲取在視頻文件中對應的圖像對象。步驟S404,接收用戶輸入的輔助信息,其中輔助信息包括指示圖像對象是第一物體還是第二物體,其中第一物體包括人和動物,第二物體包括剛性物體。具體地,剛性物體可以是風景、建筑、交通工具等物體。步驟S405,如果圖像對象是第一物體,則用生物特征識別技術提取圖像對象的gabor特征值。在本發(fā)明的一個實施例中,生物特征識別技術通過基于harr特征提取的adboost級聯(lián)分類器的檢測算法進行檢測,并通過基于adboost的gabor特征選擇及識別算法進行特征識別,得到gabor特征值。步驟S406,如果圖像對象是第二物體,則用surf特征提取算法提取圖像對象的surf特征值。具體地,surf特征提取算法是一種點檢測特征值提取算法,可以對剛性物體進行檢測獲取其surf特征值。步驟S407,將圖像對象的特征值和輔助信息上傳至服務器。步驟S408,服務器接收圖像對象的特征值和輔助信息,并查找與或圖像對象的特征值或輔助信息相關的信息。具體地,服務器接收到移動終端發(fā)送的圖像對象的特征值和輔助信息后,查找與圖像對象的特征值和輔助信息相近或相關的圖像,或者包含圖像對象的特征值和輔助信息的網頁。步驟S409,服務器將與圖像對象的特征值和輔助信息相關的信息返回至移動終端。具體地,服務器將查找到的圖像或者網頁的鏈接返回給移動終端,便于用戶查看。
根據(jù)本發(fā)明實施例的用于移動終端的視頻圖像信息搜索方法,通過用戶輸入的輔助信息對圖像對象進行區(qū)分,分別提取特征值,減少了移動終端對圖像對象識別的數(shù)據(jù)量,既提高了對圖像對象識別的準確性,也進一步縮短了圖像信息搜索時間。為了實現(xiàn)上述實施例,本發(fā)明還提出一種視頻圖像信息搜索系統(tǒng)。一種視頻圖像信息搜索系統(tǒng),包括移動終端,用于接收用戶輸入的視頻文件中的興趣圖像區(qū)域,并獲取興趣圖像區(qū)域中的圖像對象,以及上傳圖像對象;以及服務器,用于接收移動終端上傳的圖像對象,并查找與圖像對象相關的信息,以及將與圖像對象相關的信息返回至移動終端。圖5為根據(jù)本發(fā)明一個實施例的視頻圖像信息搜索系統(tǒng)的結構框圖。如圖5所示,根據(jù)本發(fā)明實施例的視頻圖像信息搜索系統(tǒng)包括移動終端100和服務器200。具體地,移動終端100用于接收用戶輸入的視頻文件中的興趣圖像區(qū)域,并獲取興趣圖像區(qū)域中的圖像對象,以及上傳圖像對象。更具體地,用戶在觀看視頻時,看到感興趣的圖像對象,可以暫停視頻,用手指或手寫筆在屏幕上圈出對象所在的興趣圖像區(qū)域,如果用戶覺得該對象在當前幀圖像不夠清晰,可以先通過視頻的前進或后退功能找到該對象的清晰圖像幀,然后再圈出該對象所在的興趣圖像區(qū)域,其中用戶感興趣的對象可以為視頻中出現(xiàn)的人、動物、建筑物、交通工具、槍械、風景等。服務器200用于接收移動終端上傳的圖像對象,并查找與圖像對象相關的信息,以及將與圖像對象相關的信息返回至移動終端。更具體地,服務器接收到移動終端發(fā)送的圖像對象后,查找與圖像對象相近或相關的圖像,或者包含圖像對象的網頁,并將查找到的圖像或者網頁的鏈接返回給移動終端,便于用戶查看。在本發(fā)明的一個實施例中,移動終端100還用于接收用戶輸入的縮放請求,根據(jù)縮放請求對視頻文件進行預定比例的縮放,并接收用戶在所述縮放后的視頻文件中輸入的興趣圖像區(qū)域,以及根據(jù)縮放后的興趣圖像區(qū)域在視頻文件中按預定比例獲取圖像對象。具體地,用戶在觀看視頻時,有可能會根據(jù)需要對視頻進行縮放,例如,當用戶需要全屏觀看時,就需要按照一定比例將視頻放大至屏幕大小,如果用戶看到感興趣的圖像對象,就可以暫??s放后的視頻,用手指或手寫筆在屏幕上圈出對象所在的興趣圖像區(qū)域,如果用戶覺得該對象在當前幀圖像不夠清晰,可以先通過視頻的前進或后退功能找到該對象的清晰圖像幀,然后再圈出該對象所在的興趣圖像區(qū)域,其中用戶感興趣的對象可以為視頻中出現(xiàn)的人、動物、建筑物、交通工具、槍械、風景等,然后對于縮小的興趣圖像區(qū)域,則將其按照預定比例放大,對于放大的興趣圖像區(qū)域,則將其按照預定比例縮小,獲取并上傳興趣圖像區(qū)域在視頻文件中對應的圖像對象。在本發(fā)明的另一個實施例中,移動終端100還用于對圖像對象進行特征提取,獲取圖像對象的特征值。具體地移動終端100用于接收用戶輸入的輔助信息,其中輔助信息包括指示圖像對象是第一物體還是第二物體,其中第一物體包括人和動物,第二物體包括剛性物體,并在輔助信息指示圖像對象是第一物體時,用生物特征識別技術提取圖像對象的gabor特征值,在輔助信息指示圖像對象是第二物體時,用surf特征提取算法提取圖像對象的surf特征值,以及上傳圖像對象的特征值和輔助信息。更具體地,生物特征識別技術通過基于harr特征提取的adboost級聯(lián)分類器的檢測算法進行檢測,并通過基于adboost的gabor特征選擇及識別算法進行特征識別,得到gabor特征值。surf特征提取算法是一種點檢測特征值提取算法,可以對剛性物體進行檢測獲取其surf特征值,其中剛性物體可以是風景、建筑、交通工具等物體。服務器200還用于接收圖像對象的特征值和輔助信息,并查找與或圖像對象的特征值或輔助信息相關的信息,以及將與圖像對象的特征值和輔助信息相關的信息返回至移動終端。具體地,服務器接收到移動終端發(fā)送的圖像對象的特征值和輔助信息后,查找與圖像對象的特征值和輔助信息相近或相關的圖像,或者包含圖像對象的特征值和輔助信息的網頁,并將查找到的圖像或者網頁的鏈接返回給移動終端,便于用戶查看。根據(jù)本發(fā)明實施例的視頻文件的搜索排序系統(tǒng),自動將視頻文件中用戶感興趣的圖像相關信息返回給用戶,無需用戶手動搜索,并且通過用戶輸入的輔助信息對圖像對象進行區(qū)分,分別提取特征值,減少了移動終端對圖像對象識別的數(shù)據(jù)量,提高了對圖像對象識別的準確性,方便、智能、快捷,用戶體驗好。為了實現(xiàn)上述實施例,本發(fā)明還提出一種移動終端。一種移動終端,包括輸入模塊,用于接收用戶輸入的視頻文件中的興趣圖像區(qū)域;獲取模塊,用于獲取興趣圖像區(qū)域中的圖像對象;上傳模塊,用于將圖像對象上傳至服務器;以及接收模塊,用于接收服務器返回的與圖像對象相關的信息。圖6為根據(jù)本發(fā)明一個實施例的移動終端的結構框圖。如圖6所示,根據(jù)本發(fā)明實施例的移動終端包括輸入模塊110、獲取模塊120、上傳模塊130和接收模塊140。具體地,輸入模塊110用于接收用戶輸入的視頻文件中的興趣圖像區(qū)域。更具體地,用戶在觀看視頻時,看到感興趣的圖像對象,可以暫停視頻,用手指或手寫筆在屏幕上圈出對象所在的興趣圖像區(qū)域,如果用戶覺得該對象在當前幀圖像不夠清晰,可以先通過視頻的前進或后退功能找到該對象的清晰圖像幀,然后再圈出該對象所在的興趣圖像區(qū)域,其中用戶感興趣的對象可以為視頻中出現(xiàn)的人、動物、建筑物、交通工具、槍械、風景等。獲取模塊120用于獲取興趣圖像區(qū)域中的圖像對象。上傳模塊130用于將圖像對象上傳至服務器。接收模塊140用于接收服務器返回的與圖像對象相關的信息。更具體地,接收模塊接收服務器返回的與圖像對象相近或相關的圖像的鏈接。根據(jù)本發(fā)明實施例的移動終端,使用戶可以自動將視頻文件中用戶感興趣的圖像上傳至服務器并搜索相關信息返回給用戶,無需手動搜索,滿足了用戶在連續(xù)觀看視頻的同時可以隨時獲取感興趣的對象的相關信息信息的需求,使用方便、智能,用戶體驗好。圖7為根據(jù)本發(fā)明又一個實施例的移動終端的結構框圖。如圖7所示,根據(jù)本發(fā)明實施例的移動終端在圖6所示的基礎上還包括縮放模塊150。具體地,縮放模塊150用于接收用戶輸入的縮放請求,并根據(jù)所述縮放請求對所述視頻文件進行預定比例的縮放,其中輸入模塊110還用于接收用戶在縮放后的視頻文件中輸入的興趣圖像區(qū)域;以及獲取模塊120還用于根據(jù)縮放后的興趣圖像區(qū)域在視頻文件中按預定比例獲取圖像對象。根據(jù)本發(fā)明實施例的移動終端,通過縮放模塊可以對視頻文件進行縮放,方便用戶獲取興趣圖像區(qū)域,滿足用戶觀看視頻的不同需求,提升用戶體驗。圖8為根據(jù)本發(fā)明再一個實施例的移動終端的結構框圖。如圖8所示,根據(jù)本發(fā)明實施例的移動終端在圖7所示的基礎上還包括特征提取模塊160。具體地,特征提取模塊160用于對圖像對象進行特征提取,獲取圖像對象的特征值。其中,上傳模塊130還用于將特征提取模塊160提取的圖像對象的特征值上傳至服務器。根據(jù)本發(fā)明實施例的移動終端,通過特征提取模塊對圖像對象進行特征提取,并將圖像對象的特征值發(fā)送至服務器查找相關信息,減小了網絡傳輸?shù)呢摵?,也提高了服務器的查找效率,?jié)省圖像對象搜索時間,進一步提升用戶體驗。圖9為根據(jù)本發(fā)明一個具體實施例的移動終端的結構框圖。如圖9所示,根據(jù)本發(fā)明實施例的移動終端包括輸入模塊110、獲取模塊120、上傳模塊130、接收模塊140、縮放模塊150、特征提取模塊160、接收單元162、第一提取單元162和第二提取單元163,其中特征提取模塊包括接收單元162、第一提取單元162和第二提取單元163。具體地,接收單元161用于接收用戶輸入的輔助信息,其中輔助信息包括指示圖像對象是第一物體還是第二物體,其中第一物體包括人和動物,第二物體包括剛性物體。更具體地,剛性物體可以是風景、建筑、交通工具等物體。第一提取單元162用于在輔助信息指示圖像對象是第一物體時,用生物特征識別技術提取圖像對象的gabor特征值。在本發(fā)明的一個實施例中,生物特征識別技術通過基于harr特征提取的adboost級聯(lián)分類器的檢測算法進行檢測,并通過基于adboost的gabor特征選擇及識別算法進行特征識別,得到gabor特征值。第二提取單元163用于在輔助信息指示圖像對象是第二物體時,用surf特征提取算法提取圖像對象的surf特征值。更具體地,surf特征提取算法是一種點檢測特征值提取算法,可以對剛性物體進行檢測獲取其surf特征值。在本發(fā)明的實施例中,上傳模塊130還用于將圖像對象的特征值和輔助信息上傳至服務器。根據(jù)本發(fā)明實施例的移動終端,用戶可以通過輸入模塊輸入圖像對象的輔助信息區(qū)分圖像對象,使得終端對把不同的圖像對象可以分別提取特征值,減少了移動終端對圖像對象識別的數(shù)據(jù)量,既提高了對圖像對象識別的準確性,也進一步縮短了圖像信息搜索時間。應當理解,在本發(fā)明的實施例中,移動終端可以是手機、平板電腦、個人數(shù)字助理等具有視頻播放功能的硬件設備。在本說明書的描述中,參考術語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結合該實施例或示例描述的具體特征、結構、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對所述術語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結構、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結合。盡管已經示出和描述了本發(fā)明的實施例,對于本領域的普通技術人員而言,可以理解在不脫離本發(fā)明的原理和精神的情況下可以對這些實施例進行多種變化、修改、替換和變型,本發(fā)明的范圍由所附權利要求及其等同限定。
權利要求
1.一種用于移動終端的視頻圖像信息搜索方法,其特征在于,包括以下步驟移動終端接收用戶輸入的視頻文件中的興趣圖像區(qū)域;獲取所述興趣圖像區(qū)域中的圖像對象,并將所述圖像對象上傳至服務器;所述服務器接收所述圖像對象,并查找與所述圖像對象相關的信息;以及所述服務器將所述與所述圖像對象相關的信息返回至所述移動終端。
2.根據(jù)權利要求1所述的方法,其特征在于,還包括以下步驟所述移動終端接收用戶輸入的縮放請求,并根據(jù)所述縮放請求對所述視頻文件進行預定比例的縮放,以及接收所述用戶在所述縮放后的視頻文件中輸入的興趣圖像區(qū)域;以及根據(jù)所述縮放后的興趣圖像區(qū)域在所述視頻文件中按所述預定比例獲取所述圖像對象。
3.根據(jù)權利要求1或2所述的方法,其特征在于,還包括以下步驟對所述圖像對象進行特征提取,獲得所述圖像對象的特征值。
4.根據(jù)權利要求3所述的方法,其特征在于,對所述圖像對象進行特征提取,獲得所述圖像對象的特征值的步驟具體包括以下步驟接收所述用戶輸入的輔助信息,其中所述輔助信息包括指示所述圖像對象是第一物體還是第二物體,其中所述第一物體包括人和動物,所述第二物體包括剛性物體;如果所述圖像對象是所述第一物體,則用生物特征識別技術提取所述圖像對象的 gabor特征值;以及如果所述圖像對象是所述第二物體,則用surf特征提取算法提取所述圖像對象的 surf特征值。
5.根據(jù)權利要求3或4所述的方法,其特征在于,還包括以下步驟將所述圖像對象的特征值和所述輔助信息上傳至所述服務器。
6.一種視頻圖像信息搜索系統(tǒng),其特征在于,包括移動終端,用于接收用戶輸入的視頻文件中的興趣圖像區(qū)域,并獲取所述興趣圖像區(qū)域中的圖像對象,以及上傳所述圖像對象;以及服務器,用于接收所述移動終端上傳的所述圖像對象,并查找所述與所述圖像對象相關的信息,以及將所述與所述圖像對象相關的信息返回至所述移動終端。
7.根據(jù)權利要求6所述的系統(tǒng),其特征在于,所述移動終端還用于接收用戶輸入的縮放請求,根據(jù)所述縮放請求對所述視頻文件進行預定比例的縮放,并接收所述用戶在所述縮放后的視頻文件中輸入的興趣圖像區(qū)域,以及根據(jù)所述縮放后的興趣圖像區(qū)域在所述視頻文件中按所述預定比例獲取所述圖像對象。
8.根據(jù)權利要求6或7所述的系統(tǒng),其特征在于,所述移動終端還用于對所述圖像對象進行特征提取,獲取所述圖像對象的特征值。
9.根據(jù)權利要求8所述的系統(tǒng),其特征在于,所述移動終端還用于接收所述用戶輸入的輔助信息,其中所述輔助信息包括指示所述圖像對象是第一物體還是第二物體,其中所述第一物體包括人和動物,所述第二物體包括剛性物體,并在所述輔助信息指示所述圖像對象是所述第一物體時,用生物特征識別技術提取所述圖像對象的gabor特征值,在所述輔助信息指示所述圖像對象是所述第二物體時,用surf特征提取算法提取所述圖像對象的surf特征值。
10.根據(jù)權利要求8或9所述的系統(tǒng),其特征在于,所述移動終端還用于將所述圖像對象的特征值和所述輔助信息上傳至所述服務器。
11.一種移動終端,其特征在于,包括 輸入模塊,用于接收用戶輸入的視頻文件中的興趣圖像區(qū)域; 獲取模塊,用于獲取所述興趣圖像區(qū)域中的圖像對象; 上傳模塊,用于將所述圖像對象上傳至服務器;以及 接收模塊,用于接收服務器返回的與所述圖像對象相關的信息。
12.根據(jù)權利要求11所述的移動終端,其特征在于,還包括 縮放模塊,用于接收用戶輸入的縮放請求,并根據(jù)所述縮放請求對所述視頻文件進行預定比例的縮放,其中 所述輸入模塊還用于接收所述用戶在所述縮放后的視頻文件中輸入的興趣圖像區(qū)域;以及 所述獲取模塊還用于根據(jù)所述縮放后的興趣圖像區(qū)域在所述視頻文件中按所述預定比例獲取所述圖像對象。
13.根據(jù)權利要求11或12所述的移動終端,其特征在于,還包括 特征提取模塊,用于對所述圖像對象進行特征提取,獲取所述圖像對象的特征值。
14.根據(jù)權利要求13所述的移動終端,其特征在于,所述特征提取模塊具體包括 接收單元,用于接收所述用戶輸入的輔助信息,其中所述輔助信息包括指示所述圖像對象是第一物體還是第二物體,其中所述第一物體包括人和動物,所述第二物體包括剛性物體; 第一提取單元,用于在所述輔助信息指示所述圖像對象是所述第一物體時,用生物特征識別技術提取所述圖像對象的gabor特征值;以及 第二提取單元,用于在所述輔助信息指示所述圖像對象是所述第二物體時,用surf特征提取算法提取所述圖像對象的surf特征值。
15.根據(jù)權利要求13或14所述的移動終端,其特征在于,所述上傳模塊還用于將所述圖像對象的特征值和所述輔助信息上傳至所述服務器。
全文摘要
本發(fā)明提出一種用于移動終端的視頻圖像信息搜索方法、系統(tǒng)及移動終端,其中所述方法包括移動終端接收用戶輸入的視頻文件中的興趣圖像區(qū)域;獲取興趣圖像區(qū)域中的圖像對象,并將圖像對象上傳至服務器;服務器接收圖像對象,并查找與圖像對象相關的信息;以及服務器將與圖像對象相關的信息返回至移動終端。根據(jù)本發(fā)明實施例的方法,可以自動將視頻文件中用戶感興趣的圖像上傳至服務器并搜索相關信息返回給用戶,無需用戶手動搜索,滿足了用戶在連續(xù)觀看視頻的同時可以隨時獲取感興趣的對象的相關信息信息的需求,方便、智能,用戶體驗好。
文檔編號G06F17/30GK103020173SQ201210493069
公開日2013年4月3日 申請日期2012年11月27日 優(yōu)先權日2012年11月27日
發(fā)明者鄧雄書, 何飛 申請人:北京百度網訊科技有限公司