本申請涉及計算機領域,尤其涉及一種用于確定ar視頻的識別圖片的技術(shù)。
背景技術(shù):
ar(augmentedreality,增強現(xiàn)實)技術(shù)是一種實時地計算攝影機影像的位置及角度并加上相應圖像、視頻、3d模型的技術(shù),這種技術(shù)的目標是在屏幕上把虛擬世界套在現(xiàn)實世界并進行互動。通過該技術(shù)應用得比較多的就是ar視頻,ar視頻通過識別圖片展示對應視頻的ar效果。
關(guān)于ar視頻的制作,業(yè)界目前普遍的做法是將識別圖片和視頻分開處理,該做法容易引起圖片與視頻整合效果不好、編輯制作麻煩的問題。
技術(shù)實現(xiàn)要素:
本申請的一個目的是提供一種用于確定ar視頻的識別圖片的方法與設備。
根據(jù)本申請的一個方面,提供了一種用于確定ar視頻的識別圖片的方法,其中,該方法包括:
獲取目標視頻,其中,所述目標視頻包括若干個候選圖片;
檢測所述候選圖片的特征信息;
將所述特征信息符合預定特征條件的所述候選圖片確定為ar視頻的識別圖片,其中,所述ar視頻基于所述目標視頻生成。
根據(jù)本申請的另一個方面,提供了一種包括指令的計算機可讀介質(zhì),所述指令在被執(zhí)行時使得系統(tǒng)進行如上所述方法的操作。
根據(jù)本申請的又一個方面,提供了一種用于確定ar視頻的識別圖片的設備,其中,該設備包括:
處理器;以及
被安排成存儲計算機可執(zhí)行指令的存儲器,所述可執(zhí)行指令在被執(zhí)行時使所述處理器執(zhí)行如上所述的方法。
與現(xiàn)有技術(shù)相比,本申請獲取目標視頻,所述目標視頻包括若干個候選圖片,檢測所述候選圖片的特征信息,在制作所述目標視頻對應的ar視頻的過程中,將所述特征信息符合預定特征條件的所述候選圖片確定為所述ar視頻的識別圖片;本申請通過檢測所述候選圖片的特征信息來確定所述目標視頻對應的ar視頻的識別圖片,在制作ar視頻的過程中無需將識別圖片和目標視頻分開處理,避免了編輯制作麻煩的問題,而且制作所得的ar視頻融合性較好。進一步地,本申請存儲所述識別圖片的特征信息,用于后續(xù)的識別跟蹤,解決了播放目標視頻時對齊所述識別圖片與所述目標視頻的麻煩。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征、目的和優(yōu)點將會變得更明顯:
圖1示出根據(jù)本申請一個實施例的一種用于確定ar視頻的識別圖片的方法流程圖;
圖2示出根據(jù)本申請另一個實施例的一種用于確定ar視頻的識別圖片的方法流程圖;
圖3示出根據(jù)本申請又一個實施例的一種用于確定ar視頻的識別圖片的方法流程圖。
附圖中相同或相似的附圖標記代表相同或相似的部件。
具體實施方式
下面結(jié)合附圖對本申請作進一步詳細描述。
在本申請一個典型的配置中,終端、服務網(wǎng)絡的設備和可信方均包括一個或多個處理器(cpu)、輸入/輸出接口、網(wǎng)絡接口和內(nèi)存。
內(nèi)存可能包括計算機可讀介質(zhì)中的非永久性存儲器,隨機存取存儲器(ram)和/或非易失性內(nèi)存等形式,如只讀存儲器(rom)或閃存(flashram)。內(nèi)存是計算機可讀介質(zhì)的示例。
計算機可讀介質(zhì)包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術(shù)來實現(xiàn)信息存儲。信息可以是計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計算機的存儲介質(zhì)的例子包括,但不限于相變內(nèi)存(pram)、靜態(tài)隨機存取存儲器(sram)、動態(tài)隨機存取存儲器(dram)、其他類型的隨機存取存儲器(ram)、只讀存儲器(rom)、電可擦除可編程只讀存儲器(eeprom)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲器(cd-rom)、數(shù)字多功能光盤(dvd)或其他光學存儲、磁盒式磁帶,磁帶磁盤存儲或其他磁性存儲設備或任何其他非傳輸介質(zhì),可用于存儲可以被計算設備訪問的信息。
本申請所指設備1包括但不限于用戶設備、網(wǎng)絡設備、或用戶設備與網(wǎng)絡設備通過網(wǎng)絡相集成所構(gòu)成的設備。所述用戶設備包括但不限于任何一種可與用戶進行人機交互的移動電子產(chǎn)品,例如智能手機、平板電腦等,所述移動電子產(chǎn)品可以采用任意操作系統(tǒng),如android操作系統(tǒng)、ios操作系統(tǒng)、windows操作系統(tǒng)等。其中,所述網(wǎng)絡設備包括一種能夠按照事先設定或存儲的指令,自動進行數(shù)值計算和信息處理的電子設備,其硬件包括但不限于微處理器、專用集成電路(asic)、可編程邏輯器件(pld)、現(xiàn)場可編程門陣列(fpga)、數(shù)字信號處理器(dsp)、嵌入式設備等。所述網(wǎng)絡設備包括但不限于計算機、網(wǎng)絡主機、單個網(wǎng)絡服務器、多個網(wǎng)絡服務器集或多個服務器構(gòu)成的云;在此,云由基于云計算(cloudcomputing)的大量計算機或網(wǎng)絡服務器構(gòu)成,其中,云計算是分布式計算的一種,由一群松散耦合的計算機集組成的一個虛擬超級計算機。所述網(wǎng)絡包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、vpn網(wǎng)絡、無線自組織網(wǎng)絡(adhoc網(wǎng)絡)等。優(yōu)選地,所述設備1還可以是運行于所述用戶設備、網(wǎng)絡設備、或用戶設備與網(wǎng)絡設備、網(wǎng)絡設備、觸摸終端或網(wǎng)絡設備與觸摸終端通過網(wǎng)絡相集成所構(gòu)成的設備上的程序。
當然,本領域技術(shù)人員應能理解上述設備1僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的設備如可適用于本申請,也應包含在本申請保護范圍以內(nèi),并在此以引用方式包含于此。
圖1示出根據(jù)本申請一個實施例的一種用于確定ar視頻的識別圖片的方法流程圖,其中,該方法包括步驟s11、步驟s12和步驟s13。
具體地,步驟s11中,設備1獲取目標視頻,其中,所述目標視頻包括若干個候選圖片;步驟s12中,設備1檢測所述候選圖片的特征信息;步驟s12中,設備1將所述特征信息符合預定特征條件的所述候選圖片確定為ar視頻的識別圖片,其中,所述ar視頻基于所述目標視頻生成。
例如,所述目標視頻包括但不限于手機錄制的視頻、網(wǎng)上下載的視頻、所述設備1錄制的視頻。所述設備1獲取所述目標視頻,并制作所述目標視頻對應的ar視頻(ar視頻通過識別圖片展示對應視頻的ar效果)。其中,所述設備1包括但不限于用戶設備、云端服務器,即,既可以由用戶設備獲取所述目標視頻并制作所述目標視頻對應的ar視頻,也可以由云端服務器獲取所述目標視頻并制作所述目標視頻對應的ar視頻。制作所得的ar視頻既可以存儲于云端服務器,也可以存儲于用戶設備。
連續(xù)的圖像變化每秒超過24幀(frame)畫面以上時,根據(jù)視覺暫留原理,人眼無法辨別單幅的靜態(tài)畫面;看上去是平滑連續(xù)的視覺效果,這樣連續(xù)的畫面叫做視頻。
所述候選圖片可以是所述目標視頻中的任意一幀畫面。所述設備1可以通過sift(scale-invariantfeaturetransform,尺度不變特征轉(zhuǎn)換)算法、vlad(vectoroflocallyaggregateddescriptors,局部特征聚合描述符)算法等方式檢測所述候選圖片的特征信息。然后,將所述特征信息符合預定特征條件(例如特征點足夠豐富)的所述候選圖片確定為所述目標視頻對應的ar視頻的識別圖片。其中,所述目標視頻對應的ar視頻的識別圖片的數(shù)量可以為一張或多張。所述ar視頻可以包括所述目標視頻的全部幀畫面,或者,所述ar視頻也可以包括所述目標視頻的部分幀畫面(例如,將所述識別圖片作為所述ar視頻的第一幀畫面,所述ar視頻包括所述目標視頻中在所述識別圖片之后的幀畫面,不包括所述目標視頻中在所述識別圖片之前的幀畫面)。
當然,本領域技術(shù)人員應能理解上述sift算法、vlad算法僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的算法如可適用于本申請,也應包含在本申請保護范圍以內(nèi),并在此以引用方式包含于此。
優(yōu)選地,所述預定特征條件包括以下至少任一項:所述候選圖片的特征點數(shù)量大于或等于預定數(shù)量閾值;所述候選圖片的特征點分布均勻度大于或等于預定分布均勻閾值。
例如,可以通過sift算法檢測所述候選圖片的特征信息;sift算法用于偵測與描述影像中的局部性特征,它在空間尺度中尋找極值點,并提取出其位置、尺度、旋轉(zhuǎn)不變量;如果預定數(shù)量閾值為50個,那么所述預定特征條件可以包括:所述候選圖片的特征點數(shù)量大于或等于50個。
再例如,如果在圖像不同區(qū)域(或方向)的特征點數(shù)目相等或接近,那么說明特征點分布比較均勻。可以通過以下三個步驟計算分布均勻度:(1)圖像的區(qū)域劃分;(2)每個圖像區(qū)域內(nèi)的特征點數(shù)目統(tǒng)計;(3)表示不同圖像區(qū)域內(nèi)的特征點數(shù)目相差程度的數(shù)學量,如公式u=-101log(v)。然后,比較所述候選圖片的特征點分布均勻度與預定分布均勻閾值,選出特征點分布較為均勻的所述候選圖片。
優(yōu)選地,步驟s11中,設備1獲取目標視頻,按幀解碼所述目標視頻,以獲得若干個候選圖片,其中,所述目標視頻包括若干個候選圖片。
例如,可以使用視頻解碼器(如ffmpeg、android平臺的mediacodec、ios平臺的avfoundation)解碼出所述目標視頻的各幀畫面。所述候選圖片可以是所述目標視頻中的任意一幀畫面。
當然,本領域技術(shù)人員應能理解上述ffmpeg、mediacodec、avfoundation僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的視頻解碼器如可適用于本申請,也應包含在本申請保護范圍以內(nèi),并在此以引用方式包含于此。
優(yōu)選地,步驟s13中,設備1將所述特征信息符合預定特征條件的所述候選圖片確定為所述ar視頻的備選識別圖片,其中,所述ar視頻基于所述目標視頻生成;根據(jù)用戶基于所述備選識別圖片的選擇信息,從所述備選識別圖片中確定識別圖片。
例如,所述設備1先根據(jù)預定特征條件選出備選識別圖片,將備選識別圖片提供給用戶選擇;然后,獲取用戶基于所述備選識別圖片的選擇信息,再從所述備選識別圖片中確定識別圖片。
優(yōu)選地,如圖2所示,所述方法還包括步驟s14’;步驟s14’中,設備1存儲所述識別圖片的特征信息。
例如,步驟s12’中,設備1可以通過sift算法、vlad算法等方式檢測所述候選圖片的特征信息;若在步驟s13’中,設備1將候選圖片a確定為所述識別圖片;步驟s14’中,設備1存儲候選圖片a(即所述識別圖片)的特征信息。比如,設備1可以將所述識別圖片的特征信息存儲為特征文件,用于后續(xù)的識別跟蹤。此外,用戶還可以將所述識別圖片打印出來,以便后續(xù)通過攝像頭掃描該識別圖片,來播放對應的目標視頻。
優(yōu)選地,如圖3所示,所述方法還包括步驟s15”和步驟s16”;步驟s15”中,設備1通過攝像頭獲取實時圖像;步驟s16”中,設備1若在所述實時圖像中識別出所述識別圖片,播放所述ar視頻。
例如,用戶打開用戶設備(例如智能手機、平板電腦等)上的特定應用(例如ar應用),該特定應用打開用戶設備的攝像頭掃描,通過攝像頭獲取實時圖像;設備1利用圖像識別技術(shù)檢測所述實時圖像中是否存在所述識別圖片,若所述實時圖像中存在所述識別圖片,則通過該特定應用在用戶設備屏幕上播放所述識別圖片對應的ar視頻。其中,所述設備1包括但不限于用戶設備、云端服務器;若所述ar視頻存儲于云端服務器,當在所述實時圖像中識別出所述識別圖片,該特定應用從云端服務器獲取所述ar視頻,并在用戶設備端播放所述ar視頻;若所述ar視頻存儲于用戶設備本地,當在所述實時圖像中識別出所述識別圖片,該特定應用直接從用戶設備本地獲取所述ar視頻,并播放所述ar視頻。
優(yōu)選地,設備1播放所述ar視頻,包括:設備1解碼所述ar視頻得到待播序列幀圖片,按照所述ar視頻的幀率播放所述待播序列幀圖片。
例如,可以使用視頻解碼器(如ffmpeg、mediacodec、avfoundation)解碼所述ar視頻,形成待播序列幀圖片;然后,按照所述ar視頻的幀率播放所述待播序列幀圖片。
優(yōu)選地,步驟s15”中,設備1通過攝像頭獲取實時圖像,檢測所述實時圖像的特征信息;步驟s16”中,設備1若所述實時圖像的特征信息與所述識別圖片的特征信息相匹配,則在所述實時圖像中識別出所述識別圖片,播放所述ar視頻。
例如,可以通過sift算法檢測所述實時圖像的特征信息;若所述實時圖像的特征信息包含所述識別圖片的特征信息,則認為所述實時圖像的特征信息與所述識別圖片的特征信息相匹配,則認為在所述實時圖像中識別出所述識別圖片。
優(yōu)選地,步驟s16”中,設備1若所述實時圖像的特征信息與所述識別圖片的特征信息相匹配,則在所述實時圖像中識別出所述識別圖片,并跟蹤所述識別圖片,得到所述識別圖片的空間姿態(tài);根據(jù)所述識別圖片的空間姿態(tài),在所述識別圖片的相應位置播放所述ar視頻。
例如,若檢測到所述實時圖像中存在所述識別圖片,識別跟蹤所述識別圖片,得到所述識別圖片的空間姿態(tài)(如傾斜、平放等);根據(jù)該空間姿態(tài)計算出所述識別圖片在三維空間中的位置,然后,使用3d渲染技術(shù)(如opengl)在所述識別圖片的相應位置(比如所述識別圖片與所述ar視頻的幀畫面相對齊的位置)播放所述ar視頻(例如按照所述ar視頻的幀率播放所述ar視頻的待播序列幀圖片)。若所述識別圖片的位置發(fā)生移動,所述ar視頻可以跟蹤所述識別圖片,即所述ar視頻的播放位置隨著所述識別圖片的移動而移動。
根據(jù)本申請的另一個方面,提供了一種包括指令的計算機可讀介質(zhì),所述指令在被執(zhí)行時使得系統(tǒng)進行如上所述方法的操作。
根據(jù)本申請的又一個方面,提供了一種用于確定ar視頻的識別圖片的設備,其中,該設備包括:
處理器;以及
被安排成存儲計算機可執(zhí)行指令的存儲器,所述可執(zhí)行指令在被執(zhí)行時使所述處理器執(zhí)行如上所述的方法。
與現(xiàn)有技術(shù)相比,本申請獲取目標視頻,所述目標視頻包括若干個候選圖片,檢測所述候選圖片的特征信息,在制作所述目標視頻對應的ar視頻的過程中,將所述特征信息符合預定特征條件的所述候選圖片確定為所述ar視頻的識別圖片;本申請通過檢測所述候選圖片的特征信息來確定所述目標視頻對應的ar視頻的識別圖片,在制作ar視頻的過程中無需將識別圖片和目標視頻分開處理,避免了編輯制作麻煩的問題,而且制作所得的ar視頻融合性較好。進一步地,本申請存儲所述識別圖片的特征信息,用于后續(xù)的識別跟蹤,解決了播放目標視頻時對齊所述識別圖片與所述目標視頻的麻煩。
需要注意的是,本申請可在軟件和/或軟件與硬件的組合體中被實施,例如,可采用專用集成電路(asic)、通用目的計算機或任何其他類似硬件設備來實現(xiàn)。在一個實施例中,本申請的軟件程序可以通過處理器執(zhí)行以實現(xiàn)上文所述步驟或功能。同樣地,本申請的軟件程序(包括相關(guān)的數(shù)據(jù)結(jié)構(gòu))可以被存儲到計算機可讀記錄介質(zhì)中,例如,ram存儲器,磁或光驅(qū)動器或軟磁盤及類似設備。另外,本申請的一些步驟或功能可采用硬件來實現(xiàn),例如,作為與處理器配合從而執(zhí)行各個步驟或功能的電路。
另外,本申請的一部分可被應用為計算機程序產(chǎn)品,例如計算機程序指令,當其被計算機執(zhí)行時,通過該計算機的操作,可以調(diào)用或提供根據(jù)本申請的方法和/或技術(shù)方案。本領域技術(shù)人員應能理解,計算機程序指令在計算機可讀介質(zhì)中的存在形式包括但不限于源文件、可執(zhí)行文件、安裝包文件等,相應地,計算機程序指令被計算機執(zhí)行的方式包括但不限于:該計算機直接執(zhí)行該指令,或者該計算機編譯該指令后再執(zhí)行對應的編譯后程序,或者該計算機讀取并執(zhí)行該指令,或者該計算機讀取并安裝該指令后再執(zhí)行對應的安裝后程序。在此,計算機可讀介質(zhì)可以是可供計算機訪問的任意可用的計算機可讀存儲介質(zhì)或通信介質(zhì)。
通信介質(zhì)包括藉此包含例如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù)的通信信號被從一個系統(tǒng)傳送到另一系統(tǒng)的介質(zhì)。通信介質(zhì)可包括有導的傳輸介質(zhì)(諸如電纜和線(例如,光纖、同軸等))和能傳播能量波的無線(未有導的傳輸)介質(zhì),諸如聲音、電磁、rf、微波和紅外。計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù)可被體現(xiàn)為例如無線介質(zhì)(諸如載波或諸如被體現(xiàn)為擴展頻譜技術(shù)的一部分的類似機制)中的已調(diào)制數(shù)據(jù)信號。術(shù)語“已調(diào)制數(shù)據(jù)信號”指的是其一個或多個特征以在信號中編碼信息的方式被更改或設定的信號。調(diào)制可以是模擬的、數(shù)字的或混合調(diào)制技術(shù)。
作為示例而非限制,計算機可讀存儲介質(zhì)可包括以用于存儲諸如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)的信息的任何方法或技術(shù)實現(xiàn)的易失性和非易失性、可移動和不可移動的介質(zhì)。例如,計算機可讀存儲介質(zhì)包括,但不限于,易失性存儲器,諸如隨機存儲器(ram,dram,sram);以及非易失性存儲器,諸如閃存、各種只讀存儲器(rom,prom,eprom,eeprom)、磁性和鐵磁/鐵電存儲器(mram,feram);以及磁性和光學存儲設備(硬盤、磁帶、cd、dvd);或其它現(xiàn)在已知的介質(zhì)或今后開發(fā)的能夠存儲供計算機系統(tǒng)使用的計算機可讀信息/數(shù)據(jù)。
對于本領域技術(shù)人員而言,顯然本申請不限于上述示范性實施例的細節(jié),而且在不背離本申請的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本申請。因此,無論從哪一點來看,均應將實施例看作是示范性的,而且是非限制性的,本申請的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化涵括在本申請內(nèi)。不應將權(quán)利要求中的任何附圖標記視為限制所涉及的權(quán)利要求。此外,顯然“包括”一詞不排除其他單元或步驟,單數(shù)不排除復數(shù)。第一,第二等詞語用來表示名稱,而并不表示任何特定的順序。