手勢辨識與控制方法及其裝置制造方法
【專利摘要】一種手勢辨識與控制方法及其裝置。手勢辨識與控制方法包括下列步驟。先擷取具有深度信息的待處理影像,待處理影像包括人形影像。分析人形影像,以獲得具有第一骨架與第二骨架的手部骨架信息。判斷第一骨架與第二骨架是否具有交點。若是,則繼續(xù)判斷第一骨架與第二骨架所形成的夾角是否在預(yù)設(shè)角度范圍內(nèi)。當(dāng)夾角在第一預(yù)設(shè)角度范圍內(nèi),則據(jù)以輸出控制信號。本發(fā)明提供的一種手勢辨識與控制方法及其裝置,通過分析手部骨架信息而可直接輸出控制信號至多媒體影音裝置,減少使用者利用手勢控制游標(biāo)的步驟。
【專利說明】手勢辨識與控制方法及其裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明是有關(guān)于一種辨識與控制方法及其裝置,且特別是有關(guān)于一種手勢辨識與控制方法及其裝置。
【背景技術(shù)】
[0002]傳統(tǒng)的人機(jī)互動介面為滑鼠、鍵盤和搖桿,隨著科技發(fā)展日新月異,為了使人機(jī)互動可以更加便利,于是有了觸控、聲控等技術(shù)的出現(xiàn)。為了使人機(jī)互動可以更加人性化,體感控制提供了一種全新的輸入方式,其中之一為手勢辨識,由于手勢是人與人在日常生活中常用的溝通方式之一,是一種相當(dāng)直覺且方便的示意方式。手勢辨識應(yīng)用于人機(jī)介面設(shè)計、醫(yī)療復(fù)健、虛擬實境、數(shù)字藝術(shù)創(chuàng)作與游戲設(shè)計等領(lǐng)域近來漸漸受到消費者的矚目。
[0003]辨識手勢的信息主要有兩種:一是動態(tài)手勢,另一則是靜態(tài)手勢。動態(tài)手勢信息包括手部移動軌跡、位置信息與時序關(guān)系,靜態(tài)手勢信息則主要為手形變化,通過分析手勢信息并根據(jù)不同的手勢,來達(dá)到人機(jī)互動的功能。手勢辨識的方法之一為利用深度攝影機(jī)來取得具有深度信息的影像,每張影像必須做前置處理,如影像二值化和清除影像背景、消除雜訊等,再從一連串影像中擷取并分析出使用者手部位置及手勢等相關(guān)訊息。再利用手部位置的影像坐標(biāo)數(shù)值來控制顯示器的游標(biāo)的移動。由于前置處理需花費較長時間,使得移動游標(biāo)的速度與精確度難以與滑鼠相較。因此,對于強(qiáng)調(diào)即時人機(jī)互動的手勢控制介面來說實為待加強(qiáng)的一環(huán)。
【發(fā)明內(nèi)容】
[0004]有鑒于此,本發(fā)明提供一種手勢辨識與控制方法及手勢辨識與控制裝置,通過分析手部骨架信息而可直接輸出控制信號至多媒體影音裝置,減少使用者利用手勢控制游標(biāo)的步驟。
[0005]本發(fā)明提出一種手勢辨識與控制方法,包括下列步驟。先擷取具有深度信息的待處理影像,此待處理影像包括人形影像。分析人形影像,以獲得具有第一骨架與第二骨架的手部骨架信息。判斷第一骨架與第二骨架是否具有交點。若是,則繼續(xù)判斷第一骨架與第二骨架所形成的夾角是否在第一預(yù)設(shè)角度范圍內(nèi)。當(dāng)夾角在第一預(yù)設(shè)角度范圍內(nèi),則據(jù)以輸出控制信號。
[0006]在本發(fā)明的一實施例中,上述的手勢辨識與控制方法更包括依據(jù)交點在第一骨架中的位置來計算第一比例值,并依據(jù)交點在第二骨架中的位置來計算第二比例值。當(dāng)?shù)谝槐壤蹬c第二比例值的至少其中之一小于第一臨界值,則輸出用以表示暫停功能的暫??刂菩盘枴.?dāng)?shù)谝槐壤蹬c第二比例值皆屬于預(yù)設(shè)比例區(qū)間之內(nèi),則輸出用以表示停止功能的停止控制信號。
[0007]在本發(fā)明的一實施例中,其中當(dāng)?shù)谝还羌芘c第二骨架不具有交點,則上述的手勢辨識與控制方法更包括判斷第一骨架與第二骨架的延伸線上是否具有延伸交點。若是,則判斷延伸交點的夾角是否在第二預(yù)設(shè)角度范圍內(nèi)。當(dāng)延伸交點的夾角在第二預(yù)設(shè)角度范圍內(nèi),則據(jù)以輸出另一控制信號。
[0008]在本發(fā)明的一實施例中,上述的手勢辨識與控制方法更包括計算第一骨架與第二骨架的中點連線長度。并依據(jù)此中點連線長度的變化,據(jù)以產(chǎn)生對應(yīng)的另一控制信號。
[0009]在本發(fā)明的一實施例中,上述的依據(jù)中點連線長度的變化,據(jù)以輸出對應(yīng)的另一控制信號的步驟包括當(dāng)中點連線長度增加時,輸出用以表示提高音量功能的第一音量控制信號;當(dāng)中點連線長度縮小時,輸出用以表示降低音量功能的第二音量控制信號。
[0010]本發(fā)明另提出一種手勢辨識與控制方法,包括下列步驟。先擷取具有深度信息的待處理影像。接著采用斑點檢測(Blob detection)法分析此待處理影像,據(jù)以判斷待處理影像的連通域個數(shù)。當(dāng)連通域個數(shù)為二個,則分析待處理影像的第一連通域的第一重心位置與第二連通域的第二重心位置。并且依據(jù)第一與第二重心位置之間的重心連線長度的變化,據(jù)以輸出對應(yīng)的控制信號。
[0011]本發(fā)明又提出一種手勢辨識與控制裝置,其包括影像擷取單元、儲存單元以及處理單元。其中,影像擷取單元用以擷取具有深度信息的待處理影像,此待處理影像包括人形影像。儲存單元用以儲存待處理影像以及電腦可讀寫軟件。處理單元用以執(zhí)行電腦可讀寫軟件的多個指令,其中所述多個指令包括:分析人形影像,以獲得具有第一骨架與第二骨架的手部骨架信息。判斷第一骨架與第二骨架是否具有交點。若是,判斷第一骨架與第二骨架所形成的夾角是否在第一預(yù)設(shè)角度范圍內(nèi)。當(dāng)夾角在第一預(yù)設(shè)角度范圍內(nèi),則據(jù)以輸出控制信號。
[0012]基于上述,本發(fā)明所提供的手勢辨識與控制方法及其裝置直接通過分析手部骨架信息來直接輸出控制信號至多媒體影音裝置,以使多媒體影音裝置直接根據(jù)此控制信號執(zhí)行預(yù)設(shè)程序。如此一來,利用手勢操控達(dá)到類似快捷鍵的功能,減少使用者利用手勢控制多媒體影音裝置的顯示屏幕的游標(biāo)的步驟。
[0013]為讓本發(fā)明的上述特征和優(yōu)點能更明顯易懂,下文特舉實施例,并配合所附圖式作詳細(xì)說明如下。
【專利附圖】
【附圖說明】
[0014]圖1是依照本發(fā)明一實施例所繪示的手勢辨識與控制裝置的方塊圖。
[0015]圖2是依照本發(fā)明一實施例所繪示的手勢辨識與控制方法的流程圖。
[0016]圖3 Ca)至圖3 (C)繪示的為第一種至第三種手部骨架的簡單示意圖。
[0017]圖4 Ca)是圖3 Ca)的手部骨架放大示意圖。
[0018]圖4 (b)是圖3 (b)的手部骨架放大示意圖。
[0019]圖5 (a)至圖5 (C)繪示的為第一骨架與第二骨架的中點連線長度的變化示意圖。
[0020]圖6是依照本發(fā)明另一實施例所繪示的手勢辨識與控制方法的流程圖。
[0021]圖7 Ca)至圖7 (c)是依照本發(fā)明另一實施例所繪示的連通域個數(shù)的示意圖。
[0022]附圖標(biāo)號:
[0023]100:手勢辨識與控制裝置
[0024]110:影像擷取單元
[0025]120:儲存單元
[0026]130:處理單元[0027]310,320,330:手部骨架
[0028]312、322、332:第一骨架
[0029]314、324、334:第二骨架
[0030]710,720,730:待處理影像
[0031]Al:骨架端點
[0032]dl、d2、d3:中點連線長度
[0033]bl:第一連通域
[0034]b2:第二連通域
[0035]S21(TS280:—實施例的手勢辨識與控制方法的各步驟
[0036]S61(TS670:另一實施例的手勢辨識與控制方法的各步驟。
【具體實施方式】
[0037]圖1是依照本發(fā)明一實施例所繪示的手勢辨識與控制裝置的方塊圖。請參照圖1,在一實施例中,手勢辨識與控制裝置100例如可通過有線或無線的方式連結(jié)至具有顯示屏幕的多媒體影音裝置(未繪示),多媒體影音裝置例如是智能型電視。在另一實施例中,手勢辨識與控制裝置100例如是內(nèi)嵌整合于多媒體影音裝置的內(nèi)部。舉例來說,手勢辨識與控制裝置100例如是機(jī)上盒(Set-top box,STB)而可外接于智能型電視。手勢辨識與控制裝置100負(fù)責(zé)接收并辨別使用者的手勢變化,據(jù)以產(chǎn)生相對應(yīng)的控制信號,并且將控制信號傳送至智能型電視,以控制智能型電視執(zhí)行對應(yīng)于手勢的預(yù)設(shè)程式。如此一來,便能減少使用者利用手勢控制多媒體影音裝置的顯示屏幕的游標(biāo)的繁雜步驟。
[0038]以下針對手勢辨識與控制裝置100進(jìn)行說明。手勢辨識與控制裝置100包括影像擷取單元110、儲存單元120以及處理單元130。其功能分述如下:
[0039]影像擷取單元110包括深度攝影機(jī),而可用以擷取二維(two-dimensional,2D)影像以及三維(three-dimensional, 3D)影像。深度攝影機(jī)可用以判斷物體與攝影機(jī)之間的距離,進(jìn)而得出拍攝畫面中物體遠(yuǎn)近的深度影像(depthimage),或稱為深度圖(depth map)。深度影像為一種采用灰階值O?255來表示距離資料的影像,而可將對應(yīng)的2D影像立體化,因此,3D影像為二維影像加上深度影像信息,稱為“2D +D” (2D+ Depth).深度攝影機(jī)例如是時差測距(Time-of-flight)攝影機(jī)、立體視覺(Stereo vision)深度攝影機(jī)、激光斑點(Laser speckle)攝影機(jī)或雷測追蹤(Laser tracking)攝影機(jī)等,不限于上述。
[0040]儲存單元120可為任意型式的固定式或可移動式隨機(jī)存取存儲器(Random AccessMemory,RAM)、唯讀存儲器(Read-Only Memory, ROM)、快閃存儲器(Flash memory)、硬碟或其他類似裝置,而可用以儲存電腦可讀寫軟件、影像及其他信息。
[0041]處理單兀130例如是中央處理單兀(Central Processing Unit, CPU),或是其他可程式化的一般用途或特殊用途的微處理器(MiCToprocessor)、數(shù)字信號處理器(DigitalSignal Processor, DSP)等裝置,而可用以載入電腦可讀寫軟件以執(zhí)行多個指令。
[0042]圖2是依照本發(fā)明一實施例所繪示的手勢辨識與控制方法的流程圖。本實施例的方法適用于圖1的手勢辨識與控制裝置100。在本實施例中,手勢辨識與控制裝置100例如耦接至智能型電視。以下即搭配手勢辨識與控制裝置100中的各構(gòu)件說明本實施例的詳細(xì)步驟:[0043]在步驟S210中,影像擷取單元110擷取具有深度信息的待處理影像,待處理影像包括人形影像。其中,影像擷取單元110例如可同時或先后拍攝二維影像以及三維影像。
[0044]于步驟S220,處理單元130分析人形影像,以獲得具有第一骨架與第二骨架的手部骨架信息。在此步驟中,處理單元130至少可采用兩種不同的分析方法來取得手部骨架信息,手部骨架信息例如包括手部骨架的長度、形狀、對應(yīng)于待處理影像中的坐標(biāo)位置、深度信息等,不限于上述。其中,處理單元130如何利用人形影像來取得手部骨架信息的分析方法容后詳述。
[0045]取得手部骨架信息之后,便可接續(xù)步驟S230,處理單元130依據(jù)手部骨架信息來判斷第一骨架與第二骨架是否具有交點。舉例來說,圖3 (a)至圖3 (C)繪示為第一種至第三種手部骨架的簡單示意圖。請參照圖3(a),手部骨架310包括第一骨架312以及第二骨架314,其分別對應(yīng)至人形影像的左手與右手,其中,第一骨架312與第二骨架314具有一個交點NI。同理,請參照圖3(b),手部骨架320包括第一骨架322以及第二骨架324,且具有一個交點N2。再請參照圖3 (C),手部骨架330包括第一骨架332以及第二骨架334,手部骨架330并未具有交點。
[0046]若第一骨架與第二骨架具有交點,則接續(xù)步驟S240 ;若第一骨架與第二骨架不具有交點,則接續(xù)步驟S260。
[0047]在步驟S240中,處理單元130繼續(xù)判斷第一骨架與第二骨架所形成的夾角是否在第一預(yù)設(shè)角度范圍內(nèi)。詳細(xì)地說,第一骨架與第二骨架所形成的夾角例如可預(yù)設(shè)為開口向下的夾角,且第一預(yù)設(shè)角度范圍例如設(shè)定為80度~100度,但不限于此,其可由本領(lǐng)域具通常知識者依據(jù)實際應(yīng)用情況設(shè)定之。以圖3 (a)為例,處理單元130例如可判斷第一骨架312與第二骨架314所形成的夾角Θ I是否在80度~100度范圍內(nèi)。以圖3(b)為例,處理單元130例如可判斷第一骨架322與第二骨架324所形成的夾角Θ 2是否在80度~100度范圍內(nèi)。
[0048]當(dāng)夾角在第一預(yù)設(shè)角度范圍內(nèi),則接續(xù)步驟S250,處理單元130依據(jù)交點所在位置的比例值,據(jù)以輸出控制信號。詳細(xì)地說,處理單元130先依據(jù)交點在第一骨架中的位置來計算第一比例值,并依據(jù)交點在第二骨架中的位置來計算第二比例值。當(dāng)?shù)谝槐壤蹬c第二比例值的至少其中之一小于第一臨界值,則輸出用以表示暫停功能的暫??刂菩盘枴.?dāng)?shù)谝槐壤蹬c第二比例值皆屬于預(yù)設(shè)比例區(qū)間之內(nèi),則輸出用以表示停止功能的停止控制信號。其中,第一臨界值例如可設(shè)定為0.2 ;預(yù)設(shè)比例區(qū)間Rl例如設(shè)定為0.3 ^ Rl ^ 0.70
[0049]圖4 (a)是圖3 (a)的手部骨架放大示意圖。請參照圖4 (a),處理單元130會先以端點A為起點計算端點A與交點NI之間的長度,并除以端點A、B之間的長度,以計算第一比例值。在本實施例中,第一比例值例如為0.3。此外,處理單元130再以端點C為起點計算端點C與交點NI之間的長度,并除以端點C、D之間的長度,以計算第二比例值。在本實施例中,第二比例值例如為0.05。假設(shè)在本實施例中,第一臨界值設(shè)定為0.2,處理單元130判斷第二比例值小于第一臨界值,因此輸出用以表示暫停功能的暫??刂菩盘栔林悄苄碗娨暋V悄苄碗娨曉诮邮盏酱藭和?刂菩盘栔?,便可直接執(zhí)行暫停播放的指令。 [0050]圖4 (b)是圖3 (b)的手部骨架放大示意圖。請參照圖4 (b),處理單元130會先以端點E為起點計算端點E與交點N2之間的長度,并除以端點E、F之間的長度,以計算第一比例值。在本實施例中,第一比例值例如為0.45。此外,處理單元130再以端點G為起點計算端點G與交點N2之間的長度,并除以端點G、H之間的長度,以計算第二比例值。在本實施例中,第二比例值例如為0.5。假設(shè)在本實施例中,預(yù)設(shè)比例區(qū)間Rl設(shè)定為0.3 ^ Rl ^ 0.7,處理單元130判斷第一比例值與第二比例值皆屬于預(yù)設(shè)比例區(qū)間Rl之內(nèi),因此輸出用以表示停止功能的停止控制信號至智能型電視。智能型電視在接收到此停止控制信號之后,便可直接執(zhí)行停止播放的指令。
[0051]再回到圖2的步驟S230,若處理單元130判斷第一骨架與第二骨架不具有交點,則接續(xù)步驟S260,處理單元130判斷第一骨架與第二骨架的延伸線上是否具有延伸交點。由于使用者所執(zhí)行的平行操作手勢可能會有些微差距,并非剛好完全平行。因此若第一骨架與第二骨架的延伸線上具有延伸交點,則處理單元130進(jìn)一步判斷延伸交點所形成的夾角是否在第二預(yù)設(shè)角度范圍內(nèi),第二預(yù)設(shè)角度范圍例如是10度~-10度范圍內(nèi)(步驟S270)。倘若延伸交點所形成的夾角在第二預(yù)設(shè)角度范圍之內(nèi),則處理單元130仍判定為平行操作手勢而接續(xù)步驟S280。若延伸交點所形成的夾角不在第二預(yù)設(shè)角度范圍之內(nèi),則回到步驟S210,重新擷取待處理影像。
[0052]在步驟S280中,處理單元130計算第一骨架與第二骨架的中點連線長度,并依據(jù)此中點連線長度的變化,據(jù)以產(chǎn)生對應(yīng)的控制信號。舉例來說,當(dāng)中點連線長度增加時,處理單元130輸出用以表示提高音量功能的第一音量控制信號至智能型電視;當(dāng)中點連線長度縮小時,輸出用以表示降低音量功能的第二音量控制信號至智能型電視。智能型電視接收到音量控制信號則對應(yīng)執(zhí)行提高音量或降低音量的指令。
[0053]至于提高音量或降低音量的多寡亦可由中點連線長度來進(jìn)行控制,以下將以圖5(a)至圖5 (C)來說明如何利用中點連線長度來對應(yīng)控制音量調(diào)節(jié)幅度。圖5 (a)至圖5(C)繪示的為第一骨架與第二骨架的中點連線長度的變化示意圖。 [0054]倘若處理單元130判斷第一骨架與第二骨架的中點連線長度由圖5 (a)轉(zhuǎn)換至圖5 (b),也就是圖5 (a)的中點連線長度dl縮小為圖5 (b)的中點連線長度d2。在一實施例中,若使用者的雙手距離保持不變,也就是中點連線長度持續(xù)維持在圖5 (b)的中點連線長度d2,則處理單元130可輸出代表持續(xù)降低音量的音量控制信號,直至使用者的雙手結(jié)束平行調(diào)控姿勢。在另一實施例中,處理單元130可經(jīng)由事先預(yù)設(shè)的中點連線長度與音量控制的對應(yīng)關(guān)系來輸出音量控制信號。舉例來說,若中點連線長度為100公分時對應(yīng)至音量100%,中點連線長度為50公分時對應(yīng)至音量50%,依此類推。依據(jù)中點連線長度的比例關(guān)系來對應(yīng)調(diào)整音量。在又一實施例中,當(dāng)中點連線長度由圖5 (a)轉(zhuǎn)換至圖5 (b)時,處理單元130可輸出縮小一格音量的音量控制信號;當(dāng)中點連線長度由圖5 Ca)轉(zhuǎn)換至圖5(c)時,處理單元130可輸出提高一格音量的音量控制信號。由中點連線長度來調(diào)節(jié)音量的方式不限于上述,可以對于實際的需求而酌予變更上述實施例的內(nèi)容。
[0055]接下來則舉例說明在圖2的步驟S220中,處理單元130如何利用人形影像來取得手部骨架信息的兩種分析方法。
[0056]第一種分析方法主要是利用人臉辨識技術(shù)來進(jìn)行分析。詳細(xì)地說,處理單元130先利用影像擷取單元110所取得的二維影像進(jìn)行人臉檢測,以判斷人臉在二維影像中的位置信息,并將此位置信息儲存于儲存單元120。接著,處理單元130根據(jù)二維影像中的人臉位置信息來對應(yīng)至三維影像,藉以從三維影像中取得人臉位置的深度信息。然后,處理單元130便可利用人臉位置的深度信息為基準(zhǔn),輔以找出預(yù)設(shè)深度區(qū)間的雙手影像,預(yù)設(shè)深度區(qū)間可由本領(lǐng)域具通常知識者依實際應(yīng)用情況設(shè)定之。舉例來說,由于使用者的雙手通常會位于使用者臉部的前方,因此,預(yù)設(shè)深度區(qū)間例如可設(shè)定為人臉位置的深度往深度較淺的方向的一段深度區(qū)間。處理單元130找出預(yù)設(shè)深度區(qū)間的雙手影像之后,便可根據(jù)雙手影像獲得雙手的手部骨架信息。
[0057]第二種分析方法主要是利用全身骨架技術(shù)來進(jìn)行分析。詳細(xì)地說,處理單元130例如可直接利用影像擷取單元110所擷取的三維影像找出人形的全身骨架,接著,處理單元130再根據(jù)全身骨架來找出雙手的手部骨架信息。舉例來說,處理單元130可先尋找全身骨架的預(yù)設(shè)特征,據(jù)以判斷為雙手骨架,預(yù)設(shè)特征例如設(shè)定為由一端點起算第某節(jié)的骨架,預(yù)設(shè)特征可由本領(lǐng)域具通常知識者依實際應(yīng)用情況設(shè)定之。
[0058]圖6是依照本發(fā)明另一實施例所繪示的手勢辨識與控制方法的流程圖。本實施例的方法亦適用于圖1的手勢辨識與控制裝置100,以下請配合參照圖6與圖1:
[0059]在步驟S610中,影像擷取裝置110擷取具有深度信息的待處理影像。于步驟S620,處理單元130采用斑點檢測(Blob detection)法分析待處理影像,據(jù)以判斷待處理影像的連通域個數(shù)。舉例來說,圖7 (a)至圖7 (C)是依照本發(fā)明另一實施例所繪示的連通域個數(shù)的示意圖。圖7 (a)的待處理影像710具有第一連通域bl以及第二連通域b2;圖7 (b)與圖7 (c)的待處理影像720以及730則僅具有一個連通域。
[0060]于步驟S630,當(dāng)連通域個數(shù)為二個,則處理單元130分析待處理影像的第一連通域bl的第一重心位置與第二連通域b2的第二重心位置。接著,在步驟S640中,依據(jù)第一重心位置以及第二重心位置之間的重心連線長度的變化,據(jù)以輸出對應(yīng)的控制信號。舉例來說,當(dāng)重心連線長度增加時,處理單元130輸出用以表示提高音量功能的第一音量控制信號;當(dāng)重心連線長度縮小時,輸出用以表示降低音量功能的第二音量控制信號。步驟S640類似于前一實施例的步驟S280,因此利用重心連線長度來控制提高音量或降低音量的多寡的詳細(xì)步驟相同或類似于前一實施例的中點連線長度的說明,在此不贅述。
[0061]回到圖6的步驟S620,當(dāng)連通域個數(shù)為一個,則接續(xù)步驟S650,處理單元130分析待處理影像,以獲得具有第一骨架與第二骨架的手部骨架信息。由于已知連通域個數(shù)為一個,對應(yīng)圖7 (b)與圖7 (c)所示,第一骨架與第二骨架一定會產(chǎn)生交點。故在本實施例中,可省略判斷第一骨架與第二骨架是否具有交點的步驟。接續(xù)步驟S660,處理單元130直接判斷第一骨架與第二骨架所形成的夾角是否在第一預(yù)設(shè)角度范圍內(nèi)。此步驟例如可用來濾除連通域個數(shù)為一個但僅為單一手掌的手勢操作。若步驟S660判斷為否,則回到步驟S610。當(dāng)夾角在第一預(yù)設(shè)角度范圍內(nèi),則接續(xù)步驟S670,處理單元130依據(jù)交點所在位置的比例值,據(jù)以輸出控制信號。其中,控制信號例如包括用以表示暫停功能的暫停控制信號或是用以表示停止功能的停止控制信號。本實施例的步驟S650、S660、S670相同或類似于前一實施例的步驟S220、S240、S250,故在此不重復(fù)贅述。
[0062]本實施例與前述實施例不同的地方在于先利用斑點檢測法來快速判斷待處理影像中的連通域個數(shù),若連通域個數(shù)為二個,則可直接判定使用者的雙手進(jìn)行平行手勢操控,而可直接分析連通域的重心的距離變化進(jìn)而輸出控制信號。藉此可省略部份分析手部骨架信息的運算,減少辨別手勢操控的所需時間。
[0063]綜上所述,本發(fā)明利用深度信息以及相應(yīng)的人體骨架檢測功能,便能省去許多現(xiàn)有手勢辨識所需的步驟,例如節(jié)省消除背景以及減少需要過濾的雜訊,從而減少辨識手勢所需花費的時間。并且,直接通過分析手部骨架信息來直接輸出控制信號至多媒體影音裝置,以使多媒體影音裝置直接根據(jù)此控制信號執(zhí)行預(yù)設(shè)程序。如此一來,利用手勢操控達(dá)到類似快捷鍵的功能,減少使用者利用手勢控制多媒體影音裝置的顯示屏幕的游標(biāo)的步驟,以達(dá)到更為方便且迅速的即時人機(jī)互動。
[0064]雖然本發(fā)明已以實施例揭露如上,然其并非用以限定本發(fā)明,任何所屬【技術(shù)領(lǐng)域】中具有通常知識者,在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可作些許的更動與潤飾,故本發(fā)明的保護(hù)范圍當(dāng)視申請專利范圍所界定者為準(zhǔn)。
【權(quán)利要求】
1.一種手勢辨識與控制方法,其特征是,所述手勢辨識與控制方法包括: 擷取具有深度信息的一待處理影像,所述待處理影像包括一人形影像; 分析所述人形影像,以獲得具有一第一骨架與一第二骨架的一手部骨架信息; 判斷所述第一骨架與所述第二骨架是否具有一交點; 若是,判斷所述第一骨架與所述第二骨架所形成的一夾角是否在一第一預(yù)設(shè)角度范圍內(nèi);以及 當(dāng)所述夾角在所述第一預(yù)設(shè)角度范圍內(nèi),據(jù)以輸出一控制信號。
2.如權(quán)利要求1所述的手勢辨識與控制方法,其特征是,所述手勢辨識與控制方法更包括: 依據(jù)所述交點在所述第一骨架中的位置來計算一第一比例值,并依據(jù)所述交點在所述第二骨架中的位置來計算一第二比例值; 當(dāng)所述第一比例值與所述第二比例值的至少其中之一小于一第一臨界值,輸出用以表示暫停功能的一暫??刂菩盘?;以及 當(dāng)所述第一 比例值與所述第二比例值皆屬于一預(yù)設(shè)比例區(qū)間之內(nèi),輸出用以表示停止功能的一停止控制信號。
3.如權(quán)利要求1所述的手勢辨識與控制方法,其特征是,當(dāng)所述第一骨架與所述第二骨架不具有所述交點,所述手勢辨識與控制方法更包括: 判斷所述第一骨架與所述第二骨架的一延伸線上是否具有一延伸交點; 若是,判斷所述延伸交點的一夾角是否在一第二預(yù)設(shè)角度范圍內(nèi);以及 當(dāng)所述延伸交點的所述夾角在所述第二預(yù)設(shè)角度范圍內(nèi),據(jù)以輸出另一控制信號。
4.如權(quán)利要求1或3所述的手勢辨識與控制方法,其特征是,當(dāng)所述第一骨架與所述第二骨架不具有所述交點,所述手勢辨識與控制方法更包括: 計算所述第一骨架與所述第二骨架的一中點連線長度;以及 依據(jù)所述中點連線長度的變化,據(jù)以產(chǎn)生對應(yīng)的所述另一控制信號。
5.如權(quán)利要求4所述的手勢辨識與控制方法,其特征是,依據(jù)所述中點連線長度的變化,據(jù)以輸出對應(yīng)的所述另一控制信號的步驟包括: 當(dāng)所述中點連線長度增加時,輸出用以表示提高音量功能的一第一音量控制信號,當(dāng)所述中點連線長度縮小時,輸出用以表示降低音量功能的一第二音量控制信號。
6.一種手勢辨識與控制方法,其特征是,所述手勢辨識與控制方法包括: 擷取具有深度信息的一待處理影像; 采用一斑點檢測法分析所述待處理影像,據(jù)以判斷所述待處理影像的一連通域個數(shù);當(dāng)所述連通域個數(shù)為二個,分析所述待處理影像的一第一連通域的一第一重心位置與一第二連通域的一第二重心位置;以及 依據(jù)所述第一與所述第二重心位置之間的一重心連線長度的變化,據(jù)以輸出對應(yīng)的一控制信號。
7.如權(quán)利要求6所述的手勢辨識與控制方法,其特征是,依據(jù)所述重心連線長度的變化,據(jù)以輸出對應(yīng)的所述控制信號的步驟包括: 當(dāng)所述重心連線長度增加時,輸出用以表示提高音量功能的一第一音量控制信號;以及當(dāng)所述重心連線長度縮小時,輸出用以表示降低音量功能的一第二音量控制信號。
8.如權(quán)利要求6所述的手勢辨識與控制方法,其特征是,當(dāng)所述連通域個數(shù)為一個,所述手勢辨識與控制方法更包括: 分析所述待處理影像中的一人形影像,以獲得具有一第一骨架與一第二骨架的一手部骨架信息; 判斷所述第一骨架與所述第二骨架是否具有一交點; 若是,判斷所述第一骨架與所述第二骨架所形成的一夾角是否在一第一預(yù)設(shè)角度范圍內(nèi);以及 當(dāng)所述夾角在所述第一預(yù)設(shè)角度范圍內(nèi),據(jù)以輸出另一控制信號。
9.如權(quán)利要求8所述的手勢辨識與控制方法,其特征是,所述手勢辨識與控制方法更包括: 計算所述交點的位置在所述第一骨架中的一第一比例值,并計算所述交點的位置在所述第二骨架中的一第二比例值; 當(dāng)所述第一比例值與所述第二比例值的至少其中之一小于一第一臨界值,輸出用以表示暫停功能的一暫??刂菩盘?;以及 當(dāng)所述第一比例值與所述第二比例值皆屬于一預(yù)設(shè)比例區(qū)間之內(nèi),輸出用以表示停止功能的一停止控制信號。
10.一種手勢辨識與控制裝置,其特征是,所述手勢辨識與控制裝置包括: 一影像擷取單元,擷取具有深度信息的一待處理影像,所述待處理影像包括一人形影像; 一儲存單元,儲存所述待處理影像以及一電腦可讀寫軟件;以及 一處理單元,執(zhí)行所述電腦可讀寫軟件的多個指令,其中所述多個指令包括: 分析所述人形影像,以獲得具有一第一骨架與一第二骨架的一手部骨架信息; 判斷所述第一骨架與所述第二骨架是否具有一交點; 若是,判斷所述第一骨架與所述第二骨架所形成的一夾角是否在一第一預(yù)設(shè)角度范圍內(nèi);以及 當(dāng)所述夾角在所述第一預(yù)設(shè)角度范圍內(nèi),據(jù)以輸出一控制信號。
11.如權(quán)利要求10所述的手勢辨識與控制裝置,其特征是,所述儲存單元記錄所述手部骨架信息與所述交點,所述處理單元執(zhí)行的所述多個指令更包括: 依據(jù)所述交點在所述第一骨架中的位置來計算一第一比例值,并依據(jù)所述交點在所述第二骨架中的位置來計算一第二比例值; 當(dāng)所述第一比例值與所述第二比例值的至少其中之一小于一第一臨界值,輸出用以表示暫停功能的一暫停控制信號;以及 當(dāng)所述第一比例值與所述第二比例值皆屬于一預(yù)設(shè)比例區(qū)間之內(nèi),輸出用以表示停止功能的一停止控制信號。
12.如權(quán)利要求10所述的手勢辨識與控制裝置,其特征是,當(dāng)所述第一骨架與所述第二骨架不具有所述交點,所述處理單元執(zhí)行的所述多個指令更包括: 判斷所述第一骨架與所述第二骨架的一延伸線上是否具有一延伸交點; 若是,判斷所述延伸交點的一夾角是否在一第二預(yù)設(shè)角度范圍內(nèi);以及當(dāng)所述延伸交點的所述夾角在所述第二預(yù)設(shè)角度范圍內(nèi),據(jù)以輸出另一控制信號。
13.如權(quán)利要求12所述的手勢辨識與控制裝置,其特征是,所述處理單元執(zhí)行的所述多個指令更包括: 計算所述第一骨架與所述第二骨架的一中點連線長度;以及 依據(jù)所述中點連線長度的變化,據(jù)以產(chǎn)生對應(yīng)的所述另一控制信號。
14.如權(quán)利要求13所述的手勢辨識與控制裝置,其特征是,所述儲存單元記錄所述中點連線長度,所述處理單元產(chǎn)生對應(yīng)的所述另一控制信號的指令包括: 當(dāng)所述中點連線長度增加時,輸出用以表示提高音量功能的一第一音量控制信號,當(dāng)所述中點連線長度縮小時,輸出用以表示降低音量功能的一第二音量控制信號。
15.如權(quán)利要求10所述的手勢辨識與控制裝置,其特征是,所述處理單元分析所述手部影像以獲得所述手部骨架信息的指令之前,更包括: 先采用一斑點檢測法分析所述待處理影像,據(jù)以判斷所述待處理影像的一連通域個 數(shù); 當(dāng)所述連通域個數(shù)為二個,分析所述待處理影像的一第一連通域的一第一重心位置與一第二連通域的一第二重心位置;以及 判斷所述第一與所述第二重心位置之間的一重心連線長度的變化,據(jù)以輸出對應(yīng)的另一控制信號。
【文檔編號】G06F3/01GK103970264SQ201310053431
【公開日】2014年8月6日 申請日期:2013年2月19日 優(yōu)先權(quán)日:2013年1月29日
【發(fā)明者】周家德, 魏守德, 邱煒杰, 黃智皓 申請人:緯創(chuàng)資通股份有限公司