基于三維手勢和語音的自動撥號方法及移動終端的制作方法

文檔序號：7982522閱讀：167來源：國知局

基于三維手勢和語音的自動撥號方法及移動終端的制作方法
【專利摘要】本發(fā)明提出了一種基于三維手勢和語音的自動撥號方法，包括如下步驟：移動終端檢測用戶的動作是否符合預定軌跡，如果符合，則啟動圖像傳感器檢測是否捕捉到用戶的預設部位的圖像以及啟動距離傳感器檢測移動終端和用戶的預設部位的距離是否小于或等于預設距離；如果圖像傳感器捕捉到用戶的預設部位，且移動終端與預設部位距離小于或等于預設距離，則啟動語音撥號模式；在語音撥號模式下，采集用戶發(fā)出的語音信號，并對語音信號進行解析以獲取語音信息；以及自動撥打與語音信息對應的聯(lián)系人電話號碼。該方法使撥打電話的任務流程簡化，操作更加快捷高效，并且使撥打電話的交互方式更加自然化、人性化。本發(fā)明還提出了一種移動終端。
【專利說明】基于三維手勢和語音的自動撥號方法及移動終端
【技術領域】
[0001]本發(fā)明涉及移動通信【技術領域】，特別涉及一種基于三維手勢和語音的自動撥號方法和一種移動終端。
【背景技術】
[0002]三維手勢是基于人的肢體在三維空間中的運動而做出的具有識別性和語義性的手勢。三維手勢可以不接觸機器設備單獨進行，也可以與機器設備接觸后進行，共同完成三維手勢。三維手勢技術目前在游戲領域已經(jīng)廣泛應用，在其它領域的應用前景也十分廣闊。
[0003]語音識別技術，也被稱為自動語音識別，其目標是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸入，例如按鍵、二進制編碼或者字符序列。
[0004]目前，現(xiàn)有移動終端例如手機撥打電話的形式主要有兩種。一種是通過點觸屏幕按鍵觸發(fā)，例如，要打電話給媽媽，需要先解鎖手機，在電話撥號盤輸入媽媽的電話號碼，然后點觸“撥打”按鍵撥出；或者找到已存儲的媽媽的電話號碼，然后點觸“撥打”按鍵撥出。另一種是通過完整的語音指令觸發(fā)，例如，要打電話給媽媽，需要先開啟語音模式，然后說“打電話給媽媽”，電話自動撥出。
[0005]現(xiàn)有技術的缺點是:采用第一種點觸屏幕按鍵觸發(fā)撥打電話時，至少需要操作四個步驟:
[0006](I)按電源鍵喚醒移動終端例如手機的屏幕；
[0007](2)手機解鎖；
[0008](3)找到打電話應用或者目標聯(lián)系人；
[0009](4)拔出電話。
[0010]由上可知，現(xiàn)有技術的撥打電話步驟繁瑣，時效性差，尤其在緊急情況下，更加不方便操作。
[0011]采用第二種通過完整的語音指令觸發(fā)撥打電話時，記憶量大，交互形式死板，不容錯。并且，需要記憶完整的、規(guī)范的語音指令，操作時準確輸出語音指令，一旦出錯，就無法完成任務。此外，死板的交互形式使用戶與機器設備產(chǎn)生疏離感，缺乏人文關懷氣息。

【發(fā)明內(nèi)容】

[0012]本發(fā)明旨在至少在一定程度上解決上述技術問題之一。
[0013]為此，本發(fā)明的一個目的在于提出一種基于三維手勢和語音的自動撥號方法，使撥打電話的任務流程簡化，操作更加快捷高效，并且使撥打電話的交互方式更加自然化、人性化，容易理解、記憶、操作。
[0014]本發(fā)明的第二個目的在于還提出一種移動終端。
[0015]為達到上述目的，本發(fā)明的第一方面實施例提出的一種基于三維手勢和語音的自動撥號方法，包括如下步驟:
[0016]移動終端檢測用戶的動作是否符合預定軌跡，如果符合，則啟動圖像傳感器檢測是否捕捉到所述用戶的預設部位的圖像以及啟動距離傳感器檢測所述移動終端和所述用戶的預設部位的距離是否小于或等于預設距離；
[0017]如果所述圖像傳感器捕捉到所述用戶的預設部位，且所述移動終端與所述預設部位距離小于或等于所述預設距離，則啟動語音撥號模式；
[0018]在所述語音撥號模式下，采集所述用戶發(fā)出的語音信號，并對所述語音信號進行解析以獲取語音信息；以及
[0019]自動撥打與所述語音信息對應的聯(lián)系人電話號碼。
[0020]根據(jù)本發(fā)明實施例的基于三維手勢和語音的自動撥號方法，將三維手勢交互和語音交互這兩種自然的、豐富的交互方式結合起來，在移動終端上實現(xiàn)了智能化、人性化、自然化的撥打電話的交互模式，操作起來更加快捷高效，容易理解、記憶、操作。同時，有效地減少用戶因犯錯帶來的尷尬，避免因單通道誤差帶來的誤操作。此外，緊急情況下，可以最大程度節(jié)省時間、避免誤操作、避免危險和傷害。
[0021]在本發(fā)明的一個實施例中，所述移動終端利用手勢傳感器檢測所述用戶的動作是否符合預定軌跡，其中，所述手勢傳感器向外發(fā)射光信號，且根據(jù)接收到的反射光獲取所述用戶動作的軌跡。
[0022]在本發(fā)明的一個實施例中，所述啟動圖像傳感器檢測是否捕捉到所述用戶的預設部位的圖像，包括如下步驟:
[0023]所述圖像傳感器采集當前窗口內(nèi)的圖像信息，并判斷所述圖像信息是否與所述預設部位匹配，如果是，則判斷捕捉到所述用戶的預設部位的圖像。
[0024]根據(jù)本發(fā)明實施例的基于三維手勢和語音的自動撥號方法，使撥打電話的交互風格更加自然化、人性化。
[0025]在本發(fā)明的一個實施例中，所述自動撥打與所述語音信息對應的聯(lián)系人電話號碼，包括如下步驟:
[0026]判斷所述語音信息是否屬于預存的聯(lián)系人名稱或聯(lián)系人電話，其中，所述聯(lián)系人列表包括所述聯(lián)系人名稱和對應的聯(lián)系人電話；
[0027]如果是，則自動撥打與所述語音信息對應的聯(lián)系人電話號碼。
[0028]使用三維手勢、語音兩個通道來定位撥號給某聯(lián)系人的任務操作，可以極大地增加任務操作定位的準確性，避免因單通道誤差帶來的誤操作。
[0029]本發(fā)明第二方面實施例提出了一種移動終端，包括:三維手勢檢測模塊，用于檢測用戶的動作是否符合預定軌跡，如果符合，則在捕捉到所述用戶的預設部位的圖像以及所述移動終端和所述用戶的預設部位的距離小于或等于預設距離時，發(fā)出語音撥號啟動信號；采集模塊，用于采集所述用戶發(fā)出的語音信號；語音解析模塊，所述語音解析模塊與所述采集模塊相連，用于對所述語音信號進行解析以獲取語音信息；以及撥打模塊，所述撥打模塊分別與所述三維手勢檢測模塊和所述語音解析模塊相連，用于在接收到所述語音撥號啟動信號后，啟動語音撥號模式，并自動撥打與所述語音信息對應的聯(lián)系人電話號碼。
[0030]根據(jù)本發(fā)明實施例的移動終端，通過將三維手勢交互和語音交互這兩種自然的、豐富的交互方式結合起來，能夠使撥打電話的任務流程簡化，操作更加簡單便捷，此外還有效減少用戶因犯錯帶來的尷尬，尤其是在緊急情況下，可以最大程度節(jié)省時間、避免誤操作、避免危險和傷害。[0031]在本發(fā)明的一個實施例中，所述三維手勢檢測模塊包括:手勢傳感器，用于檢測所述用戶的動作是否符合預定軌跡，其中，所述手勢傳感器向外發(fā)射光信號，且根據(jù)接收到反射光獲取所述用戶動作的軌跡；圖像傳感器，用于采集當前窗口內(nèi)的圖像信息，并判斷所述圖像信息是否與所述預設部位匹配，如果是，則判斷捕捉到所述用戶的預設部位的圖像；以及距離傳感器，用于檢測所述移動終端與所述預設部位的當前距離，并判斷當前距離是否小于或等于所述預設距離。
[0032]其中，所述手勢傳感器包括:光源，用于向外發(fā)射光信號；光學控制器，用于接收反射光，并對所述反射光進行聚焦；光探測器，用于接收聚焦后的反射光，并將所述聚焦后的反射光轉(zhuǎn)換為電信號；控制器，用于接收所述電信號，并將所述電信號轉(zhuǎn)換為應用可讀格式。
[0033]在本發(fā)明的一個示例中，所述光源為LED或激光二極管。
[0034]本發(fā)明實施例的移動終端，使撥打電話的交互方式更加自然化、人性化、智能化，并且撥打電話的交互風格更加友好。
[0035]在本發(fā)明的一個實施例中，所述移動終端還包括存儲模塊，用于存儲所述聯(lián)系人列表，其中，所述聯(lián)系人列表包括所述聯(lián)系人名稱和對應的聯(lián)系人電話。
[0036]進一步地，所述語音解析模塊與所述存儲模塊相連，用于讀取所述聯(lián)系人列表，并判斷所述語音信息是否屬于預存的聯(lián)系人名稱或聯(lián)系人電話。
[0037]采用三維手勢、語音兩個通道來定位撥號給某聯(lián)系人的任務操作，可以極大地增加任務操作定位的準確性，避免因單通道誤差帶來的誤操作。
[0038]在本發(fā)明的一個示例中，所述采集模塊為聽筒。
[0039]本發(fā)明的附加方面和優(yōu)點將在下面的描述中部分給出，部分將從下面的描述中變得明顯，或通過本發(fā)明的實踐了解到。
【專利附圖】

【附圖說明】
[0040]本發(fā)明的上述和/或附加的方面和優(yōu)點從結合下面附圖對實施例的描述中將變得明顯和容易理解，其中:
[0041]圖1為根據(jù)本發(fā)明實施例的基于三維手勢和語音的自動撥號方法的流程圖；
[0042]圖2為根據(jù)本發(fā)明實施例中手勢傳感器的結構示意圖；
[0043]圖3為根據(jù)本發(fā)明一個實施例的基于三維手勢和語音的自動撥號方法的具體流程圖；
[0044]圖4為根據(jù)本發(fā)明實施例的移動終端的結構示意圖；和
[0045]圖5為根據(jù)本發(fā)明實施例的三維手勢檢測模塊的結構示意圖。
【具體實施方式】
[0046]下面詳細描述本發(fā)明的實施例，所述實施例的示例在附圖中示出，其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的，旨在用于解釋本發(fā)明，而不能理解為對本發(fā)明的限制。
[0047]在本發(fā)明中，除非另有明確的規(guī)定和限定，術語“安裝”、“相連”、“連接”、“固定”等術語應做廣義理解，例如，可以是固定連接，也可以是可拆卸連接，或一體地連接；可以是機械連接，也可以是電連接；可以是直接相連，也可以通過中間媒介間接相連，可以是兩個元件內(nèi)部的連通。對于本領域的普通技術人員而言，可以根據(jù)具體情況理解上述術語在本發(fā)明中的具體含義。
[0048]下面參照圖1至圖3來描述根據(jù)本發(fā)明第一方面實施例提出的基于三維手勢和語音的自動撥號方法。
[0049]如圖1所示，本發(fā)明實施例提供的自動撥號方法包括如下步驟:
[0050]S101，移動終端檢測用戶的動作是否符合預定軌跡，如果符合，則啟動圖像傳感器檢測是否捕捉到該用戶的預設部位的圖像以及啟動距離傳感器檢測移動終端和該用戶的預設部位的距離是否小于或等于預設距離。
[0051]在本發(fā)明的一個實施例中，移動終端利用手勢傳感器檢測用戶的動作是否符合預定軌跡，其中，手勢傳感器向外發(fā)射光信號，且根據(jù)接收到的反射光獲取用戶動作的軌跡。
[0052]具體地，如圖2所示，手勢傳感器包括光源201、光學控制器202、光探測器203和控制器204。
[0053]光源201用于向外發(fā)射光信號，一般采用LED (Light Emitting Diode,發(fā)光二極管)或激光二極管，通常可產(chǎn)生紅外光或近紅外光，這種光一般不易為使用者察覺，并且大多經(jīng)過光調(diào)制，可以提高手勢傳感器的分辨率。
[0054]光學控制器202用于接收反射光，并對反射光進行聚焦。也就是說，光學控制器202有助于實現(xiàn)理想的環(huán)境照明，并將反射光聚焦在光探測器203的表面上。此外，光學控制器202中的帶通濾波器能夠濾除影響性能的背景光和其他雜散光，只有與光源201的光頻相匹配的反射光才能進入光學控制器202的光敏元件。
[0055]光探測器203用于接收聚焦后的反射光，并將聚焦后的反射光轉(zhuǎn)換為電信號。也就是說，光探測器203能夠檢測到經(jīng)過過濾的反射光，并將其轉(zhuǎn)換為電信號，以供控制器204進行處理。
[0056]控制器204用于接收光探測器203轉(zhuǎn)換后的電信號，并將電信號轉(zhuǎn)換為應用可讀格式。例如，控制器 204 可以為超高速 ASIC(Application Specific Integrated Circuit,專門應用的集成電路)或者DSP (Digital Signal Processing,數(shù)字信號處理)芯片，能夠?qū)邮盏降男畔?例如電信號)進行處理，將其轉(zhuǎn)換為終端用戶應用(例如移動終端中的軟件)能夠解讀的格式。在本發(fā)明的一個實施例中，步驟SlOl中啟動圖像傳感器檢測是否捕捉到該用戶的預設部位的圖像，進一步包括:
[0057]圖像傳感器采集當前窗口內(nèi)的圖像信息，并判斷圖像信息是否與預設部位匹配，如果是，則判斷捕捉到用戶的預設部位的圖像。
[0058]在本發(fā)明的一個示例中，預定軌跡可以為用戶將移動終端從遠端靠近身體的軌跡，預設部位可以為耳朵。換言之，用戶將移動終端從遠端逐步靠近身體，直至耳朵的部位。
[0059]具體而言，光源201用于向外發(fā)射光信號,包括向用戶發(fā)射光信號。光學控制器202接收來自外部的反射光，并對反射光進行聚焦。其中，光學控制器202接收由用戶的身體反射的反射光并進行聚焦。光探測器203將聚焦后的反射光轉(zhuǎn)換為電信號，并發(fā)送至控制器204。由控制器204對該電信號進行分析，得出光線的傳輸路徑，進而判斷該傳輸路徑是否符合預設軌跡。在符合的條件下，進一步由圖像傳感器檢測是否捕捉到用戶的耳朵的圖像。其中，圖像傳感器可以為移動終端的攝像裝置。[0060]S102,如果圖像傳感器捕捉到用戶的預設部位，且移動終端與預設部位距離小于或等于預設距離，則啟動語音撥號模式。
[0061]也就是說，在此交互過程中，移動終端通過手勢傳感器檢測到用戶拿起移動終端貼近身體的這個動作，即符合預定軌跡，然后通過圖像傳感器(例如根據(jù)攝像頭拍攝的圖像信息)捕捉用戶的身體部位，即上述預設部位，例如耳朵。
[0062]具體而言，移動終端通過手勢傳感器檢測到用戶拿起移動終端貼近身體的這個動作，然后根據(jù)圖像傳感器捕捉到移動終端是貼到用戶身體的預設部位例如耳朵，再通過距離傳感器判斷移動終端與耳朵的距離是小于或等于預設距離(例如I厘米)，當以上這個三個條件的判斷都符合要求即打電話情景時，移動終端自動啟動語音撥號模式。
[0063]在本發(fā)明的一個示例中，移動終端可以是手機，可以理解的是，本發(fā)明示例中的移動終端并不僅限于此。
[0064]S103，在語音撥號模式下，采集用戶發(fā)出的語音信號，并對語音信號進行解析以獲取語首?目息。
[0065]也就是說，移動終端的語言解析模塊將采集到的用戶發(fā)出的語音信號轉(zhuǎn)換成語音指令，直接控制移動終端撥打電話號碼。
[0066]S104,自動撥打與語音信息對應的聯(lián)系人電話號碼。
[0067]也就是說，步驟S104自動撥打與語音信息對應的聯(lián)系人電話號碼，還進一步包括:
[0068]判斷語音信息是否屬于預存的聯(lián)系人名稱或聯(lián)系人電話，其中，聯(lián)系人列表包括聯(lián)系人名稱和對應的聯(lián)系人電話；如果是，則自動撥打與語音信息對應的聯(lián)系人電話號碼。例如，用戶說出“小明”，移動終端`立即檢索聯(lián)系人列表中“小明”的信息并撥打出與聯(lián)系人相對應的電話號碼?；蛘撸脩粽f出想要撥打的電話號碼，移動終端立即檢索到聯(lián)系人列表中的該號碼并撥打出。
[0069]具體地，下面以手機為例對本發(fā)明實施例的基于三維手勢和語音的自動撥號方法的流程進行詳細描述。如圖3所示，上述基于三維手勢和語音的自動撥號方法，包括如下步驟:
[0070]S301，手機檢測用戶的動作是否為拿起手機貼近身體的動作。如果是，則進入下一步驟S302 ;如果否，則返回步驟S301，繼續(xù)進行檢測。
[0071]S302,啟動手機圖像傳感器，并米集當如窗口內(nèi)的圖像?目息。
[0072]S303，判斷圖像信息是否為用戶的耳朵。如果是，則進入下一步驟S304 ;如果否，則返回步驟S302。
[0073]S304，手機圖像傳感器捕捉到的貼近身體的部位為用戶的耳朵。
[0074]S305，啟動手機距尚傳感器。
[0075]S306，手機距離傳感器檢測手機與用戶耳朵的距離是否小于或等于I厘米。優(yōu)選地，在本發(fā)明的一個示例中，預設距離以I厘米進行判斷。如果是，則進入下一步驟S307 ；如果否，則返回步驟S305。
[0076]S307，啟動語音撥號模式。
[0077]S308，采集用戶發(fā)出的語音信號，并對語音信號進行解析以獲取語音信息。
[0078]S309，判斷語音信息是否屬于手機中預存的聯(lián)系人名稱或聯(lián)系人電話。如果是，則進入下一步驟；如果否，返回步驟S308，重新采集用戶的語音信號。
[0079]S310，自動撥打與語音信息對應的聯(lián)系人電話號碼。
[0080]在本發(fā)明的一個示例中，手機放置在桌上，呈鎖屏狀態(tài)，這時小美走過來，拿起桌上的手機并貼近耳朵至I厘米以內(nèi)，直接說道:“媽媽”，然后手機進行語音反饋“正在給媽媽撥電話”，幾秒鐘后，媽媽的電話就接通了。
[0081]根據(jù)本發(fā)明實施例的基于三維手勢和語音的自動撥號方法，通過將三維手勢交互和語音交互這兩種自然的、豐富的交互方式結合起來，具有以下幾個優(yōu)點:(1)使撥打電話的任務流程簡化，操作起來更加快捷、高效；(2)使撥打電話的交互方式更加自然化、人性化，容易理解、記憶、操作；(3)使撥打電話的交互風格更加友好，有效減少用戶因犯錯而帶來的尷尬；(4)使用三維手勢、語音兩個通道來定位撥號給聯(lián)系人的任務操作，可以極大增加任務操作定位的準確性，避免因單通道誤差帶來的誤操作；(5)緊急情況下，可以最大程度節(jié)省時間、避免誤操作、避免危險和傷害。
[0082]下面參照圖4和圖5描述根據(jù)本發(fā)明第二方面實施例提出的移動終端。
[0083]如圖4所示，該移動終端包括三維手勢檢測模塊401、采集模塊402、語音解析模塊403和撥打模塊404。
[0084]其中，三維手勢檢測模塊401用于檢測用戶的動作是否符合預定軌跡，如果符合，則在捕捉到用戶的預設部位的圖像以及移動終端和用戶的預設部位的距離小于或等于預設距離時，發(fā)出語音撥號啟動信號。采集模塊402用于采集用戶發(fā)出的語音信號。語音解析模塊403與采集模塊402相連，用于對語音信號進行解析以獲取語音信息。撥打模塊404分別與三維手勢檢測模塊401和語音解析模塊403相連，用于在接收到語音撥號啟動信號后，啟動語音撥號模式，并自動撥打與語音信息對應的聯(lián)系人電話號碼。也就是說，語言解析模塊403將采集模塊402采集到的用戶發(fā)出的語音信號轉(zhuǎn)換成語音指令，直接控制撥打模塊404撥打電話號碼。
[0085]進一步地，在本發(fā)明的一個實施例中，如圖5所示，三維手勢檢測模塊401包括手勢傳感器501、圖像傳感器502和距離傳感器503。
[0086]手勢傳感器501用于檢測用戶的動作是否符合預定軌跡，其中，手勢傳感器向外發(fā)射光信號，且根據(jù)接收到反射光獲取用戶動作的軌跡。
[0087]圖像傳感器502用于采集當前窗口內(nèi)的圖像信息，并判斷圖像信息是否與預設部位匹配，如果是，則判斷捕捉到用戶的預設部位的圖像。
[0088]距離傳感器503用于檢測移動終端與預設部位的當前距離，并判斷當前距離是否小于或等于預設距離。優(yōu)選地，在本發(fā)明的一個示例中，預設距離可以為I厘米。
[0089]也就是說，在此交互過程中，手勢傳感器501檢測到用戶拿起移動終端貼近身體的這個動作，即這個動作符合預定軌跡，然后通過圖像傳感器502 (例如根據(jù)攝像頭拍攝的圖像信息)捕捉用戶的身體部位，即上述預設部位，在本發(fā)明的一個示例中，預設部位可以為耳朵。
[0090]具體而言，手勢傳感器501檢測到用戶拿起移動終端貼近身體的這個動作，然后根據(jù)圖像傳感器502捕捉到移動終端是貼到用戶身體的預設部位例如耳朵，再通過距離傳感器503判斷移動終端與耳朵的距離是小于或等于預設距離(例如I厘米)，當以上這個三個條件的判斷都符合要求即打電話情景時，三維手勢檢測模塊401自動發(fā)出語音撥號啟動信號。
[0091]具體地，在本發(fā)明的一個實施例中，如圖2所示，手勢傳感器501包括光源201、光學控制器202、光探測器203和控制器204。
[0092]其中，光源201用于向外發(fā)射光信號，一般采用LED或激光二極管，通?？僧a(chǎn)生紅外光或近紅外光，這種光一般不易為使用者察覺，并且大多經(jīng)過光調(diào)制，可以提高手勢傳感器501的分辨率。
[0093]光學控制器202用于接收反射光，并對反射光進行聚焦。也就是說，光學控制器202有助于實現(xiàn)理想的環(huán)境照明，并將反射光聚焦在光探測器203的表面上。此外，光學控制器202中的帶通濾波器能夠濾除影響性能的背景光和其他雜散光，只有與光源201的光頻相匹配的反射光才能進入光學控制器202的光敏元件。
[0094]光探測器203用于接收聚焦后的反射光，并將聚焦后的反射光轉(zhuǎn)換為電信號。也就是說，光探測器203能夠檢測到經(jīng)過過濾的反射光，并將其轉(zhuǎn)換為電信號，以供控制器204進行處理。
[0095]控制器204用于接收光探測器203轉(zhuǎn)換后的電信號，并將電信號轉(zhuǎn)換為應用可讀格式。例如，控制器204可以為超高速ASIC或者DSP芯片，能夠?qū)邮盏降男畔?例如電信號)進行處理，將其轉(zhuǎn)換為終端用戶應用(例如移動終端中的軟件)能夠解讀的格式。
[0096]本發(fā)明實施例的移動終端，使撥打電話的交互方式更加自然化、人性化、智能化，并且撥打電話的交互風格更加友好。
[0097]在本發(fā)明的一個實施例中，如圖4所示，該移動終端還包括存儲模塊405，用于存儲聯(lián)系人列表，其中，聯(lián)系人列表包括聯(lián)系人名稱和對應的聯(lián)系人電話。
[0098]進一步地，如圖4所示，語音解析模塊403與存儲模塊405相連，用于讀取聯(lián)系人列表，并判斷語音信息是否屬于預存的聯(lián)系人名稱或聯(lián)系人電話。例如，采集模塊402采集到用戶說出“小明”的語音信號，語音解析模塊403進行解析并立即檢索聯(lián)系人列表中“小明”的信息，撥打模塊404自動撥打出與聯(lián)系人“小明”相對應的電話號碼?；蛘?，采集模塊402采集到用戶說出想要撥打的電話號碼的語音信號，語音解析模塊403進行解析并立即檢索到聯(lián)系人列表中的該號碼，然后撥打模塊404自動撥打出該號碼。
[0099]在本發(fā)明的一個示例中，采集模塊402為聽筒或語音監(jiān)聽模塊。
[0100]采用三維手勢、語音兩個通道來定位撥號給聯(lián)系人的任務操作，可以極大地增加任務操作定位的準確性，避免因單通道誤差帶來的誤操作。
[0101]在本發(fā)明的一個實施例中，該移動終端可以是手機，可以理解的是，本發(fā)明實施例的移動終端并不僅限于此。
[0102]在本發(fā)明的一個示例中，手機放置在桌上，呈鎖屏狀態(tài)，這時小美走過來，拿起桌上的手機并貼近耳朵至I厘米以內(nèi)，直接說道:“媽媽”，然后手機進行語音反饋“正在給媽媽撥電話”，幾秒鐘后，媽媽的電話就接通了。
[0103]根據(jù)本發(fā)明實施例的移動終端，通過將三維手勢交互和語音交互這兩種自然的、豐富的交互方式結合起來，能夠使撥打電話的任務流程簡化，操作更加簡單便捷，此外還有效減少用戶因犯錯帶來的尷尬，尤其是在緊急情況下，可以最大程度節(jié)省時間、避免誤操作、避免危險和傷害。
[0104]流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為，表示包括一個或更多個用于實現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分，并且本發(fā)明的優(yōu)選實施方式的范圍包括另外的實現(xiàn)，其中可以不按所示出或討論的順序，包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序，來執(zhí)行功能，這應被本發(fā)明的實施例所屬【技術領域】的技術人員所理解。
[0105]在流程圖中表示或在此以其他方式描述的邏輯和/或步驟，例如，可以被認為是用于實現(xiàn)邏輯功能的可執(zhí)行指令的定序列表，可以具體實現(xiàn)在任何計算機可讀介質(zhì)中，以供指令執(zhí)行系統(tǒng)、裝置或設備(如基于計算機的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設備取指令并執(zhí)行指令的系統(tǒng))使用，或結合這些指令執(zhí)行系統(tǒng)、裝置或設備而使用。就本說明書而言，"計算機可讀介質(zhì)"可以是任何可以包含、存儲、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設備或結合這些指令執(zhí)行系統(tǒng)、裝置或設備而使用的裝置。計算機可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個或多個布線的電連接部(電子裝置)，便攜式計算機盤盒(磁裝置)，隨機存取存儲器(RAM)，只讀存儲器(R0M)，可擦除可編輯只讀存儲器(EPR0M或閃速存儲器)，光纖裝置，以及便攜式光盤只讀存儲器(⑶ROM)。另外，計算機可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì)，因為可以例如通過對紙或其他介質(zhì)進行光學掃描，接著進行編輯、解譯或必要時以其他合適方式進行處理來以電子方式獲得所述程序，然后將其存儲在計算機存儲器中。
[0106]應當理解，本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實現(xiàn)。在上述實施方式中，多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實現(xiàn)。例如，如果用硬件來實現(xiàn)，和在另一實施方式中一樣，可用本領域公知的下列技術中的任一項或他們的組合來實現(xiàn):具有用于對數(shù)據(jù)信號實現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路，具有合適的組合邏輯門電路的專用集成電路，可編程門陣列(PGA)，現(xiàn)場可編程門陣列(FPGA)等。
[0107]本【技術領域】的普通技術人員可以理解實現(xiàn)上述實施例方法攜帶的全部或部分步驟是可以通過程序來指令相關的硬件完成，所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中，該程序在執(zhí)行時，包括方法實施例的步驟之一或其組合。
[0108]此外，在本發(fā)明各個實施例中的各功能單元可以集成在一個處理模塊中，也可以是各個單元單獨物理存在，也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現(xiàn)，也可以采用軟件功能模塊的形式實現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時，也可以存儲在一個計算機可讀取存儲介質(zhì)中。
[0109]上述提到的存儲介質(zhì)可以是只讀存儲器，磁盤或光盤等。
[0110]在本說明書的描述中，參考術語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結合該實施例或示例描述的具體特征、結構、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中，對上述術語的示意性表述不一定指的是相同的實施例或示例。而且，描述的具體特征、結構、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結合。
[0111]盡管上面已經(jīng)示出和描述了本發(fā)明的實施例，可以理解的是，上述實施例是示例性的，不能理解為對本發(fā)明的限制，本領域的普通技術人員在不脫離本發(fā)明的原理和宗旨的情況下在本發(fā)明的范圍內(nèi)可以對上述實施例進行變化、修改、替換和變型。
【權利要求】
1.一種基于三維手勢和語音的自動撥號方法，其特征在于，包括如下步驟: 移動終端檢測用戶的動作是否符合預定軌跡，如果符合，則啟動圖像傳感器檢測是否捕捉到所述用戶的預設部位的圖像以及啟動距離傳感器檢測所述移動終端和所述用戶的預設部位的距離是否小于或等于預設距離；如果所述圖像傳感器捕捉到所述用戶的預設部位，且所述移動終端與所述預設部位距離小于或等于所述預設距離，則啟動語音撥號模式；在所述語音撥號模式下，采集所述用戶發(fā)出的語音信號，并對所述語音信號進行解析以獲取語音信息；以及自動撥打與所述語音信息對應的聯(lián)系人電話號碼。
2.如權利要求1所述的自動撥號方法，其特征在于，所述移動終端利用手勢傳感器檢測所述用戶的動作是否符合預定軌跡，其中，所述手勢傳感器向外發(fā)射光信號，且根據(jù)接收到的反射光獲取所述用戶動作的軌跡。
3.如權利要求1所述的自動撥號方法，其特征在于，所述啟動圖像傳感器檢測是否捕捉到所述用戶的預設部位的圖像，包括如下步驟: 所述圖像傳感器采集當前窗口內(nèi)的圖像信息，并判斷所述圖像信息是否與所述預設部位匹配，如果是，則判斷捕捉到所述用戶的預設部位的圖像。
4.如權利要求1所述的自動撥號方法，其特征在于，所述自動撥打與所述語音信息對應的聯(lián)系人電話號碼，包括如下步驟: 判斷所述語音信息是否屬于預存的聯(lián)系人名稱或聯(lián)系人電話，其中，所述聯(lián)系人列表包括所述聯(lián)系人名稱和對應的聯(lián)系人電話；如果是，則自動撥打與所述語音信息對應的聯(lián)系人電話號碼。
5.一種移動終端，其特征在于，包括: 三維手勢檢測模塊，用于檢測用戶的動作是否符合預定軌跡，如果符合，則在捕捉到所述用戶的預設部位的圖像以及所述移動終端和所述用戶的預設部位的距離小于或等于預設距離時，發(fā)出語音撥號啟動信號；采集模塊，用于采集所述用戶發(fā)出的語音信號；語音解析模塊，所述語音解析模塊與所述采集模塊相連，用于對所述語音信號進行解析以獲取語音信息；以及撥打模塊，所述撥打模塊分別與所述三維手勢檢測模塊和所述語音解析模塊相連，用于在接收到所述語音撥號啟動信號后，啟動語音撥號模式，并自動撥打與所述語音信息對應的聯(lián)系人電話號碼。
6.如權利要求5所述的移動終端，其特征在于，所述三維手勢檢測模塊包括: 手勢傳感器，用于檢測所述用戶的動作是否符合預定軌跡，其中，所述手勢傳感器向外發(fā)射光信號，且根據(jù)接收到反射光獲取所述用戶動作的軌跡；圖像傳感器，用于采集當前窗口內(nèi)的圖像信息，并判斷所述圖像信息是否與所述預設部位匹配，如果是，則判斷捕捉到所述用戶的預設部位的圖像；以及距離傳感器，用于檢測所述移動終端與所述預設部位的當前距離，并判斷當前距離是否小于或等于所述預設距離。
7.如權利要求6所述的移動終端，其特征在于，所述手勢傳感器包括:光源，用于向外發(fā)射光信號；光學控制器，用于接收反射光，并對所述反射光進行聚焦；光探測器，用于接收聚焦后的反射光，并將所述聚焦后的反射光轉(zhuǎn)換為電信號；控制器，用于接收所述電信號，并將所述電信號轉(zhuǎn)換為應用可讀格式。
8.如權利要求7所述的移動終端，其特征在于，所述光源為LED或激光二極管。
9.如權利要求5所述的移動終端，其特征在于，還包括存儲模塊，用于存儲所述聯(lián)系人列表，其中，所述聯(lián)系人列表包括所述聯(lián)系人名稱和對應的聯(lián)系人電話。
10.如權利要求9所述的移動終端，其特征在于，所述語音解析模塊與所述存儲模塊相連，用于讀取所述聯(lián)系人列表，并判斷所述語音信息是否屬于預存的聯(lián)系人名稱或聯(lián)系人電話。
11.如權利要求5所述的移動終端，其特征在于，所述采集模塊為聽筒。
【文檔編號】H04M1/26GK103634442SQ201210308653
【公開日】2014年3月12日申請日期:2012年8月27日優(yōu)先權日:2012年8月27日
【發(fā)明者】齊穎申請人:百度在線網(wǎng)絡技術（北京）有限公司

完整全部詳細技術資料下載