本發(fā)明的領(lǐng)域涉及飛行器的駕駛員座艙內(nèi)的人機交互領(lǐng)域以及,更具體地,涉及包括聲音命令裝置和觸摸裝置的系統(tǒng)的領(lǐng)域。
背景技術(shù):
在現(xiàn)代駕駛員座艙內(nèi),飛行員和飛行器之間的交互通過多種人機界面而發(fā)生。主要的那些人機界面通過與儀表板顯示裝置的交互而發(fā)生,這些顯示裝置顯示了平穩(wěn)執(zhí)行飛行計劃或執(zhí)行任務(wù)所需要的主要飛行和航行參數(shù)。觸摸表面逐漸用于這個目的,其允許與顯示裝置的簡單交互。
為了進一步簡化飛行員與機載系統(tǒng)的交互,可能將語音作為手段用于通過語音識別系統(tǒng)進行交互。
語音識別已經(jīng)在航空電子學(xué)領(lǐng)域進行了實驗性地研究。為了確保與航空環(huán)境(該環(huán)境可為嘈雜的)中的用途相兼容的識別,已經(jīng)實施了基于有限命令詞典和用戶前期學(xué)習(xí)的方案。此外,這些方案需要利用即按即說(push-to-talk)裝置,例如駕駛員座艙內(nèi)的物理按鈕,其使得語音識別觸發(fā)或停止。
也可能使用觸摸表面以觸發(fā)語音識別。因此,名稱為“觸摸任意地方以說話(Touch anywhere to speak)”的申請WO 2010/144732描述了一種用于移動電子設(shè)備的通過觸摸交互來觸發(fā)語音識別的系統(tǒng)。這個申請未提及特別針對航空領(lǐng)域的安全方面,并且未提出提高嘈雜環(huán)境中語音識別的可靠性的任何方案。
因此,這些當(dāng)前的方案需要物理的即按即說裝置、飛行員對通過語音識別能夠得到的命令清單的學(xué)習(xí)以及確收結(jié)果的系統(tǒng)。此外,語音識別性能水平通常限制其使用。
使用包括根據(jù)本發(fā)明的語音識別單元的用于飛行器的人機界面裝置的方法不具有這些缺點。其使得能夠:
-限制繁重的接觸交互,例如在實際的鍵盤上打字,這尤其在大氣湍流情況下會導(dǎo)致錯誤或煩惱;
-在使用語音識別時提供與航空標(biāo)準(zhǔn)相兼容的安全水平;
-通過將語音命令放置在特定且有限的內(nèi)容中來限制飛行員對語音命令詞典的學(xué)習(xí),因此,極大地降低了錯誤的風(fēng)險。
其還保證,以簡單的方式,對關(guān)鍵命令和非關(guān)鍵命令的管理。術(shù)語“關(guān)鍵命令”理解為表示很可能危及飛行器安全的命令。因此,啟動或停止發(fā)動機為關(guān)鍵命令。術(shù)語“非關(guān)鍵命令”理解為表示對飛行安全或飛行器的安全沒有顯著影響的命令。因此,改變無線電通信的頻率不是關(guān)鍵命令。
技術(shù)實現(xiàn)要素:
更特別地,本發(fā)明的主題在于使用用于飛行器的人機界面裝置的方法,該飛行器至少包括一個語音識別單元、一個具有觸摸界面的顯示裝置、一個圖形界面計算機以及一個電子計算單元,該裝置設(shè)計成圖像地顯示多個命令,每一個命令至少分類成第一種類和第二種類,第一種類稱為關(guān)鍵類,第二類稱為非關(guān)鍵類,每一非關(guān)鍵命令具有多個選項,每一選項具有一個名稱,該名稱集合在稱為“詞典”的數(shù)據(jù)庫中,其中:
-當(dāng)命令是關(guān)鍵的時,該使用方法包括如下步驟:
о識別用戶借助于觸摸界面啟動的關(guān)鍵命令;
о根據(jù)所述命令來啟動語音識別單元;
о將語音識別單元解碼的語音與啟動的命令相比較;
о如果解碼的語音與啟動的命令相對應(yīng),則確認啟動的命令;
-當(dāng)命令是非關(guān)鍵的時,該使用方法包括如下步驟:
о識別用戶借助于觸摸界面啟動的非關(guān)鍵命令;
о根據(jù)所述命令來啟動語音識別單元;
о將語音識別單元解碼的語音與和啟動的命令相關(guān)的詞典中的名稱相比較;
о在詞典中選擇與解碼的語音最相對應(yīng)的名稱;
о顯示與詞典中的所述名稱相對應(yīng)的選項。
有利地,當(dāng)命令是非關(guān)鍵的時,與詞典中的名稱相對應(yīng)的選項自動執(zhí)行。
有利地,啟動語音識別單元的功能從用戶借助于觸摸界面啟動的命令被識別時起,僅啟動有限的持續(xù)時間。
有利地,這個持續(xù)時間與詞典的容量成比例。
有利地,這個持續(xù)時間小于或等于10秒。
附圖說明
閱讀了下面的非限定性描述并借助于附圖1,將更好地理解本發(fā)明且其他優(yōu)點將變得明顯,所述附圖1顯示了根據(jù)本發(fā)明的用于飛行器的人機界面裝置的總體圖。
具體實施方式
根據(jù)本發(fā)明的方法在用于飛行器的人機界面裝置內(nèi)執(zhí)行,更特別地,在其電子計算單元內(nèi)執(zhí)行。
借助于示例,在圖1中示出人機界面裝置1的該套裝置。所述人機界面裝置至少包括:
-具有觸摸界面11的一個顯示裝置10;
-一個圖形界面計算機12;
-一個語音識別單元13;
-一個電子計算單元14。這個單元在圖1中由虛線圍繞。
顯示裝置10傳統(tǒng)上為液晶平板屏幕。也可設(shè)想其他技術(shù)。其示出飛行或航行信息,或者關(guān)于飛行器的航空電子系統(tǒng)的信息。觸摸界面11采取位于顯示裝置的屏幕上的透明觸摸板的形式。這個觸摸板與用于公眾的平板電腦或智能手機上實施的觸摸板相類似。本領(lǐng)域熟知的多種技術(shù)方案能夠生產(chǎn)這類觸摸板。
圖形界面12為計算機,其根據(jù)由傳感器產(chǎn)生的各種數(shù)據(jù)或者來自飛行器數(shù)據(jù)庫的各種數(shù)據(jù),來產(chǎn)生發(fā)送至顯示裝置的圖形信息。這個信息包括一定數(shù)量的命令。每一命令具有一定數(shù)量的可能選項。例如,“傳送頻率”命令具有一定數(shù)量的可能頻率選項。
圖形界面12還獲取由觸摸板產(chǎn)生的信息,其轉(zhuǎn)換為用于航空電子系統(tǒng)其余部分的命令或確認指示。
語音識別單元13傳統(tǒng)地包括微接收器130和能夠識別用戶發(fā)出的詞語的語音處理裝置。這里再次,這些不同的裝置對于本領(lǐng)域的技術(shù)人員而言是已知的。這個單元可以在這樣的意義下配置:能夠在任意時候?qū)υ搯卧付ㄒ蛔R別的命令/詞語的詞典。
語音識別單元從用戶借助于觸摸界面啟動的命令被識別時起,僅啟動有限的持續(xù)時間。因此,語音識別的觸發(fā)和停止是靈活的機構(gòu):
-語音命令通過觸摸交互來觸發(fā),該觸摸界面使得飛行員能夠確定要修改的對象;
-識別的持續(xù)時間或者由第一觸摸交互的結(jié)束來確定,或者在依據(jù)詞典進行識別檢測時根據(jù)詞典來確定。還存在限制的持續(xù)時間,其取決于選擇的詞典,且其防止如果例如沒有檢測到觸摸交互的結(jié)束,則語音識別無限期地保持啟動。這個持續(xù)時間的值取決于選擇的詞典。這個持續(xù)時間通常小于或等于10秒。
對于非關(guān)鍵命令,電子計算單元14包括一定數(shù)量的數(shù)據(jù)庫,稱為“詞典”140。每一詞典包括與特定命令選項相對應(yīng)的詞語或名稱。因此,“頻率”命令僅包括指示頻率或頻率值的名稱。通過非限制性示例,圖1包括稱為“詞典1”、“詞典2”、以及“詞典3”的三個數(shù)據(jù)庫。
電子計算單元14執(zhí)行如下的特定任務(wù):
-“仲裁器”141。這個術(shù)語包括兩個功能。
-第一功能142,其包括啟動語音識別/使語音識別失效。其在圖1中通過兩路開關(guān)來象征性地示出。這個功能的目的是僅在用戶通過觸摸板來選擇命令時,即在合適的時機,啟動語音識別。
-第二功能143,其包括根據(jù)命令來指定要被識別的命令或詞語的正確詞典。淺顯地說,選擇的詞典(其對應(yīng)于圖1中的詞典1)對應(yīng)于單個命令的多個選項。這個功能143在圖1中以多路開關(guān)象征性地表示;
-“安全門”144。這個功能驗證了聲音命令的結(jié)果確實與仲裁器141選擇的詞典相對應(yīng),且如果得到這個對應(yīng)則將其傳送到圖形界面12。然后圖形界面向飛行員顯示證實或確認請求。
如上所述,存在兩種類型的命令,稱為關(guān)鍵命令和非關(guān)鍵命令。
借助于第一示例,為了說明根據(jù)本發(fā)明的人機界面在關(guān)鍵命令情況下的操作,假定左引擎失火且飛行員希望關(guān)停這個發(fā)動機。
通過按壓顯示在觸摸界面上的虛擬按鈕,該按鈕使得關(guān)停左引擎,飛行員必須同時發(fā)出“關(guān)停左引擎”,并且繼續(xù)按壓用于關(guān)停左引擎的按鈕。僅當(dāng)短語“關(guān)停左引擎”被語音識別單元識別出時,該動作被系統(tǒng)確認。
借助于第二示例,為了說明根據(jù)本發(fā)明的人機界面在非關(guān)鍵命令情況下的操作,假定圖形界面正顯示無線電頻率而飛行員希望改變這個頻率。
在駕駛員座艙的顯示屏上,顯示用于VHF通信的所述無線電頻率的當(dāng)前值。飛行員在表示這個頻率的位置處對觸摸板的按壓觸發(fā)語音識別確定的持續(xù)時間,并選擇使得識別無線電頻率的詞典。這個詞典包括,例如一組特定值。由于飛行員已經(jīng)指定了一個頻率,所以他或她能夠自然地說出用于該頻率的新值;語音識別根據(jù)限定到可能的頻率的詞典來執(zhí)行分析。如果識別的詞語出現(xiàn)于詞典,則門144建議文本值,其顯示成接近當(dāng)前值。飛行員可以或不以通過第二觸摸交互來確認該新值。當(dāng)新的選擇不帶來任意負面結(jié)果時,確認可以是自動的。
這個人機界面具有如下優(yōu)點。
第一個優(yōu)勢是在關(guān)鍵命令和非關(guān)鍵命令兩種情況下裝置的安全性。安全性是旨在用于航空應(yīng)用的界面的重要特征。首先,語音識別限制到特定內(nèi)容中,在前述示例中的頻率識別,其使得能夠保證設(shè)備安全性的等級比輕率操作設(shè)備的等級更高。此外,觸摸信息和語音識別是冗余的。最后,通過限制語音識別啟動的時間,避免了不期望的識別,并且能夠相對于可能的值來檢驗命令的結(jié)果。
第二優(yōu)勢是裝置更寬范圍的選擇。觸摸和語音識別的組合能夠識別出更大量的命令,并使語音識別的使用安全。具體地,代替要識別的詞語的單個詞典,語音識別基于多個詞典。這些詞典的每一個的容量有限,但是這些詞典的總和使得大量命令選項成為可能。
第三優(yōu)勢是裝置的高人機工程特性。特別地,要修改的對象的指定使得飛行員直觀地得知要發(fā)布的聲音命令的特性,并因此減小聲音命令所需要的學(xué)習(xí)。此外,正確詞典的選擇和語音識別通過在駕駛員座艙的人機界面的元件上的觸摸交互來直觀地觸發(fā)。這個裝置因此使得飛行員與機載系統(tǒng)直觀且高效地交互,因為觸摸用于指定要被修改的參數(shù)而聲音用于給出新值。
第四優(yōu)勢是廢除了物理的“即按即說”裝置,即用于啟動和停止語音識別的裝置。這個即按即說裝置是最通常的機械控制按鈕。在根據(jù)本發(fā)明的裝置中,僅當(dāng)必須提出聲音識別時,智能地實現(xiàn)開始和停止。