專利名稱:具有包括導(dǎo)引配對和語音觸發(fā)操作的語音控制功能的電信裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及電信、音頻耳機、揚聲器以及諸如移動電話和個人數(shù)字助理的其它通信裝置,具體地涉及用于在耳機與這些裝置之間提供無線語音控制導(dǎo)引 (wa 1 k-through)配對和其它功能的系統(tǒng)和方法。
背景技術(shù):
當(dāng)前存在能夠嵌入在移動電話和其它裝置內(nèi)并且使得用戶可以直接對裝置講話并且控制某些功能的系統(tǒng)。例如,一些移動電話提供語音識別特征,這使得用戶可將電話設(shè)置到語音設(shè)備模式,然后說出在電話的地址薄中列出的人的名字。通常,這是通過以下操作執(zhí)行的首先按下電話上的一個按鈕,等待說出命令的邀請,然后講出命令和人的名字。如果電話識別該名字,則它撥打?qū)?yīng)號碼。然而,在許多當(dāng)前系統(tǒng)中,語音識別功能被包含在電話自身內(nèi)。這樣,當(dāng)使用該特征時用戶一般必須靠近電話,以啟用語音識別模式,然后對電話講出人的名字。這種技術(shù)不易帶來便利的使用,尤其是當(dāng)用戶正在使用可能與電話自身分離一定距離的耳機或其它音頻裝置時。此外,隨著電信裝置(特別是移動電話、計算機和便攜式數(shù)字助理(PDA)的使用持續(xù)變得更加普及并且商業(yè)和臨時用戶通常具有一個或多個這種裝置(在一些情況下,具有幾個這種裝置),現(xiàn)代裝置的一個好處在于它們能夠彼此進行無線通信。例如,使用藍牙協(xié)議,移動電話可以與計算機進行通信;或者計算機可以與打印機進行通信,只要這兩個裝置被適當(dāng)構(gòu)造為彼此通信即可;在藍牙的情況下,這要求對裝置進行配對。藍牙配對的一個普通例子是移動電話和無線音頻耳機。然而,即使在這種簡單情形之下,配對行動對于一些用戶仍是困難的;并且由于加入了附加裝置,配對會變得更加困難。
發(fā)明內(nèi)容
本文公開了一種提供電信、音頻耳機和諸如移動電話和個人數(shù)字助理的其它通信裝置的無線語音控制導(dǎo)引配對和其它功能的系統(tǒng)和方法。與要求用戶通常靠近電話以啟用語音識別模式以及對電話講出人的名字的許多當(dāng)前系統(tǒng)不同,根據(jù)一個實施例,耳機、免提聽筒電話或配備麥克風(fēng)的其它裝置能夠直接從用戶接收語音命令,識別該命令,然后在諸如移動電話的通信裝置上執(zhí)行功能。這些功能例如能夠包括請求電話呼叫它的地址薄中的號碼。根據(jù)各種實施例,這些功能還能夠包括通信裝置的先進控制,例如,將該裝置與音頻耳機或另一個藍牙裝置進行配對。本文還公開了一種使用語音實現(xiàn)的導(dǎo)引配對來對通信裝置進行配對的系統(tǒng)和方法。在藍牙和其它協(xié)議的情況下,配對能使兩個或更多裝置被配對,從而使得它們能夠隨后使用藍牙協(xié)議進行無線通信。根據(jù)一個實施例,無線音頻耳機、揚聲器、免提聽筒電話或帶藍牙功能的其它裝置能夠包括配對邏輯和聲音/音頻播放文件,其口頭引導(dǎo)用戶將該裝置與另一個帶藍牙功能的裝置進行配對。這使得配對過程對于大部分用戶更加容易,特別是在可能要求配對多個裝置的情況下。本文還公開了一種使用語音激活、語音觸發(fā)或語音實現(xiàn)的操作來操作電信、音頻耳機、揚聲器以及諸如移動電話、個人數(shù)字助理和相機的其它通信和電子裝置的特征的系統(tǒng)和方法。根據(jù)一個實施例,電子裝置能夠在空閑模式下工作,在空閑模式下該裝置監(jiān)聽來自用戶的口頭命令。當(dāng)用戶講出或以其它方式發(fā)出命令時,裝置識別該命令并且相應(yīng)地進行回應(yīng),包括根據(jù)發(fā)出命令的上下文,遵循一系列提示以引導(dǎo)用戶操作裝置的一個或多個特征(例如,訪問菜單或其它特征)。根據(jù)一個實施例,這使得用戶可以根據(jù)需要以免提模式操作裝置。
圖1示出了根據(jù)一個實施例的實現(xiàn)耳機、揚聲器或其它通信裝置的語音控制操作的系統(tǒng)的圖。圖2示出了根據(jù)一個實施例的提供語音控制導(dǎo)引配對和其它功能的耳機、揚聲器或者其它通信裝置的圖。圖3示出了根據(jù)一個實施例的在電信裝置中提供語音控制功能的系統(tǒng)的圖。圖4示出了根據(jù)一個實施例的在電信裝置中提供語音控制功能的系統(tǒng)的另一個圖。圖5示出了根據(jù)一個實施例的包括語音控制導(dǎo)引配對的移動電話和耳機、揚聲器或其它通信裝置的圖。圖6是根據(jù)一個實施例的對耳機、揚聲器或其它通信裝置提供語音控制導(dǎo)引配對和其它功能的方法的流程圖。圖7是根據(jù)一個實施例的使用語音實現(xiàn)導(dǎo)引配對對通信裝置進行配對的方法的流程圖。圖8示出了根據(jù)一個實施例的提供語音實現(xiàn)導(dǎo)引配對的耳機、揚聲器或其它通信裝置的圖。圖9示出了根據(jù)一個實施例的提供語音激活、語音觸發(fā)或語音實現(xiàn)的操作的耳機、免提聽筒電話或者諸如移動電話、個人數(shù)字助理或相機的其它通信或電子裝置的圖。圖10示出了根據(jù)一個實施例的在電信裝置中提供語音激活、語音觸發(fā)或語音實現(xiàn)的功能的系統(tǒng)的圖。圖11是根據(jù)一個實施例的在裝置中提供語音激活、語音觸發(fā)或語音實現(xiàn)的操作的方法的流程圖。圖12示出了根據(jù)一個實施例的包括語音激活、語音觸發(fā)或語音實現(xiàn)的操作的移動電話和耳機的圖。
具體實施例方式本文描述了一種提供電信、音頻耳機和諸如移動電話和個人數(shù)字助理的其它通信裝置的語音控制導(dǎo)引配對和其它功能的系統(tǒng)和方法。與要求用戶通??拷娫捯詥⒂谜Z音識別模式以及向電話講出人的名字的許多當(dāng)前系統(tǒng)不同,根據(jù)一個實施例,耳機、免提聽筒電話或裝配麥克風(fēng)的其它裝置能夠直接從用戶接收語音命令,識別該命令,然后在例如移
5動電話的通信裝置上執(zhí)行功能。這些功能例如能夠包括請求電話呼叫它的地址簿中的電話號碼。根據(jù)各種實施例,這些功能還能夠包括通信裝置的先進控制,例如,將該裝置與音頻耳機或另一個藍牙裝置進行配對。另外,本文描述了一種使用語音實現(xiàn)導(dǎo)引配對對通信裝置進行配對的系統(tǒng)和方法。在藍牙的情況下,配對允許對兩個或更多裝置進行配對從而它們隨后能夠使用藍牙協(xié)議(在短距離內(nèi)與固定和移動裝置交換數(shù)據(jù)的開放無線協(xié)議)或另一無線技術(shù)進行無線通信以形成個人局域網(wǎng)。通常,該系統(tǒng)能夠并入用戶能夠用于經(jīng)由移動電話、車載電話或任何其它類型的通信系統(tǒng)進行通信的無線音頻耳機、揚聲器、免提聽筒電話或者其它帶藍牙功能的裝置中。根據(jù)一些實施例,耳機、揚聲器、免提聽筒電話或其它裝置能夠包括正面麥克風(fēng)和背面麥克風(fēng),這些麥克風(fēng)能夠拾取講話聲音(經(jīng)由正面麥克風(fēng))和環(huán)境聲音或噪聲 (經(jīng)由背面麥克風(fēng)),并且同時對這些信號進行比較或減除以實現(xiàn)更加清楚的通信。通常,該系統(tǒng)能夠并入用戶能夠用于經(jīng)由移動電話、車載電話或任何其它類型的通信系統(tǒng)進行通信的耳機、免提聽筒電話或其它裝置中。通常,耳機(如圖1所示)包括聽筒、耳鉤、正面和背面麥克風(fēng),并且能夠由用戶通過聽筒在用戶的耳朵之一上佩戴并且耳鉤繞耳朵進行接合以更好將耳機進行固定?;蛘?,如圖1所示,該系統(tǒng)能夠設(shè)置在揚聲器或其它通信裝置內(nèi)。正面和背面麥克風(fēng)的組合使得可以拾取講話聲音(經(jīng)由正面麥克風(fēng))和環(huán)境聲音或噪聲(經(jīng)由背面麥克風(fēng)),并且同時對這些信號進行比較或減除以實現(xiàn)更加清楚的通信。根據(jù)一些實施例,耳機、揚聲器和/或其它裝置能夠使用藍牙(在短距離內(nèi)與固定和移動裝置交換數(shù)據(jù)的開放無線協(xié)議)或另一無線技術(shù)進行通信以形成個人局域網(wǎng)。耳機還能夠用作普通通信耳機或者用作移動電話的內(nèi)部揚聲器和麥克風(fēng)系統(tǒng)的擴展。具有語音控制功能的電信裝置圖1示出了根據(jù)一個實施例的實現(xiàn)耳機、揚聲器或其它通信裝置的語音控制操作的系統(tǒng)100的圖。如圖1所示,第一裝置102、108(例如,音頻耳機或免提聽筒電話)能夠與諸如移動電話104、106、揚聲器108、個人數(shù)字助手或其它裝置的一個或多個其它通信裝置進行通信以及控制它們的功能。根據(jù)一個實施例,第一裝置可以是帶藍牙功能的耳機,其它裝置可以是一個或多個帶藍牙功能的電話、揚聲器、通信系統(tǒng)或其它裝置。根據(jù)其它實施例,第一裝置可以是帶藍牙功能的免提聽筒電話(例如可能安裝在汽車遮陽板上),其它裝置也可以是一個或多個帶藍牙功能的電話、揚聲器、通信系統(tǒng)或其它裝置。根據(jù)特定實施例,耳機或揚聲器可以包括行動按鈕103,該行動按鈕103使用戶可以將耳機或揚聲器設(shè)置到語音識別模式。在其它實施例中,耳機可以在始終監(jiān)聽或被動監(jiān)聽語音識別模式下工作,等待來自用戶的語音命令。通常,這需要向麥克風(fēng)供電,在耳機是電池供電的情況下這會使電池耗電。在一些實施例中,當(dāng)耳機已經(jīng)被配對時(例如,當(dāng)使用藍牙或類似技術(shù)已經(jīng)特定地將耳機與接近的移動電話進行關(guān)聯(lián)時),通過將耳機配置為僅僅監(jiān)聽語音命令,能夠降低對電池電力的需求。當(dāng)激活語音識別模式時,用戶能夠向耳機(128)或揚聲器(129)提供語音命令 120,如圖1所示的語音命令A(yù) 122、B 124、CU6。當(dāng)耳機接收到每個語音命令時,再次使用藍牙或類似技術(shù),對應(yīng)功能能夠被發(fā)送至電話、揚聲器、通信系統(tǒng)或其它裝置(130、132)或者在這些裝置上執(zhí)行。該裝置能夠類似地使用藍牙信號回應(yīng)耳機,并且耳機向用戶提供聽覺響應(yīng)。根據(jù)一個實施例,用戶能夠通過說出簡單的語音命令來命令耳機并且隨后控制電話或其它裝置。例如,用于執(zhí)行功能的與耳機的典型交互能夠包括1.用戶點擊耳機行動按鈕或者以其它方式激活耳機的語音識別特征。2.用戶等待耳機請求“說A命令”。3.用戶然后大聲清楚地向耳機講出語音命令之一。如果耳機沒有回應(yīng),則用戶可以重復(fù)語音命令。如果用戶延遲太長時間,則耳機將通知用戶他們先前的命令被“取消”,并且在用戶能夠使用另一個語音命令之前用戶需要點擊行動按鈕或者以其它方式重新激活耳機的語音識別特征。在任何時間用戶都能夠說“我能說什么? ”,這使得耳機播放可用語音命令的列表。根據(jù)一個實施例,耳機識別的語音命令能夠包括“我已經(jīng)連接了?”-找出耳機是否連接到電話?!皯?yīng)答”-應(yīng)答來電?!盎仉姟?撥打在當(dāng)前連接的電話上接收的最后來電?!昂艚锌焖贀芴?”到“呼叫快速撥號8”_撥打?qū)?yīng)存儲的快速撥號?!昂艚行畔ⅰ?撥打本地信息服務(wù)?!叭∠?取消當(dāng)前操作?!皺z查電池”-檢查耳機和當(dāng)前連接的電話的電池電量。“返回”-從“設(shè)置菜單”或“講授(Teach Me)”選項返回主菜單?!昂鲆暋?拒絕來電?!芭c我配對”-進入配對模式?!半娫捗睢?訪問電話的語音撥號特征(如果它具有一個語音撥號特征的話)?!爸?fù)堋?重?fù)茉诋?dāng)前連接的電話上呼叫的最后號碼。“我能說什么? ”-聆聽當(dāng)前可用命令的列表?!瓣P(guān)閉耳機”-關(guān)閉耳機;耳機將請求確認(rèn)。圖2顯示了根據(jù)一個實施例的提供語音控制導(dǎo)引配對和其它功能的耳機、免提聽筒電話、或其它通信裝置的圖。如圖2所示,耳機、免提聽筒電話或其它裝置102可以包括嵌入電路或邏輯140,該嵌入電路或邏輯140包括處理器142、存儲器144、用戶音頻麥克風(fēng)和揚聲器146和電信裝置接口 148。語音識別軟件150包括如下程序設(shè)計識別來自用戶的語音命令152,將語音命令映射到可用功能154的列表,以及準(zhǔn)備對應(yīng)裝置功能156從而經(jīng)由電信裝置接口與電話或其它裝置進行通信。配對邏輯160與多個聲音/音頻播放文件和/或輸出命令164、166和168的腳本一起能夠用于向用戶提供導(dǎo)引配對通知或指令。以上部件的每一個能夠設(shè)置在適于安裝在耳機內(nèi)的小形狀因數(shù)的一個或多個集成電路或電子芯片上。圖3顯示了根據(jù)一個實施例的用于在電信裝置中提供語音控制功能的系統(tǒng)的圖。 如圖3所示,根據(jù)一個實施例,該系統(tǒng)包括應(yīng)用層180、音頻插件層182和DSP層184。應(yīng)用層向用戶提供邏輯接口,并且使得該系統(tǒng)實現(xiàn)語音響應(yīng)(VR) 186,例如,監(jiān)視行動按鈕的使用或者監(jiān)聽用戶講出的命令。如果VR被激活(188),則用戶輸入被提供給音頻插件層,該音
7頻插件層提供命令的語音識別和/或?qū)⒚钷D(zhuǎn)換成基礎(chǔ)DSP層理解的格式。根據(jù)不同的實施例,能夠插入不同音頻層部件,和/或不同DSP層。這使得現(xiàn)有的應(yīng)用層可以與例如不同電信產(chǎn)品中的新版本的音頻層和/或DSP—起使用。音頻層的輸出與來自用戶的任何附加或可選指令(191) 一起被集成在DSP中(190)。DSP層然后負(fù)責(zé)與其它電信裝置進行通信。 根據(jù)一個實施例,DSP層能夠利用KalimbaCSR BC05芯片組,其提供與帶藍牙功能的電信裝置的藍牙互操作性。根據(jù)其它實施例,可以使用其它類型的芯片組。DSP層然后產(chǎn)生對VR 命令或行為的響應(yīng)(192),或者執(zhí)行必要的操作(例如,藍牙操作),并且音頻層向應(yīng)用層指示完成命令(194)。此時,根據(jù)需要應(yīng)用層能夠播放附加提示和/或接收附加命令196。以上部件的每個能夠進行組合和/或設(shè)置為一個或多個集成軟件和/或硬件構(gòu)造。圖4顯示了根據(jù)一個實施例的用于在電信裝置中提供語音控制功能的系統(tǒng)的另一個圖。如圖4所示,根據(jù)一個實施例,該系統(tǒng)也能夠用于播放提示(沒有來自用戶的另外輸入)。根據(jù)這個實施例,音頻層的輸出被集成在DSP內(nèi)(190),而不等待來自用戶的附加或可選指令。除了這個DSP層能夠根據(jù)需要播放附加提示198(不需要請求另外用戶輸入) 以外,DSP層還負(fù)責(zé)與其它電信裝置進行通信并且產(chǎn)生對VR命令或行為的任何響應(yīng)(192, 194)。圖5顯示了根據(jù)一個實施例的包括語音控制導(dǎo)引配對的移動電話和耳機的圖。通常,在用戶能夠使用耳機或免提聽筒電話與移動電話之前,例如通過藍牙必須對這些裝置進行配對。配對建立了電話與耳機之間的存儲鏈路。根據(jù)一個實施例,能夠使用上述的語音控制功能以導(dǎo)引方式對這些裝置進行配對。一旦用戶已經(jīng)將耳機與例如電話進行配對,這兩個裝置能夠在未來彼此重新連接而不需要重復(fù)配對過程。根據(jù)一個實施例,耳機被構(gòu)造為在第一次接通時自動進入配對模式。根據(jù)一些實施例,用戶能夠通過說出“與我配對”語音命令并且遵循耳機的語音提示而進入配對模式。用戶還能夠通過說出“我已經(jīng)連接了”語音命令,確定耳機與電話是否連接。如圖5所示,用戶能夠說出語音命令122以激活移動電話或其它裝置上的功能,例如使用移動電話撥打號碼或者開始配對過程。根據(jù)請求的功能,藍牙或其它信號220能夠被發(fā)送至移動電話以激活其上的功能。耳機能夠向用戶提供提示124,請求他們執(zhí)行一些附加行動以完成該過程。再次使用藍牙或其它信號222,還能夠從移動電話接收信息。當(dāng)該過程完成時,耳機能夠通過另一個聽覺響應(yīng)126 (在這個例子中,耳機與移動電話的配對224) 通知用戶。例如,用于執(zhí)行配對的與耳機的典型交互包括1.在耳機接通后,用戶按下耳機行動按鈕,等待耳機請求“說A命令”,然后說“與我配對”。2.語音提示向用戶解釋耳機現(xiàn)在處于配對模式,并且請求用戶將移動電話帶到耳機的范圍內(nèi)。3.然后,提示用戶定位電話中的藍牙菜單,并且打開藍牙。4.然后,提示用戶使用電話的藍牙菜單搜索藍牙裝置。5.當(dāng)電話完成搜索時,它將顯示它找到的裝置的列表。用戶于是能夠從列表選擇耳機。6.電話可以提示口令或安全代碼。一旦輸入后,電話能夠自動連接到耳機并且通知用戶成功。
圖6是根據(jù)一個實施例的對耳機、揚聲器或其它通信裝置提供語音控制導(dǎo)引配對和其它功能的方法的流程圖。如圖6所示,在步驟242中,用戶請求耳機啟動通信裝置上的功能或者與通信裝置的功能(例如,撥打號碼或者與裝置進行配對)。在步驟M4中,耳機接收用戶語音命令。在步驟246中識別語音命令,在步驟248中,將該語音命令映射到一個或多個裝置功能(例如,請求電話撥打特定號碼或者啟動配對序列)。在步驟250中,確定裝置功能。在步驟252中,裝置功能被發(fā)送至通信裝置,在步驟254中,耳機返回等待隨后的用戶請求。顯而易見,根據(jù)說出的語音命令,一些語音命令和功能可以要求超過一次與用戶的往復(fù)交互。例如,上述的配對序列要求許多步驟,在每個步驟包括對用戶的一個或多個語音提示。根據(jù)一個實施例,特定功能可以調(diào)用這些語音提示的腳本,以引導(dǎo)用戶使用耳機和 /或移動電話或其它裝置的特定功能。 電信裝置的語音實現(xiàn)導(dǎo)弓丨配對根據(jù)一個實施例,一般通過在兩個藍牙裝置之間交換密碼以確認(rèn)這些裝置(或者裝置的用戶)已經(jīng)同意彼此配對,來執(zhí)行藍牙配對。通常,配對始于第一裝置被構(gòu)造為尋找它近旁的其它裝置;并且第二藍牙裝置被構(gòu)造為向它近旁的其它裝置廣告它的存在。當(dāng)這兩個裝置發(fā)現(xiàn)彼此時,它們能夠提示輸入密碼,該密碼必須在任一裝置處匹配以建立配對。 一些裝置(例如,一些音頻耳機)具有工廠預(yù)設(shè)的密碼,該工廠預(yù)設(shè)的密碼不能夠被用戶改變,但必須被輸入到與之配對的裝置。圖7是根據(jù)一個實施例的用于使用語音實現(xiàn)導(dǎo)引配對對通信裝置進行配對的方法的流程圖。具體地講,圖7示出了耳機與第一和/或第二電話的配對,但是顯而易見,類似過程可以應(yīng)用于其它類型的裝置。如圖7所示,在第一步驟312中,用戶能夠請求該裝置啟動配對過程。根據(jù)一個實施例,耳機、揚聲器、免提聽筒電話或者其它裝置能夠包括行動按鈕,該行動按鈕啟動配對過程或者使得用戶可以將裝置設(shè)置到語音識別模式并且開始配對過程。根據(jù)一些實施例,耳機能夠在始終監(jiān)聽或被動監(jiān)聽語音識別模式下操作,等待來自用戶的語音命令(例如,來自用戶的“與我配對”的請求),如在2009年6月25日提交的題目為 "TELECOMMUNICATIONS DEVICE WITH VOICE-CONTROLLED FUNCTIONS” 的美國臨時專利申請 No. 61/220, 399中詳細描述的,通過引用將該美國臨時專利申請并入本文。根據(jù)一個實施例,當(dāng)接收到請求“與我配對”時,在步驟14中,該裝置確定第一電話是否已經(jīng)連接。如果第一電話被連接,則在步驟316中,該裝置確定第二電話是否已經(jīng)連接。如果第二電話被連接,則在步驟318中,該裝置口頭通知用戶兩個電話被連接。根據(jù)一個實施例,音頻文件(例如,如圖1所示的2Ph0neSC0nneCted. wav音頻文件)能夠經(jīng)由耳機或其它揚聲器進行播放,由此通知或指示用戶。根據(jù)其它實施例,其它音頻文件格式和不同措詞的指令能夠提供給用戶。在步驟320中,該裝置口頭詢問用戶他們是否想進入配對模式,在步驟322,用戶能夠使用語音命令或鍵盤命令指示是或否。如果用戶指示否,則在步驟324 中,該裝置指示用戶配對模式已經(jīng)被取消。在步驟326中,過程結(jié)束。如果先前在步驟316中裝置確定了第一電話已經(jīng)連接而第二電話沒有連接,則在步驟328中裝置通知用戶電話被連接,然后如上所述繼續(xù)進行從步驟320開始的處理。
如果先前在步驟314中裝置確定了第一電話還沒有連接,則在步驟332中,裝置確定第二電話是否連接,并且如果第二電話被連接,則進入步驟328,在步驟328中該過程如上所述繼續(xù)進行。如果先前在步驟332中裝置確定了第一電話和第二電話均沒有連接,則裝置直接進入配對模式334。在配對模式中,裝置使用腳本口頭引導(dǎo)或指示用戶通過成功配對所需的多個步驟,在恰當(dāng)時間暫停從而使得用戶可以執(zhí)行特定步驟或者等待來自裝置的響應(yīng)。典型的配對腳本例如能夠包括耳機“耳機現(xiàn)在處于配對模式,準(zhǔn)備好連接到你的電話。進入你的電話上的藍牙
菜單。”裝置等待3秒;然后播放pairMel. wav (或者等效的口頭/音頻通知)。耳機“打開或啟用藍牙。”裝置等待5秒;然后播放pairMe2. wav (或者等效的口頭/音頻通知)。耳機“選擇配對或添加新裝置。”裝置等待3秒;然后播放pairMe3. wav (或者等效于口頭/音頻通知)。耳機“選擇 < 電話名稱>,,裝置等待3秒;然后播放pairMe4. wav (或者等效于口頭/音頻通知)。耳機“在你的電話上輸入0000。接受任何連接請求并且啟用自動連接。如果需要則設(shè)置 < 電話名稱 > 作為選項菜單中的信任裝置?!毖b置播放pairMe5· wav (或者等效的口頭/音頻通知)。使用如上所示的配對腳本,在步驟336中,裝置搜索可發(fā)現(xiàn)的對。如果沒有找到可發(fā)現(xiàn)的對,則在步驟340中,裝置口頭通知用戶沒有找到電話,并且在步驟342中,配對模式被取消。還可以在任何時間通過MFB按壓取消配對模式(344)。如果先前在步驟336中找到可發(fā)現(xiàn)的對,則在步驟346中裝置確認(rèn)正確密碼已經(jīng)被輸入電話。在步驟348中,如果裝置上的配對列表當(dāng)前是滿的,則在步驟350中,裝置口頭通知用戶這個事件并且確認(rèn)能夠刷新配對列表。否則,在步驟352中,裝置與電話進行配對,并且在步驟M中,口頭向用戶通知成功配對。在以上所示的例子中,該過程能夠使用特定密碼和適于特定音頻耳機或其它裝置的等待時間。根據(jù)其它例子和其它實施例,能夠使用其它密碼、等待時間、通知和步驟組合 (包括采用裝置的全名或適當(dāng)名稱替代如上所示的一般 < 電話名稱 > 屬性),從而最好地反映特定裝置及其需要。圖8顯示了根據(jù)一個實施例的包括語音實現(xiàn)導(dǎo)引配對的移動電話和耳機的圖。如上所述,通常在用戶能夠使用耳機402或揚聲器416與移動電話418之前,這些裝置必須進行配對。根據(jù)一個實施例,能夠使用上述的語音實現(xiàn)功能以導(dǎo)引方式對裝置進行配對。一旦用戶已經(jīng)將耳機或揚聲器與例如電話進行配對,不必重復(fù)配對過程就能夠在未來將這兩個裝置彼此重新連接。如圖8所示,用戶能夠說出語音命令400(例如,“與我配對”402)以啟動耳機、揚聲器、移動電話或其它裝置上的配對過程。根據(jù)請求的功能,藍牙或其它信號422能夠發(fā)送至移動電話或者從移動電話進行發(fā)送從而激活其上的功能。如上所述,耳機能夠向用戶提供被預(yù)定暫?;虻却龝r間406、410所穿插的附加提示404、410、412和414,指示用戶如何執(zhí)行完成該過程所需的任何附加行動。當(dāng)該過程完成時,耳機能夠通知用戶,并且在這個例子中將耳機和揚聲器二者與移動電話配對430。電子裝置的語音觸發(fā)操作根據(jù)一個實施例,本文公開了一種使用語音激活、語音觸發(fā)或語音實現(xiàn)的操作來操作電信、音頻耳機、揚聲器以及其它通信和電子裝置(例如,移動電話、個人數(shù)字助理和相機)的特征的系統(tǒng)和方法。根據(jù)一個實施例,電子裝置能夠在空閑模式下操作,在空閑模式下該裝置監(jiān)聽來自用戶的口頭命令。當(dāng)用戶講出或以其它方式發(fā)出命令時,裝置識別該命令并且相應(yīng)地進行回應(yīng),包括根據(jù)發(fā)出命令的上下文,遵循一系列提示以引導(dǎo)用戶操作裝置的一個或多個特征(例如,訪問菜單或其它特征)。根據(jù)一個實施例,如果需要這使得用戶可以以免提模式操作該裝置。圖9顯示了提供語音激活、語音觸發(fā)或語音實現(xiàn)的操作的耳機、免提聽筒電話或其它通信或電子裝置(例如,移動電話、個人數(shù)字助理或相機)的圖。如圖9所示,耳機、免提聽筒電話或其它通信或電子裝置502能夠包括嵌入電路或邏輯540,該嵌入電路或邏輯 540包括處理器M2、存儲器M4、用戶音頻麥克風(fēng)和揚聲器M6以及裝置接口 M8。語音識別軟件550包括如下程序設(shè)計識別來自用戶的語音命令552,將該語音命令映射到可用功能的列表554,并且準(zhǔn)備對應(yīng)裝置功能556以經(jīng)由電信裝置接口與電話或其它裝置進行通信。操作流邏輯560與語音激活觸發(fā)功能561和多個聲音/音頻播放文件和/或輸出命令 564、566、568的腳本(例如,wav文件)一起能夠用于提供語音實現(xiàn)的操作,包括對用戶的通知或指令。根據(jù)一個實施例,語音激活觸發(fā)功能與軟件標(biāo)記或類似指示器進行關(guān)聯(lián),該軟件標(biāo)記或類似指示器能夠進行切換以指示語音激活觸發(fā)功能設(shè)置到開(啟用)還是關(guān)(禁用)模式。當(dāng)語音激活觸發(fā)功能為開或啟用時,系統(tǒng)持續(xù)激活麥克風(fēng)監(jiān)聽并且準(zhǔn)備好執(zhí)行語音識別(不管是否按下了主按鈕)。當(dāng)語音激活觸發(fā)功能為關(guān)或禁用時,當(dāng)按下或以其它方式激活例如主按鈕的手動操作特征時,系統(tǒng)僅僅激活麥克風(fēng)監(jiān)聽和/或啟動語音識別; 此時,系統(tǒng)發(fā)出例如“說一個命令”的確認(rèn)并且進入全語音識別模式。根據(jù)一個實施例,當(dāng)語音激活觸發(fā)功能為開或啟用模式時,在發(fā)出例如“說一個命令”的確認(rèn)并且進入全語音識別模式之前,系統(tǒng)激活麥克風(fēng)監(jiān)聽但等待直到接收到例如“激活”、“對我講話”的先前配置的特定短語或命令作為語音觸發(fā)或者其它配置的短語或命令。以上部件的每個能夠設(shè)置在適于安裝在耳機或其它電子裝置內(nèi)的小形狀因數(shù)的一個或多個集成電路或電子芯片上或者組合成這一個或多個集成電路或電子芯片。圖10顯示了根據(jù)一個實施例的在電信裝置中提供語音激活、語音觸發(fā)或語音實現(xiàn)的功能的系統(tǒng)的圖。如圖10所示,根據(jù)一個實施例,該系統(tǒng)包括應(yīng)用層570、音頻插件層 572和DSP層574。應(yīng)用層向用戶提供邏輯接口,并且例如通過監(jiān)視行動按鈕的使用或者當(dāng)通過監(jiān)聽用戶講出的命令啟用語音激活功能時,使得系統(tǒng)能夠執(zhí)行語音響應(yīng)(VR)。根據(jù)一個實施例,語音激活觸發(fā)功能與軟件標(biāo)記或類似指示器576進行關(guān)聯(lián),該軟件標(biāo)記或類似指示器576能夠進行切換以指示語音激活觸發(fā)功能被設(shè)置在開(啟用)或關(guān)(禁用)模式之一。當(dāng)語音激活觸發(fā)功能為關(guān)或禁用時(580),當(dāng)按下或以其它方式激活手動操作特征(例如,主按鈕)時(582),系統(tǒng)僅僅激活麥克風(fēng)監(jiān)聽和/或啟動語音識別。系統(tǒng)然后進
11入全語音識別模式(584)和/或發(fā)出例如“說一個命令”的確認(rèn)(585)。當(dāng)語音激活觸發(fā)功能為開或啟用時(578),系統(tǒng)激活麥克風(fēng)監(jiān)聽但是等待直到接收到例如來自用戶的“與我說話”指令的特定短語或命令作為語音觸發(fā)(581)。系統(tǒng)然后類似地進入全語音識別模式(184)和/或發(fā)出例如“說一個命令”的確認(rèn)(585)。在每種情況下,當(dāng)恰當(dāng)根據(jù)語音激活觸發(fā)功能設(shè)置而激活VR時(588),用戶輸入隨后被提供給音頻插件層,該音頻插件層提供語音識別和/或?qū)⒃撁钷D(zhuǎn)換成基礎(chǔ)DSP層理解的格式。根據(jù)不同實施例,能夠插入不同音頻層部件和/或不同DSP層。這使得現(xiàn)有應(yīng)用層可以與例如不同電信產(chǎn)品中的新版本的音頻層和/或DSP—起使用。音頻層的輸出與來自用戶的任何附加或可選指令591—起被集成在DSP 590內(nèi)。DSP層然后負(fù)責(zé)與其它電信裝置進行通信。根據(jù)一個實施例,DSP層能夠利用Kalimba CSR BC05芯片組,其提供與帶藍牙功能的電信裝置的藍牙互操作性。根據(jù)其它實施例,能夠使用其它類型的芯片組。 DSP層然后產(chǎn)生對VR命令或行動的響應(yīng)(592),或者執(zhí)行必要的操作(例如,藍牙操作),并且音頻層向應(yīng)用層指示完成命令(594)。此時,應(yīng)用層能夠根據(jù)需要播放附加提示和/或接收附加命令(596)。以上部件的每個能夠進行組合和/或設(shè)置為一個或多個集成軟件和/ 或硬件構(gòu)造。圖11是根據(jù)一個實施例的在裝置中提供語音激活、語音觸發(fā)或語音實現(xiàn)的操作的方法的流程圖。如圖11所示,在步驟640中,語音激活觸發(fā)功能進行確定,裝置的語音激活觸發(fā)特征處于開(啟用)還是關(guān)(禁用)模式。在步驟642中,根據(jù)模式,裝置等待或者被激活或者被觸發(fā)以接收用戶語音命令。如上所述,當(dāng)語音激活觸發(fā)功能為開或啟用時, 系統(tǒng)等待直到它接收到特定短語或命令作為語音觸發(fā);而當(dāng)語音激活觸發(fā)功能為關(guān)或禁用時,當(dāng)按下或者以其它方式激活例如主按鈕的手動操作特征時該系統(tǒng)僅僅啟動語音識別。 在步驟644中,接收語音命令。在步驟646中,識別語音命令,并且在步驟648中,將該語音命令映射到一個或多個裝置功能(例如,請求電話撥打特定號碼或者啟動配對序列)。在步驟650中,確定裝置功能。在步驟652中,裝置功能被發(fā)送至裝置,并且在步驟654中,裝置返回等待隨后的用戶請求。圖12顯示了根據(jù)一個實施例的包括語音激活、語音觸發(fā)或語音實現(xiàn)的操作的移動電話和耳機的圖。具體地,圖12顯示了使用語音激活、語音觸發(fā)或語音實現(xiàn)的操作例如通過藍牙將耳機702與移動電話704進行配對的例子。如圖12所示,如果裝置處于語音激活觸發(fā)開或啟用模式,則用戶能夠說出語音觸發(fā)706(例如,“BlueAnt對我講話”708),以使得裝置進入語音識別模式并且等待進一步的命令710 (例如,使用移動電話撥打號碼或者啟動配對過程)。根據(jù)請求的功能,藍牙或其它信號720能夠發(fā)送至移動電話以激活其上的功能。耳機能夠向用戶提供提示,請求他們執(zhí)行一些附加行動以完成該過程。還可以再使用藍牙或其它信號722從移動電話接收信息。當(dāng)該過程完成時,耳機能夠通過另一個口頭響應(yīng)通知用戶,并且在這個例子中將耳機與移動電話配對。已經(jīng)為了圖示和描述的目的提供了本發(fā)明的上述描述。這并不意圖是窮盡性的或者將本發(fā)明限制到公開的具體形式。本領(lǐng)域技術(shù)人員將明白許多變型和變動。選擇并描述實施例以最佳解釋本發(fā)明的原理及其實際應(yīng)用,由此使得本領(lǐng)域其它技術(shù)人員能夠理解本發(fā)明的各種實施例以及適于構(gòu)思的特定使用的各種變型。本發(fā)明的范圍旨在由權(quán)利要求及其等同物進行限定。
可以使用一個或多個傳統(tǒng)的通用或?qū)S脭?shù)字計算機、計算裝置、機器、微處理器或電子電路(包括根據(jù)本發(fā)明的教導(dǎo)設(shè)計的一個或多個處理器、存儲器和/或計算機可讀存儲介質(zhì)),方便地實現(xiàn)本發(fā)明的一些方面。軟件領(lǐng)域技術(shù)人員應(yīng)該明白,熟練程序員基于本發(fā)明的教導(dǎo)能夠容易地準(zhǔn)備恰當(dāng)軟件編碼。在一些實施例中,本發(fā)明包括作為存儲有指令并且能夠用于對計算機編程以執(zhí)行本發(fā)明的任何過程的存儲介質(zhì)或者計算機可讀介質(zhì)的計算機程序產(chǎn)品。該存儲介質(zhì)可以包括但不限于任何類型的盤(包括軟盤、光盤、DVD、CD-ROM、微硬盤和磁光盤)、ROM、RAM、 EPR0M、EEPR0M、DRAM、VRAM、閃存裝置、磁卡或光卡、納米系統(tǒng)(包括分子存儲器IC)、或者適于存儲指令和/或數(shù)據(jù)的任何類型的介質(zhì)或裝置。
權(quán)利要求
1.一種提供電信、音頻耳機以及諸如移動或蜂窩電話的其它裝置的語音控制功能的系統(tǒng),包括電子或音頻裝置,具有包括處理器、存儲器、用戶音頻麥克風(fēng)和電信裝置接口的嵌入電路或邏輯;以及語音識別軟件或邏輯,位于電子或音頻裝置內(nèi),包括如下程序設(shè)計識別來自用戶的語音命令,將語音命令映射到可用功能的列表,以及準(zhǔn)備或執(zhí)行對應(yīng)裝置功能,或者經(jīng)由電信裝置接口和/或無線協(xié)議向電話或其它裝置發(fā)送裝置功能以及從電話或其它裝置接收裝置功能。
2.權(quán)利要求1的系統(tǒng),其中,電子或音頻裝置是耳機、免提聽筒電話、揚聲器或其它通I H衣且。
3.權(quán)利要求1的系統(tǒng),其中,電子或音頻裝置是揚聲器或車載免提聽筒電話。
4.權(quán)利要求2的系統(tǒng),其中,耳機、免提聽筒電話、揚聲器或其它通信裝置包括使得將耳機設(shè)置到語音識別模式的行動按鈕。
5.權(quán)利要求2的系統(tǒng),其中,耳機或免提聽筒電話在等待來自用戶的語音命令的始終監(jiān)聽或被動監(jiān)聽語音識別模式下工作。
6.權(quán)利要求5的系統(tǒng),其中,耳機被構(gòu)造為僅當(dāng)耳機已經(jīng)與另一個裝置配對時監(jiān)聽語音命令,以減少電池電力的使用。
7.權(quán)利要求3的系統(tǒng),其中,揚聲器或車載免提聽筒電話包括使得將耳機設(shè)置到語音識別模式的行動按鈕。
8.權(quán)利要求3的系統(tǒng),其中,揚聲器或車載免提聽筒電話在等待來自用戶的語音命令的始終監(jiān)聽或被動監(jiān)聽語音識別模式下工作。
9.權(quán)利要求2的系統(tǒng),其中,耳機、免提聽筒電話、揚聲器或其它通信裝置被構(gòu)造為僅當(dāng)耳機已經(jīng)與另一個裝置配對時監(jiān)聽語音命令,以減少電池電力的使用。
10.權(quán)利要求1的系統(tǒng),其中,無線協(xié)議是藍牙。
11.權(quán)利要求1的系統(tǒng),其中,電子或音頻裝置包括語音命令和提示的腳本,所述語音命令和提示然后用于引導(dǎo)用戶激活移動裝置上的功能。
12.權(quán)利要求1的系統(tǒng),其中,所述系統(tǒng)提供用于引導(dǎo)用戶將電子或音頻裝置與移動裝置進行配對的語音命令和提示。
13.權(quán)利要求11的系統(tǒng),其中,音頻裝置是耳機或免提聽筒電話、揚聲器或其它通信裝置,并且所述語音命令和提示的腳本用于引導(dǎo)用戶將耳機或免提聽筒電話與移動裝置進行配對。
14.權(quán)利要求1的系統(tǒng),包括口頭或音頻指令或通知的腳本,用于幫助用戶將諸如耳機或揚聲器的音頻裝置與諸如移動電話的另一個電信裝置進行配對,其中,音頻裝置和移動電話使用藍牙通信,并且所述口頭指令或通知的腳本幫助用戶操作一個或多個裝置的藍牙特征,包括從用戶接收對狀態(tài)和/或?qū)⒁纛l裝置與其它電信裝置進行配對的請求,確定當(dāng)前連接的裝置的狀態(tài)和/或用于與附加裝置進行配對的選項,以及口頭通知用戶當(dāng)前連接的裝置的狀態(tài)和/或用于與附加裝置進行配對的選項,以及可選地引導(dǎo)用戶與附加裝置進行配對,包括提供附加口頭指令或通知以幫助用戶啟動藍牙,使得裝置可發(fā)現(xiàn),輸入密碼以及對裝置進行配對,并且包括在適當(dāng)時間暫停以使得用戶可以執(zhí)行特定步驟和/或等待來自正在進行配對的裝置的響應(yīng)。
15.權(quán)利要求1的系統(tǒng),包括語音激活觸發(fā)功能,用于確定裝置是否回應(yīng)作為語音激活觸發(fā)的口頭輸入;以及當(dāng)語音識別軟件或邏輯等待以接收特定短語或命令作為語音激活觸發(fā)語音觸發(fā)時以及當(dāng)被觸發(fā)時,播放指令或通知的腳本以幫助用戶操作電子裝置的特征。
16.一種提供電信、音頻耳機和諸如移動或蜂窩電話的其它裝置的語音控制功能的方法,包括如下步驟提供具有包括處理器、存儲器、用戶音頻麥克風(fēng)和揚聲器以及電信裝置接口的嵌入電路或邏輯的電子或音頻裝置;在電子或音頻裝置內(nèi)設(shè)置語音識別軟件或邏輯,所述語音識別軟件或邏輯包括如下程序設(shè)計識別來自用戶的語音命令,將語音命令映射到可用功能的列表,以及準(zhǔn)備或執(zhí)行對應(yīng)裝置功能,或者經(jīng)由電信裝置接口和/或無線協(xié)議向電話或其它裝置發(fā)送裝置功能以及從其接收裝置功能;使得用戶能夠請求電子或音頻裝置啟動電子、音頻、電話或其它裝置上的功能或者與這些裝置一起啟動功能,諸如撥打號碼或者與裝置進行配對; 將語音命令映射到一個或多個裝置功能;以及準(zhǔn)備或執(zhí)行對應(yīng)裝置功能,或者使用電信裝置接口和/或無線協(xié)議向電話或其它裝置傳送裝置功能。
17.權(quán)利要求16的方法,包括如下步驟播放口頭或音頻指令或通知的腳本,以幫助用戶將諸如耳機或揚聲器的電子或音頻裝置與諸如移動電話的另一個電信裝置進行配對,包括從用戶接收對狀態(tài)和/或?qū)⒁纛l裝置與其它電信裝置進行配對的請求, 確定當(dāng)前連接的裝置的狀態(tài)和/或用于與附加裝置進行配對的選項,以及口頭通知用戶當(dāng)前連接的裝置的狀態(tài)和/或用于與附加裝置進行配對的選項,以及可選地引導(dǎo)用戶與附加裝置進行配對,包括在適當(dāng)時間暫停以使得用戶能夠執(zhí)行特定步驟和 /或等待來自正在進行配對的裝置的響應(yīng)。
18.權(quán)利要求16的方法,其中,音頻裝置和移動電話使用藍牙進行通信,并且口頭指令或通知的腳本幫助用戶操作一個或多個裝置的藍牙特征。
19.權(quán)利要求18的方法,其中,所述口頭指令或通知的腳本包括詢問用戶他們是否想進入藍牙配對模式,如果用戶肯定地確認(rèn),則提供附加口頭指令或通知以幫助用戶啟動藍牙、使得裝置可發(fā)現(xiàn)、輸入密碼和對裝置進行配對。
20.權(quán)利要求16的方法,包括如下步驟提供語音激活觸發(fā)標(biāo)記,該語音激活觸發(fā)標(biāo)記確定裝置是否回應(yīng)語音激活觸發(fā); 等待接收特定短語或命令作為語音激活觸發(fā)語音觸發(fā);以及播放指令或通知的腳本以幫助用戶操作電子或音頻裝置的特征。
全文摘要
一種用于提供電信、音頻耳機和諸如移動電話和個人數(shù)字助理的其它通信裝置的無線語音控制導(dǎo)引配對和其它功能的系統(tǒng)和方法。根據(jù)一個實施例,耳機、揚聲器或配備麥克風(fēng)的其它裝置能夠直接從用戶接收語音命令,識別該命令,然后執(zhí)行例如移動電話的通信裝置上的功能。這些功能例如能夠包括請求電話呼叫它的電話簿中的號碼。根據(jù)各種實施例,這些功能還能夠包括通信裝置的先進控制,例如將該裝置與音頻耳機或另一個藍牙裝置配對。根據(jù)另一個實施例,提供一種使用語音實現(xiàn)導(dǎo)引配對來對通信裝置進行配對的系統(tǒng)和方法。根據(jù)另一個實施例,提供了一種使用語音激活、語音觸發(fā)或語音實現(xiàn)的操作來操作電信、音頻耳機、揚聲器以及諸如移動電話、個人數(shù)字助理和相機的其它通信和電子裝置的特征的系統(tǒng)和方法。
文檔編號G10L15/00GK102483915SQ201080027993
公開日2012年5月30日 申請日期2010年6月25日 優(yōu)先權(quán)日2009年6月25日
發(fā)明者A·潭, T·馬德恩 申請人:藍蟻無線股份有限公司