專利名稱::語音接聽方法與移動終端裝置的制作方法
技術領域:
:本發(fā)明是有關于一種語音操控的技術,且特別是有關于一種語音接聽方法與移動終端裝置。
背景技術:
:隨著科技的發(fā)展,具有語音系統(tǒng)的移動終端裝置已日漸普及。上述的語音系統(tǒng)是通過語音理解技術,讓使用者與移動終端裝置進行溝通。舉例來說,使用者只要對上述的移動終端裝置講出某項要求,例如想要查車次、查天氣或是欲撥打電話等,系統(tǒng)便會依據使用者的語音信號,采取對應的動作。上述的動作可能是以語音方式回答使用者問題或是依照使用者指令去驅使移動終端裝置的系統(tǒng)進行動作。以語音系統(tǒng)啟動的便捷性來說,目前大都是觸發(fā)移動終端裝置的屏幕其所顯示的應用程序來啟動,或者通過移動終端裝置所設置的實體按鍵來啟動。上述的設計皆須通過移動終端裝置本身來啟動,但是在某些場合,上述的設計卻是相當的不便。比如說:在行車期間,或者在廚房做菜時,需要撥打位于客廳的行動電話,以詢問友人食譜細節(jié)等使用者無法立即觸及移動終端裝置,但需使語音系統(tǒng)開啟的情況。更進一步,開啟語音對話后,如何進行更符合人類對話自然規(guī)律的完全脫手的多次交互對話。基于此,如何改進上述的這些缺點,成為亟待解決的議題
發(fā)明內容本發(fā)明提供一種語音接聽方法與移動終端裝置,可更快速地提供語音服務。使用者僅需發(fā)送具有識別信息的語音信號,即可方便地與移動終端裝置進行語音溝通,且移動終端裝置可根據使用者所說的內容來終止語音交互,更符合人類對話的自然規(guī)律,使得在對話過程中不再需要手動參與,可以實現人機對話的完全脫手,藉以可更方便、快速地提供語音服務。本發(fā)明提出一種語音接聽方法,用于具有通常模式及第一模式的移動終端裝置。語音接聽方法包括以下步驟。從通常模式切換為第一模式。當于第一模式接收到來電通話時,發(fā)送語音通知,并啟動接收語音信號。解析語音信號以獲得語音辨識結果。根據語音辨識結果,執(zhí)行對應的應答操作。本發(fā)明另提出一種移動終端裝置,其包括語音輸出單元、語音接收單元、語言理解模塊以及來電接收單元。語音輸出單元用以發(fā)送語音通知。語音接收單元用以接收語音信號。語言理解模塊耦接于語音接收單元,用以解析語音信號。來電接收單元耦接于語音輸出單元與語言理解模塊。來電接收單元用以接收來電通話及執(zhí)行應答操作。其中,移動終端裝置從通常模式切換為第一模式,且當來電接收單元接收來電通話時,來電接收單元通過語音輸出單元發(fā)送語音通知,并啟動語音接收單元接收語音信號。并且,語言理解模塊解析語音信號以獲得語音辨識結果,以及來電接收單元根據語音辨識結果執(zhí)行對應的應答操作?;谏鲜?,當移動終端裝置在第一模式接收到來電通話時,移動終端裝置可發(fā)送語音通知以詢問使用者,而讓使用者可根據語音通知,通過語音的方式來操控移動終端裝置進行回應。并且,移動終端裝置可根據來自使用者所說的話,執(zhí)行對應的應答操作。如此一來,移動終端裝置可更快速地提供語音服務,讓使用者可更加便利地、更便捷地操控移動終端裝置。為讓本發(fā)明的上述特征和優(yōu)點能更明顯易懂,下文特舉實施例,并結合所附圖式作詳細說明如下。圖1是依照本發(fā)明一實施例所繪示的移動終端裝置的方塊圖。圖2是依照本發(fā)明一實施例所繪示的語音接聽方法的流程圖。圖3是依照本發(fā)明一實施例所繪示的移動終端裝置的方塊圖。圖4是依照本發(fā)明一實施例所繪示的語音操控方法的流程圖。圖5是依照本發(fā)明一實施例所繪示的語音操控方法的流程圖。具體實施例方式雖然現今的移動終端裝置已可提供語音系統(tǒng),以讓使用者發(fā)出語音來和移動終端裝置溝通,但使用者在啟動此語音系統(tǒng)時,仍必須通過移動終端裝置本身來啟動。因此在使用者無法立即觸及移動終端裝置,但需使語音系統(tǒng)開啟的情況,往往無法滿足使用者立即的需求。更進一步,即使能夠喚醒語音對話系統(tǒng),但目前的行動裝置在對話過程中仍然需要手的不時參與,比如使用者提問結束后,需要再次詢問時需要手動再次開啟語音對話系統(tǒng),極不方便。為此,本發(fā)明提出一種語音接聽方法、語音操控方法及移動終端裝置,讓使用者能夠更便捷地開啟語音系統(tǒng)。更進一步,本發(fā)明能夠使得使用者在整個對話過程中,擺脫手的操作,使得對話更加便捷快速自然。為了使本發(fā)明的內容更為明了,以下特舉實施例作為本發(fā)明確實能夠據以實施的范例。圖1是依照本發(fā)明一實施例所繪示的移動終端裝置的方塊圖。請參照圖1,移動終端裝置100具有語音輸出單元110、語音接收單元120、語言理解模塊130以及來電接收單元140。移動終端裝置100例如為行動電話(Cellphone)、個人數字助理(PersonalDigitalAssistant,PDA)手機、智能手機(Smartphone),或是安裝有通訊軟件的掌上電腦(PocketPC)、平板電腦(TabletPC)或筆記計算機等等。移動終端裝置100可以是任何具備通訊功能的可攜式(Portable)行動裝置,在此并不限制其范圍。此外,移動終端裝置100可使用Android作業(yè)系統(tǒng)、Microsoft作業(yè)系統(tǒng)、Android作業(yè)系統(tǒng)、Linux作業(yè)系統(tǒng)等等,不限于上述。語音輸出單兀110例如是揚聲器。語音輸出單兀110具有擴音功能,用以輸出語音通知以及來自通話對象的語音。具體來說,當移動終端裝置100接收到來電通話時,移動終端裝置100可通過語音輸出單元110發(fā)送語音通知,以告知使用者此來電通話的來源(例如通話對象)或詢問使用者是否要接聽此來電通話等等。此外,當使用者接通來電通話后,使用者也會通過語音輸出單元110來進行接聽。語音接收單元120例如為麥克風,用以接收使用者的聲音,以將使用者的聲音轉換為語音信號。語言理解模塊130耦接于語音接收單元120,用以解析語音接收單元120所接收的語音信號,以獲得語音辨識結果。具體而言,語言理解模塊130可包括語音辨識模塊以及語音處理模塊(未繪示),其中,語音辨識模塊可會接收從語音接收單元120傳來的語音信號,以將語音信號轉換成多個分段語義(例如詞匯或字句等)。語音處理模塊則可依據這些分段語義而解析出這些分段語義所代表的意指(例如意圖、時間、地點等),進而判斷出上述語音信號中所表示的意思。此外,語音處理模塊還會根據所解析的結果產生對應的應答內容。在本實施例中,語言理解模塊130可由一個或數個邏輯門組合而成的硬件電路來實現,亦可以是以計算機程序代碼來實現。值得一提的是,在另一實施例中,上述的語言理解模塊亦可配置于云端伺服器中。也就是說,移動終端裝置100亦可與云端伺服器(未繪示)連線,其中云端伺服器連線具有語言理解模塊。如此一來,移動終端裝置100可將所接收到的語音信號,發(fā)送給云端伺服器中的語言理解模塊進行解析,再從云端伺服器獲得語首辨識結果。來電接收單元140耦接于語音接收單元120與語言理解模塊130。來電接收單元140用以接收來電通話及執(zhí)行應答操作。具體來說,來電接收單元140接收到來電通話后,可根據使用者的語音(后將詳述),來進行接聽來電通話、拒接來電通話、發(fā)送預設語音應答、短信等應答操作來回應來電通話。在此說明的是,本實施例的移動終端裝置100具有通常模式及第一模式。其中,第一模式例如是移動終端裝置100用于行動中的行車裝置中而進入車載模式。更具體而言,在此第一模式中,當移動終端裝置100接收到來電通話時,移動終端裝置100會自動發(fā)送語音通知(例如來電通話的來源)以詢問使用者是否接聽這個來電通話,即移動終端裝置100可自動地開啟其免持系統(tǒng),以和使用者進行語音交互。相對而言,通常模式例如是移動終端裝置100于非車載模式的時候。亦即,在此通常模式中,移動終端裝置100不會自動發(fā)送語音通知以詢問使用者是否接聽這個來電通話,而無法根據使用者的語音信號來做回應,即移動終端裝置100不會自動地開啟其免持系統(tǒng)。如此一來,當移動終端裝置100切換為第一模式時,若移動終端裝置100接收到來電通話,則會發(fā)送語音通知使用者,以讓使用者通過語音的方式,傳送語音信號至移動終端裝置100,使得移動終端裝置100可根據使用者所說的話,來回應此來電通話(例如接聽或拒絕接聽來電通話等應答操作)。需說明的是,本實施例的移動終端裝置100可自動從通常模式切換為第一模式。具體而言,當移動終端裝置100連線于輔助裝置104時,移動終端裝置100可從通常模式切換為第一模式。另一方面,當移動終端裝置100未連線于輔助裝置104時,移動終端裝置104可從第一模式切換為通常模式。在此,移動終端裝置100可匹配于輔助裝置104。其中,當移動終端裝置100通過無線傳輸信號或者電性連接于輔助裝置104時,可使移動終端裝置10自動切換為第一模式。此外,在另一實施例中,當移動終端裝置100用于行動中的行車裝置時,移動終端裝置100也可根據感應行車裝置的速度的大小,來決定是否切換成第一模式。例如,當行車裝置的速度超過閾值時,移動終端裝置100則會從通常模式切換為第一模式。另一方面,當行車裝置的速度未超過閾值時,移動終端裝置100則會從自第一模式切換為通常模式。如此一來,使用者可更加便利地通過語音來操控移動終端裝置100。圖2是依照本發(fā)明一實施例所繪示的語音接聽方法的流程圖。請同時參照圖1及圖2,于步驟202中,移動終端裝置100會從通常模式切換為第一模式。在移動終端裝置100于第一模式的情況下,如步驟S204所示,當來電接收單元140接收到來電通話C時,來電接收單元140會通過語音輸出單元110發(fā)送語音通知S0,并啟動語音接收單元120接收語音信號SI。詳細而言,語音通知SO可告知使用者來電通話的來源,例如,來電接收單元140可依據來電通話C而通過語音輸出單元110發(fā)出關于來電通話C的電話號碼信息,或進而依據聯絡人通訊錄而查出撥出此來電通話C的聯絡人名稱,不限于上述。舉例來說,來電接收單元140可通過語音輸出單元110而發(fā)送出“王大明給您來電,現在接聽嗎?”、“X公司給您來電,現在接聽嗎?”、“來電是0922-123564,現在接聽嗎?”或“來電是886922-123564,現在接聽嗎?”等關于來電通話C的信息。此外,倘若此來電通話C未提供電話號碼,則來電接收單元140亦可通過語音輸出單元110而送出預設的語音通知S0,例如,“這是未知電話,現在接聽嗎?”等等。根據上述的語音通知S0,使用者可得知來電通話C的來源,并可通過語音的方式來操控來電接收單元140以回應此來電通話C。因此,當來電接收單元140接收到來電通話C時,來電接收單元140會啟動語音接收單元120以接收來自使用者的語音信號SI。于步驟S206,語言理解模塊130會解析語音接收單元120所接收到的語音信號SI,以獲得語音辨識結果。在此,語言理解模塊130可接收來自語音接收單元120的語音信號SI,并將語音信號SI分割成多個分段語義。并且,語言理解模塊130會對上述分段語義進行自然語言理解,以辨識出語音信號SI中的應答信息。在此說明的是,在計算機系統(tǒng)架構下的自然語言理解中,通常會使用固定詞語法來擷取語音信號SI的語句,以解析這些語句所意指的指令或意圖(例如接聽來電通話C、拒絕接聽來電通話C或發(fā)送短信等動作)等,而判斷出語音信號SI的意思,藉以獲得語音辨識結果。在本實施例中,語言理解模塊130可通過語義資料庫106,來查詢語音信號SI中所分割成的分段語義是對應于哪些指令,其中語義資料庫106可記錄有各種分段語義與各種命令的關系。在本實施例中,根據上述各種分段語義,語言理解模塊130還可判斷出語音信號SI中哪些是使用者欲回應來電通話C的信息。舉例來說,當使用者回應“好的”、“接聽”、“接一下”等之類表示要接聽來電通話C的語音信號SI時,語言理解模塊130可通過語義資料庫106來查詢“好的”、“接聽”、“接一下”等所對應的命令,而解析出上述的語音信號SI是用以表示接聽來電通話C。在另一實施例中,當使用者回應“不接”、“不”、“先不接”等之類表示要拒絕接聽來電通話C的語音信號SI時,語言理解模塊130可通過語義資料庫106來查詢“不接”、“不”、“先不接”等所對應的命令,而解析出上述的語音信號SI是用以表示拒絕接聽來電通話C。在另一實施例中,當使用者回應“先不接,告訴他我到公司后再打電話給他”等之類表示發(fā)送消息以回應來電通話C的語音信號SI時,語言理解模塊130可通過語義資料庫106來查詢“先不接”所對應的命令,而解析出語音信號S為表示拒絕接聽來電通話C。并且,語言理解模塊130還可通過語義資料庫106來判斷出“告訴他”是表示發(fā)送消息的命令,藉以在后續(xù)步驟中根據這個命令來執(zhí)行應答操作,例如是根據這個命令來產生應答信號(如發(fā)送短信等)。此外,語言理解模塊130還可判斷出“告訴他”之后的語音是表示發(fā)送消息時的應答內容(例如是“到公司后再打電話”)。接著,于步驟S208,來電接收單元140會根據語言理解模塊130所解析出的語音辨識結果,執(zhí)行對應的應答操作。在本實施例中,由于使用者可通過語音的方式,以命令移動終端裝置100進行接聽、拒接來電通話C、發(fā)送消息或其他動作以回應來電通話C,因此語言理解模塊130解析語音信號SI之后,可判斷出語音信號SI中的命令。故來電接收單元140可根據語音信號SI中的命令來執(zhí)行對一的應答操作。上述來電接收單元140所執(zhí)行應答操作可以是接聽來電通話C、拒絕接聽來電通話C、傳送預設語音應答以回應來電通話C,或者傳送短信、語音應答等應答信號,以回應來電通話C,其中應答信號中具有使用者欲回應來電通話C的應答內容。為了使本領域的技術人員進一步了解本實施例來電接收單元140所執(zhí)行的應答操作,下面再舉諸實施例,其中,仍結合圖1的移動終端裝置100來進行說明。當移動終端裝置100切換為第一模式時(例如移動終端裝置100用于行動中的行車裝置中而進入車載模式),假設來電接收單元140接收到來電通話C,且來電接收單元140會通過語音輸出單元110發(fā)送“王大明給您來電,現在接聽嗎?”這個語音通知S0。在本實施例中,倘若使用者回應“好的”這個語音信號SI,則來電接收單元140會接聽這個來電通話C。另一方面,倘若使用者回應“不接”這個語音信號SI,則來電接收單元140會拒絕接聽這個來電通話C。在一實施例中,來電接收單元140還可傳送“您撥的電話暫時無法接聽,請稍后再撥,或在“嗶”聲后留言”這個預設語音應答來回應來電通話C。此外,倘若使用者回應“先不接,告訴他我到公司后再打電話給他”這個語音信號SI,則來電接收單元140會拒絕接聽這個來電通話C,并且會自語音辨識結果取得應答內容,即“到公司后再打電話”這個應答內容以發(fā)送短信,其中例如在短信中記載“我在開會,稍后再回撥”這個短信內容來回應來電通話C。如此一來,在移動終端裝置100進入車載模式的情況下,移動終端裝置100可自動詢問使用者是否接聽來電通話C,以讓使用者直接通過語音的方式來操控移動終端裝置100進行接聽、拒絕接聽或其他應答操作。依據上述,移動終端裝置100可自動從通常模式切換為第一模式。并且,當來電接收單元140在第一模式接收到來電通話時,語音輸出單元110會發(fā)送語音通知以詢問使用者。當使用者發(fā)送語音信號時,語言理解模塊130會對此語音信號進行解析,且來電接收單元140會根據語言理解模塊130解析后所獲得的語音辨識結果,執(zhí)行對應的應答操作。如此一來,移動終端裝置可更快速地提供語音服務,其中當移動終端裝置100在第一模式的情況下,例如用于行動中的行車裝置時,使用者可方便地根據移動終端裝置100所發(fā)送的語音通知,通過語音的方式來回應來電通話。藉此,使用者可更加便利地操控移動終端裝置。圖3是依照本發(fā)明一實施例所繪示的移動終端裝置的方塊圖。請參照圖3,移動終端裝置300具有語音輸出單元310、語音接收單元320、語言理解模塊330以及語音喚醒模塊350。本實施例的移動終端裝置300與圖1的移動終端裝置100相似,其不同之處在于:本實施例的移動終端裝置300更具有語音喚醒模塊350。語音喚醒模塊350用以判斷是否接收到具有識別信息的語音信號。在本實施例中,當語音喚醒模塊350未接收到具有識別信息的語音信號時,語音輸出單元310、語音接收單元320及語言理解模塊330可以處于待機或關閉等模式,即移動終端裝置300不會與使用者進行語音交互。而當語音喚醒模塊350接收到具有識別信息的語音信號時,移動終端裝置300則會啟動語音接收單元320以接收之后的語音信號,并通過語言理解模塊330來進行解析,即移動終端裝置300會依據此語音信號與使用者進行語音交互,且還可執(zhí)行對應于語音信號的應答操作等。故在本實施例中,使用者可直接以語音的方式,說出具有識別信息的語音(例如特定的字匯,如名字),來喚醒移動終端裝置300執(zhí)行語音交互功能。此外,本實施例的語音喚醒模塊350可由一個或數個邏輯門組合而成的硬件電路來實現,亦可以是以計算機程序代碼來實現。值得一提的是,由于語音接收單元320是在語音喚醒模塊350辨識出識別信息之后而被啟動,因此語言理解模塊330可避免對非語音信號(例如雜音信號)進行解析。此夕卜,由于語音喚醒模塊350只要能辨識出識別信息所對應的聲音信號(例如“小茜”這個識別信息所對應的聲音信號),即會判斷所接收到的語音信號具有識別信息,因此語音喚醒模塊350可以不具備有自然語言理解的能力,而具有較低功率的消耗。如此一來,當使用者未提供具有識別信息的語音信號時,移動終端裝置300不會啟動語音交互功能,故移動終端裝置300不僅可方便使用者通過語音來進行操控,亦可節(jié)省電源消耗。以下即結合上述移動終端裝置300來說明語音操控的方法。圖4是依照本發(fā)明一實施例所繪示的語音操控方法的流程圖。請同時參照圖3及圖4,于步驟S402中,語音喚醒模塊350會判斷是否接收到符合識別信息的語音信號(下面以語音信號Vl表示)。詳細而言,識別信息可以是特定的字匯(例如名字)所對應的預設音,其中此預設音會在特定音頻范圍或特定能量范圍之內。也就是說,語音喚醒模塊350可判斷是否接收到在特定音頻范圍或特定能量范圍之內的預設音,而判斷出是否接收到具有識別信息的語音信號VI。在本實施例中,使用者可預先通過移動終端裝置300的系統(tǒng)來設定這個識別信息,例如預先提供識別信息所對應的預設音,而語音喚醒模塊350可藉由比對語音信號Vl是否符合這個預設音,來判斷語音信號Vl是否具有識別信息。舉例來說,假設識別信息為“小茜”這個名字所對應的預設音,則語音喚醒模塊350會判斷是否接收到具有“小茜”的語音信號VI。倘若語音喚醒模塊350未接收到符合識別信息的語音信號VI,則如步驟S404所示,移動終端裝置300不會啟動語音交互功能。由于語音喚醒模塊350未接收到符合識別信息的語音信號VI,因此語音接收單元320是成關閉狀態(tài)或休眠狀態(tài)而不會進行語音信號的接收,故移動終端裝置300中的語言理解模塊330不會取得到之后的語音信號來進行解析。舉例來說,假設識別信息為“小茜”,倘若使用者未說出“小茜”而是說出“小王”等其他語音,即語音喚醒模塊350無法接收到符合“小茜”的語音信號VI,故移動終端裝置300的語音交互功能不會被啟動。于步驟S406中,當語音喚醒模塊350判斷語音信號Vl符合識別信息時,移動終端裝置300會啟動語音接收單元320以接收音訊。并且,語言理解模塊330會依據語音接收單元320所接收到的音訊,判斷語音接收單元320是否在語音信號Vl之后接收到另一語音信號(下面以語音信號V2表示)。在本實施例中,語言理解模塊330可判斷語音接收單元320所接收到的聲音信號的能量是否超過一設定值。若所述聲音信號的能量未超過設定值,則語言理解模塊330會判斷此聲音信號為雜音,藉以判斷語音接收單元320未接收到語音信號V2;若所述聲音信號的能量已達設定值,則語言理解模塊330可判斷語音接收單元320已接收到語音信號V2,進而根據此語音信號V2來執(zhí)行后續(xù)的步驟。倘若語言理解模塊330判斷語音接收單元320未接收到語音信號V2,則如步驟S408所示,語言理解模塊330會執(zhí)行語音對話模式。在語音對話模式中,語言理解模塊330可通過語音輸出單元310發(fā)送語音應答,且可通過語音接收單元320繼續(xù)接收及解析來自使用者的另一個語音信號,據以做出另一個語音應答或者應答操作,直到語言理解模塊330判斷出具有對話終止提示信息的語音信號,或者移動終端裝置300已完成使用者的命令或請求為止。關于語音對話模式的詳細步驟,將于后詳述。倘若語言理解模塊330判斷語音接收單元320接收到語音信號V2,則如步驟S410所示,語言理解模塊330會解析語音信號V2而獲得語音辨識結果。語言理解模塊330可接收來自語音接收單元320的語音信號V2,并將語音信號V2分割成多個分段語義,以及對上述分段語義進行自然語言理解,以辨識出語音信號V2中的內容。如同圖1的語言理解模塊130,本實施例的語言理解模塊330可依據固定詞語法來擷取語音信號V2的語句,以解析這些語句所意指的指令或意圖(例如命令句或者詢問句)等,而判斷出語音信號V2的意思,藉以獲得語音辨識結果。其中,語言理解模塊330可通過語義資料庫306,來查詢語音信號V2中所分割成的分段語義是對應于哪些指令,而上述語義資料庫306可記錄有各種分段語義與各種命令的關系。接著,如步驟S412所示,語言理解模塊330會判斷語音辨識結果中是否具有可執(zhí)行請求信息。詳細而言,可執(zhí)行請求信息例如是指讓移動終端裝置300完成請求操作。也就是說,語言理解模塊330可依據語音辨識結果中的可執(zhí)行請求信息,讓移動終端裝置300執(zhí)行一個動作,其中移動終端裝置300例如可通過一個或多個應用程序來完成。舉例來說,當語音信號V2為“幫我打電話給王大明”、“幫我查臺北明天的天氣”或“現在幾點”等,則語音信號V2具有可執(zhí)行請求信息,因此,語言理解模塊330解析上述語音信號V2后,可令移動終端裝置300撥打電話給王大明、上網查并回報臺北明天的天氣、或者查詢并回報現在的時間等這些動作。另一方面,若語音辨識結果不具有可執(zhí)行請求信息,則表示語言理解模塊330無法依據語音辨識結果而判斷使用者的意圖,因此無法讓移動終端裝置300完成請求操作。舉例來說,當語音信號V2為“幫我打電話”、“幫我查天氣”、“現在”等,則語言理解模塊330解析語音信號V2后,無法令移動終端裝置300完成上述的請求操作。亦即,語言理解模塊330無法判斷出上述語音信號V2中的通話對象、查詢哪一時間內或哪一地點的天氣,以及無法根據一個不具完整語意的句子來執(zhí)行。當語音辨識結果具有可執(zhí)行請求信息時,則如步驟S414所示,語言理解模塊330會執(zhí)行應答操作,且移動終端裝置300會關閉接收其他語音信號(下面以語音信號V3表示),藉以關閉移動終端裝置300的語音交互功能。具體來說,當可執(zhí)行請求信息為操作指令時,則語言理解模塊330會啟動對應于操作指令的操作功能。例如,當可執(zhí)行請求信息為“調低屏幕的亮度”,則語言理解模塊330會發(fā)出一調整亮度的信號給移動終端裝置300的系統(tǒng),使其將屏幕的亮度調低。此外,當可執(zhí)行請求信息為詢問句時,則語言理解模塊330會發(fā)送對應于此詢問句的語音應答。此時語言理解模塊330可辨識出詢問句中的一個或多個關鍵詞,并依據這些關鍵詞而自搜尋引擎中進行查詢對應的答案,再通過語音輸出單元310來輸出語音應答。例如,當可執(zhí)行請求信息為“明天臺北的溫度是幾度?”,則語言理解模塊330可發(fā)出一查詢信號以通過搜尋引擎查詢對應的答案,并通過語音輸出單元310來輸出“明天臺北的溫度是26度”這個語音應答。在此說明的是,由于上述的可執(zhí)行請求信息會讓移動終端裝置300完成請求操作,因此語言理解模塊330執(zhí)行應答操作之后,此時的語音接收單元320會成關閉或休眠狀態(tài),而不會接收到其他的語音信號V3。更進一步而言,當語音接收單元320被關閉接收語音信號V3時,若使用者欲通過語音的方式來令移動終端裝置300執(zhí)行請求操作,則使用者需再呼叫具有識別信息的語音,藉以通過語音喚醒模塊350來進行判斷,進而再次啟動語音接收單元320。當語音辨識結果不具有可執(zhí)行請求信息時,則如步驟S408所示,語言理解模塊330會執(zhí)行語音對話模式。在此,語言理解模塊330會根據語音信號V2通過語音輸出單元310發(fā)送語音應答,并且會通過語音接收單元320,繼續(xù)接收另一個語音信號。也就是說,語言理解模塊330會繼續(xù)接收及解析來自使用者的語音信號,據以做出另一個語音應答或者應答操作,直到語言理解模塊330判斷出具有對話終止提示信息的語音信號,或者移動終端裝置300已完成使用者的命令或請求為止。為了使本領域的技術人員進一步了解上述語言理解模塊330所執(zhí)行的語音對話模式,下面舉諸實施例為例,其中仍結合圖3的移動終端裝置300來進行說明。圖5是依照本發(fā)明一實施例所繪示的語音操控方法的流程圖。請同時參照圖3、圖4與圖5,語言理解模塊330在執(zhí)行語音對話模式時,于步驟S502中,語言理解模塊330會產生語音應答,下面以語音應答Al表示,并通過語音輸出單元310輸出。由于語言理解模塊330會因未接收到語音信號V2(如圖4的步驟S406)而執(zhí)行語音對話模式,或者是因接收到不具有可執(zhí)行請求信息的語音信號V2而執(zhí)行語音對話模式(如圖4的步驟S412),故此時,語言理解模塊330會自動發(fā)送語音應答Al以詢問使用者的請求信息(即使用者的意圖)。舉例來說,當語音接收單元320未接收到語音信號V2時,語言理解模塊330可通過語音輸出單元310發(fā)送“有什么事嗎?”、“需要提供什么服務?”等,不限于此,藉以詢問使用者。此外,當語言理解模塊330所接收到的語音信號V2不具有可執(zhí)行請求信息時,語言理解模塊330可通過語音輸出單元310發(fā)送“您說的是哪一個地方的天氣?”、“您說的是誰的電話?”或“您說的是什么意思?”等等,不限于此。需說明的是,語言理解模塊330亦可根據這個不具有可執(zhí)行請求信息的語音信號V2,而找出匹配此語音信號V2的語音應答。換言之,語言理解模塊330可進入語音聊天的模式,以和使用者進行溝通。其中,語言理解模塊330可通過語義資料庫306來實現上述的語音聊天的模式。詳細而言,語義資料庫306可記錄有多種候選答案,而語言理解模塊330依據優(yōu)先順序來選取這些候選答案的其中之一來做為語音應答。例如,語言理解模塊330可依據眾人使用習慣,以決定這些候選答案的優(yōu)先順序?;蛘?,語言理解模塊330可依據使用者的喜好或者習慣,以決定這些候選答案的優(yōu)先順序。值得一提的是,語義資料庫306中亦可記錄先前語言理解模塊330所輸出的語音應答的內容,并依據先前的內容來產生語音應答。上述選出語音應答的方法為舉例說明,本實施例并不以此為限制。當語言理解模塊330通過語音輸出單元310輸出語音應答之后,于步驟S504中,語言理解模塊330會判斷語音接收單元320是否再接收到其他語音信號(下面以語音信號V4表示)。此處與圖4的步驟S406相似,可參照前述的說明。當語音接收單元320接收語音信號V4時,則如步驟S506所示,語言理解模塊330會判斷語音信號V4是否符合對話終止提示信息,或者語音信號V4是否具有可執(zhí)行請求信息。對話終止提示信息例如是特定詞匯,用以表示對話終止。亦即,語言理解模塊330會對語音信號V4進行解析,倘若解析到上述的特定詞匯,則判斷語音信號V4符合對話終止提示信息。舉例來說,當語音信號V4符合“再見”或“沒事了”等這些對話終止提示信息,則語音接收單元320不會繼續(xù)接收語音信號。另一方面,若語音信號V4具有可執(zhí)行請求信息,則語言理解模塊330即會執(zhí)行對應于可執(zhí)行請求信息的應答操作。并且,語言理解模塊330會終止語音對話模式,而語音接收單元320亦不再繼續(xù)接收語音信號。在此與圖4的步驟S414相似,可參照前述的說明。若語音信號V4符合對話終止提示信息,或者具有可執(zhí)行請求信息時,則如步驟S508所示,語言理解模塊330則終止語音對話模式,并終止接收之后的語音信號,據以結束移動終端裝置300和使用者進行語音溝通。也就是說,此時若使用者欲通過語音的方式來操控移動終端裝置300,則需說出具有識別信息(例如“小茜”這個名子)的語音信號,才可再啟動移動終端裝置300執(zhí)行語音交互。此外,若語音信號V4不符合對話終止提示信息,亦不具有可執(zhí)行請求信息時,則回到步驟S502,語言理解模塊330會繼續(xù)通過語音輸出單元310發(fā)送語音應答來詢問使用者。返回步驟S504,當語音接收單元320未接收到語音信號V4,則如步驟S510所示,語言理解模塊330會判斷預設時間內未接收到語音信號V4的次數,是否超過預設次數。具體來說,若預設時間內未接收到語音信號V4,則語言理解模塊330會記錄一筆次數。如此一來,當所記錄的次數未超過預設次數時,則回到步驟S502,語言理解模塊330會繼續(xù)通過語音輸出單元310發(fā)送語音應答,藉以詢問使用者的意圖。其中,語言理解模塊330可于語音接收單元320未接收到語音信號V4的預設時間之后,產生語音應答。上述的語音應答例如是“您還在嗎?”、“需要提供什么服務?”等問句,不限于此。反之,當所記錄的次數為超過預設次數時,則如步驟S508所示,語言理解模塊330會終止此語音對話模式,且語音接收單元320會終止接收之后的語音信號,亦即移動終端裝置300會結束與使用者進行語音溝通,以結束語音交互。值得一提的是,當移動終端裝置300結束語音交互功能之后,使用者不僅可呼叫具有識別信息的語音信號,以和移動終端裝置300溝通,使用者亦可通過輔助操控裝置304,從輔助操控裝置304發(fā)出無線傳輸信號至移動終端裝置300,以啟動語音交互功能。于此,移動終端裝置300便會啟動語音接收單元320來接收語音信號。依據上述,本實施例的移動終端裝置300可據符合識別信息的語音信號,而啟動移動終端裝置300的語音交互功能,藉以可更快速地提供語音服務。其中,在移動終端裝置300未啟動其語音交互功能時,語音喚醒模塊350會偵測符合識別信息的語音信號。倘若語音喚醒模塊350接收到上述符合識別信息的語音信號時,語音接收單元320則會被啟動,以接收在上述語音信號之后的另一個語音信號。之后,語言理解模塊330則會根據上述另一個語音信號來做出應答操作并終止移動終端裝置300的語音交互功能;或者根據上述另一個語音信號發(fā)送語音應答,藉以獲得使用者的意圖或和使用者對話,直到解析到對話終止提示信息或做出應答操作為止。如此一來,使用者可更加便利地操控移動終端裝置300。綜上所述,在本發(fā)明的語音接聽方法與移動終端裝置中,移動終端裝置可自動從通常模式切換為第一模式。并且,當移動終端裝置在第一模式接收到來電通話時,移動終端裝置可發(fā)送語音通知以詢問使用者,而讓使用者可通過語音的方式發(fā)送語音信號來操控移動終端裝置進行回應。此時,移動終端裝置可根據來自使用者的語音信號進行解析,并根據解析后所獲得的語音辨識結果,執(zhí)行對應的應答操作。如此一來,使用者可方便地根據移動終端裝置所發(fā)送的語音通知,通過語音的方式來回應來電通話。此外,在本發(fā)明的語音操控方法與移動終端裝置中,移動終端裝置可據符合識別信息的語音信號,以啟動語音交互功能。在移動終端裝置未啟動其語音交互功能時,倘若移動終端裝置接收到符合識別信息的語音信號,移動終端裝置則會接收在上述語音信號之后的另一個語音信號。之后,移動終端裝置會根據上述另一個語音信號來做出應答操作并終止語音交互功能;或者根據上述另一個語音信號發(fā)送語音應答,藉以獲得使用者的意圖或和使用者對話,直到解析到對話終止提示信息或做出應答操作為止。如此一來,使用者僅需發(fā)送具有識別信息的語音信號,即可方便地與移動終端裝置進行語音溝通,并在通話過程中可以完全解放雙手,因為移動終端總是在一個對話回合后自動打開語音輸入。且移動終端裝置可根據使用者所說的內容來終止語音交互,藉以可更快速地提供語音服務?;诖?,本發(fā)明的語音接聽方法、語音操控方法與移動終端裝置,可讓使用者可更加便利地操控移動終端裝置。雖然本發(fā)明已以實施例公開如上,然其并非用以限定本發(fā)明,任何所屬
技術領域:
中具有通常知識者,在不脫離本發(fā)明的精神和范圍內,當可作些許的更動與潤飾,故本發(fā)明的保護范圍當視后附的權利要求所界定者為準。權利要求1.一種語音接聽方法,用于具有一通常模式及一第一模式的一移動終端裝置,該方法包括:當該移動終端裝置連線于一輔助裝置時,該移動終端裝置自該通常模式切換為該第一模式;當于該第一模式接收到一來電通話時,發(fā)送一語音通知,并啟動接收一語音信號;解析該語音信號以獲得一語音辨識結果;以及根據該語音辨識結果,執(zhí)行對應的一應答操作。2.如權利要求1所述的語音接聽方法,更包括:當該移動終端裝置未連線于該輔助裝置時,該移動終端裝置自該第一模式切換為該通常模式。3.如權利要求1所述的語音接聽方法,其中該移動終端裝置用于行動中的一行車裝置,該語音接聽方法更包括:當該行車裝置的速度超過一閾值時,該移動終端裝置自該通常模式切換為該第一模式;以及當該行車裝置的速度未超過該閾值時,該移動終端裝置自該第一模式切換為該通常模式。4.如權利要求1所述的語音接聽方法,其中該第一模式為該移動終端裝置用于行動中的一行車裝置。5.如權利要求1所述的語音接聽方法,其中在執(zhí)行對應的該應答操作的步驟包括:接聽該來電通話或拒絕接聽該來電通話。6.如權利要求5所述的語音接聽方法,其中在拒絕接聽該來電通話的步驟包括:傳送一預設語音應答以回應該來電通話。7.如權利要求1所述的語音接聽方法,更包括:自該語音辨識結果取得一應答內容,并根據該應答內容產生一應答信號以回應該來電通話。8.如權利要求1所述的語音接聽方法,更包括:自一輔助操控裝置接收一操控信號,以接聽或拒絕接聽該來電通話。9.一種移動終端裝置,包括:一語音輸出單元,用以發(fā)送一語音通知;一語音接收單元,用以接收一語音信號;一語言理解模塊,耦接于該語音接收單元,用以解析該語音信號;一來電接收單元,耦接于該語音輸出單元與該語言理解模塊,該來電接收單元用以接收一來電通話及執(zhí)行一應答操作,其中該移動終端裝置從一通常模式切換為一第一模式,以及當該來電接收單元于該第一模式接收到該來電通話時,該來電接收單元通過該語音輸出單元發(fā)送該語音通知,并啟動該語音接收單元接收該語音信號,該語言理解模塊解析該語音信號以獲得一語音辨識結果,以及該來電接收單元根據該語音辨識結果執(zhí)行對應的該應答操作。10.如權利要求9所述的移動終端裝置,更包括:當該移動終端裝置連線于一輔助裝置時,該移動終端裝置自該通常模式切換為該第一模式;以及當該移動終端裝置未連線于該輔助裝置時,該移動終端裝置自該第一模式切換為該通常模式。11.如權利要求9所述的移動終端裝置,其中該移動終端裝置用于行動中的一行車裝置,且當該行車裝置的速度超過一閾值時,該移動終端裝置自該通常模式切換為該第一模式,以及當該行車裝置的速度未超過該閾值時,該移動終端裝置自該第一模式切換為該通常模式。12.如權利要求9所述的移動終端裝置,其中該第一模式為該移動終端裝置用于行動中的一行車裝置。13.如權利要求9所述的移動終端裝置,其中該來電接收單元根據該語音辨識結果,接聽該來電通話或拒絕接聽該來電通話。14.如權利要求13所述的移動終端裝置,其中該來電接收單元拒絕接聽該來電通話時,傳送一預設語音應答以回應該來電通話。15.如權利要求9所述的移動終端裝置,其中該來電接收單元自該語音辨識結果取得一應答內容,并根據該應答內容產生一應答信號以回應該來電通話。16.如權利要求9所述的移動終端裝置,其中該來電接收單元自一輔助操控裝置接收一操控信號,以接聽或拒絕接聽該來電通話。全文摘要一種語音接聽方法與移動終端裝置,其中移動終端裝置具有通常模式及第一模式。語音接聽方法包括以下步驟。從通常模式切換為第一模式。當于第一模式接收到來電通話時,發(fā)送語音通知,并啟動接收語音信號。解析語音信號以獲得語音辨識結果,以及根據語音辨識結果,執(zhí)行對應的應答操作。文檔編號H04M1/725GK103220423SQ20131012223公開日2013年7月24日申請日期2013年4月10日優(yōu)先權日2013年4月10日發(fā)明者尋亮,張國峰申請人:威盛電子股份有限公司