載到易失性存儲器,處理這些指令或數(shù)據(jù),并將數(shù)據(jù)存儲在非易失性存儲器中。
[0040]通信模塊220以與圖1的通信接口170類似的方式被構建。通信模塊220包括蜂窩模塊221、W1-Fi模塊223、藍牙(BT)模塊225、全球定位系統(tǒng)(GPS)模塊227、近場通信(NFC)模塊228以及射頻(RF)模塊229。
[0041]例如,蜂窩模塊221通過電信網(wǎng)絡提供語音電話、視頻電話以及文本和網(wǎng)絡服務。蜂窩模塊221在電信網(wǎng)絡內使用SIM卡224來執(zhí)行電子裝置201的區(qū)分和授權。蜂窩模塊221執(zhí)行AP 210提供的功能中的至少一些功能,并包括通信處理器(CP)。
[0042]W1-Fi模塊223、BT模塊225、GPS模塊227和NFC模塊228中的每個都可包括用于處理通過相應的模塊發(fā)送/接收的數(shù)據(jù)的處理器,并且通信模塊220中的至少兩個模塊可以被包括在一個集成電路(IC)或IC封裝內。
[0043]RF模塊229發(fā)送/接收RF通信信號,并包括收發(fā)器、功率放大器模塊(PAM)、頻率濾波器、低噪聲放大器(LNA)或者天線。通信模塊220中的至少一個模塊可以通過獨立的RF模塊發(fā)送/接收RF信號。
[0044]SIM卡224可以是嵌入式SIM JIM卡224包括唯一的標識信息(如集成電路卡ID(ICCID))或用戶信息(如國際移動用戶識別碼(MSI))。
[0045]存儲器230包括內部存儲器232和外部存儲器234。傳感器模塊240測量電子裝置201的物理量或者感測電子裝置201的激活狀態(tài),以將測量或感測的信息轉變成電子信號。
[0046]傳感器模塊240包括手勢傳感器240A、陀螺儀傳感器240B、氣壓傳感器240C、磁性傳感器240D、加速度傳感器240E、手握傳感器240F、接近傳感器240G、顏色傳感器240H (如紅綠藍(RGB)傳感器)、生物物理傳感器2401、溫度/濕度傳感器240J、照度傳感器240K以及紫外線(UV)傳感器240M中的至少一個。
[0047]傳感器模塊240還可以包括電子鼻傳感器、肌電圖(EMG)傳感器、腦電圖(EEG)傳感器、心電圖(ECG)傳感器、紅外線(IR)傳感器、虹膜傳感器和/或指紋傳感器。
[0048]輸入裝置250包括觸摸面板252、(數(shù)字)筆傳感器254、按鍵256和超聲輸入裝置258 ο顯示器260包括面板262、全息圖裝置264和投影儀266。
[0049]接口270包括高密度多媒體接口(HDMI)272、通用串行總線(USB)274、光學接口276和微型接口(D-sub)278。音頻模塊280交互式地轉換語音和電子信號,并處理被通過揚聲器282、接收器284、耳機286或麥克風288輸入或輸出的聲音信息。
[0050]拍攝靜止和運動圖像的相機模塊291包括一個或更多個圖像傳感器、鏡頭、圖像信號處理器(ISP)和閃光燈(如LED或氙氣燈)。
[0051]電源管理模塊295管理電子裝置201的電力,并且包括電源管理集成電路(PMIC)、充電IC和電池量表。
[0052]指示器297顯示電子裝置201的部分或全部的特定狀態(tài),諸如啟動狀態(tài)、消息狀態(tài)或電源狀態(tài)。電動機298將電信號轉換為機械振動,并引起振動的效果。
[0053]圖3示出了根據(jù)本發(fā)明的實施例的執(zhí)行用于語音識別的方法的電子裝置的部分結構。
[0054]參照圖3,電子裝置301包括應用處理器310、通信模塊320、顯示模塊360、音頻模塊380和麥克風388。
[0055]電子裝置301可以以各種操作模式(諸如正常模式或空閑模式)進行操作,并可以在用于最小化功耗的節(jié)能模式(如睡眠模式)下進行操作。例如,節(jié)能模式可以降低應用處理器310的操作速度。在此,睡眠模式代表用于減少功耗的操作模式,但是本發(fā)明并不限于此。
[0056]參照圖3,如果電子裝置301通過使用低功率進入節(jié)能模式,電子裝置301關閉使用高功率的顯示模塊360,并將使用高頻時鐘(如千兆赫單位)的應用處理器310的狀態(tài)轉換為空閑狀態(tài)。
[0057]為了在睡眠模式下識別用戶通過麥克風388輸入的語音信號,電子裝置301驅動包括在音頻模塊380中的音頻編解碼器380a。音頻編解碼器380a可被看作是使用低功率的第一處理器,并且應用處理器310可被看作是使用高功率的第二處理器。
[0058]音頻編解碼器380a使用諸如以兆赫為單位的50兆赫(MHz)的低頻時鐘,并且相比于應用處理器310,音頻編解碼器380a被制造為低功耗的低功率芯片。
[0059]當應用處理器310處于空閑模式時,音頻編解碼器380a識別通過麥克風388輸入的用戶語音信號。例如,在睡眠模式下,音頻編解碼器380a使用50MHz的低頻時鐘來識別通過麥克風388輸入的用戶語音信號,并確定該用戶語音信號是否與先前設置的特定語音信號一 Sc ο
[0060]例如,如果識別的用戶語音信號是先前設置的特定關鍵字,則音頻編解碼器380a生成語音觸發(fā),使得語音識別操作由在應用處理器310中執(zhí)行的至少一個或更多個應用來執(zhí)行。
[0061]在這里,本領域技術人員將會清楚,音頻編解碼器380a除了執(zhí)行用戶語音識別操作之外,還可以將用戶語音信號處理成音頻信號并將音頻信號輸出到揚聲器。
[0062]在音頻編解碼器380a產(chǎn)生語音觸發(fā)之后,應用處理器310從空閑狀態(tài)醒來,進入激活狀態(tài),并執(zhí)行從音頻編解碼器380a接收通過麥克風388輸入的用戶語音信號并記錄用戶語音信號的語音記錄操作。
[0063]如果在執(zhí)行語音記錄操作時用戶語音信號的輸入結束,則應用處理器310控制通信模塊320的操作并與通過網(wǎng)絡362提供語音識別服務的服務器306進行接口連接。應用處理器310可以執(zhí)行語音識別操作,而不與服務器306進行接口連接。
[0064]應用處理器310通過與服務器306進行接口連接來接收與記錄的用戶語音信號相應的文本或命令,并顯示文本或者執(zhí)行與命令相應的任意功能。
[0065]在電子裝置301的睡眠模式下,識別通過麥克風388輸入的用戶的語音關鍵字,然后自動執(zhí)行與無縫地輸入的用戶語音命令相應的任意功能的功能可以被稱為“無縫喚醒”功能。
[0066]在一個實施例中,電子裝置301在節(jié)能模式下識別語音觸發(fā),當語音觸發(fā)被識別時記錄語音輸入,并且當記錄結束時改變到正常模式。
[0067]圖4示出了根據(jù)本發(fā)明的實施例的應用用于語音識別的方法的電子裝置的操作時序。
[0068]參照圖4,如果這種電子裝置為了節(jié)能進入睡眠模式,則顯示模塊460進入關閉狀態(tài),應用處理器410進入空閑狀態(tài)。
[0069]在睡眠模式下,音頻編解碼器480a使用例如50MHz的低頻時鐘來識別通過麥克風輸入的用戶語音信號400。如果通過麥克風輸入的用戶語音信號400與先前設置的關鍵字一致,貝1J音頻編解碼器480a產(chǎn)生語音觸發(fā)(t_trigger)。
[0070]如果音頻編解碼器480a產(chǎn)生了語音觸發(fā),則應用處理器410從空閑狀態(tài)醒來,進入激活狀態(tài)。例如,諸如0.5秒的預定的延遲時間(t_delay)流逝,直至應用處理器410被語音觸發(fā)(t_tr igger)由空閑狀態(tài)喚醒到激活狀態(tài)。
[0071]音頻編解碼器480a在預定的延遲時間(t_delay)期間緩存通過麥克風輸入的用戶語音信號。如果應用處理器410變?yōu)榧せ?,則音頻編解碼器480a將緩存的用戶語音信號轉發(fā)給應用處理器410。然后,音頻編解碼器480a將通過麥克風輸入的用戶語音信號實時轉發(fā)給應用處理器410。
[0072]在應用處理器410變?yōu)榧せ钪?,應用處理?10在監(jiān)測用戶語音信號的輸入是否結束的同時,記錄從音頻編解碼器480a轉發(fā)的用戶語音信號。
[0073]例如,當無用戶語音信號輸入的靜音時間與預先設置的靜音時間參考值0.5秒相一致時,應用處理器410確定靜音時間點就是用戶語音信號的輸入的結束時間點(t_end)。
[0074]如果達到用戶語音信號的輸入的結束時間點(t_end),則在控制通信模塊的操作和通過網(wǎng)絡連接服務器之后,應用處理器410將記錄的用戶語音信號發(fā)送到服務器,從服務器接收與用戶語音信號相應的文本或命令,并顯示接收到的文本或執(zhí)行與接收到的命令相應的任意功能。
[0075]如果確定用戶語音信號的輸入結束,則應用處理器410將音頻編解碼器480a的50MHz的低頻時鐘改變?yōu)?0MHz