欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種具備語音控制功能智能手機(jī)的制作方法

文檔序號:11778682閱讀:847來源:國知局

本發(fā)明專利涉及一種具備語音控制功能的智能手機(jī)。



背景技術(shù):

最早出現(xiàn)的手機(jī)采用鍵盤撥號控制,主要功能是打電話,后來發(fā)展了短信等功能,都是通過鍵盤控制。隨著技術(shù)發(fā)展,智能手機(jī)軟件采用操作系統(tǒng),可同時進(jìn)行多個程序和任務(wù),控制輸入方式以觸摸屏為主,保留少量快捷按鈕,信息輸出則以屏幕顯示為主,根據(jù)程序需求也有輸出語音信息通過揚(yáng)聲器輸出信息。當(dāng)前對手機(jī)操縱都必須用手操作,在某些場合使用者手脫不開,會影響手機(jī)使用,或一些肢體或眼睛殘疾者根本無法使用手及對手機(jī)屏幕觀察完成對現(xiàn)有智能手機(jī)操縱和使用。同時隨著語音識別技術(shù)和人工智能(ai)飛速發(fā)展,在一些手機(jī)的文字輸入應(yīng)用程序中已有一些成熟的語音輸入應(yīng)用,為該技術(shù)用于智能手機(jī)作為用口控制輸入手段提供一定技術(shù)基礎(chǔ)和可能。

聲音(sound)是由物體振動產(chǎn)生的聲波。是通過介質(zhì)(空氣或固體、液體)傳播并能被人或動物聽覺器官所感知的波動現(xiàn)象。最初發(fā)出振動(震動)的物體叫聲源。聲音以波的形式振動(震動)傳播。聲音是聲波通過任何物質(zhì)傳播形成的運(yùn)動。聲音作為一種波,頻率在20hz~20khz之間的聲音是可以被人耳識別的。人耳聽到聲音是環(huán)境中各種聲源總和,強(qiáng)度與聲源強(qiáng)度有關(guān),也與聲源距離相關(guān),聲波強(qiáng)度會隨傳播距離增加而衰減。

語音是人的發(fā)音器官發(fā)出的具有一定社會意義的聲音。語音的物理基礎(chǔ)主要有音高、音強(qiáng)、音長、音色,這也是構(gòu)成語音的四要素。人發(fā)音器官包括動力部分(肺、器官、支氣管)、發(fā)聲體聲帶以及共鳴器(口腔和鼻腔),再加上每個人在生長過程中形成不同說話習(xí)慣導(dǎo)致每個人語音都有不同特點(diǎn),可從其說話的音頻特征用于發(fā)聲者身份識別。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明專利充分利用現(xiàn)有的語音識別、音頻處理技術(shù),結(jié)合人工智能技術(shù)將輸入音頻信息轉(zhuǎn)化為主流智能手機(jī)控制指令,去控制各應(yīng)用程序運(yùn)行,程序運(yùn)行的結(jié)果仍可轉(zhuǎn)化為音頻信息輸出反饋給手機(jī)操控者。

本發(fā)明專利解決其技術(shù)問題所采用的技術(shù)方案是:智能手機(jī)通過其通話的麥克風(fēng)獲得外部聲音信號;再通過音頻處理技術(shù),識別出權(quán)限身份者的語音或捕捉近人語音(距離越近,音強(qiáng)越大);經(jīng)語音識別轉(zhuǎn)化為文字;再利用ai技術(shù)從文字中識別是否是使用者語音控制指令,并提取與手機(jī)中安裝的app程序關(guān)聯(lián)關(guān)鍵字和參數(shù);啟動相應(yīng)app程序,并填入?yún)?shù)值;程序運(yùn)行結(jié)果可在手機(jī)屏幕上顯示,也可以將程序運(yùn)行文字結(jié)果對應(yīng)語音庫中的音頻通過手機(jī)揚(yáng)聲器輸出,語音反饋給手機(jī)控制者。從而完成手機(jī)的語音控制。此外為了避免手機(jī)擁有者正常說話時被手機(jī)獲取聲音誤操作,手機(jī)上應(yīng)配備一個撥動開關(guān),只有該開關(guān)處有效狀態(tài)時,手機(jī)操作系統(tǒng)軟件才允許語音控制指令關(guān)聯(lián)應(yīng)用程序,啟動語音控制功能,否則應(yīng)屏蔽輸入聲音的音頻處理,不進(jìn)行身份識別和語音文字轉(zhuǎn)化,可避免使用者再正常與人語言交流時手機(jī)誤執(zhí)行指令。

采用本專利語音控制功能智能手機(jī)技術(shù)方案所涉及音頻處理技術(shù)的技術(shù)方案為預(yù)先錄取手機(jī)控制者(身份有效者)的聲音,并獲取其聲音的音頻特征。自然界中每種聲源包括不同人、動物、物體等不管聲音大小一般都有獨(dú)特音頻特點(diǎn),而手機(jī)通過麥克風(fēng)獲得的環(huán)境聲音轉(zhuǎn)化的模擬量是不同聲源頻率和幅度疊加總和,甚至包括手機(jī)自身揚(yáng)聲器發(fā)出的聲音?,F(xiàn)有語音處理技術(shù)已經(jīng)可以把不同音源根據(jù)頻率特征區(qū)分開來,可以采用專用的語音處理芯片實(shí)現(xiàn),也可以直接由手機(jī)cpu用專門軟件來處理和分析,不過用軟件實(shí)現(xiàn)占用手機(jī)cpu計算資源,同時實(shí)時性差。將環(huán)境聲音中區(qū)分出來的不同音頻段提取音頻特征與事先獲得有權(quán)限控制者音頻特征進(jìn)行匹配,匹配成功,則識別出使用者身份,同時可將這段音頻單獨(dú)保存,用于語音識別為文字。此外也可根據(jù)聲強(qiáng)大小獲取近人語音音頻用于語音控制。

采用本專利語音控制功能智能手機(jī)技術(shù)方案所涉及語音文字轉(zhuǎn)化技術(shù)方案可借鑒訊飛或百度等文字輸入法程序語音識別的方案和程序,將已保存有效音頻數(shù)據(jù)采用標(biāo)準(zhǔn)音庫進(jìn)行比對分析,轉(zhuǎn)化為文字,由于中文同一音可能對多個字,因此該分析程序也需一定智能化,現(xiàn)有的技術(shù)已能將語音文字識別率提高到一個比較高的水準(zhǔn)。如果分析困難或音頻信息帶地方口音,手機(jī)本地程序難以準(zhǔn)確分析時,該功能程序可通過手機(jī)自帶的wifi功能與互聯(lián)網(wǎng)連接,將音頻信息推送指定的專業(yè)服務(wù)器上進(jìn)行更復(fù)雜的智能分析,分析結(jié)果將音頻信息識別為文字信息再通過無線網(wǎng)絡(luò)反饋給手機(jī)程序進(jìn)行下一步處理。

采用本專利語音控制功能智能手機(jī)技術(shù)方案所涉及文字處理方案為將語音轉(zhuǎn)化的文字根據(jù)語法分割為字或詞,再根據(jù)關(guān)鍵詞去識別出控制字,并將控制字去關(guān)聯(lián)手機(jī)上需要執(zhí)行的app程序,同時從字和詞中識別出關(guān)鍵字作為程序運(yùn)行參數(shù),啟動相應(yīng)程序后自動填入。由于中文表達(dá)復(fù)雜性,同一意思,每個人可能有不同表達(dá)方式,因此在語音轉(zhuǎn)化的文字處理時需模擬人類說話表達(dá)方式,采用ai(人工智能)去處理。此外為了方便控制程序識別,可建立一套標(biāo)準(zhǔn)詞與程序關(guān)聯(lián)表,人在發(fā)出語音控制指令時遵照該表語法,會顯著提高指令識別準(zhǔn)確率和效率,同時也可根據(jù)個人用詞習(xí)慣將一些常用詞通過人工編輯加到關(guān)聯(lián)表中,也便于控制指令識別。手機(jī)在安裝新app程序時都可將新的關(guān)聯(lián)信息添加到該表中。除此之外,新開發(fā)的app可根據(jù)語音接口標(biāo)準(zhǔn)增加相關(guān)程序輸入輸出接口,便于語音控制的無縫連接。

采用本專利語音控制功能智能手機(jī)技術(shù)方案所涉及文字轉(zhuǎn)化音頻的技術(shù)方案較為簡單,因?yàn)槊總€文字一般對應(yīng)一個發(fā)音,因此只要采用一個較全音標(biāo)字庫,由程序?qū)⑽淖职磫巫忠纛l處理并逐字拼接,就可實(shí)現(xiàn)該功能。為了豐富語音輸出效果,滿足不同人喜好,該音標(biāo)字庫可采用男聲或女聲,甚至可制作模擬某個人發(fā)聲或某地口音的個性音標(biāo)庫。

本專利具備語音控制功能智能手機(jī)采用最新語音技術(shù)和人工智能技術(shù),豐富手機(jī)輸入輸出功能和工作模式,可為智能手機(jī)擺脫手動操作提出一個可行方案,同時有益于那些肢體或眼睛殘缺者對智能手機(jī)操縱和使用。此外該語音控制的技術(shù)方案還可被借鑒用于不需要或不方便手控制的智能電子系統(tǒng)的輸入輸出設(shè)計中,如頭盔顯示系統(tǒng)、vr眼鏡、智能音箱、以及各類可通過語音控制的智能家電、智能家居等。由于在對音頻轉(zhuǎn)化的文字進(jìn)行人工智能分析,配上手機(jī)自帶存儲器存儲功能,因此該功能手機(jī)還可以當(dāng)作以為“聽話”的秘書助理,協(xié)助機(jī)主記憶一些口述的信息和指令,甚至可以在適當(dāng)時間通過語音自動提醒機(jī)主事件。

附圖說明

下面是結(jié)合附圖和實(shí)施例對本專利發(fā)明進(jìn)一步說明。

圖1語音控制功能智能手機(jī)工作流程說明圖

圖中1.附近聲音,2.手機(jī)麥克風(fēng),3.語音處理專用電路,4.語音識別程序,5.文字智能分析程序,6.關(guān)聯(lián)手機(jī)app程序,7.執(zhí)行app程序,8.文字音頻轉(zhuǎn)化程序,9.發(fā)聲裝置控制輸出。

具體實(shí)現(xiàn)方式

參照圖1,智能手機(jī)實(shí)現(xiàn)語音控制功能工作流程為手機(jī)麥克風(fēng)(2)監(jiān)聽手機(jī)附近聲音采集外部信息,通過語音處理專用電路(3)識別和提取用戶音頻,經(jīng)語音識別程序(4)將用戶音頻信息技術(shù)轉(zhuǎn)化為文字信息,再通過文字智能分析程序(5)提取文字中用戶對手機(jī)的語音控制指令和參數(shù),與手機(jī)app程序關(guān)聯(lián)(6),從而啟動和執(zhí)行相應(yīng)app程序(7),其中部分程序會返回文字結(jié)果,可通過文字音頻轉(zhuǎn)化程序(8)獲得音頻信息通過手機(jī)發(fā)聲裝置控制輸出(9)揚(yáng)聲器或耳機(jī)為語音信息。

以下通過一些具體事例來說明由語音控制智能手機(jī)應(yīng)用程序功能。

語音控制打電話,短信:手機(jī)使用者可以說“打電話給xx”,可以獲得文字的“打電話”、“xx”等信息,通過“打電話”關(guān)聯(lián)手機(jī)“電話撥號”功能,再在手機(jī)通訊捕中獲得“xx”的電話號碼,電話通話功能自動撥出,電話接通后,使用者就可以與對方直接通話,在此期間獲得的語音信息不進(jìn)行app程序關(guān)聯(lián),直到聽到結(jié)束時使用者說聲“拜拜”,手機(jī)自動斷開通信鏈路,退出“通話”程序;如果手機(jī)使用者說“發(fā)短信告訴xxyyy”,手機(jī)在語音控制模式下應(yīng)自動啟動短信程序,在通訊簿中找到xx電話號碼發(fā)送內(nèi)容為“yyy”信息,發(fā)送完了還可以語音提示“短信已發(fā)送”。

語音控制放音樂:手機(jī)使用者可以說“請播放xxx”、“我想聽xxx”,通過“播放”或“聽”關(guān)聯(lián)音頻播放程序,并在本地音頻文件中搜索歌名關(guān)鍵字為“xxx”的文件在程序中播放。

個人秘書助理:手機(jī)使用者對手機(jī)說:“請記住xx生日為yy日”,手機(jī)可以自動關(guān)聯(lián)日歷程序或備忘錄程序,以文字方式存儲“xx生日為yyy日”信息,當(dāng)使用者對手機(jī)問:“請告訴我xx生日為哪天”,手機(jī)可以通過識別出關(guān)鍵字“xx”和“生日”在相關(guān)文件中獲得對應(yīng)信息,并以語音方式將這些信息“告訴”使用者。該功能除了根據(jù)語音自動存儲類似“生日”、“會議日程”、“家庭地址”等各種簡單日常信息,還可以根據(jù)語音要求自動搜索相關(guān)信息反饋給使用者。雖然用手操作也能在相關(guān)app應(yīng)用程序中實(shí)現(xiàn)這些功能,但需要手動完成這些操作,搜索時信息多時費(fèi)時也多,而采用語音控制完全由手機(jī)通過人工智能自動實(shí)現(xiàn),對使用者來說非常方便。

自動搜索,自動翻譯:各種常識、人物事件信息、新聞時事、科學(xué)百科等都可以由使用者向手機(jī)“提問”,手機(jī)關(guān)聯(lián)百度、谷歌等搜索引擎連接互聯(lián)網(wǎng),獲得相關(guān)信息以語音或屏幕文字圖片表現(xiàn)形式反饋提問者,成為使用者便捷的百科全書。

自拍功能:手機(jī)使用者可以口頭命令通過語音控制智能手機(jī)啟動照相程序,并在較遠(yuǎn)距離通過聲音執(zhí)行拍攝動作,為手機(jī)拍照功能提供更靈活和獨(dú)特控制方式。

智能家電遙控功能:對帶有智能家電遙控功能接口和程序的手機(jī)和家電,同樣可以通過語音發(fā)出控制指令,使家電按照手機(jī)將語言轉(zhuǎn)化的遙控指令工作。比如操縱者通過對手機(jī)發(fā)布“看電視xx頻道”的語音命令,手機(jī)自動啟動智能電視遙控app程序通過無線網(wǎng)絡(luò)向電視發(fā)出開機(jī)和切換到xx頻道的遙控指令;操縱者對手機(jī)發(fā)布“空調(diào)制冷到xx度”的語音命令,手機(jī)則自動啟動空調(diào)遙控app程序,并通過無線網(wǎng)絡(luò)或紅外接口向具備該輸入接口智能空調(diào)發(fā)出空調(diào)啟動制冷,溫度設(shè)定為xx度指令,空調(diào)接受控制指令執(zhí)行相應(yīng)動作。

通過上述事例可以看出,只要對手機(jī)操作響應(yīng)速度不高的智能手機(jī)應(yīng)用,語音控制功能大量采用人工智能識別后多數(shù)能使用,而且使用更便捷智能。

本發(fā)明專利請求保護(hù)的專利權(quán)利范圍主要包括:本專利權(quán)利書和說明書所提及的對語音采集、身份識別和音頻截取、語音文字轉(zhuǎn)化、控制指令參數(shù)智能識別提取和手機(jī)應(yīng)用程序關(guān)聯(lián)運(yùn)行的整個最終實(shí)現(xiàn)語音對手機(jī)控制的技術(shù)方案和流程以及各關(guān)鍵流程所采用技術(shù)方案;說明書提及采用專用撥動開關(guān)實(shí)現(xiàn)免于正常對話和語音控制相互干擾的技術(shù)方案;說明書提及采用標(biāo)準(zhǔn)關(guān)鍵詞與程序關(guān)聯(lián)簡化控制指令參數(shù)識別方法;說明書所提及一些具體語音控制智能手機(jī)應(yīng)用事例及其形式方式。以及采用上述語音控制技術(shù)方案用于手機(jī)以外智能電子產(chǎn)品具體包括頭盔顯示系統(tǒng)、vr眼鏡、智能音箱、以及各類可通過語音控制的智能家電、智能家居等也應(yīng)屬本專利保護(hù)范圍。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
武清区| 嘉峪关市| 万州区| 盐亭县| 德惠市| 昌邑市| 黔江区| 当阳市| 嘉义县| 乡宁县| 北票市| 保康县| 柯坪县| 都昌县| 西充县| 安仁县| 咸丰县| 高台县| 平顶山市| 鄱阳县| 镇原县| 壶关县| 同德县| 罗甸县| 玛多县| 兴和县| 富裕县| 峨边| 海原县| 桑植县| 宜章县| 湘西| 仁寿县| 苍溪县| 横峰县| 内乡县| 全南县| 建平县| 山西省| 崇仁县| 高阳县|