本發(fā)明涉及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,更具體地涉及一種信息處理的方法、裝置和移動(dòng)終端。
背景技術(shù):
隨著通訊技術(shù)的迅猛發(fā)展,移動(dòng)終端成為日常生活必不可少的一項(xiàng)設(shè)備,同時(shí),移動(dòng)通信終端的發(fā)展也日漸成熟,可實(shí)現(xiàn)各種應(yīng)用操作,用戶遇到危險(xiǎn)時(shí)可通過(guò)移動(dòng)通信終端發(fā)送求救信息就是一種。
在現(xiàn)有技術(shù)中,用戶使用移動(dòng)通信終端求救需要接觸到移動(dòng)終端才能發(fā)出報(bào)警信息或者呼出電話,并且對(duì)現(xiàn)場(chǎng)的錄制也要手動(dòng)操作,不能在緊急情況或者特定場(chǎng)合下自動(dòng)發(fā)出求救信息,用戶意圖接觸移動(dòng)終端進(jìn)行自救的動(dòng)作將會(huì)被危險(xiǎn)分子識(shí)破并被阻止。比較常見(jiàn)的是,兒童離開(kāi)家長(zhǎng)視線、與陌生人約會(huì)、女性走夜路或者夜晚打車等各種原因都會(huì)造成人口失蹤問(wèn)題,又如,為避免夜晚打車的危險(xiǎn),女性打車時(shí)盡量打出租車,但是也無(wú)法避免遇上不良車主。此外,當(dāng)當(dāng)事人出行過(guò)程中發(fā)生危險(xiǎn)時(shí),往往不能及時(shí)向家人或者朋友發(fā)求救信號(hào),甚至無(wú)法報(bào)警,即使有機(jī)會(huì)發(fā)出求救信號(hào),也有可能因處于陌生地點(diǎn),而無(wú)法及時(shí)告知其所在地,影響及時(shí)救援。
技術(shù)實(shí)現(xiàn)要素:
鑒于上述問(wèn)題,本發(fā)明提出了一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的一種信息處理的方法、裝置和移動(dòng)終端,提高用戶在遇到突發(fā)事件的安全系數(shù),且不容易被犯罪人員發(fā)現(xiàn)。
為解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例公開(kāi)了如下技術(shù)方案:
第一方面,本發(fā)明實(shí)施例中提供了一種信息處理的方法,包括:
在語(yǔ)音監(jiān)聽(tīng)模式開(kāi)啟下,接收語(yǔ)音數(shù)據(jù);
獲取所述語(yǔ)音數(shù)據(jù)內(nèi)容信息中的語(yǔ)音特征;
將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,其中,所述預(yù)定義語(yǔ)音數(shù)據(jù)模型根據(jù)用戶預(yù)先錄入的語(yǔ)音數(shù)據(jù)生成;
若匹配向預(yù)定的聯(lián)系人發(fā)送指定信息。
結(jié)合第一方面,本發(fā)明在第一方面的第一種實(shí)現(xiàn)方式中,所述語(yǔ)音特征包括語(yǔ)音的音高、音強(qiáng)、音長(zhǎng)、音色。
結(jié)合第一方面,本發(fā)明在第一方面的第二種實(shí)現(xiàn)方式中,所述接收語(yǔ)音數(shù)據(jù)之后,還包括,
將所述語(yǔ)音數(shù)據(jù)拆分為單個(gè)元素和預(yù)定義語(yǔ)音數(shù)據(jù)模型的單個(gè)元素進(jìn)行識(shí)別,如果識(shí)別誤差不小于預(yù)設(shè)值,則丟棄所述語(yǔ)音數(shù)據(jù);
所述識(shí)別誤差值預(yù)設(shè)值為35%。
結(jié)合第一方面,本發(fā)明在第一方面的第三種實(shí)現(xiàn)方式中,所述預(yù)定義語(yǔ)音數(shù)據(jù)模型根據(jù)用戶預(yù)先錄入的語(yǔ)音數(shù)據(jù)生成,包括,
預(yù)先錄入用戶語(yǔ)音生成第一語(yǔ)音數(shù)據(jù);
根據(jù)所述的第一語(yǔ)音數(shù)據(jù)內(nèi)容信息提取語(yǔ)音特征;
將所述第一語(yǔ)音數(shù)據(jù)內(nèi)容信息的語(yǔ)音特征轉(zhuǎn)換為數(shù)字信息,并拆分成多個(gè)組成元素;
將所述多個(gè)組成元素重組為第二語(yǔ)音數(shù)據(jù);
將第一語(yǔ)音數(shù)據(jù)和第二語(yǔ)音數(shù)據(jù)形成預(yù)定義語(yǔ)音數(shù)據(jù)模型。
結(jié)合第一方面的第二種實(shí)現(xiàn)方式,本發(fā)明在第一方面的第四種實(shí)現(xiàn)方式中,所述預(yù)定義語(yǔ)音數(shù)據(jù)模型根據(jù)用戶預(yù)先錄入的語(yǔ)音數(shù)據(jù)生成,包括,
預(yù)先錄入用戶語(yǔ)音生成第一語(yǔ)音數(shù)據(jù);
根據(jù)所述的第一語(yǔ)音數(shù)據(jù)內(nèi)容信息提取語(yǔ)音特征;
將所述第一語(yǔ)音數(shù)據(jù)內(nèi)容信息的語(yǔ)音特征轉(zhuǎn)換為數(shù)字信息,并拆分成多個(gè)組成元素;
將所述多個(gè)組成元素重組為第二語(yǔ)音數(shù)據(jù);
將第一語(yǔ)音數(shù)據(jù)和第二語(yǔ)音數(shù)據(jù)形成預(yù)定義語(yǔ)音數(shù)據(jù)模型。
結(jié)合第一方面,本發(fā)明在第一方面的第五種實(shí)現(xiàn)方式中,所述將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,包括,
判斷所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型匹配的模糊度是否大于預(yù)設(shè)值,若大于則確認(rèn)匹配;
所述模糊度設(shè)置值為65%。
結(jié)合第一方面,本發(fā)明在第一方面的第六種實(shí)現(xiàn)方式中,所述將所述語(yǔ)音與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,包括,
根據(jù)所述接收到的語(yǔ)音數(shù)據(jù)的內(nèi)容信息提取語(yǔ)音特征;
判斷所述語(yǔ)音特征與根據(jù)預(yù)定義語(yǔ)音數(shù)據(jù)模型匹配的模糊度是否大于預(yù)設(shè)值,若不大于則確認(rèn)不匹配;
若確認(rèn)不匹配則丟棄所述語(yǔ)音數(shù)據(jù)。
結(jié)合第一方面,本發(fā)明在第一方面的第七種實(shí)現(xiàn)方式中,所述若匹配則向預(yù)定的聯(lián)系人發(fā)送指定信息,包括,
若匹配則觸發(fā)并喚醒預(yù)設(shè)應(yīng)用程序向預(yù)定的聯(lián)系人發(fā)送指定信息;
所述觸發(fā)并喚醒為將觸發(fā)指令通過(guò)intent方式傳給預(yù)設(shè)應(yīng)用程序,同時(shí)喚醒預(yù)設(shè)應(yīng)用程序。
結(jié)合第一方面,本發(fā)明在第一方面的第八種實(shí)現(xiàn)方式中,所述若匹配向預(yù)定的聯(lián)系人發(fā)送指定信息,還包括,
錄入環(huán)境音;
調(diào)用GPS定位當(dāng)前位置;
將GPS定位信息和環(huán)境錄音添加到指定信息中;
觸發(fā)并喚醒預(yù)設(shè)應(yīng)用程序?qū)⑺鲋付ㄐ畔l(fā)送至預(yù)定的聯(lián)系人。
結(jié)合第一方面的第七種實(shí)現(xiàn)方式,本發(fā)明在第一方面的第九種實(shí)現(xiàn)方式中,所述若匹配向預(yù)定的聯(lián)系人發(fā)送指定信息,還包括,
錄入環(huán)境音;
調(diào)用GPS定位當(dāng)前位置;
將GPS定位信息和環(huán)境錄音添加到指定信息中;
觸發(fā)并喚醒預(yù)設(shè)應(yīng)用程序。
第二方面,本發(fā)明提供了一種信息處理的裝置,包括,
監(jiān)聽(tīng)模塊,用于監(jiān)聽(tīng)語(yǔ)音獲取語(yǔ)音數(shù)據(jù);
接收模塊,用于接收所述的語(yǔ)音數(shù)據(jù);
獲取模塊,用于獲取所述語(yǔ)音數(shù)據(jù)內(nèi)容信息中的語(yǔ)音特征;
匹配模塊,用于將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,其中,所述預(yù)定義語(yǔ)音數(shù)據(jù)模型根據(jù)用戶預(yù)先錄入的語(yǔ)音數(shù)據(jù)生成;
設(shè)置模塊,用于預(yù)先設(shè)置至少一個(gè)以上的聯(lián)系人接收指定信息;處理模塊,用于確定匹配時(shí),向預(yù)定的聯(lián)系人發(fā)送指定信息。
結(jié)合第二方面,本發(fā)明在第二方面的第一種實(shí)現(xiàn)方式中,所述語(yǔ)音特征包括語(yǔ)音的音高、音強(qiáng)、音長(zhǎng)、音色。
結(jié)合第二方面,本發(fā)明在第二方面的第二種實(shí)現(xiàn)方式中,所述接收語(yǔ)音數(shù)據(jù)之后,還包括,
將所述語(yǔ)音數(shù)據(jù)拆分為單個(gè)元素和預(yù)定義語(yǔ)音數(shù)據(jù)模型的單個(gè)元素進(jìn)行識(shí)別,如果識(shí)別誤差不小于預(yù)設(shè)值,則丟棄所述語(yǔ)音數(shù)據(jù);
所述識(shí)別誤差值預(yù)設(shè)值為35%。
結(jié)合第二方面,本發(fā)明在第二方面的第三種實(shí)現(xiàn)方式中,還包括存儲(chǔ)模塊,所述存儲(chǔ)模塊用于存儲(chǔ)預(yù)定義語(yǔ)音數(shù)據(jù)模型,所述預(yù)定義語(yǔ)音數(shù)據(jù)模型根據(jù)用戶預(yù)先錄入的語(yǔ)音數(shù)據(jù)生成,包括,
預(yù)先錄入用戶語(yǔ)音生成第一語(yǔ)音數(shù)據(jù);
根據(jù)所述的第一語(yǔ)音數(shù)據(jù)的內(nèi)容信息提取語(yǔ)音特征;
將所述第一語(yǔ)音數(shù)據(jù)內(nèi)容信息的語(yǔ)音特征轉(zhuǎn)換為數(shù)字信息,并拆分成多個(gè)組成元素;
將所述多個(gè)組成元素重組為第二語(yǔ)音數(shù)據(jù);
將第一語(yǔ)音數(shù)據(jù)和第二語(yǔ)音數(shù)據(jù)形成預(yù)定義語(yǔ)音數(shù)據(jù)模型。
結(jié)合第二方面第二種實(shí)現(xiàn)方式,本發(fā)明在第二方面的第四種實(shí)現(xiàn)方式中,還包括存儲(chǔ)模塊,所述存儲(chǔ)模塊用于存儲(chǔ)預(yù)定義語(yǔ)音數(shù)據(jù)模型,所述預(yù)定義語(yǔ)音數(shù)據(jù)模型根據(jù)用戶預(yù)先錄入的語(yǔ)音數(shù)據(jù)生成,包括,
預(yù)先錄入用戶語(yǔ)音生成第一語(yǔ)音數(shù)據(jù);
根據(jù)所述的第一語(yǔ)音數(shù)據(jù)的內(nèi)容信息提取語(yǔ)音特征;
將所述第一語(yǔ)音數(shù)據(jù)內(nèi)容信息的語(yǔ)音特征轉(zhuǎn)換為數(shù)字信息,并拆分成多個(gè)組成元素;
將所述多個(gè)組成元素重組為第二語(yǔ)音數(shù)據(jù);
將第一語(yǔ)音數(shù)據(jù)和第二語(yǔ)音數(shù)據(jù)形成預(yù)定義語(yǔ)音數(shù)據(jù)模型。
結(jié)合第二方面,本發(fā)明在第二方面的第五種實(shí)現(xiàn)方式中,
所述匹配模塊將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,包括,
判斷所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型匹配的模糊度是否大于預(yù)設(shè)值,若大于則確認(rèn)匹配;
所述模糊度預(yù)設(shè)值為65%。
結(jié)合第二方面,本發(fā)明在第二方面的第六種實(shí)現(xiàn)方式中,所述匹配模塊將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,包括,
判斷所述語(yǔ)音特征與根據(jù)預(yù)定義語(yǔ)音數(shù)據(jù)模型匹配的模糊度是否大于預(yù)設(shè)值,若不大于則確認(rèn)不匹配;
若確認(rèn)不匹配則丟棄所述語(yǔ)音數(shù)據(jù)。
結(jié)合第二方面,本發(fā)明在第二方面的第七種實(shí)現(xiàn)方式中,所述處理模塊若匹配則向預(yù)定的聯(lián)系人發(fā)送指定信息,包括,
若匹配則觸發(fā)并喚醒預(yù)設(shè)應(yīng)用程序向預(yù)定的聯(lián)系人發(fā)送指定信息;
所述觸發(fā)并喚醒為將觸發(fā)指令通過(guò)intent方式傳給預(yù)設(shè)應(yīng)用程序,同時(shí)喚醒預(yù)設(shè)應(yīng)用程序。
結(jié)合第二方面,本發(fā)明在第二方面的第八種實(shí)現(xiàn)方式中,還包括,
錄音模塊,用于實(shí)時(shí)錄入環(huán)境音;
調(diào)用模塊,用于調(diào)用GPS定位當(dāng)前位置;
信息模塊,將環(huán)境錄音和GPS定位信息添加到指定信息中;
觸發(fā)模塊,觸發(fā)并喚醒預(yù)設(shè)應(yīng)用程序?qū)⑺鲋付ㄐ畔l(fā)送至預(yù)定的聯(lián)系人。
結(jié)合第二方面的第七種實(shí)現(xiàn)方式,本發(fā)明在第二方面的第九種實(shí)現(xiàn)方式中,還包括,
錄音模塊,用于實(shí)時(shí)錄入環(huán)境音;
調(diào)用模塊,用于調(diào)用GPS定位當(dāng)前位置;
信息模塊,將環(huán)境錄音和GPS定位信息添加到指定信息中;
觸發(fā)模塊,觸發(fā)并喚醒預(yù)設(shè)應(yīng)用程序?qū)⑺鲋付ㄐ畔l(fā)送至預(yù)定的聯(lián)系人。
第三方面,本發(fā)明提供了一種移動(dòng)終端,包括,
預(yù)設(shè)功能按鍵、處理器、存儲(chǔ)器和傳聲器;
所述功能按鍵用于在鎖屏狀態(tài)下供用戶觸發(fā)生成操作指令;
所述傳聲器用于接收控制指令,開(kāi)啟或結(jié)束錄音;
所述存儲(chǔ)器用于存儲(chǔ)支持鎖屏狀態(tài)下的錄音裝置執(zhí)行第一方面中任意一項(xiàng)所述的信息處理方法的程序;
所述處理器被配置為用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的程序。
相對(duì)于現(xiàn)有技術(shù),使用本發(fā)明提供的技術(shù)方案至少具有以下優(yōu)點(diǎn):
當(dāng)遇到突發(fā)事件時(shí),用戶就可以在不接觸到手機(jī)的情況下,進(jìn)行緊急求救,向預(yù)先設(shè)定的聯(lián)系人發(fā)出指定信息,其預(yù)先設(shè)定的聯(lián)系人收到信息即可快速采取必要救援行動(dòng),從而簡(jiǎn)化求救操作步驟,縮短用戶被救的時(shí)間,提高用戶在遇到突發(fā)事件的安全系數(shù),且不容易被犯罪人員發(fā)現(xiàn)。
本發(fā)明的這些方面或其他方面在以下實(shí)施例的描述中會(huì)更加簡(jiǎn)明易懂。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)的,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1示出了本發(fā)明一種信息處理的方法的流程圖。
圖2示出了本發(fā)明一個(gè)實(shí)施例中信息處理的方法的語(yǔ)音模型HMM基本結(jié)構(gòu)。
圖3示出了本發(fā)明一個(gè)實(shí)施例中信息處理的方法的Sphinx連續(xù)語(yǔ)音識(shí)別系統(tǒng)流程圖。
圖4示出了本發(fā)明一種信息處理的裝置的結(jié)構(gòu)圖。
圖5示出了本發(fā)明一種移動(dòng)終端的結(jié)構(gòu)框圖。
具體實(shí)施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述。
在本發(fā)明的說(shuō)明書(shū)和權(quán)利要求書(shū)及上述附圖中的描述的一些流程中,包含了按照特定順序出現(xiàn)的多個(gè)操作,但是應(yīng)該清楚了解,這些操作可以不按照其在本文中出現(xiàn)的順序來(lái)執(zhí)行或并行執(zhí)行,操作的序號(hào)如101、102等,僅僅是用于區(qū)分開(kāi)各個(gè)不同的操作,序號(hào)本身不代表任何的執(zhí)行順序。另外,這些流程可以包括更多或更少的操作,并且這些操作可以按順序執(zhí)行或并行執(zhí)行。需要說(shuō)明的是,本文中的“第一”、“第二”等描述,是用于區(qū)分不同的消息、設(shè)備、模塊等,不代表先后順序,也不限定“第一”和“第二”是不同的類型。
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
實(shí)施例一
為了說(shuō)明本發(fā)明一種信息處理的方法、裝置和移動(dòng)終端的方法實(shí)現(xiàn)過(guò)程,請(qǐng)參閱圖1,該方法包括如下步驟:
S101:在語(yǔ)音監(jiān)聽(tīng)模式開(kāi)啟下,接收語(yǔ)音數(shù)據(jù);
當(dāng)用戶開(kāi)啟移動(dòng)終端時(shí),即開(kāi)始實(shí)時(shí)監(jiān)聽(tīng)周圍的語(yǔ)音數(shù)據(jù);
一旦監(jiān)聽(tīng)到語(yǔ)音數(shù)據(jù)即接收所述語(yǔ)音數(shù)據(jù);
優(yōu)選的,將所述語(yǔ)音數(shù)據(jù)拆分為單個(gè)元素和預(yù)定義語(yǔ)音數(shù)據(jù)模型的單個(gè)元素進(jìn)行識(shí)別,如果識(shí)別誤差不小于預(yù)設(shè)值,則丟棄所述語(yǔ)音數(shù)據(jù);
所述識(shí)別誤差值預(yù)設(shè)值為35%。
S102:獲取所述語(yǔ)音數(shù)據(jù)內(nèi)容信息中的語(yǔ)音特征;
所述語(yǔ)音特征包括語(yǔ)音的音高、音強(qiáng)、音長(zhǎng)、音色。
S103:將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,其中,所述預(yù)定義語(yǔ)音數(shù)據(jù)模型根據(jù)用戶預(yù)先錄入的語(yǔ)音數(shù)據(jù)生成。
優(yōu)選的,構(gòu)建至少一個(gè)預(yù)定義語(yǔ)音數(shù)據(jù)模型,例如,可以選擇導(dǎo)入廠商預(yù)先設(shè)置的語(yǔ)音數(shù)據(jù)模型,例如“SOS”、“救命啊”、“help”等其他各國(guó)“救命”的語(yǔ)言和/或方言;
用戶也可以根據(jù)自身的需求自行設(shè)置語(yǔ)音數(shù)據(jù)模型,具體包括:
預(yù)先錄入用戶語(yǔ)音生成第一語(yǔ)音數(shù)據(jù),用戶可在正常情況下錄入語(yǔ)音,例如:錄入不容易被歹徒識(shí)破的求救語(yǔ)言“幾點(diǎn)了,我媽喊我回家吃飯”等等,如果提示錄入不成功或需多錄入幾次,即可重復(fù)錄入該求救語(yǔ)言;
根據(jù)所述的第一語(yǔ)音數(shù)據(jù)的內(nèi)容信息提取語(yǔ)音特征;
將所述第一語(yǔ)音數(shù)據(jù)內(nèi)容信息的語(yǔ)音特征轉(zhuǎn)換為數(shù)字信息,并拆分成多個(gè)的組成元素;
將所述的多個(gè)組成元素重組成第二語(yǔ)音數(shù)據(jù);
將第一語(yǔ)音數(shù)據(jù)和第二語(yǔ)音數(shù)據(jù)形成預(yù)定義語(yǔ)音數(shù)據(jù)模型。
具體以HTM(HMM Tools Kit)和CMUsphinx舉例說(shuō)明。
HTM(HMM Tools Kit)是由英國(guó)劍橋大學(xué)工程系的語(yǔ)音視覺(jué)和機(jī)器人技術(shù)工作組(Speech Vision and Robotics Group)開(kāi)發(fā),專門用于建立和處理HMM的實(shí)驗(yàn)工具包,主要應(yīng)用于語(yǔ)音識(shí)別領(lǐng)域,也可用于語(yǔ)音模型的測(cè)試和分析。其具體訓(xùn)練步驟如下:
(1)數(shù)據(jù)準(zhǔn)備
收集漢語(yǔ)標(biāo)準(zhǔn)普通話的語(yǔ)料庫(kù),并將語(yǔ)料庫(kù)中的語(yǔ)音標(biāo)記,創(chuàng)建語(yǔ)音識(shí)別模塊或單元元素列表文件。
(2)特征提取
本系統(tǒng)采用MFCC進(jìn)行語(yǔ)音的特征參數(shù)提取,訓(xùn)練中將每一個(gè)語(yǔ)音文件用工具HCopy轉(zhuǎn)換成MFCC格式。
(3)HMM定義
在訓(xùn)練HMM模型時(shí)要給出模型的初始框架,本系統(tǒng)中的HMM模型選擇同一個(gè)結(jié)構(gòu),如圖2所示。該模型包含4個(gè)活動(dòng)狀態(tài){S2,S3,S4,S5),開(kāi)始和結(jié)束(這里是S1,S6),是非發(fā)散狀態(tài)。觀察函數(shù)bi是帶對(duì)角矩陣的高斯分布,狀態(tài)的可能轉(zhuǎn)換由aij表示。
(4)HMM訓(xùn)練
在訓(xùn)練過(guò)程開(kāi)始之前,為了使得訓(xùn)練算法快速精準(zhǔn)收斂,HMM模型參數(shù)必須根據(jù)訓(xùn)練數(shù)據(jù)正確初始化。HTK提供了2個(gè)不同的初始化工具:Hinit工具和HCompv工具,先使用HInit工具對(duì)HMM模型進(jìn)行初始化,再用HCompv工具來(lái)對(duì)模型進(jìn)行平坦初始化。HMM模型的每個(gè)狀態(tài)給定相同的平均向量和變化向量,在整個(gè)訓(xùn)練集上全局計(jì)算而得。最后用HRest的多次估計(jì)迭代,估計(jì)出HMM模型參數(shù)的最佳值,經(jīng)多次迭代,將訓(xùn)練得到的單個(gè)HMM模型整合到一個(gè)hmmsdef.mmf文件中。
Sphinx是由美國(guó)卡內(nèi)基梅隆大學(xué)開(kāi)發(fā)的大詞匯量、非特定人、連續(xù)英語(yǔ)語(yǔ)音識(shí)別系統(tǒng)。一個(gè)連續(xù)語(yǔ)音識(shí)別系統(tǒng)大致可分為四個(gè)部分:特征提取,聲學(xué)模型訓(xùn)練,語(yǔ)言模型訓(xùn)練和解碼器。具體如圖3所示:
(1)預(yù)處理模塊:
對(duì)輸入的原始語(yǔ)音信號(hào)進(jìn)行處理,濾除掉其中的不重要的信息以及背景噪聲,并進(jìn)行語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)(找出語(yǔ)音信號(hào)的始末)、語(yǔ)音分幀(近似認(rèn)為在10-30ms內(nèi)是語(yǔ)音信號(hào)是短時(shí)平穩(wěn)的,將語(yǔ)音信號(hào)分割為一段一段進(jìn)行分析)以及預(yù)加重(提升高頻部分)等處理。
(2)特征提取:
去除語(yǔ)音信號(hào)中對(duì)于語(yǔ)音識(shí)別無(wú)用的冗余信息,保留能夠反映語(yǔ)音本質(zhì)特征的信息,并用一定的形式表示出來(lái)。也就是提取出反映語(yǔ)音信號(hào)特征的關(guān)鍵特征參數(shù)形成特征矢量序列,以便用于后續(xù)處理。
(3)聲學(xué)模型訓(xùn)練:
根據(jù)訓(xùn)練語(yǔ)音庫(kù)的特征參數(shù)訓(xùn)練出聲學(xué)模型參數(shù)。在識(shí)別時(shí)可以將待識(shí)別的語(yǔ)音的特征參數(shù)同聲學(xué)模型進(jìn)行匹配,得到識(shí)別結(jié)果。
(4)語(yǔ)言模型訓(xùn)練:
語(yǔ)言模型是用來(lái)計(jì)算一個(gè)句子出現(xiàn)概率的概率模型。它主要用于決定哪個(gè)詞序列的可能性更大,或者在出現(xiàn)了幾個(gè)詞的情況下預(yù)測(cè)下一個(gè)即將出現(xiàn)的詞語(yǔ)的內(nèi)容。換一個(gè)說(shuō)法說(shuō),語(yǔ)言模型是用來(lái)約束單詞搜索的。它定義了哪些詞能跟在上一個(gè)已經(jīng)識(shí)別的詞的后面(匹配是一個(gè)順序的處理過(guò)程),這樣就可以為匹配過(guò)程排除一些不可能的單詞。
進(jìn)一步的,將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,包括,
判斷所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型匹配的模糊度是否大于預(yù)設(shè)值,若大于則確認(rèn)匹配,所述模糊度預(yù)設(shè)值為65%。
更進(jìn)一步的,所述將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,包括:
判斷所述語(yǔ)音特征與根據(jù)預(yù)定義語(yǔ)音數(shù)據(jù)模型匹配的模糊度是否大于預(yù)設(shè)值,若不大于則確認(rèn)不匹配;
若確認(rèn)不匹配則丟棄所述語(yǔ)音數(shù)據(jù)。
例如,用戶發(fā)出“媽媽喊你回家吃飯”,即可將“媽媽喊你回家吃飯”與“幾點(diǎn)了,我媽喊我回家吃飯”進(jìn)行匹配;
當(dāng)模糊度匹配不小于65%時(shí),即確認(rèn)匹配。
S103:若匹配則向預(yù)定的聯(lián)系人發(fā)送指定信息;
優(yōu)選的,若匹配則觸發(fā)并喚醒預(yù)設(shè)應(yīng)用程序向預(yù)定的聯(lián)系人發(fā)送指定信息;
所述觸發(fā)并喚醒為將觸發(fā)指令通過(guò)intent方式傳給預(yù)設(shè)應(yīng)用程序,同時(shí)喚醒預(yù)設(shè)應(yīng)用程序。
進(jìn)一步的,若確認(rèn)匹配時(shí),錄入環(huán)境音,調(diào)用GPS定位當(dāng)前位置,將GPS定位信息和環(huán)境錄音添加到指定信息,向預(yù)定的聯(lián)系人發(fā)送所述指定信息;
所述GPS定位信息包含當(dāng)前所在的緯度信息和經(jīng)度信息。
更進(jìn)一步的,若確認(rèn)不匹配時(shí),則丟棄所述語(yǔ)音數(shù)據(jù)。
實(shí)施例二
為了說(shuō)明客戶端詳細(xì)模塊的組成,請(qǐng)參閱圖4,本實(shí)施例中至少包含了以下模塊:
監(jiān)聽(tīng)模塊401、接收模塊402、獲取模塊403、識(shí)別模塊404、匹配模塊405、處理模塊406、錄音模塊407、調(diào)用模塊408、信息模塊409、觸發(fā)模塊410和存儲(chǔ)模塊411和設(shè)置模塊412。
所述監(jiān)聽(tīng)模塊401,用于監(jiān)聽(tīng)語(yǔ)音獲取語(yǔ)音數(shù)據(jù),當(dāng)用戶開(kāi)啟移動(dòng)設(shè)備時(shí),即開(kāi)始實(shí)時(shí)監(jiān)聽(tīng)周圍的語(yǔ)音數(shù)據(jù);
所述接收模塊402,用于接收所述的語(yǔ)音數(shù)據(jù);
所述獲取模塊403,用于獲取所述語(yǔ)音數(shù)據(jù)內(nèi)容信息中的語(yǔ)音特征;
進(jìn)一步的,所述語(yǔ)音特征包括語(yǔ)音的音高、音強(qiáng)、音長(zhǎng)、音色。
優(yōu)選的,還包括所述的識(shí)別模塊404,用于將所述語(yǔ)音數(shù)據(jù)拆分為單個(gè)元素和預(yù)定義語(yǔ)音數(shù)據(jù)模型的單個(gè)元素進(jìn)行識(shí)別。
進(jìn)一步的,如果所述識(shí)別模塊識(shí)別單個(gè)語(yǔ)音數(shù)據(jù)的識(shí)別誤差不小于預(yù)設(shè)值,則丟棄所述語(yǔ)音數(shù)據(jù);
所述識(shí)別誤差值預(yù)設(shè)值為35%。
所述匹配模塊405,用于將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,其中,所述預(yù)定義語(yǔ)音數(shù)據(jù)模型根據(jù)用戶預(yù)先錄入的語(yǔ)音數(shù)據(jù)生成;
優(yōu)選的,構(gòu)建至少一個(gè)預(yù)定義語(yǔ)音數(shù)據(jù)模型,導(dǎo)入廠商預(yù)先設(shè)置的語(yǔ)音數(shù)據(jù)模型,例如“SOS”、“救命啊”、“help”等其他各國(guó)“救命”的語(yǔ)言和/或方言;
也可以根據(jù)用戶自身的需求自行設(shè)置語(yǔ)音數(shù)據(jù)模型,具體包括:
所述存儲(chǔ)模塊411,用于存儲(chǔ)構(gòu)建的至少一個(gè)預(yù)定義語(yǔ)音數(shù)據(jù)模型4111;
所述構(gòu)建的至少一個(gè)預(yù)定義語(yǔ)音數(shù)據(jù)模型4111:
錄入用戶語(yǔ)音數(shù)據(jù),用戶可在正常情況下錄入語(yǔ)音,例如:錄入不容易被歹徒識(shí)破的求救語(yǔ)言“幾點(diǎn)了,我媽喊我回家吃飯”等等,如果系統(tǒng)提示錄入不成功或需多錄入幾次,即可重復(fù)錄入該求救語(yǔ)音;
根據(jù)所述的用戶語(yǔ)音數(shù)據(jù)的內(nèi)容信息提取語(yǔ)音特征;
將所述第一語(yǔ)音數(shù)據(jù)內(nèi)容信息的語(yǔ)音特征轉(zhuǎn)換為數(shù)字信息,并拆分成多個(gè)組成元素;
重組所述多個(gè)的組成元素成第二語(yǔ)音數(shù)據(jù);
將第一語(yǔ)音數(shù)據(jù)和第二語(yǔ)音數(shù)據(jù)形成預(yù)定義語(yǔ)音數(shù)據(jù)模型。
進(jìn)一步的,根據(jù)預(yù)定義語(yǔ)音數(shù)據(jù)模型設(shè)置模糊度,將所述的模糊度設(shè)置為65%。
更進(jìn)一步的,將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,包括:
判斷所述語(yǔ)音特征與根據(jù)預(yù)定義語(yǔ)音數(shù)據(jù)模型匹配的模糊度是否大于預(yù)設(shè)值,若不大于則確認(rèn)不匹配;
若確認(rèn)不匹配則丟棄所述語(yǔ)音數(shù)據(jù)。
例如,用戶發(fā)出“媽媽喊你回家吃飯”,即可將“媽媽喊你回家吃飯”與“幾點(diǎn)了,我媽喊我回家吃飯”進(jìn)行匹配;
當(dāng)模糊度匹配不小于65%時(shí),則確認(rèn)匹配;否則確定為不匹配。
所述處理模塊406,用于確認(rèn)匹配時(shí)向預(yù)定的聯(lián)系人發(fā)送指定信息。
所述錄音模塊407,用于實(shí)時(shí)錄入環(huán)境音;
所述調(diào)用模塊408,用于調(diào)用GPS定位當(dāng)前位置;所述定位信息包含當(dāng)前所在的緯度信息和經(jīng)度信息;
所述信息模塊409,用于將環(huán)境錄音和GPS定位信息添加到指定信息中;
優(yōu)選的,所述觸發(fā)模塊410,用于在確認(rèn)匹配時(shí),觸發(fā)并喚醒預(yù)設(shè)應(yīng)用程序?qū)⑺鲋付ㄐ畔l(fā)送至預(yù)定的聯(lián)系人;
進(jìn)一步的,當(dāng)確認(rèn)匹配時(shí),錄入環(huán)境音,調(diào)用GPS定位當(dāng)前位置,將GPS定位信息和環(huán)境錄音添加到指定信息中,觸發(fā)并喚醒預(yù)設(shè)應(yīng)用程序?qū)⑺鲋付ㄐ畔l(fā)送至預(yù)定的聯(lián)系人。
所述設(shè)置模塊412,用于預(yù)先設(shè)置至少一個(gè)以上的聯(lián)系人4121接收指定信息。
更進(jìn)一步的,所述處理模塊406確定不匹配時(shí),繼續(xù)監(jiān)聽(tīng)。
實(shí)施例三
為了說(shuō)明本發(fā)明一種信息處理的方法和裝置均在如下所述的移動(dòng)終端中實(shí)現(xiàn),
所述移動(dòng)終端,包括預(yù)設(shè)功能按鍵、處理器、存儲(chǔ)器和傳聲器;
所述功能按鍵用于在鎖屏狀態(tài)下供用戶觸發(fā)生成操作指令;
所述傳聲器用于接收控制指令,開(kāi)啟或結(jié)束錄音;
所述存儲(chǔ)器用于存儲(chǔ)支持鎖屏狀態(tài)下的錄音裝置執(zhí)行前文所述信息處理的方法的程序;
所述處理器被配置為用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的程序。
詳細(xì)敘述如下:
本實(shí)施例的系統(tǒng)中包括至少一個(gè)裝置,以及用于接收所述裝置發(fā)出求救信息的預(yù)定聯(lián)系人。
該移動(dòng)終端可以包括在手機(jī)、平板電腦、PDA(Personal Digital Assistant,個(gè)人數(shù)字助理)等任意移動(dòng)終端中,以移動(dòng)終端手機(jī)為例進(jìn)行以下說(shuō)明:
如圖5所示,移動(dòng)終端手機(jī)包括:射頻(Radio Frequency,RF)電路610、存儲(chǔ)器620、輸入模塊或單元630、顯示模塊或單元640、傳感器650、音頻電路660、無(wú)線保真(wireless fidelity,WiFi)模塊670、處理器680、以及電源690等部件。本領(lǐng)域技術(shù)人員可以理解,圖5中示出的手機(jī)結(jié)構(gòu)并不構(gòu)成對(duì)手機(jī)的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。
下面結(jié)合圖5對(duì)手機(jī)的各個(gè)構(gòu)成部件進(jìn)行具體的介紹:
RF電路510可用于收發(fā)信息或通話過(guò)程中,信號(hào)的接收和發(fā)送,特別地,將基站的下行信息接收后,給處理器580處理;另外,將設(shè)計(jì)上行的數(shù)據(jù)發(fā)送給基站。通常,RF電路510包括但不限于天線、至少一個(gè)放大器、收發(fā)信機(jī)、耦合器、低噪聲放大器(Low Noise Amplifier,LNA)、雙工器等。此外,RF電路510還可以通過(guò)無(wú)線通信與網(wǎng)絡(luò)和其他設(shè)備通信。上述無(wú)線通信可以使用任一通信標(biāo)準(zhǔn)或協(xié)議,包括但不限于全球移動(dòng)通訊系統(tǒng)(Global System of Mobile communication,GSM)、通用分組無(wú)線服務(wù)(General Packet Radio Service,GPRS)、碼分多址(Code Division Multiple Access,CDMA)、寬帶碼分多址(Wideband Code Division Multiple Access,WCDMA)、長(zhǎng)期演進(jìn)(Long Term Evolution,LTE)、電子郵件、短消息服務(wù)(Short Messaging Service,SMS)等。
存儲(chǔ)器520可用于存儲(chǔ)軟件程序以及模塊,處理器580通過(guò)運(yùn)行存儲(chǔ)在存儲(chǔ)器520的軟件程序以及模塊,從而執(zhí)行手機(jī)的各種功能應(yīng)用以及數(shù)據(jù)處理。存儲(chǔ)器520可主要包括存儲(chǔ)程序區(qū)和存儲(chǔ)數(shù)據(jù)區(qū),其中,存儲(chǔ)程序區(qū)可存儲(chǔ)操作系統(tǒng)、至少一個(gè)功能所需的應(yīng)用程序(比如聲音播放功能、圖像播放功能等)等;存儲(chǔ)數(shù)據(jù)區(qū)可存儲(chǔ)根據(jù)手機(jī)的使用所創(chuàng)建的數(shù)據(jù)(比如音頻數(shù)據(jù)、電話本等)等。此外,存儲(chǔ)器520可以包括高速隨機(jī)存取存儲(chǔ)器,還可以包括非易失性存儲(chǔ)器,例如至少一個(gè)磁盤存儲(chǔ)器件、閃存器件、或其他易失性固態(tài)存儲(chǔ)器件。
輸入模塊或單元530可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與手機(jī)的用戶設(shè)置以及功能控制有關(guān)的鍵信號(hào)輸入。具體地,輸入模塊或單元530可包括觸控面板531以及其他輸入設(shè)備532。觸控面板531,也稱為觸摸屏,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸控面板531上或在觸控面板531附近的操作),并根據(jù)預(yù)先設(shè)定的程式驅(qū)動(dòng)相應(yīng)的連接裝置??蛇x的,觸控面板531可包括觸摸檢測(cè)裝置和觸摸控制器兩個(gè)部分。其中,觸摸檢測(cè)裝置檢測(cè)用戶的觸摸方位,并檢測(cè)觸摸操作帶來(lái)的信號(hào),將信號(hào)傳送給觸摸控制器;觸摸控制器從觸摸檢測(cè)裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點(diǎn)坐標(biāo),再送給處理器580,并能接收處理器580發(fā)來(lái)的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實(shí)現(xiàn)觸控面板531。除了觸控面板531,輸入模塊或單元530還可以包括其他輸入設(shè)備532。具體地,其他輸入設(shè)備532可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開(kāi)關(guān)按鍵等)、軌跡球、鼠標(biāo)、操作桿等中的一種或多種。
顯示模塊或單元540可用于顯示由用戶輸入的信息或提供給用戶的信息以及手機(jī)的各種菜單。顯示模塊或單元540可包括顯示面板541,可選的,可以采用液晶顯示器(Liquid Crystal Display,LCD)、有機(jī)發(fā)光二極管(Organic Light-Emitting Diode,OLED)等形式來(lái)配置顯示面板541。進(jìn)一步的,觸控面板531可覆蓋顯示面板541,當(dāng)觸控面板531檢測(cè)到在其上或附近的觸摸操作后,傳送給處理器580以確定觸摸事件的類型,隨后處理器580根據(jù)觸摸事件的類型在顯示面板541上提供相應(yīng)的視覺(jué)輸出。雖然在圖5中,觸控面板531與顯示面板541是作為兩個(gè)獨(dú)立的部件來(lái)實(shí)現(xiàn)手機(jī)的輸入和輸入功能,但是在某些實(shí)施例中,可以將觸控面板531與顯示面板541集成而實(shí)現(xiàn)手機(jī)的輸入和輸出功能。
手機(jī)還可包括至少一種傳感器550,比如光傳感器、運(yùn)動(dòng)傳感器以及其他傳感器。具體地,光傳感器可包括環(huán)境光傳感器及接近傳感器,其中,環(huán)境光傳感器可根據(jù)環(huán)境光線的明暗來(lái)調(diào)節(jié)顯示面板541的亮度,接近傳感器可在手機(jī)移動(dòng)到耳邊時(shí),關(guān)閉顯示面板541和/或背光。作為運(yùn)動(dòng)傳感器的一種,加速計(jì)傳感器可檢測(cè)各個(gè)方向上(一般為三軸)加速度的大小,靜止時(shí)可檢測(cè)出重力的大小及方向,可用于識(shí)別手機(jī)姿態(tài)的應(yīng)用(比如橫豎屏切換、相關(guān)游戲、磁力計(jì)姿態(tài)校準(zhǔn))、振動(dòng)識(shí)別相關(guān)功能(比如計(jì)步器、敲擊)等;至于手機(jī)還可配置的陀螺儀、氣壓計(jì)、濕度計(jì)、溫度計(jì)、紅外線傳感器等其他傳感器,在此不再贅述。
音頻電路560、揚(yáng)聲器561,傳聲器562可提供用戶與手機(jī)之間的音頻接口。音頻電路560可將接收到的音頻數(shù)據(jù)轉(zhuǎn)換后的電信號(hào),傳輸?shù)綋P(yáng)聲器561,由揚(yáng)聲器561轉(zhuǎn)換為聲音信號(hào)輸出;另一方面,傳聲器562將收集的聲音信號(hào)轉(zhuǎn)換為電信號(hào),由音頻電路560接收后轉(zhuǎn)換為音頻數(shù)據(jù),再將音頻數(shù)據(jù)輸出處理器580處理后,經(jīng)RF電路510以發(fā)送給比如另一手機(jī),或者將音頻數(shù)據(jù)輸出至存儲(chǔ)器520以便進(jìn)一步處理。
WiFi屬于短距離無(wú)線傳輸技術(shù),手機(jī)通過(guò)WiFi模塊570可以幫助用戶收發(fā)電子郵件、瀏覽網(wǎng)頁(yè)和訪問(wèn)流式媒體等,它為用戶提供了無(wú)線的寬帶互聯(lián)網(wǎng)訪問(wèn)。雖然圖5示出了WiFi模塊570,但是可以理解的是,其并不屬于手機(jī)的必須構(gòu)成,完全可以根據(jù)需要在不改變發(fā)明的本質(zhì)的范圍內(nèi)而省略。
處理器580是手機(jī)的控制中心,利用各種接口和線路連接整個(gè)手機(jī)的各個(gè)部分,通過(guò)運(yùn)行或執(zhí)行存儲(chǔ)在存儲(chǔ)器520內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲(chǔ)在存儲(chǔ)器520內(nèi)的數(shù)據(jù),執(zhí)行手機(jī)的各種功能和處理數(shù)據(jù),從而對(duì)手機(jī)進(jìn)行整體監(jiān)控??蛇x的,處理器580可包括一個(gè)或多個(gè)處理模塊或單元;優(yōu)選的,處理器580可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無(wú)線通信??梢岳斫獾氖?,上述調(diào)制解調(diào)處理器也可以不集成到處理器580中。
手機(jī)還包括給各個(gè)部件供電的電源590(比如電池),優(yōu)選的,電源可以通過(guò)電源管理系統(tǒng)與處理器580邏輯相連,從而通過(guò)電源管理系統(tǒng)實(shí)現(xiàn)管理充電、放電、以及功耗管理等功能。
盡管未示出,手機(jī)還可以包括攝像頭、藍(lán)牙模塊等,在此不再贅述。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的方法、裝置和移動(dòng)終端的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。
在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的方法、裝置和移動(dòng)終端,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述模塊或單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)模塊或單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,裝置或模塊或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
所述作為分離部件說(shuō)明的模塊或單元可以是或者也可以不是物理上分開(kāi)的,作為模塊或單元顯示的部件可以是或者也可以不是物理模塊或單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)模塊或單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊或單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本發(fā)明各個(gè)實(shí)施例中的各功能模塊或單元可以集成在一個(gè)處理模塊或單元中,也可以是各個(gè)模塊或單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上模塊或單元集成在一個(gè)模塊或單元中。上述集成的模塊或單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊或單元的形式實(shí)現(xiàn)。
本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,該程序可以存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,存儲(chǔ)介質(zhì)可以包括:只讀存儲(chǔ)器(ROM,Read Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁盤或光盤等。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。
以上對(duì)本發(fā)明所提供的一種信息處理的方法、裝置和移動(dòng)終端進(jìn)行了詳細(xì)介紹,對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明實(shí)施例的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
概括的說(shuō),本發(fā)明提供的技術(shù)方案概述如下:
A1、一種信息處理的方法,包括:
在語(yǔ)音監(jiān)聽(tīng)模式開(kāi)啟下,接收語(yǔ)音數(shù)據(jù);
獲取所述語(yǔ)音數(shù)據(jù)內(nèi)容信息中的語(yǔ)音特征;
將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,其中,所述預(yù)定義語(yǔ)音數(shù)據(jù)模型根據(jù)用戶預(yù)先錄入的語(yǔ)音數(shù)據(jù)生成;
若匹配則向預(yù)定的聯(lián)系人發(fā)送指定信息。
A2、如A1所述的方法,所述語(yǔ)音特征包括語(yǔ)音的音高、音強(qiáng)、音長(zhǎng)、音色。
A3、如A1所述的方法,所述接收語(yǔ)音數(shù)據(jù)之后,還包括,
將所述語(yǔ)音數(shù)據(jù)拆分為單個(gè)元素和預(yù)定義語(yǔ)音數(shù)據(jù)模型的單個(gè)元素進(jìn)行識(shí)別,如果識(shí)別誤差不小于預(yù)設(shè)值,則丟棄所述語(yǔ)音數(shù)據(jù);
所述識(shí)別誤差值預(yù)設(shè)值為35%。
A4、如A1或A3所述的方法,所述預(yù)定義語(yǔ)音數(shù)據(jù)模型根據(jù)用戶預(yù)先錄入的語(yǔ)音數(shù)據(jù)生成,包括,
預(yù)先錄入用戶語(yǔ)音生成第一語(yǔ)音數(shù)據(jù);
根據(jù)所述的第一語(yǔ)音數(shù)據(jù)的內(nèi)容信息提取語(yǔ)音特征;
將所述第一語(yǔ)音數(shù)據(jù)內(nèi)容信息的語(yǔ)音特征轉(zhuǎn)換為數(shù)字信息,并拆分成多個(gè)組成元素;
將所述的多個(gè)組成元素重組為第二語(yǔ)音數(shù)據(jù);
將第一語(yǔ)音數(shù)據(jù)和第二語(yǔ)音數(shù)據(jù)形成預(yù)定義語(yǔ)音數(shù)據(jù)模型。
A5、如A1所述的方法,所述將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,包括,
判斷所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型匹配的模糊度是否大于預(yù)設(shè)值,若大于則確認(rèn)匹配;
所述模糊度預(yù)設(shè)值為65%。
A6、如A1所述的方法,所述將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,包括,
判斷所述語(yǔ)音特征與根據(jù)預(yù)定義語(yǔ)音數(shù)據(jù)模型匹配的模糊度是否大于預(yù)設(shè)值,若不大于則確認(rèn)不匹配;
若確認(rèn)不匹配則丟棄所述語(yǔ)音數(shù)據(jù)。
A7、如A1所述的方法,
所述若匹配則向預(yù)定的聯(lián)系人發(fā)送指定信息,包括,
若匹配則觸發(fā)并喚醒預(yù)設(shè)應(yīng)用程序向預(yù)定的聯(lián)系人發(fā)送指定信息;
所述觸發(fā)并喚醒為將觸發(fā)指令通過(guò)intent方式傳給預(yù)設(shè)應(yīng)用程序,同時(shí)喚醒預(yù)設(shè)應(yīng)用程序。
A8、如A1或A7所述的方法,所述若匹配則向預(yù)定的聯(lián)系人發(fā)送指定信息,還包括:
錄入環(huán)境音;
調(diào)用GPS定位當(dāng)前位置;
將GPS定位信息和環(huán)境錄音添加到指定信息中;
觸發(fā)并喚醒預(yù)設(shè)應(yīng)用程序?qū)⑺鲋付ㄐ畔l(fā)送至預(yù)定的聯(lián)系人。
B9、一種信息處理的裝置,包括:
監(jiān)聽(tīng)模塊,用于監(jiān)聽(tīng)語(yǔ)音獲取語(yǔ)音數(shù)據(jù);
接收模塊,用于接收所述的語(yǔ)音數(shù)據(jù);
獲取模塊,用于獲取所述語(yǔ)音數(shù)據(jù)內(nèi)容信息中的語(yǔ)音特征;
匹配模塊,用于將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,其中,所述預(yù)定義語(yǔ)音數(shù)據(jù)模型根據(jù)用戶預(yù)先錄入的語(yǔ)音數(shù)據(jù)生成;
處理模塊,用于確定匹配時(shí)向預(yù)定的聯(lián)系人發(fā)送指定信息。
B10、如B9所述的裝置,所述語(yǔ)音特征包括語(yǔ)音的音高、音強(qiáng)、音長(zhǎng)、音色。
B11、如B 9所述的裝置,所述接收語(yǔ)音數(shù)據(jù)之后,還包括,
將所述語(yǔ)音數(shù)據(jù)拆分為單個(gè)元素和預(yù)定義語(yǔ)音數(shù)據(jù)模型的單個(gè)元素進(jìn)行識(shí)別,如果識(shí)別誤差不小于預(yù)設(shè)值,則丟棄所述語(yǔ)音數(shù)據(jù);
所述識(shí)別誤差值預(yù)設(shè)值為35%。
B12、如B9或B11所述的裝置,還包括存儲(chǔ)模塊,
所述存儲(chǔ)模塊用于存儲(chǔ)預(yù)定義語(yǔ)音數(shù)據(jù)模型,所述預(yù)定義語(yǔ)音數(shù)據(jù)模型根據(jù)用戶預(yù)先錄入的語(yǔ)音數(shù)據(jù)生成,包括,
預(yù)先錄入用戶語(yǔ)音生成第一語(yǔ)音數(shù)據(jù);
根據(jù)所述的第一語(yǔ)音數(shù)據(jù)的內(nèi)容信息提取語(yǔ)音特征;
將所述第一語(yǔ)音數(shù)據(jù)內(nèi)容信息的語(yǔ)音特征轉(zhuǎn)換為數(shù)字信息,并拆分成多個(gè)組成元素;
將所述多個(gè)組成元素重組為第二語(yǔ)音數(shù)據(jù);
將第一語(yǔ)音數(shù)據(jù)和第二語(yǔ)音數(shù)據(jù)形成預(yù)定義語(yǔ)音數(shù)據(jù)模型。
B13、如B9所述的裝置,所述匹配模塊將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,包括,
判斷所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型匹配的模糊度是否大于預(yù)設(shè)值,若大于則確認(rèn)匹配,
所述模糊度預(yù)設(shè)值為65%。
B14、如B9所述的裝置,所述匹配模塊將所述語(yǔ)音特征與預(yù)定義語(yǔ)音數(shù)據(jù)模型進(jìn)行匹配,包括,
判斷所述語(yǔ)音特征與根據(jù)預(yù)定義語(yǔ)音數(shù)據(jù)模型匹配的模糊度是否大于預(yù)設(shè)值,若不大于則確認(rèn)不匹配;
若確認(rèn)不匹配則丟棄所述語(yǔ)音數(shù)據(jù)。
B15、如B9所述的裝置,所述處理模塊若匹配則向預(yù)定的聯(lián)系人發(fā)送指定信息,包括,
若匹配則觸發(fā)并喚醒預(yù)設(shè)應(yīng)用程序向預(yù)定的聯(lián)系人發(fā)送指定信息;
所述觸發(fā)并喚醒為將觸發(fā)指令通過(guò)intent方式傳給預(yù)設(shè)應(yīng)用程序,同時(shí)喚醒預(yù)設(shè)應(yīng)用程序。
B16、如B9所述的裝置,還包括,
錄音模塊,用于實(shí)時(shí)錄入環(huán)境音;
調(diào)用模塊,用于調(diào)用GPS定位當(dāng)前位置;
信息模塊,將環(huán)境錄音和GPS定位信息添加到指定信息中;
設(shè)置模塊,用于預(yù)先設(shè)置至少一個(gè)以上的聯(lián)系人接收指定信息;
觸發(fā)模塊,觸發(fā)并喚醒預(yù)設(shè)應(yīng)用程序?qū)⑺鲋付ㄐ畔l(fā)送至預(yù)定的聯(lián)系人。
C17、一種移動(dòng)終端,包括:
預(yù)設(shè)功能按鍵、處理器、存儲(chǔ)器和傳聲器;
所述功能按鍵用于在鎖屏狀態(tài)下供用戶觸發(fā)生成操作指令;
所述傳聲器用于接收控制指令,開(kāi)啟或結(jié)束錄音;
所述存儲(chǔ)器用于存儲(chǔ)支持鎖屏狀態(tài)下的錄音裝置執(zhí)行前A1至A8中任意一項(xiàng)所述的信息處理方法的程序;
所述處理器被配置為用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的程序。