專利名稱:基于語(yǔ)音的人機(jī)通訊系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信領(lǐng)域,尤其涉及一種基于語(yǔ)音的人機(jī)通訊系統(tǒng)和方法。
背景技術(shù):
近兩年寬帶與信息技術(shù)的成熟和普及,為IPTV技術(shù)和發(fā)展鋪平了道路,再加上政府在信息產(chǎn)業(yè)領(lǐng)域的發(fā)展方向、IPTV牌照的下發(fā),使IPTV這塊新型多媒體信息交互平臺(tái)得到了迅猛發(fā)展。在機(jī)頂盒(如IP機(jī)頂盒、數(shù)字機(jī)頂盒)逐步市場(chǎng)化的趨勢(shì)下,機(jī)頂盒的功用將逐步取代傳統(tǒng)的VCD機(jī)、DVD機(jī)。IPTV的目標(biāo)客戶是普通大眾,凡是有電視機(jī)的家庭,即使不懂有關(guān)電腦與網(wǎng)絡(luò)的知識(shí),也能通過(guò)加一臺(tái)機(jī)頂盒接入互聯(lián)網(wǎng)。因此,操作簡(jiǎn)便是其能否得到大面積推廣的關(guān)鍵。
另一方面,現(xiàn)階段,語(yǔ)音識(shí)別無(wú)論從識(shí)別精度還是效率都已經(jīng)十分成熟,在家電、玩具、工業(yè)控制、還有部分通訊信息領(lǐng)域已經(jīng)投入使用并普及,滿足各個(gè)領(lǐng)域需要的語(yǔ)音識(shí)別庫(kù)也日益完備。在這個(gè)技術(shù)與市場(chǎng)前提下,將語(yǔ)音識(shí)別技術(shù)引入IPTV,把語(yǔ)音操作的簡(jiǎn)易友好性與IPTV相結(jié)合,在進(jìn)一步拓寬應(yīng)用層面,引入C/S語(yǔ)音分析識(shí)別模式,這將有很大的技術(shù)可行性和市場(chǎng)前景。
現(xiàn)階段IPTV的操作主要限于遙控器和機(jī)身上的按鈕,而一些相當(dāng)復(fù)雜的操作需要一系列的按鍵來(lái)完成。用戶使用機(jī)頂盒在電視上實(shí)現(xiàn)網(wǎng)頁(yè)瀏覽、視頻點(diǎn)播、娛樂(lè)(如游戲、試唱點(diǎn)播等)、電視直播等,仍需要通過(guò)傳統(tǒng)的方式,即使用遙控器來(lái)不斷地進(jìn)行切換。這種方式給用戶帶來(lái)極大的不便,尤其是視頻點(diǎn)播,在點(diǎn)播某個(gè)連續(xù)劇的某一集的情形,用戶需要使用遙控器層層來(lái)選擇,積累大量的操縱遙控器的動(dòng)作。因此,一種既操作簡(jiǎn)單又不受空間限制實(shí)現(xiàn)方便的操作方式成為IPTV技術(shù)廣泛應(yīng)用的一個(gè)需求。在生活當(dāng)中,人們之間最直接最簡(jiǎn)易的交流是語(yǔ)言交流,對(duì)網(wǎng)絡(luò)和信息也是一樣,人們需要一種更加人性化的網(wǎng)絡(luò)世界,所以,語(yǔ)音識(shí)別技術(shù)與IPTV的結(jié)合是一個(gè)必然的發(fā)展趨勢(shì)。
一種現(xiàn)有技術(shù)的家用設(shè)備的語(yǔ)音識(shí)別方案中,基于語(yǔ)音的人機(jī)通訊系統(tǒng)包括多個(gè)具有語(yǔ)音合成功能的可控設(shè)備,每個(gè)所述設(shè)備有其獨(dú)有的聲音模式,各個(gè)設(shè)備通過(guò)總線連接以使中央處理機(jī)構(gòu)處理所有來(lái)自用戶的請(qǐng)求,由于用戶使用其自然語(yǔ)言,命令會(huì)引起歧義,因此提供了一個(gè)用于處理歧義情況的算法。
但是,該家用設(shè)備的語(yǔ)音識(shí)別方案中的人—機(jī)通訊系統(tǒng)涉及到多個(gè)家用設(shè)備,組網(wǎng)方式復(fù)雜,每個(gè)系統(tǒng)需要有一個(gè)總線系統(tǒng)、一個(gè)中央處理機(jī)構(gòu)、和至少一個(gè)語(yǔ)音識(shí)別裝置,系統(tǒng)組網(wǎng)較為復(fù)雜,必然帶來(lái)成本的增加。
另一種現(xiàn)有技術(shù)提供一種具有語(yǔ)音識(shí)別功能的遙控裝置,該具有語(yǔ)音辨識(shí)功能的遙控裝置包括發(fā)射器及接收器,接收器包括RF射頻接收電路、解調(diào)裝置、語(yǔ)音輸入控制裝置、A/D轉(zhuǎn)換信號(hào)控制單元、緩沖區(qū)、存儲(chǔ)器、語(yǔ)音辨識(shí)處理單元、指令核封裝置、輸出控制裝置。接收器接收到由發(fā)射器所傳送的信號(hào)時(shí),首先對(duì)該信號(hào)與經(jīng)過(guò)語(yǔ)音訓(xùn)練模式所儲(chǔ)存于存儲(chǔ)器中的原先信號(hào)進(jìn)行語(yǔ)音辨識(shí)對(duì)比,以及辨識(shí)是否為特定使用者,辨識(shí)符合才由指令核對(duì)裝置核對(duì)接收到的指令,以由輸出控制裝置輸出所述指令對(duì)應(yīng)的控制信號(hào)。
但是該遙控裝置比較昂貴,而且該遙控裝置并非傳統(tǒng)的遙控器,用戶想到達(dá)到熟練操作必須經(jīng)過(guò)專業(yè)的訓(xùn)練,這對(duì)于使用的對(duì)象有一定的限制,如年紀(jì)大的用戶可能無(wú)法接受這種方式。
發(fā)明內(nèi)容
為解決現(xiàn)有技術(shù)基于語(yǔ)音的人機(jī)通訊系統(tǒng)和方法難以操作和成本較高的缺陷,本發(fā)明提供一種成本較低且易于操作的基于語(yǔ)音的人機(jī)通訊系統(tǒng)和方法。
本發(fā)明解決技術(shù)問(wèn)題的一種技術(shù)方案是,提供一種基于語(yǔ)音的人機(jī)通訊系統(tǒng),包括機(jī)頂盒、業(yè)務(wù)服務(wù)器和遙控裝置,其中,該機(jī)頂盒還包括語(yǔ)音信號(hào)處理裝置,用來(lái)采集和處理用戶發(fā)出的語(yǔ)音信號(hào);該業(yè)務(wù)服務(wù)器端還包括語(yǔ)音識(shí)別裝置,用來(lái)接收和識(shí)別客戶端傳送過(guò)來(lái)的語(yǔ)音信號(hào);機(jī)頂盒將遙控裝置發(fā)出的語(yǔ)音指令處理后發(fā)送給業(yè)務(wù)服務(wù)器端的語(yǔ)音識(shí)別裝置,語(yǔ)音識(shí)別裝置根據(jù)機(jī)頂盒發(fā)出的語(yǔ)音信號(hào)請(qǐng)求,下發(fā)操作指令給發(fā)起請(qǐng)求的機(jī)頂盒,機(jī)頂盒在接收到服務(wù)器的操作指令后,分析是否為合法的操作,若該操作不合法,機(jī)頂盒不執(zhí)行該指令,并在電視屏幕上進(jìn)行語(yǔ)音操作失敗的提示;對(duì)于合法的操作,機(jī)頂盒根據(jù)指令,執(zhí)行正常的機(jī)頂盒業(yè)務(wù)流程,實(shí)現(xiàn)用戶的操作。
作為所述系統(tǒng)的一種改進(jìn),所述語(yǔ)音信號(hào)處理裝置包括語(yǔ)音信號(hào)采集裝置。
作為所述系統(tǒng)的一種改進(jìn),所述語(yǔ)音信號(hào)采集裝置是話筒或者麥克風(fēng)。
作為所述系統(tǒng)的一種改進(jìn),所述語(yǔ)音信號(hào)處理裝置還包括用來(lái)接收用戶輸入的語(yǔ)音信號(hào)的聲音接收器。
作為所述系統(tǒng)的一種改進(jìn),所述遙控裝置包括控制語(yǔ)音輸入信號(hào)開(kāi)關(guān)的開(kāi)關(guān)模塊。
作為所述系統(tǒng)的一種改進(jìn),所述開(kāi)關(guān)模塊是通過(guò)遙控裝置內(nèi)部的編碼或者硬件實(shí)現(xiàn)的“語(yǔ)音鎖”按鍵。
作為所述系統(tǒng)的一種改進(jìn),所述遙控裝置還包括用來(lái)接收用戶輸入的語(yǔ)音信號(hào)的聲音接收器。
本發(fā)明解決技術(shù)問(wèn)題的一種技術(shù)方案是,提供一種基于語(yǔ)音的人機(jī)通訊方法,包括A.語(yǔ)音信號(hào)處理裝置收集用戶發(fā)出的語(yǔ)音指令,并將該語(yǔ)音指令發(fā)送給業(yè)務(wù)服務(wù)器;B.業(yè)務(wù)服務(wù)器處理所述語(yǔ)音指令后,下發(fā)操作指令給機(jī)頂盒進(jìn)行相關(guān)操作。
作為所述方法的一種改進(jìn),所述步驟A中語(yǔ)音信號(hào)處理裝置收集用戶發(fā)出的語(yǔ)音指令的步驟是語(yǔ)音信號(hào)處理裝置通過(guò)語(yǔ)音信號(hào)采集裝置來(lái)收集用戶的語(yǔ)音指令的。
作為所述方法的一種改進(jìn),所述的語(yǔ)音信號(hào)采集裝置是話筒或者麥克風(fēng)。
作為所述方法的一種改進(jìn),所述的語(yǔ)音信號(hào)處理裝置收集用戶發(fā)出的語(yǔ)音指令的步驟是經(jīng)由機(jī)頂盒接收用戶語(yǔ)音指令輸入完成的。
作為所述方法的一種改進(jìn),所述步驟A中,當(dāng)機(jī)頂盒接收到聲波采集設(shè)備發(fā)送過(guò)來(lái)的語(yǔ)音信號(hào)后,對(duì)其進(jìn)行分析,消除無(wú)用的干擾信號(hào),提取有效的語(yǔ)音信號(hào)。
作為所述方法的一種改進(jìn),還包括以下步驟機(jī)頂盒對(duì)提取后的聲波信號(hào)進(jìn)行模數(shù)轉(zhuǎn)換,得到過(guò)濾后的聲波數(shù)字信號(hào),并進(jìn)行信號(hào)放大。
作為所述方法的一種改進(jìn),在機(jī)頂盒的業(yè)務(wù)服務(wù)器端還包括語(yǔ)音識(shí)別模塊,用來(lái)接收和識(shí)別客戶端傳送過(guò)來(lái)的語(yǔ)音信號(hào)。
作為所述方法的一種改進(jìn),步驟A還包括機(jī)頂盒將轉(zhuǎn)換后的語(yǔ)音數(shù)字信號(hào)以報(bào)文的形式,通過(guò)網(wǎng)絡(luò)傳輸上傳到服務(wù)器端。
作為所述方法的一種改進(jìn),步驟A還包括服務(wù)器端的語(yǔ)音識(shí)別模塊分析接收到的語(yǔ)音數(shù)字信號(hào),通過(guò)與語(yǔ)音信息庫(kù)中的語(yǔ)音信號(hào)進(jìn)行匹配,將其轉(zhuǎn)換成相應(yīng)的機(jī)頂盒能夠直接執(zhí)行的用戶操作指令。
作為所述方法的一種改進(jìn),步驟B完成后還包括機(jī)頂盒在接收到服務(wù)器的操作指令后,分析是否為合法的操作,若該操作不合法,機(jī)頂盒STB不執(zhí)行該指令,并在電視屏幕上進(jìn)行語(yǔ)音操作失敗的提示。
本發(fā)明技術(shù)方案使用戶在進(jìn)行業(yè)務(wù)選擇時(shí),只須向機(jī)頂盒STB發(fā)出語(yǔ)音命令,從而有效減少用戶操縱STB的復(fù)雜性。另外,對(duì)機(jī)頂盒STB業(yè)務(wù)實(shí)現(xiàn)語(yǔ)音控制,可增加機(jī)頂盒STB的賣點(diǎn)。
由于語(yǔ)音識(shí)別器配備在服務(wù)器端,在客戶端硬件僅增加了一個(gè)聲音接收器與聲波采集設(shè)備,信號(hào)的處理均可通過(guò)軟件來(lái)實(shí)現(xiàn),機(jī)頂盒STB的成本并不會(huì)大幅度增加。
圖1為現(xiàn)有技術(shù)的一個(gè)設(shè)備中有多套交換節(jié)點(diǎn)和多套總線示意圖。
圖2為本發(fā)明可靈活配置容量的合一總線結(jié)構(gòu)示意圖。
圖3是本發(fā)明可靈活配置容量的合一總線的配置示意圖。
具體實(shí)施例方式
本發(fā)明采用語(yǔ)音識(shí)別技術(shù)和IPTV技術(shù)相結(jié)合,來(lái)簡(jiǎn)化用戶操縱STB的方式。
請(qǐng)參閱圖1,是本發(fā)明的基于語(yǔ)音的人機(jī)通訊系統(tǒng)的組織圖。
數(shù)字機(jī)頂盒通常包括四大子系統(tǒng),即控制子系統(tǒng)、信號(hào)處理子系統(tǒng)、網(wǎng)絡(luò)接口子系統(tǒng)、用戶擴(kuò)展接口子系統(tǒng)。
控制子系統(tǒng)控制系統(tǒng)或系統(tǒng)微處理器是數(shù)字機(jī)頂盒的核心,它由CPU、ROM、RAM組成。微處理器通過(guò)總線把各部分和諧地組織起來(lái),除負(fù)責(zé)各子系統(tǒng)的初始化之外,還必須控制各部分的協(xié)調(diào)工作,共同實(shí)現(xiàn)數(shù)字機(jī)頂盒的整體功能。
信號(hào)處理子系統(tǒng)由單片或多片專用芯片組成。其中,數(shù)字調(diào)諧器接收來(lái)自天線、地面或有線電視網(wǎng)來(lái)的數(shù)字信號(hào),并且從控制系統(tǒng)接收指令,通告有關(guān)傳輸層的類型、帶寬、解調(diào)方式和解碼信息。然后進(jìn)行信道解調(diào),解調(diào)后的視頻數(shù)據(jù)流和音頻數(shù)據(jù)流送至MPEG-2解碼器和MPEG-4解碼器。
網(wǎng)絡(luò)接口子系統(tǒng)用來(lái)實(shí)現(xiàn)與視頻服務(wù)器的全雙工通信,針對(duì)不同的接入網(wǎng),采用相應(yīng)的接口。
用戶接口及擴(kuò)展接口子系統(tǒng)與紅外遙控器、面板、游戲控制器等外設(shè)進(jìn)行通信,另外,隨著付費(fèi)電視的逐漸實(shí)行,解密卡和智能卡將成為數(shù)字機(jī)頂盒中必不可少的部分。
事實(shí)上,一個(gè)完整的數(shù)字機(jī)頂盒由硬件平臺(tái)和軟件系統(tǒng)組成。底層軟件提供操作系統(tǒng)內(nèi)核以及各種硬件驅(qū)動(dòng)程序;中間件將應(yīng)用軟件與依賴于硬件平臺(tái)的底層軟件分隔開(kāi),使應(yīng)用不依賴于具體的硬件平臺(tái);應(yīng)用軟件包括本機(jī)存儲(chǔ)的應(yīng)用和可下載的應(yīng)用程序,通過(guò)應(yīng)用程序來(lái)實(shí)現(xiàn)機(jī)頂盒的各種功能。
本發(fā)明的基于語(yǔ)音的人機(jī)通訊系統(tǒng)包括機(jī)頂盒STB和與該機(jī)頂盒配套的傳統(tǒng)式遙控器。其中本發(fā)明的機(jī)頂盒如圖2所示。
該機(jī)頂盒還包括一個(gè)用來(lái)輸入用戶的聲音信號(hào)的聲波采集設(shè)備和一個(gè)用來(lái)接收用戶輸入的語(yǔ)音信號(hào)的聲音接收器。與STB配套的傳統(tǒng)式遙控器包括一個(gè)用來(lái)控制語(yǔ)音功能的開(kāi)與關(guān)的“語(yǔ)音鎖”按鍵(圖未示)。所述的聲波采集設(shè)備可以采用話筒或者麥克風(fēng)來(lái)實(shí)現(xiàn)。該“語(yǔ)音鎖”按鍵可以通過(guò)遙控器內(nèi)部的編碼或者硬件實(shí)現(xiàn)。
當(dāng)“語(yǔ)音鎖”被關(guān)閉時(shí),禁止開(kāi)啟機(jī)頂盒STB的語(yǔ)音識(shí)別功能;而當(dāng)“語(yǔ)音鎖”被開(kāi)啟時(shí),傳統(tǒng)的遙控器輸入與語(yǔ)音輸入功能同時(shí)啟動(dòng),聲波采集設(shè)備就作為用戶輸入語(yǔ)音命令的媒介。
請(qǐng)參閱圖3,是本發(fā)明的機(jī)頂盒STB語(yǔ)音操作實(shí)現(xiàn)流程圖。本發(fā)明的系統(tǒng)的實(shí)現(xiàn)方法主要包括當(dāng)機(jī)頂盒STB接收到聲波采集設(shè)備發(fā)送過(guò)來(lái)的語(yǔ)音信號(hào)后,對(duì)其進(jìn)行分析,消除無(wú)用的干擾信號(hào),提取有效的聲波信號(hào);然后,機(jī)頂盒STB對(duì)提取后的聲波信號(hào)進(jìn)行模數(shù)轉(zhuǎn)換,得到過(guò)濾后的聲波數(shù)字信號(hào),并進(jìn)行信號(hào)放大,為下一步的信號(hào)傳輸做準(zhǔn)備;在機(jī)頂盒STB的業(yè)務(wù)服務(wù)器端配備一個(gè)語(yǔ)音識(shí)別模塊,用來(lái)接收和識(shí)別客戶端傳送過(guò)來(lái)的語(yǔ)音信號(hào);機(jī)頂盒STB將轉(zhuǎn)換后的語(yǔ)音數(shù)字信號(hào)以報(bào)文的形式,通過(guò)網(wǎng)絡(luò)傳輸上傳到與配備有語(yǔ)音識(shí)別模塊的服務(wù)器端;服務(wù)器端的語(yǔ)音識(shí)別模塊分析接收到的語(yǔ)音數(shù)字信號(hào),通過(guò)與語(yǔ)音信息庫(kù)中的語(yǔ)音信號(hào)進(jìn)行匹配,將其轉(zhuǎn)換成相應(yīng)的機(jī)頂盒STB能夠直接執(zhí)行的用戶操作指令;語(yǔ)音識(shí)別模塊中的控制器將用戶操作指令以報(bào)文的形式,通過(guò)網(wǎng)絡(luò)傳輸下發(fā)到語(yǔ)音請(qǐng)求的機(jī)頂盒STB終端;機(jī)頂盒STB在接收到服務(wù)器的操作指令后,分析是否為合法的操作,若該操作不合法,機(jī)頂盒STB不執(zhí)行該指令,并在電視屏幕上進(jìn)行語(yǔ)音操作失敗的提示;對(duì)于合法的操作,機(jī)頂盒STB根據(jù)指令,執(zhí)行正常的機(jī)頂盒STB業(yè)務(wù)流程,實(shí)現(xiàn)用戶的操作。
作為對(duì)上述實(shí)施方式的一種替換,在機(jī)頂盒STB內(nèi)部也可以不配備聲音接收器,遙控器上的“語(yǔ)音鎖”按鍵也可不必增設(shè),而是在機(jī)頂盒STB的配件中增加一個(gè)聲波處理裝置,該聲波處理裝置既可以接收聲波信號(hào),也可以處理聲波信號(hào)。用戶在輸入語(yǔ)音信號(hào)的途徑相應(yīng)地改為直接對(duì)聲波處理裝置發(fā)出語(yǔ)音命令,當(dāng)聲波處理裝置接收到聲波信號(hào)時(shí),對(duì)其進(jìn)行干擾處理、模數(shù)轉(zhuǎn)換,再通過(guò)機(jī)頂盒將最終的數(shù)字信號(hào)上傳上服務(wù)器,由服務(wù)器進(jìn)行分析處理。
作為對(duì)上述實(shí)施方式的另一種替換,在機(jī)頂盒內(nèi)部不配備聲音接收器,而是在遙控器上配備聲音接收器。此時(shí)可以通過(guò)遙控器上的“語(yǔ)音鎖”鍵來(lái)控制語(yǔ)音功能的開(kāi)和關(guān)。
作為對(duì)上述實(shí)施方式的又一種替換,在機(jī)頂盒收到語(yǔ)音信號(hào)時(shí),客戶端不對(duì)信號(hào)對(duì)任何處理,直接將聲波信號(hào)傳送到服務(wù)器,而是將消除聲音干擾以及信號(hào)轉(zhuǎn)換、語(yǔ)音識(shí)別的所有工作交由服務(wù)器來(lái)處理。
作為對(duì)上述實(shí)施方式的又一種替換,在遠(yuǎn)端為機(jī)頂盒設(shè)置一個(gè)僅提供語(yǔ)音識(shí)別、下發(fā)語(yǔ)音指令的專用服務(wù)器,使之與機(jī)頂盒業(yè)務(wù)服務(wù)器相獨(dú)立。
本發(fā)明技術(shù)方案使用戶在進(jìn)行業(yè)務(wù)選擇時(shí),只須向機(jī)頂盒STB發(fā)出語(yǔ)音命令,從而有效減少用戶操縱STB的復(fù)雜性。另外,對(duì)機(jī)頂盒STB業(yè)務(wù)實(shí)現(xiàn)語(yǔ)音控制,可增加機(jī)頂盒STB的賣點(diǎn)。
由于語(yǔ)音識(shí)別器配備在服務(wù)器端,在客戶端硬件僅增加了一個(gè)聲音接收器與聲波采集設(shè)備,信號(hào)的處理均可通過(guò)軟件來(lái)實(shí)現(xiàn),機(jī)頂盒STB的成本并不會(huì)大幅度增加。
以上所述,僅為本發(fā)明較佳的具體實(shí)施方式
,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
1.一種基于語(yǔ)音的人機(jī)通訊系統(tǒng),包括機(jī)頂盒、業(yè)務(wù)服務(wù)器和遙控裝置,其特征在于,該機(jī)頂盒還包括語(yǔ)音信號(hào)處理裝置,用來(lái)采集和處理用戶發(fā)出的語(yǔ)音信號(hào);該業(yè)務(wù)服務(wù)器端還包括語(yǔ)音識(shí)別裝置,用來(lái)接收和識(shí)別客戶端傳送過(guò)來(lái)的語(yǔ)音信號(hào);機(jī)頂盒將遙控裝置發(fā)出的語(yǔ)音指令處理后發(fā)送給業(yè)務(wù)服務(wù)器端的語(yǔ)音識(shí)別裝置,語(yǔ)音識(shí)別裝置根據(jù)機(jī)頂盒發(fā)出的語(yǔ)音信號(hào)請(qǐng)求,下發(fā)操作指令給發(fā)起請(qǐng)求的機(jī)頂盒,機(jī)頂盒在接收到服務(wù)器的操作指令后,分析是否為合法的操作,若該操作不合法,機(jī)頂盒不執(zhí)行該指令,并在電視屏幕上進(jìn)行語(yǔ)音操作失敗的提示;對(duì)于合法的操作,機(jī)頂盒根據(jù)指令,執(zhí)行正常的機(jī)頂盒業(yè)務(wù)流程,實(shí)現(xiàn)用戶的操作。
2.根據(jù)權(quán)利要求1所述的基于語(yǔ)音的人機(jī)通訊系統(tǒng),其特征在于,所述語(yǔ)音信號(hào)處理裝置包括語(yǔ)音信號(hào)采集裝置。
3.根據(jù)權(quán)利要求2所述的基于語(yǔ)音的人機(jī)通訊系統(tǒng),其特征在于,所述語(yǔ)音信號(hào)采集裝置是話筒或者麥克風(fēng)。
4.根據(jù)權(quán)利要求2所述的基于語(yǔ)音的人機(jī)通訊系統(tǒng),其特征在于,所述語(yǔ)音信號(hào)處理裝置還包括用來(lái)接收用戶輸入的語(yǔ)音信號(hào)的聲音接收器。
5.根據(jù)權(quán)利要求1所述的基于語(yǔ)音的人機(jī)通訊系統(tǒng),其特征在于,所述遙控裝置包括控制語(yǔ)音輸入信號(hào)開(kāi)關(guān)的開(kāi)關(guān)模塊。
6.根據(jù)權(quán)利要求5所述的基于語(yǔ)音的人機(jī)通訊系統(tǒng),其特征在于,所述開(kāi)關(guān)模塊是通過(guò)遙控裝置內(nèi)部的編碼或者硬件實(shí)現(xiàn)的“語(yǔ)音鎖”按鍵。
7.根據(jù)權(quán)利要求5所述的基于語(yǔ)音的人機(jī)通訊系統(tǒng),其特征在于,所述遙控裝置還包括用來(lái)接收用戶輸入的語(yǔ)音信號(hào)的聲音接收器。
8.一種基于語(yǔ)音的人機(jī)通訊方法,包括A.語(yǔ)音信號(hào)處理裝置收集用戶發(fā)出的語(yǔ)音指令,并將該語(yǔ)音指令發(fā)送給業(yè)務(wù)服務(wù)器;B.業(yè)務(wù)服務(wù)器處理所述語(yǔ)音指令后,下發(fā)操作指令給機(jī)頂盒進(jìn)行相關(guān)操作。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述步驟A中語(yǔ)音信號(hào)處理裝置收集用戶發(fā)出的語(yǔ)音指令的步驟是語(yǔ)音信號(hào)處理裝置通過(guò)語(yǔ)音信號(hào)采集裝置來(lái)收集用戶的語(yǔ)音指令的。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述的語(yǔ)音信號(hào)采集裝置是話筒或者麥克風(fēng)。
11.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述的語(yǔ)音信號(hào)處理裝置收集用戶發(fā)出的語(yǔ)音指令的步驟是經(jīng)由機(jī)頂盒接收用戶語(yǔ)音指令輸入完成的。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述步驟A中,當(dāng)機(jī)頂盒接收到聲波采集設(shè)備發(fā)送過(guò)來(lái)的語(yǔ)音信號(hào)后,對(duì)其進(jìn)行分析,消除無(wú)用的干擾信號(hào),提取有效的語(yǔ)音信號(hào)。
13.根據(jù)權(quán)利要求11所述的方法,其特征在于,還包括以下步驟機(jī)頂盒對(duì)提取后的聲波信號(hào)進(jìn)行模數(shù)轉(zhuǎn)換,得到過(guò)濾后的聲波數(shù)字信號(hào),并進(jìn)行信號(hào)放大。
14.根據(jù)權(quán)利要求11所述的方法,其特征在于,在機(jī)頂盒的業(yè)務(wù)服務(wù)器端還包括語(yǔ)音識(shí)別模塊,用來(lái)接收和識(shí)別客戶端傳送過(guò)來(lái)的語(yǔ)音信號(hào)。
15.根據(jù)權(quán)利要求14所述的方法,其特征在于,步驟A還包括機(jī)頂盒將轉(zhuǎn)換后的語(yǔ)音數(shù)字信號(hào)以報(bào)文的形式,通過(guò)網(wǎng)絡(luò)傳輸上傳到服務(wù)器端。
16.根據(jù)權(quán)利要求14所述的方法,其特征在于,步驟A還包括服務(wù)器端的語(yǔ)音識(shí)別模塊分析接收到的語(yǔ)音數(shù)字信號(hào),通過(guò)與語(yǔ)音信息庫(kù)中的語(yǔ)音信號(hào)進(jìn)行匹配,將其轉(zhuǎn)換成相應(yīng)的機(jī)頂盒能夠直接執(zhí)行的用戶操作指令。
17.根據(jù)權(quán)利要求8所述的方法,其特征在于,步驟B完成后還包括機(jī)頂盒在接收到服務(wù)器的操作指令后,分析是否為合法的操作,若該操作不合法,機(jī)頂盒STB不執(zhí)行該指令,并在電視屏幕上進(jìn)行語(yǔ)音操作失敗的提示。
全文摘要
本發(fā)明公開(kāi)一種基于語(yǔ)音的人機(jī)通訊系統(tǒng)和方法。該系統(tǒng)包括機(jī)頂盒、業(yè)務(wù)服務(wù)器和遙控裝置,該機(jī)頂盒還包括語(yǔ)音信號(hào)處理裝置,用來(lái)采集和處理用戶發(fā)出的語(yǔ)音信號(hào);該業(yè)務(wù)服務(wù)器端還包括語(yǔ)音識(shí)別裝置,用來(lái)接收和識(shí)別客戶端傳送過(guò)來(lái)的語(yǔ)音信號(hào);機(jī)頂盒將遙控裝置發(fā)出的語(yǔ)音指令處理后發(fā)送給業(yè)務(wù)服務(wù)器端的語(yǔ)音識(shí)別裝置,語(yǔ)音識(shí)別裝置根據(jù)機(jī)頂盒發(fā)出的語(yǔ)音信號(hào)請(qǐng)求,下發(fā)操作指令給發(fā)起請(qǐng)求的機(jī)頂盒,機(jī)頂盒在接收到服務(wù)器的操作指令后,分析是否為合法的操作,若該操作不合法,機(jī)頂盒不執(zhí)行該指令,并在電視屏幕上進(jìn)行語(yǔ)音操作失敗的提示;對(duì)于合法的操作,機(jī)頂盒根據(jù)指令,執(zhí)行正常的機(jī)頂盒業(yè)務(wù)流程,實(shí)現(xiàn)用戶的操作。
文檔編號(hào)H04N5/00GK1949756SQ20061006249
公開(kāi)日2007年4月18日 申請(qǐng)日期2006年9月6日 優(yōu)先權(quán)日2006年9月6日
發(fā)明者陳瀟瀟, 馬劍飛 申請(qǐng)人:華為技術(shù)有限公司