一種智能電視的數(shù)字音頻處理的系統(tǒng)及方法
【專利摘要】本發(fā)明公開(kāi)了一種智能電視的數(shù)字音頻處理的系統(tǒng),包括:聲音傳感器、揚(yáng)聲器、A/D轉(zhuǎn)換器、感知模型、比特分配器、MPEG編碼器、各種音頻解碼器和控制電路組成。實(shí)施本發(fā)明,使數(shù)字電視具有錄音、存儲(chǔ)音頻、傳輸音頻和播放音頻的功能。
【專利說(shuō)明】一種智能電視的數(shù)字音頻處理的系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)字電視【技術(shù)領(lǐng)域】,具體涉及一種智能電視的數(shù)字音頻處理的系統(tǒng)及方法。
【背景技術(shù)】
[0002]隨著信息通信技術(shù)的飛速發(fā)展,數(shù)字電視正在逐步成為信息交互和信息服務(wù)的重要終端。數(shù)字音頻設(shè)備是數(shù)字電視的重要組成部分,目前市場(chǎng)上數(shù)字電視音頻設(shè)備的功能只是簡(jiǎn)單地將接收到的數(shù)字音頻轉(zhuǎn)化為模擬信號(hào)并播放,在電視終端的顧客若需要交互式地進(jìn)行信息傳輸,一般做法是通過(guò)輸入文字信息或選擇給定的功能選項(xiàng),這種單一的信息交互方式使數(shù)字電視不能在信息化網(wǎng)絡(luò)中發(fā)揮更大的作用。智能數(shù)字電視音頻設(shè)備不僅可以處理來(lái)自網(wǎng)絡(luò)的數(shù)字音頻信號(hào),還可以處理電視終端輸入的模擬信號(hào),將接收到的模擬信號(hào)轉(zhuǎn)化為數(shù)字信號(hào),然后傳輸給相應(yīng)的接收設(shè)備或者緩存。同時(shí)數(shù)字化的語(yǔ)音設(shè)備使數(shù)字電視具備了語(yǔ)音傳送的功能,為以后實(shí)現(xiàn)智能電視的語(yǔ)音識(shí)別、IP電話、網(wǎng)絡(luò)會(huì)議等功能提供了硬件基礎(chǔ),將極大的提高數(shù)字電視的互動(dòng)性和智能化。
[0003]一般數(shù)字音頻設(shè)備系統(tǒng)包括音頻傳感器、A/D轉(zhuǎn)換器(模數(shù)轉(zhuǎn)換器)、編碼器、解碼器等基本部件。音頻傳感器將自然界的聲音轉(zhuǎn)化為模擬電信號(hào)傳給A/D轉(zhuǎn)換器,電信號(hào)經(jīng)過(guò)A/D轉(zhuǎn)換器中的低通濾波器刪除高頻率的雜音,然后由抽樣器對(duì)信號(hào)進(jìn)行抽樣,再傳給量化器進(jìn)行量化,這樣經(jīng)過(guò)A/D轉(zhuǎn)換器以后,原來(lái)的自然聲音就轉(zhuǎn)化為二進(jìn)制的數(shù)字信息。但是在實(shí)際應(yīng)用中需要將二進(jìn)制音頻信息按照音頻標(biāo)準(zhǔn)協(xié)議進(jìn)行編碼,這種功能由編碼器來(lái)完成,雖然通用的音頻編碼標(biāo)準(zhǔn)較多,但是由于音頻解碼器具有多種標(biāo)準(zhǔn)解碼的功能,因此可以只使用一種編碼器和多種解碼器。本系統(tǒng)選用MPEG音頻編碼器將信息編碼為符合MPEG-2標(biāo)準(zhǔn)的音頻信息。音頻信息的解碼是上面編碼過(guò)程的反向執(zhí)行。除此之外,以上過(guò)程要有相應(yīng)的緩沖器和復(fù)用器等一系列相關(guān)部件的支持。
[0004]一般的數(shù)字電視音頻設(shè)備只具有單向的解碼功能,其主要過(guò)程是接收各種標(biāo)準(zhǔn)的音頻流,然后通過(guò)的音頻解碼器將音頻流轉(zhuǎn)化為二進(jìn)制流,再通過(guò)數(shù)模轉(zhuǎn)換器轉(zhuǎn)化為電信號(hào),最后由音頻播放器進(jìn)行播放。為了解碼不同標(biāo)準(zhǔn)的音頻需要不同的解碼器以及相應(yīng)的軟件,還需要一定的緩存機(jī)制來(lái)協(xié)調(diào)各部件的速度差異。為了實(shí)現(xiàn)雙向的通話機(jī)制,一般需要添加其他的可安插設(shè)備。
[0005]現(xiàn)有的數(shù)字電視音頻設(shè)備一般不具有聲音的雙向傳輸功能,只能進(jìn)行音頻流的解碼功能,在需要聲音傳輸時(shí)需要添加一系列的設(shè)備;或者雖然具有編碼的功能但是無(wú)法進(jìn)行傳輸,也即不能進(jìn)行IP電話等功能。在用數(shù)字電視進(jìn)行上網(wǎng)時(shí),一般采用遙控輸入的方式;觸屏式電視機(jī)雖然解決了遙控問(wèn)題,但是人們需要靠近電視機(jī),極為不便。語(yǔ)音識(shí)別系統(tǒng)應(yīng)該是一種較好的輸入方式,但是目前多數(shù)硬件設(shè)備不支持這項(xiàng)功能。為了解決這一系列的缺點(diǎn)首先需要較為完善的音頻硬件系統(tǒng)和相應(yīng)的軟件支持。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的是為智能數(shù)字電視提供一種數(shù)字音頻雙向處理系統(tǒng),使數(shù)字電視具有錄音、存儲(chǔ)音頻、傳輸音頻和播放音頻的功能。
[0007]本發(fā)明實(shí)施例提供了一種智能電視的數(shù)字音頻處理的系統(tǒng),包括:
[0008]聲音傳感器、揚(yáng)聲器、A/D轉(zhuǎn)換器、感知模型、比特分配器、MPEG編碼器、各種音頻解碼器和控制電路組成,其中:
[0009]聲音傳感器用于負(fù)責(zé)數(shù)字電視終端用戶的聲音采集,生成聲音模擬信號(hào),傳遞給A/D轉(zhuǎn)換器;
[0010]揚(yáng)聲器用于播放聲音;
[0011]A/D轉(zhuǎn)換器用于將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào);
[0012]感知模型用于確保量化噪音低于聽(tīng)得見(jiàn)的閾值;
[0013]比特分配器用于估算屏蔽閾值并以音頻信號(hào)頻譜能量和心理學(xué)模型為依據(jù)來(lái)分配比特;
[0014]MPEG編碼器用于將音頻信號(hào)壓縮成符合MPEG標(biāo)準(zhǔn)的音頻信息;
[0015]MEPG解碼器用于將壓縮的音頻解壓成編碼流,以便D/A轉(zhuǎn)換器將數(shù)字信號(hào)轉(zhuǎn)換為模擬信號(hào)。
[0016]所述A/D轉(zhuǎn)換器用于進(jìn)行信號(hào)抽樣、對(duì)每個(gè)樣本進(jìn)行量化,得出的信號(hào)是未經(jīng)編碼的數(shù)字信號(hào)。
[0017]相應(yīng)的,本發(fā)明實(shí)施例還提供了一種智能電視的數(shù)字音頻處理的方法,所述方法包括:
[0018]步驟一、數(shù)字電視終端客戶發(fā)出自然聲音,音頻傳感器接收并將其轉(zhuǎn)化為模擬信號(hào);
[0019]步驟二、數(shù)模轉(zhuǎn)換器將模擬信號(hào)轉(zhuǎn)化為數(shù)字信號(hào);
[0020]步驟三、音頻編碼器在各種控制信息下將數(shù)字音頻信號(hào)編碼成為符合一定標(biāo)準(zhǔn)的音頻信息,然后判斷是否將音頻信息傳送到存儲(chǔ)設(shè)備或者數(shù)字接口,如果是就轉(zhuǎn)入步驟六,否者判斷是否轉(zhuǎn)到復(fù)用器,如果是轉(zhuǎn)到步驟四,否則就拋棄;
[0021]步驟四、多路復(fù)用器將接收到的壓縮音頻信息進(jìn)行發(fā)送,有緩沖器保存待發(fā)信息;
[0022]步驟五、緩沖器將接收到的信息發(fā)給多路分解器分解出編碼流;
[0023]步驟六、數(shù)字接口判斷有無(wú)數(shù)字設(shè)備請(qǐng)求音頻信息,有就接收音頻并傳送給數(shù)字設(shè)備,否者不處理數(shù)據(jù)流;
[0024]步驟七、解碼器接收到編碼流,將其解壓,還原音頻信號(hào);
[0025]步驟八、D/A轉(zhuǎn)換器接收到數(shù)字音頻信號(hào),并將其轉(zhuǎn)化為模擬信號(hào),傳到相應(yīng)的揚(yáng)聲設(shè)備或接口。
[0026]本發(fā)明具有如下有益效果,本發(fā)明的目的是為智能數(shù)字電視提供一種數(shù)字音頻處理系統(tǒng)及方法,是電視終端不僅可以接收播放音頻,還可以錄制發(fā)布音頻,提高了智能電視的互動(dòng)性。為基于智能數(shù)字音頻設(shè)備的服務(wù)提供了硬件基礎(chǔ)。
【專利附圖】
【附圖說(shuō)明】
[0027]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其它的附圖。
[0028]圖1是本發(fā)明實(shí)施例中的智能電視的數(shù)字音頻處理的系統(tǒng)結(jié)構(gòu)示意圖;
[0029]圖2是本發(fā)明實(shí)施例中的基于智能電視的數(shù)字音頻處理的系統(tǒng)中的方法流程示意圖;
[0030]圖3是本發(fā)明實(shí)施例中的基于智能電視的數(shù)字音頻處理的系統(tǒng)中的方法另一流程不意圖;
[0031]圖4是本發(fā)明實(shí)施例中的數(shù)字音頻設(shè)備的編碼器和解碼器的結(jié)構(gòu)示意圖;
[0032]圖5是本發(fā)明實(shí)施例中的數(shù)字音頻設(shè)備的編解碼流程圖。
【具體實(shí)施方式】
[0033]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0034]本發(fā)明的目的是為智能數(shù)字電視提供一種數(shù)字音頻雙向處理系統(tǒng),使數(shù)字電視具有錄音、存儲(chǔ)音頻、傳輸音頻和播放音頻的功能。
[0035]本發(fā)明提供了一種數(shù)字音頻雙向處理系統(tǒng),與以往單向音頻設(shè)備系統(tǒng)不同的是,該系統(tǒng)可以將數(shù)字電視終端用戶的語(yǔ)音信息轉(zhuǎn)化為數(shù)字音頻信息,并編碼為符合一定標(biāo)準(zhǔn)的音頻流或者文件進(jìn)行傳輸。該系統(tǒng)的基本構(gòu)造如圖1所示,該系統(tǒng)是音頻編碼器和解碼器通過(guò)控制電路合理地組合在一起的功能器件,在其中考慮到時(shí)鐘同步、傳輸控制、多編碼標(biāo)準(zhǔn)、多傳感器、多播放器等一系列問(wèn)題。音頻傳感器和音頻播放器可以并聯(lián)多個(gè),實(shí)現(xiàn)多個(gè)接口傳輸。解碼器需要具有對(duì)多種音頻標(biāo)準(zhǔn)解碼的功能,由此解碼器由解碼器組和判斷電路組成。但是對(duì)音頻的編碼一般只要實(shí)現(xiàn)一種編碼標(biāo)準(zhǔn)即可,所以編碼器可以選用一些通用的音頻標(biāo)準(zhǔn)編碼器中的任意一種。
[0036]通過(guò)這種組合的數(shù)字音頻處理系統(tǒng),能夠?qū)W(wǎng)絡(luò)或者本地存儲(chǔ)的音頻文件進(jìn)行有效的處理,同時(shí)在數(shù)字電視終端實(shí)現(xiàn)錄音功能并保存或者發(fā)送數(shù)字音頻。這種數(shù)字音頻設(shè)備在進(jìn)行處理聲音時(shí)的流程如圖2所示,使用數(shù)字電視時(shí)的網(wǎng)絡(luò)傳輸示意圖如圖3所示。
[0037]下面結(jié)合圖2和圖3對(duì)該設(shè)備的組成進(jìn)行說(shuō)明:本設(shè)備主要由聲音傳感器、揚(yáng)聲器、A/D轉(zhuǎn)換器、感知模型、比特分配器、MPEG編碼器、各種音頻解碼器和控制電路組成。各部分的功能如下:
[0038]聲音傳感器主要負(fù)責(zé)數(shù)字電視終端用戶的聲音采集,生成聲音模擬信號(hào),傳遞給A/D轉(zhuǎn)換器。揚(yáng)聲器用來(lái)播放聲音。
[0039]A/D轉(zhuǎn)換器將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),主要步驟是進(jìn)行信號(hào)抽樣、對(duì)每個(gè)樣本進(jìn)行量化,得出的信號(hào)是未經(jīng)編碼的數(shù)字信號(hào)
[0040]感知模型主要功能是確保量化噪音低于聽(tīng)得見(jiàn)的閾值。比特分配器用于估算屏蔽閾值并以音頻信號(hào)頻譜能量和心理學(xué)模型為依據(jù)來(lái)分配比特。
[0041]MPEG編碼器的功能是將音頻信號(hào)壓縮成符合MPEG標(biāo)準(zhǔn)的音頻信息。MEPG解碼器和其他相關(guān)解碼器將壓縮的音頻解壓成編碼流,以便D/A轉(zhuǎn)換器將數(shù)字信號(hào)轉(zhuǎn)換為模擬信號(hào)。
[0042]控制電路用來(lái)控制信號(hào)流向以及時(shí)鐘等數(shù)據(jù)。
[0043]下面結(jié)合圖2和圖3來(lái)說(shuō)明該設(shè)備處理聲音的主要流程:
[0044]第一步:數(shù)字電視終端客戶發(fā)出自然聲音,音頻傳感器接收并將其轉(zhuǎn)化為模擬信號(hào)。
[0045]第二步:數(shù)模轉(zhuǎn)換器將模擬信號(hào)轉(zhuǎn)化為數(shù)字信號(hào)。
[0046]第三步:音頻編碼器在各種控制信息下將數(shù)字音頻信號(hào)編碼成為符合一定標(biāo)準(zhǔn)的音頻信息,然后判斷是否將音頻信息傳送到存儲(chǔ)設(shè)備或者數(shù)字接口,如果是就轉(zhuǎn)入第六步,否者判斷是否轉(zhuǎn)到復(fù)用器,如果是轉(zhuǎn)到第四步,否則就拋棄。
[0047]第四步:多路復(fù)用器將接收到的壓縮音頻信息進(jìn)行發(fā)送,有緩沖器保存待發(fā)信息。
[0048]第五步:緩沖器將接收到的信息發(fā)給多路分解器分解出編碼流。
[0049]第六步:數(shù)字接口判斷有無(wú)數(shù)字設(shè)備請(qǐng)求音頻信息,有就接收音頻并傳送給數(shù)字設(shè)備,否者不處理數(shù)據(jù)流。
[0050]第七步:解碼器接收到編碼流,將其解壓,還原音頻信號(hào)。在此步,若有多個(gè)解碼器,要使用符合標(biāo)準(zhǔn)的解碼器。
[0051]第八步:D/A轉(zhuǎn)換器接收到數(shù)字音頻信號(hào),并將其轉(zhuǎn)化為模擬信號(hào),傳到相應(yīng)的揚(yáng)聲設(shè)備或接口。
[0052]下面圖4和圖5分別給出了該數(shù)字音頻設(shè)備的核心部件編碼器和解碼器的詳細(xì)設(shè)計(jì)圖:該編碼器可以將聲音轉(zhuǎn)化為符合MPEG-2音頻標(biāo)準(zhǔn)的音頻,兼容MPEG-1標(biāo)準(zhǔn),編碼過(guò)程如上文所述。解碼器在此處只給出MPEG—種標(biāo)準(zhǔn)的解碼器設(shè)計(jì)圖,其他的可以參考相關(guān)資料,本處不再一一討論。
[0053]本發(fā)明具有如下有益效果,本發(fā)明的目的是為智能數(shù)字電視提供一種數(shù)字音頻處理系統(tǒng)及方法,是電視終端不僅可以接收播放音頻,還可以錄制發(fā)布音頻,提高了智能電視的互動(dòng)性。為基于智能數(shù)字音頻設(shè)備的服務(wù)提供了硬件基礎(chǔ)。
[0054]本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,該程序可以存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,存儲(chǔ)介質(zhì)可以包括:只讀存儲(chǔ)器(ROM,Read Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,RandomAccess Memory)、磁盤(pán)或光盤(pán)等。
[0055]以上對(duì)本發(fā)明實(shí)施例所提供的一種智能電視的數(shù)字音頻處理的系統(tǒng)及方法進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
【權(quán)利要求】
1.一種智能電視的數(shù)字音頻處理的系統(tǒng),其特征在于,包括: 聲音傳感器、揚(yáng)聲器、A/D轉(zhuǎn)換器、感知模型、比特分配器、MPEG編碼器、各種音頻解碼器和控制電路組成,其中: 聲音傳感器用于負(fù)責(zé)數(shù)字電視終端用戶的聲音采集,生成聲音模擬信號(hào),傳遞給A/D轉(zhuǎn)換器; 揚(yáng)聲器用于播放聲音; A/D轉(zhuǎn)換器用于將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào); 感知模型用于確保量化噪音低于聽(tīng)得見(jiàn)的閾值; 比特分配器用于估算屏蔽閾值并以音頻信號(hào)頻譜能量和心理學(xué)模型為依據(jù)來(lái)分配比特; MPEG編碼器用于將音頻信號(hào)壓縮成符合MPEG標(biāo)準(zhǔn)的音頻信息; MEPG解碼器用于將壓縮的音頻解壓成編碼流,以便D/A轉(zhuǎn)換器將數(shù)字信號(hào)轉(zhuǎn)換為模擬信號(hào)。
2.如權(quán)利要去I所述的智能電視的數(shù)字音頻處理的系統(tǒng),其特征在于,所述A/D轉(zhuǎn)換器用于進(jìn)行信號(hào)抽樣、對(duì)每個(gè)樣本進(jìn)行量化,得出的信號(hào)是未經(jīng)編碼的數(shù)字信號(hào)。
3.一種智能電視的數(shù)字音頻處理的方法,其特征在于,所述方法包括: 步驟一、數(shù)字電視終端客戶發(fā)出自然聲音,音頻傳感器接收并將其轉(zhuǎn)化為模擬信號(hào); 步驟二、數(shù)模轉(zhuǎn)換器將模擬信號(hào)轉(zhuǎn)化為數(shù)字信號(hào); 步驟三、音頻編碼器在各種控制信息下將數(shù)字音頻信號(hào)編碼成為符合一定標(biāo)準(zhǔn)的音頻信息,然后判斷是否將音頻信息傳送到存儲(chǔ)設(shè)備或者數(shù)字接口,如果是就轉(zhuǎn)入步驟六,否者判斷是否轉(zhuǎn)到復(fù)用器,如果是轉(zhuǎn)到步驟四,否則就拋棄; 步驟四、多路復(fù)用器將接收到的壓縮音頻信息進(jìn)行發(fā)送,有緩沖器保存待發(fā)信息; 步驟五、緩沖器將接收到的信息發(fā)給多路分解器分解出編碼流; 步驟六、數(shù)字接口判斷有無(wú)數(shù)字設(shè)備請(qǐng)求音頻信息,有就接收音頻并傳送給數(shù)字設(shè)備,否者不處理數(shù)據(jù)流; 步驟七、解碼器接收到編碼流,將其解壓,還原音頻信號(hào); 步驟八、D/A轉(zhuǎn)換器接收到數(shù)字音頻信號(hào),并將其轉(zhuǎn)化為模擬信號(hào),傳到相應(yīng)的揚(yáng)聲設(shè)備或接口。
【文檔編號(hào)】G10L19/008GK103491428SQ201310391397
【公開(kāi)日】2014年1月1日 申請(qǐng)日期:2013年8月31日 優(yōu)先權(quán)日:2013年8月31日
【發(fā)明者】劉海亮, 劉振, 林格 申請(qǐng)人:中山大學(xué)