本發(fā)明涉及音頻傳輸,具體是一種低延時網(wǎng)絡(luò)音頻傳輸方法及系統(tǒng)。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)音頻應(yīng)用日益廣泛,如在線語音通話、網(wǎng)絡(luò)直播、遠(yuǎn)程會議等。然而,在音頻傳輸過程中面臨諸多挑戰(zhàn)。
2、在實(shí)時性要求較高的場景下,如在線游戲語音交流、遠(yuǎn)程實(shí)時指揮等,傳統(tǒng)音頻傳輸方法往往存在較大延時;網(wǎng)絡(luò)環(huán)境復(fù)雜多變,在音頻數(shù)據(jù)傳輸過程中,數(shù)據(jù)包可能會因?yàn)榫W(wǎng)絡(luò)波動、信號干擾等原因出現(xiàn)丟失或損壞的情況;一旦發(fā)生這種情況,接收端恢復(fù)出的音頻信號就會出現(xiàn)雜音、卡頓甚至完全無法播放等問題,嚴(yán)重影響音頻質(zhì)量。
3、目前已有的一些音頻傳輸技術(shù)在降低延時和保證音頻質(zhì)量方面做出了嘗試,但效果有限。部分技術(shù)通過優(yōu)化網(wǎng)絡(luò)傳輸協(xié)議來減少延時,但無法從根本上解決音頻編碼和解碼過程中的時間消耗問題;在應(yīng)對音頻數(shù)據(jù)丟失或損壞方面,一些簡單的校驗(yàn)方法準(zhǔn)確性較低,無法有效檢測出輕微的數(shù)據(jù)變化,導(dǎo)致恢復(fù)出的音頻仍然存在質(zhì)量問題。
4、因此,迫切需要一種既能有效降低延時,又能保證音頻質(zhì)量的網(wǎng)絡(luò)音頻傳輸方法及系統(tǒng)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一;為此,本發(fā)明提出了一種低延時網(wǎng)絡(luò)音頻傳輸方法及系統(tǒng)。
2、一種低延時網(wǎng)絡(luò)音頻傳輸方法,包括以下步驟:
3、步驟一、音頻采集
4、采集音頻信號;
5、步驟二、音頻編碼
6、利用opus編碼算法對數(shù)字音頻信號進(jìn)行編碼,并得到數(shù)字音頻信號分割后若干個音頻幀,隨之對于每個音頻幀,提取分析出其對應(yīng)的特征參數(shù),并將若干個音頻幀分別結(jié)合特征參數(shù)捆綁為若干個數(shù)據(jù)包;
7、步驟三、網(wǎng)絡(luò)傳輸
8、將數(shù)據(jù)包進(jìn)行傳輸;
9、步驟四、完整性校驗(yàn)
10、根據(jù)特征參數(shù),對傳輸后的數(shù)據(jù)包進(jìn)行完整性校驗(yàn);
11、步驟五、音頻解碼
12、采用opus解碼算法,將接收到的完整性校驗(yàn)后的所有數(shù)據(jù)包恢復(fù)成音頻信號;
13、步驟六、音頻播放
14、對解碼后的音頻信號進(jìn)行播放;
15、采集過程中,其以固定的采樣頻率對音頻信號進(jìn)行采樣,并將音頻信號轉(zhuǎn)換為數(shù)字音頻信號。
16、作為本發(fā)明的進(jìn)一步方案,其中,音頻幀對應(yīng)的特征參數(shù)包含時域特征、頻域特征和統(tǒng)計(jì)特征;
17、作為本發(fā)明的進(jìn)一步方案,其中,音頻幀是在對音頻信號進(jìn)行數(shù)字化處理和分析時,將連續(xù)的音頻信號劃分成的一段段有特定時長的片段,且每一幀都包含指定數(shù)量的音頻采樣點(diǎn);
18、作為本發(fā)明的進(jìn)一步方案,其中,每個數(shù)據(jù)包包含指定數(shù)量的音頻數(shù)據(jù)和包頭信息,且包頭信息包括數(shù)據(jù)包序號、時間戳和特征參數(shù),且數(shù)據(jù)包序號通過時間戳并按照時間走向進(jìn)行依次標(biāo)記。
19、作為本發(fā)明的進(jìn)一步方案,時域特征的提取分析方式如下:
20、選定一個音頻幀;
21、首先,獲取該音頻幀中各個音頻采樣點(diǎn)的幅度值;
22、接著,計(jì)算出該音頻幀中所有音頻采樣點(diǎn)上幅度值的平均值,并將其記為幅度均值;
23、隨之,結(jié)合幅度均值,計(jì)算出該音頻幀中所有音頻采樣點(diǎn)上幅度值的方差,并將其記為幅度方差。
24、作為本發(fā)明的進(jìn)一步方案,頻域特征的提取分析方式如下:
25、選定一個音頻幀;
26、首先,對該音頻幀進(jìn)行快速傅里葉變換,并得到該音頻幀的頻譜;
27、接著,獲取該音頻幀在多個頻率點(diǎn)的幅度值;
28、隨之,計(jì)算出該音頻幀中多個頻率點(diǎn)上幅度值的平均值,并將其記為頻譜均值;
29、之后,結(jié)合頻譜均值計(jì)算出該音頻幀中多個頻率點(diǎn)上幅度值的方差,并將其記為頻譜方差。
30、作為本發(fā)明的進(jìn)一步方案,統(tǒng)計(jì)特征的提取分析方式如下:
31、選定一個音頻幀;
32、首先,獲取該音頻幀中各個音頻采樣點(diǎn)的幅度值;
33、隨之,在該音頻幀中所有音頻采樣點(diǎn)的幅度值中,選定一個值最大的幅度值,并將其記為峰值幅度。
34、作為本發(fā)明的進(jìn)一步方案,完整性校驗(yàn)方式如下:
35、將接收到的編碼音頻數(shù)據(jù)的特征參數(shù)與發(fā)送端發(fā)送的原始音頻數(shù)據(jù)的特征參數(shù)進(jìn)行比較:
36、如果兩者的特征差異在一定的閾值范圍內(nèi),則認(rèn)為音頻傳輸是完整的;否則,認(rèn)為音頻傳輸出現(xiàn)了丟失或損壞。
37、作為本發(fā)明的進(jìn)一步方案,具體比較方式為:
38、提取時域特征中的幅度均值和幅度方差、頻域特征中的頻譜均值和頻譜方差、統(tǒng)計(jì)特征中的峰值幅度;
39、選定時域特征中的幅度均值;
40、設(shè)定發(fā)送端原始音頻數(shù)據(jù)的幅度均值為m1,接收端編碼音頻數(shù)據(jù)的幅度均值為m2,設(shè)定幅度均值差異閾值為cm;
41、若|m1-m2|≤cm,則判定幅度均值校驗(yàn)通過,反之則表示幅度均值校驗(yàn)不通過;
42、按照幅度均值的比較方式,對時域特征中的幅度方差、頻域特征中的頻譜均值和頻譜方差、統(tǒng)計(jì)特征中的峰值幅度進(jìn)行比較校驗(yàn);
43、在數(shù)據(jù)包中,時域特征中的幅度均值和幅度方差、頻域特征中的頻譜均值和頻譜方差、統(tǒng)計(jì)特征中的峰值幅度均進(jìn)行比較后;
44、若含有至少一項(xiàng)校驗(yàn)結(jié)果不通過,則認(rèn)為音頻傳輸出現(xiàn)了丟失或損壞。
45、作為本發(fā)明的進(jìn)一步方案,完整性校驗(yàn)方式還如下:
46、提取接收到的編碼音頻數(shù)據(jù)的特征參數(shù)與發(fā)送端發(fā)送的原始音頻數(shù)據(jù)的特征參數(shù):
47、隨之將發(fā)送端對應(yīng)音頻幀的幅度均值、幅度方差、頻譜均值、頻譜方差、峰值幅度分別標(biāo)記為m1、v1、fm1、fv1、p1,將接收端對應(yīng)音頻幀的幅度均值、幅度方差、頻譜均值、頻譜方差、峰值幅度分別標(biāo)記為m2、v2、fm2、fv2、p2;
48、隨之通過:
49、計(jì)算出校驗(yàn)值g;
50、隨之將校驗(yàn)值g與預(yù)設(shè)的校驗(yàn)閾值gy進(jìn)行比較:
51、若g>gy,則判定傳輸音頻信號是完整的;
52、若g≤gy,則判定傳輸音頻信號出現(xiàn)了丟失或損壞。
53、一種低延時網(wǎng)絡(luò)音頻傳輸系統(tǒng),該系統(tǒng)用于執(zhí)行一種低延時網(wǎng)絡(luò)音頻傳輸方法,該系統(tǒng)包括:
54、音頻采集模塊:用于采集音頻信號,并將其轉(zhuǎn)換為音頻數(shù)字音頻信號;
55、音頻編碼模塊:用于對采集到的音頻數(shù)字音頻信號進(jìn)行編碼;
56、網(wǎng)絡(luò)傳輸模塊:用于將編碼后的音頻數(shù)據(jù)通過網(wǎng)絡(luò)傳輸?shù)浇邮斩耍?/p>
57、音頻解碼模塊:用于對接收的編碼音頻數(shù)據(jù)進(jìn)行解碼,恢復(fù)為原始的音頻數(shù)字音頻信號;
58、音頻播放模塊:用于將解碼后的音頻數(shù)字音頻信號轉(zhuǎn)換為模擬信號,并播放出來。
59、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
60、低延時方面:通過將音頻信號快速采集并轉(zhuǎn)換為數(shù)字信號后,立即進(jìn)行opus編碼分割成音頻幀并結(jié)合特征參數(shù)捆綁成數(shù)據(jù)包傳輸,減少了信號處理的等待時間,同時在接收端能迅速根據(jù)特征參數(shù)進(jìn)行完整性校驗(yàn)和解碼播放,極大地降低了音頻傳輸過程中的延時,使得音頻傳輸更加實(shí)時,適用于對實(shí)時性要求高的場景,如在線會議、實(shí)時語音通訊等。
61、數(shù)據(jù)準(zhǔn)確性方面:利用音頻幀的時域特征、頻域特征和統(tǒng)計(jì)特征進(jìn)行完整性校驗(yàn),無論是通過將接收端和發(fā)送端的特征參數(shù)直接比較,還是通過計(jì)算校驗(yàn)值與閾值對比的方式,都能精準(zhǔn)地判斷音頻數(shù)據(jù)在傳輸過程中是否完整。一旦出現(xiàn)丟失或損壞能及時發(fā)現(xiàn)并采取措施,有效保障了音頻數(shù)據(jù)的準(zhǔn)確性,讓用戶接收到準(zhǔn)確無誤的音頻信息。
62、系統(tǒng)高效性方面:音頻采集模塊、編碼模塊、傳輸模塊、解碼模塊和播放模塊協(xié)同工作,形成一個完整高效的音頻傳輸系統(tǒng)。各模塊分工明確且相互配合緊密,從音頻的采集源頭到最終播放都有完善的處理流程,使得整個音頻傳輸系統(tǒng)運(yùn)行流暢高效,提高了系統(tǒng)整體的性能和穩(wěn)定性。
63、編碼優(yōu)勢方面:opus編碼算法在對數(shù)字音頻信號進(jìn)行編碼時能夠有效減少數(shù)據(jù)量,降低網(wǎng)絡(luò)傳輸壓力,提高傳輸速度,同時還能保障音頻質(zhì)量。在網(wǎng)絡(luò)帶寬有限的情況下,依然能夠?qū)崿F(xiàn)高質(zhì)量的音頻傳輸,并且能夠適應(yīng)不同網(wǎng)絡(luò)環(huán)境下的音頻傳輸需求。