一種低延時網(wǎng)絡(luò)音頻傳輸方法及系統(tǒng)與流程

文檔序號：40817668發(fā)布日期：2025-01-29 02:36閱讀：9來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本發(fā)明涉及音頻傳輸，具體是一種低延時網(wǎng)絡(luò)音頻傳輸方法及系統(tǒng)。

背景技術(shù)：

1、隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展，網(wǎng)絡(luò)音頻應(yīng)用日益廣泛，如在線語音通話、網(wǎng)絡(luò)直播、遠(yuǎn)程會議等。然而，在音頻傳輸過程中面臨諸多挑戰(zhàn)。

2、在實(shí)時性要求較高的場景下，如在線游戲語音交流、遠(yuǎn)程實(shí)時指揮等，傳統(tǒng)音頻傳輸方法往往存在較大延時；網(wǎng)絡(luò)環(huán)境復(fù)雜多變，在音頻數(shù)據(jù)傳輸過程中，數(shù)據(jù)包可能會因?yàn)榫W(wǎng)絡(luò)波動、信號干擾等原因出現(xiàn)丟失或損壞的情況；一旦發(fā)生這種情況，接收端恢復(fù)出的音頻信號就會出現(xiàn)雜音、卡頓甚至完全無法播放等問題，嚴(yán)重影響音頻質(zhì)量。

3、目前已有的一些音頻傳輸技術(shù)在降低延時和保證音頻質(zhì)量方面做出了嘗試，但效果有限。部分技術(shù)通過優(yōu)化網(wǎng)絡(luò)傳輸協(xié)議來減少延時，但無法從根本上解決音頻編碼和解碼過程中的時間消耗問題；在應(yīng)對音頻數(shù)據(jù)丟失或損壞方面，一些簡單的校驗(yàn)方法準(zhǔn)確性較低，無法有效檢測出輕微的數(shù)據(jù)變化，導(dǎo)致恢復(fù)出的音頻仍然存在質(zhì)量問題。

4、因此，迫切需要一種既能有效降低延時，又能保證音頻質(zhì)量的網(wǎng)絡(luò)音頻傳輸方法及系統(tǒng)。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一；為此，本發(fā)明提出了一種低延時網(wǎng)絡(luò)音頻傳輸方法及系統(tǒng)。

2、一種低延時網(wǎng)絡(luò)音頻傳輸方法，包括以下步驟：

3、步驟一、音頻采集

4、采集音頻信號；

5、步驟二、音頻編碼

6、利用opus編碼算法對數(shù)字音頻信號進(jìn)行編碼，并得到數(shù)字音頻信號分割后若干個音頻幀，隨之對于每個音頻幀，提取分析出其對應(yīng)的特征參數(shù)，并將若干個音頻幀分別結(jié)合特征參數(shù)捆綁為若干個數(shù)據(jù)包；

7、步驟三、網(wǎng)絡(luò)傳輸

8、將數(shù)據(jù)包進(jìn)行傳輸；

9、步驟四、完整性校驗(yàn)

10、根據(jù)特征參數(shù)，對傳輸后的數(shù)據(jù)包進(jìn)行完整性校驗(yàn)；

11、步驟五、音頻解碼

12、采用opus解碼算法，將接收到的完整性校驗(yàn)后的所有數(shù)據(jù)包恢復(fù)成音頻信號；

13、步驟六、音頻播放

14、對解碼后的音頻信號進(jìn)行播放；

15、采集過程中，其以固定的采樣頻率對音頻信號進(jìn)行采樣，并將音頻信號轉(zhuǎn)換為數(shù)字音頻信號。

16、作為本發(fā)明的進(jìn)一步方案，其中，音頻幀對應(yīng)的特征參數(shù)包含時域特征、頻域特征和統(tǒng)計(jì)特征；

17、作為本發(fā)明的進(jìn)一步方案，其中，音頻幀是在對音頻信號進(jìn)行數(shù)字化處理和分析時，將連續(xù)的音頻信號劃分成的一段段有特定時長的片段，且每一幀都包含指定數(shù)量的音頻采樣點(diǎn)；

18、作為本發(fā)明的進(jìn)一步方案，其中，每個數(shù)據(jù)包包含指定數(shù)量的音頻數(shù)據(jù)和包頭信息，且包頭信息包括數(shù)據(jù)包序號、時間戳和特征參數(shù)，且數(shù)據(jù)包序號通過時間戳并按照時間走向進(jìn)行依次標(biāo)記。

19、作為本發(fā)明的進(jìn)一步方案，時域特征的提取分析方式如下：

20、選定一個音頻幀；

21、首先，獲取該音頻幀中各個音頻采樣點(diǎn)的幅度值；

22、接著，計(jì)算出該音頻幀中所有音頻采樣點(diǎn)上幅度值的平均值，并將其記為幅度均值；

23、隨之，結(jié)合幅度均值，計(jì)算出該音頻幀中所有音頻采樣點(diǎn)上幅度值的方差，并將其記為幅度方差。

24、作為本發(fā)明的進(jìn)一步方案，頻域特征的提取分析方式如下：

25、選定一個音頻幀；

26、首先，對該音頻幀進(jìn)行快速傅里葉變換，并得到該音頻幀的頻譜；

27、接著，獲取該音頻幀在多個頻率點(diǎn)的幅度值；

28、隨之，計(jì)算出該音頻幀中多個頻率點(diǎn)上幅度值的平均值，并將其記為頻譜均值；

29、之后，結(jié)合頻譜均值計(jì)算出該音頻幀中多個頻率點(diǎn)上幅度值的方差，并將其記為頻譜方差。

30、作為本發(fā)明的進(jìn)一步方案，統(tǒng)計(jì)特征的提取分析方式如下：

31、選定一個音頻幀；

32、首先，獲取該音頻幀中各個音頻采樣點(diǎn)的幅度值；

33、隨之，在該音頻幀中所有音頻采樣點(diǎn)的幅度值中，選定一個值最大的幅度值，并將其記為峰值幅度。

34、作為本發(fā)明的進(jìn)一步方案，完整性校驗(yàn)方式如下：

35、將接收到的編碼音頻數(shù)據(jù)的特征參數(shù)與發(fā)送端發(fā)送的原始音頻數(shù)據(jù)的特征參數(shù)進(jìn)行比較：

36、如果兩者的特征差異在一定的閾值范圍內(nèi)，則認(rèn)為音頻傳輸是完整的；否則，認(rèn)為音頻傳輸出現(xiàn)了丟失或損壞。

37、作為本發(fā)明的進(jìn)一步方案，具體比較方式為：

38、提取時域特征中的幅度均值和幅度方差、頻域特征中的頻譜均值和頻譜方差、統(tǒng)計(jì)特征中的峰值幅度；

39、選定時域特征中的幅度均值；

40、設(shè)定發(fā)送端原始音頻數(shù)據(jù)的幅度均值為m1，接收端編碼音頻數(shù)據(jù)的幅度均值為m2，設(shè)定幅度均值差異閾值為cm；

41、若|m1-m2|≤cm，則判定幅度均值校驗(yàn)通過，反之則表示幅度均值校驗(yàn)不通過；

42、按照幅度均值的比較方式，對時域特征中的幅度方差、頻域特征中的頻譜均值和頻譜方差、統(tǒng)計(jì)特征中的峰值幅度進(jìn)行比較校驗(yàn)；

43、在數(shù)據(jù)包中，時域特征中的幅度均值和幅度方差、頻域特征中的頻譜均值和頻譜方差、統(tǒng)計(jì)特征中的峰值幅度均進(jìn)行比較后；

44、若含有至少一項(xiàng)校驗(yàn)結(jié)果不通過，則認(rèn)為音頻傳輸出現(xiàn)了丟失或損壞。

45、作為本發(fā)明的進(jìn)一步方案，完整性校驗(yàn)方式還如下：

46、提取接收到的編碼音頻數(shù)據(jù)的特征參數(shù)與發(fā)送端發(fā)送的原始音頻數(shù)據(jù)的特征參數(shù)：

47、隨之將發(fā)送端對應(yīng)音頻幀的幅度均值、幅度方差、頻譜均值、頻譜方差、峰值幅度分別標(biāo)記為m1、v1、fm1、fv1、p1，將接收端對應(yīng)音頻幀的幅度均值、幅度方差、頻譜均值、頻譜方差、峰值幅度分別標(biāo)記為m2、v2、fm2、fv2、p2；

48、隨之通過：

49、計(jì)算出校驗(yàn)值g；

50、隨之將校驗(yàn)值g與預(yù)設(shè)的校驗(yàn)閾值gy進(jìn)行比較：

51、若g＞gy，則判定傳輸音頻信號是完整的；

52、若g≤gy，則判定傳輸音頻信號出現(xiàn)了丟失或損壞。

53、一種低延時網(wǎng)絡(luò)音頻傳輸系統(tǒng)，該系統(tǒng)用于執(zhí)行一種低延時網(wǎng)絡(luò)音頻傳輸方法，該系統(tǒng)包括：

54、音頻采集模塊：用于采集音頻信號，并將其轉(zhuǎn)換為音頻數(shù)字音頻信號；

55、音頻編碼模塊：用于對采集到的音頻數(shù)字音頻信號進(jìn)行編碼；

56、網(wǎng)絡(luò)傳輸模塊：用于將編碼后的音頻數(shù)據(jù)通過網(wǎng)絡(luò)傳輸?shù)浇邮斩耍?/p>

57、音頻解碼模塊：用于對接收的編碼音頻數(shù)據(jù)進(jìn)行解碼，恢復(fù)為原始的音頻數(shù)字音頻信號；

58、音頻播放模塊：用于將解碼后的音頻數(shù)字音頻信號轉(zhuǎn)換為模擬信號，并播放出來。

59、與現(xiàn)有技術(shù)相比，本發(fā)明的有益效果是：

60、低延時方面：通過將音頻信號快速采集并轉(zhuǎn)換為數(shù)字信號后，立即進(jìn)行opus編碼分割成音頻幀并結(jié)合特征參數(shù)捆綁成數(shù)據(jù)包傳輸，減少了信號處理的等待時間，同時在接收端能迅速根據(jù)特征參數(shù)進(jìn)行完整性校驗(yàn)和解碼播放，極大地降低了音頻傳輸過程中的延時，使得音頻傳輸更加實(shí)時，適用于對實(shí)時性要求高的場景，如在線會議、實(shí)時語音通訊等。

61、數(shù)據(jù)準(zhǔn)確性方面：利用音頻幀的時域特征、頻域特征和統(tǒng)計(jì)特征進(jìn)行完整性校驗(yàn)，無論是通過將接收端和發(fā)送端的特征參數(shù)直接比較，還是通過計(jì)算校驗(yàn)值與閾值對比的方式，都能精準(zhǔn)地判斷音頻數(shù)據(jù)在傳輸過程中是否完整。一旦出現(xiàn)丟失或損壞能及時發(fā)現(xiàn)并采取措施，有效保障了音頻數(shù)據(jù)的準(zhǔn)確性，讓用戶接收到準(zhǔn)確無誤的音頻信息。

62、系統(tǒng)高效性方面：音頻采集模塊、編碼模塊、傳輸模塊、解碼模塊和播放模塊協(xié)同工作，形成一個完整高效的音頻傳輸系統(tǒng)。各模塊分工明確且相互配合緊密，從音頻的采集源頭到最終播放都有完善的處理流程，使得整個音頻傳輸系統(tǒng)運(yùn)行流暢高效，提高了系統(tǒng)整體的性能和穩(wěn)定性。

63、編碼優(yōu)勢方面：opus編碼算法在對數(shù)字音頻信號進(jìn)行編碼時能夠有效減少數(shù)據(jù)量，降低網(wǎng)絡(luò)傳輸壓力，提高傳輸速度，同時還能保障音頻質(zhì)量。在網(wǎng)絡(luò)帶寬有限的情況下，依然能夠?qū)崿F(xiàn)高質(zhì)量的音頻傳輸，并且能夠適應(yīng)不同網(wǎng)絡(luò)環(huán)境下的音頻傳輸需求。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳建世,張昊,胡漢勛
技術(shù)所有人：北京視佳偉業(yè)科技有限公司
我是此專利的發(fā)明人

上一篇：一種鈣法提釩尾渣脫硫的方法與流程
上一篇：一種輸電線路寬電流大功率取能裝置及其控制方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計(jì) 2.汽車檢測系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種低延時網(wǎng)絡(luò)音頻傳輸方法及系統(tǒng)與流程