本發(fā)明涉及數(shù)據(jù)處理,具體涉及一種基于大模型歷史參數(shù)分析的通訊信息分揀系統(tǒng)。
背景技術(shù):
1、對(duì)講機(jī)通訊是一種便捷的雙向無(wú)線通信方式。它通過(guò)特定頻段傳輸語(yǔ)音信號(hào),操作簡(jiǎn)單,無(wú)需復(fù)雜設(shè)置。適用于短距離通訊,如建筑工地、安保巡邏、戶外活動(dòng)等場(chǎng)景,用戶按下按鍵即可講話,松開(kāi)即可收聽(tīng),實(shí)現(xiàn)即時(shí)交流。
2、申請(qǐng)?zhí)枮?02311025009.3的發(fā)明專利中公開(kāi)了一種對(duì)講機(jī)的通信方法,其特征在于,運(yùn)用于對(duì)講機(jī)的通信系統(tǒng),所述通信系統(tǒng)包括起始對(duì)講機(jī)、中轉(zhuǎn)對(duì)講機(jī)以及目標(biāo)終端,所述中轉(zhuǎn)對(duì)講機(jī)的數(shù)量為n個(gè),其中,n為正整數(shù),所述通信方法包括:所述起始對(duì)講機(jī)獲取所述起始對(duì)講機(jī)的設(shè)備信息,并向處于第一通信范圍內(nèi)的中轉(zhuǎn)對(duì)講機(jī)發(fā)送所述設(shè)備信息,所述設(shè)備信息至少包括位置信息,所述第一通信范圍為所述起始對(duì)講機(jī)的通信范圍:所述中轉(zhuǎn)對(duì)講機(jī)接收所述設(shè)備信息,并向所述目標(biāo)終端轉(zhuǎn)發(fā)所述設(shè)備信息,至少一個(gè)所述中轉(zhuǎn)對(duì)講機(jī)的第二通信范圍內(nèi)存在所述目標(biāo)終端,所述第二通信范圍為所述中轉(zhuǎn)對(duì)講機(jī)的通信范圍;所述目標(biāo)終端接收所述設(shè)備信息。
3、該申請(qǐng)?jiān)谟诮鉀Q:“在一些特定場(chǎng)合中,例如在野外探索時(shí),當(dāng)持有對(duì)講機(jī)的工作人員與控制中心之間的物理距離超過(guò)對(duì)講機(jī)的通信距離時(shí),用戶無(wú)法通過(guò)對(duì)講機(jī)與控制中心進(jìn)行通信,報(bào)告其位置,此時(shí)用戶的位置無(wú)法確定,存在安全隱患”的問(wèn)題。
4、然而,對(duì)講機(jī)在語(yǔ)音通訊過(guò)程中,通訊環(huán)境雜音會(huì)影響通訊語(yǔ)音的品質(zhì),且由于通訊環(huán)境雜音也致使通訊語(yǔ)音數(shù)據(jù)包更大,以至于對(duì)講機(jī)傳輸通訊語(yǔ)音的任務(wù)量增大,從而通訊難度也隨之增大;
5、為此,我們提出了一種基于大模型歷史參數(shù)分析的通訊信息分揀系統(tǒng)。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有技術(shù)所存在的上述缺點(diǎn),本發(fā)明提供了一種基于大模型歷史參數(shù)分析的通訊信息分揀系統(tǒng),解決了上述背景技術(shù)中提出的技術(shù)問(wèn)題。
2、為實(shí)現(xiàn)以上目的,本發(fā)明通過(guò)以下技術(shù)方案予以實(shí)現(xiàn):
3、一種基于大模型歷史參數(shù)分析的通訊信息分揀系統(tǒng),包括控制終端、接收層、分揀層及交互層;
4、控制終端,是系統(tǒng)的主控端,用于決策系統(tǒng)的啟停及系統(tǒng)中各模塊的啟停;
5、對(duì)講機(jī)音頻發(fā)送端出現(xiàn)的音頻通過(guò)接收層接收,同時(shí)基于接收音頻獲取相應(yīng)音頻頻譜,通過(guò)音頻頻譜識(shí)別音頻來(lái)源方向,基于識(shí)別的音頻來(lái)源方向?qū)σ纛l及音頻頻譜進(jìn)行標(biāo)記,分揀層接收音頻及音頻頻譜,應(yīng)用音頻頻譜對(duì)音頻進(jìn)行分割處理,得到若干組對(duì)應(yīng)單位時(shí)間不等的音頻幀,進(jìn)一步對(duì)各分割所得音頻幀進(jìn)行分揀,分揀剩余音頻幀向交互層反饋,交互層對(duì)接收音頻幀進(jìn)行重組,并將組合所得音頻向?qū)χv機(jī)音頻接收端發(fā)送;
6、所述分揀層包括音譯模塊、分割模塊及分揀模塊,音譯模塊用于獲取接收層中接收的音頻及對(duì)應(yīng)音頻頻譜,進(jìn)一步選擇帶有標(biāo)記的音頻及音頻頻譜,將選擇的音頻轉(zhuǎn)換為文字信息,并向分割模塊轉(zhuǎn)發(fā)其獲取的音頻頻譜,分割模塊用于接收音頻頻譜,對(duì)音頻頻譜進(jìn)行分割處理,分揀模塊用于接收分割模塊中分割所得音頻幀及音頻的文字信息轉(zhuǎn)換結(jié)果,結(jié)合音頻幀及文字信息轉(zhuǎn)換結(jié)果對(duì)音頻幀進(jìn)行分揀;
7、所述分揀模塊在接收到音頻幀及音頻的文字信息轉(zhuǎn)換結(jié)果時(shí),同步對(duì)各音頻幀進(jìn)行信息熵識(shí)別,基于音頻幀的信息熵識(shí)別結(jié)果,生成音頻幀分揀隊(duì)列,再執(zhí)行音頻幀分揀操作;
8、所述音頻幀的信息熵的識(shí)別邏輯表示為:
9、
10、式中:h為音頻幀的信息熵;k為音頻幀中特征值的總量;pj為第j組特征值出現(xiàn)的概率;εj為第j組特征值的權(quán)重;θ為修正;
11、其中,音頻幀在識(shí)別信息熵時(shí),以音頻幀中峰頻點(diǎn)為界,以音頻幀中峰頻點(diǎn)兩側(cè)線段中最短線段的長(zhǎng)度作為另一線段的截?cái)鄥⒄?,以峰頻點(diǎn)作為起始點(diǎn),在另一線段上截取與最短線段長(zhǎng)度相等的線段,進(jìn)一步設(shè)定分割精度,基于分割精度,對(duì)音頻幀中峰頻點(diǎn)兩側(cè)線段中最短線段及截取線段進(jìn)行分割,得到若干組子線段,若干組子線段,兩端表示的幅度值中最大值,記作音頻幀中特征值,第j組特征值的權(quán)重εj服從,特征值來(lái)源子線段距離音頻幀中峰頻點(diǎn)的距離越近,則權(quán)重εj取值越大,權(quán)重εj>0,且
12、更進(jìn)一步地,所述接收層包括接收模塊、識(shí)別模塊及標(biāo)記模塊,接收模塊用于接收對(duì)講機(jī)音頻發(fā)送端出現(xiàn)的音頻,并同步將接收音頻轉(zhuǎn)換為音頻頻譜,識(shí)別模塊用于獲取接收模塊中音頻轉(zhuǎn)換所得音頻頻譜,基于音頻頻譜識(shí)別音頻來(lái)源方向,標(biāo)記模塊用于接收識(shí)別模塊中音頻來(lái)源方向識(shí)別結(jié)果,對(duì)音頻來(lái)源方向所屬的音頻及其對(duì)應(yīng)音頻頻譜進(jìn)行標(biāo)記,以區(qū)別接收模塊接收的其他音頻及對(duì)應(yīng)音頻頻譜;
13、其中,接收模塊由三組麥克風(fēng)所集成,三組所述麥克風(fēng)呈三角狀分布,且各相鄰兩組麥克風(fēng)的間距均相等,接收模塊安裝于對(duì)講機(jī)上,實(shí)時(shí)接收對(duì)講機(jī)音頻發(fā)送端用戶發(fā)出的音頻,并將音頻頻譜導(dǎo)入到音頻頻譜分析儀中,通過(guò)音頻頻譜分析儀輸出音頻對(duì)應(yīng)的音頻頻譜。
14、更進(jìn)一步地,所述音頻頻譜分析儀部署于對(duì)講機(jī)內(nèi)部,在麥克風(fēng)接收到對(duì)講機(jī)音頻發(fā)送端用戶發(fā)出的音頻后,實(shí)時(shí)向音頻頻譜分析儀傳輸,所述接收模塊中每一組麥克風(fēng)均接收到一組音頻,每組音頻均通過(guò)音頻頻譜分析儀輸出其對(duì)應(yīng)音頻頻譜;
15、所述識(shí)別模塊中音頻來(lái)源方向識(shí)別邏輯表示為:
16、
17、式中:simm(a,b)為音頻頻譜a與音頻頻譜b的相似度;fp1為音頻頻譜a中能量最大的頻率點(diǎn)的值;fp2為音頻頻譜b中能量最大的頻率點(diǎn)的值;fmax為兩組音頻頻譜中能量最大的頻率點(diǎn)的值;ω1為權(quán)重;n為音頻頻譜劃分所得頻段總量;ei-a為音頻頻譜a第i個(gè)頻段的能量占比;ei-b為音頻頻譜b第i個(gè)頻段的能量占比;
18、其中,基于上式求取三組音頻頻譜相互之間的相似度,擇相似度最低的一組相似度計(jì)算結(jié)果中fmax來(lái)源音頻頻譜,作為音頻來(lái)源方向識(shí)別參照,音頻來(lái)源方向識(shí)別參照來(lái)源的麥克風(fēng)即音頻來(lái)源方向。
19、更進(jìn)一步地,權(quán)重ω1≤0.5,音頻頻譜a與音頻頻譜b在執(zhí)行相似度計(jì)算前,對(duì)兩組音頻頻譜進(jìn)行劃分處理,使每一劃分所得子音頻頻譜的時(shí)間均為一秒;
20、所述音頻頻譜a與音頻頻譜b在執(zhí)行相似度計(jì)算前,對(duì)兩組音頻頻譜進(jìn)行歸一化處理,使兩組音頻頻譜的能量總和均為1;
21、標(biāo)記模塊中對(duì)于音頻來(lái)源方向識(shí)別結(jié)果對(duì)應(yīng)的音頻頻譜及音頻的標(biāo)記內(nèi)容為文字標(biāo)記,文字標(biāo)記內(nèi)容為:origin,所述其他音頻及對(duì)應(yīng)音頻頻譜,即剩余兩組音頻及音頻頻譜。
22、更進(jìn)一步地,所述分割模塊在接收音頻頻譜后,對(duì)音頻頻譜中所有谷峰頻點(diǎn)進(jìn)行拾取,以每相鄰三組頻點(diǎn)所在頻譜段作為一組音頻幀,且三組相鄰頻點(diǎn)中,谷頻點(diǎn)設(shè)置有兩組,峰頻點(diǎn)設(shè)置有一組,并且峰頻點(diǎn)處于兩組谷頻點(diǎn)之間,以上記作音頻幀判定邏輯,分割模塊基于音頻幀判定邏輯對(duì)音頻頻譜進(jìn)行分割,得到若干組音頻幀,且若干組所述音頻幀的單位時(shí)間均不相等;
23、所述分割模塊對(duì)音頻頻譜進(jìn)行分割得到若干組音頻幀后,分割模塊同步獲取音譯模塊中獲取的音頻,基于若干組音頻幀各自對(duì)應(yīng)單位時(shí)間的比例,對(duì)音頻進(jìn)行分割處理,得到若干組子音頻,若干組子音頻配置于對(duì)應(yīng)音頻幀后,再向音譯模塊發(fā)送,對(duì)各組子音頻進(jìn)行文字信息轉(zhuǎn)換操作,進(jìn)一步將轉(zhuǎn)換所得文字信息與文字信息來(lái)源子音頻對(duì)應(yīng)配置的音頻幀相互綁定,并重新回到分割模塊中,基于分割模塊將相互綁定的文字信息與音頻幀向分揀模塊發(fā)送。
24、更進(jìn)一步地,2>θ≥1,且服從:音頻幀中峰頻點(diǎn)兩側(cè)線段的長(zhǎng)度差值越大,修正θ取值越大,反之,修正θ取值越??;
25、所述分揀模塊接收的音頻幀及音頻的文字信息轉(zhuǎn)換結(jié)果時(shí),即相互綁定的文字信息與音頻幀,所述分揀模塊運(yùn)行生成音頻幀分揀隊(duì)列時(shí),以音頻幀對(duì)應(yīng)信息熵的大小,對(duì)各音頻幀進(jìn)行降序排列,以生成音頻幀分揀隊(duì)列,并以音頻幀分揀隊(duì)列中信息熵大的音頻幀優(yōu)先作為分揀目標(biāo);
26、所述分揀模塊中音頻幀分揀操作的邏輯表示為:
27、
28、式中:qt為音頻幀t是否分揀目標(biāo)的判定值;lt為音頻幀基于音譯模塊轉(zhuǎn)換的文字信息;t0為音頻基于音譯模塊轉(zhuǎn)換的文字信息;
29、其中,基于上式對(duì)音頻幀分揀隊(duì)列中每一音頻幀進(jìn)行是否為分揀目標(biāo)的判定值的求??;
30、音頻幀對(duì)應(yīng)是否為分揀目標(biāo)的判定值為1,則該音頻幀為分揀模塊分揀目標(biāo)音頻幀,分揀目標(biāo)音頻幀由分揀模塊執(zhí)行刪除處理。
31、更進(jìn)一步地,所述交互層包括拾取模塊、重組模塊及刷新模塊,拾取模塊用于拾取分揀層中分揀模塊分揀剩余的音頻幀,進(jìn)一步在音頻頻譜中獲取各分揀剩余音頻幀對(duì)應(yīng)時(shí)域,并以獲取時(shí)域在音頻中截選相同時(shí)域的音頻,記作子音頻,重組模塊用于接收拾取模塊中截選的所有子音頻,對(duì)各組子音頻基于其對(duì)應(yīng)時(shí)域進(jìn)行排序,以組成一組新的音頻,刷新模塊用于接收重組模塊運(yùn)行得到的新音頻,以新音頻作為對(duì)講機(jī)音頻發(fā)送端所要傳輸?shù)囊纛l,向?qū)χv機(jī)音頻接收端傳輸,并刷新系統(tǒng)運(yùn)行。
32、更進(jìn)一步地,所述重組模塊在對(duì)各組子音頻進(jìn)行排序、重組操作時(shí),各相鄰兩組子音頻執(zhí)行淡入淡出處理;
33、其中,相鄰兩組子音頻在執(zhí)行淡入淡出處理時(shí),淡入淡出時(shí)長(zhǎng)服從:相鄰兩組子音頻中時(shí)域最短子音頻的時(shí)長(zhǎng)越長(zhǎng),淡入淡出時(shí)長(zhǎng)越長(zhǎng),反之,淡入淡出時(shí)長(zhǎng)越短;相鄰兩組子音頻在執(zhí)行淡入淡出處理時(shí),淡入淡出音頻強(qiáng)度處于相鄰兩組子音頻中最大音頻強(qiáng)度與最小音頻強(qiáng)度所組成的音頻強(qiáng)度閾值內(nèi)。
34、更進(jìn)一步地,所述刷新模塊運(yùn)行階段,同步對(duì)系統(tǒng)當(dāng)前運(yùn)行過(guò)程中接收層的識(shí)別模塊識(shí)別的音頻來(lái)源方向識(shí)別結(jié)果進(jìn)行記錄,在連續(xù)兩次記錄的音頻來(lái)源方向一致時(shí),系統(tǒng)基于刷新模塊控制下一次運(yùn)行時(shí),識(shí)別模塊不運(yùn)行,并將上一次音頻來(lái)源方向識(shí)別結(jié)果應(yīng)用于標(biāo)記模塊;
35、其中,各次系統(tǒng)運(yùn)行過(guò)程當(dāng)中,識(shí)別模塊未運(yùn)行的系統(tǒng)運(yùn)行過(guò)程,不作為連續(xù)兩次記錄的音頻來(lái)源方向一致的判定目標(biāo)。
36、更進(jìn)一步地,所述音譯模塊通過(guò)局域網(wǎng)絡(luò)交互連接有分割模塊及分揀模塊,所述音譯模塊通過(guò)局域網(wǎng)絡(luò)交互連接有標(biāo)記模塊,所述標(biāo)記模塊通過(guò)局域網(wǎng)絡(luò)交互連接有識(shí)別模塊及接收模塊,所述分揀模塊通過(guò)局域網(wǎng)絡(luò)交互連接有拾取模塊,所述拾取模塊通過(guò)局域網(wǎng)絡(luò)交互連接有重組模塊及刷新模塊。
37、采用本發(fā)明提供的技術(shù)方案,與已知的公有技術(shù)相比,具有如下有益效果:
38、本發(fā)明提供一種基于大模型歷史參數(shù)分析的通訊信息分揀系統(tǒng),該系統(tǒng)在運(yùn)行過(guò)程中,通過(guò)設(shè)定多組麥克風(fēng)的方式,采集以對(duì)講機(jī)用戶的歷史使用習(xí)慣,從而基于對(duì)講機(jī)用戶的歷史使用習(xí)慣,對(duì)多組麥克風(fēng)接收的用戶音頻進(jìn)行選擇,確保該系統(tǒng)能夠以最清晰、貼合對(duì)講機(jī)用戶音頻原意的一組音頻作為系統(tǒng)的進(jìn)一步運(yùn)行目標(biāo),從而對(duì)音頻的對(duì)應(yīng)音頻頻譜進(jìn)行分割、文字信息轉(zhuǎn)換等操作,以達(dá)到最終消減音頻中不包含信息的音頻幀的目標(biāo),最終使得對(duì)講機(jī)傳輸音頻更加清晰、精簡(jiǎn)且包含的雜音更少,進(jìn)而在用戶使用對(duì)講機(jī)時(shí),基于該系統(tǒng)為用戶帶來(lái)更加優(yōu)質(zhì)的通訊體驗(yàn)。