本技術(shù)涉及音頻處理,尤其涉及一種音頻處理方法、裝置、設(shè)備、存儲介質(zhì)及計算機(jī)程序產(chǎn)品。
背景技術(shù):
1、目前現(xiàn)有的會議系統(tǒng),都是由主持人設(shè)定一個會議主題并建立線上會議房間,之后通知相關(guān)人員參會。但在會議期間,來自不同項目組的參與者會根據(jù)自己立場發(fā)言,導(dǎo)致會議的主題擴(kuò)散,與本會議室的主議題不一致,從而在一個會議室中形成多個主題的同時討論,而同時間不同主題的人發(fā)言會彼此影響。比如開一個故障復(fù)盤會,主持人進(jìn)行問題描述后,前端人員會討論app(應(yīng)用程序)的問題,而后端人員會討論服務(wù)節(jié)點的問題,此時會出現(xiàn)針對前端和后端這2個主題的2波人的討論,整個線上會議室的語音就會相互影響,導(dǎo)致效率低下或者無法繼續(xù)討論。此時需要再新建其他會議室,把一部分人分到其他新建的會議室。
2、也就是,現(xiàn)有技術(shù)中,同一個線上會議室中的參會者可能需要就同一件事的不同主題進(jìn)行討論;具體的,針對解決同一件事,但討論主題側(cè)重點不同的人分別建立不同線上會議室,在分會議室討論結(jié)束后,再進(jìn)入同一個會議室討論;如果此時再次出現(xiàn)分歧,就需要重復(fù)進(jìn)行分會議室討論、再進(jìn)同一個會議室的循環(huán)模式,這會造成資源浪費、時間浪費、辦事效率低下。
3、由上,現(xiàn)有技術(shù)中的線上會議方案存在效率低下等問題。
技術(shù)實現(xiàn)思路
1、本技術(shù)的目的在于提供一種音頻處理方法、裝置、設(shè)備、存儲介質(zhì)及計算機(jī)程序產(chǎn)品,以解決現(xiàn)有技術(shù)中線上會議方案效率低下的問題。
2、為了解決上述技術(shù)問題,本技術(shù)實施例提供一種音頻處理方法,包括:
3、獲取線上會議中第一用戶與第二用戶之間的音頻內(nèi)容相關(guān)性信息和音頻時序相關(guān)性信息;
4、根據(jù)所述音頻內(nèi)容相關(guān)性信息和音頻時序相關(guān)性信息,對所述第一用戶和第二用戶進(jìn)行虛擬小組劃分;
5、播放所述第一用戶所處虛擬小組中各組員的音頻,所述第一用戶為本終端用戶,所述第二用戶為所述線上會議中除所述第一用戶之外的其他終端用戶。
6、可選的,獲取線上會議中第一用戶與第二用戶之間的音頻內(nèi)容相關(guān)性信息,包括:
7、獲取第一文本中的第一詞匯集合,其中,所述第一文本為所述第一用戶在所述線上會議中的第一音頻數(shù)據(jù)的文本,所述第一詞匯集合包括:在所述第一文本中的出現(xiàn)頻率排序在前z位的詞匯,z為大于或等于1的整數(shù);
8、獲取第二文本中的第二詞匯集合,其中,所述第二文本為所述第二用戶在所述線上會議中的第二音頻數(shù)據(jù)的文本,所述第二詞匯集合包括:在所述第二文本中的出現(xiàn)頻率排序在前z位的詞匯;所述第二詞匯集合與所述第一詞匯集合的元素總個數(shù)相同;
9、獲取所述第一詞匯集合與所述第二詞匯集合之間相匹配的詞匯個數(shù);
10、根據(jù)所述詞匯個數(shù)和元素總個數(shù),確定所述第一詞匯集合與所述第二詞匯集合之間的相似度,并將所述相似度作為所述第一用戶與第二用戶之間的音頻內(nèi)容相關(guān)性信息。
11、可選的,獲取線上會議中第一用戶與第二用戶之間的音頻時序相關(guān)性信息,包括:
12、計算所述第一用戶與第二用戶之間的音頻銜接度;
13、根據(jù)所述音頻銜接度,得到所述第一用戶與第二用戶之間的音頻時序相關(guān)性信息。
14、可選的,所述計算所述第一用戶與第二用戶之間的音頻銜接度,包括:
15、獲取所述第一用戶在第一音頻數(shù)據(jù)中各個講話語音區(qū)間的結(jié)束時刻所構(gòu)成的第一時間序列;所述第一音頻數(shù)據(jù)為所述第一用戶在所述線上會議中的音頻數(shù)據(jù);
16、獲取所述第二用戶在第二音頻數(shù)據(jù)中各個講話語音區(qū)間的開始時刻所構(gòu)成的第二時間序列;所述第二音頻數(shù)據(jù)為所述第二用戶在所述線上會議中的音頻數(shù)據(jù);
17、根據(jù)所述第一時間序列與所述第二時間序列,獲取所述第一用戶與第二用戶之間的音頻間隔值;
18、根據(jù)所述音頻間隔值,計算得到所述第一用戶與第二用戶之間的音頻銜接度。
19、可選的,所述獲取所述第二用戶在第二音頻數(shù)據(jù)中各個講話語音區(qū)間的開始時刻所構(gòu)成的第二時間序列,包括:
20、確定第二用戶的講話語音區(qū)間所對應(yīng)的第一用戶的靜音區(qū)間;其中,所述第二用戶的講話語音區(qū)間是指所述第二用戶在所述線上會議中的第二音頻數(shù)據(jù)中的講話語音區(qū)間,所述第一用戶的靜音區(qū)間是指第一用戶在所述線上會議中的第一音頻數(shù)據(jù)中的靜音區(qū)間;
21、根據(jù)所述靜音區(qū)間與所述講話語音區(qū)間之間的時間關(guān)系,確定第二用戶在第二音頻數(shù)據(jù)中的講話語音區(qū)間的講話開始時刻;
22、根據(jù)確定的講話開始時刻,得到第二時間序列。
23、可選的,所述根據(jù)所述靜音區(qū)間與所述講話語音區(qū)間之間的時間關(guān)系,確定第二用戶在第二音頻數(shù)據(jù)中的講話語音區(qū)間的講話開始時刻,包括以下至少一項:
24、若所述講話語音區(qū)間與所述靜音區(qū)間存在重疊,且所述講話語音區(qū)間對應(yīng)的第二用戶的實際講話開始時刻晚于所述靜音區(qū)間的開始時刻,以及所述實際講話開始時刻與所述靜音區(qū)間的開始時刻之間的間隔小于第一閾值,則將所述實際講話開始時刻作為講話語音區(qū)間的講話開始時刻;
25、若所述講話語音區(qū)間與所述靜音區(qū)間存在重疊,且所述講話語音區(qū)間對應(yīng)的第二用戶的實際講話開始時刻早于所述靜音區(qū)間的開始時刻,則將所述實際講話開始時刻作為講話語音區(qū)間的講話開始時刻;
26、若所述講話語音區(qū)間與所述靜音區(qū)間存在重疊,且所述講話語音區(qū)間對應(yīng)的第二用戶的實際講話開始時刻晚于所述靜音區(qū)間的開始時刻,以及所述實際講話開始時刻與所述靜音區(qū)間的開始時刻之間的間隔大于或等于第二閾值,則將所述靜音區(qū)間的開始時刻作為講話語音區(qū)間的講話開始時刻;
27、若所述講話語音區(qū)間與所述靜音區(qū)間不存在重疊,則將所述靜音區(qū)間的開始時刻作為講話語音區(qū)間的講話開始時刻。
28、本技術(shù)實施例還提供了一種音頻處理裝置,包括:
29、第一獲取模塊,用于獲取線上會議中第一用戶與第二用戶之間的音頻內(nèi)容相關(guān)性信息和音頻時序相關(guān)性信息;
30、第一處理模塊,用于根據(jù)所述音頻內(nèi)容相關(guān)性信息和音頻時序相關(guān)性信息,對所述第一用戶和第二用戶進(jìn)行虛擬小組劃分;
31、第一播放模塊,用于播放所述第一用戶所處虛擬小組中各組員的音頻,所述第一用戶為本終端用戶,所述第二用戶為所述線上會議中除所述第一用戶之外的其他終端用戶。
32、可選的,獲取線上會議中第一用戶與第二用戶之間的音頻內(nèi)容相關(guān)性信息,包括:
33、獲取第一文本中的第一詞匯集合,其中,所述第一文本為所述第一用戶在所述線上會議中的第一音頻數(shù)據(jù)的文本,所述第一詞匯集合包括:在所述第一文本中的出現(xiàn)頻率排序在前z位的詞匯,z為大于或等于1的整數(shù);
34、獲取第二文本中的第二詞匯集合,其中,所述第二文本為所述第二用戶在所述線上會議中的第二音頻數(shù)據(jù)的文本,所述第二詞匯集合包括:在所述第二文本中的出現(xiàn)頻率排序在前z位的詞匯;所述第二詞匯集合與所述第一詞匯集合的元素總個數(shù)相同;
35、獲取所述第一詞匯集合與所述第二詞匯集合之間相匹配的詞匯個數(shù);
36、根據(jù)所述詞匯個數(shù)和元素總個數(shù),確定所述第一詞匯集合與所述第二詞匯集合之間的相似度,并將所述相似度作為所述第一用戶與第二用戶之間的音頻內(nèi)容相關(guān)性信息。
37、可選的,獲取線上會議中第一用戶與第二用戶之間的音頻時序相關(guān)性信息,包括:
38、計算所述第一用戶與第二用戶之間的音頻銜接度;
39、根據(jù)所述音頻銜接度,得到所述第一用戶與第二用戶之間的音頻時序相關(guān)性信息。
40、可選的,所述計算所述第一用戶與第二用戶之間的音頻銜接度,包括:
41、獲取所述第一用戶在第一音頻數(shù)據(jù)中各個講話語音區(qū)間的結(jié)束時刻所構(gòu)成的第一時間序列;所述第一音頻數(shù)據(jù)為所述第一用戶在所述線上會議中的音頻數(shù)據(jù);
42、獲取所述第二用戶在第二音頻數(shù)據(jù)中各個講話語音區(qū)間的開始時刻所構(gòu)成的第二時間序列;所述第二音頻數(shù)據(jù)為所述第二用戶在所述線上會議中的音頻數(shù)據(jù);
43、根據(jù)所述第一時間序列與所述第二時間序列,獲取所述第一用戶與第二用戶之間的音頻間隔值;
44、根據(jù)所述音頻間隔值,計算得到所述第一用戶與第二用戶之間的音頻銜接度。
45、可選的,所述獲取所述第二用戶在第二音頻數(shù)據(jù)中各個講話語音區(qū)間的開始時刻所構(gòu)成的第二時間序列,包括:
46、確定第二用戶的講話語音區(qū)間所對應(yīng)的第一用戶的靜音區(qū)間;其中,所述第二用戶的講話語音區(qū)間是指所述第二用戶在所述線上會議中的第二音頻數(shù)據(jù)中的講話語音區(qū)間,所述第一用戶的靜音區(qū)間是指第一用戶在所述線上會議中的第一音頻數(shù)據(jù)中的靜音區(qū)間;
47、根據(jù)所述靜音區(qū)間與所述講話語音區(qū)間之間的時間關(guān)系,確定第二用戶在第二音頻數(shù)據(jù)中的講話語音區(qū)間的講話開始時刻;
48、根據(jù)確定的講話開始時刻,得到第二時間序列。
49、可選的,所述根據(jù)所述靜音區(qū)間與所述講話語音區(qū)間之間的時間關(guān)系,確定第二用戶在第二音頻數(shù)據(jù)中的講話語音區(qū)間的講話開始時刻,包括以下至少一項:
50、若所述講話語音區(qū)間與所述靜音區(qū)間存在重疊,且所述講話語音區(qū)間對應(yīng)的第二用戶的實際講話開始時刻晚于所述靜音區(qū)間的開始時刻,以及所述實際講話開始時刻與所述靜音區(qū)間的開始時刻之間的間隔小于第一閾值,則將所述實際講話開始時刻作為講話語音區(qū)間的講話開始時刻;
51、若所述講話語音區(qū)間與所述靜音區(qū)間存在重疊,且所述講話語音區(qū)間對應(yīng)的第二用戶的實際講話開始時刻早于所述靜音區(qū)間的開始時刻,則將所述實際講話開始時刻作為講話語音區(qū)間的講話開始時刻;
52、若所述講話語音區(qū)間與所述靜音區(qū)間存在重疊,且所述講話語音區(qū)間對應(yīng)的第二用戶的實際講話開始時刻晚于所述靜音區(qū)間的開始時刻,以及所述實際講話開始時刻與所述靜音區(qū)間的開始時刻之間的間隔大于或等于第二閾值,則將所述靜音區(qū)間的開始時刻作為講話語音區(qū)間的講話開始時刻;
53、若所述講話語音區(qū)間與所述靜音區(qū)間不存在重疊,則將所述靜音區(qū)間的開始時刻作為講話語音區(qū)間的講話開始時刻。
54、本技術(shù)實施例還提供了一種音頻處理設(shè)備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的程序;所述處理器執(zhí)行所述程序時實現(xiàn)上述的音頻處理方法。
55、本技術(shù)實施例還提供了一種可讀存儲介質(zhì),其上存儲有程序,該程序被處理器執(zhí)行時實現(xiàn)上述的音頻處理方法中的步驟。
56、本技術(shù)實施例還提供了一種計算機(jī)程序產(chǎn)品,包括計算機(jī)指令,所述計算機(jī)指令被處理器執(zhí)行時實現(xiàn)上述的音頻處理方法的步驟。
57、本技術(shù)的上述技術(shù)方案的有益效果如下:
58、上述方案中,所述音頻處理方法通過獲取線上會議中第一用戶與第二用戶之間的音頻內(nèi)容相關(guān)性信息和音頻時序相關(guān)性信息;根據(jù)所述音頻內(nèi)容相關(guān)性信息和音頻時序相關(guān)性信息,對所述第一用戶和第二用戶進(jìn)行虛擬小組劃分;播放所述第一用戶所處虛擬小組中各組員的音頻,所述第一用戶為本終端用戶,所述第二用戶為所述線上會議中除所述第一用戶之外的其他終端用戶;能夠支持基于參會者音頻的分析來對參會者劃分不同主題的分組,而線上會議的所有參與者只需要進(jìn)入同一個會議室就可以只聽到本人所處分組的組員語音,不需要反復(fù)進(jìn)出不同的會議房間,從而提高會議效率,解決現(xiàn)有技術(shù)中線上會議方案效率低下的問題。