本發(fā)明涉及終端技術(shù)領(lǐng)域,具體而言,涉及音頻數(shù)據(jù)播放方法、音頻數(shù)據(jù)播放裝置和終端。
背景技術(shù):
目前,在播放記錄了多個用戶產(chǎn)生的音頻數(shù)據(jù)時,如果用戶想要播放某個用戶產(chǎn)生的音頻片段,需要將該音頻數(shù)據(jù)從頭到尾播放一遍,以找出該用戶產(chǎn)生的音頻片段。例如,在一音頻數(shù)據(jù)中記錄了a、b、c三名用戶開會時的講話內(nèi)容,若用戶想要獲取b用戶開會時的講話內(nèi)容,則通過將整個的音頻數(shù)據(jù)播放一遍才能獲取b用戶講話的所有內(nèi)容,這樣就比較麻煩。特別是音頻數(shù)據(jù)的時長比較長時,用戶需要耗費大量的時間來獲取到想要的音頻片段。
因此,如何使用戶更加方便地獲取音頻數(shù)據(jù)中的目標用戶的音頻片段成為亟待解決的技術(shù)問題。
技術(shù)實現(xiàn)要素:
本發(fā)明正是基于上述問題,提出了一種新的技術(shù)方案,解決了用戶不方便在音頻數(shù)據(jù)中獲取目標用戶的音頻片段的技術(shù)問題。
有鑒于此,本發(fā)明的第一方面提出了一種音頻數(shù)據(jù)播放方法,包括:對音頻數(shù)據(jù)進行識別,以識別出所述音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段;當識別結(jié)果為所述音頻數(shù)據(jù)包括多個用戶產(chǎn)生的音頻片段時,接收用戶觸發(fā)的播放音頻片段的指令;播放所述多個用戶中的目標用戶的音頻片段。
在該技術(shù)方案中,通過識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段,以直接播放目標用戶的音頻片段,避免了將整個音頻數(shù)據(jù)從頭到尾播放一遍才能找出目標用戶的音頻片段,從而滿足了用戶對播放某個目標用戶的音頻片段的需求,進而提升了用戶的使用體驗。
在上述技術(shù)方案中,優(yōu)選地,所述音頻數(shù)據(jù)播放方法用于終端,所述對音頻數(shù)據(jù)進行識別,以識別出所述音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段,具體包括:在記錄所述音頻數(shù)據(jù)時,確定所述音頻數(shù)據(jù)中音頻片段的發(fā)聲源方向和/或發(fā)聲源與所述終端之間的距離;根據(jù)所述發(fā)聲源方向和/或所述距離,識別出所述音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段。
在該技術(shù)方案中,可以根據(jù)音頻數(shù)據(jù)中的音頻片段的發(fā)聲源方向(即用戶所在的方向)來識別出音頻數(shù)據(jù)中由同一用戶產(chǎn)生的音頻片段,還可以根據(jù)音頻數(shù)據(jù)中音頻片段的發(fā)聲源與記錄該音頻片段的終端之間的距離來識別出音頻數(shù)據(jù)中由同一用戶產(chǎn)生的音頻片段,從而滿足了用戶對播放某個目標用戶的音頻片段的需求。特別是在開會時,參與會議的用戶一般坐在會議桌的四周,在記錄音頻數(shù)據(jù)時,記錄用戶的音頻片段的終端與每個用戶的距離和方向是不同的。
在上述任一技術(shù)方案中,優(yōu)選地,所述對音頻數(shù)據(jù)進行識別,以識別出所述音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段,具體包括:在記錄或播放所述音頻數(shù)據(jù)時,獲取記錄或播放的所述音頻數(shù)據(jù)的聲音參數(shù);根據(jù)所述聲音參數(shù),識別出所述音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段。
在該技術(shù)方案中,由于不同用戶發(fā)出聲音時的聲音參數(shù)是不同的,因此,可以通過獲取播放音頻數(shù)據(jù)時的聲音參數(shù),以識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段,從而滿足了用戶對播放某個目標用戶的音頻片段的需求。
在上述任一技術(shù)方案中,優(yōu)選地,在所述目標用戶的音頻片段的數(shù)量有多個的情況下,所述播放所述多個用戶中的目標用戶的音頻片段,具體包括:獲取所述目標用戶的多個音頻片段的播放順序;按照所述播放順序,依次播放所述目標用戶的多個音頻片段。
在該技術(shù)方案中,按照目標用戶的多個音頻片段的播放順序,依次播放目標用戶的多個音頻片段,從而方便用戶收聽目標用戶的多個音頻片段。
在上述任一技術(shù)方案中,優(yōu)選地,在所述目標用戶的音頻片段的數(shù)量有多個的情況下,還包括:若當前播放的音頻片段為所述目標用戶的第一音頻片段,則在接收到切換指令時,將當前播放的音頻片段切換到所述目標用戶的第二音頻片段。
在該技術(shù)方案中,在播放目標用戶的多個音頻片段時,可以根據(jù)用戶的需求,在目標用戶的多個音頻片段中進行切換播放,從而滿足了用戶播放目標用戶的某個音頻片段的需求。例如,在播放目標用戶的第一音頻片段時,播放的第一音頻片段并不是用戶想要的,可以切換到用戶想要播放的第二音頻片段。
本發(fā)明的第二方面提出了一種音頻數(shù)據(jù)播放裝置,包括:識別單元,用于對音頻數(shù)據(jù)進行識別,以識別出所述音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段;接收單元,用于當所述識別單元的識別結(jié)果為所述音頻數(shù)據(jù)包括多個用戶產(chǎn)生的音頻片段時,接收用戶觸發(fā)的播放音頻片段的指令;播放單元,用于播放所述多個用戶中的目標用戶的音頻片段。
在該技術(shù)方案中,通過識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段,以直接播放目標用戶的音頻片段,避免了將整個音頻數(shù)據(jù)從頭到尾播放一遍才能找出目標用戶的音頻片段,從而滿足了用戶對播放某個目標用戶的音頻片段的需求,進而提升了用戶的使用體驗。
在上述任一技術(shù)方案中,優(yōu)選地,所述音頻數(shù)據(jù)播放裝置用于終端,所述識別單元包括:確定子單元,用于在記錄所述音頻數(shù)據(jù)時,確定所述音頻數(shù)據(jù)中音頻片段的發(fā)聲源方向和/或發(fā)聲源與所述終端之間的距離;第一識別子單元,用于根據(jù)所述發(fā)聲源方向和/或所述距離,識別出所述音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段。
在該技術(shù)方案中,可以根據(jù)音頻數(shù)據(jù)中的音頻片段的發(fā)聲源方向(即用戶所在的方向)來識別出音頻數(shù)據(jù)中由同一用戶產(chǎn)生的音頻片段,還可以根據(jù)音頻數(shù)據(jù)中音頻片段的發(fā)聲源與記錄該音頻片段的終端之間的距離來識別出音頻數(shù)據(jù)中由同一用戶產(chǎn)生的音頻片段,從而滿足了用戶對播放某個目標用戶的音頻片段的需求。特別是在開會時,參與會議的用戶一般坐在會議桌的四周,在記錄音頻數(shù)據(jù)時,記錄用戶的音頻片段的終端與每個用戶的距離和方向是不同的。
在上述任一技術(shù)方案中,優(yōu)選地,所述識別單元包括:第一獲取子單元,用于在記錄或播放所述音頻數(shù)據(jù)時,獲取記錄或播放的所述音頻數(shù)據(jù)的聲音參數(shù);第二識別子單元,用于根據(jù)所述聲音參數(shù),識別出所述音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段。
在該技術(shù)方案中,由于不同用戶發(fā)出聲音時的聲音參數(shù)是不同的,因此,可以通過獲取播放音頻數(shù)據(jù)時的聲音參數(shù),以識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段,從而滿足了用戶對播放某個目標用戶的音頻片段的需求。
在上述任一技術(shù)方案中,優(yōu)選地,在所述目標用戶的音頻片段的數(shù)量有多個的情況下,所述播放單元包括:第二獲取子單元,用于獲取所述目標用戶的多個音頻片段的播放順序;播放子單元,用于按照所述播放順序,依次播放所述目標用戶的多個音頻片段。
在該技術(shù)方案中,按照目標用戶的多個音頻片段的播放順序,依次播放目標用戶的多個音頻片段,從而方便用戶收聽目標用戶的多個音頻片段。
在上述任一技術(shù)方案中,優(yōu)選地,在所述目標用戶的音頻片段的數(shù)量有多個的情況下,還包括:切換單元,用于若當前播放的音頻片段為所述目標用戶的第一音頻片段,則在接收到切換指令時,將當前播放的音頻片段切換到所述目標用戶的第二音頻片段。
在該技術(shù)方案中,在播放目標用戶的多個音頻片段時,可以根據(jù)用戶的需求,在目標用戶的多個音頻片段中進行切換播放,從而滿足了用戶播放目標用戶的某個音頻片段的需求。例如,在播放目標用戶的第一音頻片段時,播放的第一音頻片段并不是用戶想要的,可以切換到用戶想要播放的第二音頻片段。
本發(fā)明的第三方面提出了一種終端,包括上述技術(shù)方案中任一項所述的音頻數(shù)據(jù)播放裝置,因此,該終端具有和上述技術(shù)方案中任一項所述的音頻數(shù)據(jù)播放裝置相同的技術(shù)效果,在此不再贅述。
通過本發(fā)明的技術(shù)方案,可以使用戶更加方便地獲取到音頻數(shù)據(jù)中的目標用戶的音頻片段。
附圖說明
圖1示出了根據(jù)本發(fā)明的一個實施例的音頻數(shù)據(jù)播放方法的流程示意圖;
圖2a和圖2b示出了根據(jù)本發(fā)明的一個實施例的音頻片段識別結(jié)果的示意圖;
圖3示出了根據(jù)本發(fā)明的一個實施例的終端界面的示意圖;
圖4示出了根據(jù)本發(fā)明的另一個實施例的音頻數(shù)據(jù)播放方法的流程示意圖;
圖5示出了根據(jù)本發(fā)明的一個實施例的音頻數(shù)據(jù)播放裝置的結(jié)構(gòu)示意圖;
圖6示出了根據(jù)本發(fā)明的一個實施例的終端的結(jié)構(gòu)示意圖;
圖7示出了根據(jù)本發(fā)明的另一個實施例的終端的結(jié)構(gòu)示意圖。
具體實施方式
為了可以更清楚地理解本發(fā)明的上述目的、特征和優(yōu)點,下面結(jié)合附圖和具體實施方式對本發(fā)明進行進一步的詳細描述。需要說明的是,在不沖突的情況下,本申請的實施例及實施例中的特征可以相互組合。
在下面的描述中闡述了很多具體細節(jié)以便于充分理解本發(fā)明,但是,本發(fā)明還可以采用其他不同于在此描述的其他方式來實施,因此,本發(fā)明的保護范圍并不受下面公開的具體實施例的限制。
圖1示出了根據(jù)本發(fā)明的一個實施例的音頻數(shù)據(jù)播放方法的流程示意圖。
如圖1所示,根據(jù)本發(fā)明的一個實施例的音頻數(shù)據(jù)播放方法,包括:
步驟102,對音頻數(shù)據(jù)進行識別,以識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段。
如圖2a和圖2b所示,對一個20分鐘的音頻數(shù)據(jù)進行識別,以識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段。即0-2分鐘的音頻片段、5-7分鐘的音頻片段和16-20分鐘的音頻片段為用戶a產(chǎn)生的音頻片段,2-5分鐘的音頻片段和13-15分鐘的音頻片段為用戶b產(chǎn)生的音頻片段,7-10分鐘的音頻片段為用戶c產(chǎn)生的音頻片段,10-13分鐘的音頻片段為用戶d產(chǎn)生的音頻片段,15-16分鐘的音頻片段為用戶e產(chǎn)生的音頻片段。
步驟104,當識別結(jié)果為音頻數(shù)據(jù)包括多個用戶產(chǎn)生的音頻片段時,接收用戶觸發(fā)的播放音頻片段的指令。
步驟106,播放多個用戶中的目標用戶的音頻片段。
如圖3所示,在終端界面上顯示一個20分鐘的音頻數(shù)據(jù),該20分鐘的音頻數(shù)據(jù)由用戶a、用戶b、用戶c、用戶d和用戶e產(chǎn)生的音頻片段組成。當接收到選擇a用戶的指令時,僅播放用戶a的語音片段,當接收到選擇c用戶的指令時,僅播放用戶c的語音片段。
在該技術(shù)方案中,通過識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段,以直接播放目標用戶的音頻片段,避免了將整個音頻數(shù)據(jù)從頭到尾播放一遍才能找出目標用戶的音頻片段,從而滿足了用戶對播放某個目標用戶的音頻片段的需求,進而提升了用戶的使用體驗。
在上述技術(shù)方案中,優(yōu)選地,音頻數(shù)據(jù)播放方法用于終端,步驟102具體包括:在記錄音頻數(shù)據(jù)時,確定音頻數(shù)據(jù)中音頻片段的發(fā)聲源方向和/或發(fā)聲源與終端之間的距離;根據(jù)發(fā)聲源方向和/或距離,識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段。
在該技術(shù)方案中,可以根據(jù)音頻數(shù)據(jù)中的音頻片段的發(fā)聲源方向(即用戶所在的方向)來識別出音頻數(shù)據(jù)中由同一用戶產(chǎn)生的音頻片段,還可以根據(jù)音頻數(shù)據(jù)中音頻片段的發(fā)聲源與記錄該音頻片段的終端之間的距離來識別出音頻數(shù)據(jù)中由同一用戶產(chǎn)生的音頻片段,從而滿足了用戶對播放某個目標用戶的音頻片段的需求。特別是在開會時,參與會議的用戶一般坐在會議桌的四周,在記錄音頻數(shù)據(jù)時,記錄用戶的音頻片段的終端與每個用戶的距離和方向是不同的。
例如,在一段30分鐘的音頻數(shù)據(jù)中,前10分鐘的音頻片段的發(fā)聲源位于左側(cè)30°,10分鐘到15分鐘的音頻片段的發(fā)聲源位于右側(cè)30°,15分鐘到25分鐘的音頻片段的發(fā)聲源位于左側(cè)30°,25分鐘到30分鐘的音頻片段的發(fā)聲源位于右側(cè)60°,因此,可以識別出發(fā)聲源位于左側(cè)30°方向的音頻片段(即前10分鐘的音頻片段和15分鐘到25分鐘的音頻片段)為a用戶的音頻片段,發(fā)聲源位于右側(cè)30°方向的音頻片段(即10分鐘到15分鐘的音頻片段)為b用戶的音頻片段,發(fā)聲源位于右側(cè)60°方向的音頻片段(即25分鐘到30分鐘的音頻片段)為c用戶的音頻片段,從而可以直接播放a用戶、b用戶和c用戶中的任一用戶的音頻片段。
再例如,在一段30分鐘的音頻數(shù)據(jù)中,前10分鐘的音頻片段的發(fā)聲源與記錄該音頻數(shù)據(jù)的終端之間的距離為0.5米,10分鐘到15分鐘的音頻片段的發(fā)聲源與記錄整個音頻數(shù)據(jù)的終端之間的距離為0.8米,15分鐘到25分鐘的音頻片段的發(fā)聲源與記錄整個音頻數(shù)據(jù)的終端之間的距離為0.5米,25分鐘到30分鐘的音頻片段的發(fā)聲源與記錄整個音頻數(shù)據(jù)的終端之間的距離為1.1米。基于上述的識別結(jié)果,可以識別出距離記錄整個音頻數(shù)據(jù)的終端的距離為0.5米的發(fā)聲源產(chǎn)生的音頻片段(即前10分鐘的音頻片段和15分鐘到25分鐘的音頻片段)為a用戶的音頻片段,距離記錄整個音頻數(shù)據(jù)的終端的距離為0.8米的發(fā)聲源產(chǎn)生的音頻片段(即10分鐘到15分鐘的音頻片段)為b用戶的音頻片段,距離記錄整個音頻數(shù)據(jù)的終端的距離為1.1米的發(fā)聲源產(chǎn)生的音頻片段(即25分鐘到30分鐘的音頻片段)為b用戶的音頻片段,從而可以直接播放a用戶、b用戶和c用戶中的任一用戶的音頻片段。
當然,也可以結(jié)合音頻數(shù)據(jù)中音頻片段的發(fā)聲源方向和發(fā)聲源與終端之間的距離,來識別出音頻數(shù)據(jù)中各個用戶產(chǎn)生的音頻片段。
以上方案適用于在記錄音頻數(shù)據(jù)的過程中,識別音頻數(shù)據(jù)中的同一用戶產(chǎn)生的音頻片段。
例如,在會議結(jié)束后保存記錄的音頻數(shù)據(jù),如需要僅試聽某個重要人物的講話內(nèi)容,可單擊試聽并找出該重要人物的講話進行播放,從而節(jié)約大量時間,提高效率。本提案也可用于下述情況,即因未出席會議而錯過領(lǐng)導的重要講話,后續(xù)想快速了解領(lǐng)導在該會議上提到的重點內(nèi)容時,可通過本方案快速播放領(lǐng)導的重要講話。
在上述任一技術(shù)方案中,優(yōu)選地,步驟102具體包括:在記錄或播放所述音頻數(shù)據(jù)時,獲取記錄或播放的所述音頻數(shù)據(jù)的聲音參數(shù);根據(jù)聲音參數(shù),識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段。
在該技術(shù)方案中,由于不同用戶發(fā)出聲音時的聲音參數(shù)是不同的,因此,可以通過獲取播放音頻數(shù)據(jù)時的聲音參數(shù),以識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段,從而滿足了用戶對播放某個目標用戶的音頻片段的需求。
例如,在一段30分鐘的音頻數(shù)據(jù)中,前10分鐘的音頻片段的聲音參數(shù)與之后的15分鐘至25分鐘的音頻片段的聲音參數(shù)一致,說明前10分鐘的音頻片段和15分鐘至25分鐘的音頻片段是由同一個用戶產(chǎn)生的。另外,10分鐘至15分鐘的音頻片段的聲音參數(shù)與25分鐘至30分鐘的音頻片段的聲音參數(shù)一致,說明10分鐘至15分鐘的音頻片段和25分鐘至30分鐘的音頻片段是由同一個用戶產(chǎn)生的。其中,聲音參數(shù)包括以下之一或多種的組合:音調(diào)、響度和音色。
以上方案不僅適用于在記錄音頻數(shù)據(jù)的過程中,識別音頻數(shù)據(jù)中的同一用戶產(chǎn)生的音頻片段,其中,該音頻數(shù)據(jù)包括但不限于:開會時的音頻數(shù)據(jù)和訪談時的音頻數(shù)據(jù)。以上方案還適用于在播放音頻數(shù)據(jù)的過程中,識別音頻數(shù)據(jù)中的同一用戶產(chǎn)生的音頻片段,其中,該音頻數(shù)據(jù)包括但不限于:開會時的音頻數(shù)據(jù)、訪談時的音頻數(shù)據(jù)、學習課程的音頻數(shù)據(jù)、在網(wǎng)站上下載的音頻數(shù)據(jù)。
在上述任一技術(shù)方案中,優(yōu)選地,在目標用戶的音頻片段的數(shù)量有多個的情況下,播放多個用戶中的目標用戶的音頻片段,具體包括:獲取目標用戶的多個音頻片段的播放順序;按照播放順序,依次播放目標用戶的多個音頻片段。
在該技術(shù)方案中,按照目標用戶的多個音頻片段的播放順序,依次播放目標用戶的多個音頻片段,從而方便用戶收聽目標用戶的多個音頻片段。
在上述任一技術(shù)方案中,優(yōu)選地,在目標用戶的音頻片段的數(shù)量有多個的情況下,還包括:若當前播放的音頻片段為目標用戶的第一音頻片段,則在接收到切換指令時,將當前播放的音頻片段切換到目標用戶的第二音頻片段。
在該技術(shù)方案中,在播放目標用戶的多個音頻片段時,可以根據(jù)用戶的需求,在目標用戶的多個音頻片段中進行切換播放,從而滿足了用戶播放目標用戶的某個音頻片段的需求。例如,在播放目標用戶的第一音頻片段時,播放的第一音頻片段并不是用戶想要的,可以切換到用戶想要播放的第二音頻片段。
圖4示出了根據(jù)本發(fā)明的另一個實施例的音頻數(shù)據(jù)播放方法的流程示意圖。
如圖4所示,根據(jù)本發(fā)明的另一個實施例的音頻數(shù)據(jù)播放方法,包括:
步驟402,在接收到開始錄音的指令時,記錄語音數(shù)據(jù)。
步驟404,在記錄語音數(shù)據(jù)的同時,對語音數(shù)據(jù)進行識別,以識別出語音數(shù)據(jù)中的由同一用戶產(chǎn)生的語音片段。
步驟406,在接收到結(jié)束錄音的指令時,根據(jù)該指令存儲記錄的語音數(shù)據(jù)。
步驟408,當識別結(jié)果為音頻數(shù)據(jù)包括多個用戶產(chǎn)生的音頻片段時,接收用戶觸發(fā)的播放音頻片段的指令。
步驟410,播放多個用戶中的目標用戶的音頻片段。
圖5示出了根據(jù)本發(fā)明的一個實施例的音頻數(shù)據(jù)播放裝置的結(jié)構(gòu)示意圖。
如圖5所示,根據(jù)本發(fā)明的一個實施例的音頻數(shù)據(jù)播放裝置500,包括:識別單元502、接收單元504和播放單元506。
識別單元502,用于對音頻數(shù)據(jù)進行識別,以識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段;接收單元504,用于當識別單元502的識別結(jié)果為音頻數(shù)據(jù)包括多個用戶產(chǎn)生的音頻片段時,接收用戶觸發(fā)的播放音頻片段的指令;播放單元506,用于播放多個用戶中的目標用戶的音頻片段。
在該技術(shù)方案中,通過識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段,以直接播放目標用戶的音頻片段,避免了將整個音頻數(shù)據(jù)從頭到尾播放一遍才能找出目標用戶的音頻片段,從而滿足了用戶對播放某個目標用戶的音頻片段的需求,進而提升了用戶的使用體驗。
在上述任一技術(shù)方案中,優(yōu)選地,音頻數(shù)據(jù)播放裝置500用于終端,識別單元502包括:確定子單元5022,用于在記錄音頻數(shù)據(jù)時,確定音頻數(shù)據(jù)中音頻片段的發(fā)聲源方向和/或發(fā)聲源與終端之間的距離;第一識別子單元5024,用于根據(jù)發(fā)聲源方向和/或距離,識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段。
在該技術(shù)方案中,可以根據(jù)音頻數(shù)據(jù)中的音頻片段的發(fā)聲源方向(即用戶所在的方向)來識別出音頻數(shù)據(jù)中由同一用戶產(chǎn)生的音頻片段,還可以根據(jù)音頻數(shù)據(jù)中音頻片段的發(fā)聲源與記錄該音頻片段的終端之間的距離來識別出音頻數(shù)據(jù)中由同一用戶產(chǎn)生的音頻片段,從而滿足了用戶對播放某個目標用戶的音頻片段的需求。特別是在開會時,參與會議的用戶一般坐在會議桌的四周,在記錄音頻數(shù)據(jù)時,記錄用戶的音頻片段的終端與每個用戶的距離和方向是不同的。
在上述任一技術(shù)方案中,優(yōu)選地,識別單元502包括:第一獲取子單元5026,用于在記錄或播放所述音頻數(shù)據(jù)時,獲取記錄或播放的所述音頻數(shù)據(jù)的聲音參數(shù);第二識別子單元5028,用于根據(jù)聲音參數(shù),識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段。
在該技術(shù)方案中,由于不同用戶發(fā)出聲音時的聲音參數(shù)是不同的,因此,可以通過獲取播放音頻數(shù)據(jù)時的聲音參數(shù),以識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段,從而滿足了用戶對播放某個目標用戶的音頻片段的需求。
在上述任一技術(shù)方案中,優(yōu)選地,在目標用戶的音頻片段的數(shù)量有多個的情況下,播放單元506包括:第二獲取子單元5062,用于獲取目標用戶的多個音頻片段的播放順序;播放子單元5064,用于按照播放順序,依次播放目標用戶的多個音頻片段。
在該技術(shù)方案中,按照目標用戶的多個音頻片段的播放順序,依次播放目標用戶的多個音頻片段,從而方便用戶收聽目標用戶的多個音頻片段。
在上述任一技術(shù)方案中,優(yōu)選地,在目標用戶的音頻片段的數(shù)量有多個的情況下,還包括:切換單元508,用于若當前播放的音頻片段為目標用戶的第一音頻片段,則在接收到切換指令時,將當前播放的音頻片段切換到目標用戶的第二音頻片段。
在該技術(shù)方案中,在播放目標用戶的多個音頻片段時,可以根據(jù)用戶的需求,在目標用戶的多個音頻片段中進行切換播放,從而滿足了用戶播放目標用戶的某個音頻片段的需求。例如,在播放目標用戶的第一音頻片段時,播放的第一音頻片段并不是用戶想要的,可以切換到用戶想要播放的第二音頻片段。
圖6示出了根據(jù)本發(fā)明的一個實施例的終端的結(jié)構(gòu)示意圖。
如圖6所示,根據(jù)本發(fā)明的一個實施例的終端600,包括上述技術(shù)方案中任一項的音頻數(shù)據(jù)播放裝置500,因此,該終端600具有和上述技術(shù)方案中任一項的音頻數(shù)據(jù)播放裝置500相同的技術(shù)效果,在此不再贅述。
其中,終端600包括但不限于:手機、電腦和錄音筆。
如圖7所示,根據(jù)本發(fā)明的另一個實施例的終端700,包括處理器702、存儲器704和通信總線706。
處理器702可以是通用處理器,例如中央處理器(centralprocessingunit,cpu),還可以是數(shù)字信號處理器(digitalsignalprocessor,dsp)、專用集成電路(applicationspecificintegratedcircuit,asic),或者是被配置成實施本發(fā)明實施例的一個或多個集成電路。存儲器704,用于存儲程序代碼,并將該程序代碼傳輸給處理器702。存儲器704可以包括易失性存儲器(volatilememory),例如隨機存取存儲器(randomaccessmemory,ram);存儲器704也可以包括非易失性存儲器(non-volatilememory),例如只讀存儲器(read-onlymemory,rom)、快閃存儲器(flashmemory)、硬盤(harddiskdrive,hdd)或固態(tài)硬盤(solid-statedrive,ssd);存儲器704還可以包括上述種類的存儲器704的組合。通信總線706用于實現(xiàn)處理器702和存儲器704之間的連接通信。通信總線706可以是工業(yè)標準體系結(jié)構(gòu)(industrystandardarchitecture,isa)總線、外部設(shè)備互連(peripheralcomponentinterconnect,pci)總線或擴展標準體系結(jié)構(gòu)(extendedindustrystandardarchitecture,eisa)總線等。該通信總線706可以分為地址總線、數(shù)據(jù)總線、控制總線等。
其中,處理器702用于調(diào)用存儲器704存儲的程序代碼,執(zhí)行如下操作:
對音頻數(shù)據(jù)進行識別,以識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段;當識別結(jié)果為音頻數(shù)據(jù)包括多個用戶產(chǎn)生的音頻片段時,接收用戶觸發(fā)的播放音頻片段的指令;播放多個用戶中的目標用戶的音頻片段。
優(yōu)選地,處理器702具體用于,在記錄音頻數(shù)據(jù)時,確定音頻數(shù)據(jù)中音頻片段的發(fā)聲源方向和/或發(fā)聲源與終端700之間的距離;根據(jù)發(fā)聲源方向和/或距離,識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段。
優(yōu)選地,處理器702具體用于,在記錄或播放音頻數(shù)據(jù)時,獲取記錄或播放的音頻數(shù)據(jù)的聲音參數(shù);根據(jù)聲音參數(shù),識別出音頻數(shù)據(jù)中的由同一用戶產(chǎn)生的音頻片段。
優(yōu)選地,處理器702具體用于,獲取目標用戶的多個音頻片段的播放順序;按照播放順序,依次播放目標用戶的多個音頻片段。
優(yōu)選地,在目標用戶的音頻片段的數(shù)量有多個的情況下,處理器702還用于,還包括:若當前播放的音頻片段為目標用戶的第一音頻片段,則在接收到切換指令時,將當前播放的音頻片段切換到目標用戶的第二音頻片段。
以上結(jié)合附圖詳細說明了本發(fā)明的技術(shù)方案,通過本發(fā)明的技術(shù)方案,可以使用戶更加方便地獲取到音頻數(shù)據(jù)中的目標用戶的音頻片段,從而節(jié)約大量時間,提高效率。
在本發(fā)明中,術(shù)語“第一”、“第二”僅用于描述的目的,而不能理解為指示或暗示相對重要性;術(shù)語“多個”表示兩個或兩個以上。對于本領(lǐng)域的普通技術(shù)人員而言,可以根據(jù)具體情況理解上述術(shù)語在本發(fā)明中的具體含義。
以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。