欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

查看多媒體文件中錄音的方法及裝置與流程

文檔序號(hào):12274065閱讀:632來(lái)源:國(guó)知局
查看多媒體文件中錄音的方法及裝置與流程

本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別是涉及一種查看多媒體文件中錄音的方法及裝置。



背景技術(shù):

隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,各種終端,如智能電話、平板電腦、計(jì)算機(jī)等的性能在不斷提高,并且,隨著人們生活需求的增加,這些終端能夠支持的應(yīng)用類型也不斷地增加,例如通信、社交、多媒體文件播放、上網(wǎng)或購(gòu)物等諸多功能,其中,使用終端設(shè)備播放多媒體文件是人們?nèi)粘I钪凶畛S玫墓δ苤弧?/p>

然而,采用傳統(tǒng)多媒體文件播放方式播放多媒體文件時(shí),多媒體文件從頭至尾順序播放。當(dāng)多媒體文件中包括多個(gè)發(fā)言者的錄音時(shí),如果用戶想查看或記錄某一位發(fā)言者的錄音,只能先將整個(gè)多媒體文件完整播放一遍,手動(dòng)記錄每個(gè)發(fā)言者的錄音起始時(shí)間,再在后續(xù)播放時(shí)根據(jù)手動(dòng)記錄調(diào)整多媒體文件的播放進(jìn)度,播放想要查看的發(fā)言者的錄音。因此,采用傳統(tǒng)多媒體文件播放方式播放指定發(fā)言人的錄音的操作過(guò)程中,用戶需要進(jìn)行諸多手動(dòng)操作,操作繁冗、費(fèi)時(shí)費(fèi)力。



技術(shù)實(shí)現(xiàn)要素:

基于此,有必要針對(duì)傳統(tǒng)多媒體文件播放方式播放指定發(fā)言人的錄音操作繁冗、費(fèi)時(shí)費(fèi)力的問(wèn)題,提供一種查看多媒體文件中錄音的方法及裝置。

一種查看多媒體文件中錄音的方法,包括:

掃描多媒體文件,獲取多媒體文件中的聲紋數(shù)據(jù);

根據(jù)聲紋數(shù)據(jù),識(shí)別多媒體文件中具有相同聲紋特征的多媒體數(shù)據(jù);

將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)進(jìn)行標(biāo)記。

在其中一個(gè)實(shí)施例中,將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)進(jìn)行標(biāo)記,包括:將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)與預(yù)設(shè)標(biāo)簽進(jìn)行綁定;

將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)與預(yù)設(shè)標(biāo)簽進(jìn)行綁定之后,還包括:

接收對(duì)預(yù)設(shè)標(biāo)簽的選中操作;

根據(jù)對(duì)預(yù)設(shè)標(biāo)簽的選中操作,運(yùn)行與預(yù)設(shè)標(biāo)簽相綁定的具有相同聲紋特征的多媒體數(shù)據(jù)。

在其中一個(gè)實(shí)施例中,上述將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)進(jìn)行標(biāo)記,包括:

讀取每個(gè)聲紋特征對(duì)應(yīng)的錄音的起始時(shí)刻;

將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)進(jìn)行起始時(shí)刻標(biāo)記。

在其中一個(gè)實(shí)施例中,上述根據(jù)聲紋數(shù)據(jù),識(shí)別多媒體文件中具有相同聲紋特征的多媒體數(shù)據(jù)之后,還包括:

讀取本地聯(lián)系人聲紋數(shù)據(jù),識(shí)別本地聯(lián)系人聲紋數(shù)據(jù)的聲紋特征,將本地聯(lián)系人的聲紋特征與已獲取的多媒體文件中的聲紋特征匹配;

若多媒體文件中的聲紋特征與本地聯(lián)系人的聲紋特征相同,則提取本地聯(lián)系人名稱,以本地聯(lián)系人名稱對(duì)多媒體數(shù)據(jù)進(jìn)行標(biāo)記。

在其中一個(gè)實(shí)施例中,上述查看多媒體文件中錄音的方法還包括:

檢測(cè)多媒體文件是否包含字幕信息,若多媒體文件包含字幕信息,則在顯示界面上顯示字幕搜索窗口。

一種查看多媒體文件中錄音的裝置,包括:

聲紋數(shù)據(jù)掃描模塊,用于掃描多媒體文件,獲取多媒體文件中的聲紋數(shù)據(jù);

聲紋特征分析模塊,用于根據(jù)聲紋數(shù)據(jù),識(shí)別多媒體文件中具有相同聲紋特征的多媒體數(shù)據(jù);

錄音標(biāo)記模塊,用于將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)進(jìn)行標(biāo)記。

在其中一個(gè)實(shí)施例中,查看多媒體文件中錄音的裝置還包括:

預(yù)設(shè)標(biāo)簽綁定模塊,用于將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)與預(yù)設(shè)標(biāo)簽進(jìn)行綁定;

接收模塊,用于接收對(duì)預(yù)設(shè)標(biāo)簽的選中操作;

錄音播放模塊,用于根據(jù)對(duì)預(yù)設(shè)標(biāo)簽的選中操作,運(yùn)行與預(yù)設(shè)標(biāo)簽相綁定的具有相同聲紋特征的多媒體數(shù)據(jù)。

在其中一個(gè)實(shí)施例中,查看多媒體文件中錄音的裝置還包括:

起始時(shí)刻獲取模塊,用于讀取每個(gè)聲紋特征對(duì)應(yīng)的錄音的起始時(shí)刻;

錄音標(biāo)記模塊還用于將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)進(jìn)行起始時(shí)刻標(biāo)記。

在其中一個(gè)實(shí)施例中,查看多媒體文件中錄音的裝置還包括:

本地聲紋分析模塊,用于讀取本地聯(lián)系人聲紋數(shù)據(jù),識(shí)別本地聯(lián)系人聲紋數(shù)據(jù)的聲紋特征,將本地聯(lián)系人的聲紋特征與已獲取的多媒體文件中的聲紋特征匹配;

若多媒體文件中的聲紋特征與本地聯(lián)系人的聲紋特征相同,則提取本地聯(lián)系人名稱,將本地聯(lián)系人名稱發(fā)送給錄音標(biāo)記模塊;

錄音標(biāo)記模塊以本地聯(lián)系人名稱對(duì)多媒體數(shù)據(jù)進(jìn)行標(biāo)記。

在其中一個(gè)實(shí)施例中,查看多媒體文件中錄音的裝置還包括:

字幕信息檢測(cè)模塊,用于檢測(cè)多媒體文件是否包含字幕信息,當(dāng)多媒體文件包含字幕信息時(shí),在顯示界面上顯示字幕搜索窗口。

上述查看多媒體文件中錄音的方法及裝置,識(shí)別多媒體文件中具有相同聲紋特征的多媒體數(shù)據(jù),并將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)進(jìn)行標(biāo)記。因此,上述查看多媒體文件中錄音的方法及裝置能夠通過(guò)聲紋特征區(qū)分不同發(fā)言者的錄音,并對(duì)每個(gè)發(fā)言者的錄音進(jìn)行標(biāo)記,以使得用戶可以方便的查看指定發(fā)言者的錄音。當(dāng)用戶需要查看某一位發(fā)言者的錄音時(shí),根據(jù)標(biāo)記即可快速查找到想要查看的發(fā)言者的錄音,而無(wú)需聽(tīng)一遍錄音進(jìn)行記錄,操作方便,有效節(jié)省用戶查看指定發(fā)言者錄音的時(shí)間,方便用戶查看錄音。

附圖說(shuō)明

圖1為一個(gè)實(shí)施例中查看多媒體文件中錄音的方法的流程原理圖;

圖2為一個(gè)實(shí)施例中在一個(gè)具體應(yīng)用場(chǎng)景中展示多媒體文件中發(fā)言人錄音標(biāo)識(shí)的界面示意圖;

圖3為另一個(gè)實(shí)施例中在一個(gè)具體應(yīng)用場(chǎng)景中展示多媒體文件中發(fā)言人錄音標(biāo)識(shí)的界面示意圖;

圖4為又一個(gè)實(shí)施例中在一個(gè)具體應(yīng)用場(chǎng)景中展示多媒體文件中發(fā)言人錄音標(biāo)識(shí)的界面示意圖;

圖5為一個(gè)實(shí)施例中查看多媒體文件中錄音的裝置的結(jié)構(gòu)原理圖。

具體實(shí)施方式

為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

請(qǐng)參閱圖1,一種查看多媒體文件中錄音的方法,包括:

步驟120:掃描多媒體文件,獲取多媒體文件中的聲紋數(shù)據(jù)。

具體的,多媒體文件可以是包括錄音的音頻文件或視頻文件,當(dāng)查看包括錄音的視頻/音頻文件時(shí),對(duì)視頻/音頻文件進(jìn)行聲紋數(shù)據(jù)掃描,獲取視頻/音頻文件中的聲紋數(shù)據(jù)。

步驟140:根據(jù)聲紋數(shù)據(jù),識(shí)別多媒體文件中具有相同聲紋特征的多媒體數(shù)據(jù)。

具體的,對(duì)步驟120中獲取到的聲紋數(shù)據(jù)進(jìn)行聲紋特征識(shí)別分析,提取聲紋特征信息,根據(jù)聲紋特征信息對(duì)多媒體文件中的多媒體數(shù)據(jù)進(jìn)行識(shí)別,獲取具有相同聲紋特征的多媒體數(shù)據(jù)。

步驟160:將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)進(jìn)行標(biāo)記。

具體的,對(duì)具有相同聲紋特征的多媒體數(shù)據(jù)標(biāo)記相同的標(biāo)識(shí),用戶通過(guò)查看對(duì)多媒體數(shù)據(jù)的標(biāo)識(shí)即可獲知哪些多媒體數(shù)據(jù)具有相同的聲紋特征,是一個(gè)發(fā)言人的發(fā)言錄音,從而方便用戶對(duì)多媒體文件中的多個(gè)發(fā)言人錄音進(jìn)行區(qū)分,使用戶可以方便的查看指定發(fā)言者的錄音。

在一個(gè)實(shí)施例中,對(duì)多媒體數(shù)據(jù)標(biāo)記的標(biāo)識(shí)可以采用文字命名方式進(jìn)行標(biāo)記。如,將多個(gè)不同聲紋特征對(duì)應(yīng)的標(biāo)識(shí)分別記為發(fā)言人1、發(fā)言人2……發(fā)言人n,具有相同聲紋特征的多媒體數(shù)據(jù)的標(biāo)識(shí)相同。例如,在一個(gè)實(shí)施例中,獲取到第一聲紋特征和第二聲紋特征兩個(gè)聲紋特征,其中,具有第一聲紋特征的多媒體數(shù)據(jù)有兩段,具有第二聲紋特征的多媒體數(shù)據(jù)有一段,采用上述文字命名標(biāo)識(shí)的方式,可以對(duì)具有第一聲紋特征的多媒體數(shù)據(jù)的標(biāo)識(shí)記為發(fā)言人1,對(duì)具有第二聲紋特征的多媒體數(shù)據(jù)的標(biāo)識(shí)記為發(fā)言人2,具有第一聲紋特征的兩段多媒體數(shù)據(jù)的標(biāo)識(shí)都為發(fā)言人1,具有第二聲紋特征的1段多媒體數(shù)據(jù)標(biāo)識(shí)都為發(fā)言人2,具有相同聲紋特征的多媒體數(shù)據(jù)的標(biāo)識(shí)相同。

需要說(shuō)明的是,具體對(duì)多媒體數(shù)據(jù)標(biāo)記的標(biāo)識(shí)可以是任意形式的標(biāo)識(shí),只要能夠體現(xiàn)對(duì)不同聲紋特征的多媒體數(shù)據(jù)進(jìn)行區(qū)分,使用戶能夠清楚的分辨哪些多媒體數(shù)據(jù)是同一個(gè)發(fā)言者的錄音即可。如,在其它實(shí)施例中,還可以采用符號(hào)形式或圖形形式做為標(biāo)識(shí)對(duì)多媒體數(shù)據(jù)進(jìn)行標(biāo)記。例如,仍以上述的舉例為例,在一個(gè)實(shí)施例中,可以對(duì)具有第一聲紋特征的兩段多媒體數(shù)據(jù)標(biāo)記均三角形標(biāo)識(shí),對(duì)具有第二聲紋特征的三段多媒體數(shù)據(jù)均標(biāo)記正方形標(biāo)記。因此,上述只是一種示例,本實(shí)施例并不做具體限定。

在一個(gè)實(shí)施例中,步驟160包括:將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)與預(yù)設(shè)標(biāo)簽進(jìn)行綁定。

具體的,預(yù)設(shè)標(biāo)簽為多媒體數(shù)據(jù)的播放按鈕,且對(duì)應(yīng)同一發(fā)言人,預(yù)設(shè)標(biāo)簽的數(shù)量對(duì)應(yīng)具有相同聲紋特征的多媒體數(shù)據(jù)的數(shù)量,且預(yù)設(shè)標(biāo)簽對(duì)具有相同聲紋特征的各多媒體數(shù)據(jù)進(jìn)行區(qū)別顯示,具有相同聲紋特征的每隔多媒體數(shù)據(jù)的預(yù)設(shè)標(biāo)簽顯示內(nèi)容不同,以對(duì)具有相同聲紋特征的多個(gè)多媒體數(shù)據(jù)進(jìn)行區(qū)分,方便用戶查看。

如,仍以上述舉例為例,標(biāo)識(shí)為發(fā)言人1的兩段具有第一聲紋特征的多媒體數(shù)據(jù)分別與兩個(gè)顯示內(nèi)容不同的預(yù)設(shè)標(biāo)簽進(jìn)行綁定,同樣,標(biāo)識(shí)為發(fā)言人2的一段具有聲紋特征的多媒體數(shù)據(jù)與一個(gè)預(yù)設(shè)標(biāo)簽進(jìn)行綁定。具體的,如圖2所示,在一個(gè)實(shí)施例中,標(biāo)識(shí)為發(fā)言人1的兩個(gè)多媒體數(shù)據(jù)中,一個(gè)多媒體數(shù)據(jù)綁定的預(yù)設(shè)標(biāo)簽202的顯示內(nèi)容為錄音1,另一多媒體數(shù)據(jù)綁定的預(yù)設(shè)標(biāo)簽202的內(nèi)容為錄音2;標(biāo)識(shí)為發(fā)言人2的一個(gè)多媒體數(shù)據(jù)中,預(yù)設(shè)標(biāo)簽202的顯示內(nèi)容為錄音1。

如圖2所示,本實(shí)施例中,兩個(gè)發(fā)言人的不同聲紋特征的多媒體數(shù)據(jù)間采用列表形式展示,標(biāo)識(shí)發(fā)言人1、發(fā)言人2按照對(duì)應(yīng)多媒體文件數(shù)量排序,每個(gè)預(yù)設(shè)標(biāo)簽202與其對(duì)應(yīng)的發(fā)言人標(biāo)識(shí)對(duì)應(yīng)展示。需要說(shuō)明是,本實(shí)施例并不限定具體的多媒體數(shù)據(jù)的標(biāo)識(shí)和預(yù)設(shè)標(biāo)簽202的展示形式及各標(biāo)識(shí)的排序方式,以上實(shí)施例只是一種示例,并不做具體限定。

進(jìn)一步的,本實(shí)施例中,將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)與預(yù)設(shè)標(biāo)簽進(jìn)行綁定之后,還包括:接收對(duì)預(yù)設(shè)標(biāo)簽的選中操作,根據(jù)對(duì)預(yù)設(shè)標(biāo)簽的選中操作,運(yùn)行與預(yù)設(shè)標(biāo)簽相綁定的具有相同聲紋特征的多媒體數(shù)據(jù)。

具體的,終端檢測(cè)是否接收到用戶對(duì)預(yù)設(shè)標(biāo)簽的選中操作,當(dāng)接收到用戶對(duì)預(yù)設(shè)標(biāo)簽的選中操作時(shí),獲取預(yù)設(shè)標(biāo)簽對(duì)應(yīng)的多媒體數(shù)據(jù),播放預(yù)設(shè)標(biāo)簽202對(duì)應(yīng)的多媒體數(shù)據(jù)。如,檢測(cè)到用戶對(duì)與標(biāo)識(shí)為發(fā)言人1對(duì)應(yīng)的顯示內(nèi)容為錄音1的預(yù)設(shè)標(biāo)簽202的選中操作,即播放發(fā)言人1的錄音1的預(yù)設(shè)標(biāo)簽202對(duì)應(yīng)的多媒體數(shù)據(jù)。具體的,選中操作可以為點(diǎn)擊或按壓操作,本實(shí)施例不做具體限定。

在一個(gè)實(shí)施例中,步驟160包括:讀取每個(gè)聲紋特征對(duì)應(yīng)的錄音的起始時(shí)刻,將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)進(jìn)行起始時(shí)刻標(biāo)記。

具體的,對(duì)于具有相同聲紋特征的不同多媒體數(shù)據(jù),讀取每個(gè)多媒體數(shù)據(jù)錄音的起始時(shí)刻,并以起始時(shí)刻對(duì)具有相同聲紋特征的各多媒體數(shù)據(jù)分別進(jìn)行標(biāo)記。具體的,根據(jù)各多媒體數(shù)據(jù)的錄音起始時(shí)刻生成起始時(shí)刻界面元素,顯示各多媒體數(shù)據(jù)的標(biāo)識(shí)及所對(duì)應(yīng)的起始時(shí)刻界面元素。如圖3所示,發(fā)言人1的兩段錄音的其實(shí)時(shí)刻分別為7s和19s,發(fā)言人2的一段錄音的起始時(shí)刻為13s,與標(biāo)識(shí)發(fā)言人1對(duì)應(yīng)的兩個(gè)界面元素302分別顯示為0:00:07和0:00:19;標(biāo)識(shí)發(fā)言人2對(duì)應(yīng)的界面元素302顯示0:00:13。通過(guò)錄音起始時(shí)刻對(duì)多媒體數(shù)據(jù)進(jìn)行標(biāo)記,可以更加方便用戶查找指定的發(fā)言人錄音。

更進(jìn)一步的,根據(jù)各錄音的起始時(shí)刻生成起始時(shí)刻界面元素302,顯示各錄音的標(biāo)識(shí)及每個(gè)標(biāo)識(shí)所對(duì)應(yīng)的起始時(shí)刻界面元素302的步驟之后,還包括:接收對(duì)界面元素302的選中操作,根據(jù)對(duì)界面的選中操作,從界面元素302對(duì)應(yīng)的錄音其實(shí)時(shí)刻播放多媒體文件。

具體的,檢測(cè)是否接收到用戶對(duì)界面元素302的選中操作,當(dāng)接收到用戶對(duì)界面元素302的選中操作時(shí),獲取界面元素302對(duì)應(yīng)的錄音起始時(shí)刻,從錄音起始時(shí)刻開始播放多媒體文件。如,檢測(cè)到用戶對(duì)顯示內(nèi)容為0:00:07的界面元素302的選中操作,則從7s位置開始播放多媒體文件,播放到13s時(shí)結(jié)束,播放0:00:07的界面元素302對(duì)應(yīng)的發(fā)言人1的錄音。具體的,選中操作可以是點(diǎn)擊操作或按壓操作,本實(shí)施例不做具體限定。

本實(shí)施例中,通過(guò)錄音起始時(shí)刻對(duì)多媒體數(shù)據(jù)進(jìn)行標(biāo)記,用戶需要查看某一位發(fā)言者的錄音時(shí),選中相應(yīng)的界面元素302即可在界面元素302對(duì)應(yīng)的起始時(shí)刻播放多媒體文件,而無(wú)需聽(tīng)一遍錄音記錄錄音時(shí)間,操作方便,且能夠準(zhǔn)確讀取每一段錄音的起始時(shí)刻,錄音時(shí)間記錄準(zhǔn)確,能夠進(jìn)一步省用戶查看指定發(fā)言者錄音的時(shí)間,保證用戶查看錄音的效率。

如圖3所示,本實(shí)施例中,兩個(gè)發(fā)言人的不同聲紋特征的多媒體數(shù)據(jù)間采用列表形式展示,標(biāo)識(shí)發(fā)言人1、發(fā)言人2按照對(duì)應(yīng)錄音起始時(shí)刻排序,每個(gè)界面元素302與其對(duì)應(yīng)的發(fā)言人標(biāo)識(shí)對(duì)應(yīng)展示。需要說(shuō)明是,本實(shí)施例并不限定具體的多媒體數(shù)據(jù)的標(biāo)識(shí)和界面元素302的排序方式,如在其它實(shí)施例中,不同聲紋特征的多媒體數(shù)據(jù)的標(biāo)識(shí)之間還可以按照錄音數(shù)量多少,或錄音時(shí)長(zhǎng),或其它方式進(jìn)行排序。另外,本實(shí)施例也不具體限定多媒體數(shù)據(jù)的標(biāo)識(shí)和界面元素302的展示形式,如圖4所示,在一個(gè)實(shí)施例中,可以直接在時(shí)間軸上展示多媒體數(shù)據(jù)的標(biāo)識(shí)和起始時(shí)刻,分別在0:00:07,0:00:13和0:00:19三個(gè)起始時(shí)刻作出標(biāo)記,并在對(duì)應(yīng)的起始時(shí)刻位置處對(duì)標(biāo)識(shí)發(fā)言人1和發(fā)言人2進(jìn)行標(biāo)記,采用該種展示形式,需要播放多媒體文件時(shí),可拖動(dòng)播放進(jìn)度條至起始時(shí)刻位置進(jìn)行播放也可以直接對(duì)起始時(shí)刻位置進(jìn)行點(diǎn)擊或觸控等操作播放多媒體文件。

以上實(shí)施例為在一個(gè)多媒體文件中查看指定發(fā)言人的錄音。在其它實(shí)施例中,還可以同時(shí)對(duì)多個(gè)多媒體數(shù)據(jù)進(jìn)行查看,當(dāng)需要在多個(gè)多媒體文件中查看指定發(fā)言人的錄音時(shí),同時(shí)掃描多個(gè)多媒體文件,獲取各多媒體文件中的聲紋數(shù)據(jù),根據(jù)聲紋數(shù)據(jù)識(shí)別多個(gè)多媒體文件中具有相同聲紋特征的多媒體數(shù)據(jù),并進(jìn)行標(biāo)記,對(duì)每一個(gè)發(fā)言人在不同文件中的錄音進(jìn)行標(biāo)記。在多個(gè)多媒體文件中查看指定發(fā)言人的錄音的基本原理與上述實(shí)施例相同,即同時(shí)對(duì)多個(gè)多媒體文件進(jìn)行掃描,對(duì)每個(gè)多媒體文件均采用上述過(guò)程進(jìn)行識(shí)別及標(biāo)記處理,最后對(duì)標(biāo)記結(jié)果進(jìn)行匯總展示即可。

在一個(gè)實(shí)施例中,步驟140之后還包括:讀取本地聯(lián)系人聲紋數(shù)據(jù),識(shí)別本地聯(lián)系人聲紋數(shù)據(jù)的聲紋特征,將本地聯(lián)系人的聲紋特征與已獲取的多媒體文件中的聲紋特征匹配;若多媒體文件中的聲紋特征與本地聯(lián)系人的聲紋特征相同,則提取本地聯(lián)系人名稱,以本地聯(lián)系人名稱對(duì)多媒體數(shù)據(jù)進(jìn)行標(biāo)記。

具體的,本地聯(lián)系人包括通訊錄聯(lián)系人或支持語(yǔ)音功能的社交應(yīng)用中的聯(lián)系人。首先獲取本地聯(lián)系人聲紋數(shù)據(jù)并進(jìn)行特征分析,獲取本地聯(lián)系人的聲紋特征,在將已獲取的多媒體文件中的多媒體特征與本地聯(lián)系人的聲紋特征進(jìn)行匹配,如果匹配成功,則提取本地聯(lián)系人名稱,以本地聯(lián)系人的名稱做為該聲紋特征對(duì)應(yīng)的多媒體數(shù)據(jù)的標(biāo)識(shí),對(duì)多媒體數(shù)據(jù)進(jìn)行標(biāo)記。具體本地聯(lián)系人名稱包括通訊錄聯(lián)系人姓名或支持語(yǔ)音功能的社交應(yīng)用中的聯(lián)系人昵稱。如,經(jīng)匹配獲取通訊錄中姓名為小張以及社交應(yīng)用中昵稱為洋蔥頭的兩個(gè)的聯(lián)系人名稱與已獲取的多媒體文件中的兩個(gè)聲紋特征相同,則將兩個(gè)多媒體數(shù)據(jù)的標(biāo)識(shí)分別命名為小張和洋蔥頭。

本實(shí)施例中通過(guò)匹配本地聯(lián)系人的聲紋特征實(shí)現(xiàn)以本地聯(lián)系人的名稱對(duì)錄音進(jìn)行標(biāo)記,能夠進(jìn)一步方便用戶查看多媒體文件中的錄音。具體以聯(lián)系人命名的標(biāo)識(shí)與其它方式命名的標(biāo)識(shí)展示時(shí)可根據(jù)首字母順序或數(shù)字順序排序,也可如上述實(shí)施例所述根據(jù)錄音其實(shí)時(shí)刻的先后順序或照錄音數(shù)量多少,或錄音時(shí)長(zhǎng)等排序。

在其中一個(gè)實(shí)施例中,上述查看多媒體文件中錄音的方法還包括:檢測(cè)多媒體文件是否包含字幕信息,若多媒體文件包含字幕信息,則在顯示界面上顯示字幕搜索窗口。

具體的,當(dāng)需要查看的多媒體文件包含字幕信息時(shí),在顯示界面上顯示字幕搜索窗口,用戶可以輸入文字進(jìn)行搜索,使得用戶可以根據(jù)需要查找的發(fā)言人的發(fā)言內(nèi)容快速查找指定發(fā)言人的錄音,進(jìn)一步方便用戶查找,提高用戶查找效率。

如圖5所示,一種查看多媒體文件中錄音的裝置500,包括:

聲紋數(shù)據(jù)掃描模塊502,用于掃描多媒體文件,獲取多媒體文件中的聲紋數(shù)據(jù);

聲紋特征分析模塊504,用于根據(jù)聲紋數(shù)據(jù),識(shí)別多媒體文件中具有相同聲紋特征的多媒體數(shù)據(jù);

錄音標(biāo)記模塊506,用于將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)進(jìn)行標(biāo)記。

在一個(gè)實(shí)施例中,查看多媒體文件中錄音的裝置還包括:預(yù)設(shè)標(biāo)簽綁定模塊、接收模塊和錄音播放模塊,預(yù)設(shè)標(biāo)簽綁定模塊用于將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)與預(yù)設(shè)標(biāo)簽進(jìn)行綁定;接收模塊用于接收對(duì)預(yù)設(shè)標(biāo)簽的選中操作。錄音播放模塊用于根據(jù)對(duì)預(yù)設(shè)標(biāo)簽的選中操作,運(yùn)行與預(yù)設(shè)標(biāo)簽相綁定的具有相同聲紋特征的多媒體數(shù)據(jù)。

在一個(gè)實(shí)施例中,查看多媒體文件中錄音的裝置還包括:起始時(shí)刻獲取模塊,用于讀取每個(gè)聲紋特征對(duì)應(yīng)的錄音的起始時(shí)刻。錄音標(biāo)記模塊506還用于將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)進(jìn)行起始時(shí)刻標(biāo)記。

在其中一個(gè)實(shí)施例中,查看多媒體文件中錄音的裝置還包括:

本地聲紋分析模塊,用于讀取本地聯(lián)系人聲紋數(shù)據(jù),識(shí)別本地聯(lián)系人聲紋數(shù)據(jù)的聲紋特征,將本地聯(lián)系人的聲紋特征與已獲取的多媒體文件中的聲紋特征匹配。若多媒體文件中的聲紋特征與本地聯(lián)系人的聲紋特征相同,則提取本地聯(lián)系人名稱,將本地聯(lián)系人名稱發(fā)送給錄音標(biāo)記模塊;錄音標(biāo)記模塊以本地聯(lián)系人名稱對(duì)多媒體數(shù)據(jù)進(jìn)行標(biāo)記。

在其中一個(gè)實(shí)施例中,查看多媒體文件中錄音的裝置還包括:字幕信息檢測(cè)模塊,用于檢測(cè)多媒體文件是否包含字幕信息,當(dāng)多媒體文件包含字幕信息時(shí),在顯示界面上顯示字幕搜索窗口。

上述查看多媒體文件中錄音的方法及裝置可以應(yīng)用于包括但不限于以下至少一種終端:智能手機(jī)、平板電腦、筆記本電腦、臺(tái)式PC機(jī)、穿戴式智能設(shè)備。上述只是一種示例,本實(shí)施例對(duì)此不作任何限定。

上述查看多媒體文件中錄音的方法及裝置,識(shí)別多媒體文件中具有相同聲紋特征的多媒體數(shù)據(jù),并將識(shí)別出的具有相同聲紋特征的多媒體數(shù)據(jù)進(jìn)行標(biāo)記。因此,上述查看多媒體文件中錄音的方法及裝置能夠通過(guò)聲紋特征區(qū)分不同發(fā)言者的錄音,并對(duì)每個(gè)發(fā)言者的錄音進(jìn)行標(biāo)記,以使得用戶可以方便的查看指定發(fā)言者的錄音。當(dāng)用戶需要查看某一位發(fā)言者的錄音時(shí),根據(jù)標(biāo)記即可快速查找到想要查看的發(fā)言者的錄音,而無(wú)需聽(tīng)一遍錄音進(jìn)行記錄,操作方便,有效節(jié)省用戶查看指定發(fā)言者錄音的時(shí)間,方便用戶查看錄音。

以上所述實(shí)施例的各技術(shù)特征可以進(jìn)行任意的組合,為使描述簡(jiǎn)潔,未對(duì)上述實(shí)施例中的各個(gè)技術(shù)特征所有可能的組合都進(jìn)行描述,然而,只要這些技術(shù)特征的組合不存在矛盾,都應(yīng)當(dāng)認(rèn)為是本說(shuō)明書記載的范圍。

以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對(duì)發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
澳门| 宜君县| 逊克县| 盘锦市| 房山区| 无为县| 辽阳县| 湘潭县| 十堰市| 清流县| 梅河口市| 金沙县| 晋宁县| 武胜县| 马鞍山市| 南木林县| 邳州市| 稷山县| 海原县| 宁都县| 昌宁县| 大足县| 筠连县| 北宁市| 科技| 盐源县| 当阳市| 闽清县| 商洛市| 齐河县| 乌鲁木齐市| 江安县| 南皮县| 安乡县| 印江| 贡山| 宜黄县| 香格里拉县| 舟山市| 慈利县| 阜平县|