欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種實現(xiàn)影視識別的方法和裝置與流程

文檔序號:11729331閱讀:468來源:國知局
一種實現(xiàn)影視識別的方法和裝置與流程

本申請涉及多媒體技術(shù)領(lǐng)域,特別涉及一種實現(xiàn)影視識別的方法和裝置。



背景技術(shù):

隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)上的影視資源越來越豐富,人們已經(jīng)習(xí)慣于在網(wǎng)絡(luò)上來搜索并觀看自己喜歡的影視資源。例如,用戶可以通過網(wǎng)絡(luò)機(jī)頂盒,在電視上免費(fèi)觀看高清影視資源;也可以在視頻網(wǎng)站上搜索查看自己感興趣的影視資源。

為了能夠給用戶推送熱播或用戶感興趣的影視資源,網(wǎng)絡(luò)服務(wù)器需要做大數(shù)據(jù)統(tǒng)計,統(tǒng)計影視資源的播放情況,根據(jù)統(tǒng)計的播放情況為用戶推送影視資源。

目前,常用的統(tǒng)計方式是,根據(jù)用戶觀看的影視資源的多幀圖像,匹配網(wǎng)絡(luò)服務(wù)器存儲的影視資源,如果匹配成功,則識別出用戶當(dāng)前關(guān)聯(lián)的影視資源,進(jìn)而記錄該影視資源被播放。但這種基于圖像的識別方式,需要網(wǎng)絡(luò)服務(wù)器配置有強(qiáng)大的圖像分析系統(tǒng),整個識別過程中數(shù)據(jù)計算量較大,網(wǎng)絡(luò)服務(wù)器的計算壓力較大。



技術(shù)實現(xiàn)要素:

本發(fā)明所要解決的技術(shù)問是提供一種實現(xiàn)影視識別的方法,用以利用字幕文件實現(xiàn)對用戶播放的影視資源的識別,能夠有效緩解網(wǎng)絡(luò)服務(wù)器的計算壓力,進(jìn)而提高網(wǎng)絡(luò)服務(wù)器的針對影視資源播放情況的統(tǒng)計效率。

本發(fā)明還提供了一種實現(xiàn)影視識別的裝置,用以保證上述方法在實際中的實現(xiàn)及應(yīng)用。

在本發(fā)明第一方面提供了一種利用字幕信息實現(xiàn)影視識別的方法, 所述方法包括:

服務(wù)端接收客戶端發(fā)送的當(dāng)前播放的影視資源的字幕文件;

服務(wù)端將接收到的所述字幕文件與預(yù)先存儲的字幕信息庫中的字幕文件進(jìn)行比較,其中,字幕信息庫包括:影視資源唯一標(biāo)識和對應(yīng)的字幕文件;

如果所述字幕信息庫包含與所述接收到的字幕文件相同的字幕文件,則服務(wù)端根據(jù)所述字幕信息庫中與所述接收到的字幕文件相同的字幕文件對應(yīng)的影視資源唯一標(biāo)識識別客戶端當(dāng)前播放的影視資源。

在本發(fā)明第二方面提供了一種利用字幕信息實現(xiàn)影視識別的裝置,所述裝置包括:

字幕文件接收單元,用于接收客戶端發(fā)送的當(dāng)前播放的影視資源的字幕文件;

比較單元,用于服務(wù)端將接收到的所述字幕文件與預(yù)先存儲的字幕信息庫中的字幕文件進(jìn)行比較,其中,字幕信息庫包括:影視資源唯一標(biāo)識和對應(yīng)的字幕文件;如果所述字幕信息庫包含與所述接收到的字幕文件相同的字幕文件,則執(zhí)行識別單元;

識別單元,用于根據(jù)所述字幕信息庫中與所述接收到的字幕文件相同的字幕文件對應(yīng)的影視資源唯一標(biāo)識識別客戶端當(dāng)前播放的影視資源。

與現(xiàn)有技術(shù)相比,本發(fā)明提供的技術(shù)方案具有以下有益效果:

在發(fā)明技術(shù)方案中,服務(wù)端接收客戶端發(fā)送的當(dāng)前播放的影視資源的字幕文件;服務(wù)端將接收到的所述字幕文件與預(yù)先存儲的字幕信息庫中的字幕文件進(jìn)行比較,其中,字幕信息庫包括:影視資源唯一標(biāo)識和對應(yīng)的字幕文件;如果所述字幕信息庫包含與所述接收到的字幕文件相同的字幕文件,則服務(wù)端根據(jù)所述字幕信息庫中與所述接收到的字幕文件相同的字幕文件對應(yīng)的影視資源唯一標(biāo)識識別客戶端當(dāng)前播放的影視資源。與現(xiàn)有技術(shù)中通過圖像識別影視資源的方式相比,本發(fā)明無需識別圖像,僅通過字幕文件來識別,而字幕文件都是文本信息,其識別過程簡單,計算量相對較少,因此,本發(fā)明能夠有效緩解服務(wù)端的計算壓 力,進(jìn)而提高服務(wù)端針對影視資源播放情況的統(tǒng)計效率。

附圖說明

為了更清楚地說明本申請實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1是本發(fā)明實施例提供的一種實現(xiàn)影視識別的方法的流程圖;

圖2是本發(fā)明實施例提供的一種實現(xiàn)影視識別的裝置的結(jié)構(gòu)圖。

具體實施方式

下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├绢I(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護(hù)的范圍。

本申請可用于眾多通用或?qū)S玫挠嬎阊b置環(huán)境或配置中。例如:個人計算機(jī)、服務(wù)器計算機(jī)、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器裝置、包括以上任何裝置或設(shè)備的分布式計算環(huán)境等等。

本申請可以在由計算機(jī)執(zhí)行的計算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計算環(huán)境中實踐本申請,在這些分布式計算環(huán)境中,由通過通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計算環(huán)境中,程序模塊可以位于包括存儲設(shè)備在內(nèi)的本地和遠(yuǎn)程計算機(jī)存儲介質(zhì)中。

參考圖1,圖1是本發(fā)明實施例提供的一種實現(xiàn)影視識別的方法的流程圖,如圖1所示,該方法可以包括步驟101-103:

步驟101:服務(wù)端接收客戶端發(fā)送的當(dāng)前播放的影視資源的字幕文件。

在實現(xiàn)時,本發(fā)明實施例中的客戶端,是指能夠與服務(wù)端通信的、支持影視資源傳輸、播放的設(shè)備。如電視盒子、電腦、筆記本或者手機(jī)等。例如,用戶可以通過電視盒子,在電視上觀看影視資源;或者,用戶可以在電腦上通過視頻網(wǎng)站觀看影視資源。

在實現(xiàn)時,客戶端負(fù)責(zé)收集用戶正在觀看的影視資源的字幕文件。如果,當(dāng)前播放的影視帶有內(nèi)置或外置的字幕文件,則客戶端通過文件讀取的方式將字幕文件發(fā)送給服務(wù)器。字幕文件是指包含影視資源的字幕的文件,字幕是指以文字形式顯示電視、電影、或者舞臺作品里面的對話等非影像內(nèi)容,可以理解為影視作品后期加工的文字。字幕文件具有多種文件格式,如sub、srt、ssa、ass、smi、xss、psb、txt、ssb等文本格式。在本發(fā)明實施例中,對字幕文件的具體格式不作限定。

在實現(xiàn)時,如果當(dāng)前播放的影視資源未關(guān)聯(lián)有字幕文件時,則客戶端采用光學(xué)字符識別技術(shù)(ocr技術(shù)),分析當(dāng)前播放的影視資源中的字幕信息,將所述字幕信息打包成文件,以生成當(dāng)前播放的影視資源的字幕文件。

步驟102:服務(wù)端將接收到的所述字幕文件與預(yù)先存儲的字幕信息庫中的字幕文件進(jìn)行比較,其中,字幕信息庫包括:影視資源唯一標(biāo)識和對應(yīng)的字幕文件;如果預(yù)先存儲的字幕信息庫包含與所述接收到的字幕文件相同的字幕文件,則執(zhí)行步驟103。

在實現(xiàn)時,服務(wù)端預(yù)先存儲有字幕信息庫,該字幕信息庫包括:影視資源唯一標(biāo)識和對應(yīng)的字幕文件;其中,一個影視資源唯一標(biāo)識對于一個影視資源而言是唯一的。在實現(xiàn)時,可以根據(jù)影視資源的視頻標(biāo)題、視頻描述信息、演員、上映時間等信息來生成影視資源唯一標(biāo)識。在實現(xiàn)時,一個影視資源可能對應(yīng)有多種語言的字幕文件,因此,在字幕信息庫中,一個影視資源唯一標(biāo)識可以對應(yīng)多個不同語言的字幕文件。例如,一個電影配置有中文字幕和英文字幕,則在字幕信息庫中存儲有該電影的影視資源唯一標(biāo)識和對應(yīng)的中文字幕文件和英文字幕文件。

在實現(xiàn)時,步驟102可以按照如下方式實現(xiàn),該方式包括:s11-s12

s11:所述服務(wù)端提取接收到的所述字幕文件的屬性信息;

s12:所述服務(wù)端判斷所述屬性信息與字幕信息庫中某一字幕文件的屬性信息是否相同,如果是,則表明所述字幕信息庫包含與所述接收到的字幕文件相同的字幕文件。

在實現(xiàn)時,字幕文件的屬性信息可以包括以下一種或其幾種組合:

文件名稱、文件創(chuàng)建時間、文件大小、字幕格式、字幕語種。在該方式中,服務(wù)端維護(hù)的字幕信息庫中每個字幕文件都具有各自的屬性信息,基于此,服務(wù)端通過字幕文件屬性信息的對比來識別客戶端發(fā)送的字幕文件是否與服務(wù)端存儲的字幕信息庫中的某個字幕文件相同。如果,客戶端發(fā)送的字幕文件的屬性信息與字幕信息庫中的某個字幕文件的屬性信息相同,則認(rèn)為客戶端發(fā)送的字幕文件與字幕信息庫中該字幕文件相同,即,表明字幕信息庫包含與所述接收到的字幕文件相同的字幕文件。

例如:客戶端發(fā)送的字幕文件的屬性信息具體為:

文件名稱為“阿凡達(dá)中文字幕”;

文件創(chuàng)建時間為“2010年10月1日”;

文件大小為“60kb”;

字幕格式為“ssa”;

字幕語種為“中文”;

如果,服務(wù)端存儲的字幕信息庫中,有一個字幕文件的屬性信息與客戶端發(fā)送的字幕文件的上述屬性信息一致,則認(rèn)為所述字幕文件與字幕信息庫中的該字幕文件相同,即,表明字幕信息庫包含與所述接收到的字幕文件相同的字幕文件。

在實現(xiàn)時,步驟102還可以按照如下方式實現(xiàn),該方式包括:s21-s22

s21:所述服務(wù)端提取接收到的所述字幕文件包含的字幕信息;

s22:所述服務(wù)端計算所述字幕信息與字幕信息庫中每個字幕文件包含的字幕信息之間的相似度,并判斷最大相似度是否大于預(yù)設(shè)閾值,如果是,則表明所述字幕信息庫包含與所述接收到的字幕文件相同的字幕文件。

在實現(xiàn)時,服務(wù)端通過字幕信息,分別計算客戶端發(fā)送的字幕文件 與服務(wù)端維護(hù)的每個字幕文件之間的相似度;其中,字幕信息是指字幕文件包含的具體字幕內(nèi)容;字幕信息可以是中文、英文、日文等任何語言形式、任何格式的文本信息。

服務(wù)端根據(jù)計算得到的相似度的大小關(guān)系,從字幕信息庫中選擇與客戶端發(fā)送的字幕文件相似度最大的字幕文件,并判斷該最大相似度是否大于預(yù)設(shè)閾值,閾值大小可以根據(jù)實際需求而設(shè)定。如果該最大相似度大于預(yù)設(shè)閾值,則認(rèn)為客戶端發(fā)送的字幕文件與字幕信息庫中與其相似度最大的字幕文件是相同的,即,表明字幕信息庫包含與所述接收到的字幕文件相同的字幕文件。例如:服務(wù)端存儲有字幕信息庫,字幕信息庫中包括:影視資源唯一標(biāo)識與對應(yīng)的字幕文件,具體如下:

影視資源唯一標(biāo)識——對應(yīng)的字幕文件

影視資源唯一標(biāo)識a00001——字幕文件1;

影視資源唯一標(biāo)識a00002——字幕文件2;

影視資源唯一標(biāo)識a00003——字幕文件3;

影視資源唯一標(biāo)識a00004——字幕文件4;

影視資源唯一標(biāo)識a00005——字幕文件5;

客戶端發(fā)送的字幕文件b,服務(wù)端根據(jù)字幕文件包含字幕信息,分別計算字幕文件b與字幕信息庫中的字幕文件1、字幕文件2、字幕文件3、字幕文件4、字幕文件5之間的相似度。計算結(jié)果如下:

字幕文件b與字幕文件1之間的相似度為30%;

字幕文件b與字幕文件2之間的相似度為45%;

字幕文件b與字幕文件3之間的相似度為10%;

字幕文件b與字幕文件4之間的相似度為60%;

字幕文件b與字幕文件5之間的相似度為95%;

從計算結(jié)果可知:字幕信息庫中的字幕文件5與客戶端發(fā)送的字幕文件b之間的相似度最大,假設(shè)預(yù)設(shè)閾值為80%,則最大相似度大于預(yù)設(shè)閾值,則認(rèn)為客戶端發(fā)送的字幕文件b與字幕信息庫中與其相似度最大的字幕文件5是相同的,即,表明字幕信息庫包含與所述接收到的字幕文件相同的字幕文件。

在本發(fā)明實施例中,字幕信息之間的相似度的計算采用文本相似度計算工具來實現(xiàn),當(dāng)然也可以采用其他工具或者算法來實現(xiàn),本發(fā)明對此不作具體限定。

步驟103:服務(wù)端根據(jù)字幕信息庫中與所述接收到的字幕文件相同的字幕文件對應(yīng)的影視資源唯一標(biāo)識識別客戶端當(dāng)前播放的影視資源。

執(zhí)行完畢步驟102,如果服務(wù)端比較出字幕信息庫包含與所述接收到的字幕文件相同的字幕文件,在這種情況下,服務(wù)端就能夠識別出客戶端當(dāng)前播放的影視資源為字幕信息庫中與所述接收到的字幕文件相同的字幕文件對應(yīng)的影視資源唯一標(biāo)識所標(biāo)識的影視資源。

例如:在上述示例中,客戶端發(fā)送的字幕文件b與服務(wù)端字幕信息庫中的字幕文件5相同,即,字幕信息庫包含與所述接收到的字幕文件相同的字幕文件,此時,服務(wù)端就能夠識別出客戶端當(dāng)前播放的影視資源是字幕文件5對應(yīng)的影視資源唯一標(biāo)識a00005所標(biāo)識的影視。

在識別出客戶端當(dāng)前播放的影視資源后,服務(wù)端還可以根據(jù)識別結(jié)果累計該影視資源的觀看次數(shù)。在實現(xiàn)時,具體是在上述方法的基礎(chǔ)上,還可以增加如下步驟:

所述服務(wù)端累計所述字幕信息庫中與所述接收到的字幕文件相同的字幕文件對應(yīng)的影視資源唯一標(biāo)識所標(biāo)識的影視資源的觀看次數(shù)。

以上述示例為例,在服務(wù)端識別出客戶端當(dāng)前播放的影視為影視資源唯一標(biāo)識a00005所標(biāo)識的影視;則服務(wù)端累計字幕文件5對應(yīng)的影視資源唯一標(biāo)識a00005所標(biāo)識的影視的觀看次數(shù)。在實現(xiàn)時,服務(wù)端可以利用計數(shù)器來實現(xiàn)觀看次數(shù)的累計功能。通過這種識別方式,服務(wù)端可以快速的識別客戶端當(dāng)前播放的影視資源,進(jìn)而提高服務(wù)器的針對影視資源播放情況的統(tǒng)計效率。

在本發(fā)明技術(shù)方案中,服務(wù)端接收客戶端發(fā)送的當(dāng)前播放的影視資源的字幕文件;服務(wù)端將接收到的所述字幕文件與預(yù)先存儲的字幕信息庫中的字幕文件進(jìn)行比較,其中,字幕信息庫包括:影視資源唯一標(biāo)識和對應(yīng)的字幕文件;如果所述字幕信息庫包含與所述接收到的字幕文件相同的字幕文件,則服務(wù)端根據(jù)所述字幕信息庫中與所述接收到的字幕 文件相同的字幕文件對應(yīng)的影視資源唯一標(biāo)識識別客戶端當(dāng)前播放的影視資源。與現(xiàn)有技術(shù)中通過圖像識別影視資源的方式相比,服務(wù)端無需維護(hù)龐大的影視資源,也無需具備強(qiáng)大的圖像分析能力,在實現(xiàn)時,本發(fā)明無需識別圖像,僅通過字幕文件來識別,而字幕文件都是文本信息,其識別過程簡單,計算量相對較少,因此,本發(fā)明能夠有效緩解服務(wù)端的計算壓力,進(jìn)而提高服務(wù)端的針對影視資源播放情況的統(tǒng)計效率。

與上述方法相對應(yīng)的,本發(fā)明還提供了一種利用字幕信息實現(xiàn)影視識別的裝置。下面對該裝置進(jìn)行解釋說明。

參見圖2,圖2是本發(fā)明實施例提供的一種實現(xiàn)影視識別的裝置的結(jié)構(gòu)圖,如圖2所示,該裝置可以包括:

字幕文件接收單元201,用于接收客戶端發(fā)送的當(dāng)前播放的影視資源的字幕文件;

比較單元202,用于服務(wù)端將接收到的所述字幕文件與預(yù)先存儲的字幕信息庫中的字幕文件進(jìn)行比較,其中,字幕信息庫包括:影視資源唯一標(biāo)識和對應(yīng)的字幕文件;如果所述字幕信息庫包含與所述接收到的字幕文件相同的字幕文件,則執(zhí)行識別單元;

識別單元203,用于根據(jù)所述字幕信息庫中與所述接收到的字幕文件相同的字幕文件對應(yīng)的影視資源唯一標(biāo)識識別客戶端當(dāng)前播放的影視資源。

可選的,所述字幕文件是所述客戶端通過以下方式生成的:

所述客戶端采用光學(xué)字符識別技術(shù),分析當(dāng)前播放的影視資源中的字幕信息,將所述字幕信息打包成文件,以生成當(dāng)前播放的影視資源的字幕文件。

可選的,所述比較單元,包括:

文件屬性提取子單元,用于提取接收到的所述字幕文件的屬性信息;

文件屬性判斷子單元,用于判斷所述屬性信息與字幕信息庫中某一字幕文件的屬性信息是否相同,如果是,則表明所述字幕信息庫包含與所述接收到的字幕文件相同的字幕文件。

可選的,所述屬性信息包括以下一種或其組合:

文件名稱、文件創(chuàng)建時間、文件大小、文件類型、字幕語種。

可選的,所述比較單元,包括:

字幕信息提取子單元,用于提取接收到的所述字幕文件包含的字幕信息;

相似度判斷子單元,用于計算所述字幕信息與字幕信息庫中每個字幕文件包含的字幕信息之間的相似度,并判斷最大相似度是否大于預(yù)設(shè)閾值,如果是,則表明所述字幕信息庫包含與所述接收到的字幕文件相同的字幕文件。

可選的,所述裝置還包括:

累計單元,用于在所述識別單元執(zhí)行完畢后,累計所述字幕信息庫中與所述接收到的字幕文件相同的字幕文件對應(yīng)的影視資源唯一標(biāo)識所標(biāo)識的影視資源的觀看次數(shù)。

需要說明的是,對于裝置類實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。

最后,還需要說明的是,在本文中,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。

以上對本申請所提供的一種實現(xiàn)影視識別的方法和裝置進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個例對本申請的原理及實施方式進(jìn)行了闡述,以上實施例的說明只是用于幫助理解本申請的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請的思想,在具體實施方式及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本申請的限制。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
乡城县| 宣恩县| 天等县| 普定县| 临江市| 福州市| 榆林市| 双流县| 辽阳县| 温宿县| 永州市| 长治市| 台前县| 古丈县| 岢岚县| 武平县| 大余县| 灵丘县| 苍溪县| 双桥区| 广水市| 图片| 类乌齐县| 忻城县| 盐城市| 建宁县| 惠水县| 弥渡县| 尼玛县| 连山| 多伦县| 石城县| 老河口市| 卢湾区| 东阿县| 商都县| 娱乐| 株洲县| 凌云县| 松江区| 拜泉县|