一種互動內(nèi)容關聯(lián)推送方法及系統(tǒng)與流程

文檔序號：12732089閱讀：1053來源：國知局

本發(fā)明涉及互聯(lián)網(wǎng)技術領域，特別涉及一種互動內(nèi)容關聯(lián)推送方法及系統(tǒng)。

背景技術：

隨著網(wǎng)絡技術的發(fā)展，人們的生活也越來越離不開網(wǎng)絡，各種節(jié)目內(nèi)容文件都可以通過網(wǎng)絡獲取。節(jié)目內(nèi)容通常指涉各種動態(tài)影像的儲存格式，例如：數(shù)位節(jié)目內(nèi)容格式，包括DVD，QuickTime，與MPEG-4；以及類比的錄像帶,包括VHS與Betamax。節(jié)目內(nèi)容可以被記錄下來并經(jīng)由不同的物理媒介傳送：在節(jié)目內(nèi)容被拍攝或以無線電傳送時為電氣訊號，而記錄在磁帶上時則為磁性訊號；節(jié)目內(nèi)容畫質(zhì)實際上隨著拍攝與擷取的方式以及儲存方式而變化。

通常，節(jié)目內(nèi)容是在時間上連續(xù)的一系列圖像幀的集合，是一種沒有結(jié)構(gòu)的圖像流。我們可以把節(jié)目內(nèi)容看作一本沒有目錄和索引的書，那么一幅圖像幀就相當于書中的一頁。由于節(jié)目內(nèi)容這部書缺乏目錄和索引信息，就無法對它進行高效瀏覽和檢索，無法快速閱讀。為尋找感興趣的節(jié)目內(nèi)容片段，我們只能采取“快進”和“快倒”的耗時方式線性瀏覽。

隨著數(shù)字節(jié)目內(nèi)容數(shù)據(jù)量迅速增加，傳統(tǒng)的“線性”瀏覽方式已遠不能滿足人們對節(jié)目內(nèi)容的訪問和查詢需求。用慣了文本搜索引擎的用戶越來越希望能在海量節(jié)目內(nèi)容庫中快速找到自己感興趣的節(jié)目內(nèi)容片段，而節(jié)目內(nèi)容中的文字可以直接并且集中的描述節(jié)目內(nèi)容的各種信息，所以節(jié)目內(nèi)容中的文字識別可以更好地幫助人們分析和理解節(jié)目內(nèi)容中的內(nèi)容，從而作為節(jié)目內(nèi)容信息處理和檢索的一種良好手段。

目前已經(jīng)涌現(xiàn)出了大量的在圖像和節(jié)目內(nèi)容流中提取文字的有效方法，這些從節(jié)目內(nèi)容流中提取文字的方法大致可以分為兩大類：一類是連接相似的區(qū)域法,這種方法的主要依據(jù)是節(jié)目內(nèi)容和圖像中的文字比較集中,并且和背景有不同的顏色。其特點是可以快速,準確地確定節(jié)目內(nèi)容中的文字，但是當遇到節(jié)目內(nèi)容中的文字被嵌入到復雜的背景中或者和其他的圖形對象相連接時,這種方法的效果就不是很理想了；另一類主要是基于紋理的分類的方法。這類方法的主要問題是比較難排除類似于文字的區(qū)域。

隨著互聯(lián)網(wǎng)技術的發(fā)展，交互變的越來越重要。在線的交互，已經(jīng)成為日益重要的溝通模式。為了滿足廣大用戶信息交互的需要，各種交互軟件或者溝通軟件應運而生。

微信是一個為智能終端提供即時通訊服務的免費應用程序，微信支持跨通信運營商、跨操作系統(tǒng)平臺通過網(wǎng)絡快速發(fā)送免費(需消耗少量網(wǎng)絡流量)語音短信、視頻、圖片和文字，同時，也可以使用通過共享流媒體內(nèi)容的資料和基于位置的社交插件等服務插件。微信提供公眾平臺、朋友圈、消息推送等功能，用戶可以通過“搖一搖”、“搜索號碼”、“附近的人”、掃二維碼方式添加好友和關注公眾平臺，同時微信將內(nèi)容分享給好友以及將用戶看到的精彩內(nèi)容分享到微信朋友圈。

微信作為時下最熱門的社交信息平臺之一，也是移動端的一大入口，正在演變成為一大商業(yè)交易平臺，其對營銷行業(yè)帶來的顛覆性變化開始顯現(xiàn)。微信商城的開發(fā)也隨之興起，微信商城是基于微信而研發(fā)的一款社會化電子商務系統(tǒng)，消費者只要通過微信平臺，就可以實現(xiàn)商品查詢、選購、體驗、互動、訂購與支付的線上線下一體化服務模式。

微信公眾賬號是開發(fā)者或商家在微信公眾平臺上申請的應用賬號，該帳號與QQ賬號互通，通過公眾賬號，商家可在微信平臺上實現(xiàn)和特定群體的文字、圖片、語音、視頻的全方位溝通、互動。形成了一種主流的線上線下微信互動營銷方式。正如線上線下微信互動營銷的代表微部落，率先提出標準的行業(yè)通用模板和深定制的微信平臺開發(fā)理念相結(jié)合。形成了線上線下微信互動營銷的開放應用平臺。

用戶可以通過自身設備與公眾賬號進行互動。通過手機向公眾賬號發(fā)送消息，一般需要如下步驟：

首先用你的手機微信關注微信公眾賬號。然后登陸自己的微信公眾平臺點擊公眾賬號助手。在公眾賬號助手設置的第二步選擇輸入你要綁定的微信號碼。然后點擊發(fā)送微信驗證碼。你的手機微信會收到一條信息，然后將數(shù)字輸入到驗證碼輸入框完成驗證就完成了綁定了。然后進入通訊錄，搜索公眾賬號助手。然后找到公眾賬號助手這個聯(lián)系人這個號碼是騰訊官方的賬號mphelper(騰訊公眾平臺的助手賬號需要通過它進行消息群發(fā))。關注該賬號就可以通過向它發(fā)送群發(fā)消息了。點擊進入聊天界面，然后向其發(fā)送消息，然后看你的公眾賬號的關注用戶是否會接受到這條消息。

微信公眾賬號提供了一種微信與其它系統(tǒng)的后臺服務相聯(lián)系的方案，這一方案可以很好的為微信之外的其它開發(fā)者提供充分的開發(fā)空間。開發(fā)者可以通過微信公眾賬號將自身開發(fā)的服務應用接入微信系統(tǒng)，利用微信龐大的用戶資源進行相應的操作。

現(xiàn)有技術中，對于用戶對于節(jié)目內(nèi)容的需求已經(jīng)不僅僅是播放，還需要從節(jié)目內(nèi)容中獲取相應的信息并由此產(chǎn)生相應的互動。而這個互動內(nèi)容，最好是能夠與節(jié)目內(nèi)容同步的。例如，當節(jié)目內(nèi)容播放到某一內(nèi)容的時候，為用戶推送與此相關的互動內(nèi)容，從而提高用戶的體驗度。因而，亟需要一種可以充分滿足用戶在節(jié)目內(nèi)容播放過程中實時進行互動的方案，從而提高用戶體驗度。

技術實現(xiàn)要素：

本發(fā)明提供一種互動內(nèi)容關聯(lián)推送方法及系統(tǒng)，用以解決現(xiàn)有技術中無法實現(xiàn)節(jié)目內(nèi)容實時互動推送的問題。

一種互動內(nèi)容關聯(lián)推送方法，包括如下步驟：

提取節(jié)目內(nèi)容中的關鍵特征；所述關鍵特征包括關鍵詞、關鍵音頻或關鍵畫面；

根據(jù)所述關鍵特征，配置對應的互動內(nèi)容；

向用戶推送所述互動內(nèi)容。

所述方法還包括：

獲取所述關鍵特征在所述節(jié)目內(nèi)容中出現(xiàn)的關鍵特征時間點；

根據(jù)所述關鍵特征時間點，配置所述互動內(nèi)容向用戶推送的時間點。

所述方法還包括：

微信用戶根據(jù)節(jié)目內(nèi)容搖一搖進入互動頁面，獲取互動內(nèi)容；

根據(jù)所述互動內(nèi)容進行互動操作。

所述提取節(jié)目內(nèi)容中的關鍵特征包括：

預設所述關鍵特征對應的關鍵詞；

獲取所述節(jié)目內(nèi)容中每一節(jié)目內(nèi)容幀的文字信息，并從中篩選包含所述關鍵詞的文字信息作為關鍵文字；

將所述關鍵文字作為所述關鍵特征。

所述提取節(jié)目內(nèi)容中的關鍵特征包括：

預設所述關鍵特征對應的關鍵音頻；

提取所述節(jié)目內(nèi)容對應的音頻數(shù)據(jù)，并從中篩選包含所述關鍵音頻的音頻數(shù)據(jù)作為音頻信息；

將所述音頻信息作為所述關鍵特征。

所述提取節(jié)目內(nèi)容中的關鍵特征包括：

預設所述關鍵特征對應的關鍵畫面；

獲取所述節(jié)目內(nèi)容中每一節(jié)目內(nèi)容幀的畫面信息，并從中篩選包含所述關鍵畫面的畫面信息對應的關鍵視頻幀；

將所述關鍵視頻幀作為所述關鍵特征。

一種互動內(nèi)容關聯(lián)推送系統(tǒng)，包括：

關鍵特征提取單元，用于提取節(jié)目內(nèi)容中的關鍵特征；所述關鍵特征為關鍵詞、關鍵音頻或關鍵幀；

互動內(nèi)容設置單元，用于根據(jù)所述關鍵特征，配置對應的互動內(nèi)容；

同步推送單元，用于向用戶推送所述互動內(nèi)容。

所述同步推送單元還用于：

獲取所述關鍵特征在所述節(jié)目內(nèi)容中出現(xiàn)的關鍵特征時間點；

根據(jù)所述關鍵特征時間點，配置所述互動內(nèi)容向用戶推送的時間點。

所述互動內(nèi)容設置單元，還用于預先設置和管理所述互動內(nèi)容。

所述關鍵特征提取單元進一步包括：

關鍵特征預設子單元，用于預設所述關鍵特征對應的關鍵詞、關鍵音頻或關鍵畫面；

篩選子單元，用于獲取所述節(jié)目內(nèi)容中每一節(jié)目內(nèi)容幀的文字信息，并從中篩選包含所述關鍵詞的文字信息作為關鍵文字；或提取所述節(jié)目內(nèi)容對應的音頻數(shù)據(jù)，并從中篩選包含所述關鍵音頻的音頻數(shù)據(jù)作為音頻信息；或獲取所述節(jié)目內(nèi)容中每一節(jié)目內(nèi)容幀的畫面信息，并從中篩選包含所述關鍵畫面的畫面信息對應的關鍵視頻幀；

設置子單元，用于將所述關鍵文字、音頻信息或關鍵視頻幀作為所述關鍵特征。

本發(fā)明實施例中，通過提取節(jié)目內(nèi)容中的關鍵特征；所述關鍵特征包括關鍵詞、關鍵音頻或關鍵畫面；根據(jù)所述關鍵特征，配置對應的互動內(nèi)容；向用戶推送所述互動內(nèi)容。本發(fā)明實施例的方案，能夠在節(jié)目內(nèi)容播放的過程中，實時根據(jù)節(jié)目播放的內(nèi)容獲取其中的關鍵特征，根據(jù)所述關鍵特征為用戶設定對應的推送互動內(nèi)容，與節(jié)目內(nèi)容中該關鍵特征播放時間點同步推送給用戶，使得用戶可以在觀看節(jié)目內(nèi)容的過程中，根據(jù)節(jié)目內(nèi)容獲取到相應的推送互動內(nèi)容，極大的提高用戶體驗度。

本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述，并且，部分地從說明書中變得顯而易見，或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。

下面通過附圖和實施例，對本發(fā)明的技術方案做進一步的詳細描述。

附圖說明

附圖用來提供對本發(fā)明的進一步理解，并且構(gòu)成說明書的一部分，與本發(fā)明的實施例一起用于解釋本發(fā)明，并不構(gòu)成對本發(fā)明的限制。在附圖中：

圖1為本發(fā)明實施例1提供的一種互動內(nèi)容關聯(lián)推送方法原理流程圖；

圖2為本發(fā)明實施例2提供的一種互動內(nèi)容關聯(lián)推送系統(tǒng)結(jié)構(gòu)示意圖；

圖3為本發(fā)明實施例3提供的一種關鍵特征提取單元21結(jié)構(gòu)示意圖。

具體實施方式

以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例進行說明，應當理解，此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明，并不用于限定本發(fā)明。

如圖1所示，為本發(fā)明實施例1提供的一種互動內(nèi)容關聯(lián)推送方法原理流程圖，其中，

步驟11，提取節(jié)目內(nèi)容中的關鍵特征；關鍵特征為關鍵詞、關鍵音頻或關鍵畫面。

本實施例中的關鍵特征，并不是指節(jié)目內(nèi)容打包、壓縮、解碼等技術特征，而是預先設定的用以標明節(jié)目內(nèi)容中的重要信息的特征。這些關鍵特征是預先設定的，與需要展示推送給用戶的互動內(nèi)容相關聯(lián)。不同的互動內(nèi)容對應不同的關鍵特征，其中的對應關系可以預先根據(jù)需要設定。

節(jié)目內(nèi)容播放過程中，不僅有文字、畫面，還有音頻信息等，這些在節(jié)目內(nèi)容中都是有機的整體，但是，可以通過技術手段對這些文字、畫面、音頻進行分離，從而得到單獨的文字、畫面、音頻信息，這些文字、畫面、音頻信息與完整的節(jié)目內(nèi)容有著嚴格的對應關系和時間同步，因而，實際上，獲取這些文字、畫面、音頻信息，相當于獲取了節(jié)目內(nèi)容的部分信息，并可以準確的知道這些文字、畫面、音頻信息對應節(jié)目內(nèi)容的哪一部分或者哪一時間點。

為了更準確的理解本實施例，本實施例以向用戶推送廣告互動信息為例，來說明本實施例的具體方案。本實施例對推送互動操作的內(nèi)容和類型以及展示形式不做限定。

舉例來說，如果節(jié)目內(nèi)容播放中的某一畫面出現(xiàn)了某種類型的飲料，那么，如果這個時刻同步向用戶展示該類型飲料的網(wǎng)上購買信息、地址，并提供相應的互動操作內(nèi)容，則會極大的提高用戶購買的可能性，從而實現(xiàn)了對用戶需求的準確定位。而這一向用戶提供互動內(nèi)容的方案的第一步，就是要準確的識別出節(jié)目內(nèi)容中的關鍵特征，也就是節(jié)目內(nèi)容播放到什么時候會出現(xiàn)該類型飲料的畫面。這當然可以預先瀏覽節(jié)目內(nèi)容并人工統(tǒng)計畫面出現(xiàn)的時間，但顯然不夠高效，操作起來過于繁瑣。本實施例提供一種自動提取關鍵特征并自動實現(xiàn)互動信息推送的方案。

節(jié)目內(nèi)容中的關鍵特征的提取，有很多種方式，通常取決于關鍵特征設定為關鍵詞、關鍵音頻還是關鍵畫面。關鍵詞的話，是一種文本信息，則需要提取節(jié)目內(nèi)容中的文字信息。關鍵音頻是一種音頻信息，就需要提取節(jié)目內(nèi)容中的音頻信息。而關鍵畫面是節(jié)目內(nèi)容畫面本身，則需要提取關鍵幀并獲取其中的幀的圖像或者圖片。對于不同的關鍵特征，需要采用不同的提取方式。

預設所述關鍵特征對應的關鍵詞；獲取所述節(jié)目內(nèi)容中每一節(jié)目內(nèi)容幀的文字信息，并從中篩選包含所述關鍵詞的文字信息作為關鍵文字；將所述關鍵文字作為所述關鍵特征。這里，關鍵文字可以直接通過節(jié)目內(nèi)容中文字識別的方式進行?；蛘?，可以逐一獲取節(jié)目內(nèi)容幀，將每一幀作為圖片獲取其中的文字信息。識別出文字信息后，可以直接用文字信息與關鍵詞的比對來進行關鍵特征識別，也可以將文字信息對應的節(jié)目內(nèi)容幀與關鍵特征對應起來，在節(jié)目內(nèi)容播放到該節(jié)目內(nèi)容幀的時候，認為關鍵特征已經(jīng)出現(xiàn)，從而展示相關互動內(nèi)容。

具體的文字識別方案，現(xiàn)有技術中有很多解決方案，本實施例不做限定。例如，可以利用OCR(Optical Character Recognition，光學字符識別)技術來進行文字識別。OCR是指電子設備(例如掃描儀或數(shù)碼相機)檢查紙上打印的字符，通過檢測暗、亮的模式確定其形狀，然后用字符識別方法將形狀翻譯成計算機文字的過程；即，針對印刷體字符，采用光學的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點陣的圖像文件，并通過識別軟件將圖像中的文字轉(zhuǎn)換成文本格式，供文字處理軟件進一步編輯加工的技術。如何除錯或利用輔助信息提高識別正確率，是OCR最重要的課題，ICR(Intelligent Character Recognition)的名詞也因此而產(chǎn)生。衡量一個OCR系統(tǒng)性能好壞的主要指標有：拒識率、誤識率、識別速度、用戶界面的友好性，產(chǎn)品的穩(wěn)定性，易用性及可行性等。

一個OCR識別系統(tǒng)，其目的很簡單，只是要把影像作一個轉(zhuǎn)換，使影像內(nèi)的圖形繼續(xù)保存、有表格則表格內(nèi)資料及影像內(nèi)的文字，一律變成計算機文字，使能達到影像資料的儲存量減少、識別出的文字可再使用及分析，當然也可節(jié)省因鍵盤輸入的人力與時間。

從影像到結(jié)果輸出，須經(jīng)過影像輸入、影像前處理、文字特征抽取、比對識別、最后經(jīng)人工校正將認錯的文字更正，將結(jié)果輸出。

影像輸入：欲經(jīng)過OCR處理的標的物須透過光學儀器，如影像掃描儀、傳真機或任何攝影器材，將影像轉(zhuǎn)入計算機?？萍嫉倪M步，掃描儀等的輸入裝置已制作的愈來愈精致，輕薄短小、品質(zhì)也高，對OCR有相當大的幫助，掃描儀的分辨率使影像更清晰、掃除速度更增進OCR處理的效率。

影像預處理：影像預處理是OCR系統(tǒng)中，須解決問題最多的一個模塊。影像須先將圖片、表格及文字區(qū)域分離出來，甚至可將文章的編排方向、文章的提綱及內(nèi)容主體區(qū)分開，而文字的大小及文字的字體亦可如原始文件一樣的判斷出來。

對待識別圖像進行如下預處理，可以降低特征提取算法的難度，并能提高識別的精度。

二值化：由于彩色圖像所含信息量過于巨大，在對圖像中印刷體字符進行識別處理前，需要對圖像進行二值化處理，使圖像只包含黑色的前景信息和白色的背景信息，提升識別處理的效率和精確度。

圖像降噪：由于待識別圖像的品質(zhì)受限于輸入設備、環(huán)境、以及文檔的印刷質(zhì)量，在對圖像中印刷體字符進行識別處理前，需要根據(jù)噪聲的特征對待識別圖像進行去噪處理，提升識別處理的精確度。

傾斜校正：由于掃描和拍攝過程涉及人工操作，輸入計算機的待識別圖像或多或少都會存在一些傾斜，在對圖像中印刷體字符進行識別處理前，就需要進行圖像方向檢測，并校正圖像方向。

文字特征抽?。簡我宰R別率而言，特征抽取可說是OCR的核心，用什么特征、怎么抽取，直接影響識別的好壞，也所以在OCR研究初期，特征抽取的研究報告特別的多。而特征可說是識別的籌碼，簡易的區(qū)分可分為兩類：一為統(tǒng)計的特征，如文字區(qū)域內(nèi)的黑/白點數(shù)比，當文字區(qū)分成好幾個區(qū)域時，這一個個區(qū)域黑/白點數(shù)比之聯(lián)合，就成了空間的一個數(shù)值向量，在比對時，基本的數(shù)學理論就足以應付了。而另一類特征為結(jié)構(gòu)的特征，如文字影像細線化后，取得字的筆劃端點、交叉點之數(shù)量及位置，或以筆劃段為特征，配合特殊的比對方法，進行比對，市面上的線上手寫輸入軟件的識別方法多以此種結(jié)構(gòu)的方法為主。

對比數(shù)據(jù)庫：當輸入文字算完特征后，不管是用統(tǒng)計或結(jié)構(gòu)的特征，都須有一比對數(shù)據(jù)庫或特征數(shù)據(jù)庫來進行比對，數(shù)據(jù)庫的內(nèi)容應包含所有欲識別的字集文字，根據(jù)與輸入文字一樣的特征抽取方法所得的特征群組。

對比識別：這是可充分發(fā)揮數(shù)學運算理論的一個模塊，根據(jù)不同的特征特性，選用不同的數(shù)學距離函數(shù)，較有名的比對方法有，歐式空間的比對方法、松弛比對法(Relaxation)、動態(tài)程序比對法(Dynamic Programming，DP)，以及類神經(jīng)網(wǎng)絡的數(shù)據(jù)庫建立及比對、HMM(Hidden Markov Model)…等著名的方法，為了使識別的結(jié)果更穩(wěn)定，也有所謂的專家系統(tǒng)(Experts System)被提出，利用各種特征比對方法的相異互補性，使識別出的結(jié)果，其信心度特別的高。

字詞后處理：由于OCR的識別率并無法達到百分之百，或想加強比對的正確性及信心值，一些除錯或甚至幫忙更正的功能，也成為OCR系統(tǒng)中必要的一個模塊。字詞后處理就是一例，利用比對后的識別文字與其可能的相似候選字群中，根據(jù)前后的識別文字找出最合乎邏輯的詞，做更正的功能。

字詞數(shù)據(jù)庫：為字詞后處理所建立的詞庫。

人工校正：OCR最后的關卡，在此之前，使用者可能只是拿支鼠標，跟著軟件設計的節(jié)奏操作或僅是觀看，而在此有可能須特別花使用者的精神及時間，去更正甚至找尋可能是OCR出錯的地方。一個好的OCR軟件，除了有一個穩(wěn)定的影像處理及識別核心，以降低錯誤率外，人工校正的操作流程及其功能，亦影響OCR的處理效率，因此，文字影像與識別文字的對照，及其屏幕信息擺放的位置、還有每一識別文字的候選字功能、拒認字的功能、及字詞后處理后特意標示出可能有問題的字詞，都是為使用者設計盡量少使用鍵盤的一種功能，當然，不是說系統(tǒng)沒顯示出的文字就一定正確，就像完全由鍵盤輸入的工作人員也會有出錯的時候，這時要重新校正一次或能允許些許的錯，就完全看使用單位的需求了。

結(jié)果輸出：有人只要文本文件作部份文字的再使用之用，所以只要一般的文字文件、有人要漂漂亮亮的和輸入文件一模一樣，所以有原文重現(xiàn)的功能、有人注重表格內(nèi)的文字，所以要和Excel等軟件結(jié)合。無論怎么變化，都只是輸出檔案格式的變化而已。如果需要還原成原文一樣格式，則在識別后，需要人工排版，耗時耗力。

如果關鍵特征為音頻，則預設所述關鍵特征對應的關鍵音頻；提取所述節(jié)目內(nèi)容對應的音頻數(shù)據(jù)，并從中篩選包含所述關鍵音頻的音頻數(shù)據(jù)作為音頻信息；將所述音頻信息作為所述關鍵特征。

實際上節(jié)目內(nèi)容文件中的節(jié)目內(nèi)容信息是可以分離的，通常也是分開存放的。但是音頻和節(jié)目內(nèi)容是嚴格同步的。因而，獲取相應的音頻數(shù)據(jù)的時間點可以準確的了解到節(jié)目內(nèi)容播放的時間點。通常來說，音頻數(shù)據(jù)的識別是相對容易的?，F(xiàn)有技術中也存在很多的音頻識別技術，例如，最常用的語音識別等。

現(xiàn)有的語音識別方法主要是模式匹配法。

在訓練階段，用戶將詞匯表中的每一詞依次說一遍，并且將其特征矢量作為模板存入模板庫。

在識別階段，將輸入語音的特征矢量依次與模板庫中的每個模板進行相似度比較，將相似度最高者作為識別結(jié)果輸出。

語音識別系統(tǒng)選擇識別基元的要求是，有準確的定義，能得到足夠數(shù)據(jù)進行訓練，具有一般性。英語通常采用上下文相關的音素建模，漢語的協(xié)同發(fā)音不如英語嚴重，可以采用音節(jié)建模。系統(tǒng)所需的訓練數(shù)據(jù)大小與模型復雜度有關。模型設計得過于復雜以至于超出了所提供的訓練數(shù)據(jù)的能力，會使得性能急劇下降。

聽寫機：大詞匯量、非特定人、連續(xù)語音識別系統(tǒng)通常稱為聽寫機。其架構(gòu)就是建立在前述聲學模型和語言模型基礎上的HMM拓撲結(jié)構(gòu)。訓練時對每個基元用前向后向算法獲得模型參數(shù)，識別時，將基元串接成詞，詞間加上靜音模型并引入語言模型作為詞間轉(zhuǎn)移概率，形成循環(huán)結(jié)構(gòu)，用Viterbi算法進行解碼。針對漢語易于分割的特點，先進行分割再對每一段進行解碼，是用以提高效率的一個簡化方法。

如果關鍵特征為畫面，則預設所述關鍵特征對應的關鍵畫面；獲取所述節(jié)目內(nèi)容中每一節(jié)目內(nèi)容幀的畫面信息，并從中篩選包含所述關鍵畫面的畫面信息對應的關鍵視頻幀；將所述關鍵視頻幀作為所述關鍵特征。

這種方法相對簡單，畫面的話，僅需要提取節(jié)目內(nèi)容中的每一幀，用以進行圖像的比對識別即可?，F(xiàn)有技術中同樣有較多的方案可以實現(xiàn)圖像的比對。

本步驟中，用以設定和獲取節(jié)目內(nèi)容中的關鍵特征，這些關鍵特征是預先設定的，并且是與后續(xù)的互動內(nèi)容相關聯(lián)的。不同的關鍵特征對應不同的互動內(nèi)容。

步驟12，根據(jù)關鍵特征，配置對應的互動內(nèi)容。

獲取了關鍵特征后，目的還在于將關鍵特征與相應的互動內(nèi)容對應起來。這里的互動內(nèi)容是需要與關鍵特征關聯(lián)并最終展示給用戶的。因而，這的關鍵特征與互動內(nèi)容是一一對應的，也是預先設定的。設定了互動內(nèi)容后，才可以根據(jù)該互動內(nèi)容設置相應的關鍵特征?；觾?nèi)容是最終展示給用戶的，因而，互動內(nèi)容還需要設置相應的展示形式。本實施例對互動內(nèi)容的展示形式不做限定。

步驟13，向用戶推送互動內(nèi)容。

這里的互動內(nèi)容與節(jié)目內(nèi)容的同步，指的是互動內(nèi)容與節(jié)目內(nèi)容之間的時間對應。獲取所述關鍵特征在所述節(jié)目內(nèi)容中出現(xiàn)的關鍵特征時間點；根據(jù)所述關鍵特征時間點，配置所述互動內(nèi)容與所述節(jié)目內(nèi)容同步展示的時間點。

根據(jù)所述互動內(nèi)容與所述節(jié)目內(nèi)容同步展示的時間點，實時配置所述互動內(nèi)容與所述節(jié)目內(nèi)容的同步。

也就是說，互動內(nèi)容是在關鍵特征出現(xiàn)的時候才推送給用戶的，只有在節(jié)目內(nèi)容播放到關鍵特征的時候，互動內(nèi)容才推送推送給用戶。這就需要互動內(nèi)容獲取關鍵特征在節(jié)目內(nèi)容中出現(xiàn)的時間點，然后根據(jù)這個時間點設置互動內(nèi)容展示推送的時間點。

通常，互動內(nèi)容的展示與節(jié)目內(nèi)容播放是實時的，節(jié)目內(nèi)容播放過程中，實時哦獲取關鍵特征并與互動內(nèi)容對應，然后實時的展示推送給用戶。對于用戶來說，當觀看節(jié)目內(nèi)容到出現(xiàn)關鍵特征的時候，則同時會收到一個與關鍵特征相關的互動內(nèi)容，這個互動內(nèi)容因為是與節(jié)目內(nèi)容正在播放的關鍵特征也就是節(jié)目內(nèi)容正在播放的內(nèi)容是相關的，因而，用戶的體驗度很好。

通常來說，用戶可以是微信用戶，而微信用戶參與互動的方式包括關注微信公眾賬號、通過微信搖電視功能等。例如，用戶可以在觀看電視時候，進行搖一搖的操作，而本實施例可以提供給用戶與電視內(nèi)容向匹配對應的搖一搖后臺互動內(nèi)容。

實際上，本實施例的支撐平臺不只是為微信用戶提供服務的，也不僅僅時微信搖一搖應用的一個集中支撐平臺，而是一個應用的管理支撐平臺。這個支撐平臺是搖一搖的后臺管理系統(tǒng)，通過微信公眾號接入微信平臺，根據(jù)微信用戶的搖一搖信息來進行相關的操作。

微信搖一搖是指騰訊公司推出的微信內(nèi)的一個隨機交友應用，通過搖手機或點擊按鈕模擬搖一搖，可以匹配到同一時段觸發(fā)該功能的微信用戶，從而增加用戶間的互動和微信粘度。進入搖一搖界面，輕搖手機，微信會幫您搜尋同一時刻搖晃手機的人——聚會上一起搖，會快速幫您列出一起搖的朋友；千里搖一搖，可以為您匹配這個世界上同時也在手機的朋友。

微信搖一搖還開發(fā)了搖歌曲、搖電視等應用。搖電視，又稱搖TV，是微信于2015年春節(jié)后推出的網(wǎng)友與電視互動功能，用戶打開微信“搖電視”搖一搖，就可以搖出電視節(jié)目相關的頁面，并參與節(jié)目互動。微信“搖一搖”技術與電視節(jié)目相融合，給觀眾帶來全新的收視體驗，被認為將帶來電視媒體的第二春。

“微信搖電視”互動模式強調(diào)網(wǎng)絡與電視的連通、媒體與受眾的互動。觀眾在觀看電視臺各頻道節(jié)目時，打開手機微信搖一搖，進入搖歌曲選項，對著電視搖一搖，就可以進入“微信搖電視”界面，實時參與各欄目推出的互動交流活動。觀眾可以通過“微信搖電視”互動模式點擊景點介紹和旅游攻略，獲取最新優(yōu)惠信息，贏得門票；通過互動答題，成為歷史文化達人；通過電視節(jié)目的交互，成為新聞的參與者和評論者；參與美食節(jié)目的預定和打折活動；參與電視節(jié)目的有獎競猜、投票，調(diào)查，并獲取各種獎品。

微信用戶打開搖一搖功能，進行搖電視的操作后，微信平臺獲取微信用戶的搖一搖信息，也就是搖一搖用戶信息，根據(jù)當前搖一搖用戶以及對應的電視內(nèi)容，生成用戶標識和電視內(nèi)容參數(shù)，并會同用戶基本信息，一同發(fā)送后臺服務器。這里的用戶標識是根據(jù)用戶自身來設置的，用以唯一區(qū)分用戶身份，也就是用戶的ID。用戶基本信息是用戶注冊微信時候提供的基本用戶信息，包括用戶的基本愛好信息、分類信息等，本實施例對此不做限定。

電視內(nèi)容參數(shù)是根據(jù)搖電視功能對應的電視內(nèi)容來設定的。用戶在搖電視的時候，接收電視音頻信號，需要預先設置相應的電視內(nèi)容參數(shù)，據(jù)此確定用戶在搖電視的時候?qū)碾娨晝?nèi)容。例如，用戶在收看某一頻道的電視節(jié)目時候進行搖電視操作，則這個電視內(nèi)容參數(shù)即為該頻道的電視內(nèi)容參數(shù)。

微信用戶互動操作的信息內(nèi)容自本地上傳，或調(diào)用微信用戶與相應公眾號互動的內(nèi)容。微信用戶在公眾號頁面根據(jù)提示輸入互動操作信息內(nèi)容。微信用戶能夠?qū)斎氲男畔?nèi)容進行格式編輯和整理。

微信用戶進行互動操作時，直接輸入文字、圖片、音頻或視頻信息；或輸入文字、圖片、音頻或視頻信息的鏈接。

互動操作的信息內(nèi)容包括但不限于文字、圖片、音頻或視頻材料，還可以包括鏈接地址以及鏈接內(nèi)容等。所有形式的視頻直播內(nèi)容均可以由用戶自行編輯，格式由用戶選擇，展示形式同樣由用戶選擇。

如圖2所示，為本發(fā)明實施例2提供的一種互動內(nèi)容關聯(lián)推送系統(tǒng)結(jié)構(gòu)示意圖，其中，

關鍵特征提取單元21，用于提取節(jié)目內(nèi)容中的關鍵特征；所述關鍵特征包括關鍵詞、關鍵音頻或關鍵幀；

互動內(nèi)容設置單元22，用于根據(jù)所述關鍵特征，配置對應的互動內(nèi)容；

同步推送單元23，用于向用戶推送所述互動內(nèi)容。

進一步的，上述的同步推送單元23還用于：

獲取所述關鍵特征在所述節(jié)目內(nèi)容中出現(xiàn)的關鍵特征時間點；

根據(jù)所述關鍵特征時間點，配置所述互動內(nèi)容向用戶推送的時間點。

進一步的，上述互動內(nèi)容設置單元22，還用于預先設置和管理所述互動內(nèi)容。

如圖3所示，上述關鍵特征提取單元21進一步包括：

關鍵特征預設子單元211，用于預設所述關鍵特征對應的關鍵詞、關鍵音頻或關鍵畫面；

篩選子單元212，用于獲取所述節(jié)目內(nèi)容中每一節(jié)目內(nèi)容幀的文字信息，并從中篩選包含所述關鍵詞的文字信息作為關鍵文字；或提取所述節(jié)目內(nèi)容對應的音頻數(shù)據(jù)，并從中篩選包含所述關鍵音頻的音頻數(shù)據(jù)作為音頻信息；或獲取所述節(jié)目內(nèi)容中每一節(jié)目內(nèi)容幀的畫面信息，并從中篩選包含所述關鍵畫面的畫面信息對應的關鍵視頻幀；

設置子單元213，用于將所述關鍵文字、音頻信息或關鍵視頻幀作為所述關鍵特征。

綜上所述，本發(fā)明實施例中，通過提取節(jié)目內(nèi)容中的關鍵特征；所述關鍵特征包括關鍵詞、關鍵音頻或關鍵畫面；根據(jù)所述關鍵特征，配置對應的互動內(nèi)容；向用戶推送所述互動內(nèi)容。本發(fā)明實施例的方案，能夠在節(jié)目內(nèi)容播放的過程中，實時根據(jù)節(jié)目播放的內(nèi)容獲取其中的關鍵特征，根據(jù)所述關鍵特征為用戶設定對應的推送互動內(nèi)容，與節(jié)目內(nèi)容中該關鍵特征播放時間點同步推送給用戶，使得用戶可以在觀看節(jié)目內(nèi)容的過程中，根據(jù)節(jié)目內(nèi)容獲取到相應的推送互動內(nèi)容，極大的提高用戶體驗度。

本領域內(nèi)的技術人員應明白，本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此，本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且，本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學存儲器等)上實施的計算機程序產(chǎn)品的形式。

本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合?？商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設備的處理器以產(chǎn)生一個機器，使得通過計算機或其他可編程數(shù)據(jù)處理設備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。

這些計算機程序指令也可存儲在能引導計算機或其他可編程數(shù)據(jù)處理設備以特定方式工作的計算機可讀存儲器中，使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品，該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。

這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設備上，使得在計算機或其他可編程設備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理，從而在計算機或其他可編程設備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。

顯然，本領域的技術人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣，倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術的范圍之內(nèi)，則本發(fā)明也意圖包含這些改動和變型在內(nèi)。

完整全部詳細技術資料下載

當前第1頁1 2 3