一種在線數(shù)字媒體分類的快速特征提取方法

文檔序號：6472020閱讀：298來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種在線數(shù)字媒體分類的快速特征提取方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種數(shù)字媒體分類的處理方法，特別涉及一種在線數(shù)字媒體分類的快速特征提取方法。
背景技術(shù)：
當前，視頻、音頻、媒體等數(shù)字媒體廣泛應(yīng)用于各行各業(yè)中，數(shù)字媒體的積累也越
來越多。在很多在線應(yīng)用中都需要對數(shù)字媒體進行實時分類，例如Web視頻搜索、Web
媒體搜索、帶媒體的Web網(wǎng)頁分類等。在這樣的任務(wù)中，速度是一個非常重要的因素。
為了進行數(shù)字媒體分類，首先要從數(shù)字媒體對象中提取一組事先設(shè)定的特征，用這些特
征來對數(shù)字媒體對象進行表示，在此基礎(chǔ)上再進行分類。目前的技術(shù)是在遇到一個待分
類數(shù)字媒體對象時，把事先設(shè)定的所有特征都提取出來，然后將這些特征信息提交給預(yù)
測模型進行分類。這樣的做法忽略了一個問題，即對具體的一個數(shù)字媒體對象來說，往
往只需使用一部分特征就可以進行有效分類，提取其他特征所使用的時間就成為一種浪
費。為了提高速度，可以考慮不為每個數(shù)字媒體對象提取全部特征，具體來說，對"簡
單"的對象只提取少量特征，而對"復(fù)雜"的對象提取更多的特征，這樣就可以節(jié)省用
于特征提取的時間開銷，從而提高處理速度。

發(fā)明內(nèi)容
發(fā)明目的本發(fā)明針對目前在線數(shù)字媒體分類方法中存在由于提取不必要的特征而帶來計算資源和時間額外開銷的問題，提出一種自適應(yīng)提取數(shù)字媒體對象特征的分類方法，該方法自動地為相對容易處理的數(shù)字媒體對象提取少量特征、為相對難以處理的數(shù) 字媒體對象提取較多特征，從而提高在線數(shù)字媒體處理的速度。
技術(shù)方案本發(fā)明所述的一種在線數(shù)字媒體分類的快速特征提取方法，其數(shù)字媒體分類裝置的分類流程如圖1所示。首先，數(shù)字媒體分類裝置需要將訓(xùn)練媒體對象轉(zhuǎn)換成特征表示。用戶要有一個媒體庫，其中的媒體對象均帶有類標記。將數(shù)字媒體對象輸入到特征提取算法中，得到媒體對象的特征向量。數(shù)字媒體對象的特征提取方法有很多種，一種方法對應(yīng)于一個特征，例如，對于一幅圖像，其對比度就是該對象的一個特征。記特征總的個數(shù)為"。然后將媒體的特征向量和媒體的類標記輸入一個預(yù)測模型的建模算法，得到一個預(yù)測模型。在預(yù)測階段，用戶將待預(yù)測媒體對象輸入預(yù)測模型，預(yù)測模型輸出媒體對象的類標記。在預(yù)測階段的時間開銷是提取待預(yù)測媒體對象特征的時間開銷之和再加上預(yù)測模型對特征向量的分類時間，而對特征向量的分類時間一般開銷很少，所以提取媒體對象特征時間開銷成為減少總的預(yù)測時間開銷的瓶頸。本發(fā)明提供一種適用于在線數(shù)字媒體分類的自適應(yīng)特征提取機制，通過以下步驟來實現(xiàn)對媒體對象的高效分類(1)如果預(yù)測模型尚未建立，執(zhí)行步驟2，否則轉(zhuǎn)入步驟5; (2)將特征按提取時間開銷排序；(3)按序提取訓(xùn)練媒體對象的特征；(4)按序訓(xùn)練一個備選子預(yù)測模型序列；(5)提取待預(yù)測媒體對象的特征；(6)使用對應(yīng)于所提取特征的子預(yù)測模型對待預(yù)測媒體對象分類；(7)如果該子預(yù)測模型的預(yù)測置信度不夠高且還有可提取的特征，則轉(zhuǎn)入步驟5，提取更多的特征，否則轉(zhuǎn)入步驟8; (8)輸出媒體對象的類標記；(9) 結(jié)束。
有益效果本發(fā)明自動地對"簡單"的對象只提取少量特征，而對"復(fù)雜"的對象提取更多的特征，這樣就可以節(jié)省用于特征提取的時間開銷，從而提高在線數(shù)字媒體處理的速度。

圖1是數(shù)字媒體分類裝置工作流程圖。
圖2是本發(fā)明的流程圖。
圖3是本發(fā)明的備選子預(yù)測模型序列的建模流程圖。圖4是本發(fā)明中預(yù)測模型的分類流程圖。
具體實施例方式
下面將結(jié)合附圖對本發(fā)明的實施例進行詳細說明。
本發(fā)明的主要流程如圖2所示。步驟10是起始動作。步驟11判斷預(yù)測模型是否己經(jīng)訓(xùn)練好，如果是則轉(zhuǎn)入步驟15，否則轉(zhuǎn)入步驟12，訓(xùn)練預(yù)測模型。步驟12按照特征的提取時間開銷從小到大將特征排序。步驟13按照特征順序，依次將訓(xùn)練集中媒體對象的特征提取出來。步驟14使用已經(jīng)提取的特征構(gòu)建一個備選子預(yù)測模型序列，其詳細說明如圖3所示。步驟15使用建好的預(yù)測模型對沒有類標記的對象進行分類，其詳細說明如圖4所示。算法在步驟16中輸出結(jié)果，結(jié)束于步驟17。
圖3詳細解釋了圖2中步驟14的建模過程，具體說明了在建模過程中如何訓(xùn)練一個備選子預(yù)測模型序列。本算法使用的子預(yù)測模型是機器學(xué)習(xí)教科書中的支持向量機 (以下均記為SVM)。這種預(yù)測模型具有結(jié)構(gòu)簡單，分類準確度高，分類速度快等優(yōu)點。 SVM的基本原理是在特征空間中確定一個線性分界面將樣本分成兩類。以下是詳細步驟。步驟140是起始動作。步驟141將特征計數(shù)器j'設(shè)置為0。步驟142至步驟144是一個循環(huán)，逐次使用更多特征訓(xùn)練子預(yù)測模型。步驟142中，特征計數(shù)器J'加1。步驟 143使用訓(xùn)練集合中媒體對象的前J個特征輸入到學(xué)習(xí)算法，建立一個SVM子預(yù)測模型 SVM,，該子模型在分類時能夠?qū)μ崛×饲癑'個特征的媒體對象進行分類。在步驟144中，如果j〈 ^表示還有更多的特征可用，則轉(zhuǎn)步驟142,建立一個特征個數(shù)多1的子預(yù) 測模型，否則，在步驟145中輸出所有的子預(yù)測模型，并結(jié)束。這是本算法的建模步驟，共輸出含有"個子預(yù)測模型的序列，在該序列中，每個子模型比前一個子模型多使用一個特征。
圖4詳細解釋了圖2中步驟15的分類過程。本發(fā)明的預(yù)測模型分類步驟中，從提取時間開銷小的特征開始逐次提取特征，并將所有已提取特征交給相應(yīng)子預(yù)測模型。若其分類置信度高于置信度閾值t力r，則不提取更多的特征，以縮減提取特征的總時間，其中分類置信度閾值t力r由用戶來設(shè)定。步驟150是初始動作。在步驟151中模型接受用戶要分類的媒體對象I。步驟152將特征計數(shù)器j'初始化為0。步驟153將計數(shù)器J 加1。步驟154按照特征順序提取第J個特征值。步驟155將前J個特征值作為媒體對象I的特征向量x輸入到第j'個預(yù)測模型SVM,。步驟156中，計算特征向量;c距離SVM, 的分界面的距離"作為該子預(yù)測模型的分類置信度，歷計算方法如下
其中SVM,表示為(r,扮。在步驟157中，如果y 7a/^，則表明SVM,.對樣本分類的置信度不夠高，并且J'〈A表明還有更多的特征可提取，則返回步驟153，提取更多的媒體對象特征；如果步驟157中條件不成立，子預(yù)測模型SVM,.的輸出作為為樣本的最終類標記，在步驟158中輸出。步驟157中的置信度閾值"r為用戶提供了一種對準確率和時間開銷進行折中的機制。當用戶將該閾值設(shè)置得比較大時，媒體對象往往需要提取更多的特征，時間開銷較大，但同時對其分類的置信度和最終的準確率會比較高，反之，如果閾值比較小，準確率可能會略有下降，但會在很大程度上減少時間開銷。這種機制滿足了不同用戶的需求。步驟159結(jié)束操作。
以上描述的機制在使用標準SVM預(yù)測模型時適用于解決兩類問題，當媒體對象的類別為f(D2)類時，可以容易地使用機器學(xué)習(xí)教科書中的"一對多分解"技術(shù)進行推廣(即每次將一個類別作為"目標類"，所有其他類別之并集作為"對比類"，從而轉(zhuǎn)化為一個標準SVM可以解決的兩類問題；通過這樣的方法，可以將原來的一個多類問題轉(zhuǎn)化為一系列的兩類問題求解)。此時步驟143將為每一類對象建立SVM預(yù)測模型，以判斷測試對象是否屬于該類，例如在第y步，對于第c類樣本要建立一個子預(yù)測模型SVMw，判斷樣本是否屬于該類；步驟14的輸出將是C個SVM序列。在預(yù)測過程中，步驟154 每提取一個媒體對象特征后，將使用C個相應(yīng)的SVM同時對該樣本進行分類。步驟156 中將計算樣本到C個SVM分界面的距離。步驟157將根據(jù)C個SVM預(yù)測模型的輸出來判斷預(yù)測置信度是否足夠，當樣本被某個SVM判定為屬于本類(假設(shè)為第c類)，并且樣本距其分界面的距離大于^r，并且其他1個SVM都不將樣本判定為各自對應(yīng)的目標類，此時預(yù)測結(jié)果輸出為c類，否則認為該樣本的分類置信度不夠，應(yīng)當提取更多的特征，直到無更多的特征可利用為止。
熟知本領(lǐng)域的人士將理解，雖然這里為了便于解釋己描述了具體實施例，但是可在
不背離本發(fā)明精神和范圍的情況下作出各種改變。因此，除了所附權(quán)利要求之外不能用于限制本發(fā)明。
權(quán)利要求
1、一種在線數(shù)字媒體分類的快速特征提取方法，其特征是該方法包括以下步驟(1)起始；(2)檢測預(yù)測模型是否已訓(xùn)練好，如果預(yù)測模型尚未建立，執(zhí)行步驟3，否則轉(zhuǎn)入步驟6；(3)將媒體對象的特征按提取時間開銷排序；(4)按序提取訓(xùn)練媒體對象的特征；(5)按序訓(xùn)練一組備選子預(yù)測模型序列；(6)使用子模型序列對媒體對象進行分類；(7)輸出媒體對象的分類標記；(8)結(jié)束。
2、根據(jù)權(quán)利要求1所述的一種在線數(shù)字媒體分類的快速特征提取方法，其特征是步驟(5)按序訓(xùn)練一組備選子預(yù)測模型序列的具體步驟是(51) 起始；(52) 將特征計數(shù)器J設(shè)置為O，其中J為特征個數(shù)；(53) 特征計數(shù)器J'加1;(54) 使用訓(xùn)練集合中媒體對象的前j'個特征輸入到學(xué)習(xí)算法，建立一個SVM子預(yù) 測模型SVM"該子模型在分類時能夠?qū)μ崛×饲?'個特征的媒體對象進行分類，其中 SVM為支持向量機；(55) 如果j'〈 d表示還有更多的特征可用，則轉(zhuǎn)步驟53，建立一個特征個數(shù)j' 加l的子預(yù)測模型，否則，轉(zhuǎn)到步驟56，其中V表示媒體對象總的特征個數(shù)；(56) 輸出所有的子預(yù)測模型；(57) 結(jié)束。
3、根據(jù)權(quán)利要求1所述的一種在線數(shù)字媒體分類的快速特征提取方法，其特征是步驟(6)使用子模型序列對媒體對象進行分類的具體步驟是(61) 起始；(62) 模型接受用戶要分類的媒體對象I;(63) 將特征計數(shù)器J'初始化為0;(64) 將計數(shù)器J'加1;(65) 按照特征順序提取第/個特征值；(66) 將前個特征值作為媒體對象I的特征向量x輸入到第/個預(yù)測模型SVM"(67) 計算特征向量;c距離SVM,的分界面的距離歷，忍為子預(yù)測模型的分類置信度；(68) 如果Wt力r，則表明SVM,對樣本分類的置信度不夠高，并且y^，表明還有更多的特征可提取，則返回步驟64;如果不滿足/Kt力r且j'〈A則轉(zhuǎn)到步驟69，為置信度閾值；(69) SVM,的輸出作為I的標記； (610)結(jié)束。
全文摘要
本發(fā)明提供一種在線數(shù)字媒體分類的自適應(yīng)特征提取方法，通過以下步驟來實現(xiàn)對媒體對象的高效分類(1)起始；(2)檢測預(yù)測模型是否已訓(xùn)練好，如果預(yù)測模型尚未建立，執(zhí)行步驟3，否則轉(zhuǎn)入步驟6；(3)將特征按提取時間開銷排序；(4)按序提取訓(xùn)練媒體對象的特征；(5)按序訓(xùn)練一組備選子預(yù)測模型序列；(6)使用子模型序列對媒體對象進行分類；(7)輸出媒體對象的分類標記；(8)結(jié)束。該方法自動地對“簡單”的對象只提取少量特征，而對“復(fù)雜”的對象提取更多的特征，這樣就可以節(jié)省用于特征提取的時間開銷，從而提高在線數(shù)字媒體處理的速度。
文檔編號G06K9/62GK101419632SQ20081024314
公開日2009年4月29日申請日期2008年12月9日優(yōu)先權(quán)日2008年12月9日
發(fā)明者揚俞, 劉力平, 周志華, 遠姜申請人:南京大學(xué)

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：周志華;劉力平;俞揚;姜遠
技術(shù)所有人：南京大學(xué)
我是此專利的發(fā)明人

上一篇：基于仿射不變點及光流計算的目標自動識別和跟蹤方法
上一篇：一種紅外激光筆遙指虛擬觸摸系統(tǒng)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

svm分類器特征提取相關(guān)技術(shù)

圖像的特征提取和分類相關(guān)技術(shù)

多媒體技術(shù)的主要特征相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種在線數(shù)字媒體分類的快速特征提取方法