專利名稱:一種在線數(shù)字媒體分類的快速特征提取方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種數(shù)字媒體分類的處理方法,特別涉及一種在線數(shù)字媒體分類的快速 特征提取方法。
背景技術(shù):
當前,視頻、音頻、媒體等數(shù)字媒體廣泛應(yīng)用于各行各業(yè)中,數(shù)字媒體的積累也越
來越多。在很多在線應(yīng)用中都需要對數(shù)字媒體進行實時分類,例如Web視頻搜索、Web
媒體搜索、帶媒體的Web網(wǎng)頁分類等。在這樣的任務(wù)中,速度是一個非常重要的因素。
為了進行數(shù)字媒體分類,首先要從數(shù)字媒體對象中提取一組事先設(shè)定的特征,用這些特
征來對數(shù)字媒體對象進行表示,在此基礎(chǔ)上再進行分類。目前的技術(shù)是在遇到一個待分
類數(shù)字媒體對象時,把事先設(shè)定的所有特征都提取出來,然后將這些特征信息提交給預(yù)
測模型進行分類。這樣的做法忽略了一個問題,即對具體的一個數(shù)字媒體對象來說,往
往只需使用一部分特征就可以進行有效分類,提取其他特征所使用的時間就成為一種浪
費。為了提高速度,可以考慮不為每個數(shù)字媒體對象提取全部特征,具體來說,對"簡
單"的對象只提取少量特征,而對"復(fù)雜"的對象提取更多的特征,這樣就可以節(jié)省用
于特征提取的時間開銷,從而提高處理速度。
發(fā)明內(nèi)容
發(fā)明目的本發(fā)明針對目前在線數(shù)字媒體分類方法中存在由于提取不必要的特征而 帶來計算資源和時間額外開銷的問題,提出一種自適應(yīng)提取數(shù)字媒體對象特征的分類方 法,該方法自動地為相對容易處理的數(shù)字媒體對象提取少量特征、為相對難以處理的數(shù) 字媒體對象提取較多特征,從而提高在線數(shù)字媒體處理的速度。
技術(shù)方案本發(fā)明所述的一種在線數(shù)字媒體分類的快速特征提取方法,其數(shù)字媒體 分類裝置的分類流程如圖1所示。首先,數(shù)字媒體分類裝置需要將訓(xùn)練媒體對象轉(zhuǎn)換成 特征表示。用戶要有一個媒體庫,其中的媒體對象均帶有類標記。將數(shù)字媒體對象輸入 到特征提取算法中,得到媒體對象的特征向量。數(shù)字媒體對象的特征提取方法有很多種, 一種方法對應(yīng)于一個特征,例如,對于一幅圖像,其對比度就是該對象的一個特征。記 特征總的個數(shù)為"。然后將媒體的特征向量和媒體的類標記輸入一個預(yù)測模型的建模算 法,得到一個預(yù)測模型。在預(yù)測階段,用戶將待預(yù)測媒體對象輸入預(yù)測模型,預(yù)測模型 輸出媒體對象的類標記。在預(yù)測階段的時間開銷是提取待預(yù)測媒體對象特征的時間開銷之和再加上預(yù)測模型對特征向量的分類時間,而對特征向量的分類時間一般開銷很少, 所以提取媒體對象特征時間開銷成為減少總的預(yù)測時間開銷的瓶頸。本發(fā)明提供一種適 用于在線數(shù)字媒體分類的自適應(yīng)特征提取機制,通過以下步驟來實現(xiàn)對媒體對象的高效 分類(1)如果預(yù)測模型尚未建立,執(zhí)行步驟2,否則轉(zhuǎn)入步驟5; (2)將特征按提取 時間開銷排序;(3)按序提取訓(xùn)練媒體對象的特征;(4)按序訓(xùn)練一個備選子預(yù)測模型 序列;(5)提取待預(yù)測媒體對象的特征;(6)使用對應(yīng)于所提取特征的子預(yù)測模型對待 預(yù)測媒體對象分類;(7)如果該子預(yù)測模型的預(yù)測置信度不夠高且還有可提取的特征, 則轉(zhuǎn)入步驟5,提取更多的特征,否則轉(zhuǎn)入步驟8; (8)輸出媒體對象的類標記;(9) 結(jié)束。
有益效果本發(fā)明自動地對"簡單"的對象只提取少量特征,而對"復(fù)雜"的對象 提取更多的特征,這樣就可以節(jié)省用于特征提取的時間開銷,從而提高在線數(shù)字媒體處 理的速度。
圖1是數(shù)字媒體分類裝置工作流程圖。
圖2是本發(fā)明的流程圖。
圖3是本發(fā)明的備選子預(yù)測模型序列的建模流程圖。 圖4是本發(fā)明中預(yù)測模型的分類流程圖。
具體實施例方式
下面將結(jié)合附圖對本發(fā)明的實施例進行詳細說明。
本發(fā)明的主要流程如圖2所示。步驟10是起始動作。步驟11判斷預(yù)測模型是否 己經(jīng)訓(xùn)練好,如果是則轉(zhuǎn)入步驟15,否則轉(zhuǎn)入步驟12,訓(xùn)練預(yù)測模型。步驟12按照特 征的提取時間開銷從小到大將特征排序。步驟13按照特征順序,依次將訓(xùn)練集中媒體 對象的特征提取出來。步驟14使用已經(jīng)提取的特征構(gòu)建一個備選子預(yù)測模型序列,其 詳細說明如圖3所示。步驟15使用建好的預(yù)測模型對沒有類標記的對象進行分類,其 詳細說明如圖4所示。算法在步驟16中輸出結(jié)果,結(jié)束于步驟17。
圖3詳細解釋了圖2中步驟14的建模過程,具體說明了在建模過程中如何訓(xùn)練一 個備選子預(yù)測模型序列。本算法使用的子預(yù)測模型是機器學(xué)習(xí)教科書中的支持向量機 (以下均記為SVM)。這種預(yù)測模型具有結(jié)構(gòu)簡單,分類準確度高,分類速度快等優(yōu)點。 SVM的基本原理是在特征空間中確定一個線性分界面將樣本分成兩類。以下是詳細步 驟。步驟140是起始動作。步驟141將特征計數(shù)器j'設(shè)置為0。步驟142至步驟144是一個循環(huán),逐次使用更多特征訓(xùn)練子預(yù)測模型。步驟142中,特征計數(shù)器J'加1。步驟 143使用訓(xùn)練集合中媒體對象的前J個特征輸入到學(xué)習(xí)算法,建立一個SVM子預(yù)測模型 SVM,,該子模型在分類時能夠?qū)μ崛×饲癑'個特征的媒體對象進行分類。在步驟144中, 如果j〈 ^表示還有更多的特征可用,則轉(zhuǎn)步驟142,建立一個特征個數(shù)多1的子預(yù) 測模型,否則,在步驟145中輸出所有的子預(yù)測模型,并結(jié)束。這是本算法的建模步驟, 共輸出含有"個子預(yù)測模型的序列,在該序列中,每個子模型比前一個子模型多使用一 個特征。
圖4詳細解釋了圖2中步驟15的分類過程。本發(fā)明的預(yù)測模型分類步驟中,從提 取時間開銷小的特征開始逐次提取特征,并將所有已提取特征交給相應(yīng)子預(yù)測模型。若 其分類置信度高于置信度閾值t力r,則不提取更多的特征,以縮減提取特征的總時間, 其中分類置信度閾值t力r由用戶來設(shè)定。步驟150是初始動作。在步驟151中模型接受 用戶要分類的媒體對象I。步驟152將特征計數(shù)器j'初始化為0。步驟153將計數(shù)器J 加1。步驟154按照特征順序提取第J個特征值。步驟155將前J個特征值作為媒體對 象I的特征向量x輸入到第j'個預(yù)測模型SVM,。步驟156中,計算特征向量;c距離SVM, 的分界面的距離"作為該子預(yù)測模型的分類置信度,歷計算方法如下
其中SVM,表示為(r,扮。在步驟157中,如果y 7a/^,則表明SVM,.對樣本分類的置信度 不夠高,并且J'〈A表明還有更多的特征可提取,則返回步驟153,提取更多的媒體對 象特征;如果步驟157中條件不成立,子預(yù)測模型SVM,.的輸出作為為樣本的最終類標 記,在步驟158中輸出。步驟157中的置信度閾值"r為用戶提供了一種對準確率和時 間開銷進行折中的機制。當用戶將該閾值設(shè)置得比較大時,媒體對象往往需要提取更多 的特征,時間開銷較大,但同時對其分類的置信度和最終的準確率會比較高,反之,如 果閾值比較小,準確率可能會略有下降,但會在很大程度上減少時間開銷。這種機制滿 足了不同用戶的需求。步驟159結(jié)束操作。
以上描述的機制在使用標準SVM預(yù)測模型時適用于解決兩類問題,當媒體對象的類 別為f(D2)類時,可以容易地使用機器學(xué)習(xí)教科書中的"一對多分解"技術(shù)進行推 廣(即每次將一個類別作為"目標類",所有其他類別之并集作為"對比類",從而轉(zhuǎn)化 為一個標準SVM可以解決的兩類問題;通過這樣的方法,可以將原來的一個多類問題轉(zhuǎn)化為一系列的兩類問題求解)。此時步驟143將為每一類對象建立SVM預(yù)測模型,以判 斷測試對象是否屬于該類,例如在第y步,對于第c類樣本要建立一個子預(yù)測模型SVMw, 判斷樣本是否屬于該類;步驟14的輸出將是C個SVM序列。在預(yù)測過程中,步驟154 每提取一個媒體對象特征后,將使用C個相應(yīng)的SVM同時對該樣本進行分類。步驟156 中將計算樣本到C個SVM分界面的距離。步驟157將根據(jù)C個SVM預(yù)測模型的輸出來判 斷預(yù)測置信度是否足夠,當樣本被某個SVM判定為屬于本類(假設(shè)為第c類),并且樣 本距其分界面的距離大于^r,并且其他1個SVM都不將樣本判定為各自對應(yīng)的目標 類,此時預(yù)測結(jié)果輸出為c類,否則認為該樣本的分類置信度不夠,應(yīng)當提取更多的特 征,直到無更多的特征可利用為止。
熟知本領(lǐng)域的人士將理解,雖然這里為了便于解釋己描述了具體實施例,但是可在
不背離本發(fā)明精神和范圍的情況下作出各種改變。因此,除了所附權(quán)利要求之外不能用 于限制本發(fā)明。
權(quán)利要求
1、一種在線數(shù)字媒體分類的快速特征提取方法,其特征是該方法包括以下步驟(1)起始;(2)檢測預(yù)測模型是否已訓(xùn)練好,如果預(yù)測模型尚未建立,執(zhí)行步驟3,否則轉(zhuǎn)入步驟6;(3)將媒體對象的特征按提取時間開銷排序;(4)按序提取訓(xùn)練媒體對象的特征;(5)按序訓(xùn)練一組備選子預(yù)測模型序列;(6)使用子模型序列對媒體對象進行分類;(7)輸出媒體對象的分類標記;(8)結(jié)束。
2、 根據(jù)權(quán)利要求1所述的一種在線數(shù)字媒體分類的快速特征提取方法,其特征是 步驟(5)按序訓(xùn)練一組備選子預(yù)測模型序列的具體步驟是(51) 起始;(52) 將特征計數(shù)器J設(shè)置為O,其中J為特征個數(shù);(53) 特征計數(shù)器J'加1;(54) 使用訓(xùn)練集合中媒體對象的前j'個特征輸入到學(xué)習(xí)算法,建立一個SVM子預(yù) 測模型SVM"該子模型在分類時能夠?qū)μ崛×饲?'個特征的媒體對象進行分類,其中 SVM為支持向量機;(55) 如果j'〈 d表示還有更多的特征可用,則轉(zhuǎn)步驟53,建立一個特征個數(shù)j' 加l的子預(yù)測模型,否則,轉(zhuǎn)到步驟56,其中V表示媒體對象總的特征個數(shù);(56) 輸出所有的子預(yù)測模型;(57) 結(jié)束。
3、 根據(jù)權(quán)利要求1所述的一種在線數(shù)字媒體分類的快速特征提取方法,其特征是 步驟(6)使用子模型序列對媒體對象進行分類的具體步驟是(61) 起始;(62) 模型接受用戶要分類的媒體對象I;(63) 將特征計數(shù)器J'初始化為0;(64) 將計數(shù)器J'加1;(65) 按照特征順序提取第/個特征值;(66) 將前個特征值作為媒體對象I的特征向量x輸入到第/個預(yù)測模型SVM"(67) 計算特征向量;c距離SVM,的分界面的距離歷,忍為子預(yù)測模型的分類置信度;(68) 如果Wt力r,則表明SVM,對樣本分類的置信度不夠高,并且y^,表明還 有更多的特征可提取,則返回步驟64;如果不滿足/Kt力r且j'〈A則轉(zhuǎn)到步驟69,為置信度閾值;(69) SVM,的輸出作為I的標記; (610)結(jié)束。
全文摘要
本發(fā)明提供一種在線數(shù)字媒體分類的自適應(yīng)特征提取方法,通過以下步驟來實現(xiàn)對媒體對象的高效分類(1)起始;(2)檢測預(yù)測模型是否已訓(xùn)練好,如果預(yù)測模型尚未建立,執(zhí)行步驟3,否則轉(zhuǎn)入步驟6;(3)將特征按提取時間開銷排序;(4)按序提取訓(xùn)練媒體對象的特征;(5)按序訓(xùn)練一組備選子預(yù)測模型序列;(6)使用子模型序列對媒體對象進行分類;(7)輸出媒體對象的分類標記;(8)結(jié)束。該方法自動地對“簡單”的對象只提取少量特征,而對“復(fù)雜”的對象提取更多的特征,這樣就可以節(jié)省用于特征提取的時間開銷,從而提高在線數(shù)字媒體處理的速度。
文檔編號G06K9/62GK101419632SQ20081024314
公開日2009年4月29日 申請日期2008年12月9日 優(yōu)先權(quán)日2008年12月9日
發(fā)明者揚 俞, 劉力平, 周志華, 遠 姜 申請人:南京大學(xué)