專利名稱:感知特征集的擷取方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及影像分割(segmentation),特別是涉及用于影像/視訊分割的感知特 征集(perceptual feature set)的擷取。
背景技術(shù):
影像分割為影像分析當中的一種,其藉由強調(diào)(highlight)或分割(isolation) 技術(shù)而將一影像分割為個別的物件或區(qū)域。影像分割可用于影像或視訊中尋找出物件或邊 界,因而可適用于機器視覺(computer vision)等應(yīng)用。對于灰度影像,一般是以亮度或/ 及紋理(texture)訊息來進行分割。對于彩色影像,則是使用顏色訊息及紋理訊息來進行分割。在近似人類視覺感 知認識或知覺所進行的影像/視訊分割中,用以描述顏色及紋理的適當特征集(feature set)是不可或缺的。紋理特征一般是藉由統(tǒng)計方法及頻域方法來描述。其中,統(tǒng)計方法 如K階動量法(Kth order moment)、均勻法(uniformity)、熵值法(entropy)及共矩陣法 (co-concurrent matrix);頻域方法如法則濾波器(Laws filter)、離散余弦轉(zhuǎn)換(DCT)、 具環(huán)濾波器(ring filter)及楔濾波器(wedge filter)的傅利葉轉(zhuǎn)換、加柏(Gabor)濾 波器組及波長轉(zhuǎn)換法。另一方面,顏色特征一般是藉由各種顏色空間來描述,例如RGB(紅 綠藍)空間、YUV空間、CIELAB空間及HSI (色調(diào)/飽和/亮度)空間。由于HSI顏色空間 接近人類對于顏色的感知認識,因而經(jīng)常用于機器視覺的各種應(yīng)用。但是,顏色特征、紋理 特征或其組合通常不易以描述顏色紋理。再者,較佳的顏色/紋理特征通常具有較高維度 (dimensiona Iity),因而往往造成后續(xù)分割時的復(fù)雜度。由此可見,上述現(xiàn)有的感知特征集的擷取方法及系統(tǒng)在方法、產(chǎn)品結(jié)構(gòu)及使用上, 顯然仍存在有不便與缺陷,而亟待加以進一步改進。為了解決上述存在的問題,相關(guān)廠商莫 不費盡心思來謀求解決之道,但長久以來一直未見適用的設(shè)計被發(fā)展完成,而一般方法及 產(chǎn)品又沒有適切的方法及結(jié)構(gòu)能夠解決上述問題,此顯然是相關(guān)業(yè)者急欲解決的問題。因 此如何能創(chuàng)設(shè)一種新的感知特征集的擷取方法及系統(tǒng),用以描述顏色及紋理,使得整體的 影像分割較能接近于人類的感知認識,實屬當前重要研發(fā)課題之一,亦成為當前業(yè)界極需 改進的目標。
發(fā)明內(nèi)容
本發(fā)明的目的在于,克服現(xiàn)有的感知特征集的擷取方法及系統(tǒng)存在的缺陷,而提 供一種新的感知特征集的擷取方法及系統(tǒng),所要解決的技術(shù)問題是使其可有效降低計算 量,近似人類對于顏色的感知認識,因而使得整體的影像分割較能接近于人類的感知認識, 非常適于實用。本發(fā)明的目的及解決其技術(shù)問題是采用以下技術(shù)方案來實現(xiàn)的。依據(jù)本發(fā)明提出 的一種感知特征集的擷取方法,其包含轉(zhuǎn)換一輸入影像以得到一色調(diào)成分及一飽和成分; 量化該色調(diào)成分,使其分為多個量化值;以該飽和成分對該量化的色調(diào)成分予以加權(quán);以及對該加權(quán)的量化色調(diào)成分及該飽和成分進行統(tǒng)計處理,用以擷取特征向量。本發(fā)明的目的及解決其技術(shù)問題還可采用以下技術(shù)措施進一步實現(xiàn)。前述的感知特征集的擷取方法,其中所述的輸入影像經(jīng)轉(zhuǎn)換為HSI顏色空間。前述的感知特征集的擷取方法,其中所述的色調(diào)成分被量化分為六 個量化值。前述的感知特征集的擷取方法,其中所述的六個量化值為紅、黃、綠、藍綠、藍、紫 紅。前述的感知特征集的擷取方法,其中所述的量化色調(diào)成分是乘以該飽和成分以進 行加權(quán)。前述的感知特征集的擷取方法,一區(qū)塊圍繞于正進行特征擷取的像素;位于該區(qū) 塊內(nèi),該特征向量包含色彩特征向量及無色特征向量Hgray,其是以該飽和成分針對每一顏 色以得到相對應(yīng)的直方圖,如下式 Σ 5P Hcolor= peCohr’psBcolor e {紅,黃,綠,藍綠,藍,紫紅}u ζ(1 一
H = ρ^,
IAgray ^)其中,ρ表示該像素,Hcolor為該色彩特征向量,Hgray為該無色特征向量,Sp為該飽 和值。前述的感知特征集的擷取方法,其更包含一步驟,用以對該擷取特征向量予以分類。前述的感知特征集的擷取方法,其中所述的擷取特征向量是使用聚類技術(shù)以進行 分類。本發(fā)明的目的及解決其技術(shù)問題還采用以下技術(shù)方案來實現(xiàn)。依據(jù)本發(fā)明提出的 一種感知特征集的擷取系統(tǒng),其包括一轉(zhuǎn)換單元,用以轉(zhuǎn)換一輸入影像以得到一色調(diào)成分 及一飽和成分;一量化單元,用以量化該色調(diào)成分,使其分為多個量化值;一加權(quán)單元,以 該飽和成分對該量化的色調(diào)成分予以加權(quán);以及一統(tǒng)計單元,對該加權(quán)的量化色調(diào)成分及 該飽和成分進行統(tǒng)計處理,用以擷取特征向量。本發(fā)明的目的及解決其技術(shù)問題還可采用以下技術(shù)措施進一步實現(xiàn)。前述的感知特征集的擷取系統(tǒng),其中所述的輸入影像經(jīng)轉(zhuǎn)換為HSI (色調(diào)/飽和/ 亮度)顏色空間。前述的感知特征集的擷取系統(tǒng),其中所述的色調(diào)成分被量化分為六個量化值。前述的感知特征集的擷取系統(tǒng),其中所述的六個量化值為紅、黃、綠、藍綠、藍、紫紅。前述的感知特征集的擷取系統(tǒng),其中所述的量化色調(diào)成分是乘以該飽和成分以進 行加權(quán)。前述的感知特征集的擷取系統(tǒng),一區(qū)塊圍繞于正進行特征擷取的像素;位于該區(qū) 塊內(nèi),特征向量包含色彩特征向量及無色特征向量,其是以該飽和成分針對每一顏色以得 到相對應(yīng)的直方圖,如下式<formula>formula see original document page 6</formula>其中,ρ表示該像素,Hcolor為該色彩特征向量,Hgray為該無色特征向量,Sp為該飽 和值。前述的感知特征集的擷取系統(tǒng),其更包含一分類單元,用以對該擷取特征向量予 以分類。前述的感知特征集的擷取系統(tǒng),其中所述的擷取特征向量是使用聚類技術(shù)以進行 分類。本發(fā)明與現(xiàn)有技術(shù)相比具有明顯的優(yōu)點和有益效果。由以上可知,為達到上述目 的,根據(jù)本發(fā)明實施例,將輸入影像進行轉(zhuǎn)換(例如轉(zhuǎn)換為HSI顏色空間),用以得到色調(diào) 成分及飽和成分,其中色調(diào)成分被量化為多個(例如六個)量化值。在較佳實施例中,六個 量化值為紅、黃、綠、藍綠(cyan)、藍、紫紅(magenta)。以飽和成分對量化的色調(diào)成分予以 加權(quán)(或相乘處理),再對加權(quán)的量化色調(diào)成分及飽和成分進行統(tǒng)計處理,用以擷取特征向 量。在一實施例中,對于一區(qū)塊中的每一像素求得其直方圖,以代表其紋理特征。借由上述技術(shù)方案,本發(fā)明感知特征集的擷取方法及系統(tǒng)至少具有下列優(yōu)點及有 益效果藉由本發(fā)明,可有效降低計算量,近似人類對于顏色的感知認識,因而使得整體的 影像分割較能接近于人類的感知認識。綜上所述,本發(fā)明是有關(guān)于一種感知特征集的擷取方法及系統(tǒng)。該方法轉(zhuǎn)換輸入 影像以得到色調(diào)成分及飽和成分,其中色調(diào)成分被量化為多個量化值。以飽和成分對量化 的色調(diào)成分予以加權(quán),再對加權(quán)的量化色調(diào)成分及飽和成分進行統(tǒng)計處理,用以擷取特征 向量。藉此,可以使得整體的分割結(jié)果非常近似于人類的感知認識。本發(fā)明在技術(shù)上有顯 著的進步,具有明顯的積極效果,誠為一新穎、進步、實用的新設(shè)計。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段, 而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其他目的、特征和優(yōu)點能夠 更明顯易懂,以下特舉較佳實施例,并配合附圖,詳細說明如下。
圖1是顯示本發(fā)明實施例以感知特征集為基礎(chǔ)的影像/視訊分割的方框圖。圖2是顯示本發(fā)明實施例的感知特征集的擷取方法或系統(tǒng)示意圖。圖3是顯示較佳實施例的色調(diào)環(huán)的量化的示意圖。圖4A是顯示一影像,其中區(qū)塊B圍繞于目前正進行特征擷取的像素P的示意圖。圖4B是例示色彩(chromat i c)特征向量H。。1ot及無色(achromat i c)特征向量 Hgray,其以直方圖(histogram)來表示的示意圖。10:擷取感知特征集12:聚類100 轉(zhuǎn)換單元102 量化單元
104 加權(quán)單元106 統(tǒng)計單元
H 色調(diào)成分S 飽和成分Hq 量化的色調(diào)成分H。。1(ff:色彩特征向量Hgray:無色特征向量
具體實施例方式為更進一步闡述本發(fā)明為達成預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合 附圖及較佳實施例,對依據(jù)本發(fā)明提出的感知特征集的擷取方法及系統(tǒng)其具體實施方式
、 方法、步驟、結(jié)構(gòu)、特征及其功效,詳細說明如后。圖1是顯示本發(fā)明實施例以感知特征集(perceptual feature set)為基礎(chǔ)的影 像/視訊分割的方框圖。在本實施例中,以方框10處理輸入影像或視訊,用以擷取感知特征 集或特征向量。特征集擷取的細節(jié)將于以下配合圖2作說明。在完成特征擷取后,接著對所 擷取的向量進行分割(s^arate)或分類(classify),如方框12所示的聚類(clustering) 演算法。在眾多聚類演算法當中,本實施例是采用K均值(K-means)聚類演算法進行分類 以得到分割結(jié)果。圖2是顯示本發(fā)明實施例的感知特征集的擷取方法或系統(tǒng)的示意圖。首先,以轉(zhuǎn) 換單元100將輸入影像/視訊轉(zhuǎn)換為HSI (色調(diào)/飽和/亮度)顏色空間的表示形式。換 句話說,輸入影像/視訊的每一像素被轉(zhuǎn)換為色調(diào)成分H、飽和成分S及亮度成分。由于亮 度成分未用于后續(xù)的處理中,因而未顯示于圖式中。在本說明書中,“單元”一詞是用以指 一電路、一段程序或其組合。雖然本實施例以HSI顏色空間作為例示,然而也可以使用其他 顏色空間,例如HSL(色調(diào)/飽和/光度(lightness))顏色空間或HSV(色調(diào)/飽和/值 (value))顏色空間。接下來,以量化單元102將像素的色調(diào)成分H量化為多個離散量化值。在本實施例 中,整個色調(diào)范圍被分隔為六個離散量化值紅、黃、綠、藍綠(cyan)、藍、紫紅(magenta)。 圖3是顯示較佳實施例的色調(diào)環(huán)的量化的示意圖。在此之所以將色調(diào)量化為如圖所示的六 個量化值,是因其能符合眼睛的感知。在其他實施例中,可以將色調(diào)量化為少于或多于六個 量化值。再者,色調(diào)環(huán)中每一量化值的角度也不一定都要等于60度。對于圖3所示色調(diào)環(huán)的每一量化值,較飽和色調(diào)(亦即,較接近環(huán)的周圍)所具有 的量化值同于較不飽和色調(diào)(亦即,較接近環(huán)的中心)的量化值。因此,使用像素的飽和成 分S來作為權(quán)重系數(shù)或因子(weighting coefficient/factor),以加權(quán)單元104來對量化 的色調(diào)成分Hq進行加權(quán)。例如,以乘法器104將量化的色調(diào)成分Hq乘以相對應(yīng)的飽和成分 S,因而形成色彩(chromatic)特征,而飽和成分S則作為無色(achromatic)特征。由于本 實施例的量化值有六個,因此色彩特征共有六個維度。該六個維度加上無色(achromatic) 特征的一個維度,因此在本實施例中總共具有七個維度。接著,以統(tǒng)計單元106對色彩(chromatic)特征及無色(achromatic)特征進行統(tǒng) 計處理,因而得到特征集,可用以描述影像/視訊的顏色及紋理。在本實施例中,影像/視 訊像素的特征向量可以由下式得到<formula>formula see original document page 7</formula>color e {紅,黃,綠,藍綠,藍,紫紅}
<formula>formula see original document page 8</formula>
其中ρ代表像素;B為圍繞目前正進行特征擷取的像素P的區(qū)塊;Sp代表ρ的飽和 值(亦即,加權(quán)單元104的輸出),其值介于0和1之間。圖4A是顯示一影像,其中區(qū)塊B圍繞于目前正進行特征擷取的像素ρ的示意 圖。在區(qū)塊B內(nèi),將每一顏色的飽和值分別進行加總,因而得到各顏色的向量H。。1ot。圖 4B是例示色彩(chromatic)特征向量HMl。r (亦即,H
red
(紅)、Hyellow (黃)、Hgreen (綠)、 Hcyan(藍綠)、Hblue ( 藍)、Hmagenta(紫紅))及無色(achromatic)特征向量 Hgray (灰),其以 直方圖(histogram)來表示。由于每一像素具有其特殊的直方圖,因此可據(jù)以表示其紋理 特征。圖1所示的聚類方框12根據(jù)所接收到的色彩(chromatic)特征向量H。。1(ff及無色 (achromatic)特征向量Hgray (灰)來進行分類。換句話說,具有類似直方圖的像素將被分 類于同一區(qū)域,反之亦是。根據(jù)上述的實施例,色調(diào)環(huán)是采用離散且明確的臨界值來進行量化,因而可以有 效地降低傳統(tǒng)分割技術(shù)中所遭遇的復(fù)雜計算量。再者,使用加權(quán)系數(shù)來將色彩成分(Hral J 與無色成分(Hgray)分開,此可近似人類對于色彩、無色的感知認識,因而可以避免于低飽和 度下的色調(diào)誤判。另外,本實施例對于相同平滑度/紋理色彩區(qū)域可得到相同數(shù)值,而對不 同平滑度/紋理色彩區(qū)域則可得到截然不同的數(shù)值,因而使得整體的分割結(jié)果非常近似于 人類的感知認識。以上所述,僅是本發(fā)明的較佳實施例而已,并非對本發(fā)明作任何形式上的限制,雖 然本發(fā)明已以較佳實施例揭露如上,然而并非用以限定本發(fā)明,任何熟悉本專業(yè)的技術(shù)人 員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當可利用上述揭示的技術(shù)內(nèi)容作出些許更動或修飾 為等同變化的等效實施例,但凡是未脫離本發(fā)明技術(shù)方案內(nèi)容,依據(jù)本發(fā)明的技術(shù)實質(zhì)對 以上實施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
一種感知特征集的擷取方法,其特征在于其包含轉(zhuǎn)換一輸入影像以得到一色調(diào)成分及一飽和成分;量化該色調(diào)成分,使其分為多個量化值;以該飽和成分對該量化的色調(diào)成分予以加權(quán);以及對該加權(quán)的量化色調(diào)成分及該飽和成分進行統(tǒng)計處理,用以擷取特征向量。
2.根據(jù)權(quán)利要求1所述的感知特征集的擷取方法,其特征在于其中所述的輸入影像經(jīng) 轉(zhuǎn)換為HSI顏色空間。
3.根據(jù)權(quán)利要求1所述的感知特征集的擷取方法,其特征在于其中所述的色調(diào)成分被 量化分為六個量化值。
4.根據(jù)權(quán)利要求3所述的感知特征集的擷取方法,其特征在于其中所述的六個量化值 為紅、黃、綠、藍綠、藍、紫紅。
5.根據(jù)權(quán)利要求1所述的感知特征集的擷取方法,其特征在于其中所述的量化色調(diào)成 分是乘以該飽和成分以進行加權(quán),用以得到飽和值。
6.根據(jù)權(quán)利要求5所述的感知特征集的擷取方法,其特征在于,一區(qū)塊圍繞于正進行 特征擷取的像素;位于該區(qū)塊內(nèi),該特征向量包含色彩特征向量及無色特征向量Hgray,其是 以該飽和值針對每一顏色以得到相對應(yīng)的直方圖,如下式<formula>formula see original document page 2</formula>其中,P表示該像素,Hcolor為該色彩特征向量,Hgray為該無色特征向量,Sp為該飽和值。
7.根據(jù)權(quán)利要求1所述的感知特征集的擷取方法,其特征在于其更包含一步驟,用以 對該擷取特征向量予以分類。
8.根據(jù)權(quán)利要求7所述的感知特征集的擷取方法,其特征在于其中所述的擷取特征向 量是使用聚類技術(shù)以進行分類。
9.一種感知特征集的擷取系統(tǒng),其特征在于其包括一轉(zhuǎn)換單元,用以轉(zhuǎn)換一輸入影像以得到一色調(diào)成分及一飽和成分;一量化單元,用以量化該色調(diào)成分,使其分為多個量化值;一加權(quán)單元,以該飽和成分對該量化的色調(diào)成分予以加權(quán);以及一統(tǒng)計單元,對該加權(quán)的量化色調(diào)成分及該飽和成分進行統(tǒng)計處理,用以擷取特征向量。
10.根據(jù)權(quán)利要求9所述的感知特征集的擷取系統(tǒng),其特征在于其中所述的輸入影像 經(jīng)轉(zhuǎn)換為HSI (色調(diào)/飽和/亮度)顏色空間。
11.根據(jù)權(quán)利要求9所述的感知特征集的擷取系統(tǒng),其特征在于其中所述的色調(diào)成分 被量化分為六個量化值。
12.根據(jù)權(quán)利要求11所述的感知特征集的擷取系統(tǒng),其特征在于其中所述的六個量化 值為紅、黃、綠、藍綠、藍、紫紅。
13.根據(jù)權(quán)利要求9所述的感知特征集的擷取系統(tǒng),其特征在于其中所述的量化色調(diào)成分是乘以該飽和成分以進行加權(quán),用以得到飽和值。
14.根據(jù)權(quán)利要求13所述的感知特征集的擷取系統(tǒng),其特征在于,一區(qū)塊圍繞于正進 行特征擷取的像素;位于該區(qū)塊內(nèi),特征向量包含色彩特征向量及無色特征向量,其是以該 飽和值針對每一顏色以得到相對應(yīng)的直方圖,如下式<formula>formula see original document page 3</formula>其中,P表示該像素,Hcolor為該色彩特征向量,Hgray為該無色特征向量,SP為該飽和值。
15.根據(jù)權(quán)利要求9所述的感知特征集的擷取系統(tǒng),其特征在于其更包含一分類單元, 用以對該擷取特征向量予以分類。
16.根據(jù)權(quán)利要求15所述的感知特征集的擷取系統(tǒng),其特征在于其中所述的擷取特征 向量是使用聚類技術(shù)以進行分類。
全文摘要
本發(fā)明是有關(guān)于一種感知特征集的擷取方法及系統(tǒng)。該方法轉(zhuǎn)換輸入影像以得到色調(diào)成分及飽和成分,其中色調(diào)成分被量化為多個量化值。以飽和成分對量化的色調(diào)成分予以加權(quán),再對加權(quán)的量化色調(diào)成分及飽和成分進行統(tǒng)計處理,用以擷取特征向量。藉此,可以使得整體的分割結(jié)果非常近似于人類的感知認識。
文檔編號G06K9/62GK101833772SQ200910126080
公開日2010年9月15日 申請日期2009年3月9日 優(yōu)先權(quán)日2009年3月9日
發(fā)明者李國君, 王明俊, 黃鈴琇 申請人:奇景光電股份有限公司;財團法人成大研究發(fā)展基金會