專利名稱:基于圖像處理及圖形學(xué)技術(shù)的戒指在線試戴系統(tǒng)實(shí)現(xiàn)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于計(jì)算機(jī)圖像處理和圖形學(xué)技術(shù)的戒指在線試戴系統(tǒng)實(shí)現(xiàn)方法。
背景技術(shù):
網(wǎng)上購物已經(jīng)成為大眾喜聞樂見的一種消費(fèi)方式。目前,互聯(lián)網(wǎng)上已經(jīng)出現(xiàn)了一些在線購買戒指的網(wǎng)站,這種銷售模式正逐漸被消費(fèi)者接受。但是,該類網(wǎng)絡(luò)銷售模式存在著一個(gè)共性的問題消費(fèi)者體驗(yàn)不夠直接。用戶無法獲知網(wǎng)絡(luò)上選定的一款戒指戴在自己的手上的特定效果。專利《圖形用戶界面》(專利號(hào)200680056095. 2)是一個(gè)和本發(fā)明最接近的實(shí)現(xiàn)方案。在該專利提出的技術(shù)方案如下一種圖形用戶界面,它接收第一對象的三維表示,提供用以指定第二對象的控件,并連同第二對象一起顯示第一對象的三維表示。第一對象可以是人手,而第二對象可以是要根據(jù)該指定規(guī)格制成的珠寶戒指。專利《圖形用戶界面》可以顯示出指定規(guī)格的戒指佩戴在人手上的效果圖。但其在實(shí)現(xiàn)上,它是基于對象的三維表示。其中的關(guān)鍵步驟,對齊和合成算法均是在三維空間進(jìn)行實(shí)現(xiàn)。該專利存在著顯然的缺陷即在實(shí)際網(wǎng)絡(luò)銷售的環(huán)境下,要得到用戶手型三維表示是非常困難、不切實(shí)際的。因此,該專利適用于離線應(yīng)用,對于實(shí)時(shí)網(wǎng)絡(luò)銷售并無實(shí)際意義。
發(fā)明內(nèi)容
本發(fā)明的目的是用戶輸入一張二維的人手圖像,并指定一款戒指,系統(tǒng)將這兩個(gè)信息提交到服務(wù)器,生成合成圖像。運(yùn)算均在二維空間中進(jìn)行。目前,數(shù)碼相機(jī)大量普及, 而且市場上大量手機(jī)均帶拍攝功能。因此,這樣的輸入要求對用戶來說比較友好。本發(fā)明的技術(shù)方案為一種基于計(jì)算機(jī)圖像處理和圖形學(xué)技術(shù)的戒指在線試戴系統(tǒng)實(shí)現(xiàn)方法,包括以下步驟步驟1 用戶從系統(tǒng)終端從存儲(chǔ)于系統(tǒng)服務(wù)器上的戒指數(shù)據(jù)庫中選定所需戒指, 并從系統(tǒng)終端輸入其手形圖形;步驟2 系統(tǒng)服務(wù)器通過網(wǎng)絡(luò)接收用戶輸入手形圖形和戒指選定信息,從存儲(chǔ)于硬件存儲(chǔ)器上的戒指庫中提取相應(yīng)圖像,將手形圖形進(jìn)行二值化,并提取手形輪廓線;步驟3 系統(tǒng)服務(wù)器對手形輪廓線進(jìn)行拐點(diǎn)提取,獲得輸入手形特征點(diǎn)矩陣,將其同存儲(chǔ)于系統(tǒng)服務(wù)器上的典型手形數(shù)據(jù)庫進(jìn)行比對,計(jì)算變換矩陣,取誤差最小的單應(yīng)變換矩陣,其中P = HQ,矩陣H為變換矩陣,P為輸入手形的特征點(diǎn)矩陣,Q為數(shù)據(jù)庫中某一個(gè)手形的特征點(diǎn)矩陣;步驟4 系統(tǒng)服務(wù)器將步驟3所獲取的變換矩陣作用于步驟2所述選取的戒指圖形,即R = HR',矩陣H為變換矩陣,R'為所選定戒指圖形,R為調(diào)整后的戒指圖形,并將輸入的人手圖形和調(diào)整后的戒指圖形疊加,獲得最終合成圖形,并將其發(fā)送到終端顯示。步驟2所述的二值化,是通過膚色顏色分類模型獲取圖形像素膚色/非膚色概率,并設(shè)定一膚色/非膚色概率閾值,進(jìn)行判斷并實(shí)現(xiàn)圖像二值化的。所述采用膚色分類模型判斷圖像像素膚色/非膚色的概率,分類模型包括BP神經(jīng)網(wǎng)絡(luò)、或決策樹、或支持向量機(jī)模式識(shí)別常用的分類技術(shù)。所述二值化過程是在對圖像像素概率進(jìn)行灰度近似并進(jìn)行濾波的基礎(chǔ)上進(jìn)行的。所述經(jīng)典手形/戒指數(shù)據(jù)庫,選取單色為圖形背景。術(shù)語解釋計(jì)算機(jī)圖像處理是指將圖像信號(hào)轉(zhuǎn)換成數(shù)字格式并利用計(jì)算機(jī)對其進(jìn)行處理的過程。其內(nèi)容十分豐富包括有數(shù)字圖像變形技術(shù)、圖像的傅立葉分析技術(shù)、圖像分割、邊緣提取、形狀描述、形態(tài)學(xué)分析、圖像壓縮編碼、彩色圖像處理、修復(fù)與區(qū)域分割等。計(jì)算機(jī)圖形學(xué)是一種使用數(shù)學(xué)算法將二維或三維圖形轉(zhuǎn)化為計(jì)算機(jī)顯示器的柵格形式的科學(xué)。簡單地說,計(jì)算機(jī)圖形學(xué)的主要研究內(nèi)容就是研究如何在計(jì)算機(jī)中表示圖形、以及利用計(jì)算機(jī)進(jìn)行圖形的計(jì)算、處理和顯示的相關(guān)原理與算法。是近30年來發(fā)展迅速、應(yīng)用廣泛的新興學(xué)科,是計(jì)算機(jī)科學(xué)最活躍的分支之一。模式識(shí)別指對表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進(jìn)行處理和分析,以對事物或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類和解釋的過程,是信息科學(xué)和人工智能的重要組成部分。模式識(shí)別又常稱作模式分類。分類模型(分類器)模式識(shí)別中用于分類的數(shù)學(xué)模型。分類器的使用包括兩個(gè)過程訓(xùn)練和應(yīng)用。在訓(xùn)練過程中,用戶提供帶有數(shù)據(jù)標(biāo)簽的訓(xùn)練數(shù)據(jù),提供給分類器,調(diào)整分類器的參數(shù),使其達(dá)到最佳的性能。將訓(xùn)練好的分類模型使用在應(yīng)用過程中,模型就可以自動(dòng)識(shí)別出數(shù)據(jù)的標(biāo)簽。它是模式識(shí)別的核心研究內(nèi)容之一。神經(jīng)網(wǎng)絡(luò)用神經(jīng)基礎(chǔ)理論的研究成果,用數(shù)理方法探索功能更加完善、性能更加優(yōu)越的數(shù)學(xué)模型,深入研究網(wǎng)絡(luò)算法和性能,如穩(wěn)定性、收斂性、容錯(cuò)性、魯棒性等;開發(fā)新的網(wǎng)絡(luò)數(shù)理理論,如神經(jīng)網(wǎng)絡(luò)動(dòng)力學(xué)、非線性神經(jīng)場等。BP神經(jīng)網(wǎng)絡(luò)的全稱為基于誤差反向傳播算法的人工神經(jīng)網(wǎng)絡(luò),它是一種可用于模式識(shí)別問題的分類模型。本發(fā)明的有益效果為本發(fā)明建立了一個(gè)戒指在線試戴系統(tǒng),用戶從系統(tǒng)終端輸入其二維人手圖像、選定一款戒指,系統(tǒng)即生成新的合成圖像,以供用戶參考。
圖1是本系統(tǒng)拓?fù)鋱D。圖2是圖像二值化和輪廓線的提取流程圖。圖3是本系統(tǒng)模塊圖。圖4是BP網(wǎng)絡(luò)結(jié)構(gòu)圖。附圖符號(hào)說明圖4中,圓形表示神經(jīng)元;W表示神經(jīng)元之間的連接權(quán)重,任意兩個(gè)有連接的神經(jīng)元之間均有權(quán)重;自左向右,分別為輸入層,隱含層和輸出層,實(shí)際網(wǎng)絡(luò)可以有多個(gè)隱含層。
具體實(shí)施例方式下面結(jié)合附圖和實(shí)施例對本發(fā)明進(jìn)一步說明。本發(fā)明的實(shí)施例中,采用客戶端/服務(wù)器的硬件拓?fù)浣Y(jié)構(gòu)如圖1所示??蛻敉ㄟ^客戶端輸入二維手形圖像、選定戒指類型,過廣域網(wǎng)絡(luò)將模型數(shù)據(jù)傳輸?shù)椒?wù)器端,服務(wù)器端的在線試戴系統(tǒng)基于存儲(chǔ)于硬件存儲(chǔ)設(shè)備已有的典型手型/戒指的數(shù)據(jù)庫和用戶上傳圖像、通過cpu運(yùn)算進(jìn)行比對、重建,得到合成圖像,然后通過廣域網(wǎng)絡(luò)將模型數(shù)據(jù)傳輸回客戶終端,在客戶終端將該合成圖像進(jìn)行顯示,以供客戶參考??蛻舳丝梢圆捎猛ㄓ玫腜C機(jī), 也可以是一臺(tái)獨(dú)立的服務(wù)器構(gòu)成,其基本要求是具有一定的運(yùn)算能力、輸入輸出功能、以及將運(yùn)算結(jié)果通過網(wǎng)絡(luò)傳輸出去的功能,并能夠接受遠(yuǎn)程服務(wù)器運(yùn)算的結(jié)果。本實(shí)施例中的客戶端平臺(tái)性能如下CPU 主頻 Pentium D 2. 80GHz ;內(nèi)存容量:512M ;運(yùn)行操作系統(tǒng)WindowsXP/98,2000,Linux ;一個(gè)并行打印端口,配置為USB端口。本實(shí)施例中的服務(wù)器采用HP的ProLiant DL380G4 (378735-AA1),其性能如下CPU 類型Xeon DP ;CPU 頻率(MHz) :3000 ;處理器描述標(biāo)準(zhǔn)處理器數(shù)量1 ;支持CPU個(gè)數(shù)2;CPU 二級(jí)緩存2MB;運(yùn)行操作系統(tǒng)為 Windows 2003Server。本發(fā)明的技術(shù)方案包括多個(gè)步驟,包括手形和戒指數(shù)據(jù)庫的建立、用戶手形圖像的輸入、圖像的二值化和手形輪廓線提取、拐點(diǎn)提取和最優(yōu)單應(yīng)變換矩陣的計(jì)算、以及最終的圖像合成,具體包括以下步驟系統(tǒng)初始化準(zhǔn)備建立典型手形數(shù)據(jù)庫和戒指圖像數(shù)據(jù)庫。所述典型手形數(shù)據(jù)庫中存放各種手形輪廓線的曲線拐點(diǎn)。在建立數(shù)據(jù)庫時(shí),首先,我們要有代表性地采集各種手形圖像。男性和女性的手形圖像一般有顯著的差異,可以分別建立數(shù)據(jù)庫。其次,需要進(jìn)行手形圖輪廓線拐點(diǎn)提取,以得到每一個(gè)手形數(shù)據(jù)的拐點(diǎn)描述。該步驟是系統(tǒng)在線應(yīng)用中重要的步驟,其實(shí)現(xiàn)方案在下述系統(tǒng)實(shí)現(xiàn)方法步驟2中進(jìn)行描述。最后,將上述數(shù)據(jù)保存于數(shù)據(jù)庫。需要注意的是,這里所有的手形圖像均使用同一坐標(biāo)系。另外,為了圖像二值化和輪廓線拐點(diǎn)的順利提取,和下述步驟1中用戶手形圖像輸入一樣,盡量選取手形圖像的背景和膚色的差異大的圖像。由于離線數(shù)據(jù)采集環(huán)境可控,實(shí)施時(shí),優(yōu)選單色背景。所述戒指圖像數(shù)據(jù)庫中存放各種規(guī)格的戒指圖像,以矩陣形式存儲(chǔ)于服務(wù)器存儲(chǔ)器內(nèi),以供用戶選擇。為了正確地將戒指主體從背景中分離出來,在離線操作時(shí)使用盡量和戒指顏色不同的單色背景。這里,戒指和手形圖像使用同一坐標(biāo)系,且一一對應(yīng),即手同戒指匹配,可疊加合成手戴戒指的圖片?;谝陨铣跏紨?shù)據(jù)庫,系統(tǒng)正常操作包括如下步驟1.用戶圖形輸入,并選擇戒指類型。用戶通過系統(tǒng)終端,瀏覽存儲(chǔ)于系統(tǒng)服務(wù)器的戒指圖像數(shù)據(jù)庫,選定所需戒指類型。然后,將其手形圖像通過USB或其它接口,向終端輸入手型圖像,終端通過網(wǎng)絡(luò)將其上傳到系統(tǒng)服務(wù)器。為了后續(xù)步驟的順利進(jìn)行。一般要求(1)用戶手形圖像和其背景顏色具有顯著的差異,盡量避免使用和膚色很相近的顏色作為背景。( 手的形狀應(yīng)該是五指自然展開的,不能使用握拳、手形側(cè)面等特殊角度或者形態(tài)的圖像。這些輸入的要求,可在照片手形圖像上傳程序的醒目位置進(jìn)行說明。2.系統(tǒng)服務(wù)器通過網(wǎng)絡(luò)接收用戶輸入手形圖形和戒指選定信息,從存儲(chǔ)于硬件存儲(chǔ)器上的戒指庫中提取相應(yīng)圖像,將手形圖形進(jìn)行二值化,并提取手型輪廓線。圖像二值化是計(jì)算機(jī)圖像處理一個(gè)基本的步驟。它的目的是將輸入的圖像轉(zhuǎn)化為 01 二值的圖像。這里的0和1在不同應(yīng)用中有不同的定義。在本發(fā)明中,我們需要將背景像素分類為0,而將前景像素(手形、戒指像素)分類為1。二值化過程可以形象地用下式所示。以灰度圖為例。
權(quán)利要求
1.基于圖像處理及圖形學(xué)技術(shù)的戒指在線試戴系統(tǒng)實(shí)現(xiàn)方法,其特征在于,包括以下步驟步驟1 用戶從系統(tǒng)終端從存儲(chǔ)于系統(tǒng)服務(wù)器上的戒指數(shù)據(jù)庫中選定所需戒指,并從系統(tǒng)終端輸入其手形圖形;步驟2 系統(tǒng)服務(wù)器通過網(wǎng)絡(luò)接收用戶輸入手形圖形和戒指選定信息,從存儲(chǔ)于硬件存儲(chǔ)器上的戒指庫中提取相應(yīng)圖像,將手形圖形進(jìn)行二值化,并提取手形輪廓線;步驟3 系統(tǒng)服務(wù)器對手形輪廓線進(jìn)行拐點(diǎn)提取,獲得輸入手形特征點(diǎn)矩陣,將其同存儲(chǔ)于系統(tǒng)服務(wù)器上的典型手形數(shù)據(jù)庫進(jìn)行比對,計(jì)算變換矩陣,取誤差最小的單應(yīng)變換矩陣,其中P = HQ,矩陣H為變換矩陣,P為輸入手形的特征點(diǎn)矩陣,Q為數(shù)據(jù)庫中某一個(gè)手形的特征點(diǎn)矩陣;步驟4 系統(tǒng)服務(wù)器將步驟3所獲取的變換矩陣作用于步驟2所述選取的戒指圖形,即 R = HR',矩陣H為變換矩陣,R'為所選定戒指圖形,R為調(diào)整后的戒指圖形,并將輸入的人手圖形和調(diào)整后的戒指圖形疊加,獲得最終合成圖形,并將其發(fā)送到終端顯示。
2.根據(jù)權(quán)利要求1所述的在線試戴系統(tǒng)實(shí)現(xiàn)方法,其特征在于,步驟2所述的二值化, 是通過膚色顏色分類模型獲取圖形像素膚色/非膚色概率,并設(shè)定一膚色/非膚色概率閾值,進(jìn)行判斷并實(shí)現(xiàn)圖像二值化的。
3.根據(jù)權(quán)利要求2所述的在線試戴系統(tǒng)實(shí)現(xiàn)方法,其特征在于,所述采用膚色分類模型判斷圖像像素膚色/非膚色的概率,其分類模型包括BP神經(jīng)網(wǎng)絡(luò)、或決策樹、或支持向量機(jī)模式識(shí)別常用的分類技術(shù)。
4.根據(jù)權(quán)利要求2所述的在線試戴系統(tǒng)實(shí)現(xiàn)方法,其特征在于,所述二值化過程是在對圖像像素概率進(jìn)行灰度近似并進(jìn)行濾波的基礎(chǔ)上進(jìn)行的。
5.根據(jù)權(quán)利要求1所述的在線試戴系統(tǒng)實(shí)現(xiàn)方法,其特征在于,所述經(jīng)典手形/戒指數(shù)據(jù)庫,選取單色為圖形背景。
全文摘要
本發(fā)明公開了基于圖像處理及圖形學(xué)技術(shù)的戒指在線試戴系統(tǒng)實(shí)現(xiàn)方法,包括手形數(shù)據(jù)庫,戒指圖像數(shù)據(jù)庫,以及最佳匹配計(jì)算方法,通過用戶圖形輸入,實(shí)現(xiàn)戒指在線試戴。系統(tǒng)實(shí)現(xiàn)過程為,輸入一張二維的人手圖像和戒指圖像,生成新的合成圖像。運(yùn)算均在二維空間中進(jìn)行。用戶只要拍攝一張手的照片,然后指定一款想要試戴的戒指,并提交到網(wǎng)站服務(wù)器即可。本發(fā)明實(shí)現(xiàn)了一種基于計(jì)算機(jī)圖像處理技術(shù)和計(jì)算機(jī)圖形學(xué)技術(shù)的二維人手圖像和戒指圖像的合成系統(tǒng),解決了顧客網(wǎng)上購物體驗(yàn)不夠直接的問題,對于網(wǎng)上戒指購買成交率有很大提升。
文檔編號(hào)G06T1/00GK102298746SQ20101021117
公開日2011年12月28日 申請日期2010年6月25日 優(yōu)先權(quán)日2010年6月25日
發(fā)明者湯成陽, 翁時(shí)鋒 申請人:上海九鉆電子商務(wù)有限公司