專利名稱:彩色聲像導(dǎo)盲方法及彩色聲像導(dǎo)盲儀的制作方法
技術(shù)領(lǐng)域:
涉及ー種應(yīng)用于導(dǎo)盲領(lǐng)域中的將圖像信息轉(zhuǎn)化為聲音信息的方法和裝置。
背景技術(shù):
目前,本領(lǐng)域提出了兩種方案為盲人提供周圍物體信息,即導(dǎo)盲杖和視覺替代。導(dǎo)盲杖其設(shè)備主要依靠紅外或超聲反射來向盲人報警附近物體,盲人通過導(dǎo)盲杖發(fā)出的聲音和觸覺信息來判斷障礙物遠(yuǎn)近。這種方案依靠儀器識別障礙物然后表達(dá)給盲人,由于傳達(dá)信息有限,盲人幾乎無法直接識別物體形狀大小顔色等信息。視覺替代主要有觸覺-視覺替代和音頻-視覺替代兩種。 觸覺-視覺替代通過電極陣列刺激指尖、舌頭或皮膚等來間接傳遞視覺信息。由于感覺神經(jīng)細(xì)胞的分辨率以及電極陣列面積的限制,該方法現(xiàn)在也只能達(dá)到識別盲文的作用。顔色差別是識別物體形狀最主要因素,現(xiàn)階段尚且沒有能傳遞顏色的觸覺-視覺替代系統(tǒng)。中國發(fā)明專利申請文件CN101390789公開了上述技術(shù)方案,該技術(shù)方案基于點刺激的觸覺替代視覺系統(tǒng),使用電極陣列刺激指尖或舌頭產(chǎn)生觸覺感受,并利用觸點ニ維分布,傳遞有限但是十分重要的ニ維視覺信息。該方法主要存在如下缺點I.該方法由于電極陣列刺激,會對手指或舌頭產(chǎn)生不適的感覺,影響健康2.由于舌頭和指尖所容納的陣列面積有限,以及感覺細(xì)胞的分辨率限制導(dǎo)致空間分辨率低??臻g分辨率低導(dǎo)致該方法只能識別簡單性狀的物體,基本只能用于盲文識別。音頻-視覺替代能夠?qū)D像像素信息轉(zhuǎn)換為聲音信息。目前,該種技術(shù)還停留在專利申請文件EP0410045A1和KR20110052824A所公開的技術(shù)方案的階段。上述兩個發(fā)明專利申請所公開的技術(shù)方案均需要通過對圖像像素進(jìn)行逐掃描的方法來遞呈圖像位置信息,這使得人腦難于適應(yīng)聲音-圖像反變換機(jī)制,空間解析度低,時間分辨率低。因此尚沒有成熟易用的產(chǎn)品占據(jù)市場。專利申請文件EP0410045A1是由Meijer提出的現(xiàn)在市面上唯一有產(chǎn)品的技術(shù),其技術(shù)方案通過攝像頭采集64x64的實時灰度圖像,然后進(jìn)行圖像-聲音轉(zhuǎn)換,如圖I所示。圖像的灰度用聲音響度表示,聲音最大響度代表純白色,響度為零代表純黑色。圖像的縱向定位用頻率代表,高頻代表位于圖像上緣的像素,低頻代表位于圖像下緣的像素。圖像橫向定位通過快速時間掃描,第一個掃描時間塊表達(dá)最左列像素條,最后ー個掃描時間塊代表最右列像索條。最后聽者需要空間想象能力按頻率時間塊掃描以及響度合成要表達(dá)的圖像。該方法的核心原理是圖像到聲音的3重對應(yīng),即“灰度對應(yīng)響度,像素y坐標(biāo)對應(yīng)頻率,像素X坐標(biāo)對應(yīng)掃描時間”?;谶@種非自然地圖像到聲音轉(zhuǎn)換原理,不可避免會遇到以下缺點I.需要長期訓(xùn)練“像素y坐標(biāo)對應(yīng)頻率,像素X坐標(biāo)對應(yīng)掃描時間”是一種人為的對應(yīng)轉(zhuǎn)換。聽者非常難于適應(yīng)“頻率編碼y方向,時間塊掃描編碼X方向”的邏輯。事實上經(jīng)過長期訓(xùn)練,盲人用該設(shè)備對簡單形狀物體的識別率仍低于30%,所以尚未被廣泛應(yīng)用。
2.空間分辨率低a.聽覺的頻率分辨率限制了聲像y方向的分辨率。b. X方向不能做很多切分,否則掃描時間太長,動態(tài)圖片更新率太低。c.盲人很難同時分辨“頻率編碼的y方向和時間塊掃描編碼的X方向”,所以一般該方法聲像分辨率只能做到64x64。3.時間分辨率低x方向需要時間塊掃描,為保正64塊切分以及編碼聲音信號不失真,橫向掃描時間要求大于I秒鐘,即最低掃描時間為I秒/中貞。4.由于方法原理限制,物體顔色是無法被識別的。5.該方法只能用于ニ維圖像到聲音轉(zhuǎn)換,不能用于3D物體識別。 6.需要人腦非常困難的做聲音圖像反變換,因此該方法少有應(yīng)用。專利申請文獻(xiàn)KR20110052824A公開了ー種色彩發(fā)聲設(shè)備,該設(shè)備將彩色圖像分區(qū)塊,計算每個區(qū)塊的色彩參數(shù)(色彩,飽和度,亮度),通過色彩與聲音轉(zhuǎn)換表格,將12種顔色6種飽和度12種亮度映射到鋼琴不同的按鍵上。順序掃描圖像區(qū)塊,可以產(chǎn)生不同的音樂。盲人借此判斷前方障礙物。該方法存在如下缺點I.需要區(qū)塊劃分,導(dǎo)致空間分辨率低。一般只能做到10x10分辨率。2.需要區(qū)塊逐點掃描,導(dǎo)致時間分辨率低。10x10區(qū)塊,每塊O. 5秒鐘表達(dá),每幅圖需要5秒鐘掃描時間。3.僅限于樂器表達(dá),也就是說只能是鋼琴鍵盤有限個鍵所能表達(dá)的范圍。4.色彩分辨率極低只能區(qū)分12種顏色。顔色必須離散化到12中對應(yīng)顏色。由于表格法以及鋼琴鍵盤表達(dá),該方法無法實現(xiàn)連續(xù)色彩表達(dá)。5.色彩飽和度分辨率極低只有有限幾個音高可供表達(dá)。6.盲人很難適應(yīng)這種非自然聲音轉(zhuǎn)換。7.該方法無法識別3D物體。
發(fā)明內(nèi)容
本發(fā)明提供ー種彩色圖像信息到聲音信息的轉(zhuǎn)換方法和裝置,使得盲人無需經(jīng)過特殊訓(xùn)練便可以獲得很好的三維物體識別效果。本發(fā)明提供的技術(shù)方案為ー種彩色聲像導(dǎo)盲方法,包括如下步驟A.采集實時彩色圖像數(shù)據(jù);B.根據(jù)實時彩色圖像數(shù)據(jù)計算出每個彩色像素點的色彩光波主頻、色彩飽和度以及亮度,然后再轉(zhuǎn)換為相應(yīng)聲素點聲波主頻、聲波信噪比、以及響度,再結(jié)合彩色像素點的三維位置信息產(chǎn)生脈沖式雙耳立體聲聲波信號;C.將所述脈沖式雙耳立體聲聲波信號通過無殼雙耳耳機(jī)播放出來。ー種彩色聲像導(dǎo)盲儀,包括攝像模塊,用于采集實時彩色圖像數(shù)據(jù);主處理模塊,用于接收攝像模塊采集的實時彩色圖像數(shù)據(jù),通過實時彩色圖像數(shù)據(jù)計算出每個彩色像素點的色彩光波主頻、色彩飽和度以及亮度,然后再轉(zhuǎn)換為相應(yīng)聲素點聲波主頻、聲波信噪比、以及響度,再結(jié)合彩色像素點的三維位置信息產(chǎn)生脈沖式雙耳立體聲聲波信號,并傳遞給無殼雙耳耳機(jī)模塊;
無殼雙耳耳機(jī)模塊,用于接收主處理模塊產(chǎn)生的脈沖式雙耳立體聲聲波信號,將其轉(zhuǎn)換成聲音并播出。本發(fā)明的有益效果是I.幫助識別物體顔色。2.幫助識別物體形狀。3.幫助識別物體大小,聲像分辨率可與圖像分辨率相同。4.明暗有助于盲人晝夜節(jié)律的生理調(diào)節(jié)。5.可將夜視儀圖像、紅外紫外等圖像轉(zhuǎn)化為聲音。
6.可將3D圖像轉(zhuǎn)化為立體聲像。7.幫助識別被遮擋的物體。8.同時呈現(xiàn)全空間聲像,而非掃描像素或陣列,再合成。9.全彩色變換,各種波長飽和度亮度顏色可連續(xù)變換,不影響色彩分辨率。
圖I是現(xiàn)有技術(shù)的原理框圖。圖2是本發(fā)明提供的彩色聲像導(dǎo)盲儀的原理框圖。圖3是標(biāo)準(zhǔn)彩色圖像數(shù)據(jù)矩陣示意圖。圖4是RGB三色值與色彩主頻、飽和度對應(yīng)圖。圖5是本發(fā)明提供的圖像聲像轉(zhuǎn)換模塊原理框圖。圖6是本發(fā)明提供的聲像處理模塊原理框圖。圖7是連續(xù)聲波脈沖化示意圖。圖8是本發(fā)明提供的圖像到聲音轉(zhuǎn)換流程圖。
具體實施例方式如圖2所示,本發(fā)明提供的彩色聲像導(dǎo)盲儀包括攝像模塊I、主處理模塊2、無殼雙耳耳機(jī)模塊3。攝像模塊I :用于采集實時彩色圖像,存儲為標(biāo)準(zhǔn)彩色圖像,并提供接ロ給主處理模塊2進(jìn)行后續(xù)處理。其具備的功能有a)可人工近遠(yuǎn)距離縮放,并自動對焦b)可多攝像頭用于3D聲像的彩色圖像采集c)可開啟微距模式用于讀書等微距識別主處理模塊2 :接收攝像模塊I提供的實時彩色圖像數(shù)據(jù),將其轉(zhuǎn)化為雙耳立體彩色聲像信號,并傳遞給無殼雙耳耳機(jī)模塊用于導(dǎo)盲。所述主處理模塊2包括圖像采集模塊2. I、圖像處理模塊2. 2、圖像聲像轉(zhuǎn)換模塊2. 3、聲像處理模塊2. 4、以及聲像輸出模塊2. 5圖像采集模塊2.I :獲得攝像模塊I所采集的實時彩色圖像,將實時彩色圖像轉(zhuǎn)化成標(biāo)準(zhǔn)彩色圖像數(shù)據(jù)矩陣(平面圖像為2D矩陣,立體圖像數(shù)據(jù)為3D矩陣),如可采用RGBf^rmt,其中/代表橫坐標(biāo)分為/行像素,m代表縱坐標(biāo)分為m列像素,η代表縱深坐標(biāo)分為η列像素(2D圖像η取值I),X 3彩色圖像數(shù)據(jù)矩陣的紅綠藍(lán)三個分量,t代表動態(tài)時間。圖像采集模塊2. I將上述標(biāo)準(zhǔn)彩色圖像矩陣傳遞給圖像處理模塊2. 2。圖3示出了標(biāo)準(zhǔn)彩色圖像數(shù)據(jù)矩陣,其中實時攝像信號的圖像更新率為10幀/秒,每幀更新傳遞過來X3個數(shù)據(jù)塊分別存儲空間像素點的紅綠藍(lán)數(shù)據(jù)。每個數(shù)據(jù)塊是3維,代表橫縱深。圖像處理模塊2.2 :接收圖像采集模塊2. I傳遞的標(biāo)準(zhǔn)彩色圖像矩陣,并計算出每個彩色像素點的色彩光波主頻、色彩飽和度以及亮度。計算過程如下
"X] l pn bn 613]「鍆 i 「0.49 0.31 0.20 I「H'
Y =J- hi hi 623 G = —0.17697 0.81240 0.01063 Gメ」[&3 &32 hs] [Sj U17by7 0.00 0.01 0.99 J B= x+y + z V - X + Y +zZ = x + v + z = 1-x-y根據(jù)上述兩個公式使用已知的RGB三色值求得X,y, Y三個分量,其中分量Y代表亮度,再根據(jù)X和I分量的值從圖4中查得對應(yīng)的色彩主頻與飽和度。圖像處理模塊2. 2構(gòu)建彩色圖像數(shù)據(jù)矩陣/r SZ^/77x/7x3x/,其中/代表橫坐標(biāo)分為/行像素,m代表縱坐標(biāo)分為m列像素,η代表縱深坐標(biāo)分為η列像素(2D圖像η取值I),X 3代表彩色圖像數(shù)據(jù)矩陣的色彩光波主頻、色彩飽和度以及亮度三個分量。t代表動態(tài)時間。最后圖像處理模塊2. 2將矩陣實時傳遞給圖像聲像轉(zhuǎn)換模塊2. 3圖像聲像轉(zhuǎn)換模塊2.3接收來自圖像處理模塊2. 2傳遞的彩色圖像數(shù)據(jù)矩陣/77Χ/7Χ3ΧΛ然后通過圖像聲像映射關(guān)系轉(zhuǎn)換為彩色聲像數(shù)據(jù)矩陣
多^SZ*A/77X/7X;3X/。其中I代表橫坐標(biāo)分為/行像素,m代表縱坐標(biāo)分為m列像素,η代表縱深坐標(biāo)分為η列像素(2D圖像η取值I),X 3代表彩色圖像數(shù)據(jù)矩陣的色彩聲素點聲波主頻、聲波信噪比以及響度三個分量。如附圖5所示,圖像聲像轉(zhuǎn)換模塊2. 3包括三個子模塊頻率轉(zhuǎn)換模塊2. 3. I、飽和度信噪比轉(zhuǎn)換模塊2. 3. 2、亮度響度轉(zhuǎn)換模塊2. 3. 3。頻率轉(zhuǎn)換模塊2. 3. I :建立像素點色彩主頻率到聲素聲波主頻率的映射正常人類視覺可見光范圍(3. 8χ1014Ηζ,7. 6χ1014Ηζ),正常人聽覺范圍(20Hz,20000Hz)。定義光波長WLl = 800nm映射到聲頻Fsl = 20Hz ;光波長WL2 = 300nm映射到聲頻Fs2 = 12500Hz ;光速c = 3 * 108m/s,則使用下列公式光頻fl可被映射到聲頻fs 線性映射fs= Fsl+(Fs2-FslV(c/WL2_c/WLl) * (fl-c/WLl);也可以映射到聲音對數(shù)頻率fs = 10~(loglO (Fsl) + (loglO(Fs2)-IoglO(Fsl))/(c/WL2-c/WLl) * (fl~c/WLl))。飽和度信噪比轉(zhuǎn)換模塊2. 3. 2 :建立像素飽和度到聲素信噪比映射。所述色彩飽和度是某一色彩相對于純正色彩的偏差,反映色彩的飽滿程度,這與某一音色的飽滿程度相仿,本領(lǐng)域可以通過填加噪聲的方式來反映音色的飽滿程度。光飽和度Saturation與對應(yīng)聲音信噪SNR比都能夠表達(dá)為噪聲與純正弦波的比例,兩者做等比映射。等比映射公式為
SNR = Saturation/(1-Saturation)。亮度響度轉(zhuǎn)換模塊2. 3. 3 :建立像素亮度到聲素響度的映射,亮度和響度都是與波幅度有關(guān),兩者可做相關(guān)映射??紤]到人耳對響度等級感覺隨頻率變化,標(biāo)準(zhǔn)IS0226 2003(Normalequal-louaness-level contours-ISO 226 2003acoustics internationalorganization forstandardization(ISO)2nd edition.http://www. sengpielaudio. com/Acoustics226-2003.pdf (2003))可以用來求得響度等級在特定主頻下對應(yīng)的聲音響度。具體可以采用如下過程進(jìn)行亮度到響度的相關(guān)映射定義亮度Yl = O映射到響度等級phol=O ;亮度Y2 = 1441映射到響度等級pho2 = 90 ;則用下列公式,亮度Ic可被映射到響度等級P P = phol+(pho2_phol)/(Y2-Y1) * (Ic-Yl);然后通過ISO 226 :2003可求出各聲素點響度等級p在該聲素點聲波主頻fs下的 響度。聲像處理模塊2. 4:接收圖像聲像轉(zhuǎn)換模塊2. 3傳遞的彩色聲像數(shù)據(jù)矩陣S/^iSZ^A/TTX/^Sx/,對空間每個聲素點產(chǎn)生雙耳脈沖色彩聲波。如附圖6所示,聲像處理模塊2. 4包括聲素彩色連續(xù)聲波合成模塊2. 4. I、聲素位置信息加載模塊2. 4. 2、聲波脈沖去耦模塊2. 4. 3和雙耳聲波合成模塊2. 4. 4。聲素彩色連續(xù)聲波合成模塊2. 4. I :通過聲素彩色聲像數(shù)據(jù)矩陣
所提供的每個聲素點聲波主頻、信噪比、響度,按照如下公式對每個聲素點產(chǎn)生相應(yīng)的人造連續(xù)彩色聲波Wave(t) = A*sin(2π*fs*t)+sqrt(1/SNR)*A*Noise(t)其中,Wave (t)為聲波隨時間變換波函數(shù),t為時間參數(shù),A為聲波振幅,fs為聲音頻率,SNR為信噪比Noise (t)為單位噪聲函數(shù)。聲素位置信息加載模塊2. 4. 2 :根據(jù)彩色像素空間位置信息以及KEMAR頭模型參數(shù)(Gardner, B. Martin, K. HRTF measurements of a KEMAR dummy-nead m icrophone.http://sound, media, mit. edu/resources/KEMAR. html (2000))或者雪人模型,查找出或計算出對應(yīng)的卷積函數(shù),進(jìn)行如下式的卷積運算便可求出對應(yīng)彩色聲素在左右耳產(chǎn)生的人造連續(xù)彩色聲波。即人耳聽該聲波可辨別聲素位置。et (r, t) = h, (F, t) <S> wave(r, t)ら( ,0= /^(り)0而財( ,0其中 為聲素點相對攝像頭空間位置,f為時間參數(shù),wave (r, t)為上述生成的聲素位置對應(yīng)的連續(xù)彩色聲波,Mr, t), hr(r, t)為左右耳頭相關(guān)傳遞函數(shù),ex(r, t), er (r, t)為加載聲素位置信息 后的左右耳聲波函數(shù)。聲波脈沖去稱模塊2. 4. 3 :由于相同色彩聲素產(chǎn)生聲波主頻相同,所產(chǎn)生的聲波干涉效應(yīng)使人們無法分辨兩聲素點。聲波脈沖去耦模塊2. 4. 3通過切斷連續(xù)彩色聲波、カロ隨機(jī)間隔的方式使聲波脈沖化,從而相同色彩聲素點對應(yīng)聲波去耦合化,人們可辨識相同色彩聲素點。如圖7所示,開始A和B兩點重合,在A和B兩點之間加入隨機(jī)間隔脈沖化后,連續(xù)聲波變成離散化的波包。雙耳聲波合成模塊2. 4. 4 :對應(yīng)每個聲素點產(chǎn)生的雙耳彩色脈沖化聲波信號進(jìn)行相加求和,便得到可用于導(dǎo)盲的立體聲雙耳彩色脈沖化聲波信號,并將其傳遞給聲像輸出模塊2. 5。該立體聲雙耳彩色脈沖化聲波信號可以使得盲人辨識物體的位置。聲像輸出模塊2. 5 :將聲像處理模塊2. 4所產(chǎn)生的立體聲雙耳彩色脈沖化聲波信號轉(zhuǎn)變成エ業(yè)標(biāo)準(zhǔn)格式存儲并提供接ロ給無殼雙耳耳機(jī)硬件模塊用于播放。無殼雙耳耳機(jī)模塊3 :接收主處理模塊2產(chǎn)生的エ業(yè)標(biāo)準(zhǔn)格式的立體聲雙耳彩色脈沖化聲波信號,并將其轉(zhuǎn)換成聲音通過無殼雙耳耳機(jī)播出。由于聲波通過耳機(jī)外殼會產(chǎn)生反射衍射等影響,這種影響直接削弱頭相關(guān)傳遞函數(shù)所加載的聲素位置信息。而無殼雙耳耳機(jī)模塊不具有外売,能夠消除聲波反射和衍射,從而保持脈沖式雙耳立體聲聲波信號攜帯的所述位置信息,有助于盲人對聲素位置的識別。在實施時,盲人所佩戴墨鏡上設(shè)置的攝像頭,或手機(jī)攝像頭,或盲人所處房間中的攝像頭采集實時彩色圖像數(shù)據(jù),圖像數(shù)據(jù)按照圖8所示的流程被轉(zhuǎn)換成雙耳聲像信號供給兩耳。以使高頻光波轉(zhuǎn)變成對應(yīng)低頻聲波來給盲人提供信息。如紅色大門可視為有許多紅色鈴鐺布滿在門上,緑色的墻壁掛有緑色的鈴鐺在響。盲人轉(zhuǎn)頭帶動攝像頭旋轉(zhuǎn),攝像頭 視野從綠色墻壁劃過紅色大門時,耳機(jī)聲音傳出的聲音由綠色響聲逐漸加入大門的紅色響聲。從而盲人可以輕松定位大門的位置。上述攝像頭可以是普通攝像頭,核磁共振成像設(shè)備,X-ray成像設(shè)備,夜視設(shè)備,3D攝像設(shè)備等。
權(quán)利要求
1.一種彩色聲像導(dǎo)盲方法,其特征在于包括如下步驟A.采集實時彩色圖像數(shù)據(jù);B.根據(jù)實時彩色圖像數(shù)據(jù)計算出每個彩色像素點的色彩光波主頻、色彩飽和度以及亮度,然后再轉(zhuǎn)換為相應(yīng)的聲素點聲波主頻、信噪比、以及響度,再結(jié)合彩色像素點的三維位置信息產(chǎn)生脈沖式雙耳立體聲聲波信號;C.將所述脈沖式雙耳立體聲聲波信號通過無殼雙耳耳機(jī)播放出來。
2.如權(quán)利要求I所述的方法,其特征在于所述步驟B具體為BI.獲得采集的實時彩色圖像數(shù)據(jù);B2.計算出所述實時彩色圖像數(shù)據(jù)中的每個彩色像素點的色彩光波主頻、色彩飽和度以及亮度;將所述色彩光波主頻、色彩飽和度以及亮度對應(yīng)轉(zhuǎn)換為聲素點聲波主頻、信噪 t匕、以及響度;B3.根據(jù)轉(zhuǎn)換后獲得的所述聲素點聲波主頻、信噪比、響度,以及所述彩色像素點的三維位置信息產(chǎn)生脈沖式雙耳立體聲聲波信號;B4.將所述脈沖式雙耳立體聲聲波信號轉(zhuǎn)換為工業(yè)標(biāo)準(zhǔn)格式存儲并輸出。
3.如權(quán)利要求2所述的方法,其特征在于所述步驟B3具體為B31.根據(jù)每個聲素點的聲波主頻、信噪比、響度產(chǎn)生人造連續(xù)彩色聲波;B32.根據(jù)所述彩色像素點的三維位置信息,使用頭相關(guān)傳遞函數(shù)方法產(chǎn)生左右耳人造連續(xù)彩色聲波;B33.通過填加隨機(jī)間隔的方式切斷所述左右耳人造連續(xù)彩色聲波,獲得脈沖聲波信號,以消除相同主頻聲波干涉效應(yīng);B34.對每個聲素點產(chǎn)生的所述脈沖聲波信號進(jìn)行相加求和,產(chǎn)生所述脈沖式雙耳立體聲聲波信號;其中,所述頭相關(guān)傳遞函數(shù)方法用于加載聲素點位置信息。
4.如權(quán)利要求2或3所述的方法,其特征在于所述步驟B2中采用線性映射方式將所述色彩光波主頻對應(yīng)轉(zhuǎn)換為所述聲素點聲波主頻,采用相關(guān)映射方式將所述亮度對應(yīng)轉(zhuǎn)換為所述聲素點響度等級,然后通過標(biāo)準(zhǔn)ISO 226計算得出各聲素點響度等級在對應(yīng)聲素點聲波主頻下的響度,采用比例映射方式將色彩飽和度轉(zhuǎn)換為聲音信噪比。
5.—種彩色聲像導(dǎo)盲儀,其特征在于包括攝像模塊,用于采集實時彩色圖像數(shù)據(jù);主處理模塊,用于接收攝像模塊采集的實時彩色圖像數(shù)據(jù),根據(jù)實時彩色圖像數(shù)據(jù)計算出每個彩色像素點的色彩光波主頻、色彩飽和度以及亮度,然后再轉(zhuǎn)換為相應(yīng)聲素點聲波主頻、聲波信噪比、以及聲波響度,再結(jié)合彩色像素點的三維位置信息產(chǎn)生脈沖式雙耳立體聲聲波信號,并傳遞給無殼雙耳耳機(jī)模塊;無殼雙耳耳機(jī)模塊,用于接收主處理模塊產(chǎn)生的脈沖式雙耳立體聲聲波信號,將其轉(zhuǎn)換成聲音并播出。
6.如權(quán)利要求5所述的彩色聲像導(dǎo)盲儀,其特征在于所述主處理模塊包括圖像采集模塊,用于獲得所述攝像模塊所采集的實時彩色圖像數(shù)據(jù);圖像處理模塊,用于接收圖像采集模塊獲得的實時彩色圖像數(shù)據(jù),計算出所述實時彩色圖像數(shù)據(jù)中的每個彩色像素點的色彩光波主頻、色彩飽和度以及亮度;圖像聲像轉(zhuǎn)換模塊,用于將所述色彩光波主頻、色彩飽和度以及亮度對應(yīng)轉(zhuǎn)換為聲素點的聲波主頻、信噪比、以及響度;聲像處理模塊,用于根據(jù)轉(zhuǎn)換后獲得的所述聲波主頻、信噪比、響度,以及彩色像素點的三維位置信息產(chǎn)生脈沖式雙耳立體聲聲波信號;聲像輸出模塊,用于將聲像處理模塊所產(chǎn)生的脈沖式雙耳立體聲聲波信號轉(zhuǎn)換為工業(yè)標(biāo)準(zhǔn)格式存儲并輸出給無殼雙耳耳機(jī)模塊播放。
7.如權(quán)利要求5所述的彩色聲像導(dǎo)盲儀,其特征在于所述聲像處理模塊包括 聲素彩色連續(xù)聲波合成模塊,用于根據(jù)每個聲素點的聲波主頻、信噪比、響度產(chǎn)生人造連續(xù)彩色聲波;聲素位置信息加載模塊,用于根據(jù)所述彩色像素點的三維位置信息,使用頭相關(guān)傳遞函數(shù)方法產(chǎn)生左右耳人造連續(xù)彩色聲波;聲波脈沖去耦模塊,用于通過填加隨機(jī)間隔的方式切斷所述左右耳人造連續(xù)彩色聲波,獲得聲波脈沖信號,以消除相同頻率聲波干涉效應(yīng);雙耳聲波合成模塊,用于對每個聲素點產(chǎn)生的所述聲波脈沖信號進(jìn)行相加求和,產(chǎn)生所述脈沖式雙耳立體聲聲波信號;其中,所述頭相關(guān)傳遞函數(shù)方法用于加載聲素點位置信息。
8.如權(quán)利要求6或7所述的彩色聲像導(dǎo)盲儀,其特征在于所述圖像聲像轉(zhuǎn)換模塊采用線性映射方式將所述色彩光波主頻對應(yīng)轉(zhuǎn)換為所述聲素點聲波主頻,采用相關(guān)映射方式將所述亮度對應(yīng)轉(zhuǎn)換為所述聲素點響度等級,然后通過標(biāo)準(zhǔn)ISO 226計算得出各聲素點響度等級在對應(yīng)聲素點聲波主頻下的響度,采用比例映射方式將色彩飽和度轉(zhuǎn)換為聲音信噪比。
9.如權(quán)利要求5所述的彩色聲像導(dǎo)盲儀,其特征在于所述攝像模塊設(shè)置在盲人佩戴的盲人眼鏡上,或者設(shè)置在手機(jī)上,或者設(shè)置在盲人所處房間的任何位置;所述攝像模塊可采用普通攝像頭、核磁共振成像設(shè)備、X-ray成像設(shè)備、夜視設(shè)備、或者3D攝像設(shè)備采集實時彩色圖像數(shù)據(jù)。
10.如權(quán)利要求5-7所述所述的彩色聲像導(dǎo)盲儀,其特征在于,所述無殼雙耳耳機(jī)模塊不具有外殼,并進(jìn)一步用于消除聲波反射和衍射,保持脈沖式雙耳立體聲聲波信號攜帶的所述位置信息。
全文摘要
提供一種彩色聲像導(dǎo)盲方法及彩色聲像導(dǎo)盲儀,能夠根據(jù)采集到的實時彩色圖像數(shù)據(jù),計算出每個彩色像素點的色彩光波主頻、色彩飽和度以及亮度,再轉(zhuǎn)換為對應(yīng)聲素點聲波主頻、聲波信噪比、以及響度,再結(jié)合彩色像素點的三維位置信息產(chǎn)生脈沖式雙耳立體聲聲波信號,并通過無殼雙耳耳機(jī)將聲像信息輸出以進(jìn)行導(dǎo)盲。本發(fā)明可以使得盲人無需經(jīng)過訓(xùn)練便可以識別三維物體的顏色、形狀和大小,識別分辨率高。
文檔編號A61F9/08GK102688120SQ20121018642
公開日2012年9月26日 申請日期2012年6月8日 優(yōu)先權(quán)日2012年6月8日
發(fā)明者綦峰 申請人:綦峰