助視裝置、助視系統(tǒng)及助視方法
【專利摘要】本發(fā)明公開了一種助視裝置、助視系統(tǒng)及助視方法。助視裝置包括:攝像頭,用于對一預(yù)定區(qū)域的圖像進(jìn)行采集,得到預(yù)定區(qū)域的圖像信息,并將預(yù)定區(qū)域的圖像信息傳輸?shù)教幚砥?;處理器,與攝像頭連接,用于:根據(jù)預(yù)定區(qū)域的圖像信息、預(yù)設(shè)的膚色的顏色直方圖和反向投影方法來確定預(yù)定區(qū)域的圖像信息的第一概率密度分布圖;根據(jù)連通域檢測算法確定第一概率密度分布圖中的手體區(qū)域;根據(jù)手體區(qū)域在預(yù)定區(qū)域內(nèi)標(biāo)定一顯示區(qū)域;以及將顯示區(qū)域的圖像信息放大,并將放大后的顯示區(qū)域的圖像信息傳輸?shù)斤@示器;以及顯示器,用于將放大后的顯示區(qū)域的圖像信息進(jìn)行顯示。由此,可以實(shí)現(xiàn)智能化助視閱讀,無需手動(dòng)操作,十分便捷。
【專利說明】
助視裝置、助視系統(tǒng)及助視方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及計(jì)算機(jī)視覺領(lǐng)域,具體地,涉及一種助視裝置、助視系統(tǒng)及助視方法。
【背景技術(shù)】
[0002]從古至今,閱讀一直是人們獲取信息、提高修養(yǎng)的一種重要途徑。然而,一些人群具有不同程度的閱讀障礙,這些人群包括近視、遠(yuǎn)視、弱視患者以及大部分的老年人等。他們常常利用各種輔助工具(例如,放大鏡、助視器等)將書本上的圖像放大來進(jìn)行閱讀。
[0003]在利用現(xiàn)有的輔助工具進(jìn)行閱讀時(shí),讀者需要手握該輔助工具,將其放置在需要閱讀或?qū)懽值牡胤剑@樣勢必會(huì)占用一只手,不論是寫字還是閱讀都很不方便。因此,對于視力差的人群來說,通過利用輔助工具將圖像放大來進(jìn)行閱讀或?qū)懽謺r(shí),還需要額外對這些輔助工具進(jìn)行操作來選取想要放大的目標(biāo)。這樣,讀者在閱讀或?qū)懽值耐瑫r(shí)又增加了對這些輔助工具的操作動(dòng)作,不僅影響閱讀速度,還影響閱讀體驗(yàn)。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是提供一種無需手動(dòng)操作、實(shí)現(xiàn)智能化助視閱讀的助視裝置、系統(tǒng)和方法。
[0005]為了實(shí)現(xiàn)上述目的,本發(fā)明提供一種助視裝置,該助視裝置包括:攝像頭,用于對一預(yù)定區(qū)域的圖像進(jìn)行采集,得到所述預(yù)定區(qū)域的圖像信息,并將所述預(yù)定區(qū)域的圖像信息傳輸?shù)教幚砥?;所述處理器,與所述攝像頭連接,用于:根據(jù)所述預(yù)定區(qū)域的圖像信息、預(yù)設(shè)的膚色的顏色直方圖和反向投影方法來確定所述預(yù)定區(qū)域的圖像信息的第一概率密度分布圖;根據(jù)連通域檢測算法確定所述第一概率密度分布圖中的手體區(qū)域;根據(jù)所述手體區(qū)域在所述預(yù)定區(qū)域內(nèi)標(biāo)定一顯示區(qū)域;以及將所述顯示區(qū)域的圖像信息放大,并將放大后的所述顯示區(qū)域的圖像信息傳輸?shù)斤@示器;以及所述顯示器,與所述處理器連接,用于將所述放大后的所述顯示區(qū)域的圖像信息進(jìn)行顯示。
[0006]優(yōu)選地,所述處理器還用于:在確定所述預(yù)定區(qū)域的圖像信息的第一概率密度分布圖之后,在所述手體在所述預(yù)定區(qū)域內(nèi)移動(dòng)的情況下,根據(jù)背景差分法來確定所述預(yù)定區(qū)域的第一背景差分圖像;以及將所述第一背景差分圖像中判斷為背景的像素點(diǎn)在所述第一概率密度分布圖中的概率降低為零。
[0007]優(yōu)選地,所述處理器還用于:在根據(jù)連通域檢測算法確定所述第一概率密度分布圖中的手體區(qū)域之后,通過將所述手體區(qū)域與預(yù)設(shè)的手體特征進(jìn)行匹配來對所述預(yù)定區(qū)域內(nèi)的手體區(qū)域進(jìn)行確認(rèn)。
[0008]優(yōu)選地,在所述手體在所述預(yù)定區(qū)域移動(dòng)之前的初始幀中,在所述預(yù)定區(qū)域內(nèi)標(biāo)定初始幀的一跟蹤區(qū)域,使得該初始幀的跟蹤區(qū)域至少包括所述手體區(qū)域的一部分;確定所述初始幀的跟蹤區(qū)域的像素點(diǎn)的顏色直方圖,根據(jù)初始幀的所述預(yù)定區(qū)域的圖像信息、所述初始幀的跟蹤區(qū)域的像素點(diǎn)的顏色直方圖和反向投影方法來確定初始幀的所述預(yù)定區(qū)域的圖像信息的第二概率密度分布圖;在所述初始幀之后的每一幀中,根據(jù)上一幀的所述跟蹤區(qū)域的像素點(diǎn)的顏色直方圖、當(dāng)前幀的所述預(yù)定區(qū)域的圖像信息和反向投影方法,確定當(dāng)前幀的第二概率密度分布圖,根據(jù)均值漂移算法標(biāo)定當(dāng)前幀的跟蹤區(qū)域,使得跟蹤區(qū)域在所述當(dāng)前幀的第二概率密度分布圖中的概率分布與上一幀的所述跟蹤區(qū)域在上一幀的第二概率密度分布圖中的概率分布相匹配;以及根據(jù)當(dāng)前幀的跟蹤區(qū)域來標(biāo)定當(dāng)前幀的顯示區(qū)域。
[0009]優(yōu)選地,所述處理器還用于:在標(biāo)定所述初始幀的跟蹤區(qū)域之前,將所述手體區(qū)域在所述第一概率密度分布圖中的概率分布按照一預(yù)定規(guī)則進(jìn)行調(diào)整,使得所述手體區(qū)域在所述第一概率密度分布圖中的概率隨所述預(yù)定區(qū)域邊緣的延伸方向而逐漸減小,之后,再根據(jù)調(diào)整后的所述手體區(qū)域在所述第一概率密度分布圖中的概率分布標(biāo)定所述初始幀的跟蹤區(qū)域;以及在標(biāo)定所述當(dāng)前幀的跟蹤區(qū)域之前,將所述當(dāng)前幀的所述手體區(qū)域在所述第二概率密度分布圖中的概率分布按照所述預(yù)定規(guī)則進(jìn)行調(diào)整,使得所述當(dāng)前幀的所述手體區(qū)域在所述第二概率密度分布圖中的概率隨所述預(yù)定區(qū)域邊緣的延伸方向而逐漸減小,之后,再根據(jù)調(diào)整后的所述手體區(qū)域在所述第二概率密度分布圖中的概率分布標(biāo)定所述當(dāng)前幀的跟蹤區(qū)域。
[0010]優(yōu)選地,所述處理器還用于:在所述初始幀之后的每一幀中,在確定當(dāng)前幀的第二概率密度分布圖之后,根據(jù)背景差分法來確定當(dāng)前幀的第二背景差分圖像;以及將所述當(dāng)前幀的第二背景差分圖像中判斷為背景的像素點(diǎn)在所述當(dāng)前幀的第二概率密度分布圖中的概率降低為零。
[0011]優(yōu)選地,所述處理器還用于:對所述手體的手勢進(jìn)行識別,根據(jù)所識別的手勢對所述顯示區(qū)域的圖像信息進(jìn)行處理,并將處理后的所述顯示區(qū)域的圖像信息傳輸?shù)剿鲲@示器;以及所述顯示器還用于對處理后的所述顯示區(qū)域的圖像信息進(jìn)行顯示。
[0012]優(yōu)選地,該助視裝置還包括音頻播放器,其中,所述處理器還用于對所述顯示區(qū)域的字符進(jìn)行識別,生成與所識別的字符對應(yīng)的語音信息,并將所述語音信息傳輸?shù)剿鲆纛l播放器;以及所述音頻播放器與所述處理器連接,用于將所述語音信息進(jìn)行播放,其中,所述處理器還用于接收用戶切換指令,并在接收到所述用戶切換指令的情況下,向所述顯示器傳輸放大后的所識別的字符,其中,所述用戶切換指令用于指示顯示放大后的所識別的字符。
[0013]本發(fā)明還提供一種助視系統(tǒng),該助視系統(tǒng)包括:上述助視裝置;以及服務(wù)器,與所述助視裝置通信,用于與所述助視裝置遠(yuǎn)程交互。
[0014]本發(fā)明還提供一種助視方法,該助視方法包括:對一預(yù)定區(qū)域的圖像進(jìn)行采集,得到所述預(yù)定區(qū)域的圖像信息;根據(jù)所述預(yù)定區(qū)域的圖像信息、預(yù)設(shè)的膚色的顏色直方圖和反向投影方法來確定所述預(yù)定區(qū)域的圖像信息的第一概率密度分布圖;根據(jù)連通域檢測算法確定所述第一概率密度分布圖中的手體區(qū)域;根據(jù)所述手體區(qū)域在所述預(yù)定區(qū)域內(nèi)標(biāo)定一顯示區(qū)域;將所述顯示區(qū)域的圖像信息放大;以及將所述放大后的所述顯示區(qū)域的圖像信息進(jìn)行顯示。
[0015]通過上述技術(shù)方案,本發(fā)明的助視裝置根據(jù)攝像頭采集的一預(yù)定區(qū)域的圖像信息確定出該預(yù)定區(qū)域內(nèi)的手體區(qū)域,根據(jù)該手體區(qū)域確定一顯示區(qū)域,然后將該顯示區(qū)域中的圖像信息放大后在顯示器上顯示出來。這樣,當(dāng)視力差的讀者用該助視裝置閱讀或?qū)懽值臅r(shí)候,只要把閱讀文件放在預(yù)定區(qū)域,把手放在該閱讀文件的紙面上,指向想要閱讀的地方,顯示器中就能夠顯示出想要閱讀的地方的放大的圖像。因此,通過應(yīng)用本發(fā)明的助視裝置,使得視力差的讀者通過將圖像放大來閱讀的同時(shí),不需要對該助視裝置進(jìn)行操作來選取想要放大的區(qū)域,從而加快了閱讀速度,改善閱讀體驗(yàn)。在本發(fā)明的優(yōu)選實(shí)施方式中,該助視裝置能夠?qū)⑹煮w的一部分自動(dòng)標(biāo)定為目標(biāo)進(jìn)行實(shí)時(shí)跟蹤,從而能夠自動(dòng)地跟蹤手體所指的顯示區(qū)域,使顯示器中能夠自動(dòng)放大顯示讀者想要關(guān)注的地方。
[0016]本發(fā)明的其他特征和優(yōu)點(diǎn)將在隨后的【具體實(shí)施方式】部分予以詳細(xì)說明。
【附圖說明】
[0017]附圖是用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與下面的【具體實(shí)施方式】一起用于解釋本發(fā)明,但并不構(gòu)成對本發(fā)明的限制。在附圖中:
[0018]圖1是根據(jù)本發(fā)明的實(shí)施方式提供的助視裝置的結(jié)構(gòu)框圖;
[0019]圖2a_圖2d是根據(jù)本發(fā)明的實(shí)施方式提供的標(biāo)定的各個(gè)區(qū)域的示意圖;
[0020]圖3是根據(jù)本發(fā)明的實(shí)施方式提供的助視裝置的示意圖;
[0021]圖4是根據(jù)本發(fā)明的另一實(shí)施方式提供的助視裝置的結(jié)構(gòu)框圖;
[0022]圖5是根據(jù)本發(fā)明的實(shí)施方式提供的助視系統(tǒng)的示意圖;以及
[0023]圖6是根據(jù)本發(fā)明的實(shí)施方式提供的助視方法的流程圖。
[0024]附圖標(biāo)記說明
[0025]100助視裝置101攝像頭 102處理器
[0026]103顯示器 104音頻播放器110服務(wù)器
[0027]I 預(yù)定區(qū)域II 手體區(qū)域 III顯示區(qū)域
[0028]IV 跟蹤區(qū)域
【具體實(shí)施方式】
[0029]以下結(jié)合附圖對本發(fā)明的【具體實(shí)施方式】進(jìn)行詳細(xì)說明。應(yīng)當(dāng)理解的是,此處所描述的【具體實(shí)施方式】僅用于說明和解釋本發(fā)明,并不用于限制本發(fā)明。
[0030]圖1是根據(jù)本發(fā)明的實(shí)施方式提供的助視裝置的結(jié)構(gòu)框圖。如圖1所示,該助視裝置100可以包括攝像頭101、處理器102和顯示器103。其中,攝像頭101可以用于對一預(yù)定區(qū)域的圖像進(jìn)行采集,得到該預(yù)定區(qū)域的圖像信息,并將該預(yù)定區(qū)域的圖像信息傳輸?shù)教幚砥?02。處理器102與攝像頭101連接,處理器102可以用于進(jìn)行以下操作:根據(jù)預(yù)定區(qū)域的圖像信息、預(yù)設(shè)的膚色的顏色直方圖和反向投影方法來確定預(yù)定區(qū)域的圖像信息的第一概率密度分布圖;根據(jù)連通域檢測算法確定第一概率密度分布圖中的手體區(qū)域;根據(jù)手體區(qū)域在預(yù)定區(qū)域內(nèi)標(biāo)定一顯示區(qū)域;以及將顯示區(qū)域的圖像信息放大,并將放大后的顯示區(qū)域的圖像信息傳輸?shù)斤@示器103。顯示器103與處理器102連接,顯示器103可以用于將放大后的顯示區(qū)域的圖像信息進(jìn)行顯示。
[0031]圖2a_圖2d是根據(jù)本發(fā)明的實(shí)施方式提供的處理器102進(jìn)行圖像處理的示意圖。如圖2a-圖2d所示,預(yù)定區(qū)域I可以是攝像頭101所能采集的區(qū)域。例如,可以將該預(yù)定區(qū)域I設(shè)定為略大于A4紙,這樣,對于一般的閱讀材料,攝像頭101可以一次性采集一個(gè)版面,而不需要在閱讀過程中再去移動(dòng)書本。
[0032]以下詳細(xì)描述處理器102對采集到的預(yù)定區(qū)域I的圖像信息的處理過程。
[0033]首先,根據(jù)預(yù)定區(qū)域I的圖像信息、預(yù)設(shè)的膚色的顏色直方圖和反向投影方法來確定預(yù)定區(qū)域I的圖像信息的第一概率密度分布圖。膚色是人體專有的顏色特征,可以通過預(yù)設(shè)色調(diào)飽和度亮度(HSV,hue, saturat1n, value)顏色空間中的色調(diào)取值范圍來確定膚色的色調(diào)。也就是,可以以一閾值作為分割界限,將膚色色調(diào)與非膚色色調(diào)區(qū)分開來。例如,可以根據(jù)經(jīng)驗(yàn)在HSV顏色空間中設(shè)定膚色色調(diào)在336-360和0_68的范圍內(nèi)。在預(yù)設(shè)膚色的色調(diào)范圍之后,可以確定該預(yù)設(shè)的膚色的顏色直方圖。然后,根據(jù)將該預(yù)設(shè)的膚色的顏色直方圖、預(yù)定區(qū)域I的圖像信息和反向投影方法,可以得到預(yù)定區(qū)域I的圖像信息的第一概率密度分布圖。2011年江西理工大學(xué)江鳳兵的碩士論文《不同顏色空間膚色檢測算法的研究》中詳細(xì)描述了利用各種顏色空間的膚色檢測算法,其全部內(nèi)容在此被合并引用。在讀者將手放到預(yù)定區(qū)域I內(nèi)的情況下,處理器102得到的第一概率密度分布圖中會(huì)出現(xiàn)一個(gè)手形的區(qū)域。
[0034]在一些復(fù)雜的背景中,預(yù)定區(qū)域I中可能會(huì)有些不屬于手體但與膚色相似的像素點(diǎn),這時(shí),由上述膚色檢測方法得到的第一概率密度分布圖中由膚色區(qū)域確定的手體區(qū)域可能會(huì)有冗余信息。要得到準(zhǔn)確的手體區(qū)域,需要將這些不屬于手體但具有與膚色相似顏色的像素點(diǎn)剔除。因此,優(yōu)選地,處理器102還可以結(jié)合一種背景差分的方法來剔除掉冗余信息。也就是,在手體在預(yù)定區(qū)域I內(nèi)移動(dòng)的情況下,根據(jù)背景差分法來確定預(yù)定區(qū)域I的第一背景差分圖像;以及將第一背景差分圖像中判斷為背景的像素點(diǎn)在第一概率密度分布圖中的概率降低為零。
[0035]其中,該背景差分法可以利用例如混合高斯模型構(gòu)建出一幀可以參考的背景圖像,取得當(dāng)前幀與背景幀之間的差值,這個(gè)差值飽含了幀間變化的運(yùn)動(dòng)信息,可以剔除掉長時(shí)間沒有發(fā)生變化的背景區(qū)域,只剩下具有運(yùn)動(dòng)狀態(tài)的目標(biāo)。2013年電子科技大學(xué)普婕的碩士論文《復(fù)雜動(dòng)態(tài)場景背景建模與目標(biāo)檢測技術(shù)研究》詳細(xì)描述了背景建模和目標(biāo)檢測技術(shù),其全部內(nèi)容在此被合并引用。第一背景差分圖像中“凸顯”的區(qū)域?yàn)闄z測為運(yùn)動(dòng)的圖像區(qū)域,該圖像區(qū)域呈現(xiàn)手體形狀。這樣,通過將在第一背景差分圖像中判斷為背景的像素點(diǎn)在第一概率密度分布圖中的概率降低為零,可以將這些非手體的膚色像素點(diǎn)剔除。
[0036]接下來,處理器102根據(jù)連通域檢測算法確定第一概率密度分布圖中的手體區(qū)域。也就是,在手體以一定比例進(jìn)入到預(yù)定區(qū)域I時(shí),在第一概率密度分布圖上,通過連通域檢測算法,提取出概率密度較大的一些連通區(qū)域,提取出來的該連通區(qū)域可以確定為手體區(qū)域II (如圖2a-圖2d所示)。2014年吉林大學(xué)王霏的碩士論文《基于視頻的運(yùn)動(dòng)目標(biāo)檢測算法研究》中詳細(xì)描述了該連通域檢測算法,其全部內(nèi)容在此被合并引用。
[0037]為了降低對手體區(qū)域II誤判的可能性,處理器102可以進(jìn)一步對手體區(qū)域II進(jìn)行確認(rèn)。優(yōu)選地,處理器102在根據(jù)連通域檢測算法確定第一概率密度分布圖中的手體區(qū)域II之后,可以通過將手體區(qū)域II與預(yù)設(shè)的手體特征進(jìn)行匹配,以對預(yù)定區(qū)域I內(nèi)的手體區(qū)域II進(jìn)行確認(rèn)。其中,所述手體特征可以是根據(jù)手體的大小、形狀、動(dòng)作和/或手體區(qū)域與預(yù)定區(qū)域I的邊緣的位置關(guān)系(例如,手體區(qū)域II與預(yù)定區(qū)域I的邊緣相交的部分應(yīng)該是手臂或手腕的圖像區(qū)域,不應(yīng)該出現(xiàn)手指的形狀)來確定的特征。例如,該手體特征可以是一些手形的模板,并且可以預(yù)存在處理器102中。在手體區(qū)域II的形狀與預(yù)設(shè)的手體特征的匹配程度在誤差范圍的情況下,可以進(jìn)一步確認(rèn)由連通域檢測算法確定的第一概率密度分布圖中的上述手體區(qū)域II就是實(shí)際手體所對應(yīng)的圖像區(qū)域。
[0038]接下來,處理器102根據(jù)手體區(qū)域II在預(yù)定區(qū)域I內(nèi)標(biāo)定一顯示區(qū)域III (如圖2b所示)。具體地,可以以多種方式來標(biāo)定該顯示區(qū)域III。例如,可以以手體區(qū)域II的左上角的像素點(diǎn)為中心標(biāo)定一個(gè)矩形,或者可以以手體區(qū)域II的左上角的像素點(diǎn)向上或向左平移一預(yù)定距離為中心標(biāo)定一個(gè)矩形?;蛘撸谔幚砥?02檢測到手體區(qū)域II與預(yù)定區(qū)域I的左側(cè)邊緣相交的情況(讀者用左手指示想要關(guān)注的區(qū)域)下,可以以手體區(qū)域II的右上角的像素點(diǎn)為中心標(biāo)定一個(gè)矩形,或者可以以手體區(qū)域II的右上角的像素點(diǎn)向上或向右平移一預(yù)定距離為中心標(biāo)定一個(gè)矩形。該顯示區(qū)域III就是其中的圖像信息可以在顯示器103中進(jìn)行放大顯示的區(qū)域,也就是讀者想要關(guān)注的區(qū)域。
[0039]以上處理器102標(biāo)定顯示區(qū)域III可以在手體靜止不動(dòng)的情況下來標(biāo)定。當(dāng)由于閱讀的需要而使讀者關(guān)注的區(qū)域發(fā)生變化時(shí),讀者可以將手體在預(yù)定區(qū)域I內(nèi)移動(dòng)時(shí),指示想要關(guān)注的區(qū)域。因此,優(yōu)選情況下,處理器102可以根據(jù)手體的移動(dòng)來動(dòng)態(tài)標(biāo)定該顯示區(qū)域III。
[0040]具體地,處理器102根據(jù)手體區(qū)域II在預(yù)定區(qū)域I內(nèi)標(biāo)定一顯示區(qū)域III可以包括:
[0041]1、在手體在預(yù)定區(qū)域I移動(dòng)之前的初始幀中,在預(yù)定區(qū)域內(nèi)標(biāo)定初始幀的一跟蹤區(qū)域IV(如圖2c所示),使得該初始幀的跟蹤區(qū)域IV至少包括手體區(qū)域II的一部分。也就是,可以選取包含手體區(qū)域II中的任意一部分的矩形框作為跟蹤區(qū)域IV。
[0042]2、確定初始幀的跟蹤區(qū)域IV的像素點(diǎn)的顏色直方圖,根據(jù)初始幀的預(yù)定區(qū)域I的圖像信息、初始幀的跟蹤區(qū)域IV的像素點(diǎn)的顏色直方圖和反向投影方法來確定初始幀的預(yù)定區(qū)域I的圖像信息的第二概率密度分布圖。
[0043]3、在初始幀之后的每一幀中,根據(jù)上一幀的跟蹤區(qū)域IV的像素點(diǎn)的顏色直方圖、當(dāng)前幀的預(yù)定區(qū)域I的圖像信息和反向投影方法,確定當(dāng)前幀的第二概率密度分布圖,根據(jù)均值漂移算法標(biāo)定當(dāng)前幀的跟蹤區(qū)域IV,使得當(dāng)前幀的跟蹤區(qū)域IV在當(dāng)前幀的第二概率密度分布圖中的概率分布與上一幀的跟蹤區(qū)域IV在上一幀的第二概率密度分布圖中的概率分布相匹配。該匹配可以為:當(dāng)前幀的跟蹤區(qū)域IV在當(dāng)前幀的第二概率密度分布圖的概率分布與上一幀的跟蹤區(qū)域IV在上一幀的第二概率密度分布圖中的概率分布在差別允許的范圍內(nèi)被判為相一致。也就是,在確定初始幀的跟蹤區(qū)域IV后,以此作為均值漂移算法的起始位置,在后續(xù)的每一幀中,該均值漂移算法通過第二概率密度分布圖中跟蹤區(qū)域IV的概率分布遞歸計(jì)算出概率質(zhì)心的漂移矢量,相對起點(diǎn)得出一個(gè)新的跟蹤區(qū)域IV位置,以此位置作為新的一幀中對手體移動(dòng)軌跡的跟蹤結(jié)果,隨后的每一幀進(jìn)行類似的迭代工作,達(dá)到跟隨手體移動(dòng)的跟蹤效果。2005年6月,第24卷第2期的《計(jì)算技術(shù)與自動(dòng)化》中,陳彩虹的《復(fù)雜背景下實(shí)時(shí)運(yùn)動(dòng)手指提取及指尖檢測方法》詳細(xì)描述了用均值漂移算法進(jìn)行目標(biāo)跟蹤的方法,其全部內(nèi)容在此被合并引用。
[0044]4、根據(jù)當(dāng)前幀的跟蹤區(qū)域IV來標(biāo)定當(dāng)前幀的顯示區(qū)域III,如圖2d所示。例如,可以在預(yù)定區(qū)域I的圖像信息的當(dāng)前幀中,將跟蹤區(qū)域IV中心的像素點(diǎn)向上或向右平移一預(yù)定距離的像素點(diǎn)為中心標(biāo)定一個(gè)矩形的顯示區(qū)域III,該顯示區(qū)域III就是用戶希望關(guān)注的區(qū)域。
[0045]處理器102采用上述步驟在預(yù)定區(qū)域I內(nèi)標(biāo)定一顯示區(qū)域III之后,將顯示區(qū)域III的圖像信息放大,并將放大后的顯示區(qū)域III的圖像信息傳輸?shù)斤@示器103。這樣,處理器102就將讀者期望關(guān)注的部分的放大信息傳輸?shù)斤@示器103進(jìn)行顯示。
[0046]為了選擇合適的跟蹤范圍來對手體區(qū)域II進(jìn)行跟蹤。優(yōu)選地,處理器102還可以用于:在標(biāo)定初始幀的跟蹤區(qū)域之前,將手體區(qū)域II在第一概率密度分布圖中的概率分布按照一預(yù)定規(guī)則進(jìn)行調(diào)整,使得手體區(qū)域II在第一概率密度分布圖中的概率隨著向預(yù)定區(qū)域I邊緣的延伸方向而逐漸減小,之后,再根據(jù)調(diào)整后的手體區(qū)域II在第一概率密度分布圖中的概率分布標(biāo)定一跟蹤區(qū)域IV。以及,處理器102還可以在標(biāo)定當(dāng)前幀的跟蹤區(qū)域IV之前,將當(dāng)前幀的手體區(qū)域II在第二概率密度分布圖中的概率分布按照上述預(yù)定規(guī)則進(jìn)行調(diào)整,使得當(dāng)前幀的手體區(qū)域II在第二概率密度分布圖中的概率隨預(yù)定區(qū)域I邊緣的延伸方向而逐漸減小,之后,再根據(jù)調(diào)整后的手體區(qū)域II在第二概率密度分布圖中的概率分布標(biāo)定當(dāng)前幀的跟蹤區(qū)域IV。其中,該預(yù)定規(guī)則例如可以是使手體區(qū)域II中各個(gè)像素點(diǎn)的概率沿著向預(yù)定區(qū)域I邊緣的延伸方向按比例減小。上述優(yōu)選實(shí)施方式中,在初始幀中對手體區(qū)域II中各個(gè)像素點(diǎn)的概率進(jìn)行調(diào)整,便于優(yōu)先選擇包含手背部分(比手臂部分概率大)的矩形框作為跟蹤區(qū)域IV,在當(dāng)前幀中對手體區(qū)域II中各個(gè)像素點(diǎn)的概率進(jìn)行調(diào)整,便于處理器102準(zhǔn)確、快速地找到相匹配的跟蹤區(qū)域IV。
[0047]在手體移動(dòng)的情況下,優(yōu)選地,還可以根據(jù)背景差分的方法來剔除第二概率密度分布圖中手體檢測的冗余信息。具體地,處理器102還可以用于:在初始幀之后的每一幀中,在確定當(dāng)前幀的的第二概率密度分布圖之后,根據(jù)背景差分法來確定當(dāng)前幀的第二背景差分圖像;以及將當(dāng)前幀的第二背景差分圖像中判斷為背景的像素點(diǎn)在當(dāng)前幀的第二概率密度分布圖中的概率降低為零。
[0048]為了方便讀者選擇適合自己的字體大小,優(yōu)選情況下,處理器102還可以用于對手體的手勢進(jìn)行識別,根據(jù)所識別的手勢對顯示區(qū)域III的圖像信息進(jìn)行處理,并將處理后的顯示區(qū)域III的圖像信息傳輸?shù)斤@示器103。顯示器103還可以用于對根據(jù)所識別的手勢處理后的顯示區(qū)域的圖像信息進(jìn)行顯示。具體地,手勢識別可以采用BP(BackPropagat1n)神經(jīng)網(wǎng)絡(luò)的算法來分類各種手勢。以跟蹤區(qū)域IV概率的質(zhì)心為原點(diǎn),按角度將周圍劃分為η個(gè)鄰域,并以η個(gè)鄰域的質(zhì)心與原點(diǎn)的位置關(guān)系作為特征輸入,經(jīng)過訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)分類器輸出手勢的判定結(jié)果。其中,對顯示區(qū)域III的圖像信息進(jìn)行的處理可以包括縮放圖像和截圖等。讀者通過縮放圖像可以選擇合適的字體大?。煌ㄟ^截圖并將圖片存儲(chǔ)在處理器102中,可以將感興趣的部分記錄下來,方便以后查找。2013年9月第39卷第3期的《延邊大學(xué)學(xué)報(bào)(自然科學(xué)版)》中,何良華的《一種基于視頻的手勢識別算法》中詳細(xì)描述了這種手勢識別算法,其全部內(nèi)容在此被合并引用。
[0049]處理器102將放大(或處理)后的顯示區(qū)域III的圖像信息傳輸?shù)斤@示器103后,由顯示器103來進(jìn)行顯示。該顯示器103例如可以是手機(jī)、平板等,與處理器102可以有線或無線地連接。
[0050]圖3是根據(jù)本發(fā)明的實(shí)施方式提供的助視裝置100的示意圖。由圖3所示,該實(shí)施方式中,助視裝置100可以制作成臺燈樣式置于桌面上,攝像頭101可以安裝在助視裝置100的支架上。用該助視裝置100進(jìn)行閱讀的時(shí)候,可以將要閱讀的書本放置在桌面上,此時(shí),攝像頭101所能采集到圖像信息的范圍可以為預(yù)定區(qū)域I。當(dāng)攝像頭101采集到預(yù)定區(qū)域I的圖像信息之后,將該圖像信息傳輸?shù)教幚砥?02,處理器102例如可以安裝在在助視裝置100的支架頂端。處理器102對該預(yù)定區(qū)域的圖像信息進(jìn)行處理之后,提取出顯示區(qū)域III中的圖像信息并將其放大后傳輸?shù)斤@示器103。最后,經(jīng)放大的顯示區(qū)域III中的圖像信息在顯示器103中顯示出來。由于處理器102中可以根據(jù)檢測的手體來標(biāo)定顯示區(qū)域III,所以,讀者只要把手置于該預(yù)定區(qū)域I中,顯示器103中就可以放大顯示手體附近的圖像信息。并且,讀者在閱讀過程中移動(dòng)手體,顯示器103中就可以跟蹤顯示讀者想要關(guān)注的區(qū)域。在圖3的實(shí)施方式中,顯示器103可以通過延長桿和頭箍固定到頭部,這種安裝方法不僅方便閱讀,而且還保護(hù)頸椎。
[0051]另外,在讀者閱讀疲勞的情況下,本發(fā)明的助視裝置100還可以提供語音播報(bào)功能。圖4是根據(jù)本發(fā)明的另一實(shí)施方式提供的助視裝置的結(jié)構(gòu)框圖。如圖4所示,該優(yōu)選實(shí)施方式中,助視裝置100還可以包括音頻播放器104。其中,處理器102還可以用于對顯示區(qū)域III的字符進(jìn)行識別,生成與所識別的字符對應(yīng)的語音信息,并將該語音信息傳輸?shù)揭纛l播放器104。該音頻播放器104可以與處理器102連接,用于將語音信息進(jìn)行播放。其中,處理器102還用于接收用戶切換指令,并在接收到用戶切換指令的情況下,向顯示器102傳輸放大后的所識別的字符,其中,用戶切換指令用于指示顯示放大后的所識別的字符;顯示器102還可以用于將放大后的所識別的字符進(jìn)行顯示。助視裝置100的該優(yōu)選實(shí)施方式還能夠使讀者以多途徑接收信息,增強(qiáng)了閱讀體驗(yàn)。并且,與攝像頭101采集的顯示區(qū)域III的圖像信息不同,該識別后的圖像信息中包括計(jì)算機(jī)能夠識別出的字符,而不包括圖片之類不能識別為字符的信息。讀者可以選擇這種顯示方式來簡化顯示內(nèi)容,減輕閱讀負(fù)擔(dān)。
[0052]通過以上技術(shù)方案,當(dāng)視力差的讀者用該助視裝置100閱讀或?qū)懽值臅r(shí)候,只要把閱讀文件放在預(yù)定區(qū)域I,把手放在該閱讀文件的紙面上,指向想要閱讀的地方,顯示器103中就能夠顯示出想要閱讀的地方的放大的圖像。因此,通過應(yīng)用本發(fā)明的助視裝置100,使得由視力差的讀者在通過將圖像放大來閱讀的同時(shí),不需要對輔助工具進(jìn)行操作來選取想要放大的區(qū)域,從而加快了閱讀速度,增強(qiáng)了閱讀體驗(yàn)。
[0053]本發(fā)明還提供一種助視系統(tǒng)。圖5是根據(jù)本發(fā)明的實(shí)施方式提供的助視系統(tǒng)的示意圖。如圖5所示,該助視系統(tǒng)可以包括上述助視裝置100 (例如8個(gè))和服務(wù)器110。其中,服務(wù)器110可以與助視裝置100通信,用于與各個(gè)助視裝置100遠(yuǎn)程交互。具體地,月艮務(wù)器110可以通過網(wǎng)絡(luò)(例如,互聯(lián)網(wǎng)或局域網(wǎng))從一助視裝置100接收圖像信息,并對圖像信息進(jìn)行處理(例如,存儲(chǔ)、分類),還可以將處理后的圖像信息發(fā)送到該助視裝置100或其他助視裝置100。該實(shí)施方式中,每個(gè)助視裝置100的用戶還可以通過該服務(wù)器110與其它助視裝置100的用戶建立社交網(wǎng)絡(luò),彼此交換存儲(chǔ)的信息,交流心得體會(huì)。
[0054]本發(fā)明還提供一種助視方法。圖6是根據(jù)本發(fā)明的實(shí)施方式提供的助視方法的流程圖。如圖6所示,該助視方法可以包括:
[0055]步驟S601,對一預(yù)定區(qū)域的圖像進(jìn)行采集,得到預(yù)定區(qū)域的圖像信息;
[0056]步驟S602,根據(jù)預(yù)定區(qū)域的圖像信息、預(yù)設(shè)的膚色的顏色直方圖和反向投影方法來確定預(yù)定區(qū)域的圖像信息的第一概率密度分布圖;
[0057]步驟S603,根據(jù)連通域檢測算法確定第一概率密度分布圖中的手體區(qū)域;
[0058]步驟S604,根據(jù)手體區(qū)域在預(yù)定區(qū)域內(nèi)標(biāo)定一顯示區(qū)域;
[0059]步驟S605,將顯示區(qū)域的圖像信息放大;以及
[0060]步驟S606,將放大后的顯示區(qū)域的圖像信息進(jìn)行顯示。
[0061]優(yōu)選地,該助視方法還可以包括:在步驟S602之后,在手體在預(yù)定區(qū)域內(nèi)移動(dòng)的情況下,根據(jù)背景差分法來確定預(yù)定區(qū)域的第一背景差分圖像;以及將第一背景差分圖像中判斷為背景的像素點(diǎn)在第一概率密度分布圖中的概率降低為零。
[0062]優(yōu)選地,該助視方法還可以包括:在步驟S603之后,通過將手體區(qū)域與預(yù)設(shè)的手體特征進(jìn)行匹配來對預(yù)定區(qū)域內(nèi)的手體區(qū)域進(jìn)行確認(rèn)。
[0063]優(yōu)選地,步驟S604可以包括:在手體在所述預(yù)定區(qū)域移動(dòng)之前的初始幀中,在預(yù)定區(qū)域內(nèi)標(biāo)定初始幀的一跟蹤區(qū)域,使得該初始幀的跟蹤區(qū)域至少包括手體區(qū)域的一部分;確定初始幀的跟蹤區(qū)域的像素點(diǎn)的顏色直方圖,根據(jù)初始幀的預(yù)定區(qū)域的圖像信息、初始幀的跟蹤區(qū)域的像素點(diǎn)的顏色直方圖和反向投影方法來確定初始幀的預(yù)定區(qū)域的圖像信息的第二概率密度分布圖;在所述初始幀之后的每一幀中,根據(jù)上一幀的跟蹤區(qū)域的像素點(diǎn)的顏色直方圖、當(dāng)前幀的預(yù)定區(qū)域的圖像信息和反向投影方法,確定當(dāng)前幀的第二概率密度分布圖,根據(jù)均值漂移算法標(biāo)定當(dāng)前幀的跟蹤區(qū)域,使得當(dāng)前幀的跟蹤區(qū)域在當(dāng)前幀的第二概率密度分布圖中的概率分布與上一幀的跟蹤區(qū)域在上一幀的第二概率密度分布圖中的概率分布相匹配;以及根據(jù)當(dāng)前幀的跟蹤區(qū)域來標(biāo)定當(dāng)前幀的顯示區(qū)域。
[0064]優(yōu)選地,通過以下方式在預(yù)定區(qū)域內(nèi)標(biāo)定一跟蹤區(qū)域:將手體區(qū)域在第一概率密度分布圖中的概率分布按照一預(yù)定規(guī)則進(jìn)行調(diào)整,使得手體區(qū)域在第一概率密度分布圖中的概率隨預(yù)定區(qū)域邊緣的延伸方向而逐漸減小,并根據(jù)調(diào)整后的手體區(qū)域在第一概率密度分布圖中的概率分布標(biāo)定一跟蹤區(qū)域;以及在確定當(dāng)前幀的第二概率密度分布圖之后,并在標(biāo)定當(dāng)前幀的跟蹤區(qū)域之前,該方法還包括:將當(dāng)前幀的手體區(qū)域在所述第二概率密度分布圖中的概率分布按照上述預(yù)定規(guī)則進(jìn)行調(diào)整,使得當(dāng)前幀的手體區(qū)域在第二概率密度分布圖中的概率隨預(yù)定區(qū)域邊緣的延伸方向而逐漸減小。
[0065]優(yōu)選地,該助視方法還可以包括:在初始幀之后的每一幀中,在確定當(dāng)前幀的第二概率密度分布圖之后,根據(jù)背景差分法來確定當(dāng)前幀的第二背景差分圖像;以及將當(dāng)前幀的第二背景差分圖像中判斷為背景的像素點(diǎn)在當(dāng)前幀的第二概率密度分布圖中的概率降低為零。
[0066]優(yōu)選地,該助視方法還可以包括:對手體的手勢進(jìn)行識別,根據(jù)所識別的手勢對顯示區(qū)域的圖像信息進(jìn)行處理;以及對處理后的所述顯示區(qū)域的圖像信息進(jìn)行顯示。
[0067]優(yōu)選地,該助視方法還可以包括:該方法還包括:對顯示區(qū)域的字符進(jìn)行識別,生成與所識別的字符對應(yīng)的語音信息;將語音信息進(jìn)行播放;以及接收用戶切換指令,并在接收到所述用戶切換指令的情況下,將放大后的所識別的字符進(jìn)行顯示,其中,用戶切換指令用于指示顯示放大后的所識別的字符。
[0068]通過本發(fā)明的助視方法,使得由視力差的讀者在通過將圖像放大來閱讀的同時(shí),不需要對輔助工具進(jìn)行操作來選取想要放大的區(qū)域,從而加快了閱讀速度,增強(qiáng)了閱讀體驗(yàn)。
[0069]以上結(jié)合附圖詳細(xì)描述了本發(fā)明的優(yōu)選實(shí)施方式,但是,本發(fā)明并不限于上述實(shí)施方式中的具體細(xì)節(jié),在本發(fā)明的技術(shù)構(gòu)思范圍內(nèi),可以對本發(fā)明的技術(shù)方案進(jìn)行多種簡單變型,這些簡單變型均屬于本發(fā)明的保護(hù)范圍。
[0070]另外需要說明的是,在上述【具體實(shí)施方式】中所描述的各個(gè)具體技術(shù)特征,在不矛盾的情況下,可以通過任何合適的方式進(jìn)行組合。為了避免不必要的重復(fù),本發(fā)明對各種可能的組合方式不再另行說明。
[0071]此外,本發(fā)明的各種不同的實(shí)施方式之間也可以進(jìn)行任意組合,只要其不違背本發(fā)明的思想,其同樣應(yīng)當(dāng)視為本發(fā)明所公開的內(nèi)容。
【主權(quán)項(xiàng)】
1.一種助視裝置,該助視裝置包括: 攝像頭,用于對一預(yù)定區(qū)域的圖像進(jìn)行采集,得到所述預(yù)定區(qū)域的圖像信息,并將所述預(yù)定區(qū)域的圖像信息傳輸?shù)教幚砥鳎? 所述處理器,與所述攝像頭連接,用于: 根據(jù)所述預(yù)定區(qū)域的圖像信息、預(yù)設(shè)的膚色的顏色直方圖和反向投影方法來確定所述預(yù)定區(qū)域的圖像信息的第一概率密度分布圖; 根據(jù)連通域檢測算法確定所述第一概率密度分布圖中的手體區(qū)域; 根據(jù)所述手體區(qū)域在所述預(yù)定區(qū)域內(nèi)標(biāo)定一顯示區(qū)域;以及 將所述顯示區(qū)域的圖像信息放大,并將放大后的所述顯示區(qū)域的圖像信息傳輸?shù)斤@示器;以及 所述顯示器,與所述處理器連接,用于將所述放大后的所述顯示區(qū)域的圖像信息進(jìn)行顯不O2.根據(jù)權(quán)利要求1所述的助視裝置,其特征在于,所述處理器還用于: 在確定所述預(yù)定區(qū)域的圖像信息的第一概率密度分布圖之后,在所述手體在所述預(yù)定區(qū)域內(nèi)移動(dòng)的情況下,根據(jù)背景差分法來確定所述預(yù)定區(qū)域的第一背景差分圖像;以及將所述第一背景差分圖像中判斷為背景的像素點(diǎn)在所述第一概率密度分布圖中的概率降低為零。3.根據(jù)權(quán)利要求1所述的助視裝置,其特征在于,所述處理器還用于: 在根據(jù)連通域檢測算法確定所述第一概率密度分布圖中的手體區(qū)域之后,通過將所述手體區(qū)域與預(yù)設(shè)的手體特征進(jìn)行匹配來對所述預(yù)定區(qū)域內(nèi)的手體區(qū)域進(jìn)行確認(rèn)。4.根據(jù)權(quán)利要求1所述的助視裝置,其特征在于,所述處理器根據(jù)所述手體區(qū)域在所述預(yù)定區(qū)域內(nèi)標(biāo)定一顯示區(qū)域包括: 在所述手體在所述預(yù)定區(qū)域移動(dòng)之前的初始幀中,在所述預(yù)定區(qū)域內(nèi)標(biāo)定該初始幀的跟蹤區(qū)域,使得該初始幀的跟蹤區(qū)域至少包括所述手體區(qū)域的一部分; 確定所述初始幀的跟蹤區(qū)域的像素點(diǎn)的顏色直方圖,根據(jù)初始幀的所述預(yù)定區(qū)域的圖像信息、所述初始幀的跟蹤區(qū)域的像素點(diǎn)的顏色直方圖和反向投影方法來確定初始幀的所述預(yù)定區(qū)域的圖像信息的第二概率密度分布圖; 在所述初始幀之后的每一幀中,根據(jù)上一幀的所述跟蹤區(qū)域的像素點(diǎn)的顏色直方圖、當(dāng)前幀的所述預(yù)定區(qū)域的圖像信息和反向投影方法,確定當(dāng)前幀的第二概率密度分布圖,根據(jù)均值漂移算法標(biāo)定當(dāng)前幀的跟蹤區(qū)域,使得該跟蹤區(qū)域在所述當(dāng)前幀的第二概率密度分布圖中的概率分布與上一幀的所述跟蹤區(qū)域在上一幀的第二概率密度分布圖中的概率分布相匹配;以及 根據(jù)當(dāng)前幀的跟蹤區(qū)域來標(biāo)定當(dāng)前幀的顯示區(qū)域。5.根據(jù)權(quán)利要求4所述的助視裝置,其特征在于,所述處理器還用于: 在標(biāo)定所述初始幀的跟蹤區(qū)域之前,將所述手體區(qū)域在所述第一概率密度分布圖中的概率分布按照一預(yù)定規(guī)則進(jìn)行調(diào)整,使得所述手體區(qū)域在所述第一概率密度分布圖中的概率隨所述預(yù)定區(qū)域邊緣的延伸方向而逐漸減小,之后,再根據(jù)調(diào)整后的所述手體區(qū)域在所述第一概率密度分布圖中的概率分布標(biāo)定所述初始幀的跟蹤區(qū)域;以及 在標(biāo)定所述當(dāng)前幀的跟蹤區(qū)域之前,將所述當(dāng)前幀的所述手體區(qū)域在所述第二概率密度分布圖中的概率分布按照所述預(yù)定規(guī)則進(jìn)行調(diào)整,使得所述當(dāng)前幀的所述手體區(qū)域在所述第二概率密度分布圖中的概率隨所述預(yù)定區(qū)域邊緣的延伸方向而逐漸減小,之后,再根據(jù)調(diào)整后的所述手體區(qū)域在所述第二概率密度分布圖中的概率分布標(biāo)定所述當(dāng)前幀的跟足示區(qū)域。6.根據(jù)權(quán)利要求4所述的助視裝置,其特征在于,所述處理器還用于: 在所述初始幀之后的每一幀中,在確定當(dāng)前幀的第二概率密度分布圖之后,根據(jù)背景差分法來確定當(dāng)前幀的第二背景差分圖像;以及 將所述當(dāng)前幀的第二背景差分圖像中判斷為背景的像素點(diǎn)在所述當(dāng)前幀的第二概率密度分布圖中的概率降低為零。7.根據(jù)權(quán)利要求1所述的助視裝置,其特征在于,所述處理器還用于: 對所述手體的手勢進(jìn)行識別,根據(jù)所識別的手勢對所述顯示區(qū)域的圖像信息進(jìn)行處理,并將處理后的所述顯示區(qū)域的圖像信息傳輸?shù)剿鲲@示器;以及所述顯示器還用于對處理后的所述顯示區(qū)域的圖像信息進(jìn)行顯示。8.根據(jù)權(quán)利要求1-7中任一權(quán)利要求所述的助視裝置,其特征在于,該助視裝置還包括音頻播放器, 其中,所述處理器還用于對所述顯示區(qū)域的字符進(jìn)行識別,生成與所識別的字符對應(yīng)的語音信息,并將所述語音信息傳輸?shù)剿鲆纛l播放器;以及 所述音頻播放器與所述處理器連接,用于將所述語音信息進(jìn)行播放, 其中,所述處理器還用于接收用戶切換指令,并在接收到所述用戶切換指令的情況下,向所述顯示器傳輸放大后的所識別的字符,其中,所述用戶切換指令用于指示顯示放大后的所識別的字符; 所述顯示器還用于將放大后的所識別的字符進(jìn)行顯示。9.一種助視系統(tǒng),該助視系統(tǒng)包括: 權(quán)利要求1-8中任一權(quán)利要求所述的助視裝置;以及 服務(wù)器,與所述助視裝置通信,用于與所述助視裝置遠(yuǎn)程交互。10.一種助視方法,該助視方法包括: 對一預(yù)定區(qū)域的圖像進(jìn)行采集,得到所述預(yù)定區(qū)域的圖像信息; 根據(jù)所述預(yù)定區(qū)域的圖像信息、預(yù)設(shè)的膚色的顏色直方圖和反向投影方法來確定所述預(yù)定區(qū)域的圖像信息的第一概率密度分布圖; 根據(jù)連通域檢測算法確定所述第一概率密度分布圖中的手體區(qū)域; 根據(jù)所述手體區(qū)域在所述預(yù)定區(qū)域內(nèi)標(biāo)定一顯示區(qū)域; 將所述顯示區(qū)域的圖像信息放大;以及 將所述放大后的所述顯示區(qū)域的圖像信息進(jìn)行顯示。11.根據(jù)權(quán)利要求10所述的助視方法,其特征在于,該方法還包括: 在確定所述預(yù)定區(qū)域的圖像信息的第一概率密度分布圖的步驟之后,在所述手體在所述預(yù)定區(qū)域內(nèi)移動(dòng)的情況下,根據(jù)背景差分法來確定所述預(yù)定區(qū)域的第一背景差分圖像;以及 將所述第一背景差分圖像中判斷為背景的像素點(diǎn)在所述第一概率密度分布圖中的概率降低為零。12.根據(jù)權(quán)利要求10所述的助視方法,其特征在于,該方法還包括: 在根據(jù)連通域檢測算法確定所述第一概率密度分布圖中的手體區(qū)域的步驟之后,通過將所述手體區(qū)域與預(yù)設(shè)的手體特征進(jìn)行匹配來對所述預(yù)定區(qū)域內(nèi)的手體區(qū)域進(jìn)行確認(rèn)。13.根據(jù)權(quán)利要求10所述的助視方法,其特征在于,根據(jù)所述手體區(qū)域在所述預(yù)定區(qū)域內(nèi)標(biāo)定一顯示區(qū)域的步驟包括: 在所述手體在所述預(yù)定區(qū)域移動(dòng)之前的初始幀中,在所述預(yù)定區(qū)域內(nèi)標(biāo)定初始幀的一跟蹤區(qū)域,使得該初始幀的跟蹤區(qū)域至少包括所述手體區(qū)域的一部分; 確定所述初始幀的跟蹤區(qū)域的像素點(diǎn)的顏色直方圖,根據(jù)初始幀的所述預(yù)定區(qū)域的圖像信息、所述初始幀的跟蹤區(qū)域的像素點(diǎn)的顏色直方圖和反向投影方法來確定初始幀的所述預(yù)定區(qū)域的圖像信息的第二概率密度分布圖; 在所述初始幀之后的每一幀中,根據(jù)上一幀的所述跟蹤區(qū)域的像素點(diǎn)的顏色直方圖、當(dāng)前幀的所述預(yù)定區(qū)域的圖像信息和反向投影方法,確定當(dāng)前幀的第二概率密度分布圖,根據(jù)均值漂移算法標(biāo)定當(dāng)前幀的跟蹤區(qū)域,使得跟蹤區(qū)域在所述當(dāng)前幀的第二概率密度分布圖中的概率分布與上一幀的所述跟蹤區(qū)域在上一幀的第二概率密度分布圖中的概率分布相匹配;以及 根據(jù)當(dāng)前幀的跟蹤區(qū)域來標(biāo)定當(dāng)前幀的顯示區(qū)域。14.根據(jù)權(quán)利要求13所述的助視方法,其特征在于,該方法還包括: 在標(biāo)定所述初始幀的跟蹤區(qū)域之前,將所述手體區(qū)域在所述第一概率密度分布圖中的概率分布按照一預(yù)定規(guī)則進(jìn)行調(diào)整,使得所述手體區(qū)域在所述第一概率密度分布圖中的概率隨所述預(yù)定區(qū)域邊緣的延伸方向而逐漸減小,之后,再根據(jù)調(diào)整后的所述手體區(qū)域在所述第一概率密度分布圖中的概率分布標(biāo)定所述初始幀的跟蹤區(qū)域;以及 在標(biāo)定所述當(dāng)前幀的跟蹤區(qū)域之前,將所述當(dāng)前幀的所述手體區(qū)域在所述第二概率密度分布圖中的概率分布按照所述預(yù)定規(guī)則進(jìn)行調(diào)整,使得所述當(dāng)前幀的所述手體區(qū)域在所述第二概率密度分布圖中的概率隨所述預(yù)定區(qū)域邊緣的延伸方向而逐漸減小,之后,再根據(jù)調(diào)整后的所述手體區(qū)域在所述第二概率密度分布圖中的概率分布標(biāo)定所述當(dāng)前幀的跟足示區(qū)域。15.根據(jù)權(quán)利要求13所述的助視方法,其特征在于,該方法還包括: 在所述初始幀之后的每一幀中,在確定當(dāng)前幀的第二概率密度分布圖之后,根據(jù)背景差分法來確定當(dāng)前幀的第二背景差分圖像;以及 將所述當(dāng)前幀的第二背景差分圖像中判斷為背景的像素點(diǎn)在所述當(dāng)前幀的第二概率密度分布圖中的概率降低為零。16.根據(jù)權(quán)利要求10所述的助視方法,其特征在于,該方法還包括: 對所述手體的手勢進(jìn)行識別,根據(jù)所識別的手勢對所述顯示區(qū)域的圖像信息進(jìn)行處理;以及 對處理后的所述顯示區(qū)域的圖像信息進(jìn)行顯示。17.根據(jù)權(quán)利要求10-16中任一權(quán)利要求所述的助視方法,其特征在于,該方法還包括: 對所述顯示區(qū)域的字符進(jìn)行識別,生成與所識別的字符對應(yīng)的語音信息; 將所述語音信息進(jìn)行播放;以及 接收用戶切換指令,并在接收到所述用戶切換指令的情況下,將放大后的所識別的字符進(jìn)行顯示,其中,所述用戶切換指令用于指示顯示放大后的所識別的字符。
【文檔編號】G06F3/01GK105989365SQ201510047704
【公開日】2016年10月5日
【申請日】2015年1月30日
【發(fā)明人】沈沾俊, 劉程浩, 陳少發(fā), 張書強(qiáng), 陳菊敏
【申請人】深圳市思路飛揚(yáng)信息技術(shù)有限責(zé)任公司