欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

便攜式文字識別發(fā)聲閱讀器及讀取文字的方法

文檔序號:2585671閱讀:285來源:國知局
專利名稱:便攜式文字識別發(fā)聲閱讀器及讀取文字的方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種文字閱讀器及讀取文字的方法,尤其涉及一種便于視障人士使用的識別平面媒體所載信息的文字閱讀器及其讀取文字的方法。
背景技術(shù)
閱讀報紙、雜志、書刊、發(fā)票、電腦小票等平面媒介所載有的文字信息是人們獲取信息和學(xué)習(xí)文化技能的最好的方式,同時隨著科技的進步,電腦、電子書等帶有屏幕的電子設(shè)備成了人們獲取信息的另外一個載體。然而對于盲人、嚴重眼部疾病造成的視力低下及高度近視等視力有障礙人士(簡稱視障人士)來說,看書、讀報好似登天一樣難,因此,專門針對視力障礙人士使用的閱讀器產(chǎn)品也應(yīng)運而生,如帶有TTS文字語音輸出功能的電子書設(shè)備或者帶有掃描、識別和發(fā)音的室內(nèi)盲人閱讀機。這些已有的產(chǎn)品雖然給視障人士讀書學(xué)習(xí)帶來了福音,但仍存在一些不足前者僅可將已儲存好的TXT格式文字轉(zhuǎn)換為聲音朗讀,而不可將實時采集到的文字信息轉(zhuǎn)換為聲音朗讀;后者是依靠信息采集設(shè)備與電腦的結(jié)合將實時采集到的文字信息掃描并朗讀出來,其所用設(shè)備復(fù)雜,不宜移動。

發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種便攜式文字識別發(fā)聲閱讀器及讀取文字的方法,便于視障人士隨時隨地通過聲音獲知平面媒體所載的文字信息。為了解決上述技術(shù)問題,本發(fā)明的便攜式文字識別發(fā)聲閱讀器,包括適于視障人士隨身攜帶的其上設(shè)有一個以上按鍵的機殼和經(jīng)視障人士操作并通過語音使其獲取平面媒體信息的、設(shè)置于所述機殼內(nèi)的控制電路。所述控制電路由控制模塊、文字圖像采集模塊、OCR文字識別編輯模塊、TTS文字轉(zhuǎn)語音模塊、存儲模塊及音頻播放模塊組成,其中1)控制模塊,用于接受按鍵輸入,并根據(jù)輸入指令調(diào)用相應(yīng)的功能模塊進行處理, 是各功能模塊間的協(xié)調(diào)和安排中樞,驅(qū)動各功能模塊按指令運行,同時該模塊用于管理相關(guān)文件的操作和讀寫;2)文字圖像采集模塊,采用攝像或掃描部件對平面媒體的文字、圖像信息進行采集,攝像感光芯片型號為0V9653、或其他品牌的CMOS或CXD感光芯片;3) OCR文字識別編輯模塊,將得到的文字、圖像信息進行識別并存儲為TXT格式文件;4)TTS文字轉(zhuǎn)語音模塊,將得到的TXT文字轉(zhuǎn)換為可供播放的音頻文件;5)存儲模塊,板載的SDRAM,其型號為ffl~48LC16M16A2或norflash,其型號為 AM29LV160B)以及外接SD卡設(shè)備,SD卡選擇SPI數(shù)據(jù)傳輸模式;6)音頻播放模塊,將音頻文件轉(zhuǎn)換成音頻信號輸出;7)電源模塊,所用芯片為鋰電池的充放電管理芯片,由SEMTECH公司生產(chǎn),其型號為SC806I沖放電管理芯片。
所述的控制電路還包括智能文字拼接排版算法模塊,該模塊將多次采集的相互重疊的文字、圖像信息拼接為正確連貫的文字、圖像信息。在所述機殼上還設(shè)有閱讀平面媒體信息所需的定位機構(gòu),該定位機構(gòu)由縱向定位桿和橫向定位繩組成。所述的控制模塊為中央處理器,該模塊的中央處理器使用亞德諾半導(dǎo)體公司生產(chǎn)的型號為ADI BF533芯片組。所述的OCR文字識別編輯模塊,采用北京文通公司研發(fā)的OCR動態(tài)鏈接庫。所述的TTS文字轉(zhuǎn)語音模塊,所采用的是捷通華聲公司生產(chǎn)的型號為ejTTS6.0語音合成模塊。所述文字圖像采集模塊,通過HDMI接口外接高清大視野攝像頭設(shè)備或者掃描設(shè)備。本發(fā)明的便攜式文字識別發(fā)聲閱讀器讀取文字的方法,包括對平面媒體所載文字圖像信息的采集,該方法是由視障人士獨立操作并通過語音獲知平面媒體所載文字信息的內(nèi)容,其操作步驟如下第一步,打開書籍,將所述的便攜式文字識別發(fā)聲閱讀器的定位機構(gòu)的縱向定位桿設(shè)定為第一行,以其前端的凸緣緊貼所述書籍的上邊沿,左手拉住橫向定位繩的拉環(huán)緊貼所述書籍的左側(cè)邊,按UP或DOWN鍵選至“讀書看報”使用功能后并按QUERY鍵,啟動“讀書看報”使用功能,右手握持所述的便攜式文字識別發(fā)聲閱讀器,從左至右對打開的頁面連續(xù)拍照第一列;第二步,當(dāng)拍照至第一列盡頭時,橫向定位繩無法向外拉出,此時,將左手稍許放松使橫向定位繩少許回抽,再繼續(xù)向外拉出,右手握持所述的便攜式文字識別發(fā)聲閱讀器繼續(xù)從左至右拍照第二列;第三步,當(dāng)拍照至所述書籍頁面的最右邊時,將所述縱向定位桿設(shè)定為第二行,繼續(xù)以前述方法,從左至右對所述書籍的頁面進行連續(xù)掃描,以此類推,換列換行,直到完成對打開的所述書籍的整個頁面的拍照;第四步,按下query鍵,系統(tǒng)則通過OCR文字識別編輯模塊、智能文字拼接排版算法模塊、TTS文字轉(zhuǎn)語音模塊和音頻播放模塊,將采集到的所述書籍整個頁面上的文字圖像信息用聲音播放出來。本發(fā)明將對平面媒體所載信息的采集、識別和發(fā)聲的控制電路設(shè)置在體積小,便于人們攜帶的機殼內(nèi),又在機殼上設(shè)置了獨特的定位機構(gòu),從而,使視障人士隨時隨地通過對本發(fā)明的操作,就可以獲知平面媒體所記載的文字信息,本發(fā)明還分開了一種利用本發(fā)明為視障人士閱讀書籍或報刊雜志的方法,通過該方法,視障人士能夠很容易通過語音獲知平面媒體所載的文字圖像信息。


下面結(jié)合附圖和具體實施方式
對本發(fā)明作進一步詳細說明。圖1為本發(fā)明的外形示意2為本發(fā)明采集信息定位示意圖。圖3為本發(fā)明功能流程圖。
5
圖4為本發(fā)明結(jié)構(gòu)框圖。圖5為本發(fā)明控制電路功能模塊連接圖。
具體實施例方式實施例1如圖1所示,本發(fā)明的便攜式文字識別發(fā)聲閱讀器,包括長方體的機殼1,機殼 1的形狀也可以是圓形體或橢圓體,由金屬或PVC材料所制,其體積小,長X寬X高為 100mmX 50mmX40mm,方便視障人士隨身攜帶,在機殼1的殼體上設(shè)有與內(nèi)置在機殼1里的控制電路電連接的八個輸入指令的按鍵2、與充電器相接的充電接口 6以及用于耳機插接的耳機插孔7。八個輸入指令的按鍵2分別為UP、DOWN、QUERY、EXIT、PHOTO、VOL+、VOL-和 HELP鍵,并且在這些按鍵2上,印有可供盲人識別的盲文或特定觸點,在該機殼1內(nèi)設(shè)有控制電路,當(dāng)視障人士需要知道平面媒體所載的文字信息時,只需手持機殼1操作機殼1上相應(yīng)的按鍵2,將機殼1置于該平面媒體上進行定位拍照,即可將該平面媒體上的文字信息內(nèi)容,通過機殼1外置的耳機或揚聲器5,告知該視障人士。如圖3、4、5所示,所述控制電路由控制模塊、文字圖像采集模塊、OCR(英文全稱 Optical Character Recognition,中文名稱光學(xué)字符識別技術(shù))文字識別編輯模塊、 TTS (英文全稱Text To Speech,中文名稱;“從文本到語音”或語音合成技術(shù))文字轉(zhuǎn)語音模塊、存儲模塊及音頻播放模塊組成,其中1)控制模塊為中央處理器用以控制輸入請求及調(diào)用相關(guān)功能模塊,中央處理器使用亞德諾半導(dǎo)體 (AnalogDevices)公司生產(chǎn)的ADI BF533芯片組,也可以使用該公司同系列的處理器芯片組或者其它公司的生產(chǎn)的芯片,如ARM內(nèi)核或TI公司的OMAP系列芯片組。2)文字圖像采集模塊采集平面媒體的文字、圖像信息,其采用攝像部件或掃描部件,攝像感光芯片為 0V9653,還可以用其他品牌的CMOS或CCD感光芯片,鏡頭為1. 8mm廣角鏡頭,掃描部件使用訂制的手持式掃描儀,該模塊與所述中央處理器的并行外設(shè)總線相接。該模塊將所采集的待識別的帶有文字的圖像信息傳輸至存儲模塊儲存,經(jīng)中央處理器處理,調(diào)用OCR文字識別編輯模塊對所述帶有文字的圖像進行識別,之后,經(jīng)OCR文字識別編輯模塊識別后,獲得的TXT (—種文本文檔)文字信息,儲存至存儲模塊中。另外該模塊還可以通過HDMI (英文全稱High Definition Multimedia Interface,HDMI,中文名稱高清晰度多媒體接口,是一種數(shù)字化視頻/音頻接口技術(shù))接口外接高清大視野攝像頭設(shè)備或者掃描設(shè)備。3) OCR文字識別編輯模塊將得到的文字、圖像信息進行識別并存儲為TXT格式文件,該模塊使用北京文通公司研發(fā)的TH_Embeded_0CR.a動態(tài)鏈接庫,也可以使用其他公司的同類功能產(chǎn)品或模塊, 如漢王,文萃等公司的文字識別核心,該模塊運行于所述的中央處理器中。4) TTS文字轉(zhuǎn)語音模塊將得到的TXT文字轉(zhuǎn)換為可供播放的音頻文件,TTS文字轉(zhuǎn)換部分可以選擇發(fā)音的類型,包括男聲、女聲發(fā)音,及中文、英文、粵語等不同語言發(fā)音。該模塊采用捷通華聲的 ejTTS6. 0語音合成模塊,也可使用科大訊飛的MterPhonic系列或ViviVoice系列語音庫及語音合成芯片,該模塊運行于所述的中央處理器中。5)存儲模塊存儲來自于中央處理器和其它模塊傳輸?shù)臄?shù)據(jù)信息,板載的SDRAM( —種內(nèi)存), 其型號為MT48LC16M16A2和norflash (—種內(nèi)存)其型號AiC9LV160B以及外接SD (英文全稱Secure Digital Memory Card,中文名稱安全數(shù)碼卡)卡設(shè)備,SD卡選擇SPI數(shù)據(jù)傳輸模式,該模塊與所述的中央處理器的外部總線接口相接。6)音頻播放模塊該模塊與所述的中央處理器的同步串行接口相接,該模塊將音頻文件轉(zhuǎn)換成音頻信號通過外置的耳機或揚聲器5輸出聲音。在本發(fā)明的機殼1上還設(shè)有USB接口 8,用于同外部電腦進行數(shù)據(jù)交換以及為本發(fā)明電源充電。所用芯片為SEMTECH公司的鋰電池的充放電管理芯片,其型號為SC806I,也可采用其他公司生產(chǎn)的具有相同功能的充放電管理芯片,所用電池為3. 7V可充放電鋰電池。如圖1所示,本發(fā)明機殼1上所述的八個按鍵2,每個按鍵2表面均蝕刻了盲文標注,以方便視障人士操作,每個按鍵2的作用如下本發(fā)明開機后,先播放一段開機音樂及操作提示,然后進入使用功能選擇主菜單, 播報第一個使用功能的名稱,在使用功能選擇主菜單中通過點選UP和DOWN鍵來切換使用功能名稱播報,然后點選QUERY確定鍵進入當(dāng)前播報的使用功能。本發(fā)明主要內(nèi)置使用功能依次為1)、讀書看報;2)、系統(tǒng)功能設(shè)置;3)、其他應(yīng)用程序。其中其他應(yīng)用程序為可定制的其他使用功能。UP鍵,系統(tǒng)在主菜單狀態(tài)時,按下該鍵將播報當(dāng)前已播報使用功能的前一個使用功能的名稱,例如,當(dāng)前已播報的使用功能為“系統(tǒng)設(shè)置”,按UP鍵將播報“讀書看報“,該功能為“系統(tǒng)設(shè)置”使用功能的前一個使用功能。DOWN鍵,系統(tǒng)在主菜單狀態(tài)時,按下該鍵將播報當(dāng)前已播報使用功能的后一個使用功能的名稱,例如,當(dāng)前已播報的使用功能為“讀書看報”,按DOWN鍵將播報“系統(tǒng)設(shè)置”, 該功能為“讀書看報”使用功能的后一個使用功能。 QUERY鍵,為確認鍵,系統(tǒng)在主菜單狀態(tài)時,通過UP或DOWN鍵選擇播報待進入的使用功能,按下該鍵即進入當(dāng)前播報的使用功能,例如,通過UP或DOWN鍵選定播報的“讀書看報,,使用功能后,按下該鍵將啟動“讀書看報,,使用功能。在,,讀書看報“這個使用功能下, 圖像采集模塊處于激活狀態(tài),此時將本發(fā)明置于載有文字圖像信息的書籍或報刊雜志上, 按photo拍照鍵,進入文字圖像信息采集階段,此時,若按query確認鍵,系統(tǒng)則通過OCR文字識別編輯模塊、TTS文字轉(zhuǎn)語音模塊和音頻播放模塊,將采集到的文字圖像信息用聲音播放出來。EXIT鍵,為退出鍵,從當(dāng)前狀態(tài)退回到前一個狀態(tài)。例如在音頻播放狀態(tài)下,按 EXIT退出音頻播放狀態(tài),準備下一次的文字圖像信息的采集,再按一次EXIT鍵則返回至使用功能選擇主菜單。ΡΗ0Τ0鍵,拍照鍵,用于啟動對文字圖像信息的采集。VOL+鍵,音量加,按一次該鍵音量加一。VOL-鍵,音量減,按一次該鍵音量減一。Help鍵,為幫助鍵,隨時按此鍵,將會播放當(dāng)前使用功能的說明和必要的操作步驟
7提示。本發(fā)明的便攜式文字識別發(fā)聲閱讀器讀取文字的方法如下如圖1、2所示,在本發(fā)明的機殼1上設(shè)有定位機構(gòu),該定位機構(gòu)由縱向定位桿3、橫向定位繩4及置于機殼1內(nèi)的張緊裝置組成,縱向定位桿3設(shè)于機殼1前側(cè)面底部,其為一個可拉出或推回的分三段等距離的伸縮桿(也可以為三段以上,其長度以能夠覆蓋所讀平面媒體所載信息的縱向高度為準),該縱向定位桿3由鋁材或PVC塑料所制,其前端向下彎折90度成裙邊或者在桿的前端的下表面設(shè)有凸緣31,該凸緣31主要用來掛住待閱讀書籍或報刊雜志的邊緣,并沿該邊緣水平移動,縱向定位桿3被拉出至第一段距離簡稱第一行、 至第二段距離簡稱第二行,依次類推,由前一段距離轉(zhuǎn)至后一段距離,稱換行,每次拉出一段距離會發(fā)出機械撞擊咔嚓聲音的提示,同時視障人士還可以用手通過觸摸縱向定位桿3 伸出的節(jié)數(shù),來判斷已經(jīng)拉出了幾段距離;橫向定位繩4設(shè)于機殼1的左側(cè)面的底部,其為一個可以拉出或收回的細繩,繩子的前端設(shè)有方便拉出的拉環(huán)41,繩子是由尼龍、棉線或金屬線所制,該繩可分三段等距離拉出(也可以為三段以上,其長度以能夠覆蓋所讀平面媒體所載信息的橫向距離為準),當(dāng)拉出第一段距離時,由于設(shè)于機殼1內(nèi)張緊彈簧的作用, 該繩不能再向外拉出,若想繼續(xù)向外拉出第二段距離時,則要松開該繩使其稍許回抽,在所述彈簧的松動下,緊接著繼續(xù)向外拉出就可再拉出第二段距離,第三段距離按前述方法拉出,橫向定位繩4被拉出第一段距離稱為第一列、第二段距離稱為第二列,依次類推,由前一段距離轉(zhuǎn)至后一段距離,稱換列;使用完畢,則可松開繩環(huán),該繩即可自動回抽至機殼1 內(nèi)。當(dāng)視障人士需要讀書、看報時,右手握持所述機殼1并使所述縱向定位桿3前端的裙邊或凸緣31卡在并緊貼所述書籍或報刊雜志的上邊沿的側(cè)面,左手拉住橫向定位繩4 的拉環(huán)41緊貼所述書籍或報刊雜志左側(cè)邊,將設(shè)置于機殼1底面的攝像或掃描部件鏡頭朝下,緊貼將要閱讀的書籍或報刊雜志,按下機殼1上文字圖像信息采集功能對應(yīng)的按鍵2, 從左至右對文字圖像信息進行采集,當(dāng)所述橫向定位繩4的第一段距離被拉到盡頭時,此時,視障人士可以感知到,自己所持的機殼1是在所述書籍或報刊雜志的第幾列位置,若想繼續(xù)看下去,則按前述方法換列進入橫向定位繩4的第二段距離,直到進入橫向定位繩4的最后一段距離;之后,若要繼續(xù)下去,則將所述的縱向定位桿3換行伸出至第二段距離,使縱向定位桿3前端的裙邊或凸緣31仍舊卡在并緊貼所述書籍或報刊雜志的上邊沿的側(cè)面, 以前述方法對所述書籍或報刊雜志從左至右對文字圖像信息進行采集,依前述方法不斷在換列、換行中進行,直到將所述的書籍或報刊雜志讀完。在視障人士閱讀的整個過程中,其能根據(jù)縱向定位桿3和橫向定位繩4拉出后所處的行或列的數(shù)目,確定自己正在閱讀所述書籍或報刊雜志頁面上的哪個位置,并且在中斷后若想繼續(xù)閱讀時,他能很快找到中斷前所閱讀到的位置。在前述從左至右的采集、換列、換行過程中,圖像采集模塊將所采集到的帶有文字的圖像信息傳輸至存儲模塊儲存,經(jīng)中央處理器處理,調(diào)用OCR文字識別編輯模塊對所述帶有文字的圖像進行識別,之后,將經(jīng)OCR文字識別編輯模塊識別后,獲得的TXT文字信息, 儲存至存儲模塊中。被存儲的文字信息,既可以是單獨掃描采集的文字信息,也可以是連續(xù)相重疊采集的文字信息,即所述視障人士在閱讀采集所述信息時,既可以拍一次存儲一次,也可以連續(xù)拍照,實時存儲,當(dāng)所采集的文字圖像為小票一類尺寸小于等于攝像頭視野的小范圍文字時,一次拍照即可獲取全部完整的信息,生成的文字信息若有多段,通過機殼1上UP或 DOWN鍵切換到所要播放的文字段落,經(jīng)TTS文字語音轉(zhuǎn)換模塊生成可播放的音頻文件。
實施例2
如圖3所示,本發(fā)明的控制電路還包括智能文字拼接排版算法模塊,該模塊運行于所述的中央處理器中。當(dāng)所采集的圖像為大范圍文字圖像、攝像頭不能一次完成對該圖像的拍照時,該模塊可以實現(xiàn)對所述圖像的連續(xù)拍照并實時儲存,待拍照完所有文字圖像信息后,該模塊將自動拼接所采集到的文字圖像信息。
該模塊將視障人士閱讀時,連續(xù)拍照采集并實時儲存的相互重疊的文字、圖像信息拼接為正確連貫的文字、圖像信息。
使用時,利用機殼1上所設(shè)的定位機構(gòu),在“讀書看報”使用功能下,每定位一次, 按一次拍照鍵,通過多次定位和按拍照鍵完成對整個頁面內(nèi)的文字信息圖像的采集。
在對所述的書籍或報刊雜志所載文字圖像信息進行連續(xù)采集后,經(jīng)OCR文字識別編輯模塊識別后分別存儲,再根據(jù)每一行的文字重合部分及語義將多次采集后的文字連貫的拼接起來,從而完成文字信息語義的連貫性。
該智能文字拼接排版算法模塊,還能夠通過TTS文字轉(zhuǎn)語音模塊和音頻播放模塊實現(xiàn)實時語音朗讀功能。
本實施例控制電路中的其它模塊、機殼1設(shè)置和所具有的功能、使用方法與實施例1相同。
本發(fā)明根據(jù)所述的書籍或報刊雜志等平面媒體所載文字圖像信息的所占面積的大小,分以下三種方式采集、識別、播放相關(guān)文字信息
1)讀取名片,購物小票等小范圍文字信息拍照采集圖像后,經(jīng)OCR文字識別編輯模塊對所采集的帶有文字的圖像,由上到下直接排版,再經(jīng)TTS文字轉(zhuǎn)語音模塊處理后,通過音頻播放模塊輸出。
2)讀取書籍或報刊雜志等大范圍文字信息使用所述的定位機構(gòu),采集文字圖像信息,再經(jīng)OCR文字識別編輯模塊、智能文字拼接排版算法模塊,將連續(xù)采集的相互重疊的文字、圖像信息拼接為正確連貫的文字、圖像信息,經(jīng)TTS文字轉(zhuǎn)語音模塊處理后,再通過音頻播放模塊輸出。
3)利用控制電路上的HDMI接口,實現(xiàn)與外部高清大視野攝像頭設(shè)備或者掃描設(shè)備的連接該方式可一次性完成對閱讀書籍整頁所載信息的圖像采集。然后將采集到的帶有文字的圖像,經(jīng)OCR文字識別編輯模塊識別并排版后,再經(jīng)TTS文字語音轉(zhuǎn)換模塊處理, 通過音頻模塊輸出音頻。
權(quán)利要求
1.一種便攜式文字識別發(fā)聲閱讀器,其特征在于包括適于視障人士隨身攜帶的其上設(shè)有一個以上按鍵O)的機殼(1)和經(jīng)視障人士操作并通過語音使其獲取平面媒體信息的、設(shè)置于所述機殼(1)內(nèi)的控制電路。
2.根據(jù)權(quán)利要求1所述的便攜式文字識別發(fā)聲閱讀器,其特征在于所述控制電路由控制模塊、文字圖像采集模塊、OCR文字識別編輯模塊、TTS文字轉(zhuǎn)語音模塊、存儲模塊及音頻播放模塊組成,其中1)控制模塊,用于接受按鍵(2)輸入,并根據(jù)輸入指令調(diào)用相應(yīng)的功能模塊進行處理, 是各功能模塊間的協(xié)調(diào)和安排中樞,驅(qū)動各功能模塊按指令運行,同時該模塊用于管理相關(guān)文件的操作和讀寫;2)文字圖像采集模塊,采用攝像或掃描部件對平面媒體的文字、圖像信息進行采集,攝像感光芯片型號為0V9653、或其他品牌的CMOS或CXD感光芯片;3)OCR文字識別編輯模塊,將得到的文字、圖像信息進行識別并存儲為TXT格式文件;4)TTS文字轉(zhuǎn)語音模塊,將得到的TXT文字轉(zhuǎn)換為可供播放的音頻文件;5)存儲模塊,板載的SDRAM,其型號為ffl~48LC16M16A2或norflash,其型號為 AM29LV160B)以及外接SD卡設(shè)備,SD卡選擇SPI數(shù)據(jù)傳輸模式;6)音頻播放模塊,將音頻文件轉(zhuǎn)換成音頻信號輸出;7)電源模塊,所用芯片為鋰電池的充放電管理芯片,由SEMTECH公司生產(chǎn),其型號為 SC806I沖放電管理芯片。
3.根據(jù)權(quán)利要求2所述的便攜式文字識別發(fā)聲閱讀器,其特征在于所述的控制電路還包括智能文字拼接排版算法模塊,該模塊將多次采集的相互重疊的文字、圖像信息拼接為正確連貫的文字、圖像信息。
4.根據(jù)權(quán)利要求3所述的便攜式文字識別發(fā)聲閱讀器,其特征在于在所述機殼(1) 上還設(shè)有閱讀平面媒體信息所需的定位機構(gòu),該定位機構(gòu)由縱向定位桿(3)和橫向定位繩組成。
5.根據(jù)權(quán)利要求2-4所述的便攜式文字識別發(fā)聲閱讀器,其特征在于所述的控制模塊為中央處理器,該模塊的中央處理器使用亞德諾半導(dǎo)體公司生產(chǎn)的型號為ADI BF533芯片組。
6.根據(jù)權(quán)利要求2-4中任一項所述的便攜式文字識別發(fā)聲閱讀器,其特征在于所述的OCR文字識別編輯模塊,采用北京文通公司研發(fā)的OCR動態(tài)鏈接庫。
7.根據(jù)權(quán)利要求2-4中任一項所述的便攜式文字識別發(fā)聲閱讀器,其特征在于所述的TTS文字轉(zhuǎn)語音模塊,所采用的是捷通華聲公司生產(chǎn)的型號為ejTTS6. 0語音合成模塊。
8.根據(jù)權(quán)利要求2-4中任一項所述的便攜式文字識別發(fā)聲閱讀器,其特征在于所述文字圖像采集模塊,通過HDMI接口外接高清大視野攝像頭設(shè)備或者掃描設(shè)備。
9.一種便攜式文字識別發(fā)聲閱讀器讀取文字的方法,包括對平面媒體所載文字圖像信息的采集,其特征在于該方法是由視障人士獨立操作并通過語音獲知平面媒體所載文字信息的內(nèi)容,其操作步驟如下第一步,打開書籍,將所述的便攜式文字識別發(fā)聲閱讀器的定位機構(gòu)的縱向定位桿(3) 設(shè)定為第一行,以其前端的凸緣(31)緊貼所述書籍的上邊沿,左手拉住橫向定位繩的拉環(huán)Gl)緊貼所述書籍的左側(cè)邊,按UP或DOWN鍵選至“讀書看報”使用功能后并按QUERY鍵,啟動“讀書看報”使用功能,右手握持所述的便攜式文字識別發(fā)聲閱讀器,從左至右對打開的頁面連續(xù)拍照第一列;第二步,當(dāng)拍照至第一列盡頭時,橫向定位繩(4)無法向外拉出,此時,將左手稍許放松使橫向定位繩(4)少許回抽,再繼續(xù)向外拉出,右手握持所述的便攜式文字識別發(fā)聲閱讀器繼續(xù)從左至右拍照第二列;第三步,當(dāng)拍照至所述書籍頁面的最右邊時,將所述縱向定位桿C3)設(shè)定為第二行,繼續(xù)以前述方法,從左至右對所述書籍的頁面進行連續(xù)掃描,以此類推,換列換行,直到完成對打開的所述書籍的整個頁面的拍照;第四步,按下query鍵,系統(tǒng)則通過OCR文字識別編輯模塊、智能文字拼接排版算法模塊、TTS文字轉(zhuǎn)語音模塊和音頻播放模塊,將采集到的所述書籍整個頁面上的文字圖像信息用聲音播放出來。
全文摘要
本發(fā)明公開了一種便攜式文字識別發(fā)聲閱讀器及讀取文字的方法,該便攜式文字識別發(fā)聲閱讀器,包括適于視障人士隨身攜帶的其上設(shè)有一個以上按鍵的機殼和經(jīng)視障人士操作并通過語音使其獲取平面媒體信息的、設(shè)置于所述機殼內(nèi)的控制電路。所述控制電路由控制模塊、文字圖像采集模塊、OCR文字識別編輯模塊、TTS文字轉(zhuǎn)語音模塊、存儲模塊及音頻播放模塊組成,本發(fā)明的便攜式文字識別發(fā)聲閱讀器讀取文字的方法,包括對平面媒體所載文字圖像信息的采集,該方法是由視障人士獨立操作并能夠很容易通過語音使其獲知平面媒體所載文字信息的內(nèi)容。
文檔編號G09B5/04GK102509479SQ20111029641
公開日2012年6月20日 申請日期2011年10月8日 優(yōu)先權(quán)日2011年10月8日
發(fā)明者張書強, 沈沾俊 申請人:張書強, 沈沾俊
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
邓州市| 中方县| 临朐县| 大厂| 宜兰市| 武平县| 陆川县| 罗城| 锡林浩特市| 衡水市| 姚安县| 正镶白旗| 九寨沟县| 万安县| 南靖县| 万年县| 会东县| 佛冈县| 得荣县| 辽中县| 乐都县| 毕节市| 手游| 玉山县| 辽宁省| 南乐县| 高阳县| 青铜峡市| 宜阳县| 盱眙县| 山西省| 临泉县| 会泽县| 上饶市| 巫山县| 荥经县| 龙井市| 运城市| 胶南市| 三亚市| 康定县|