專利名稱:可調(diào)節(jié)掃描模式的文字采集方法和掃描裝置的制作方法
技術領域:
本發(fā)明屬于電數(shù)據(jù)處理技術領域,特別涉及一種可調(diào)節(jié)掃描模式的文字采集方法和裝置。
背景技術:
當前,計算機輸入法主要有五筆輸入法、拼音輸入法、手寫輸入法等類型。當我們進行資料收集時,經(jīng)常需要將大量紙質文檔中的文字錄入計算機中,如果通過上述幾種輸入法進行錄入,費時又費力。目前,掃描筆是實現(xiàn)文字錄入的有效工具。現(xiàn)有掃描筆通常借助光學字符識別(OCR,Optical Character Recognition)技術,將需要的文字拍攝為圖像, 然后對圖像進行識別,即可實現(xiàn)快速錄入。但是,現(xiàn)有掃描筆的掃描模式單一,且只能掃描得到單行文字,存在掃描筆的掃描速度、錄入速度較慢等缺陷。
發(fā)明內(nèi)容
因此,需要一種能夠調(diào)節(jié)掃描模式的文字采集方法和裝置。根據(jù)本發(fā)明的一個方面,提供一種可選擇掃描模式的文字采集方法,該方法包括以下步驟
選擇第一掃描模式和第二掃描模式之一; 由圖像采集器采集被掃描介質上文字的二維圖像;
所述圖像采集器根據(jù)選擇的掃描模式從所述二維圖像中裁剪相應掃描模式下的有效圖像區(qū)域;
將該有效圖像區(qū)域傳輸至數(shù)據(jù)處理器進行后續(xù)處理。根據(jù)本發(fā)明的另一個方面,提供一種可選擇掃描模式的文字采集方法,該方法包括以下步驟
選擇第一掃描模式和第二掃描模式之一并將選擇的掃描模式發(fā)送至數(shù)據(jù)處理器; 由圖像采集器采集被掃描介質上文字的二維圖像;
所述數(shù)據(jù)處理器根據(jù)選擇的掃描模式控制所述圖像采集器從所述二維圖像中裁剪相應掃描模式下的有效圖像區(qū)域,并將該有效圖像區(qū)域傳輸至所述數(shù)據(jù)處理器進行后續(xù)處理。優(yōu)選地,所述第一掃描模式限定具有第一面積的有效圖像區(qū)域,所述第二掃描模式限定具有第二面積的有效圖像區(qū)域。所述裁剪相應掃描模式下的有效圖像區(qū)域包括通過相應掃描模式的起始點坐標和終點坐標對有效圖像區(qū)域進行限定。優(yōu)選地,所述后續(xù)處理包括
對所述有效圖像區(qū)域進行二值化處理,獲得二值圖像;
基于圖像配準對所述二值圖像進行實時拼接,獲得被掃描介質上文字的全景二值圖像;
對所述全景二值圖像進行校正; 從所述校正后的全景二值圖像中提取待識別文字行; 對所述待識別文字行進行光學字符識別并顯示。根據(jù)本發(fā)明的第三個方面,提供一種應用所述文字采集方法的掃描裝置,包括圖像采集器,還包括掃描模式選擇器,用于選擇第一掃描模式和第二掃描模式之一。所述圖像采集器,用于采集被掃描介質上文字的二維圖像,根據(jù)選擇的掃描模式從所述二維圖像中裁剪相應掃描模式下的有效圖像區(qū)域,并將該有效圖像區(qū)域傳輸至數(shù)據(jù)處理器進行后續(xù)處理。優(yōu)選地,所述掃描模式選擇器,為設置在掃描裝置的按鍵,用以切換掃描裝置的掃描模式。優(yōu)選地,所述掃描模式選擇器,為設置在掃描裝置掃描窗口處的滑塊,通過滑動滑塊選擇掃描模式。優(yōu)選地,所述掃描模式為單行掃描模式或至少兩行掃描模式。優(yōu)選地,所述數(shù)據(jù)處理器為設置在掃描裝置中的嵌入式處理器或與所述掃描裝置連接的外部數(shù)據(jù)處理設備。與現(xiàn)有技術相比,本發(fā)明技術方案的優(yōu)勢在于用戶可以根據(jù)需要選擇不同的掃描模式,從而實現(xiàn)對被掃描介質上的文字進行單行或多行掃描,相應地,在后續(xù)處理中,可以提取單行或多行待識別文字,這樣,提高了掃描筆的掃描速度、錄入速度。
圖1示出根據(jù)本發(fā)明實施例1的可調(diào)節(jié)掃描模式的文字采集方法的流程圖; 圖2示出根據(jù)本發(fā)明實施例2的可調(diào)節(jié)掃描模式的文字采集方法的流程圖3示出根據(jù)本發(fā)明實施例1或2的可調(diào)節(jié)掃描模式的文字采集方法中的有效圖像區(qū)域的示意圖4示出根據(jù)本發(fā)明實施例1或2的可調(diào)節(jié)掃描模式的文字采集方法中的有效圖像區(qū)域的示意圖5示出根據(jù)本發(fā)明實施例1或2的可調(diào)節(jié)掃描模式的文字采集方法中的后續(xù)處理的流程圖6示出根據(jù)本發(fā)明實施例的可調(diào)節(jié)掃描模式的文字采集裝置的結構示意圖。
具體實施例方式下面結合附圖和具體實施方式
對本發(fā)明做進一步闡述。圖1示出根據(jù)本發(fā)明實施例1的可調(diào)節(jié)掃描模式的文字采集方法的流程圖。根據(jù)實施例1,本發(fā)明提供的可調(diào)節(jié)掃描模式的文字采集方法包括以下步驟
在步驟101中,選擇第一掃描模式和第二掃描模式之一。具體地,用戶可以通過與現(xiàn)有的圖像采集器相連的掃描模式選擇器,例如可以是設置于圖像采集器上的功能鍵,來選擇掃描方式為第一掃描模式或第二掃描模式。所述第一掃描模式例如可以是單行掃描模式,所述第二掃描模式例如可以是多行掃描模式。在步驟102中,利用圖像采集器采集被掃描介質上文字的二維圖像。具體地,圖像采集器為由光感應傳感器、光感應傳感器鏡頭和電路板組成的光學模組。光感應傳感器具有光學鏡頭,通過光學鏡頭記錄灰度或彩色二維圖像,進而獲取被掃描文字的二維圖像。應用該圖像采集器的掃描裝置可以獲取被掃描介質上文字的連續(xù)圖像序列,而且相鄰圖像幀間具有一定的重疊。在步驟103中,所述圖像采集器根據(jù)選定的掃描模式從所述二維圖像中裁剪相應掃描模式下的有效圖像區(qū)域,并將該有效圖像區(qū)域傳輸至數(shù)據(jù)處理器進行后續(xù)處理。具體的,現(xiàn)有的掃描裝置中的圖像傳感器采集到的圖像為120幀每秒的640pixs χ 480pixs的圖像,但是,后續(xù)處理中所使用的有效圖像區(qū)域為120pixs χ SOpixs部分的圖像,其中,120是字高部分,因而需要將圖像傳感器采集到的圖像進行裁剪后通過數(shù)據(jù)通道傳入至數(shù)據(jù)處理器中進行后續(xù)處理。根據(jù)本發(fā)明實施例,圖像采集器根據(jù)選擇的掃描模式從所采集到的二維圖像中裁剪相應掃描模式下的有效圖像區(qū)域,具體地,所述第一掃描模式限定具有第一面積的有效圖像區(qū)域,所述第二掃描模式限定具有第二面積的有效圖像區(qū)域。第一面積和第二面積的大小可以根據(jù)需要進行設定。當所述第一掃描模式是單行掃描模式時,如圖3,對應的有效圖像區(qū)域大小和現(xiàn)有的掃描模式一樣,為120pixs χ 80pixs。當所述第二掃描模式是多行掃描模式時,如圖4所示,對應的有效圖像區(qū)域大小為MOpixs χ 80pixs。其中,120和240為字高部分。所述的裁剪,是通過起始點坐標和終點坐標對有效圖像區(qū)域進行限定。首先設定圖像左側頂點坐標為坐標原點,以向下的方向為Y軸正軸,以向右的方向為χ軸正軸,構建一坐標系。在該坐標系內(nèi)界定有效圖像區(qū)域。當所述第一掃描模式是單行掃描模式時, 圖像采集器將起始點坐標(260,200)作為左上側頂點和終點坐標(380,280)作為右下側頂點限定的矩形區(qū)域作為有效圖像區(qū)域傳輸至數(shù)據(jù)處理器中進行處理;當所述第二掃描模式是雙行掃描模式時,圖像采集器將起始點坐標(200,200)作為左上側頂點和終點坐標 (440,280)作為右下側頂點限定的矩形區(qū)域作為有效圖像區(qū)域傳輸至數(shù)據(jù)處理器中進行處理。本實施例中,數(shù)據(jù)處理器為設置在應用本實施例所述文字采集方法的掃描裝置內(nèi)部的嵌入式處理器,掃描裝置進行文字采集、圖像處理識別等動作均由該嵌入式處理器控制完成,此時,該掃描裝置形成一種脫機式的掃描設備;而當應用本實施例所述文字采集方法的掃描裝置采集的文字圖像的后續(xù)處理,必須由相連的外部數(shù)據(jù)處理設備處理時,該掃描裝置形成一種聯(lián)機式掃描設備,數(shù)據(jù)處理器即為外部數(shù)據(jù)處理設備。圖2示出根據(jù)本發(fā)明實施例2的可調(diào)節(jié)掃描模式的文字采集方法的流程圖。根據(jù)實施例2,本發(fā)明提供的可調(diào)節(jié)掃描模式的文字采集方法包括以下步驟
在步驟201中,選擇第一掃描模式和第二掃描模式之一并將選擇的掃描模式發(fā)送至數(shù)據(jù)處理器。用戶可以通過與現(xiàn)有的圖像采集器相連的掃描模式選擇器,例如可以是設置于圖像采集器上的功能鍵,來選擇掃描方式為第一掃描模式或第二掃描模式。所述第一掃描模式例如可以是單行掃描模式,所述第二掃描模式例如可以是多行掃描模式。所述第一掃描模式限定具有第一面積的有效圖像區(qū)域,所述第二掃描模式限定具有第二面積的有效圖像區(qū)域。第一面積和第二面積的大小根據(jù)實際需要予以限定。本實施例中,數(shù)據(jù)處理器為設置在應用本實施例所述文字采集方法的掃描裝置內(nèi)部的嵌入式處理器,掃描裝置進行文字采集、圖像處理識別等動作均由該嵌入式處理器控制完成,此時,該掃描裝置形成一種脫機式的掃描設備;而當應用本實施例所述文字采集方法的掃描裝置采集的文字圖像的后續(xù)處理,必須由相連的外部數(shù)據(jù)處理設備處理時,該掃描裝置形成一種聯(lián)機式掃描設備,數(shù)據(jù)處理器即為外部數(shù)據(jù)處理設備。在步驟202中,利用圖像采集器采集被掃描介質上文字的二維圖像。具體地,圖像采集器為由光感應傳感器、光感應傳感器鏡頭和電路板組成的光學模組。光感應傳感器具有光學鏡頭,通過光學鏡頭記錄灰度或彩色二維圖像,進而獲取被掃描文字的二維圖像。應用該圖像采集器的掃描裝置,可以獲取被掃描介質上文字的連續(xù)圖像序列,而且相鄰圖像幀間具有一定的重疊。在步驟203中,所述數(shù)據(jù)處理器根據(jù)選擇的掃描模式控制所述圖像采集器從所述二維圖像中裁剪相應掃描模式下的有效圖像區(qū)域。在本實施例中,如圖3和圖4所示,首先設定圖像左側頂點坐標為坐標原點,以向下的方向為Y軸正軸,以向右的方向為X軸正軸,構建一坐標系。在該坐標系內(nèi)界定有效圖像區(qū)域。當所述第一掃描模式是單行掃描模式時,數(shù)據(jù)處理器控制圖像采集器將起始點坐標(260,200)作為左上側頂點和終點坐標(380,280)作為右下側頂點限定的矩形區(qū)域32作為有效圖像區(qū)域傳輸至數(shù)據(jù)處理器中進行處理;當所述第二掃描模式是雙行掃描模式時,數(shù)據(jù)處理器控制圖像采集器將起始點坐標(200,200)作為左上側頂點和終點坐標 (440,280)作為右下側頂點限定的矩形區(qū)域32作為有效圖像區(qū)域傳輸至數(shù)據(jù)處理器中進行處理。在步驟204中,將該有效圖像區(qū)域傳輸至所述數(shù)據(jù)處理器進行后續(xù)處理。本實施例中,數(shù)據(jù)處理器為設置在應用本實施例所述文字采集方法的掃描裝置內(nèi)部的嵌入式處理器,掃描裝置進行文字采集、圖像處理識別等動作均由該嵌入式處理器控制完成,此時,該掃描裝置形成一種脫機式的掃描設備;而當應用本實施例所述文字采集方法的掃描裝置采集的文字圖像的后續(xù)處理,必須由相連的外部數(shù)據(jù)處理設備處理時,該掃描裝置形成一種聯(lián)機式掃描設備,數(shù)據(jù)處理器即為外部數(shù)據(jù)處理設備。圖5示出根據(jù)本發(fā)明實施例1或2的可調(diào)節(jié)掃描模式的文字采集方法中的后續(xù)處理的流程圖。如上所述,應用該文字采集方法的掃描裝置可以為一種聯(lián)機式掃描設備,此時數(shù)據(jù)處理器為外部數(shù)據(jù)處理設備,也可以為一種脫機式掃描設備,此時數(shù)據(jù)處理器為內(nèi)置在掃描裝置內(nèi)部的嵌入式處理器。數(shù)據(jù)處理器對有效圖像區(qū)域進行的后續(xù)處理主要包含以下步驟
1.圖像二值化數(shù)據(jù)處理器對接收到的有效圖像區(qū)域進行二值化處理,獲得二值圖像;例如可選用OTSU自適應閾值二值化算法對圖像進行二值化。2.圖像拼接基于圖像配準對所述二值圖像進行實時拼接,獲得被掃描介質上的全景二值圖像,所述圖像配準是通過匹配重疊區(qū)域計算前后相鄰兩幀圖像的相對位移關系實現(xiàn)。其中圖像二值化處理與圖像拼接過程順序可以互換。3.全景二值圖像校正對所述全景二值圖像進行校正;由于全景二值圖像可能是白底黑字,也可能是黑底白字,在進行全景二值圖像校正之前,首先要將黑底白字的圖像進行反色處理,本實施例優(yōu)選采用白底黑字圖像,不需要進行反色處理。全景二值圖像一般不是水平的文字,存在彎曲變形,需要將其校正成水平狀態(tài),具體方法包括
(1)通過連通域標記合并獲取全景二值圖像的文字行;
(2)從上述文字行中選出一行作為校正基準文字行;
(3)利用分段游程抹黑技術得到抹黑基準文字行;
(4 )通過對抹黑基準文字行進行采樣計算出文字行的彎曲曲線; (5)根據(jù)彎曲曲線對全景二值圖像進行校正。4.提取待識別文字行由所述校正后的全景二值圖像中提取待識別文字行。具體地,當以第一掃描模式進行文字采集時,采用中心定位的方法提取待識別文字中間行。全景二值圖像中除含有帶識別的文字行外,可能還有其他文字行,因此需要將待識別的文字提取出來,校正后的全景二值圖像中的文字行基本處于水平狀態(tài),沿水平方向進行投影,得到黑像素點的投影直方圖,利用投影直方圖的極小值位置可以將全景二值圖像中的文字行分隔開來,即可得到全景二值圖像中的各個完整文字行,根據(jù)這些完整文字行的位置信息識別并提取除待識別的文字行,具體的取這些文字行中靠近中間位置的文字行作為待識別文字行。當以第二掃描模式進行文字采集時,提取所有的待識別文字行。將待識別的文字提取出來,校正后的全景二值圖像中的文字行基本處于水平狀態(tài),沿水平方向進行投影,得到黑像素點的投影直方圖,利用投影直方圖的極小值位置可以將全景二值圖像中的文字行分隔開來,即可得到全景二值圖像中的各個完整文字行,將各完整文字行均提取出來,作為待識別文字行。5.對所述待識別文字行進行OCR識別并顯示。將待識別文字行送入數(shù)據(jù)處理器中的OCR模塊進行識別并顯示識別出的文字,并顯示到顯示屏上,當以第二掃描模式例如多行掃描模式進行文字采集時,對每行文字進行分行顯示。當掃描裝置為聯(lián)機式掃描設備時,數(shù)據(jù)處理器即為外部數(shù)據(jù)處理設備,識別出的文字在外部數(shù)據(jù)處理設備的顯示屏上顯示;當掃描裝置為脫機式掃描設備時,數(shù)據(jù)處理器即為掃描裝置內(nèi)置的嵌入式處理器,識別出的文字直接在掃描裝置的顯示屏上顯示。圖6示出根據(jù)本發(fā)明實施例的可調(diào)節(jié)掃描模式的掃描裝置的結構示意圖。該裝置包括包括圖像采集器,且進一步包括掃描模式選擇器,用于選擇第一掃描模式和第二掃描模式之一。所述圖像采集器,用于采集被掃描介質上文字的二維圖像,根據(jù)選擇的掃描模式從所述二維圖像中裁剪相應掃描模式下的有效圖像區(qū)域,并將該有效圖像區(qū)域傳輸至數(shù)據(jù)處理器進行后續(xù)處理。掃描模式選擇器為設置在掃描裝置上的物理按鍵,用以切換掃描裝置的掃描模式。作為另一種設計方案,掃描模式選擇器也可以為設置在掃描裝置掃描窗口處的滑塊,通過滑動滑塊的方式調(diào)整掃描模式,即調(diào)整二維圖像中有效圖像區(qū)域的面積,以此實現(xiàn)單行或多行掃描。該掃描裝置可以為一種脫機式的掃描設備,此時數(shù)據(jù)處理器為設置在掃描裝置內(nèi)部的嵌入式處理器。若該掃描裝置為聯(lián)機式掃描設備時,數(shù)據(jù)處理器為通過USB接口與該掃描裝置連接的外部數(shù)據(jù)處理設備,此時該外部數(shù)據(jù)處理設備為本實施例所述的數(shù)據(jù)處理器,用以對剪裁獲得的有效圖像區(qū)域進行OCR處理,獲得識別結果。
以上借助實施例對本發(fā)明進行了具體說明。應當理解,本發(fā)明的上述描述是示例性的而非限制性的。本領域技術人員通過閱讀本說明書,在不偏離本發(fā)明精神的情況下可以對本發(fā)明進行修改和變型。本發(fā)明的保護范圍僅由所附權利要求限定。
權利要求
1.一種可選擇掃描模式的文字采集方法,其特征在于,該方法包括以下步驟 選擇第一掃描模式和第二掃描模式之一;由圖像采集器采集被掃描介質上文字的二維圖像;所述圖像采集器根據(jù)選擇的掃描模式從所述二維圖像中裁剪相應掃描模式下的有效圖像區(qū)域,并將該有效圖像區(qū)域傳輸至數(shù)據(jù)處理器進行后續(xù)處理。
2.一種可選擇掃描模式的文字采集方法,其特征在于,該方法包括以下步驟 選擇第一掃描模式和第二掃描模式之一并將選擇的掃描模式發(fā)送至數(shù)據(jù)處理器; 由圖像采集器采集被掃描介質上文字的二維圖像;所述數(shù)據(jù)處理器根據(jù)選擇的掃描模式控制所述圖像采集器從所述二維圖像中裁剪相應掃描模式下的有效圖像區(qū)域; 將該有效圖像區(qū)域傳輸至所述數(shù)據(jù)處理器進行后續(xù)處理。
3.根據(jù)權利要求1或2所述的方法,其特征在于,所述第一掃描模式限定具有第一面積的有效圖像區(qū)域,所述第二掃描模式限定具有第二面積的有效圖像區(qū)域。
4.根據(jù)權利要求1或2所述的方法,其特征在于,所述裁剪相應掃描模式下的有效圖像區(qū)域包括通過相應掃描模式的起始點坐標和終點坐標對有效圖像區(qū)域進行限定。
5.根據(jù)權利要求1或2所述的方法,其特征在于,所述后續(xù)處理包括 對所述有效圖像區(qū)域進行二值化處理,獲得二值圖像;基于圖像配準對所述二值圖像進行實時拼接,獲得被掃描介質上文字的全景二值圖像;對所述全景二值圖像進行校正; 從所述校正后的全景二值圖像中提取待識別文字行; 對所述待識別文字行進行光學字符識別并顯示。
6.一種應用權利要求1-5任一項文字采集方法的掃描裝置,包括圖像采集器,其特征在于,還包括掃描模式選擇器,用于選擇第一掃描模式和第二掃描模式之一;所述圖像采集器,用于采集被掃描介質上文字的二維圖像,根據(jù)選擇的掃描模式從所述二維圖像中裁剪相應掃描模式下的有效圖像區(qū)域,并將該有效圖像區(qū)域傳輸至數(shù)據(jù)處理器進行后續(xù)處理。
7.根據(jù)權利要求6所述的掃描裝置,其特征在于,所述掃描模式選擇器,為設置在掃描裝置的按鍵,用以切換掃描裝置的掃描模式。
8.根據(jù)權利要求6所述的掃描裝置,其特征在于,所述掃描模式選擇器,為設置在掃描裝置掃描窗口處的滑塊,通過滑動滑塊選擇掃描模式。
9.根據(jù)權利要求7或8所述的掃描裝置,其特征在于,所述掃描模式為單行掃描模式或至少兩行掃描模式。
10.根據(jù)權利要求9所述的掃描裝置,其特征在于,所述數(shù)據(jù)處理器為設置在掃描裝置中的嵌入式處理器或與所述掃描裝置連接的外部數(shù)據(jù)處理設備。
全文摘要
本發(fā)明公開了一種可選擇掃描模式的文字采集方法,屬于電數(shù)據(jù)處理技術領域。該方法包括選擇第一掃描模式和第二掃描模式之一;利用圖像采集器采集被掃描介質上文字的二維圖像;所述圖像采集器根據(jù)選擇的掃描模式從所述二維圖像中裁剪相應掃描模式下的有效圖像區(qū)域,并將該有效圖像區(qū)域傳輸至數(shù)據(jù)處理器進行后續(xù)處理。本發(fā)明還公開了一種應用可選擇掃描模式的文字采集方法的掃描裝置。通過本發(fā)明,用戶可以根據(jù)需要選擇不同的掃描模式,從而實現(xiàn)對被掃描介質上的文字進行單行或多行掃描,在后續(xù)處理中,可以提取單行或多行待識別文字,這樣,提高了掃描筆的掃描速度、錄入速度。
文檔編號G06K9/00GK102360427SQ20111029484
公開日2012年2月22日 申請日期2011年9月30日 優(yōu)先權日2011年9月30日
發(fā)明者信強, 梁義海, 郭峰 申請人:漢王科技股份有限公司