本發(fā)明涉及一種可由包含有已重疊在多個(gè)字符串的多個(gè)標(biāo)記的原稿圖像作成以作了標(biāo)記的字符串作為解答的填空題的信息處理裝置。
背景技術(shù):
已知有如下作成填空題的技術(shù):讀取利用手寫(xiě)的標(biāo)記指定出作為問(wèn)題的解答的字符串的原稿圖像,從所讀取的原稿圖像數(shù)據(jù)中抽取標(biāo)記的圖像,在標(biāo)記的位置抽取字符串,在標(biāo)記的位置刪除字符串,且在字符串的刪除部分設(shè)定解答欄。作為用于抽取字符串的技術(shù),已知有光學(xué)字符識(shí)別(opticalcharacterrecognition;ocr)。
技術(shù)實(shí)現(xiàn)要素:
[發(fā)明所要解決的問(wèn)題]
在可作成填空題的信息處理裝置中,希望對(duì)于問(wèn)題制作者及回答者雙方可越來(lái)越友善(userfriendly)。
鑒于以上情況,本發(fā)明的目的在于在能由包含有已重疊在多個(gè)字符串的多個(gè)標(biāo)記的原稿圖像作成以作了標(biāo)記的字符串作為解答的填空題的信息處理裝置中提高用戶(hù)的便利性。
[解決問(wèn)題的手段]
為了達(dá)到所述目的,本發(fā)明的一實(shí)施方式的信息處理裝置具備:標(biāo)記抽取部,從包含有分別已重疊在多個(gè)字符串的多個(gè)標(biāo)記的原稿圖像抽取所述多個(gè)標(biāo)記;相同字符串識(shí)別部,識(shí)別已分別重疊著所述標(biāo)記的所述多個(gè)字符串中的相同的字符串;及
符號(hào)決定部,對(duì)所述相同的字符串分配相同的符號(hào),對(duì)不同的字符串分配不同的符號(hào)。
為了達(dá)到所述目的,本發(fā)明的一實(shí)施方式的信息處理裝置具備:標(biāo)記抽取部,從具有包含有已重疊著標(biāo)記的字符串及未重疊標(biāo)記的字符串的字符串區(qū)域的原稿圖像抽取所述標(biāo)記;及圖像轉(zhuǎn)換部,將已重疊在所述字符串的標(biāo)記放大而作成放大字符串,將未重疊所述標(biāo)記的字符串縮小而作成縮小字符串。
為了達(dá)到所述目的,本發(fā)明的一實(shí)施方式的信息處理裝置具備:標(biāo)記抽取部,從包含有已重疊在字符串的標(biāo)記的原稿圖像抽取所述標(biāo)記;及字符串比較部,從所述原稿圖像抽取與已重疊著所述標(biāo)記的字符串相同的未重疊標(biāo)記的字符串。
[發(fā)明的效果]
根據(jù)本發(fā)明,在能由包含有已重疊在多個(gè)字符串的多個(gè)標(biāo)記的原稿圖像作成以作了標(biāo)記的字符串作為解答的填空題的信息處理裝置中提高用戶(hù)的便利性。
附圖說(shuō)明
圖1是表示第1實(shí)施方式中的圖像形成裝置的硬件結(jié)構(gòu)的框圖。
圖2是表示圖像形成裝置的功能性結(jié)構(gòu)的框圖。
圖3是表示圖像形成裝置的動(dòng)作的流程圖。
圖4是用于說(shuō)明圖像形成裝置的動(dòng)作的圖。
圖5是表示第2實(shí)施方式中的圖像形成裝置的功能性結(jié)構(gòu)的框圖。
圖6是表示圖像形成裝置的動(dòng)作的流程圖。
圖7是表示第3實(shí)施方式中的圖像形成裝置的功能性結(jié)構(gòu)的框圖。
圖8是表示圖像形成裝置的動(dòng)作的流程圖。
圖9是用于說(shuō)明圖像形成裝置的動(dòng)作的圖。
圖10是用于說(shuō)明用以算出放大率或縮小率的算式中使用的變量的圖。
圖11是用于說(shuō)明實(shí)施例1中的放大率或縮小率的計(jì)算方法的圖。
圖12是用于說(shuō)明實(shí)施例2中的放大率或縮小率的計(jì)算方法的圖。
圖13是用于說(shuō)明實(shí)施例3中的放大率或縮小率的計(jì)算方法的圖。
圖14是用于說(shuō)明實(shí)施例4中的放大率或縮小率的計(jì)算方法的圖。
圖15是用于說(shuō)明實(shí)施例5中的放大率或縮小率的計(jì)算方法的圖。
圖16是表示第4實(shí)施方式中的圖像形成裝置的功能性結(jié)構(gòu)的框圖。
圖17是表示圖像形成裝置的動(dòng)作的流程圖。
圖18是用于說(shuō)明圖像形成裝置的動(dòng)作的圖。
具體實(shí)施方式
以下,參照附圖說(shuō)明本發(fā)明的實(shí)施方式。
(i.第1實(shí)施方式)
(1.圖像形成裝置的硬件結(jié)構(gòu))
圖1是表示本發(fā)明的第1實(shí)施方式中的圖像形成裝置的硬件結(jié)構(gòu)的框圖。
本發(fā)明的各實(shí)施方式中的信息處理裝置是圖像形成裝置(例如多功能外圍設(shè)備(multifunctionperipheral;mfp)),以下稱(chēng)為mfp。
mfp1具備控制部11。控制部11由中央處理器(centralprocessingunit;cpu)、隨機(jī)存儲(chǔ)器(randomaccessmemory;ram)、只讀存儲(chǔ)器(readonlymemory;rom)及專(zhuān)用的硬件電路等所構(gòu)成,負(fù)責(zé)mfp1整體的動(dòng)作控制。使mfp1作為各功能部(下文敘述)發(fā)揮功能的計(jì)算機(jī)程序存儲(chǔ)在rom等非暫時(shí)性存儲(chǔ)媒體中。
控制部11連接于圖像讀取部12、圖像處理部14、圖像存儲(chǔ)器15、圖像形成部16、操作部17、存儲(chǔ)部18、網(wǎng)絡(luò)通信部13等??刂撇?1對(duì)連接著的所述各部進(jìn)行動(dòng)作控制、且進(jìn)行對(duì)各部之間的信號(hào)或數(shù)據(jù)的收發(fā)。
控制部11根據(jù)由用戶(hù)通過(guò)操作部17或連接于網(wǎng)絡(luò)的個(gè)人計(jì)算機(jī)(未圖示)等輸入的工作的執(zhí)行指示,對(duì)于執(zhí)行關(guān)于掃描功能、印刷功能及復(fù)制功能等各功能的動(dòng)作控制時(shí)所需的機(jī)構(gòu)的驅(qū)動(dòng)及處理進(jìn)行控制。
圖像讀取部12從原稿讀取圖像。
圖像處理部14根據(jù)需要對(duì)圖像讀取部12所讀取的圖像的圖像數(shù)據(jù)進(jìn)行圖像處理。例如,圖像處理部14進(jìn)行陰影(shading)校正等圖像處理,以提高圖像讀取部12所讀取的圖像經(jīng)過(guò)圖像形成后的品質(zhì)。
圖像存儲(chǔ)器15具有暫時(shí)存儲(chǔ)經(jīng)圖像讀取部12讀取而獲得的原稿圖像的數(shù)據(jù)、或暫時(shí)存儲(chǔ)作為圖像形成部16的印刷對(duì)象的數(shù)據(jù)的區(qū)域。
圖像形成部16對(duì)圖像讀取部12所讀取的圖像數(shù)據(jù)等進(jìn)行圖像形成。
操作部17具備針對(duì)mfp1可執(zhí)行的各種動(dòng)作及處理而接受來(lái)自用戶(hù)的指示的觸摸面板部及操作按鍵部。觸摸面板部具備設(shè)有觸摸面板的液晶顯示器(liquidcrystaldisplay;lcd)等顯示部17a。
網(wǎng)絡(luò)通信部13是用于與網(wǎng)絡(luò)連接的界面。
存儲(chǔ)部18是存儲(chǔ)由圖像讀取部12所讀取的原稿圖像等的硬盤(pán)驅(qū)動(dòng)器(harddiskdrive;hdd)等大容量的存儲(chǔ)裝置。
(2.圖像形成裝置的功能性結(jié)構(gòu))
圖2是表示圖像形成裝置的功能性結(jié)構(gòu)的框圖。
mfp1通過(guò)執(zhí)行信息處理程序而作為標(biāo)記抽取部101、標(biāo)記判定部102、字符串抽取部103、相同字符串識(shí)別部110、符號(hào)決定部104、空欄作成部105及圖像合成部106發(fā)揮功能。
標(biāo)記抽取部101從圖像讀取部12所讀取的原稿圖像抽取分別已重疊在多個(gè)字符串的多個(gè)標(biāo)記。
標(biāo)記判定部102對(duì)標(biāo)記抽取部101所抽取的多個(gè)標(biāo)記各自在原稿圖像內(nèi)的位置及形狀進(jìn)行判定。
字符串抽取部103根據(jù)標(biāo)記判定部102所判定的多個(gè)標(biāo)記的位置及形狀,抽取已重疊著各個(gè)標(biāo)記的多個(gè)字符串。
相同字符串識(shí)別部110具有字符串識(shí)別部111、ocr用數(shù)據(jù)庫(kù)112及字符串比較部113,識(shí)別各自已重疊著標(biāo)記的多個(gè)字符串中的相同的字符串。
符號(hào)決定部104對(duì)字符串比較部113所識(shí)別的相同的字符串分配相同的符號(hào),對(duì)不同的字符串分配不同的符號(hào)。
空欄作成部105作成分別重疊在各自已重疊著標(biāo)記的多個(gè)字符串的空欄圖像。
圖像合成部106作成將圖像讀取部12所讀取的原稿圖像、空欄作成部105所作成的空欄圖像、及作為符號(hào)決定部104所分配的符號(hào)的圖像的符號(hào)圖像予以合成的合成圖像。
(3.圖像形成裝置的動(dòng)作)
圖3是表示圖像形成裝置的動(dòng)作的流程圖。圖4是用于說(shuō)明圖像形成裝置的動(dòng)作的圖。
作為前提,在原稿(典型的是紙)上印有作為文本數(shù)據(jù)的字符串。或者,在原稿上,形成作為圖像數(shù)據(jù)的字符串的圖像(復(fù)制印有字符串的原稿)。并且,字符串整體中的多個(gè)一部分的字符串(復(fù)合詞、短語(yǔ)、數(shù)值等)由作為用戶(hù)的問(wèn)題制作者使用熒光標(biāo)記筆等以手寫(xiě)的方式作標(biāo)記。作了標(biāo)記的字符串是填空題中作為解答的字符串。
圖像讀取部12對(duì)原稿進(jìn)行光學(xué)掃描,讀取原稿圖像(步驟s101,參照?qǐng)D4)。作為“原稿圖像”,整體而言是包含有多數(shù)字符串的文檔原稿的圖像數(shù)據(jù),包括已重疊在多個(gè)字符串的多個(gè)標(biāo)記(圖4中所示的陰影部分)?!白址笔钦Z(yǔ)句(單詞、短語(yǔ)、文章等)、數(shù)值等,嚴(yán)格而言是其圖像。
標(biāo)記抽取部101從圖像讀取部12所讀取的原稿圖像抽取分別已重疊在多個(gè)字符串的多個(gè)標(biāo)記(步驟s102)。具體而言,標(biāo)記抽取部101抽取明度及/或彩度等與背景(白色等)不同且具有特定的形狀及尺寸(特定寬度的帶狀的長(zhǎng)方形等)的區(qū)域作為標(biāo)記。
標(biāo)記判定部102對(duì)標(biāo)記抽取部101所抽取的多個(gè)標(biāo)記各自在原稿圖像內(nèi)的位置及形狀進(jìn)行判定(步驟s103)。具體而言,標(biāo)記判定部102將原稿圖像整體作為坐標(biāo)系整體,將標(biāo)記的位置及形狀作為坐標(biāo)算出。
字符串抽取部103根據(jù)標(biāo)記判定部102所判定的多個(gè)標(biāo)記的位置及形狀(坐標(biāo)),抽取已重疊著各個(gè)標(biāo)記的多個(gè)字符串(步驟s104)。具體而言,字符串抽取部103通過(guò)邊緣檢測(cè)而抽取已重疊著由標(biāo)記判定部102判定的位置及形狀(坐標(biāo))所定義的標(biāo)記的字符串。另外,字符串抽取部103并不抽取字符串所含有的1個(gè)1個(gè)的字符,而是抽取已重疊著1個(gè)標(biāo)記的字符串整體作為1個(gè)字符串。
字符串識(shí)別部111對(duì)字符串抽取部103所抽取的多個(gè)字符串各自進(jìn)行識(shí)別。具體而言,字符串識(shí)別部111從字符串抽取部103所抽取的多個(gè)字符串的各個(gè)字符串抽取多個(gè)字符。“字符”是字符串所含有的1個(gè)1個(gè)的字符(根據(jù)語(yǔ)言,也可稱(chēng)為1個(gè)1個(gè)的單詞),嚴(yán)格而言是其圖像。字符串識(shí)別部111參照ocr用數(shù)據(jù)庫(kù)112,對(duì)所抽取的多個(gè)字符的各個(gè)字符進(jìn)行識(shí)別(步驟s105)。具體而言,在ocr用數(shù)據(jù)庫(kù)112中,字符的圖像圖案與字符代碼對(duì)應(yīng)且逐個(gè)字符地注冊(cè)。字符串識(shí)別部111從ocr用數(shù)據(jù)庫(kù)112中檢索出表示所抽取的字符的圖像圖案,獲取與經(jīng)檢索而得的圖像圖案對(duì)應(yīng)的字符代碼。字符串識(shí)別部111針對(duì)字符串所含有的所有字符獲取字符代碼。字符串識(shí)別部111通過(guò)將字符串所含有的所有字符各自的字符代碼組合來(lái)識(shí)別字符串(步驟s106)。字符串識(shí)別部111針對(duì)已重疊著標(biāo)記的所有字符串抽取字符,獲取字符各自表示的字符代碼,將字符代碼組合,利用該組合的字符代碼來(lái)識(shí)別字符串。
字符串比較部113通過(guò)對(duì)字符串識(shí)別部111所識(shí)別的字符串彼此進(jìn)行比較而對(duì)相同的字符串進(jìn)行識(shí)別,從而識(shí)別相同的字符串(步驟s107)。具體而言,字符串比較部113針對(duì)已重疊著標(biāo)記的所有字符串,對(duì)組合的字符代碼彼此進(jìn)行比較,由此識(shí)別相同的字符串。
符號(hào)決定部104向字符串比較部113所識(shí)別的相同的字符串分配相同的符號(hào)(數(shù)字、字符、符號(hào)等),向不同的字符串分配不同的符號(hào)(步驟s108)。
空欄作成部105作成分別重疊在各自已重疊著標(biāo)記的多個(gè)字符串的空欄圖像(步驟s109,參照?qǐng)D4)。具體而言,空欄作成部105作成消除了字符串抽取部103通過(guò)邊緣檢測(cè)而抽取的字符串(步驟s104)、及從該字符串露出的標(biāo)記的邊緣部分的形狀及位置(坐標(biāo))的空欄圖像??諜趫D像可為單純的空格,也可包含有預(yù)先決定的格式(下劃線、矩形框、括弧等)。圖4所示的例中,空欄圖像包含有下劃線。
圖像合成部106作成將圖像讀取部12所讀取的原稿圖像(步驟s101)、空欄作成部105所作成的空欄圖像(步驟s109)、及作為符號(hào)決定部104所分配的符號(hào)(步驟s108)的圖像的符號(hào)圖像予以合成的合成圖像(步驟s110,參照?qǐng)D4)。具體而言,圖像合成部106將形狀及位置由坐標(biāo)定義的空欄圖像配置在原稿圖像的坐標(biāo)系。并且,圖像合成部106通過(guò)將預(yù)先決定的格式(字體、尺寸等)的符號(hào)配置在原稿圖像中配置的空欄圖像的預(yù)先決定的位置(中央、左端等),而作成合成圖像。圖4所示的例中,合成了原稿圖像、包含有下劃線的空欄圖像、及符號(hào)的圖像。
圖像形成部16將圖像合成部106所作成的合成圖像形成(打印輸出)在紙上(步驟s111)。
(ii.第2實(shí)施方式)
以下的說(shuō)明中,對(duì)于與第1實(shí)施方式相同的結(jié)構(gòu)及動(dòng)作等省略說(shuō)明,而以不同點(diǎn)為中心進(jìn)行說(shuō)明。
第1實(shí)施方式中,相同字符串識(shí)別部110利用光學(xué)字符識(shí)別(ocr)(步驟s105)對(duì)字符串進(jìn)行識(shí)別(步驟s106),識(shí)別相同的字符串(步驟s107)。相對(duì)于此,第2實(shí)施方式中,相同字符串識(shí)別部是利用光學(xué)字符識(shí)別(ocr)以外的方法識(shí)別相同的字符串。
(1.圖像形成裝置的功能性結(jié)構(gòu))
圖5是表示第2實(shí)施方式中的圖像形成裝置的功能性結(jié)構(gòu)的框圖。
mfp2通過(guò)執(zhí)行信息處理程序而作為標(biāo)記抽取部101、標(biāo)記判定部102、字符串抽取部103、字符串類(lèi)似度判定部201、符號(hào)決定部104、空欄作成部105及圖像合成部106發(fā)揮功能。mfp2中,作為第1實(shí)施方式的相同字符串識(shí)別部110,具有字符串類(lèi)似度判定部201以代替字符串識(shí)別部111、ocr用數(shù)據(jù)庫(kù)112及字符串比較部113。其他均與第1實(shí)施方式的mfp1相同。
字符串類(lèi)似度判定部201對(duì)字符串抽取部103所抽取的多個(gè)字符串彼此的類(lèi)似度進(jìn)行判定,當(dāng)類(lèi)似度為閾值以上時(shí),判定多個(gè)字符串為相同的字符串。
(2.圖像形成裝置的動(dòng)作)
圖6是表示圖像形成裝置的動(dòng)作的流程圖。
步驟s101至步驟s104與第1實(shí)施方式相同。
步驟s104之后,字符串類(lèi)似度判定部201判定字符串抽取部103所抽取(步驟s104)的多個(gè)字符串彼此的類(lèi)似度,當(dāng)類(lèi)似度為閾值以上時(shí),判定多個(gè)字符串為相同的字符串(步驟s201)。具體而言,字符串類(lèi)似度判定部201對(duì)字符串的圖像圖案(像素)彼此進(jìn)行比較,當(dāng)圖像圖案的重復(fù)度為閾值以上時(shí),判定為相同的字符串。該閾值只要設(shè)為如下的值即可:當(dāng)字符結(jié)構(gòu)相同但字體不同時(shí),也可判定為相同的字符串。例如,閾值為90%等,用戶(hù)可作為識(shí)別級(jí)別而任意設(shè)定。
步驟s201之后,步驟s108至步驟s111與第1實(shí)施方式相同。
(3.變化例)
各實(shí)施方式中,圖像讀取部12讀取原稿圖像(步驟s101)。取而代之,mfp1、mfp2也可通過(guò)網(wǎng)絡(luò)通信部13而從連接于網(wǎng)絡(luò)的信息處理裝置(未圖示)接收原稿圖像。
(4.總結(jié))
當(dāng)利用原有原稿作成填空題時(shí),1個(gè)文章中,作為解答的字符串有時(shí)會(huì)出現(xiàn)多次。此情況下,由于作為解答的字符串直接顯示在文章中會(huì)變成提示,所以作為解答的相同的字符串須要全部為空欄。即,應(yīng)解答為相同的字符串的空欄有多個(gè)。然而,若對(duì)應(yīng)解答為相同的字符串的多個(gè)空欄分配不同的符號(hào),則回答者可能會(huì)誤解為應(yīng)回答不同的語(yǔ)句。為了防止此現(xiàn)象,問(wèn)題制作者向應(yīng)解答為相同的字符串的多個(gè)空欄利用手動(dòng)作業(yè)分配相同的符號(hào)較為麻煩。尤其是,當(dāng)空欄的總數(shù)較多時(shí)、或有多組相同的字符串時(shí)等,若問(wèn)題制作者利用手動(dòng)作業(yè)分配符號(hào),則還可能會(huì)分配錯(cuò)誤的符號(hào)。
對(duì)此,根據(jù)各實(shí)施方式,mfp1向相同的字符串分配相同的符號(hào),向不同的字符串分配不同的符號(hào)(步驟s108)。由此,可消除由于向應(yīng)解答為相同的字符串的多個(gè)空欄分配不同的符號(hào),回答者會(huì)誤解為應(yīng)回答不同的語(yǔ)句的情況。而且,問(wèn)題制作者不需要花費(fèi)工夫向應(yīng)解答為相同的字符串的多個(gè)空欄利用手動(dòng)作業(yè)分配相同的符號(hào),而且也不可能分配錯(cuò)誤的符號(hào)。
第2實(shí)施方式中,mfp2對(duì)多個(gè)字符串彼此的類(lèi)似度進(jìn)行判定,當(dāng)類(lèi)似度為閾值以上時(shí),判定多個(gè)字符串為相同的字符串(步驟s201)。即,字符串實(shí)際包含有的字符并不是問(wèn)題,只要知道字符串相同即可。與第1實(shí)施方式中的ocr相比,第2實(shí)施方式具有處理量少且無(wú)需數(shù)據(jù)庫(kù)的優(yōu)點(diǎn)。
另外,各實(shí)施方式中,已對(duì)于標(biāo)記著具有多個(gè)字符的字符串時(shí)的處理進(jìn)行了說(shuō)明,但當(dāng)標(biāo)記著由1個(gè)字符所構(gòu)成的字符串時(shí),也能按照?qǐng)D3及圖6進(jìn)行處理。此情況下,在圖3所示的步驟s106中,字符串識(shí)別部111無(wú)需將字符串所含有的所有字符各自的字符代碼組合,只要根據(jù)已重疊著標(biāo)記的1個(gè)字符的字符代碼識(shí)別字符即可。而且,在圖3所示的步驟s107中,字符串識(shí)別部111可針對(duì)已重疊著標(biāo)記的所有的1個(gè)字符,通過(guò)對(duì)字符代碼彼此進(jìn)行比較而識(shí)別相同的1個(gè)字符。
(iii.第3實(shí)施方式)
(1.概要)
第3實(shí)施方式中,通過(guò)縮小未重疊標(biāo)記的字符串而作成縮小字符串、放大已重疊在字符串的標(biāo)記而作成放大字符串,從而使應(yīng)重疊空欄圖像的字符串的尺寸相對(duì)擴(kuò)大。
(2.圖像形成裝置的功能性結(jié)構(gòu))
圖7是表示第3實(shí)施方式中的圖像形成裝置的功能性結(jié)構(gòu)的框圖。
mfp1是通過(guò)執(zhí)行信息處理程序而作為標(biāo)記抽取部301、標(biāo)記判定部302、字符串區(qū)域判定部303、行區(qū)域判定部304、行區(qū)域分割部307、轉(zhuǎn)換率計(jì)算部308、圖像轉(zhuǎn)換部309、空欄作成部305及圖像合成部306發(fā)揮功能。
標(biāo)記抽取部301從圖像讀取部12所讀取的原稿圖像抽取已重疊在字符串的標(biāo)記。
標(biāo)記判定部302對(duì)標(biāo)記抽取部301所抽取的標(biāo)記在原稿圖像內(nèi)的位置及尺寸進(jìn)行判定。
字符串區(qū)域判定部303對(duì)字符串區(qū)域在原稿圖像內(nèi)的位置及尺寸進(jìn)行判定。
行區(qū)域判定部304將字符串區(qū)域判定部303所判定的字符串區(qū)域分割為多個(gè)行區(qū)域。行區(qū)域判定部304對(duì)多個(gè)行區(qū)域在字符串區(qū)域內(nèi)的位置及尺寸進(jìn)行判定。
行區(qū)域分割部307對(duì)標(biāo)記抽取部301所抽取的標(biāo)記在該標(biāo)記所屬的行區(qū)域內(nèi)的位置及尺寸進(jìn)行判定。行區(qū)域分割部307將標(biāo)記所屬的行區(qū)域分割為已重疊在字符串的標(biāo)記與未重疊標(biāo)記的字符串。另外,本實(shí)施方式中,“字符串”表示由1個(gè)字符所構(gòu)成的單位、或由連續(xù)的多個(gè)字符所構(gòu)成的單位。
轉(zhuǎn)換率計(jì)算部308計(jì)算用于使已重疊在字符串的標(biāo)記放大的放大率、或用于使未重疊標(biāo)記的字符串縮小的縮小率。
圖像轉(zhuǎn)換部309通過(guò)使已重疊在字符串的標(biāo)記放大而作成放大字符串。圖像轉(zhuǎn)換部309通過(guò)使未重疊標(biāo)記的字符串縮小而作成縮小字符串。圖像轉(zhuǎn)換部309將所作成的放大字符串及縮小字符串設(shè)計(jì)配置于作為輸出對(duì)象的原稿。
空欄作成部305作成已重疊在圖像轉(zhuǎn)換部309所作成的放大字符串的空欄圖像。
圖像合成部306按照設(shè)計(jì)來(lái)配置圖像轉(zhuǎn)換部309所作成的縮小字符串的圖像、及空欄作成部305所作成的空欄圖像,從而作成合成圖像。
(3.圖像形成裝置的動(dòng)作)
圖8是表示圖像形成裝置的動(dòng)作的流程圖。圖9是用于說(shuō)明圖像形成裝置的動(dòng)作的圖。
作為前提,在原稿(典型的是紙)上印有作為文本數(shù)據(jù)的字符串?;蛘撸谠迳?,形成作為圖像數(shù)據(jù)的字符串的圖像(復(fù)制印有字符串的原稿)。并且,字符串整體中的多個(gè)一部分的字符串(復(fù)合詞、短語(yǔ)、數(shù)值等)由作為用戶(hù)的問(wèn)題制作者使用熒光標(biāo)記筆等以手寫(xiě)的方式作標(biāo)記。作了標(biāo)記的字符串是填空題中作為解答的字符串。
圖像讀取部12對(duì)原稿進(jìn)行光學(xué)掃描,讀取原稿圖像(步驟s301)。作為“原稿圖像”,整體而言是包含有多數(shù)字符串的文檔原稿的圖像數(shù)據(jù),包括已重疊在多個(gè)字符串的多個(gè)標(biāo)記?!白址笔钦Z(yǔ)句(單詞、短語(yǔ)、文章等)、數(shù)值等,嚴(yán)格而言是其圖像。
標(biāo)記抽取部301從圖像讀取部12所讀取的原稿圖像抽取已重疊在字符串的標(biāo)記(步驟s302)。具體而言,標(biāo)記抽取部301抽取明度及/或彩度等與背景(白色等)不同且具有特定的形狀及尺寸(特定寬度的帶狀的長(zhǎng)方形等)的區(qū)域作為標(biāo)記。
標(biāo)記判定部302對(duì)標(biāo)記抽取部301所抽取的標(biāo)記(圖9的左下圖中所示的陰影部分)在原稿圖像內(nèi)的位置及尺寸進(jìn)行判定(步驟s303,參照?qǐng)D9)。具體而言,標(biāo)記判定部302將原稿圖像整體(包括空白(頁(yè)邊的空白))作為坐標(biāo)系整體,將標(biāo)記的位置及尺寸作為坐標(biāo)算出。
另一方面,與步驟s302及步驟s303并行地,字符串區(qū)域判定部303對(duì)字符串區(qū)域在原稿圖像內(nèi)的位置及尺寸進(jìn)行判定(步驟s304,參照?qǐng)D9)?!白址畢^(qū)域”是在原稿圖像中存在包含有已重疊著標(biāo)記的字符串及未重疊標(biāo)記的字符串的字符串集合體的區(qū)域。具體而言,字符串區(qū)域判定部303將原稿圖像整體(包括空白(頁(yè)邊的空白))作為坐標(biāo)系整體,將字符串區(qū)域的位置及尺寸作為坐標(biāo)算出。
行區(qū)域判定部304將字符串區(qū)域判定部303所判定的字符串區(qū)域分割為多個(gè)行區(qū)域?!靶袇^(qū)域”是將字符串區(qū)域內(nèi)存在的字符串集合體逐行地分割而得的區(qū)域。換而言之,一般來(lái)說(shuō),文檔原稿中,多個(gè)字符沿一個(gè)方向連續(xù)地排列而成為1行,而將包含有連成1行的字符串且在字符串區(qū)域的一端到另一端作為“行區(qū)域”。而且,包含有某1行字符串的“行區(qū)域”與包含有下1行字符串的“行區(qū)域”相鄰。換而言之,相鄰的2個(gè)行區(qū)域之間無(wú)空間。圖9的中央的圖所示的例中,被虛線包圍的矩形的行區(qū)域無(wú)間隙地相連。行區(qū)域判定部304對(duì)將字符串區(qū)域分割而得的多個(gè)行區(qū)域在字符串區(qū)域內(nèi)的位置及尺寸進(jìn)行判定(步驟s305,參照?qǐng)D9)。具體而言,行區(qū)域判定部304將原稿圖像整體作為坐標(biāo)系整體,將字符串區(qū)域內(nèi)的行區(qū)域的位置及尺寸作為坐標(biāo)算出。
行區(qū)域分割部307對(duì)標(biāo)記抽取部301所抽取(步驟s302)的標(biāo)記在該標(biāo)記所屬的行區(qū)域內(nèi)的位置及尺寸進(jìn)行判定。具體而言,行區(qū)域分割部307獲取標(biāo)記判定部302所判定(步驟s303)的標(biāo)記在原稿圖像內(nèi)的位置及尺寸、及行區(qū)域判定部304所判定(步驟s305)的多個(gè)行區(qū)域在字符串區(qū)域內(nèi)的位置及尺寸。行區(qū)域分割部307通過(guò)將標(biāo)記在原稿圖像內(nèi)的位置及尺寸反映為多個(gè)行區(qū)域在字符串區(qū)域內(nèi)的位置及尺寸,而對(duì)該標(biāo)記在標(biāo)記所屬的行區(qū)域內(nèi)的位置及尺寸進(jìn)行判定。圖9右側(cè)的圖所示的例中,判定從上數(shù)起第4個(gè)與第6個(gè)行區(qū)域內(nèi)的標(biāo)記(陰影部分)在行區(qū)域內(nèi)的位置及尺寸。并且,行區(qū)域分割部307將標(biāo)記所屬的行區(qū)域分割為已重疊在字符串的標(biāo)記及未重疊標(biāo)記的字符串(步驟s306,參照?qǐng)D9)。具體而言,行區(qū)域分割部307算出標(biāo)記的位置及尺寸作為坐標(biāo),算出未重疊標(biāo)記的字符串的位置及尺寸作為坐標(biāo)。
轉(zhuǎn)換率計(jì)算部308算出用于使行區(qū)域分割部307分割(步驟s306)后所得且已重疊在字符串的標(biāo)記放大的放大率、或用于使行區(qū)域分割部307分割(步驟s306)后所得且未重疊標(biāo)記的字符串縮小的縮小率(步驟s307)。轉(zhuǎn)換率計(jì)算部308根據(jù)預(yù)先決定的放大率及縮小率中的任一者計(jì)算放大率及縮小率中的另一者。所謂預(yù)先決定放大率的情況是指例如用戶(hù)使用操作部17在mfp1中預(yù)先設(shè)定放大率的情況、或用戶(hù)使用操作部17在mfp1中預(yù)先設(shè)定空欄尺寸的情況(根據(jù)原有的字符尺寸與空欄尺寸預(yù)先決定放大率)。所謂預(yù)先決定縮小率的情況是指例如用戶(hù)使用操作部17在mfp1中預(yù)先設(shè)定縮小率的情況、或用戶(hù)使用操作部17在mfp1中預(yù)先設(shè)定縮小后的字符尺寸的情況(根據(jù)原有的(縮小前的)字符尺寸與縮小后的字符尺寸預(yù)先決定縮小率)。
優(yōu)選的是,轉(zhuǎn)換率計(jì)算部308以如下方式計(jì)算放大率或縮小率:包含有放大字符串的行區(qū)域在行區(qū)域內(nèi)的字符排列方向上的長(zhǎng)度為放大及縮小前的行區(qū)域的同方向上的長(zhǎng)度以下。更優(yōu)選的是,轉(zhuǎn)換率計(jì)算部308在包含有放大字符串的行區(qū)域在行區(qū)域內(nèi)的字符排列方向上的長(zhǎng)度為放大及縮小前的行區(qū)域的同方向上的長(zhǎng)度以下的范圍內(nèi),以放大字符串成為最大尺寸的方式計(jì)算放大率,或以縮小字符串成為最大尺寸的方式計(jì)算縮小率。由此,盡管包含有放大字符串的行區(qū)域的長(zhǎng)度相對(duì)變長(zhǎng),也無(wú)需換行等,所以能盡量運(yùn)用原有的原稿圖像的設(shè)計(jì),且使空欄圖像的尺寸相對(duì)變大。
優(yōu)選的是,轉(zhuǎn)換率計(jì)算部308是以如下方式計(jì)算放大率或縮小率:包含有放大字符串的字符串區(qū)域在多個(gè)行區(qū)域排列方向上的長(zhǎng)度為放大及縮小前的字符串區(qū)域的同方向上的長(zhǎng)度以下。更優(yōu)選的是,轉(zhuǎn)換率計(jì)算部308在包含有放大字符串的字符串區(qū)域在多個(gè)行區(qū)域排列方向上的長(zhǎng)度為放大及縮小前的字符串區(qū)域的同方向上的長(zhǎng)度以下的范圍內(nèi),以放大字符串成為最大尺寸的方式計(jì)算放大率,或以縮小字符串成為最大尺寸的方式計(jì)算縮小率。由此,盡管包含有放大字符串的字符串區(qū)域的長(zhǎng)度變得比原有的原稿圖像長(zhǎng),也無(wú)須分頁(yè)等,所以能盡量運(yùn)用原有的原稿圖像的設(shè)計(jì),且使空欄圖像的尺寸相對(duì)變大。
關(guān)于轉(zhuǎn)換率計(jì)算部308對(duì)放大率及縮小率的計(jì)算方法,在下文敘述的各實(shí)施例中更具體地進(jìn)行說(shuō)明。
圖像轉(zhuǎn)換部309使經(jīng)行區(qū)域分割部307分割(步驟s306)后所得且已重疊在字符串的標(biāo)記以預(yù)先決定的或轉(zhuǎn)換率計(jì)算部308計(jì)算(步驟s307)出的放大率放大,而作成放大字符串(嚴(yán)格而言是放大字符串的圖像)。并且,圖像轉(zhuǎn)換部309使經(jīng)行區(qū)域分割部307分割(步驟s306)后所得且未重疊標(biāo)記的字符串以預(yù)先決定的或轉(zhuǎn)換率計(jì)算部308計(jì)算(步驟s307)出的縮小率縮小,而作成縮小字符串(嚴(yán)格而言是縮小字符串的圖像)(步驟s308)。圖像轉(zhuǎn)換部309將所作成的放大字符串及縮小字符串設(shè)計(jì)配置于作為輸出對(duì)象的原稿(步驟s309)。所謂“設(shè)計(jì)”是指例如使多個(gè)行區(qū)域分別“居中”、“左對(duì)齊”(橫向書(shū)寫(xiě)時(shí))等。
空欄作成部305作成重疊在圖像轉(zhuǎn)換部309所作成(步驟s308)的放大字符串的空欄圖像(步驟s310)??諜趫D像可為單純的空格,也可包含有預(yù)先決定的格式(下劃線、矩形框、括弧、符號(hào)等)。
圖像合成部306使圖像轉(zhuǎn)換部309所作成(步驟s308)的縮小字符串的圖像以及空欄作成部305所作成(步驟s310)的空欄圖像按照設(shè)計(jì)(步驟s309)而配置,作成合成圖像(步驟s311)。
圖像形成部16使圖像合成部306所作成的合成圖像形成(打印輸出)在紙上(步驟s312)。
(4.實(shí)施例)
以下的各實(shí)施例中,對(duì)轉(zhuǎn)換率計(jì)算部308的放大率或縮小率的計(jì)算方法進(jìn)行具體說(shuō)明。
圖10是用于說(shuō)明用以算出放大率或縮小率的算式中使用的變量的圖。
各實(shí)施例中,字符為“橫向書(shū)寫(xiě)”。以下,將行區(qū)域內(nèi)的字符排列方向(圖10的橫向)上的長(zhǎng)度定義為“寬度”。將字符串區(qū)域內(nèi)的行區(qū)域排列方向(圖10的縱向)上的長(zhǎng)度定義為“高度”。將用于算出放大率或縮小率的算式中使用的變量定義如下。
以下全部是圖像讀取部12所讀取的原稿圖像內(nèi)的值。
1個(gè)字符串區(qū)域內(nèi)所含有的行區(qū)域的總數(shù):l。
1個(gè)字符串區(qū)域內(nèi)所含有的且包含有標(biāo)記(圖10中所示的陰影部分)的行區(qū)域的總數(shù):lm。
字符串區(qū)域的寬度:x。
字符串區(qū)域的高度:y。
1個(gè)行區(qū)域內(nèi)所含有的且已重疊在字符串的標(biāo)記的合計(jì)寬度:xm。
已重疊在字符串的各標(biāo)記的高度:ym。
包含有標(biāo)記的行區(qū)域內(nèi)所含有的且未重疊標(biāo)記的字符串的合計(jì)寬度:xn。
未重疊標(biāo)記的字符串的高度:yn。
用于由已重疊在字符串的標(biāo)記作成放大字符串的放大率:α(α>1)。
用于由未重疊標(biāo)記的字符串作成縮小字符串的縮小率:β(0<β<1)。
以下的各實(shí)施例中所示的算式都包含有放大率α及縮小率β。放大率α及縮小率β中的任一者都作為變量而預(yù)先決定。結(jié)果,能算出放大率α及縮小率β中的另一者。
為求方便,圖像轉(zhuǎn)換部309的放大/縮小后的尺寸稱(chēng)為如下。它們并非變量。
包含有標(biāo)記的行區(qū)域的寬度:x’。
字符串區(qū)域的高度:y’。
(4-1.實(shí)施例1)
圖11是用于說(shuō)明實(shí)施例1中的放大率或縮小率的計(jì)算方法的圖。
圖11中表示在1個(gè)字符串區(qū)域所含有的多個(gè)行區(qū)域中的1個(gè)行區(qū)域,包含有1個(gè)標(biāo)記、及未重疊1個(gè)標(biāo)記(圖11所示的陰影部分)的字符串的情況。此情況下,式1及式2成立即可。
[式1]
y’=αym+β(y1+y3+y4+···+yl)≦y
αym是放大后且包含有標(biāo)記的行區(qū)域的高度的合計(jì)值。
β(y1+y3+y4+···+yl)是縮小后且不含標(biāo)記的多個(gè)行區(qū)域的高度的合計(jì)值。
y’≦y成立。即,能使放大/縮小后的字符串區(qū)域的高度y’處于放大/縮小前的字符串區(qū)域的高度y以下。
[式2]
x’=αxm+βxn≦x
αxm是放大后的標(biāo)記的寬度的合計(jì)值。
βxn是縮小后且未重疊標(biāo)記的字符串的寬度的合計(jì)值。
x’≦x成立。即,能使放大/縮小后的包含有標(biāo)記的行區(qū)域的寬度x’處于放大/縮小前的字符串區(qū)域的寬度x以下。
(4-2.實(shí)施例2)
以下,對(duì)于與已說(shuō)明的實(shí)施例相同的方面省略說(shuō)明,而以不同點(diǎn)為中心進(jìn)行說(shuō)明。
圖12是用以說(shuō)明實(shí)施例2中的放大率或縮小率的計(jì)算方法的圖。
圖12中表示在1個(gè)字符串區(qū)域所含有的多個(gè)行區(qū)域中的2個(gè)行區(qū)域內(nèi),包含有1個(gè)標(biāo)記(圖12所示的陰影部分)、及1個(gè)未重疊標(biāo)記的字符串的情況。此情況下,式3、式4及式5成立即可。
[式3]
y’=α(ym1+ym2)+β(y1+y3+···+yl)≦y
[式4]
x’1=αxm1+βxn1≦x
[式5]
x’2=αxm2+βxn2≦x
(4-3.實(shí)施例3)
圖13是用于說(shuō)明實(shí)施例3中的放大率或縮小率的計(jì)算方法的圖。
圖13中表示在1個(gè)字符串區(qū)域所含有的多個(gè)行區(qū)域中的1個(gè)行區(qū)域,包含有1個(gè)標(biāo)記(圖13所示的陰影部分)、及2個(gè)未重疊標(biāo)記的字符串的情況。
x=10、y=12、l=6、xm=2、xn=5+3、yn=2、ym=2、α=1.4預(yù)先作為變量而決定。
若將這些變量代入式1及式2,則成為式6及式7。
[式6]
y’=1.4×2+β(2+2+2+2+2)≦12
根據(jù)式6,β≦0.92。
[式7]
x’=1.4×2+β(5+3)≦10
根據(jù)式7,β≦0.9。
在滿(mǎn)足β≦0.92及β≦0.9兩者的范圍內(nèi),縮小率β的最小值(即,縮小字符串成為最大尺寸的縮小率β的值)為0.9。為了提高視認(rèn)性,可采用縮小字符串成為最大尺寸的縮小率,所以此情況下可為β=0.9。
(4-4.實(shí)施例4)
圖14是用于說(shuō)明實(shí)施例4中的放大率或縮小率的計(jì)算方法的圖。
圖14中表示在1個(gè)字符串區(qū)域所含有的多個(gè)行區(qū)域中的2個(gè)行區(qū)域分別含有標(biāo)記(圖14所示的陰影部分)而且2個(gè)行區(qū)域的標(biāo)記的合計(jì)寬度xm彼此相等的情況。
x=10、y=12、l=6、從上數(shù)起第2行的xm1=3+2、從上數(shù)起第4行的xm2=4+1、從上數(shù)起第2行的xn1=2+3、從上數(shù)起第4行的xn2=1+4、yn=2、ym=2、α=1.2預(yù)先作為變量而決定。
若將這些變量代入式3、式4及式5,則成為式8、式9及式10。
[式8]
y’=1.2(2+2)+β(2+2+2+2)≦12
根據(jù)式8,β≦0.9。
[式9]
x’1=1.2×(3+2)+β(2+3)≦10
根據(jù)式9,β≦0.8。
[式10]
x’2=1.2×(4+1)+β(1+4)≦10
根據(jù)式10,β≦0.8。
在完全滿(mǎn)足β≦0.9、β≦0.8及β≦0.8的范圍內(nèi),縮小率β的最小值(即,縮小字符串成為最大尺寸的縮小率β的值)為0.8。為了提高視認(rèn)性,可采用縮小字符串成為最大尺寸的縮小率,所以此情況下可為β=0.8。
(4-5.實(shí)施例5)
圖15是用于說(shuō)明實(shí)施例5中的放大率或縮小率的計(jì)算方法的圖。
圖15中表示在1個(gè)字符串區(qū)域所含有的多個(gè)行區(qū)域中的2個(gè)行區(qū)域分別包含有標(biāo)記(圖15的陰影部分)而且2個(gè)行區(qū)域的標(biāo)記的合計(jì)寬度xm彼此不同的情況。
x=10、y=12、l=6、從上數(shù)起第2行的xm1=2、從上數(shù)起第4行的xm2=5、從上數(shù)起第2行的xn1=3+5、從上數(shù)起第4行的xn2=2+3、yn=2、ym=2、α=1.2預(yù)先作為變量而決定。
若將這些變量代入式3、式4及式5,則成為式11、式12及式13。
[式11]
y’=1.2(2+2)+β(2+2+2+2)≦12
根據(jù)式11,β≦0.9。
[式12]
x’1=1.2×2+β(3+5)≦10
根據(jù)式12,β≦0.95。
[式13]
x’2=1.2×5+β(2+3)≦10
根據(jù)式13,β≦0.8。
在完全滿(mǎn)足β≦0.9、β≦0.95及β≦0.8的范圍內(nèi),縮小率β的最小值(即,縮小字符串成為最大尺寸的縮小率β的值)為0.8。為了提高視認(rèn)性,可采用縮小字符串成為最大尺寸的縮小率,所以此情況下可為β=0.8。
以上,已說(shuō)明實(shí)施例1至實(shí)施例5,但還包括除此之外的例子,在放大率或縮小率的計(jì)算方法中,式14及式15成立即可。
[式14]
式14中,n表示包含有標(biāo)記的行區(qū)域的數(shù)量,mn表示包含有標(biāo)記的行區(qū)域內(nèi)的標(biāo)記,m表示不含標(biāo)記的行區(qū)域的數(shù)量,lm表示不含標(biāo)記的行區(qū)域。
[式15]
式15中,n表示包含有標(biāo)記的行區(qū)域的數(shù)量,pn表示包含有標(biāo)記的行區(qū)域,s表示行區(qū)域pn內(nèi)的標(biāo)記的數(shù)量,ms表示行區(qū)域pn內(nèi)的標(biāo)記,t表示行區(qū)域pn內(nèi)的未重疊標(biāo)記的字符串的數(shù)量,nt表示行區(qū)域pn內(nèi)的未重疊標(biāo)記的字符串。
(5.總結(jié))
mfp1由包含有已重疊在字符串的標(biāo)記的原稿圖像作成以作了標(biāo)記的字符串作為解答的填空題(空欄問(wèn)題)??諜趦?nèi),有時(shí)會(huì)由回答者填寫(xiě)作為回答的字符串或符號(hào),或由問(wèn)題制作者填寫(xiě)符號(hào)等。若空欄小,則可能出現(xiàn)如下等情況:回答者難以填寫(xiě)作為回答的字符串或符號(hào),或難以看見(jiàn)問(wèn)題制作者所填寫(xiě)的符號(hào)等。
對(duì)此,根據(jù)本實(shí)施方式,圖像轉(zhuǎn)換部309將已重疊在字符串的標(biāo)記放大而作成放大字符串,且使未重疊標(biāo)記的字符串縮小而作成縮小字符串??諜谧鞒刹?05作成重疊在放大字符串的空欄圖像。圖像合成部306作成已將縮小字符串與空欄圖像予以合成的合成圖像。
這樣,通過(guò)縮小空欄以外的字符串(未作標(biāo)記的字符串)、放大空欄的尺寸,能盡量運(yùn)用原有的原稿圖像的設(shè)計(jì),且使空欄的尺寸相對(duì)放大。
(iv.第4實(shí)施方式)
(1.概要)
根據(jù)第4實(shí)施方式,從原稿圖像抽取與已重疊著標(biāo)記的字符串相同的未重疊標(biāo)記的字符串,作成分別重疊在已重疊著標(biāo)記的字符串及所抽取的字符串的多個(gè)空欄圖像。
(2.圖像形成裝置的功能性結(jié)構(gòu))
圖16是表示第4實(shí)施方式中的圖像形成裝置的功能性結(jié)構(gòu)的框圖。
mfp1通過(guò)執(zhí)行信息處理程序而作為標(biāo)記抽取部401、標(biāo)記判定部402、字符抽取部403、字符識(shí)別部411、字符串比較部413、空欄作成部405及圖像合成部406發(fā)揮功能。
標(biāo)記抽取部401從圖像讀取部12所讀取的原稿圖像抽取已重疊在字符串的標(biāo)記。
標(biāo)記判定部402對(duì)標(biāo)記抽取部401所抽取的標(biāo)記在原稿圖像內(nèi)的位置及形狀進(jìn)行判定。
字符抽取部403從圖像讀取部12所讀取的原稿圖像抽取多個(gè)字符。
字符識(shí)別部411參照ocr用數(shù)據(jù)庫(kù)112,對(duì)字符抽取部403所抽取的多個(gè)字符分別進(jìn)行識(shí)別。字符識(shí)別部411根據(jù)標(biāo)記判定部402所判定的標(biāo)記的位置及形狀,利用字符代碼的組合來(lái)識(shí)別已重疊著標(biāo)記的字符串。
字符串比較部413從字符識(shí)別部411所識(shí)別的多個(gè)字符抽取與字符識(shí)別部411所識(shí)別的已重疊著標(biāo)記的字符串相同的未重疊標(biāo)記的字符串。
空欄作成部405作成分別重疊在字符串比較部413所抽取的未重疊標(biāo)記的字符串、及已重疊著標(biāo)記的字符串的空欄圖像。
圖像合成部406作成已將圖像讀取部12所讀取的原稿圖像、及空欄作成部405所作成的空欄圖像予以合成的合成圖像。
(3.圖像形成裝置的動(dòng)作)
圖17是表示圖像形成裝置的動(dòng)作的流程圖。圖18是用于說(shuō)明圖像形成裝置的動(dòng)作的圖。
作為前提,在原稿(典型的是紙)上印有作為文本數(shù)據(jù)的字符串。或者,在原稿上,形成作為圖像數(shù)據(jù)的字符串的圖像(復(fù)制印有字符串的原稿)。并且,字符串整體中的多個(gè)一部分的字符串(復(fù)合詞、短語(yǔ)、數(shù)值等)由作為用戶(hù)的問(wèn)題制作者使用熒光標(biāo)記筆等以手寫(xiě)的方式作標(biāo)記。作了標(biāo)記的字符串是填空題中作為解答的字符串。
圖像讀取部12對(duì)原稿進(jìn)行光學(xué)掃描,讀取原稿圖像(步驟s401,參照?qǐng)D18)。作為“原稿圖像”,整體而言是包含有多數(shù)字符串的文檔原稿的圖像數(shù)據(jù),包括已重疊在多個(gè)字符串的多個(gè)標(biāo)記(圖18中所示的陰影部分)?!白址笔钦Z(yǔ)句(單詞、短語(yǔ)、文章等)、數(shù)值等,嚴(yán)格而言是其圖像。
標(biāo)記抽取部401從圖像讀取部12所讀取的原稿圖像抽取已重疊在字符串的標(biāo)記(步驟s402)。具體而言,標(biāo)記抽取部401抽取明度及/或彩度等與背景(白色等)不同且具有特定的形狀及尺寸(特定寬度的帶狀的長(zhǎng)方形等)的區(qū)域作為標(biāo)記。
標(biāo)記判定部402對(duì)標(biāo)記抽取部401所抽取的標(biāo)記在原稿圖像內(nèi)的位置及形狀進(jìn)行判定(步驟s403)。具體而言,標(biāo)記判定部402將原稿圖像整體作為坐標(biāo)系整體,將標(biāo)記的位置及形狀作為坐標(biāo)算出。
另一方面,與步驟s402及步驟s403并行地,字符抽取部403從圖像讀取部12所讀取的原稿圖像抽取多個(gè)字符(步驟s404)。具體而言,字符抽取部403通過(guò)邊緣檢測(cè)而抽取原稿圖像所含有的所有字符。換而言之,字符抽取部403通過(guò)邊緣檢測(cè)而將原稿圖像分解為1個(gè)1個(gè)的字符。即,“字符”是原稿圖像所含有的1個(gè)1個(gè)的字符(根據(jù)語(yǔ)言,也可為1個(gè)1個(gè)的單詞),嚴(yán)格而言是其圖像。
字符識(shí)別部411參照ocr用數(shù)據(jù)庫(kù)112,對(duì)字符抽取部403所抽取的多個(gè)字符分別進(jìn)行識(shí)別(步驟s405)。具體而言,在ocr用數(shù)據(jù)庫(kù)112中,字符的圖像圖案與字符代碼對(duì)應(yīng)地且逐個(gè)字符地注冊(cè)。字符識(shí)別部411從ocr用數(shù)據(jù)庫(kù)112中檢索出表示字符抽取部403所抽取的字符的圖像圖案,獲取與經(jīng)檢索而得的圖像圖案對(duì)應(yīng)的字符代碼。字符識(shí)別部411針對(duì)原稿圖像所含有的所有字符獲取字符代碼。
字符識(shí)別部411根據(jù)標(biāo)記判定部402所判定的標(biāo)記的位置及形狀,識(shí)別已重疊著標(biāo)記的字符串。字符識(shí)別部411針對(duì)已重疊著標(biāo)記的字符串,通過(guò)將已重疊著標(biāo)記的字符串所含有的所有字符各自的字符代碼進(jìn)行組合,從而利用該組合的字符代碼來(lái)進(jìn)行識(shí)別(步驟s406)。
字符串比較部413從字符識(shí)別部411所識(shí)別的多個(gè)字符抽取與字符識(shí)別部411所識(shí)別的已重疊著標(biāo)記的字符串相同的未重疊標(biāo)記的字符串(步驟s407,參照?qǐng)D18)。具體而言,字符串比較部413對(duì)于已重疊著標(biāo)記的字符串的字符代碼的組合與未重疊標(biāo)記的字符的字符代碼進(jìn)行比較。并且,字符串比較部413抽取與已重疊著標(biāo)記的字符串的字符代碼的組合相同且原稿圖像所含有的所有未重疊標(biāo)記的字符中的連續(xù)的字符代碼的組合。圖18所示的例中,抽取字符串“def”及“yz”。
若字符串比較部413抽取與已重疊著標(biāo)記的字符串相同的未重疊標(biāo)記的字符串(步驟s408中為是),則空欄作成部405作成已分別重疊著字符串比較部413所抽取的未重疊標(biāo)記的字符串(步驟s409)及已重疊著標(biāo)記的字符串的空欄圖像(步驟s410,參照?qǐng)D18)。另一方面,若字符串比較部413未抽取與重疊著標(biāo)記的字符串相同的未重疊標(biāo)記的字符串(步驟s408中為否),則空欄作成部405作成已重疊在重疊著標(biāo)記的字符串的空欄圖像(步驟s410)。具體而言,空欄作成部405作成消除了字符抽取部403通過(guò)邊緣檢測(cè)所抽取的字符(步驟s404)、及已重疊著標(biāo)記時(shí)的從該字符露出的標(biāo)記的邊緣部分的形狀及位置(坐標(biāo))的空欄圖像。空欄圖像可為單純的空格,也可包含有預(yù)先決定的格式(下劃線、矩形框、括弧等)。圖18所示的例中,空欄圖像包含有下劃線。
圖像合成部406作成已將圖像讀取部12所讀取的原稿圖像(步驟s401)、空欄作成部405所作成的空欄圖像(步驟s409、s410)予以合成的合成圖像(步驟s411,參照?qǐng)D18)。具體而言,圖像合成部406將形狀及位置由坐標(biāo)定義的空欄圖像配置在原稿圖像的坐標(biāo)系。圖18所示的例中,合成了原稿圖像、及包含有下劃線的空欄圖像。
圖像形成部16將圖像合成部406所作成的合成圖像形成在(打印輸出)紙上(步驟s412)。
(4.變化例)
實(shí)施方式中,空欄圖像為單純的空格等,但亦可對(duì)空欄圖像分配符號(hào)(數(shù)字、字符、符號(hào)等)。
即,一變化例中,字符串比較部413對(duì)已重疊著標(biāo)記的字符串、及與其相同的未重疊標(biāo)記的字符串分配相同的符號(hào)(數(shù)字、字符、符號(hào)等)。
圖像合成部406作成將圖像讀取部12所讀取的原稿圖像、空欄作成部405所作成的空欄圖像、及作為字符串比較部413所分配的符號(hào)的圖像的符號(hào)圖像予以合成的合成圖像。具體而言,圖像合成部406通過(guò)將預(yù)先決定的格式(字體、尺寸等)的符號(hào)配置在原稿圖像中配置的空欄圖像的預(yù)先決定的位置(中央、左端等),而作成合成圖像。
實(shí)施方式中,圖像讀取部12讀取原稿圖像(步驟s401)。取而代之,mfp1也可通過(guò)網(wǎng)絡(luò)通信部13而從連接于網(wǎng)絡(luò)的信息處理裝置(未圖示)接收原稿圖像。
(5.總結(jié))
當(dāng)利用原有原稿作成填空題時(shí),1個(gè)文章中,作為解答的字符串有時(shí)會(huì)出現(xiàn)多次。此情況下,由于作為解答的字符串直接顯示在文章中會(huì)成為提示,所以作為解答的相同的字符串須要全部為空欄。然而,問(wèn)題制作者利用手動(dòng)作業(yè)抽取作為解答的所有相同的字符串不僅費(fèi)事,而且確實(shí)難以抽取所有相同的字符串。
對(duì)此,根據(jù)實(shí)施方式,mfp1從原稿圖像抽取與已重疊著標(biāo)記的字符串相同的未重疊標(biāo)記的字符串(步驟s407),作成分別重疊在已重疊著標(biāo)記的字符串及所抽取的字符串的多個(gè)空欄圖像(步驟s409、步驟s410)。由此,能確實(shí)使作為解答的相同字符串全部成為空欄。因此,不會(huì)出現(xiàn)作為解答的字符串直接顯示在文章中而成為提示的現(xiàn)象,而且問(wèn)題制作者無(wú)需花費(fèi)工夫利用手動(dòng)作業(yè)抽取作為解答的所有相同的字符串。
而且,若對(duì)應(yīng)解答為相同的字符串的多個(gè)空欄分配不同的符號(hào),則回答者可能會(huì)誤解為應(yīng)回答不同的語(yǔ)句。為了防止此現(xiàn)象,問(wèn)題制作者利用手動(dòng)作業(yè)對(duì)應(yīng)解答為相同的字符串的多個(gè)空欄分配相同的符號(hào)較為麻煩。尤其是,當(dāng)空欄的總數(shù)較多時(shí)、或有多組相同字符串時(shí)等,若問(wèn)題制作者利用手動(dòng)作業(yè)分配符號(hào),則還可能會(huì)分配錯(cuò)誤的符號(hào)。
對(duì)此,根據(jù)變化例,mfp1對(duì)已重疊著標(biāo)記的字符串、及與其相同的未重疊標(biāo)記的字符串分配相同的符號(hào)。由此,可消除由于向應(yīng)解答為相同的字符串的多個(gè)空欄分配不同的符號(hào),回答者會(huì)誤解為應(yīng)回答不同的語(yǔ)句的情況。而且,問(wèn)題制作者不需要花費(fèi)工夫向應(yīng)解答為相同的字符串的多個(gè)空欄利用手動(dòng)作業(yè)分配相同的符號(hào),而且,也不會(huì)分配錯(cuò)誤的符號(hào)。
另外,各實(shí)施方式中,已對(duì)于標(biāo)記著具有多個(gè)字符的字符串時(shí)的處理進(jìn)行了說(shuō)明,但在標(biāo)記著由1個(gè)字符所構(gòu)成的字符串時(shí),也可按照?qǐng)D17進(jìn)行處理。此情況下,在圖17所示的步驟s406中,字符串識(shí)別部411無(wú)需將字符串中所含有的所有字符各自的字符代碼組合,只要根據(jù)已重疊著標(biāo)記的1個(gè)字符的字符代碼識(shí)別字符即可。而且,在圖17所示的步驟s407中,字符串識(shí)別部411可針對(duì)已重疊著標(biāo)記的1個(gè)字符的字符代碼與未重疊標(biāo)記的字符的字符代碼進(jìn)行比較,抽取與已重疊著標(biāo)記的1個(gè)字符的字符代碼相同且原稿圖像所含有的所有未重疊標(biāo)記的字符。
而且,當(dāng)標(biāo)記著1個(gè)字符(根據(jù)語(yǔ)言,可為1個(gè)單詞)時(shí),可不執(zhí)行圖17所示的處理。一般而言,相同的原稿中,相同的1個(gè)字符有時(shí)會(huì)采用分別不同的使用方法。此時(shí),能防止非用戶(hù)預(yù)期的1個(gè)字符成為空欄。