本申請(qǐng)享受2016年3月29日在先提出的日本國(guó)專(zhuān)利申請(qǐng)?zhí)?016-065759的優(yōu)先權(quán)的利益,并且包括在先申請(qǐng)的全部?jī)?nèi)容。
實(shí)施方式涉及圖像處理系統(tǒng)、圖像處理裝置以及圖像處理方法。
背景技術(shù):
為了將表單中所填寫(xiě)的字符、圖像等信息保存在數(shù)據(jù)庫(kù)中,有ocr(opticalcharacterreader)等用字符讀取裝置讀取表單并將所填寫(xiě)的字符變換為文本數(shù)據(jù)的技術(shù)。在此情況下,為了應(yīng)對(duì)誤識(shí)別,由作業(yè)者人工來(lái)進(jìn)行識(shí)別結(jié)果確認(rèn)和修改的工序。
在上述的工序中,作業(yè)者例如使手寫(xiě)填寫(xiě)的文件的讀取圖像和由字符讀取裝置讀取的讀取數(shù)據(jù)顯示在用于進(jìn)行修改的作業(yè)用終端裝置的畫(huà)面上并對(duì)兩者進(jìn)行比較,由此來(lái)對(duì)字符讀取裝置的讀取數(shù)據(jù)的錯(cuò)誤進(jìn)行修改。
技術(shù)實(shí)現(xiàn)要素:
在將該誤識(shí)別的應(yīng)對(duì)工序以眾包(crowdsourcing)等形式外包時(shí),存在個(gè)人信息保護(hù)等在遵紀(jì)守法方面的制約大的問(wèn)題。
本發(fā)明的實(shí)施方式的目的在于,提供一種圖像處理系統(tǒng)、圖像處理裝置以及圖像處理程序,在確保表單等文書(shū)中包含的隱秘信息的安全性的同時(shí),能夠進(jìn)行從表單識(shí)別出的字符的修改。
實(shí)施方式圖像處理系統(tǒng)是將對(duì)文書(shū)的圖像進(jìn)行識(shí)別的圖像處理裝置與具備輸入部及顯示部的終端裝置通過(guò)網(wǎng)絡(luò)進(jìn)行連接而構(gòu)成的。圖像處理裝置具備:識(shí)別部,對(duì)圖像進(jìn)行字符識(shí)別處理;隱秘信息檢測(cè)部,從識(shí)別部的識(shí)別結(jié)果檢測(cè)隱秘信息;以及加工部,基于隱秘信息,制作將圖像中的隱秘信息部分碎片化而得到的第1加工圖像。終端裝置具備:顯示部,顯示第1加工圖像;以及輸入部,輸入第1加工圖像的修改數(shù)據(jù)。
附圖說(shuō)明
圖1是表示實(shí)施方式的圖像處理系統(tǒng)的硬件構(gòu)成的概略圖。
圖2是表示實(shí)施方式的圖像處理系統(tǒng)的功能構(gòu)成的一例的框圖。
圖3是表示實(shí)施方式的圖像處理系統(tǒng)的動(dòng)作的一例的流程圖。
圖4是表示實(shí)施方式的圖像處理系統(tǒng)中的圖像的一例的圖。
圖5是表示實(shí)施方式的圖像處理系統(tǒng)中的圖像的一例的圖。
圖6是表示實(shí)施方式的圖像處理系統(tǒng)中的隱秘信息檢測(cè)處理和加工處理的一例的概略圖。
圖7是表示實(shí)施方式的圖像處理系統(tǒng)的框線圖像的一例的概略圖。
具體實(shí)施方式
以下,參照附圖對(duì)本發(fā)明的實(shí)施方式的一例進(jìn)行說(shuō)明。
首先,參照?qǐng)D1對(duì)本實(shí)施方式的圖像處理系統(tǒng)的構(gòu)成進(jìn)行說(shuō)明。圖1是表示本實(shí)施方式的圖像處理系統(tǒng)100的硬件構(gòu)成的框圖。
圖像處理系統(tǒng)100具備掃描器101、搭載有軟件102的服務(wù)器裝置103(以下稱(chēng)為圖像處理裝置)、存儲(chǔ)圖像數(shù)據(jù)及圖像處理裝置103的處理結(jié)果等的存儲(chǔ)裝置104、搭載有網(wǎng)絡(luò)瀏覽器107的作業(yè)者用終端裝置106、以及將圖像處理裝置103與作業(yè)者用終端裝置106連接的網(wǎng)絡(luò)105。
另外,所謂的“連接”,不是一定指物理上通過(guò)布線等連接,表示的是在構(gòu)成要素間能夠收發(fā)數(shù)據(jù)、信號(hào)。即,圖像處理裝置103與作業(yè)者用終端裝置106經(jīng)由網(wǎng)絡(luò)105能夠互相通信。此外,圖像處理裝置103可以不是單一的,也可以是多個(gè)服務(wù)器裝置互相協(xié)同地構(gòu)成一個(gè)系統(tǒng)。
掃描器101讀取作為由圖像處理裝置103進(jìn)行處理的對(duì)象的表單等文書(shū),并制作文書(shū)整體或者文書(shū)的一部分的圖像(文書(shū)圖像)。掃描器101將制作出的圖像輸入至圖像處理裝置103。圖像處理裝置103將所輸入的圖像存儲(chǔ)在存儲(chǔ)裝置104中。另外,圖像例如也能夠通過(guò)用攝影機(jī)攝影來(lái)制作。
軟件102實(shí)現(xiàn)圖像處理裝置103的各種功能。此外,軟件102按照來(lái)自網(wǎng)絡(luò)瀏覽器107的操作,控制作業(yè)者用終端裝置106中的顯示。
圖像處理裝置103進(jìn)行圖像的識(shí)別,并將圖像識(shí)別結(jié)果向作業(yè)者用終端裝置發(fā)送。本實(shí)施方式的識(shí)別對(duì)象的圖像,通過(guò)掃描器101來(lái)制作,并被輸入至圖像處理裝置103。圖像處理裝置103將所輸入的圖像存儲(chǔ)于存儲(chǔ)裝置104。此外,圖像處理裝置103將圖像識(shí)別結(jié)果存儲(chǔ)于存儲(chǔ)裝置104。
存儲(chǔ)裝置104例如通過(guò)硬盤(pán)驅(qū)動(dòng)器構(gòu)成。存儲(chǔ)裝置104存儲(chǔ)被輸入至圖像處理裝置103的圖像、圖像處理裝置103的圖像識(shí)別結(jié)果。此外,存儲(chǔ)裝置104預(yù)先存儲(chǔ)有圖像處理裝置103進(jìn)行圖像處理所需的信息。
作業(yè)者用終端裝置106由個(gè)人計(jì)算機(jī)、便攜電話、平板電腦、智能手機(jī)等構(gòu)成,具備:顯示部,顯示從圖像處理裝置103接收到的圖像識(shí)別結(jié)果;以及輸入部,輸入與所顯示的圖像有關(guān)的修改數(shù)據(jù)。即,作業(yè)者能夠使用作業(yè)者用終端裝置106來(lái)進(jìn)行圖像處理裝置103的圖像識(shí)別結(jié)果的修改處理。
通過(guò)上述的構(gòu)成,本實(shí)施方式的圖像處理系統(tǒng)100能夠去除圖像中所包含的隱秘信息。此外,圖像處理系統(tǒng)100能夠在作業(yè)者用終端裝置106上顯示已去除了隱秘信息的圖像,使得作業(yè)者能夠?qū)λ@示的圖像的識(shí)別結(jié)果進(jìn)行修改作業(yè)。即,能夠以不提供隱秘信息的方式將圖像的識(shí)別結(jié)果的修改作業(yè)委托給外部。此外,圖像處理系統(tǒng)100通過(guò)從去除了隱秘信息的圖像復(fù)原出原來(lái)的圖像,能夠?qū)⑿薷淖鳂I(yè)所輸入的內(nèi)容反映到圖像處理裝置103的識(shí)別結(jié)果中。
參照?qǐng)D2,對(duì)圖像處理裝置系統(tǒng)100的功能進(jìn)行說(shuō)明。圖2表示圖像處理系統(tǒng)100的功能構(gòu)成的一例。
如圖2所示,圖像處理裝置103具備框線檢測(cè)部130、識(shí)別部140、隱秘信息檢測(cè)部150、加工部160以及修改部170,對(duì)所輸入的圖像進(jìn)行圖像處理。
在本實(shí)施方式中,掃描器101讀取到的圖像數(shù)據(jù)被預(yù)先存儲(chǔ)在存儲(chǔ)裝置104中,圖像處理裝置103在被輸入存儲(chǔ)于存儲(chǔ)裝置104的圖像(以下稱(chēng)為原圖像)201時(shí)進(jìn)行圖像處理。另外,也可以根據(jù)需要對(duì)圖像施以二值化等預(yù)處理。
框線檢測(cè)部130對(duì)原圖像201進(jìn)行框線檢測(cè)處理,檢測(cè)表單上的填寫(xiě)框。
框線檢測(cè)部130將檢測(cè)到的填寫(xiě)框的信息即框線信息202存儲(chǔ)于存儲(chǔ)裝置104。
構(gòu)成填寫(xiě)框的框線是直線,因此能夠通過(guò)霍夫變換等來(lái)檢測(cè)。例如,將具有預(yù)定的閾值以上的粗細(xì)度以及長(zhǎng)度的直線確定為框線候選,檢測(cè)框線。此外,可以想到構(gòu)成框線的線段的端點(diǎn)是位于其他框線上的,所以也可以是,從由此檢測(cè)到的直線中僅將端點(diǎn)位于其他直線上的直線篩選為構(gòu)成填寫(xiě)框的框線候選。
此外,在預(yù)先知道表單的構(gòu)造的情況下,也可以預(yù)先設(shè)定填寫(xiě)框的信息,并作為框線信息202存儲(chǔ)在存儲(chǔ)裝置104中。
識(shí)別部140基于框線信息202,制作按照每個(gè)表單的填寫(xiě)框進(jìn)行截取而得到的局部圖像(以下稱(chēng)為截取圖像)。另外,識(shí)別部140基于由后述的修改部170修改過(guò)的填寫(xiě)框來(lái)制作截取圖像的情況也是存在的。
此外,識(shí)別部140進(jìn)行表單圖像以及從表單截取的截取圖像的字符識(shí)別。即,識(shí)別部140從圖像數(shù)據(jù)中檢測(cè)字符串,并識(shí)別檢測(cè)到的字符串。
從圖像中檢測(cè)字符串的方法,例如有將位于由框線檢測(cè)部130檢測(cè)到的填寫(xiě)框的內(nèi)部的字符串視為字符串的方法。或者,在預(yù)先知道表單的構(gòu)造的情況下也可以預(yù)先賦予字符串的位置。
即,識(shí)別部140基于框線信息202,在圖像的填寫(xiě)框中進(jìn)行字符識(shí)別,并輸出識(shí)別結(jié)果203。識(shí)別結(jié)果203包含截取圖像、字符以及字符的位置信息。另外,識(shí)別部140也可以輸出識(shí)別結(jié)果203的可靠度。識(shí)別部140將識(shí)別結(jié)果203存儲(chǔ)于存儲(chǔ)裝置104。
隱秘信息檢測(cè)部150在識(shí)別部140輸出的識(shí)別結(jié)果203所包含的字符信息中,檢測(cè)應(yīng)當(dāng)隱秘的信息(以下稱(chēng)為隱秘信息)204所對(duì)應(yīng)的部分。隱秘信息204中存在有:如例如姓名和住所等個(gè)人信息那樣能夠根據(jù)字符串的內(nèi)容判定出來(lái)的信息、以及如某些密碼那樣難于根據(jù)字符串的內(nèi)容進(jìn)行判斷的信息。
在預(yù)先知道表單的構(gòu)造的情況下,隱秘信息檢測(cè)部150通過(guò)將圖像上的隱秘信息204的字符串位置預(yù)先設(shè)定為知識(shí),由此能夠檢測(cè)隱秘信息204。即,隱秘信息檢測(cè)部150將識(shí)別部140的識(shí)別結(jié)果203的字符串的位置中的、符合預(yù)先設(shè)定的隱秘信息204的字符串位置的字符串的位置判斷為隱秘信息204。
在不知道表單的構(gòu)造的情況下,隱秘信息檢測(cè)部150基于識(shí)別結(jié)果203所包含的字符信息來(lái)檢測(cè)隱秘信息204。例如,也能夠通過(guò)如下等方法進(jìn)行檢測(cè),即,預(yù)先將隱秘信息204的項(xiàng)目名登記為知識(shí),在識(shí)別結(jié)果203所包含的字符與隱秘信息的項(xiàng)目名一致的情況下判定為隱秘信息204。此外,隱秘信息檢測(cè)部150將檢測(cè)到的隱秘信息204保存在存儲(chǔ)裝置104中。
加工部160在檢測(cè)到隱秘信息的情況下,基于檢測(cè)到的隱秘信息204,對(duì)截取圖像的隱秘信息部分進(jìn)行加工處理,制作加工圖像(第1加工圖像)205。
加工部160進(jìn)行的對(duì)隱秘信息部分的加工處理例如為,對(duì)隱秘信息部分的圖像進(jìn)行的消除、弱化、打馬賽克等使圖像的信息量減少的加工;字符位置的重新排序,等等。即,對(duì)加工圖像205中的隱秘信息部分的加工處理是將隱秘信息碎片化的加工,不知道加工部的處理內(nèi)容則無(wú)法根據(jù)加工圖像205分別復(fù)原隱秘信息,但如果知道加工部的處理內(nèi)容,則能夠根據(jù)需要通過(guò)使加工圖像205分別組合來(lái)復(fù)原隱秘信息。另外,加工部160制作出的加工圖像205也有時(shí)會(huì)根據(jù)隱秘信息的碎片化的方法而成為多張。
作為加工處理的具體例子,加工部160對(duì)于電話號(hào)碼等其自身不具有含義的數(shù)字及記號(hào)串,制作將字符以隨機(jī)地選擇的順序重新排序而得到的加工圖像。由此,在后述的修改部170的修改處理中,能夠不對(duì)作業(yè)者提供與原來(lái)的字符串有關(guān)的信息。在圖像數(shù)據(jù)的提供源,將由作業(yè)者輸入的修改數(shù)據(jù)按照原來(lái)的順序重新排序,從而能夠?qū)⒈蛔鞒龅男薷恼_地應(yīng)用于識(shí)別結(jié)果。
加工部160在未檢測(cè)到隱秘信息的情況下,基于框線信息202,制作將截取圖像的除填寫(xiě)框以外的部分去除而得到的框線圖像(第2加工圖像)。
加工部160將制作出的第1加工圖像和第2加工圖像作為加工圖像205存儲(chǔ)在存儲(chǔ)裝置104中。
修改部170對(duì)作業(yè)者用終端裝置106,發(fā)送作業(yè)者進(jìn)行識(shí)別結(jié)果203的修改所需要的數(shù)據(jù)(以下稱(chēng)為修改處理數(shù)據(jù))。所發(fā)送的修改處理數(shù)據(jù)被顯示于作業(yè)者用終端裝置106,作業(yè)者從所顯示的畫(huà)面進(jìn)行識(shí)別結(jié)果203的修改處理。對(duì)作業(yè)者用終端裝置106發(fā)送的修改處理數(shù)據(jù)例如是加工圖像205。根據(jù)需要,除了加工圖像205以外,還可以將由框線檢測(cè)部130檢測(cè)到的框線信息202、識(shí)別結(jié)果203增加到修改處理數(shù)據(jù)中。
作業(yè)者參照作業(yè)者用終端裝置106上顯示的修改處理數(shù)據(jù),進(jìn)行加工圖像205的修改內(nèi)容(修改數(shù)據(jù))的輸入。所輸入的修改數(shù)據(jù)是加工圖像205上顯示的字符的輸入?;蛘撸谧R(shí)別結(jié)果203與加工圖像205一起包含于修改處理數(shù)據(jù)的情況下,輸出進(jìn)行字符的正誤判定及修改的字符。
此外,在加工圖像205是框線圖像的情況下,所輸入的修改數(shù)據(jù)是所顯示的框線的正誤判定以及框線的修改。
修改部170從作業(yè)者用終端裝置106經(jīng)由網(wǎng)絡(luò)105接收修改數(shù)據(jù)。此外,修改部170從加工圖像205和修改數(shù)據(jù)復(fù)原出隱秘信息。
參照?qǐng)D3,對(duì)本實(shí)施方式的圖像處理系統(tǒng)100的動(dòng)作的一例進(jìn)行說(shuō)明。圖3是表示圖像處理系統(tǒng)100的動(dòng)作的一例的流程圖。
首先,掃描器101讀取字符識(shí)別對(duì)象的表單并制作圖像數(shù)據(jù)(步驟s10)。
在圖4中,作為原圖像201的一例,示出了圖像a。圖像a是記載有表格的表單的圖像數(shù)據(jù),在左側(cè)的列中記載有項(xiàng)目名21,在右側(cè)的列中按每個(gè)項(xiàng)目設(shè)有填寫(xiě)欄22,記載有字符。圖像a的第1行的項(xiàng)目名21是會(huì)員編號(hào)。圖像a的第2行的項(xiàng)目名21是姓名。圖像a的第3行的項(xiàng)目21是電話號(hào)碼。
圖像a被輸入至圖像處理裝置103,通過(guò)圖像處理裝置103在存儲(chǔ)裝置104中作為原圖像201存儲(chǔ)。
圖像處理裝置103的框線檢測(cè)部130對(duì)存儲(chǔ)裝置104的原圖像201進(jìn)行框線檢測(cè)處理,檢測(cè)表單的填寫(xiě)框(步驟s20)。
框線檢測(cè)部130按檢測(cè)到的每個(gè)填寫(xiě)框,將包含填寫(xiě)框在原圖像201中的位置信息的框線信息202存儲(chǔ)在存儲(chǔ)裝置104中。
識(shí)別部140制作檢測(cè)到的每個(gè)填寫(xiě)框的截取圖像,并對(duì)制作出的截取圖像進(jìn)行字符識(shí)別處理(步驟s30)。識(shí)別部140將識(shí)別結(jié)果203存儲(chǔ)于存儲(chǔ)裝置104。
圖5中表示本實(shí)施方式中的截取圖像的一例。圖5是從圖像a制作出的截取圖像。如圖5所示,從圖像a制作出截取圖像1~3這3個(gè)截取圖像。
隱秘信息檢測(cè)部150從識(shí)別結(jié)果203的字符檢測(cè)個(gè)人信息等隱秘信息204(步驟s40)。隱秘信息檢測(cè)部150將檢測(cè)到的隱秘信息204存儲(chǔ)在存儲(chǔ)裝置104中。
在檢測(cè)到隱秘信息204的情況下(步驟s50中為是),加工部160基于檢測(cè)到的隱秘信息204,進(jìn)行作為隱秘信息204的檢測(cè)源的、截取圖像的加工(步驟s60)。即,加工部160制作對(duì)被檢測(cè)到了隱秘信息204的截取圖像中的隱秘信息部分進(jìn)行加工而得到的加工圖像205(也稱(chēng)為第1加工圖像)。加工部160將加工圖像205存儲(chǔ)在存儲(chǔ)裝置104中。
使用圖6來(lái)說(shuō)明在截取圖像2中由隱秘信息檢測(cè)部150進(jìn)行的隱秘信息檢測(cè)處理以及由加工部160進(jìn)行的加工處理。圖6是本實(shí)施方式的對(duì)截取圖像2進(jìn)行的隱秘信息檢測(cè)處理和加工處理的概略圖。
如圖6所示,在對(duì)截取圖像2進(jìn)行了步驟s40的隱秘信息檢測(cè)處理時(shí),基于識(shí)別結(jié)果203的字符和與隱秘信息有關(guān)的知識(shí)檢測(cè)到“東芝”和“太郎”這2個(gè)作為隱秘信息204。
基于該隱秘信息檢測(cè)結(jié)果,加工部160對(duì)截取圖像2進(jìn)行加工處理,制作加工圖像205。這里,加工部160進(jìn)行將2個(gè)檢測(cè)到的隱秘信息204的“姓”和“名”中的一方保留而將另一方刪除的加工,制作加工圖像205-1和加工圖像205-2。
返回到圖3的說(shuō)明。修改部170向作業(yè)者用終端裝置106發(fā)送包含對(duì)隱秘信息部分進(jìn)行了加工后的加工圖像205的修改處理數(shù)據(jù)(步驟s70)。另外,修改部170發(fā)送的修改處理數(shù)據(jù)也可以根據(jù)需要而包含框線信息202、識(shí)別結(jié)果203。此時(shí)識(shí)別結(jié)果203所包含的隱秘信息204被進(jìn)行與加工圖像205中的加工同樣的處理,使得隱秘信息不被知道。
作業(yè)者用終端裝置106對(duì)作業(yè)者顯示包含接收到的加工圖像205的修改處理數(shù)據(jù)。基于所顯示的加工圖像205,由作業(yè)者對(duì)作業(yè)者用終端裝置106輸入修改數(shù)據(jù)(步驟s80)。另外,在應(yīng)當(dāng)遵守內(nèi)容相同等一定規(guī)則的加工圖像205有多個(gè)的情況下,也可以將它們重疊或者并列地一次顯示。關(guān)于例如性別等、填寫(xiě)內(nèi)容限于少數(shù)選項(xiàng)的內(nèi)容的項(xiàng)目,通過(guò)將多個(gè)成為同一識(shí)別結(jié)果的加工圖像205重疊或者并列地一次顯示,能夠高效地發(fā)現(xiàn)被誤識(shí)別的少數(shù)的加工圖像205。
作業(yè)者用終端裝置106向圖像處理裝置103發(fā)送由作業(yè)者輸入的修改數(shù)據(jù)(步驟s90)。修改部170基于接收到的修改數(shù)據(jù)、加工圖像205進(jìn)行識(shí)別結(jié)果203的修改處理(步驟s100)。例如,修改部170對(duì)加工圖像205進(jìn)行比對(duì),由此從加工圖像205復(fù)原出截取圖像并且從修改數(shù)據(jù)復(fù)原出隱秘信息。使用隱秘信息被復(fù)原出來(lái)的修改數(shù)據(jù),修改部170修改截取圖像的識(shí)別結(jié)果203。此時(shí)的修改例如有如下方法,即,對(duì)修改數(shù)據(jù)與識(shí)別結(jié)果203分別比較字符,在有不同的字符的情況下,將不同的字符和與該字符對(duì)應(yīng)的部分的圖像顯示于作業(yè)者用終端裝置106,使作業(yè)者選擇某個(gè)。
在從識(shí)別結(jié)果203未檢測(cè)到隱秘信息204的情況下(步驟s50中為否),加工部160對(duì)截取圖像中的除由框線檢測(cè)部130檢測(cè)到的填寫(xiě)框以外的部分進(jìn)行加工處理,制作框線圖像(第2加工圖像)(步驟s110)。即,加工部160對(duì)截取圖像中的除填寫(xiě)框以外的部分進(jìn)行消除、弱化或者改變等加工。
圖7中示出了本實(shí)施方式的制作框線圖像的過(guò)程的示意圖。圖7是表示框線圖像的一例的概略圖。
圖7中的左側(cè)的截取圖像4,是由框線檢測(cè)部130從圖像a截取的局部圖像數(shù)據(jù)的一例。在該截取圖像4中虛線部分被檢測(cè)為填寫(xiě)框。由于填寫(xiě)框的檢測(cè)出錯(cuò),2個(gè)填寫(xiě)框被檢測(cè)成了一個(gè)填寫(xiě)框。因此,進(jìn)行了隱秘信息檢測(cè)處理的結(jié)果為,未檢測(cè)到隱秘信息204。在此情況下,加工部160檢測(cè)截取圖像4中的除填寫(xiě)框以外的像素,并將檢測(cè)到的像素刪除。由此,加工部160制作框線圖像。
修改部170向作業(yè)者用終端裝置106發(fā)送框線圖像(步驟s120)。
作業(yè)者用終端裝置106顯示接收到的框線圖像。作業(yè)者確認(rèn)所顯示的框線圖像,并判定是否需要進(jìn)行被檢測(cè)為填寫(xiě)框的框線的修改。即,在需要進(jìn)行填寫(xiě)框的修改的情況下,由作業(yè)者進(jìn)行框線的修改,并輸入至作業(yè)者用終端裝置106(步驟s130)??蚓€的修改例如能夠通過(guò)如下的方法等來(lái)進(jìn)行,即,在作業(yè)者選擇了作業(yè)者用終端裝置106上顯示的框線圖像上的框線之中的被認(rèn)為錯(cuò)誤的框線時(shí),修改部170將所選擇的框線刪除。
作業(yè)者用終端裝置106向圖像處理裝置103發(fā)送框線的修改數(shù)據(jù)(步驟s140)。
修改部170在接收到框線圖像的修改數(shù)據(jù)時(shí),判定是否進(jìn)行了框線圖像的修改(步驟s150)。在進(jìn)行了框線圖像的修改的情況下(步驟s150中為是),識(shí)別部140基于修改后的框線制作截取圖像,并進(jìn)行字符識(shí)別(步驟s160)。然后,返回到步驟s40,隱秘信息檢測(cè)部150從識(shí)別結(jié)果203檢測(cè)隱秘信息。由此,基于正確的填寫(xiě)框進(jìn)行字符識(shí)別,因此能夠以高精度進(jìn)行隱秘信息的檢測(cè)。
在未被進(jìn)行框線圖像的修改的情況下(步驟s150中為否),即識(shí)別結(jié)果203中不包含隱秘信息204的情況下,而且是正確地檢測(cè)到填寫(xiě)框的情況下,修改部170將作為該框線圖像的加工源的截取圖像向作業(yè)者用終端裝置106發(fā)送(步驟s170)。作業(yè)者基于作業(yè)者用終端裝置106上顯示的截取圖像,進(jìn)行步驟s80以后的處理,進(jìn)行識(shí)別結(jié)果的修改。
如以上說(shuō)明那樣,本實(shí)施方式的圖像處理系統(tǒng)100能夠?qū)崿F(xiàn)包含個(gè)人信息等應(yīng)當(dāng)隱秘的信息的圖像不被提供給外包方的狀態(tài)下的字符識(shí)別結(jié)果的修改作業(yè)。
例如,在檢測(cè)到隱秘信息204并從一個(gè)截取圖像制作多個(gè)加工圖像205的情況下,在圖像處理裝置103對(duì)多個(gè)加工圖像進(jìn)行比對(duì)而復(fù)原出了加工源的原圖像的基礎(chǔ)上,再分別提供給不同的作業(yè)者,由此能夠?qū)€(gè)人信息的修改外包。
另一方面,在隱秘信息檢測(cè)部150未檢測(cè)到隱秘信息204的情況下,有時(shí)是在原圖像201中發(fā)生了框線檢測(cè)部130的框線的檢測(cè)錯(cuò)誤。在此情況下,加工部160制作將隱秘信息檢測(cè)源的截取圖像的除框線以外的成分抹掉后的圖像。制作出的圖像被修改部170向作業(yè)者用終端裝置106發(fā)送而被提示給作業(yè)者。在作業(yè)者基于被提示的圖像選擇了正確的框線時(shí),基于所選擇的框線由字符識(shí)別部120再次進(jìn)行字符識(shí)別。
由此,根據(jù)本實(shí)施方式的圖像處理系統(tǒng)100,能夠防止包含有隱秘信息的圖像被提供給外包方。即,能夠防止由于未正確地檢測(cè)到框線而未正確地檢測(cè)到隱秘信息。
以上,對(duì)本實(shí)施方式的圖像處理系統(tǒng)100進(jìn)行了說(shuō)明,但該實(shí)施方式是作為例子而提示的,無(wú)意限定發(fā)明的范圍。該新的實(shí)施方式能夠以其他各種各樣的方式實(shí)施,在不脫離發(fā)明的主旨的范圍內(nèi),能夠進(jìn)行各種省略、置換、變更。該實(shí)施方式及其變形,包含于發(fā)明的范圍及主旨,并且包含于權(quán)利要求書(shū)所記載的發(fā)明及其等同的范圍中。
例如,加工部160也可以是,對(duì)原圖像201中的電話號(hào)碼等其自身不具有含義的數(shù)字及記號(hào)串,輸出將字符以隨機(jī)地選擇的順序重新排序而得到的1張加工圖像?;蛘撸部梢允?,輸出僅將第奇數(shù)個(gè)字符抹掉而得到的加工圖像和僅將第偶數(shù)個(gè)字符抹掉的加工圖像這2張加工圖像。
由此,在修改處理中不對(duì)作業(yè)者提供與原來(lái)的字符串有關(guān)的信息,在提供源將修改輸入按照原來(lái)的順序重新排序,能夠正確地修改識(shí)別結(jié)果。
此外,作為加工部160的處理的別的例子可以想到,在作為原圖像、同一樣式且記載有不同內(nèi)容的表單的圖像數(shù)據(jù)存在有多個(gè)的情況下,通過(guò)將各個(gè)原圖像中檢測(cè)到的隱秘信息的一部分替換,能夠輸出多個(gè)加工圖像。替換的隱秘信息的位置處于各原圖像的同一位置。
例如,在從2張?jiān)瓐D像分別檢測(cè)到姓名作為隱秘信息的情況下,加工部160將第1張?jiān)瓐D像中包含的姓名中的名的部分刪除并用第2幅原圖像中包含的姓名中的名來(lái)置換。同樣,加工部160將第2幅原圖像中包含的姓名中的名刪除并用第1幅圖像中包含的姓名中的名的圖像來(lái)置換。