信息處理設(shè)備以及信息處理方法
【專利摘要】本發(fā)明提供了一種信息處理設(shè)備和信息處理方法,該設(shè)備包括存儲單元、解釋單元、以及校正單元。所述存儲單元存儲多個校正指令。所述解釋單元解釋存儲在所述存儲單元中的校正指令。所述校正單元根據(jù)由所述解釋單元解釋的所述校正指令來校正識別字符串。所述解釋單元確定所述校正指令的類型,并且根據(jù)所述校正指令的類型來提取包括作為所述校正指令的目標(biāo)的一個或多個字符在內(nèi)的第一字符串和通過對部分或全部的所述第一字符串執(zhí)行轉(zhuǎn)換而獲得的第二字符串。所述校正單元在所述第一字符串存在于所述識別字符串中的情況下,將所述識別字符串內(nèi)的部分或全部所述第一字符串轉(zhuǎn)換為所述第二字符串。
【專利說明】信息處理設(shè)備以及信息處理方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息處理設(shè)備以及信息處理方法。
【背景技術(shù)】
[0002]在日本未經(jīng)審查的專利申請公開文件第2-170292號中描述的字符識別后處理方法的目標(biāo)是,即使從具有多變字符間距的文檔以及混合了“全角(em)”字符、“半角(en)”字符、“倍角”(double “em”)字符等的文檔等中也能采用簡單處理方法高速度和高精確度地讀取字符。字符識別后處理方法從字符串圖案提取單獨的字符以用于識別,從而校正了在字符讀取中由錯誤切分字符引起的錯誤識別結(jié)果。該方法從用于校正被錯誤切分和錯誤識別部分的信息中提取候選字符串集,將正確字符串與該候選字符串集的關(guān)系登記為校正規(guī)貝U,并且將該校正規(guī)則應(yīng)用于識別出的結(jié)果,此后使得能夠?qū)⒃撔U?guī)則內(nèi)的正確字符串替換為其后的字符識別結(jié)果的第一候選字符串。
[0003]在日本未經(jīng)審查的專利申請文件第5-298488號中描述的一種光學(xué)字符閱讀器的目標(biāo)是甚至在沒有字符書寫框的紙片中也能進(jìn)行快速字符讀取。掃描儀在圖像檢測階段光學(xué)地掃描紙片,紙張緩存器存儲紙片圖像。字符切分階段檢測出涉及由從控制部分發(fā)送的格式控制信息指定的在存儲的紙片圖像之內(nèi)的閱讀欄的垂直投影,基于該垂直投影,按照來自紙片圖像的每個字符切分字符圖案并將所切分的字符圖案輸出至識別階段。識別階段通過使用關(guān)于接收的字符圖案的識別詞典來處理字符識別,并將該字符識別結(jié)果輸出到后處理階段。后處理階段在存儲于詞匯字典部分中的詞匯、錯誤字符串、以及源自識別部分的候選字符串之間做比較和核對,判定正確的詞匯,并將正確的詞匯輸出至輸出緩存器。
[0004]在日本未經(jīng)審查的專利申請文件第7-306917號中描述的字符識別裝置的目標(biāo)是,即使當(dāng)字符識別單元使用錯誤的字符切分方法并且不正確地識別合并或分離的字符時用戶未指示字符切分校正方法,也能夠簡單和可靠地識別合并或分離的字符。該字符識別裝置包括:字符識別單元,其識別關(guān)于書寫字符等的字符圖案數(shù)據(jù)的字符;存儲單元,其將由所述字符識別單元識別的識別字符存儲為對應(yīng)于所述字符圖案數(shù)據(jù)的字符以及這些識別字符的候選字符組;字符表格,其包括多個字符并預(yù)先存儲多個字符與不同于這多個字符的組合字符之間的對應(yīng)關(guān)系;以及字符產(chǎn)生單元,其通過參考所述字符表格,基于通過所述字符識別單元獲得并存儲在所述存儲單元中的識別的字符以及針對識別的字符的候選,來產(chǎn)生新的字符。
【發(fā)明內(nèi)容】
[0005]因而,本發(fā)明的目標(biāo)是提供信息處理設(shè)備和信息處理方法,其在執(zhí)行用于校正所識別字符串的處理中,提取對應(yīng)于校正指令類型的第一字符串和第二字符串。
[0006]根據(jù)本發(fā)明的第一方面,提供了一種信息處理設(shè)備,其包括存儲單元、解釋單元、以及校正單元。所述存儲單元存儲多個校正指令。所述解釋單元解釋存儲在所述存儲單元中的校正指令。所述校正單元根據(jù)由所述解釋單元解釋的所述校正指令來校正識別字符串。所述解釋單元確定所述校正指令的類型,并且根據(jù)所述校正指令的類型來提取包括作為所述校正指令的目標(biāo)的一個或多個字符在內(nèi)的第一字符串和通過對所述第一字符串的一部分或全部執(zhí)行轉(zhuǎn)換而獲得的第二字符串。所述校正單元在所述第一字符串存在于所述識別字符串中的情況下,將所述識別字符串內(nèi)的所述第一字符串的一部分或全部轉(zhuǎn)換為所述第二字符串。
[0007]在根據(jù)本發(fā)明的第二方面的所述信息處理設(shè)備中,所述校正指令包括字符合并指令和字符分離指令。所述解釋單元在所述校正指令是字符合并指令的情況下,提取多個字符的串作為所述第一字符串并且提取一個字符作為所述第二字符串。所述解釋單元在所述校正指令是字符分離指令的情況下,提取一個字符作為所述第一字符串并且提取多個字符的串作為所述第二字符串。
[0008]在根據(jù)本發(fā)明的第三方面的所述信息處理設(shè)備中,所述校正指令包括字符交換指令和候選字符增加指令。所述解釋單元在所述校正指令是字符交換指令的情況下,提取包括目標(biāo)字符以及在所述目標(biāo)字符前面和后面的字符在內(nèi)的字符串作為所述第一字符串,并且提取替換字符以及在所述替換字符前面和后面的字符作為所述第二字符串。所述解釋單元在所述校正指令是候選字符增加指令的情況下,提取包括目標(biāo)字符以及在所述目標(biāo)字符前面和后面的字符在內(nèi)的字符串作為所述第一字符串,并且提取作為所述目標(biāo)字符的識別候選而將被增加的字符作為所述第二字符串。
[0009]在根據(jù)本發(fā)明的第四方面的所述信息處理設(shè)備中,所述解釋單元在所述字符合并指令和所述字符分離指令作為所述校正指令而存在的情況下,確定所述字符合并指令的所述第二字符串和所述字符分離指令的所述第一字符串是否彼此相同。
[0010]根據(jù)本發(fā)明的第五方面,一種信息處理方法包括步驟:存儲多個校正指令;解釋存儲的校正指令;以及根據(jù)解釋的校正指令來校正識別字符串。所述解釋步驟確定所述一個校正指令的類型,并且根據(jù)所述校正指令的類型來提取包括作為所述校正指令的目標(biāo)的一個或多個字符在內(nèi)的第一字符串和通過對所述第一字符串的一部分或全部執(zhí)行轉(zhuǎn)換而獲得的第二字符串。所述校正步驟在所述第一字符串存在于所述識別字符串的情況下,將所述識別字符串內(nèi)的所述第一字符串的一部分或全部轉(zhuǎn)換為所述第二字符串。
[0011]根據(jù)本發(fā)明的第一方面的信息處理設(shè)備在執(zhí)行用于校正識別字符串的處理中,可提取對應(yīng)于校正指令類型的第一字符串和第二字符串。
[0012]根據(jù)本發(fā)明的第二方面的信息處理設(shè)備可根據(jù)所述字符合并指令或所述字符分離指令提取所述第一字符串和所述第二字符串。
[0013]根據(jù)本發(fā)明的第三方面的信息處理設(shè)備可根據(jù)字符交換指令或候選字符增加指令提取所述第一字符串和所述第二字符串。
[0014]根據(jù)本發(fā)明的第四方面的信息處理設(shè)備可防止所識別字符的同一字母被所述字符合并指令和所述字符分離指令校正。
[0015]根據(jù)本發(fā)明的第五方面的信息處理方法在執(zhí)行用于校正所識別字符串的處理中,可提取對應(yīng)于校正指令類型的所述第一字符串和所述第二字符串。
【專利附圖】
【附圖說明】
[0016]將基于下列附圖詳細(xì)描述本發(fā)明的示例性實施例,其中:
[0017]圖1是第一示例性實施例的配置示例的示意模塊配置圖;
[0018]圖2是示出第一示例性實施例中的處理示例的流程圖;
[0019]圖3A和圖3B是示出校正指令的示例的說明圖;
[0020]圖4A和圖4B是示出校正參數(shù)的示例的說明圖;
[0021]圖5A和圖5B是示出校正指令的示例的說明圖;
[0022]圖6是示出校正參數(shù)的示例的說明圖;
[0023]圖7是第二示例性實施例的配置示例的示意模塊配置圖;
[0024]圖8是示出第二示例性實施例中的處理示例的流程圖;
[0025]圖9是示出校正指令數(shù)據(jù)的示例的說明圖;
[0026]圖10是第三示例性實施例的配置示例的示意模塊配置圖;
[0027]圖11是示出第三示例性實施例中的處理示例的流程圖;
[0028]圖12是示出校正指令列表的示例的說明圖;
[0029]圖13A、圖13B、圖13C以及圖13D是示出校正指令的示例的說明圖;以及
[0030]圖14是示出實現(xiàn)示例性實施例的計算機的硬件配置的示例的框圖。
【具體實施方式】
[0031]將通過參考附圖在下文中描述本發(fā)明的不同示例性實施例。
[0032]<第一示例性實施例>
[0033]圖1是第一示例性實施例的配置示例的示意模塊配置圖。
[0034]通常,術(shù)語“模塊”是指諸如軟件(計算機程序)、硬件等可邏輯分離的組件。因此,示例性實施例中的模塊不僅涉及計算機程序中的模塊,而且涉及硬件配置中的模塊。因而,通過示例性實施例,描述了使得所述組件用作模塊的計算機程序(使計算機執(zhí)行每個步驟的程序、使計算機用作每個單元的程序、以及使計算機執(zhí)行每個功能的程序)、系統(tǒng)、以及方法。然而,為了描述方便,將使用術(shù)語“存儲”“使某物存儲”,以及其他等同的表達(dá)方式。當(dāng)示例性實施例涉及計算機程序時,這些術(shù)語和表達(dá)方式意即“使存儲裝置存儲”,或“控制存儲裝置以存儲”。模塊和功能可以以一一對應(yīng)的準(zhǔn)則相關(guān)聯(lián)。然而,在實際實施方式中,一個模塊可以通過一個程序?qū)嵤?、多個模塊可以通過一個程序?qū)嵤?,或者一個模塊可以通過多個程序?qū)嵤?。此外,多個模塊可以通過一個計算機執(zhí)行,或者在分布式計算機環(huán)境或并聯(lián)計算機環(huán)境中一個模塊可以通過多個計算機實施。此外,一個模塊可包括另一個模塊。需注意,術(shù)語“連接”在下文中可指邏輯連接(諸如數(shù)據(jù)傳輸、指令、以及數(shù)據(jù)間的交叉引用關(guān)系),也可以指物理連接。術(shù)語“被預(yù)定”意即在目標(biāo)處理被執(zhí)行之前被設(shè)置。根據(jù)處理時的條件和狀態(tài)或根據(jù)處理前一段時間內(nèi)的條件和狀態(tài),只要在執(zhí)行目標(biāo)處理之前被設(shè)置,“被預(yù)定”不僅表示在示例性實施例中的處理之前被設(shè)置,還表示甚至在示例性實施例中的處理開始之后被設(shè)置。當(dāng)存在多個“預(yù)定數(shù)值”時,數(shù)值可能彼此不同,或者兩個或以上的數(shù)值(顯然,包括所有數(shù)值)可以相同。術(shù)語“在A的情況下,B被執(zhí)行”表示“執(zhí)行是否為A的確定,以及當(dāng)確定為A時,B被執(zhí)行”,除非不需要確定是否是A。
[0035]此外,“系統(tǒng)”或者“設(shè)備”不僅可以通過經(jīng)由諸如網(wǎng)絡(luò)(包括一一對應(yīng)的通信連接)之類的通信單元連接的多個計算機、硬件、設(shè)備等實現(xiàn),還可以通過單個計算機、硬件、設(shè)備等實現(xiàn)。術(shù)語“設(shè)備”和“系統(tǒng)”作為同義詞使用。顯然地,術(shù)語“系統(tǒng)”不包括僅被人為布置的社會化“機構(gòu)”(社會系統(tǒng))。
[0036]此外,對于模塊中的每個處理或?qū)τ趫?zhí)行多個處理的模塊中的各個處理而言,從存儲裝置讀取目標(biāo)信息并且在執(zhí)行了該處理之后將處理結(jié)果寫入存儲裝置。因而,在處理被執(zhí)行之前從存儲裝置讀取的描述或在處理被執(zhí)行之后寫入到存儲裝置的描述可以省略。存儲裝置可以是硬盤、隨機存取存儲器(RAM)、外部存儲介質(zhì)、使用通信線路的存儲裝置、中央處理單元(CPU)內(nèi)的寄存器等。
[0037]根據(jù)第一示例性實施例的識別字符串校正模塊120校正識別字符串115 (其是字符識別模塊110的處理結(jié)果),并輸出校正后的識別字符串155。如圖1的示例中所示,識別字符串校正模塊120包括校正指令存儲模塊130、校正指令解釋模塊140、以及校正指令執(zhí)行模塊150。
[0038]字符識別技術(shù)公知是用來辨認(rèn)和識別文件圖像中的字符并將它們轉(zhuǎn)換為字符編碼。
[0039]如果字符是事先被切分為字符的單一單位字符(下文中稱為“單個字符”)或印刷文檔中的字符,則現(xiàn)有的字符識別技術(shù)能夠以相對高的字符識別精確度來識別字符。
[0040]然而,對于采用復(fù)雜排版的文檔或手寫文檔而言,由于單個字符切分錯誤、手寫字符質(zhì)量不一致(字符大小或字符間距不一致)等原因,字符識別的精確度被極大降低并且更多的字符趨于被不正確地識別。
[0041]因而,在字符識別技術(shù)中需要對不正確識別的字符進(jìn)行檢測和校正的技術(shù)。
[0042]字符識別模塊110被連接至識別字符串校正模塊120的校正指令執(zhí)行模塊150。字符識別模塊110接收字符圖像數(shù)據(jù)105,識別字符圖像數(shù)據(jù)105,并且輸出識別字符串115。此處的字符識別可以使用現(xiàn)有識別技術(shù)完成。例如,字符識別模塊110從電子文檔圖像數(shù)據(jù)切分對應(yīng)于字符串的字符圖像數(shù)據(jù)105 ;連續(xù)地從字符圖像數(shù)據(jù)105切分出可切分的單個字符候選區(qū);識別切分的單個字符候選區(qū)的每一個;并輸出作為識別結(jié)果的識別字符串115。
[0043]識別字符串校正模塊120校正已從字符識別模塊110輸出的識別字符串115。
[0044]校正指令存儲模塊130被連接至校正指令解釋模塊140。校正指令存儲模塊130存儲多個校正指令。具體地,校正指令存儲模塊130存儲針對字符串的多個校正方法。校正方法例如可以是任意的下列指令或其組合:字符合并指令、字符分離指令、字符交換指令、以及候選字符增加指令。校正指令包括表示校正字符串的方法的校正命令以及校正命令必需的校正參數(shù)。另外,同一校正指令包括多個不同的對應(yīng)校正參數(shù)。用于校正命令的校正參數(shù)可以是具有多個字符編碼的字符編碼圖案、定義預(yù)定字符編碼的范圍的字符編碼組等。校正命令和對應(yīng)的校正參數(shù)將稍后描述。
[0045]校正指令解釋模塊140被連接至校正指令存儲模塊130以及校正指令執(zhí)行模塊150。校正指令解釋模塊140解釋存儲在校正指令存儲模塊130中的校正指令。在此處執(zhí)行的解釋處理中,判別校正指令的類型,并且根據(jù)該校正指令的類型,提取出具有作為校正指令目標(biāo)的一個或多個字符的第一字符串以及通過對該第一字符串的一部分或全部進(jìn)行轉(zhuǎn)換而獲得的第二字符串。所述第一字符串可以是特定的字符串或由正規(guī)表達(dá)所表示的字符串。
[0046]具體地,校正指令解釋模塊140從存儲在校正指令存儲模塊130中的多種類型的校正指令中確定使用哪種校正指令,并且獲取校正命令和所需的校正參數(shù)(上面提及的第一字符串和第二字符串)。此處執(zhí)行的所述確定包括以預(yù)定順序使用校正指令、判定關(guān)于校正指令的組合是否恰當(dāng)?shù)取?br>
[0047]校正指令解釋模塊140執(zhí)行下列提取處理作為解釋處理。示例在圖13A至圖13D中給出。
[0048]當(dāng)校正指令是合并字符的指令時,多字符的串被提取作為第一字符串并且一個字符被提取作為第二字符串。如圖13A中示例所示,連續(xù)字符串,即字符1310和字符1312,被合并為字符1314。當(dāng)兩個或以上的字符被處理時,該指令被應(yīng)用多次。
[0049]當(dāng)校正指令是分離字符的指令時,一個字符被提取作為第一字符串并且多字符的串被提取作為第二字符串。如圖13B中示例所示,一個字符,即字符1320,被分離為兩個字符,即字符1322和字符1324。當(dāng)字符將被分離為三個或以上字符時,該指令被應(yīng)用多次。
[0050]當(dāng)校正指令是字符交換指令時,包括目標(biāo)字符及其前面和后面字符的字符串被提取作為第一字符串,并且包括替換字符及其前面和后面字符的字符串被提取作為第二字符串。第二字符串內(nèi)的前面和后面的字符串與第一字符串內(nèi)的前面和后面的字符串是相同的。如圖13C中示例所示,字符1330、字符1332、以及字符1334 (目標(biāo)字符1332、其前面字符1330、以及其后面字符1334)被替換為字符1330、字符1336、以及字符1334 (目標(biāo)字符1332被替換為字符1336)。
[0051]當(dāng)校正指令是增加候選字符的指令時,包括目標(biāo)字符及其前面字符和后面字符的字符串被提取作為第一字符串,并且被增加作為目標(biāo)字符的識別候選字符的字符被提取作為第二字符串。如圖13D中示例所示,在字符1340、字符1342、以及字符1344 (目標(biāo)字符1342、其前面字符1340、以及其后面字符1344)的情況下,目標(biāo)字符1342的識別候選字符1346被增加。增加候選字符的目的是,當(dāng)在通過字符識別模塊110執(zhí)行的字符識別處理中預(yù)定數(shù)目的識別候選(例如,僅一個字符)被輸出為針對每個字符圖像的識別候選時,針對容易被不正確識別的字符增加一個候選字符來作為識別字符串115。例如,在通過校正后的識別字符串155的進(jìn)一步語言處理(例如,采用其他語言字典的匹配處理,諸如詞法分析)做出校正的情況下,不是使用校正后的識別字符串155作為最終校正結(jié)果,而是可以增加作為字符識別結(jié)果的字符候選。
[0052]校正指令解釋模塊140進(jìn)行的解釋處理是任意下列指令或其組合:字符合并指令、字符分離指令、字符交換指令、以及字符候選增加指令(例如,字符合并指令和字符分離指令的組合、字符交換指令和字符候選增加指令的組合等)。
[0053]在校正指令包括字符合并指令和字符分離指令的情況下,校正指令解釋模塊140可確定字符合并指令的第二字符串和字符分離指令的第一字符串是否彼此相同。該“確定字符合并指令的第二字符串和字符分離指令的第一字符串是否彼此相同”被這樣做是因為,當(dāng)對同一字符做出合并指令和分離指令時,很有可能沒有做出期望的校正。例如,很有可能返回了最初識別的字符。
[0054]如果第二字符串和第一字符串彼此相同,則可以去除相應(yīng)的合并指令和分離指令之一?;蛘?,可以安排為,對于單個識別字符串115,產(chǎn)生已通過合并指令校正的校正后的識別字符串155和已通過分離指令校正的校正后的識別字符串155。結(jié)果是,這兩個字符串(經(jīng)過合并指令的字符串和經(jīng)過分離指令的字符串)被作為校正結(jié)果輸出。理所應(yīng)當(dāng)?shù)模?dāng)存在多對合并指令和分離指令時,產(chǎn)生了數(shù)目與校正指令和分離指令的組合的數(shù)目相同的校正指令串。結(jié)果是,輸出了其數(shù)目等于該組合的數(shù)目的校正后的識別字符串155。
[0055]校正指令執(zhí)行模塊150被連接至字符識別模塊110和校正指令解釋模塊140。校正指令執(zhí)行模塊150根據(jù)通過校正指令解釋模塊140解釋的校正指令來校正識別字符串115。此處的校正處理,在第一字符串存在于識別字符串115內(nèi)的情況下,將識別字符串115內(nèi)的部分或全部的第一字符串轉(zhuǎn)換為第二字符串。為了獲知“第一字符串存在于識別字符串115內(nèi)的情況”,例如,可以使用圖案匹配處理以從識別字符串中搜索第一字符串。
[0056]換句話說,校正指令執(zhí)行模塊150基于獲取的校正命令和相應(yīng)的校正參數(shù)來確定在識別字符串115內(nèi)是否存在需要校正的字符串,如果這樣的字符串存在,則根據(jù)校正命令和相應(yīng)的校正參數(shù)做出校正。
[0057]圖2是示出通過第一示例性實施例中的識別字符串校正模塊120進(jìn)行的處理示例(識別字符串校正處理的示例)的流程圖。下面描述的處理流程是關(guān)于一個字符串的處理流程的說明,當(dāng)多個字符串被處理時,按照所要求的字符串?dāng)?shù)目來重復(fù)從步驟S202直到步驟S218的處理。
[0058]在步驟S202,校正指令解釋模塊140從存儲在校正指令存儲模塊130中的多個校正指令中選擇一個校正指令。
[0059]在步驟S204,校正指令解釋模塊140解釋在步驟S202中選擇的校正指令的校正命令。如上所述,校正命令表示字符串的校正方法(上面提及的字符合并指令、字符分離指令、字符交換指令、或字符候選增加指令)。此處提及的“解釋”意即確定校正命令表示上述哪種校正方法。根據(jù)校正指令的校正參數(shù)也被提取。
[0060]在步驟S206,校正指令執(zhí)行模塊150從接收自字符識別模塊110的識別字符串115中選擇校正字符串候選。
[0061]在步驟S208,校正指令執(zhí)行模塊150獲取校正指令的校正參數(shù)。校正指令執(zhí)行模塊150從校正指令存儲模塊130獲取在校正指令解釋模塊140解釋的校正命令必需的校正參數(shù)。
[0062]在步驟S210,校正指令執(zhí)行模塊150確定校正字符串候選是否匹配通過校正指令執(zhí)行模塊150獲取的校正參數(shù)。如果校正字符串候選匹配獲取的校正參數(shù),則處理前進(jìn)到步驟S214,并且校正指令執(zhí)行模塊150根據(jù)由已在校正指令解釋模塊140解釋的校正命令表示的校正方法來對校正字符串候選進(jìn)行校正。如果校正字符串候選不匹配獲取的校正參數(shù),則處理進(jìn)入步驟S212。
[0063]在步驟S212,校正指令執(zhí)行模塊150獲取在校正指令解釋模塊140解釋的校正命令的所有不同的校正參數(shù),并且確定是否已做出了與校正字符串候選的匹配確定。如果已對所有獲取的校正參數(shù)做出了匹配確定,則處理前進(jìn)到步驟S216。如果未對所有獲取的校正參數(shù)做出匹配確定,則處理返回到步驟S208并且針對下一個校正參數(shù)重復(fù)步驟S208的處理以及步驟S210的處理。
[0064]在步驟S216,校正指令執(zhí)行模塊150確定是否已處理了針對接收的識別字符串115的所有校正字符串候選。如果存在未處理的校正字符串候選,則處理返回步驟S206,并且針對新的校正字符串候選,重復(fù)從步驟S206直到步驟S214的處理。如果已處理了所有校正字符串候選,則處理前進(jìn)到步驟S218。
[0065]在步驟S218,校正指令執(zhí)行模塊150確定是否已完成針對存儲在校正指令存儲模塊130中的所有校正指令的處理。如果所有校正指令已完成,則校正指令執(zhí)行模塊150針對接收自字符識別模塊110的識別字符串115,輸出校正后的識別字符串155。如果存在未處理的校正指令,則處理進(jìn)入步驟S202并且針對下一個校正指令重復(fù)從步驟S202直到步驟S216的處理。
[0066]圖3A和圖3B示出了存儲在校正指令存儲模塊130中的校正指令(校正命令和校正參數(shù))的具體示例。
[0067]圖3A和圖3B示出了作為校正指令之一的“合并指令”的具體示例。圖3A中所示的“C0RRECT_MERGE”表示校正命令,圖3B中所示的字符編碼串“0x30a30x4e4d0x4f5c”表示校正命令“C0RRECT_MERGE”必需的校正參數(shù)。在該示例中,“0x30a30x4e4d”是第一字符串,而“0x4f5c”是第二字符串。圖3A和圖3B中所示的“合并指令”表示“如果字符編碼03x30a3 (左部分)和字符編碼0X4e4d (右部分)被放在一起,則這些碼被合并為字符編碼0x4f5c (左部分和右部分合并在一起)”的校正被執(zhí)行。如已經(jīng)描述的那樣,校正指令存儲模塊130被配置為不僅存儲圖3B中所示的字符編碼串、而且存儲多個參數(shù)作為對應(yīng)于校正命令“C0RRECT_MERGE”的校正參數(shù),所述多個參數(shù)例如為,如圖4A和圖4B中所示,圖4A中的“0x30a30x30d20x5316”,其為“如果字符編碼0x30a3 (左部分)和字符編碼0x30d2 (右部分)被放在一起,則這些碼被合并為字符編碼0x5316 (左部分和右部分合并在一起)”,圖4B中的“0x30b70x4e3b0x6ce8”,其為“如果字符編碼0x30b7 (左部分)和字符編碼0x4e3b(右部分)被放在一起,則這些碼被合并為字符編碼0x6ce8 (左部分和右部分合并在一起)”,
坐坐寸寸ο
[0068]圖5A和圖5B示出了校正指令之一的“交換指令”的具體示例。正如圖3A和圖3B中所示的“合并指令”的示例一樣,圖5A中所示的“CORRECT_EXCHANGE”表示校正命令,并且圖5B 中所示的字符編碼串 “ 0x30cd0x30c80x30c40x30c3 ” 表示校正命令“ CORRECT_EXCHANGE ”必需的校正參數(shù)。在該示例中,“0x30cd0x30c80x30c4”是第一字符串,而“0x30c3”是第二字符串。圖5A和圖5B中所示的“交換指令”表示“在0x30cd (左部分)和0x30c8 (右部分)之間夾入的0x30c4(中間部分)被替換為0x30c3(小字號的中間部分)”的校正被執(zhí)行。如圖3A和圖3B以及圖4A和圖4B,針對校正命令“CORRECT_EXCHANGE”,多個校正參數(shù)被存儲在校正指令存儲模塊130中,并且如圖6所示,例如,存儲了諸如“0xffl30x67080x30ab0x30f5”之類的校正參數(shù),其意即“在0xffl3 (左部分)和0x6708 (右部分)之間夾入的0x30ab (中間部分)被替換為0x30f5 (小字號的中間部分)”。自然,多個校正參數(shù)被存儲在校正指令存儲模塊130中。
[0069]<第二示例性實施例>
[0070]在下面描述的第二示例性實施例中,將識別字符串校正模塊120與校正指令分離,以使得能夠在不用修改識別字符串校正模塊120自身的情況下增加/刪除校正指令。
[0071]圖7是第二示例性實施例的配置示例的示意模塊配置圖。以相同的參考標(biāo)記指代類似于第一示例性實施例中的部分,并且多余的說明將被省略(下文中同樣如此)。校正指令接收模塊730被連接至校正指令解釋模塊140以及校正指令數(shù)據(jù)710。
[0072]如圖7中示例所示,類似于第一示例性實施例中的字符識別設(shè)備,在第二示例性實施例中的字符識別設(shè)備包括字符識別模塊I1以及識別字符串校正模塊120。在第二示例性實施例中的識別字符串校正模塊120包括:校正指令接收模塊730,其從外部校正指令數(shù)據(jù)710接收校正指令;校正指令解釋模塊140,其解釋接收的校正指令;以及校正指令執(zhí)行模塊150,其針對接收自字符識別模塊110的識別字符串115執(zhí)行所解釋的校正指令。校正指令解釋模塊140以及校正指令執(zhí)行模塊150類似于在本發(fā)明的第一示例性實施例中描述的那些模塊。
[0073]圖8是示出第二示例性實施例中的識別字符串校正模塊120的處理示例(識別字符串校正處理的示例)的流程圖。對于作為如圖7中所示的存儲在校正指令數(shù)據(jù)710中的外部數(shù)據(jù)的校正指令而言,一條校正指令數(shù)據(jù)包括,例如,校正命令和校正命令必需的校正參數(shù),如圖9中所示。換句話說,每個校正指令包括校正命令和校正參數(shù)。
[0074]在步驟S802,校正指令接收模塊730從校正指令數(shù)據(jù)710接收校正指令。
[0075]在步驟S804,校正指令解釋模塊140解釋接收的校正指令。換句話說,校正指令解釋模塊140確定校正指令數(shù)據(jù)710中的校正命令表示哪種校正方法并且獲取相應(yīng)的校正參數(shù)。
[0076]在步驟S806,校正指令執(zhí)行模塊150從接收自字符識別模塊的識別字符串115中選擇校正字符串候選。
[0077]在步驟S808,校正指令執(zhí)行模塊150確定校正字符串候選是否匹配校正參數(shù)。如果校正字符串候選匹配校正參數(shù),則處理前進(jìn)到步驟S810,并且校正指令執(zhí)行模塊150根據(jù)由已在校正指令解釋模塊140解釋的校正命令表示的校正方法來對校正字符串候選進(jìn)行校正。如果校正字符串候選不匹配校正參數(shù),則處理返回步驟S802,并且針對在校正指令數(shù)據(jù)710中的新的校正指令,重復(fù)從步驟S802直到步驟S806的處理。
[0078]在步驟S812,校正指令執(zhí)行模塊150確定是否已經(jīng)處理了針對接收的識別字符串115的所有校正字符串候選。如果存在未處理的校正字符串候選,則處理返回步驟S806,并且針對新的校正字符串候選,重復(fù)從步驟S806直到步驟S810的處理。如果已處理所有的校正字符串候選,則處理前進(jìn)到步驟S814。
[0079]在步驟S814,校正指令執(zhí)行模塊150確定是否已完成針對所有校正指令數(shù)據(jù)710的處理。如果已完成針對所有校正指令數(shù)據(jù)710的處理,則校正指令執(zhí)行模塊150針對接收自字符識別模塊110的識別字符串115,輸出校正后的識別字符串155。如果存在未處理的校正指令數(shù)據(jù)710,則處理返回步驟S802并且針對下一個校正指令數(shù)據(jù)710,重復(fù)從步驟S802直到步驟S812的處理。
[0080]在第二示例性實施例中,將校正指令數(shù)據(jù)710布置在識別字符串校正模塊120的外部以將校正指令與識別字符串校正模塊120分開,由此使得不用修改識別字符串校正模塊120就能增加/刪除校正指令。通過這種布置,對錯誤識別的新校正變得容易。
[0081]〈第三示例性實施例〉
[0082]圖10是第三示例性實施例的配置示例的示意模塊配置圖。識別字符串校正模塊120包括校正指令接收模塊1020、校正指令存儲模塊1030、校正指令解釋模塊140、以及校正指令執(zhí)行模塊150。校正指令接收模塊1020被連接至校正指令存儲模塊1030以及校正指令列表1010。校正指令存儲模塊1030被連接至校正指令解釋模塊140以及校正指令接收模塊1020。
[0083]如圖10所示,類似于第一示例性實施例,在第三示例性實施例中,字符識別模塊110與識別字符串校正模塊120連接。在第三示例性實施例中的識別字符串校正模塊120包括:校正指令接收模塊1020,其接收作為外部文件的校正指令列表1010 ;校正指令存儲模塊1030,其基于預(yù)定的數(shù)據(jù)結(jié)構(gòu)存儲由校正指令接收模塊1020接收的校正指令列表1010 ;校正指令解釋模塊140,其解釋所接收的校正指令;以及校正指令執(zhí)行模塊150,其針對從字符識別模塊110接收的識別字符串115執(zhí)行所解釋的校正指令。
[0084]校正指令接收模塊1020讀取作為識別字符串校正模塊120的外部文件的校正指令列表1010,并且基于預(yù)定的數(shù)據(jù)結(jié)構(gòu),在校正指令存儲模塊1030中存儲表示多個校正指令的校正命令以及校正命令必需的校正參數(shù)。
[0085]校正指令存儲模塊1030基于預(yù)定的數(shù)據(jù)格式存儲校正指令。在校正指令存儲模塊1030中的數(shù)據(jù)格式可以是,例如,如圖9所示的僅包括校正命令和校正參數(shù)的簡單數(shù)據(jù)列表結(jié)構(gòu)。然而,在校正指令數(shù)目非常龐大的情況下,優(yōu)選地使用諸如散列數(shù)據(jù)結(jié)構(gòu)(hashdata structure)之類的實現(xiàn)高效搜索的數(shù)據(jù)結(jié)構(gòu)。
[0086]圖11是示出了第三示例性實施例中的識別字符串校正模塊120的處理示例(識別字符串校正處理的示例)的流程圖。在此處的處理示例中,說明了第三示例性實施例中的識別字符串校正模塊120所進(jìn)行的識別字符串校正處理的示例,其中校正指令存儲模塊1030的數(shù)據(jù)結(jié)構(gòu)是散列結(jié)構(gòu),在該結(jié)構(gòu)中作為校正參數(shù)的字符編碼被用作關(guān)鍵字而校正命令是值。
[0087]在步驟S1102,校正指令解釋模塊140將從字符識別模塊110接收的識別字符串115的目標(biāo)字符的字符編碼用作關(guān)鍵字,并且搜索存儲在校正指令存儲模塊1030中的校正命令。
[0088]在步驟1104,校正指令解釋模塊140在存在與關(guān)鍵字匹配的校正命令的情況下前進(jìn)到步驟1108,并在不存在與關(guān)鍵字匹配的校正命令的情況下,校正指令解釋模塊140前進(jìn)到識別字符的下一個目標(biāo)(步驟S1106)并且重復(fù)步驟S1102的處理。
[0089]在步驟S1108,校正指令解釋模塊140在發(fā)現(xiàn)的校正命令之中選擇預(yù)定的校正命令。校正命令的選擇應(yīng)當(dāng)遵循諸如已預(yù)先確定的校正指令的執(zhí)行順序之類的規(guī)則。
[0090]在步驟S1110,校正指令解釋模塊140解釋選擇的校正命令。換句話說,校正指令解釋模塊140確定校正命令表示的哪種校正方法,并且獲取與存儲在校正指令存儲模塊1030中的校正命令關(guān)聯(lián)的對應(yīng)校正參數(shù)。
[0091]在步驟S1112,校正指令執(zhí)行模塊140從接收自字符識別模塊110的識別字符串115中選擇在步驟1110解釋的校正命令所必需的校正字符串候選。
[0092]在步驟SI 114,校正指令執(zhí)行模塊150確定校正字符串候選是否匹配校正參數(shù)。如果校正字符串候選匹配校正參數(shù),則處理前進(jìn)到步驟S1116,并且校正指令執(zhí)行模塊150根據(jù)由已在校正指令解釋模塊140解釋的校正命令表示的校正方法來對校正字符串候選進(jìn)行校正。如果校正字符串候選不匹配校正參數(shù),則處理前進(jìn)到識別字符的下一個目標(biāo)(步驟S1106)。處理返回步驟S1102并且重復(fù)從步驟S1102直到步驟S1112的處理。
[0093]在步驟S1118,校正指令執(zhí)行模塊150確定是否已處理了針對接收的識別字符串115的所有校正字符串候選。如果存在未處理的字符串候選,則處理前進(jìn)到識別字符的下一個目標(biāo)(步驟S1106)。處理返回步驟S1102并且重復(fù)從步驟S1102直到步驟S1116的處理。如果已處理了所有校正字符串候選,則處理前進(jìn)到步驟S1120。
[0094]在步驟S1120,校正指令執(zhí)行模塊150確定是否已完成識別字符串115必需的所有校正指令的處理。如果所有的校正指令已完成,則校正指令執(zhí)行模塊150針對接收自字符識別模塊110的識別字符串115,輸出校正后的識別字符串155。如果存在未處理的校正指令,則處理返回識別字符串115的開始(步驟S1122)并重復(fù)從步驟S1102直到步驟S1118的處理。
[0095]圖12示出了在第三示例性實施例中的校正指令列表1010的具體示例,其被準(zhǔn)備為外部文件。
[0096]在圖12中所示的校正指令列表1010的具體示例中,在列表的第一行和最后一行分別描述了 “ START ”和“END ”。在第一行的“ START ”表示接下來的描述是校正指令列表的主體并且“START”之前的描述不涉及。同樣,最后一行的“END”表示直到“END”為止的描述是校正指令列表主體并且在“END”之后的描述不涉及。“START”之前或“END”之后可具有對用戶有用的信息,例如,校正指令列表的版本信息或校正指令列表主體的描述方法。
[0097]在“START”和“END”之間的夾入部分是校正指令列表主體,其每行具有“校正命令”和相應(yīng)的校正命令必需的“校正參數(shù)”。例如,有如下校正指令:“左側(cè)部分”彳和“右側(cè)部分”匕兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”化;“左側(cè)部分M和“右側(cè)部分”壬兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”任;“左側(cè)部分”彳和“右側(cè)部分”左兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”佐;“左側(cè)部分”彳和“右側(cè)部分”右兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”佑;“左側(cè)部分”彳和“右側(cè)部分”乍兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”作;“左側(cè)部分” 和“右側(cè)部分”主兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”注;“左側(cè)部分” 和“右側(cè)部分”隼兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”準(zhǔn);“左側(cè)部分” '>和“右側(cè)部分”皮兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”波;“左側(cè)部分” 和“右側(cè)部分”舌兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”活;“左側(cè)部分” 和“右側(cè)部分”凡兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”汎;“左側(cè)部分” 和“右側(cè)部分”太兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”汰;“左側(cè)部分” '>和“右側(cè)部分”及兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”汲;“左側(cè)部分” '>和“右側(cè)部分”屯兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”沌;“左側(cè)部分” '>和“右側(cè)部分”中兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”沖左側(cè)部分”'> 和“右側(cè)部分”少兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”沙;“左側(cè)部分” 和“右側(cè)部分”尺兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”沢;“左側(cè)部分” 和“右側(cè)部分”末兩個字符被合并為“通過將這兩個字符組合在一起獲得的一個字符”沫;以及“左側(cè)字符” +、“中間字符” 以及“右側(cè)字符”卜這三個字符被替換為“通過在中間字符采用小字號的情況下將這三個字符組合在一起而獲得的一個字符”專'7卜。
[0098]在第三示例性實施例中的校正指令接收模塊1020讀取夾在“START”和“END”之間的每行,將讀取的行轉(zhuǎn)換為預(yù)定數(shù)據(jù)結(jié)構(gòu)(例如,散列結(jié)構(gòu))并將具有預(yù)定數(shù)據(jù)結(jié)構(gòu)的轉(zhuǎn)換后的數(shù)據(jù)存儲到校正指令存儲模塊1030。
[0099]在第三示例性實施例中,校正指令列表1010被布置在識別字符串校正模塊120的外部,以將校正指令與識別字符串校正模塊120分開,由此使得不用修改識別字符串校正模塊120就可增加/刪除校正指令。通過這種布置,對錯誤識別的新校正變得容易。此外,即使在校正指令數(shù)目增加的情況下,也能夠通過在校正指令存儲模塊1030中保留預(yù)定數(shù)據(jù)結(jié)構(gòu)的校正指令以抑制對校正錯誤識別的處理時間的增加。
[0100]參考圖14的同時,也將對示例性實施例的信息處理設(shè)備的硬件配置示例說明如下。圖14所示的配置包括,例如,個人計算機(PC)等,其包括諸如掃描儀之類的數(shù)據(jù)讀取部分1417以及諸如打印機之類的數(shù)據(jù)輸出部分1418。
[0101]中央處理單元(CPU) 1401是根據(jù)描述了在上述示例性實施例中說明的不同模塊(即,字符識別模塊110、識別字符串校正模塊120、校正指令存儲模塊130、校正指令解釋模塊140、校正指令執(zhí)行模塊150、校正指令接收模塊730、校正指令接收模塊1020、以及校正指令存儲模塊1030)的執(zhí)行序列的計算機程序來執(zhí)行處理的控制器。
[0102]只讀存儲器(ROM) 1402存儲CPU1401使用的程序和操作參數(shù)。隨機存取存儲器(RAM) 1403存儲在CPU1401的執(zhí)行過程中使用的程序以及參數(shù)等,其在CPU1401的執(zhí)行過程中以適當(dāng)?shù)姆绞阶兓PU1401、R0M1402、以及RAM1403通過包括CPU總線等的主機總線1404彼此連接。
[0103]主機總線1404經(jīng)由橋接器1405連接至外部總線1406,例如,外部部件互連/接口(PCI)總線。
[0104]鍵盤1408和指示裝置1409 (例如鼠標(biāo))是操作者操作的輸入裝置。顯示器1410可以是液晶顯示器、陰極射線管顯示器(CRT)等,其以文本或圖像的形式顯示各種類型的信肩、O
[0105]硬盤驅(qū)動器(HDD) 1411具有內(nèi)建的硬盤,其驅(qū)動該硬盤并記錄或再現(xiàn)由CPU1401執(zhí)行的程序和信息。在該硬盤中存儲了識別字符串115、校正后的識別字符串155、校正指令。該硬盤也存儲包括其它各種數(shù)據(jù)處理程序的各種計算機程序。
[0106]驅(qū)動器1412讀取記錄在插入式可移除記錄介質(zhì)1413 (例如,磁盤、光盤、磁光盤、或半導(dǎo)體存儲器)中的數(shù)據(jù)或程序,并將數(shù)據(jù)和程序提供給經(jīng)由接口 1407、外部總線1406、橋接器1405、以及主機總線1404連接的RAM1403??梢瞥涗浗橘|(zhì)1413可如硬盤那樣用作數(shù)據(jù)存儲區(qū)。
[0107]連接端口 1414是允許連接至外部連接裝置1415并具有針對USB、IEEE1394等的連接部分的端口。連接端口 1414經(jīng)由接口 1407、外部總線1406、橋接器1405、主機總線1404等連接至CPU1401等。通信部分1416連接至通信線路,其執(zhí)行與外部的數(shù)據(jù)通信處理。數(shù)據(jù)讀取部分1417例如是掃描儀,并且執(zhí)行文檔的讀取處理。數(shù)據(jù)輸出部分1418例如是打印機,并且執(zhí)行文檔數(shù)據(jù)的輸出處理。
[0108]圖14所示的信息處理設(shè)備的硬件配置示例是配置的一個示例,并且示例性實施例不必限于圖14所示的配置。只要其能夠執(zhí)行在任意前述示例性實施例中描述的模塊,可以是任何配置。例如,部分模塊可以通過專用硬件配置,例如,專用集成電路,或者部分模塊可以布置在內(nèi)部系統(tǒng)內(nèi)并通過通信線路連接。作為替代,圖14所示的多個系統(tǒng)可以經(jīng)由通信線路彼此連接以便在協(xié)作中相互操作。此外,這些系統(tǒng)可以集成在復(fù)印機、傳真機、掃描儀、打印機、或多功能機器(具有掃描儀、打印機、復(fù)印機、傳真機等之中兩個或以上功能的圖像處理設(shè)備)中。
[0109]在上面提及的示例性實施例中,給出字符圖像數(shù)據(jù)105以作為字符識別模塊110的識別目標(biāo),然而,識別目標(biāo)可以是在線字符識別中手寫順序的矢量數(shù)據(jù)。在這種情況下,字符識別模塊110可以針對手寫順序的矢量數(shù)據(jù)來執(zhí)行書寫字符識別處理。
[0110]在字符合并指令、字符分離指令、字符交換指令、以及字符候選增加指令之間,預(yù)定類型的校正指令可以被首先執(zhí)行。例如,可以讓字符候選增加指令在其它校正指令之前執(zhí)行。換句話說,在字符候選增加指令被執(zhí)行之后的字符串(目標(biāo)字符在其中已被替換為增加的字符的字符串)可以作為另一個識別字符串115而被識別字符串校正模塊120處理。
[0111]上述程序可以存儲在記錄介質(zhì)上并提供,或者該程序可以通過通信提供。在這種情況下,例如,上述程序可以認(rèn)為是“記錄了程序的計算機可讀取記錄介質(zhì)”的發(fā)明。
[0112]“記錄了程序的計算機可讀取的記錄介質(zhì)”意即計算機可讀取的記錄介質(zhì),其記錄程序,用于程序的安裝、執(zhí)行、以及分發(fā)。
[0113]記錄介質(zhì)是例如數(shù)字多功能盤(其包括DVD論壇設(shè)置的標(biāo)準(zhǔn)“DVD-R、DVD-RW、DVD-RAM等”,以及DVD+RW設(shè)置的標(biāo)準(zhǔn)“DVD+R、DVD+RW等”)、光盤(CD)(其包括只讀存儲器(⑶-ROM)、可錄式⑶(⑶-R)、可重寫式⑶(⑶-RW)等)、藍(lán)光盤?、磁光盤(MO)、軟盤(FD)、磁帶、硬盤、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPR0M?)、閃速存儲器、隨機存取存儲器(RAM)、安全數(shù)字(SD)存儲卡,等等。
[0114]上述程序或部分程序可以記錄在上述記錄介質(zhì)上,被存儲并分發(fā)。此外,該程序可以通過通信傳輸,例如,用于局域網(wǎng)(LAN)、城域網(wǎng)(MAN)、廣域網(wǎng)(WAN)、互聯(lián)網(wǎng)、內(nèi)聯(lián)網(wǎng)、夕卜聯(lián)網(wǎng)等的有線網(wǎng)絡(luò)或無線通信網(wǎng)絡(luò),或者上述網(wǎng)絡(luò)組合的傳輸介質(zhì)。作為替代,該程序或部分程序可以通過載波發(fā)送。
[0115]上述程序可以是另一個程序的部分或者可以與不同程序一起記錄在記錄介質(zhì)上。同樣,所述程序可以被分割并記錄在多個記錄介質(zhì)上。只要它們是可重新存儲的,它們可以以任何格式存儲,例如壓縮或加密。
[0116]本發(fā)明的示例性實施例的前述描述被提供作為示出和描述的目的。其并非意在窮舉或?qū)⒈景l(fā)明限制為所公開的精確形式。顯然,很多修改和變化對于本領(lǐng)域的技術(shù)人員是很明顯的。實施例被選取和描述以便最佳地說明本發(fā)明的原理及其實際應(yīng)用,由此使得本領(lǐng)域的其他技術(shù)人員理解本發(fā)明的不同實施例并且各種修改同樣適用于所構(gòu)思的特定用途。本發(fā)明的范圍由權(quán)利要求及其等同物限定。
【權(quán)利要求】
1.一種信息處理設(shè)備,其包括: 存儲單元,其存儲多個校正指令; 解釋單元,其解釋存儲在所述存儲單元中的校正指令;以及 校正單元,其根據(jù)由所述解釋單元解釋的所述校正指令,來校正識別字符串, 其中所述解釋單元確定所述校正指令的類型,并且根據(jù)所述校正指令的類型來提取第一字符串和第二字符串,所述第一字符串包括作為所述校正指令的目標(biāo)的一個或多個字符,所述第二字符串是通過對所述第一字符串的一部分或全部執(zhí)行轉(zhuǎn)換而獲得的,并且其中在所述第一字符串存在于所述識別字符串中的情況下,所述校正單元將所述識別字符串內(nèi)的所述第一字符串的一部分或全部轉(zhuǎn)換為所述第二字符串。
2.根據(jù)權(quán)利要求1所述的信息處理設(shè)備, 其中所述校正指令包括字符合并指令和字符分離指令, 其中在所述校正指令是字符合并指令的情況下,所述解釋單元提取多個字符的串作為所述第一字符串并且提取一個字符作為所述第二字符串,并且 其中在所述校正指令是字符分離指令的情況下,所述解釋單元提取一個字符作為所述第一字符串并且提取多個字符的串作為所述第二字符串。
3.根據(jù)權(quán)利要求1或2所述的信息處理設(shè)備, 其中所述校正指令包括字符交換指令和候選字符增加指令, 其中在所述校正指令是字符交換指令的情況下,所述解釋單元提取包括目標(biāo)字符以及在所述目標(biāo)字符前面和后面的字符在內(nèi)的字符串作為所述第一字符串,并且提取替換字符以及在所述替換字符前面和后面的字符作為所述第二字符串,并且 其中在所述校正指令是候選字符增加指令的情況下,所述解釋單元提取包括目標(biāo)字符以及在所述目標(biāo)字符前面和后面的字符在內(nèi)的字符串作為所述第一字符串,并且提取作為所述目標(biāo)字符的識別候選而將被增加的字符作為所述第二字符串。
4.根據(jù)權(quán)利要求2或?qū)?quán)利要求2進(jìn)行引用的權(quán)利要求3所述的信息處理設(shè)備, 其中在所述字符合并指令和所述字符分離指令作為所述校正指令而存在的情況下,所述解釋單元確定所述字符合并指令的所述第二字符串和所述字符分離指令的所述第一字符串是否彼此相同。
5.一種信息處理方法,其包括步驟: 存儲多個校正指令; 解釋存儲的校正指令;以及 根據(jù)所解釋的校正指令來校正識別字符串, 其中所述解釋步驟確定所述校正指令的類型,并且根據(jù)所述校正指令的類型來提取第一字符串和第二字符串,所述第一字符串包括作為所述校正指令的目標(biāo)的一個或多個字符,所述第二字符串是通過對所述第一字符串的一部分或全部執(zhí)行轉(zhuǎn)換而獲得的,并且其中在所述第一字符串存在于所述識別字符串的情況下,所述校正步驟將所述識別字符串內(nèi)的所述第一字符串的一部分或全部轉(zhuǎn)換為所述第二字符串。
【文檔編號】G06K9/20GK104346611SQ201410083844
【公開日】2015年2月11日 申請日期:2014年3月7日 優(yōu)先權(quán)日:2013年8月6日
【發(fā)明者】久保田聰, 木村俊一 申請人:富士施樂株式會社