欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

字典創(chuàng)建裝置、識(shí)別裝置及識(shí)別方法

文檔序號(hào):6578127閱讀:141來源:國知局
專利名稱:字典創(chuàng)建裝置、識(shí)別裝置及識(shí)別方法
技術(shù)領(lǐng)域
這里所討論的實(shí)施例旨在提出一種字典創(chuàng)建裝置、識(shí)別裝置及識(shí)別方法。
背景技術(shù)
近來,隨著裝有^W象頭的移動(dòng)終端(下文中的"拍照電話")的廣泛 使用,對(duì)由攝像頭所拍攝的圖像中的字符或字母進(jìn)行識(shí)別或翻譯、或者基 于字符識(shí)別的輸入結(jié)果來對(duì)信息進(jìn)行檢索的需求增加。
為了滿足這種需求,拍照電話中通常裝有光學(xué)字符讀取器(OCR)。
同時(shí),重要的是,帶有OCR的移動(dòng)終端應(yīng)當(dāng)具有《更攜性。因此,與 諸如個(gè)人計(jì)算機(jī)(PC)的固定終端不同的是,必須減小存儲(chǔ)器的印刷電 路板及中央處理單元(CPU)的尺寸以減小移動(dòng)終端的尺寸。相應(yīng)的是, 在安裝OCR時(shí),硬件性能受到限制。
因?yàn)檫@種限制,在用于移動(dòng)終端的OCR中使用簡單的字符識(shí)別系統(tǒng)。 通常,在示例性字符識(shí)別系統(tǒng)中,存儲(chǔ)每個(gè)字符的平均向量,并計(jì)算作為 識(shí)別對(duì)象的所輸入的字符的特征向量與存儲(chǔ)在字符識(shí)別字典中的、每個(gè)字 符的平均向量之間的距離。然后,將其平均向量與所輸入的字符的特征向 量的距離最小的字符視為識(shí)別結(jié)果(例如,參見日本特開平第05-46812 號(hào)公報(bào))。
然而,日本特開平第05-46812號(hào)公才艮中的字符識(shí)別系統(tǒng)固有的字符 識(shí)別準(zhǔn)確度有限。
即,作為識(shí)別對(duì)象的所輸入的字符的字體不一定是固定類型的字體之 一。盡管能夠以一定的準(zhǔn)確度對(duì)預(yù)先學(xué)習(xí)過的字體進(jìn)行識(shí)別,但是在輸入 未經(jīng)學(xué)習(xí)的字體時(shí),不能iiJ'j令人滿意的字符識(shí)別準(zhǔn)確度。
為了實(shí)現(xiàn)高準(zhǔn)確度的字符識(shí)別,除了字符的平均向量之外,還可以使 用由協(xié)方差矩陣所定義的 £值及本征向量來進(jìn)行字符識(shí)別。在這種情況 下,需要其中存儲(chǔ)有每個(gè)字符的^值及本征向量的字符識(shí)別字典。該字典的量變得非常大,因此該字典難以安裝在移動(dòng)終端中。
尤其是,在字苻為漢字時(shí),要被登記在字典中的字符的總數(shù)約為
4000,因而將這么多字符的本征值及本征向量登記在用于移動(dòng)終端的 OCR的字典中是不可行的。
由于這個(gè)原因,在移動(dòng)終端中裝有字符識(shí)別裝置時(shí),如何在實(shí)現(xiàn)高準(zhǔn) 確度的字符識(shí)別能力的同時(shí)減小字典的量成為問題。對(duì)于進(jìn)行使用類別概 率分布的模式識(shí)別(例如,人臉圖像識(shí)別)的情況以及進(jìn)行作為模式識(shí)別 的字符識(shí)別的情況,這個(gè)問^l^艮普遍的。

發(fā)明內(nèi)容
本發(fā)明的目的是至少部分地解決傳統(tǒng)技術(shù)中的問題。
根據(jù)實(shí)施例的一方面,字典創(chuàng)建裝置包括特征量計(jì)算單元,其基于 用于創(chuàng)建模式識(shí)別字典的訓(xùn)練數(shù)據(jù)來計(jì)算作為識(shí)別項(xiàng)的、每個(gè)類別的特征 量;分布輪廓計(jì)算單元,其基于由所述特征量計(jì)算單元所計(jì)算出的、每個(gè) 類別的所述特征量來計(jì)算每個(gè)類別的所述特征量的組的分布輪廓;距離計(jì)
算單元,其基于由所述分布輪廓計(jì)算單元所計(jì)算出的、每個(gè)類別的所述特 征量的所述組的所述分布輪廓來計(jì)算各自的類別的所述分布輪廓之間的
距離;聚類對(duì)象確定單元,其基于由所^巨離計(jì)算單元所計(jì)算出的、各自 的類別的所述分布輪廓之間的所^JE巨離來確定作為聚類對(duì)象的分布輪廓; 典型分布輪廓確定單元,其確定代表由所述聚類對(duì)象確定單元所確定的所 述聚類對(duì)象的所述分布輪廓的典型分布輪廓;聚類單元,其將被所述聚類 對(duì)象確定單元確定為所述聚類對(duì)象的所述分布輪廓聚類;關(guān)聯(lián)單元,其將
單元所進(jìn)行的所述聚類之后作為元素被包含在所述典型分布輪廓中的類 別相關(guān)聯(lián);以及字典躬5單元,其將被所述關(guān)聯(lián)單元彼此關(guān)^來的所述 典型分布4^廓及所述類別躬己在預(yù)定字典存儲(chǔ)單元中。
將通過在權(quán)利請(qǐng)求書中具體地指出的元素及組合來實(shí)現(xiàn)并獲得本發(fā) 明的目的及優(yōu)點(diǎn)。
應(yīng)當(dāng)理解,上文的概括說明及下文的詳細(xì)說明都是示例性和解釋性 的,而并非對(duì)所要求保護(hù)的本發(fā)明的限制。


圖1是用于解釋由根據(jù)本發(fā)明笫一實(shí)施例的字典創(chuàng)建裝置所進(jìn)行的
聚類的概念的示意圖2是根據(jù)第一實(shí)施例的字典創(chuàng)建裝置及字符識(shí)別裝置的結(jié)構(gòu)的功 能才匡圖3是根據(jù)笫一實(shí)施例的字典創(chuàng)建處理過程的流程圖4是用于解釋關(guān)聯(lián)單元的處理內(nèi)容的示意圖5是根據(jù)第一實(shí)施例的字符識(shí)別處理過程的流程圖6是根據(jù)本發(fā)明第二實(shí)施例的字典創(chuàng)建裝置及字符識(shí)別裝置的結(jié) 構(gòu)的功能框圖7是用于解釋與讀取錯(cuò)誤具有對(duì)應(yīng)關(guān)系的字符類別的示意圖; 圖8是存儲(chǔ)在讀取m對(duì)應(yīng)存儲(chǔ)單元中的信息的結(jié)構(gòu)示例;以及
圖9是根據(jù)本發(fā)明第三實(shí)施例的、執(zhí)行字符識(shí)別程序的計(jì)算機(jī)的結(jié)構(gòu) 的功能才匡圖。
具體實(shí)施例方式
下面將參照附圖來詳細(xì)地解釋根據(jù)本發(fā)明的字典創(chuàng)建裝置、識(shí)別裝 置、識(shí)別方法及識(shí)別程序的示例性實(shí)施例。在下列實(shí)施例中,將對(duì)創(chuàng)建字 符識(shí)別字典作為模式字典并使用所創(chuàng)建的字符識(shí)別字典來進(jìn)行字符識(shí)別 的情況進(jìn)行解釋。
下面解釋根據(jù)本發(fā)明第一實(shí)施例的字典創(chuàng)建裝置的概要。字典創(chuàng)建裝
置10(參見圖2)創(chuàng)建用于模式識(shí)別的字符識(shí)別字典。具體地說,字典創(chuàng) 建裝置10通過識(shí)別出在拍照電話(帶有攝《象頭的移動(dòng)終端)中裝有字符 識(shí)別字典的事實(shí)來創(chuàng)建該字典。
在創(chuàng)建字符識(shí)別字典時(shí),根據(jù)第一實(shí)施例的字典創(chuàng)建裝置10通過僅 將其特征向量具有相似的分布輪廓的多個(gè)字符類別的典型分布輪廓登記 在字典中來進(jìn)行聚類.
即,優(yōu)選的是,除了平均向量之外,還使用分布輪廓(#值及^£ 向量)來進(jìn)行字符識(shí)別,以實(shí)現(xiàn)與作為識(shí)別對(duì)象的所輸入的字符的字體無
關(guān)的、穩(wěn)定的字符識(shí)別能力。然而,如果將每個(gè)類別的;^iE值;M^向量登記在字典中,則字典的量會(huì)變得很大,因此字典變得不適合裝在移動(dòng)終 端中。
相應(yīng)的是,為了確保高水平的字符識(shí)別準(zhǔn)確度,字典創(chuàng)建裝置10將
包括平均向量及協(xié)方差矩陣的概率分布登記在字典中。然而,字典創(chuàng)建裝
置10并不將所有的字符類別的^值及^向量彼此關(guān)聯(lián)地登記在字典
中,字符類別是指由相同的字符構(gòu)成的類別,而與字體的類型無關(guān)。協(xié)方 差矩陣是指示特征向量的擴(kuò)展的度量。
即,字典創(chuàng)建裝置10關(guān)注以下事實(shí)認(rèn)為許多字符類別中的一些字 符類別的、由協(xié)方差矩陣所定義的分布輪廓相似。字典創(chuàng)建裝置10將其 特征向量具有相似的分布輪廓的字符類別的多個(gè)分布輪廓組織成一個(gè)典 型分布輪廓。然后,字典創(chuàng)建裝置10將該典型分布輪廓與被組織的字符 類別相關(guān)聯(lián),并將關(guān)^來的典型分布輪廓及字符類別登記到字典中。
結(jié)果,盡管在傳統(tǒng)技術(shù)中將與字符類別的數(shù)量相對(duì)應(yīng)的、分布輪廓的 信息登記在字典中,但是在第一實(shí)施例中,僅將典型分布輪廓登記在字典 中。因此,能夠減少要被存儲(chǔ)在字典中的分布輪廓的絕對(duì)數(shù)量。
下面將參照?qǐng)D1來解釋該聚類過程。圖1是用于解釋由字典創(chuàng)建裝置 10所進(jìn)行的聚類的概念的示意圖。圖1是其中字符類別A至字符類別E 具有分布輪廓A至分布輪廓E、并通過將分布A至分布E中的每個(gè)分布 視為 一個(gè)聚類來進(jìn)行聚類的示例。
如圖1中所描繪的,字典創(chuàng)建裝置IO僅需關(guān)注字符類別A至字符類 別E的分布^"廓,因此,將這些分布的中心位置對(duì)準(zhǔn),而不考慮其平均 向量(參見圖1中的(l))。
然后,字典創(chuàng)建裝置10針對(duì)所有的聚類中的每一對(duì)聚類(c卜io對(duì)) 來計(jì)算分布之間的距離,字典創(chuàng)建裝置IO將分布輪廓之間的距離最短的 聚類合并,以確定代表這些聚類的分布輪廓的典型分布輪廓(參見圖1 中的(2 ))。字典創(chuàng)建裝置10用典型分布I^廓來替代^L合并的聚類的分布 輪廓(參見圖l中的(3))。
在圖l中所描繪的示例中,分布A與分布C的對(duì)、分布C與分布E 的對(duì)以及分布E與分布A的對(duì)的分布輪廓之間的距離較短(這些對(duì)的相 似度較高)。因此,將分布A、分布C及分布E的聚類合并,并且例如選 擇分布A作為這三個(gè)被合并的聚類的典型分布輪廓。然后,包括字符類 別A、字符類別C及字符類別E的、^L合并的聚類的分布輪廓被典型分
7布輪廓A替代。
以這種方式,根據(jù)笫一實(shí)施例,盡管除了平均向量之外還將特征向量 的分布輪廓躬i在字典中,但是僅將關(guān)于其特征向量的分布輪廓相似的多 個(gè)字符類別的典型分布輪廓登記在字典中。因此,能夠在達(dá)到與使用概率 分布的字符識(shí)別的字符識(shí)別能力相當(dāng)?shù)淖址R(shí)別能力的同時(shí)減小字典的 量。
在圖1中所描繪的示例中,解釋了二維分布輪廓。然而,所公開的字 典創(chuàng)建裝置10不僅適用于二維分布輪廓,而且能夠?qū)χT如三維或更多維 的任意數(shù)量的維度進(jìn)行聚類。
下面解釋字典創(chuàng)建裝置io的結(jié)構(gòu)。圖2是# 據(jù)第一實(shí)施例的字典創(chuàng) 建裝置10及字符識(shí)別裝置的結(jié)構(gòu)的功能框圖。
如圖2中所描繪的,字典創(chuàng)建裝置IO包括平均向量計(jì)算單元ll、分 布^^廓計(jì)算單元12、聚類單元13、典型分布輪廓確定單元14、關(guān)聯(lián)單元 15及字典登記單元16。
平均向量計(jì)算單元11計(jì)算每個(gè)字符類別的平均向量。更具體地說, 平均向量計(jì)算單元11基于從存^i殳備或外部設(shè)備(未示出)輸入的訓(xùn)練 樣本的字符數(shù)據(jù)來計(jì)算每個(gè)字符類別的特征向量,并根據(jù)計(jì)算出的特征向 量來計(jì)算每個(gè)字符類別的平均向量.
分布輪廓計(jì)算單元12計(jì)算每個(gè)字符類別的分布輪廓。參照?qǐng)D3來解 釋其細(xì)節(jié),而概要如下。分布輪廓計(jì)算單元12基于由平均向量計(jì)算單元 ll針對(duì)每個(gè)字符類別而計(jì)算出的特征向量及平均向量來計(jì)算協(xié)方差矩陣。 然后,分布輪廓計(jì)算單元12基于針對(duì)每個(gè)字符類別而計(jì)算出的協(xié)方差矩 陣來計(jì)算本征值及本征向量。例如,使用在"Handwritten Kanji and Hiragana Recognition by Weighted Direction Index Histogram Method" (Journal D of IEICE, Vol. J70-D, No. 7,第1390 — 1397頁,1987年7月) 中所描述的加權(quán)方向指數(shù)直方圖特征作為字符的特征向量。
聚類單元13對(duì)聚類(分布輪廓或典型分布輪廓)進(jìn)行合并。例如, 將所有的分布輪廓視為分別具有一個(gè)元素的聚類,聚類單元13使用 Kullback-Leibler距離作為聚類之間的距離的度量,針對(duì)所有的聚類中的 每一對(duì)聚類(在圖1中所描繪的示例中為c卜io對(duì))來計(jì)算分布輪廓之間 的距離。聚類單元13將所有的聚類對(duì)中的、其之間的距離最短的聚類合 并。重復(fù)地進(jìn)行對(duì)聚類的合并,直到所獲得的聚類的數(shù)量收斂到基于目標(biāo)字符識(shí)別準(zhǔn)確度而預(yù)先設(shè)定的值為止。例如,應(yīng)用分層聚類作為聚類方法。 在分層聚類中,聚類的最終數(shù)量由用戶(以實(shí)驗(yàn)的方式或以經(jīng)驗(yàn)為依據(jù)) 來限定,并且進(jìn)行聚類直到聚類的數(shù)量達(dá)到所限定的數(shù)量為止。
典型分布輪廓確定單元14確定被聚類單元13合并的聚類的典型分布 輪廓。在圖1中所描繪的示例中,在字符類別A及字符類別C的聚類被 合并時(shí),典型分布輪廓確定單元14可以選擇分布A及分布C中的一個(gè)分 布作為典型分布輪^廓,或?qū)⒎植糀與分布C的平均(例如,通過幾何平 均或加權(quán)平均)確定作為典型分布輪廓。優(yōu)選的是,應(yīng)用以下準(zhǔn)則來進(jìn)行 分布選擇或平均識(shí)別頻次(檢查頻次)高的字符類別的分布優(yōu)先。
關(guān)聯(lián)單元15將由典型分布輪廓確定單元14所確定的典型分布輪廓與 作為元素被包含在該典型分布輪廓中的字符類別相關(guān)聯(lián)。更具體地說,關(guān) 聯(lián)單元15將這些字符類別中的每個(gè)字符類別與分布號(hào)及平均向量相關(guān) 聯(lián),同時(shí)將分布號(hào)與典型分布輪廓相關(guān)聯(lián)(參見圖4)。因此,關(guān)聯(lián)單元
15通過分布號(hào)來將字符類別與典型分布輪廓(M值;M^向量)彼此關(guān)聯(lián)。
字典登記單元16將被關(guān)聯(lián)單元15彼此關(guān)W^來的、每個(gè)字符類別的 平均向量及典型分布輪廓登記在字典中。更具體地說,字典登記單元16 將每個(gè)字符類別的平均向量及典型分布輪廓登記在安裝在移動(dòng)終端中的 字符識(shí)別裝置30的字典存儲(chǔ)單元31中.字典創(chuàng)建裝置10與字符識(shí)別裝 置30可以通過任一類型的網(wǎng)絡(luò)、以有線或無線的方式連接起來。此外, 字典創(chuàng)建裝置10及字符識(shí)別裝置30可以安裝在同一設(shè)備中。
下面將詳細(xì)地解釋由字典創(chuàng)建裝置10所進(jìn)行的處理的流程。圖3是 根據(jù)第 一 實(shí)施例的字典創(chuàng)建處理過程的流程圖。
如圖3中所描繪的,平均向量計(jì)算單元11基于M儲(chǔ)單元或外部設(shè) 備輸入的訓(xùn)練樣本的字符數(shù)據(jù)來計(jì)算字符類別的特征向量,并基于計(jì)算出 的特征向量來計(jì)算字符類別的平均向量(步驟S301)。
然后,分布輪廓計(jì)算單元12基于由平均向量計(jì)算單元11所計(jì)算出的 特征向量及平均向量來計(jì)算協(xié)方差矩陣(步驟S302)。例如,在訓(xùn)練數(shù)據(jù) 為X卜X2.....Xn且平均向量為n時(shí),協(xié)方差矩陣由式(1)給出。
E二t(^一〃X^-J (1)
9i:協(xié)方差矩陣
j^z"...,;^:學(xué)習(xí)數(shù)據(jù) a:平均向量
分布輪廓計(jì)算單元12還基于在步驟S302中計(jì)算出的協(xié)方差矩陣來計(jì) 算v^i值及;MiE向量(步驟S303 )。
其后,在計(jì)算出所有的字符類別的^E值及本征向量(步驟S304中 的"是")時(shí),聚類單元13針對(duì)所有的聚類對(duì)來計(jì)算各自的類別的分布輪 廓之間的距離(步驟S305)。
例如,在使用Kullback-Leibler距離作為聚類之間的距離的度量、并 假設(shè)兩個(gè)類別的分布f(x)及g(x)都是正態(tài)分布時(shí),這兩個(gè)類別分布之間的 距離由式(2);J^示。
/(x),g(x):類別分布
在f(x)的平均值為^且其協(xié)方差矩陣為^、 g(x)的平均值為^且其協(xié) 方差矩陣為Z2時(shí),Kullback-Leibler距離由式(3)給出。
~ - 〃Jfc1 -〃2)+^fe1 s2& -2/] (3)
/:單位矩陣
按照這種方式,僅利用協(xié)方差矩陣來表示兩個(gè)類別分布輪廓之間的距 離.在式(4)中,I表示單位矩陣。
返回到參照?qǐng)D3的解釋,在計(jì)算分布輪廓之間的距離時(shí),聚類單元
A: /(;c)的平均值
〃2: g(;c)的平均值
s1: /w的協(xié)方差矩陣
s2: gW的協(xié)方差矩陣
在僅關(guān)注分布輪廓時(shí),可以假設(shè)^i產(chǎn)i^,于是得到式U)。
1013將所有的聚類對(duì)中的、其之間的距離最短的聚類合并(步驟S306)。典 型分布輪廓確定單元14確定被聚類單元13合并的聚類的典型分布輪廓 (步驟S307 )。
關(guān)聯(lián)單元15將由典型分布輪廓確定單元14所確定的典型分布輪廓與 作為元素被包含在該典型分布輪廓中的字符類別相關(guān)聯(lián)(步驟S308 )。
例如,在圖4中所描繪的示例中,關(guān)聯(lián)單元15使用分布號(hào)'T,來將 字符類別"A"、字符類別"C"及字符類別"E"與各自的維度的 £值
"入"至U及本征向量"XI/al至V肌"彼此關(guān)聯(lián)。
在作為聚類單元13的合并結(jié)果的聚類的數(shù)量不等于預(yù)定值(基于目 標(biāo)字符識(shí)別準(zhǔn)確度而預(yù)先設(shè)定的聚類的數(shù)量)(步驟S309中的"否")時(shí), 重復(fù)地進(jìn)行從步驟S306至步驟S308的處理。
在聚類的數(shù)量變成等于預(yù)定值(步驟S309中的"是")時(shí),字典登記 單元16將被關(guān)聯(lián)單元15彼此關(guān)M來的、每個(gè)字符類別的平均向量及典 型分布輪廓登記在字符識(shí)別裝置30的字典存儲(chǔ)單元31中(步驟S310 ), 然后終止處理。
如上所述,字典創(chuàng)建裝置10根據(jù)用于創(chuàng)建模式識(shí)別字典的訓(xùn)練數(shù)據(jù) 來計(jì)算作為識(shí)別項(xiàng)的、每個(gè)類別的特征量。然后,字典創(chuàng)建裝置10基于
針對(duì)每個(gè)類別而計(jì)算出的特征量來計(jì)算每個(gè)類別的特征量的組的分布輪 廓。然后,字典創(chuàng)建裝置10基于針對(duì)每個(gè)類別而計(jì)算出的、特征量的組 的分布輪廓來計(jì)算各自的類別的分布輪廓之間的距離。然后,字典創(chuàng)建裝 置10基于各自的類別的分布輪廓之間的距離來確定聚類對(duì)象分布輪廓, 并確定代表被確定的聚類對(duì)象分布輪廓的典型分布輪廓。然后,字典創(chuàng)建 裝置10將被確定為聚類對(duì)象的分布輪廓聚類,并將所確定的典型分布輪 廓與作為元素被包含在該典型分布輪廓中的被聚類的類別相關(guān)聯(lián)。然后, 字典創(chuàng)建裝置10將被關(guān)^來的典型分布輪廓及類別登記在字典存儲(chǔ)單 元31中。因此,能夠在達(dá)到與使用概率分布所提供的字符識(shí)別的字符識(shí) 別能力相當(dāng)?shù)淖址R(shí)別能力的同時(shí)減小字典的量。
下面將具體地解釋字典的量的減小。約有4000個(gè)日文字符類別,在 進(jìn)行統(tǒng)計(jì)字符識(shí)別時(shí),每個(gè)類別具有平均向量、#值及 £向量。每個(gè)
類別最多可以具有與特征維數(shù)一樣多的;Mi值及;ME向量.然而,在很多
情況下,實(shí)際上在字典中登記影響識(shí)別率的約20個(gè)^i值及^向量。 在特征向量為浮點(diǎn)型(=4字節(jié))、^i值為浮點(diǎn)型(=4字節(jié))、特征維數(shù)為300、且^E值或W向量的數(shù)量為20時(shí),字典的量被計(jì)算為(300 維*4字節(jié)+ (4字節(jié)+300維*4字節(jié))*20 ) *4000類別=101.12兆字節(jié)。
在假設(shè)4000個(gè)類別的分布輪廓可以由100個(gè)分布l^廓來代表時(shí),這 種情況下的字典的量變成300維*4字節(jié)*4000類別+ (4字節(jié)+300維*4 字節(jié))*20*100=7.2兆字節(jié)。
即,字典創(chuàng)建裝置10在上述條件下創(chuàng)建字典時(shí),能夠?qū)⒆值涞牧繙p 小到以傳統(tǒng)方式得到的字典的約7%。
下面對(duì)根據(jù)第一實(shí)施例的字符識(shí)別裝置30進(jìn)行解釋。字符識(shí)別裝置 30具有字符識(shí)別字典,該字符識(shí)別字典^1要裝在移動(dòng)終端中的OCR并由 字典創(chuàng)建裝置10來登記。
如圖2中所描繪的,字符識(shí)別裝置30包括字典存儲(chǔ)單元31、特征提 取單元32及字符識(shí)別單元33。
字典存儲(chǔ)單元31是諸如非易失性存儲(chǔ)器的存^i殳備,在其中存儲(chǔ)每 個(gè)字符類別的平均向量及典型分布輪廓。例如,如圖4中所描繪的,字典 存儲(chǔ)單元31包括包^個(gè)字符類別的分布號(hào)及平均向量的表以及包M 個(gè)分布號(hào)的典型分布輪廓的表。分開地設(shè)置包含分布號(hào)的^L包含典型分 布輪廓的表的原因是,多個(gè)字符類別的分布輪廓由某些分布輪廓來代表, 并通過使用分布號(hào)作為指針來管理,以減小字典的量。
特征提取單元32從所輸入的字符數(shù)據(jù)中提取特征向量??梢酝ㄟ^圖 像掃描儀等來輸入字符數(shù)據(jù),或者可以經(jīng)由網(wǎng)絡(luò)從外部設(shè)備獲得字符數(shù) 據(jù)。
字符識(shí)別單元33基于統(tǒng)計(jì)分布來進(jìn)行字符識(shí)別.稍后將參照?qǐng)D5來 對(duì)其細(xì)節(jié)進(jìn)行解釋,而其概要如下。字符識(shí)別單元33使用存儲(chǔ)在字典存 儲(chǔ)單元31中的、字符類別的分布輪廓來計(jì)算所輸入的字符的特征向量與 字符類別的平均向量之間的基于統(tǒng)計(jì)分布的距離。然后,字符識(shí)別單元 33將其之間的距離最短的字符類別確定為所輸入的字符的字符類別。
下面將解釋由字符識(shí)別裝置30所進(jìn)行的處理的流程。圖5是根據(jù)第 一實(shí)施例的字符識(shí)別處理過程的流程圖。
如圖5中所描繪的,特征提取單元32從通過圖像掃描儀等而輸入的 輸入字符數(shù)據(jù)中提取字符類別的特征向量(步驟S501 )。
然后,字符識(shí)別單元33參照字典存儲(chǔ)單元31來讀取作為當(dāng)前計(jì)算對(duì)
12象的字符類別的平均向量及分布號(hào),并基于分布號(hào)來調(diào)用典型分布輪廓, 從而計(jì)算所輸入的字符的特征向量與字符類別的平均向量之間的基于統(tǒng)
計(jì)分布的距離(步驟S502)。
例如,假設(shè)使用Mahalanobis距離作為基于統(tǒng)計(jì)分布的距離的度量。 在所輸入的字符的特征向量為x、字符類別的平均向量為p、且其協(xié)方差 矩陣為&時(shí),Mahalanobis距離由式(5)給出。
a:平均向量 s1:協(xié)方差矩陣
在特征向量的維數(shù)為n、協(xié)方差矩陣的第k個(gè)^i值為k、且與k相 對(duì)應(yīng)的本征向量為v(/k時(shí),式(5)機(jī)良示為(6)。
根據(jù)式(6)來計(jì)算所輸入的字符的特征向量與字符類別的平均向量 之間的Mahalanobis距離。
在計(jì)算出所有的字符類別的Mahalanobis距離(步驟S503中的"是") 時(shí),字符識(shí)別單元33將其之間的距離最短的字符類別確定為所輸入的字 符的字符類別(步驟S504),然后終止處理。
如上所述,字符識(shí)別裝置30將分布號(hào)與典型分布^^廓彼此關(guān)W^ 儲(chǔ)起來,并將每個(gè)字符類別的平均向量與分布號(hào)彼此關(guān)聯(lián)M儲(chǔ)起來。然 后,字符識(shí)別裝置30從作為識(shí)別對(duì)象的所輸入的字符數(shù)據(jù)中提取特征向 量,并提取與作為距離計(jì)算對(duì)象的字符類別相對(duì)應(yīng)的平均向量及分布號(hào)。 然后,字符識(shí)別裝置30提取與分布號(hào)相對(duì)應(yīng)的典型分布輪廓,并針對(duì)每 個(gè)字符類別,使用所提取的、該字符類別的典型分布輪廓來計(jì)算從所輸入 的數(shù)據(jù)中提取的特征向量與該字符類別的平均向量之間的距離。然后,字 符識(shí)別裝置30采用計(jì)算出的距離最短的字符類別作為識(shí)別結(jié)果。因此,
:所輸入的字符的特征向量
n:特征向量的維數(shù) A:協(xié)方差矩陣的第*個(gè) £值 與A相對(duì)應(yīng)的本扭向量可以通過使用其中多個(gè)字符類別的分布輪廓被組織成一個(gè)典型分布輪廓 的模式字典來進(jìn)行統(tǒng)計(jì)字符識(shí)別。因此,能夠在達(dá)到與使用概率分布來進(jìn) 行的字符識(shí)別的字符識(shí)別能力相當(dāng)?shù)淖址R(shí)別能力的同時(shí)減小字典的量。
在第 一實(shí)施例中,解釋了在無約束的情況下對(duì)分布輪廓進(jìn)行聚類的情 況。然而,對(duì)于某些類別,無論分布輪廓之間的距離如何,不進(jìn)行聚類更 好。
即,在字符識(shí)別中,字形相似的字符(例如,"玉"和"王")可能被 誤讀。在要識(shí)別這種字形相似的字符時(shí),字符類別之間的、分布輪廓的細(xì) 微的差異通常對(duì)識(shí)別起作用。因此,在對(duì)字形相似的字符的分布輪廓進(jìn)行 聚類時(shí),字符識(shí)別率可能會(huì)降低。
下面對(duì)作為本發(fā)明笫二實(shí)施例的另一字典創(chuàng)建裝置進(jìn)行解釋。該字典 創(chuàng)建裝置在從聚類對(duì)象中去除具有高誤讀率的字符的分布輪廓之后對(duì)分 布輪廓進(jìn)行聚類。該字典創(chuàng)建裝置能夠?qū)⒂锌赡鼙徽`讀的字符的原始分布 輪廓登記在字典中,而不是通過聚類用其他分布輪廓來替代。
圖6是根據(jù)第二實(shí)施例的字典創(chuàng)建裝置及字符識(shí)別裝置的結(jié)構(gòu)的功 能框圖。如圖6中所描繪的,字典創(chuàng)建裝置50與根據(jù)笫一實(shí)施例的字典 創(chuàng)建裝置10的不同之處在于,另外還包括了字符識(shí)別單元51、讀取M 組合提取單元52及讀取g對(duì)應(yīng)存儲(chǔ)單元53。將省略對(duì)具有與第一實(shí)施 例中的組成元素的功能相同的功能的組成元素的解釋。
字符識(shí)別單元51基于由分布輪廓計(jì)算單元12所計(jì)算出的、每個(gè)字符 類別的 £值及 £向量、以及測(cè)試樣本的字符數(shù)據(jù)來進(jìn)行字符識(shí)別。例 如,子空間方法用作字符識(shí)別方法。不一定必須4吏用由分布輪廓計(jì)算單元 12所計(jì)算出的^t值及本征向量。因?yàn)槠渲写鎯?chǔ)有每個(gè)字符類別的^E 值及^iE向量的字典是公知的,所以字符識(shí)別單元51可以使用這種字典。
讀取g組合提取單元52從字符識(shí)別單元51的識(shí)別結(jié)果中提取識(shí)別 錯(cuò)誤率高于閾值的字符類別的組合。例如,假設(shè)在字符已被彼此餘溪地識(shí)
別達(dá)五次時(shí),將這些字符從聚類對(duì)象中去除,圖7中描繪了由字符識(shí)別單 元51所進(jìn):行的識(shí)別的結(jié)果。在輸入字符類別A時(shí),它^JL4m地識(shí)別為字 符類別D達(dá)十次,在輸入字符類別D時(shí),它祐^^地識(shí)別為字符類別A 達(dá)八次。因而,這兩個(gè)字符之間的彼此識(shí)別錯(cuò)誤的次lt^過作為預(yù)先確定 的閾值的五次,因此,讀取錯(cuò)誤組合提取單元52提取字符類別A及字符 類別D作為讀取錯(cuò)誤組合。讀取M對(duì)應(yīng)存儲(chǔ)單元53是諸如非易失性存儲(chǔ)器的存儲(chǔ)設(shè)備,在其 中存儲(chǔ)由讀取#^組合提取單元52所提取的讀取4W組合。例如,如圖 8中所描繪的,讀取4^對(duì)應(yīng)存儲(chǔ)單元53在其中存儲(chǔ)由讀取4W組合提 取單元52所提取的字符類別對(duì)作為讀取4^組合。
在以這種方式將由讀取^組合^_取單元52所提取的讀取#^組合 存儲(chǔ)在讀取l^t應(yīng)存儲(chǔ)單元53中時(shí),聚類單元54能夠在聚類之前將被 存儲(chǔ)作為讀取4^組合的字符類別的聚類去除。
因而,根據(jù)笫二實(shí)施例的字典創(chuàng)建裝置50基于針對(duì)每個(gè)字符類別而
計(jì)算出的特征向量的分布輪廓以及測(cè)試樣^lfc據(jù)來進(jìn)行字符識(shí)別,字典創(chuàng) 建裝置50從識(shí)別結(jié)果中提^L此的識(shí)別餘溪率高于預(yù)定閾值的字符類別 的組合。然后,字典創(chuàng)建裝置50將所提取的、字符類別的組合去除,從 而確定聚類對(duì)象的分布輪廓。因此,能夠防止字形相似的字符的分布輪廓 被聚類,從而減小識(shí)別錯(cuò)誤的概率。作為結(jié)果,能夠抑制字符識(shí)別準(zhǔn)確度 的降低。
在第一實(shí)施例及第二實(shí)施例中,已對(duì)創(chuàng)建字符識(shí)別字典作為模式字典 并使用所創(chuàng)建的字符識(shí)別字典來進(jìn)行字符識(shí)別的情況進(jìn)行了解釋。然而, 可以按類似的方式將第一實(shí)施例及第二實(shí)施例應(yīng)用于以下情況通常進(jìn)行 使用類別的概率分布的模式識(shí)別(例如,面部圖像識(shí)別)。
盡管在第 一 實(shí)施例中解釋了字符識(shí)別裝置,但是可以通過利用軟件來 實(shí)現(xiàn)字符識(shí)別裝置的組件,從而提供具有相同的功能的字符識(shí)別程序.將 在本發(fā)明的笫三實(shí)施例中對(duì)執(zhí)行這種字符識(shí)別程序的計(jì)算機(jī)進(jìn)行解釋。
圖9是根據(jù)第三實(shí)施例的、執(zhí)行字符識(shí)別程序的計(jì)算機(jī)的結(jié)構(gòu)的功能 框圖。如圖9中所描繪的,計(jì)算機(jī)300包括RAM(隨MM儲(chǔ)器)310、 CPU 320、 HDD (硬盤驅(qū)動(dòng)器)330、 LAN (局域網(wǎng))接口 340及輸X/ 輸出接口 350。
RAM310在其中存儲(chǔ)程序、程序的執(zhí)行中間結(jié)果等。CPU 320是從 RAM 310中讀取程序并執(zhí)行該程序的中央處理單元。HDD 330在其中存 儲(chǔ)程序及數(shù)據(jù)。LAN接口 340用于經(jīng)由無線LAN或LAN線纜而將計(jì)算 機(jī)300連接到另一計(jì)算機(jī)。輸A/輸出接口 350用于將諸如顯示器的輸A/ 輸出設(shè)備連接到計(jì)算機(jī)300。
計(jì)算機(jī)300執(zhí)行的字符識(shí)別程序311存儲(chǔ)在通過LAN接口 340而連 接的另一計(jì)算機(jī)系統(tǒng)的數(shù)據(jù)庫等中,從該數(shù)據(jù)庫中讀取字符識(shí)別程序311以將其安裝在計(jì)算機(jī)300中。已安裝的字符識(shí)別程序311存儲(chǔ)在HDD 330 中,RAM 310從HDD 330中讀取該字符識(shí)別程序311 ,并由CPU 320來 執(zhí)樹程序。
將由字符識(shí)別程序311所獲得的輸出結(jié)果(字符識(shí)別結(jié)果)輸出為有 形的結(jié)果,例如,在顯示器上顯示、利用打印機(jī)來打印、作為數(shù)據(jù)存儲(chǔ)在 存儲(chǔ)器中、或經(jīng)由網(wǎng)絡(luò)而發(fā)送到另一計(jì)算機(jī)。
不一定將字符識(shí)別程序311存儲(chǔ)在作為計(jì)算機(jī)可讀存儲(chǔ)^h質(zhì)的HDD 330中.例如,可以將字符識(shí)別程序311存儲(chǔ)在能夠插入到計(jì)算機(jī)300中 的"便攜式物理介質(zhì)"中,5更攜式物理介質(zhì)"諸如軟盤(FD)、光盤只 讀存儲(chǔ)器(CD-ROM)、數(shù)字多用途盤(DVD)、磁光盤及集成電路(IC) 卡。計(jì)算機(jī)300可以從便攜式物理介質(zhì)中讀取二每個(gè)計(jì)算M序,并由CPU 320來執(zhí)行它。
;fH據(jù)所4S開的裝置,能夠在達(dá)到與通過使用概率分布而提供的字符識(shí) 別的識(shí)別能力相當(dāng)?shù)淖R(shí)別能力的同時(shí)減小字典的量.
這里表述的所有的示例及條件用語是出于教示的目的,以幫助讀者理 解本發(fā)明以及本發(fā)明人對(duì)推進(jìn)技術(shù)做出貢獻(xiàn)的概念,而不應(yīng)將其解釋為對(duì) 這些具體地表述的示例及條件的限制,本說明書中對(duì)這些示例的組織也不 涉;sj t本發(fā)明的優(yōu)勢(shì)及劣勢(shì)的展示。盡管詳細(xì)地描述了本發(fā)明的實(shí)施例, 但M當(dāng)理解,可以在不背離本發(fā)明的精神及范圍的情況下對(duì)其做出各種 改變、替代及更改。
權(quán)利要求
1.一種字典創(chuàng)建裝置,包括特征量計(jì)算單元,其基于用于創(chuàng)建模式識(shí)別字典的訓(xùn)練數(shù)據(jù)來計(jì)算作為識(shí)別項(xiàng)的、每個(gè)類別的特征量;分布輪廓計(jì)算單元,其基于由所述特征量計(jì)算單元所計(jì)算出的、每個(gè)類別的所述特征量來計(jì)算每個(gè)類別的所述特征量的組的分布輪廓;距離計(jì)算單元,其基于由所述分布輪廓計(jì)算單元所計(jì)算出的、每個(gè)類別的所述特征量的所述組的所述分布輪廓來計(jì)算各自的類別的所述分布輪廓之間的距離;聚類對(duì)象確定單元,其基于由所述距離計(jì)算單元所計(jì)算出的、各自的類別的所述分布輪廓之間的所述距離來確定作為聚類對(duì)象的分布輪廓;典型分布輪廓確定單元,其確定代表由所述聚類對(duì)象確定單元所確定的所述聚類對(duì)象的所述分布輪廓的典型分布輪廓;聚類單元,其將被所述聚類對(duì)象確定單元確定為所述聚類對(duì)象的所述分布輪廓聚類;關(guān)聯(lián)單元,其將由所述典型分布輪廓確定單元所確定的所述典型分布輪廓與在所述聚類單元所進(jìn)行的所述聚類之后作為元素被包含在所述典型分布輪廓中的類別相關(guān)聯(lián);以及字典登記單元,其將被所述關(guān)聯(lián)單元彼此關(guān)聯(lián)起來的所述典型分布輪廓及所述類別登記在預(yù)定字典存儲(chǔ)單元中。
2. 根據(jù)權(quán)利請(qǐng)求l所述的字典創(chuàng)建裝置,該字典創(chuàng)建裝置還包括識(shí)別單元,其基于由所述分布輪^廓計(jì)算單元所計(jì)算出的、每個(gè)類別的 所述特征量的所述組的所述分布輪廓以及測(cè)試樣;Mt據(jù)來進(jìn)行識(shí)別;以及組合提取單元,其從由所述識(shí)別單元所進(jìn)行的所述識(shí)別的結(jié)果中提取 彼此之間的識(shí)別錯(cuò)誤率高于預(yù)定閾值的類別組合,其中,所述聚類對(duì)象確定單元在將由所述組合提取單元所提取的所述類別 組合去除的情況下,確定作為所述聚類對(duì)象的所述分布4^廓。
3. —種識(shí)別裝置,包括第一字典存儲(chǔ)單元,其在其中存儲(chǔ)作為模式識(shí)別的識(shí)別項(xiàng)的、每個(gè)類別的平均特征量及標(biāo)識(shí)信息,所述平均特征量與所述標(biāo)識(shí)信息彼此關(guān)聯(lián);第二字典存儲(chǔ)單元,其將分別代表所述類別的所述平均特征量的組的 至少 一個(gè)分布輪廓的典型分布輪廓與相對(duì)應(yīng)的標(biāo)識(shí)信息相關(guān)聯(lián)地存儲(chǔ)在 其中;特征量提取單元,其從作為識(shí)別對(duì)象的所輸入的數(shù)據(jù)中提取特征量;提取單元,其從所述第一字典存儲(chǔ)單元中提取與作為距離計(jì)算對(duì)象的 類別相對(duì)應(yīng)的所述平均特征量及所述標(biāo)識(shí)信息,并從所述第二字典存儲(chǔ)單 元中提取與所述標(biāo)識(shí)信息中的每個(gè)標(biāo)識(shí)信息相對(duì)應(yīng)的所述典型分布^^廓;距離計(jì)算單元,其使用由所述提取單元所提取的、所述類別中的每個(gè) 類別的所述典型分布輪廓來計(jì)算由所述特征量提取單元從所輸入的數(shù)據(jù) 中提取的所述特征量與所述類別中的每個(gè)類別的所述平均特征量之間的 足巨離;以及識(shí)別單元,其采用由所^巨離計(jì)算單元所計(jì)算出的距離最短的類別作 為識(shí)別結(jié)果.
4. 一種識(shí)別方法,包括從作為識(shí)別對(duì)象的所輸入的數(shù)據(jù)中提取特征量;從第一字典存儲(chǔ)單元中提取與作為距離計(jì)算對(duì)象的類別相對(duì)應(yīng)的平 均特征量及標(biāo)識(shí)信息,所述第 一字典存儲(chǔ)單元將作為模式識(shí)別的識(shí)別項(xiàng) 的、每個(gè)類別的所述平均特征量及所述標(biāo)識(shí)信息彼此關(guān)聯(lián)*儲(chǔ)在其中;從笫二字典存儲(chǔ)單元中提取與所述標(biāo)識(shí)信息中的每個(gè)標(biāo)識(shí)信息相對(duì) 應(yīng)的典型分布輪廓,所述第二字典存儲(chǔ)單元將分別代表所述類別的所述平 均特征量的組的至少一個(gè)分布輪廓的所述典型分布輪廓與相對(duì)應(yīng)的標(biāo)識(shí) 信息相關(guān)聯(lián)*儲(chǔ)在其中;使用在提取所述典型分布輪廓時(shí)所提取的、所述類別中的每個(gè)類別的 所述典型分布輪廓,來計(jì)算在提取所述特征量時(shí)從所輸入的數(shù)據(jù)中提取的 所述特征量與所述類別中的每個(gè)類別的所述平均特征量之間的距離;以及采用在計(jì)算所^J巨離時(shí)所計(jì)算出的距離最短的類別作為識(shí)別結(jié)果.
全文摘要
本發(fā)明涉及字典創(chuàng)建裝置、識(shí)別裝置及識(shí)別方法。所述字典創(chuàng)建裝置將分別包括平均向量及協(xié)方差矩陣的概率分布登記在字典中。所述字典創(chuàng)建裝置將具有相似的特征向量的字符類別的多個(gè)分布輪廓組織成一個(gè)典型分布輪廓,并將該典型分布輪廓與被組織的字符類別彼此關(guān)聯(lián)地登記在字典中,而不將所有的字符類別的本征值及本征向量彼此關(guān)聯(lián)地登記在字典中。
文檔編號(hào)G06K9/64GK101582118SQ200910138419
公開日2009年11月18日 申請(qǐng)日期2009年5月11日 優(yōu)先權(quán)日2008年5月13日
發(fā)明者堀田悅伸, 藤本克仁 申請(qǐng)人:富士通株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
黑河市| 尼玛县| 烟台市| 深泽县| 崇义县| 和田市| 鸡东县| 五华县| 怀仁县| 甘南县| 独山县| 太康县| 柯坪县| 黑河市| 怀宁县| 天镇县| 宣城市| 安徽省| 枣庄市| 新蔡县| 石景山区| 衡东县| 浦北县| 雷波县| 泊头市| 甘肃省| 巩留县| 仙桃市| 手游| 永靖县| 怀远县| 镇平县| 沙雅县| 海兴县| 静安区| 奉贤区| 武冈市| 治多县| 湟中县| 济南市| 清徐县|