手寫文字檢索裝置、方法以及記錄介質(zhì)的制作方法
【專利摘要】本發(fā)明的實(shí)施方式關(guān)于手寫文字檢索裝置、方法以及記錄介質(zhì)。提供可以更準(zhǔn)確實(shí)現(xiàn)手寫文字檢索的手寫文字檢索裝置、方法以及記錄介質(zhì)。根據(jù)實(shí)施方式,具備獲取部、特征提取部、合并部、特征量付與部、檢索部。獲取部以筆畫為單位獲取手寫文字列。特征提取部從所述手寫文字列獲取每個(gè)所述筆畫固有的第1特征量。合并部將所述筆畫合并到多個(gè)集合。特征量付與部向每個(gè)所述筆畫付與基于所述合并結(jié)果的第2特征量。檢索部根據(jù)所述第1特征量以及所述第2特征量執(zhí)行檢索。
【專利說明】手寫文字檢索裝置、方法以及記錄介質(zhì)
[0001]本申請(qǐng)以日本專利申請(qǐng)2012-121304 (申請(qǐng)日:2012/5/28)為基礎(chǔ),從該申請(qǐng)享受優(yōu)先利益。本申請(qǐng)通過參照該申請(qǐng),包含該申請(qǐng)的全部?jī)?nèi)容。
【技術(shù)領(lǐng)域】
[0002]本發(fā)明的實(shí)施方式關(guān)于手寫文字檢索裝置、方法以及程序。
【背景技術(shù)】
[0003]從數(shù)據(jù)庫檢索與用戶輸入或指定的手寫查詢對(duì)象(query)相似或匹配的手寫文件的文件檢索裝置是為人所知的。
【發(fā)明內(nèi)容】
[0004]本發(fā)明要解決的課題是提供可以更準(zhǔn)確實(shí)現(xiàn)手寫文字檢索的手寫文字檢索裝置、方法以及記錄介質(zhì)。
[0005]根據(jù)實(shí)施方式,具備獲取部、特征提取部、合并部、特征量付與部、檢索部。獲取部以筆畫為單位獲取手寫文字列。特征提取部從所述手寫文字列獲取每個(gè)所述筆畫固有的第I特征量。合并部將所述筆畫合并到多個(gè)集合。特征量付與部向每個(gè)所述筆畫付與基于所述合并結(jié)果的第2特征量。檢索部根據(jù)所述第I特征量以及所述第2特征量執(zhí)行檢索。
[0006]根據(jù)上述結(jié)構(gòu)的裝置,可以進(jìn)行更準(zhǔn)確的手寫文字檢索。
【專利附圖】
【附圖說明】
[0007]圖1是顯示本實(shí)施方式涉及的手寫文字檢索裝置的構(gòu)成例的圖。
[0008]圖2是顯示本實(shí)施方式涉及的手寫文字檢索裝置的處理例的流程圖。
[0009]圖3是顯示墨跡數(shù)據(jù)的格式一例的圖。
[0010]圖4是用于說明筆畫數(shù)據(jù)輸入的圖。
[0011]圖5是用于說明筆畫數(shù)據(jù)采樣的圖。
[0012]圖6是用于說明特征量數(shù)據(jù)庫的圖。
[0013]圖7是用于說明筆畫數(shù)據(jù)合并的圖。
[0014]圖8是用于說明筆畫數(shù)據(jù)合并的圖。
[0015]圖9是用于說明筆畫數(shù)據(jù)合并的圖。
[0016]圖10是顯示合并部一例的圖。
[0017]圖11是用于說明使用了區(qū)域特征量的檢索的圖。
[0018]圖12是用于說明使用了區(qū)域特征量的檢索的圖。
[0019]圖13是顯示檢索結(jié)果顯示的一例的圖。
[0020]圖14是用于說明硬件構(gòu)成例的圖。
[0021]圖15是用于說明配合網(wǎng)絡(luò)的構(gòu)成例的圖?!揪唧w實(shí)施方式】
[0022]以下參照附圖詳細(xì)說明本發(fā)明的實(shí)施方式涉及的手寫文字檢索裝置。另外,以下的實(shí)施方式中,賦予了相同編號(hào)的部分執(zhí)行同樣動(dòng)作,省略重復(fù)說明。
[0023]本實(shí)施方式中,從預(yù)先書寫的(例如大量的)手寫文件中,以用戶手寫的手寫文字列作為查詢對(duì)象,執(zhí)行檢索。本實(shí)施方式中主要以文字列為例進(jìn)行說明,但查詢對(duì)象也可以是用戶繪制的線和標(biāo)記。此外,用戶指定手寫文字列的方法可使用任意方法。例如,可以通過用戶實(shí)際手寫文字列而指定查詢對(duì)象。也可以由用戶從已有的手寫文件中選擇用作查詢對(duì)象的部分。也可以由用戶從查詢對(duì)象用模板中選出查詢對(duì)象。也可以是它們的組合。
[0024]此外,本實(shí)施方式中,對(duì)于查詢對(duì)象與手寫文字列的相似度判定,除了筆畫單體固有的特征量,還使用基于筆畫組集合的特征量。另外,筆畫指的是手寫輸入的筆畫,表示筆等從接觸輸入面到離開為止的軌跡。
[0025]此外,本實(shí)施方式中,將含有與查詢對(duì)象相似或匹配的手寫文字列的手寫文件作為檢索結(jié)果進(jìn)行呈示。
[0026]圖1顯示的是本實(shí)施方式的手寫文字檢索裝置的構(gòu)成例。如圖1所示,本實(shí)施方式的手寫文字檢索裝置,具備獲取部1、合并部2、合并信息付與部3、特征提取部5、檢索部
7、結(jié)果顯示部8、墨跡數(shù)據(jù)數(shù)據(jù)庫(墨跡數(shù)據(jù)DB) 11、特征量數(shù)據(jù)庫(特征量DB) 12。
[0027]墨跡數(shù)據(jù)DBll存儲(chǔ)將筆畫以文件為單位合并的墨跡數(shù)據(jù)。
[0028]特征量DB12記錄各個(gè)筆畫單體固有的特征量(第I特征量)以及基于各個(gè)筆畫所屬集合的特征量(第2特征量)。此處,集合為由I個(gè)筆畫或多個(gè)筆畫(以下稱為筆畫組)所形成。
[0029]獲取部I用于獲取用作查詢對(duì)象的手寫文字列。
[0030]此處,主要說明獲取用戶書寫的筆畫的情況。另外,該手寫輸入的方法可使用在觸摸屏上用筆輸入的方法、在觸摸屏上用手指輸入的方法、在觸摸板上用手指輸入的方法、操作鼠標(biāo)輸入的方法、用電子筆的方法等各種方法。
[0031]用戶書寫的筆畫組,例如,在用戶結(jié)束書寫文件時(shí)或保存時(shí)等,作為墨跡數(shù)據(jù)DBll被存儲(chǔ)。墨跡數(shù)據(jù)是用于以文件為單位等存儲(chǔ)筆畫組的數(shù)據(jù)構(gòu)造。
[0032]特征提取部5從各筆畫提取記述有(該筆畫單體固有的)特征的特征量(第I特征量)。
[0033]合并部2對(duì)于墨跡數(shù)據(jù),將筆畫合并到多個(gè)集合,提取合并信息。合并信息是顯示各個(gè)筆畫所屬的I個(gè)或多個(gè)集合的信息。例如,對(duì)于各集合,合并信息含有顯示合并結(jié)果種類的分類標(biāo)簽與該集合所處位置的區(qū)域數(shù)據(jù)。區(qū)域數(shù)據(jù)以指定對(duì)角的矩形和旋轉(zhuǎn)角表現(xiàn)。
[0034]合并信息付與部3向各筆畫的特征量(第I特征量)付與合并部2得到的集合信息(第2特征量)。
[0035]檢索部7使用記錄為作為查詢對(duì)象的由多個(gè)筆畫構(gòu)成的文字列的特征量,檢索相似的文字列。
[0036]結(jié)果顯不部8呈不檢索結(jié)果。
[0037]圖2顯示的是本實(shí)施方式的手寫文字檢索裝置的處理的一例。
[0038]步驟SI中,獲取部I獲取用作查詢對(duì)象的手寫文件或文字列(手寫筆畫列)。
[0039]步驟S2中,合并部2對(duì)于該獲取的墨跡數(shù)據(jù)提取合并信息(執(zhí)行合并處理)。[0040]步驟S3中,特征提取部5對(duì)于該獲取的墨跡數(shù)據(jù)執(zhí)行特征提取處理。
[0041]步驟S4中,合并信息付與部3根據(jù)合并部2的合并處理結(jié)果,對(duì)該獲取的墨跡數(shù)據(jù)執(zhí)行合并信息付與處理。
[0042]步驟S5中,檢索部7根據(jù)特征提取部5得到的第I特征量以及合并信息付與部3得到的第2特征量,執(zhí)行檢索。
[0043]步驟S6中,結(jié)果顯示部8顯示檢索部7得到的檢索結(jié)果。
[0044]另外,上述處理中,步驟S3可在步驟SI與步驟S5間的任意時(shí)點(diǎn)執(zhí)行。同樣的,步驟S2、S4 (但是,步驟S4應(yīng)在步驟S2后執(zhí)行)可在步驟SI與步驟S5間的任意時(shí)點(diǎn)執(zhí)行。此外,步驟S3也可與步驟S2、S4并列處理。另外,步驟S3可與步驟SI同時(shí)執(zhí)行。
[0045]接著,參照?qǐng)D3說明墨跡的數(shù)據(jù)構(gòu)造以及筆畫數(shù)據(jù)的數(shù)據(jù)構(gòu)造。
[0046]通常,在規(guī)定的時(shí)點(diǎn)(例如一定周期),筆畫軌跡上的點(diǎn)會(huì)被采樣。因此,筆畫表現(xiàn)為采樣點(diǎn)的系列。
[0047]圖3 (b)的例中,I個(gè)筆畫(B卩,I筆)的筆畫構(gòu)造表現(xiàn)為筆移動(dòng)的平面上的坐標(biāo)值的集合(點(diǎn)構(gòu)造),具體來說,I個(gè)筆畫的筆畫構(gòu)造是含有:顯示形成該筆畫的點(diǎn)的個(gè)數(shù)的“點(diǎn)總數(shù)”、“開始時(shí)刻”、“外接圖形”、與點(diǎn)總數(shù)相當(dāng)?shù)膫€(gè)數(shù)的“點(diǎn)構(gòu)造”的排列的構(gòu)造體。此處,開始時(shí)刻表示該筆畫中筆接觸到輸入面開始書寫的時(shí)刻。外接圖形表示文件平面上對(duì)于該筆畫軌跡的外接圖形(優(yōu)選為文件平面上內(nèi)包該筆畫的最小面積的矩形)。
[0048]點(diǎn)的構(gòu)造可依存于輸入設(shè)備得到。圖3 (C)的例中,I點(diǎn)的構(gòu)造是具有該采樣點(diǎn)的坐標(biāo)值X、y、筆壓以及距初期點(diǎn)(例如上述的“開始時(shí)刻”)的時(shí)間差這4個(gè)值的構(gòu)造體。
[0049]另外,坐標(biāo)為文件平面的坐標(biāo)系,可通過左上角為原點(diǎn)、越往右下角值越大的正值來表現(xiàn)。
[0050]此外,輸入設(shè)備無法獲取筆壓或者即使可以獲取筆壓但之后的處理不使用筆壓時(shí),可以省去圖3 (c)的筆壓或在筆壓處標(biāo)記顯示無效的數(shù)據(jù)。
[0051]另外,圖3 (b)、(c)的例中,可在筆畫構(gòu)造的各個(gè)點(diǎn)構(gòu)造區(qū)域記載坐標(biāo)值x,y等的實(shí)際數(shù)據(jù),或者也可將筆畫構(gòu)造的數(shù)據(jù)與點(diǎn)構(gòu)造的數(shù)據(jù)分別管理,在筆畫構(gòu)造中各個(gè)點(diǎn)構(gòu)造的區(qū)域記載對(duì)應(yīng)的點(diǎn)構(gòu)造的鏈接信息。
[0052]圖4顯示的是獲取的筆畫例。此處,以筆畫內(nèi)的樣本點(diǎn)的采樣周期固定的情況為例進(jìn)行說明。圖4 (a)顯示采樣出的點(diǎn)的坐標(biāo),圖4 (b)將時(shí)間連續(xù)的點(diǎn)構(gòu)造線性插補(bǔ)并顯示。采樣點(diǎn)的坐標(biāo)間隔不同是由于筆速的差異。采樣點(diǎn)數(shù)可因各個(gè)筆畫而異。
[0053]圖3 (a)的例中,墨跡的數(shù)據(jù)構(gòu)造,是包含有顯示該文件全部區(qū)域所含筆畫構(gòu)造個(gè)數(shù)的“筆畫總數(shù)”、與筆畫總數(shù)相當(dāng)?shù)膫€(gè)數(shù)的“筆畫構(gòu)造”的排列的構(gòu)造體。
[0054]另外,圖3 (a)、(b)的例中,墨跡構(gòu)造中的各個(gè)筆畫構(gòu)造的區(qū)域,既可以記載圖3(b)的數(shù)據(jù),或者也可以將墨跡構(gòu)造的數(shù)據(jù)與圖3 (b)的筆畫的數(shù)據(jù)構(gòu)造分別管理,在墨跡構(gòu)造中的各個(gè)筆畫的數(shù)據(jù)構(gòu)造區(qū)域記載對(duì)應(yīng)的圖3 (b)的數(shù)據(jù)的鏈接信息。
[0055]用戶使用輸入設(shè)備書寫的筆畫數(shù)據(jù),通過例如圖3所示的墨跡構(gòu)造在存儲(chǔ)器上展開。墨跡例如作為文件保存等情況下,作為墨跡DBll存儲(chǔ)。
[0056]另外,存儲(chǔ)多個(gè)文件時(shí),可將用于識(shí)別這些文件的文件ID與各墨跡對(duì)應(yīng)保存。此夕卜,為了識(shí)別各個(gè)筆畫,也可對(duì)各筆畫構(gòu)造付與筆畫ID。
[0057]接著,說明特征提取部5。[0058]特征提取部5從各個(gè)筆畫提取各筆畫單體各自固有的特征量(第I特征量)。此處,由于可以僅通過筆畫單體的信息進(jìn)行處理,因此輸入筆畫數(shù)據(jù)后,可與追加到墨跡數(shù)據(jù)的數(shù)據(jù)構(gòu)造并行進(jìn)行特征提取。但是,也可在墨跡數(shù)據(jù)獲取結(jié)束后,匯總進(jìn)行第I特征量的提取。
[0059]但是,由于筆畫數(shù)據(jù)記錄為采樣坐標(biāo)值的集合,即使例如書寫同一形狀,由于筆速而得到的坐標(biāo)值不同,因此優(yōu)選通過對(duì)于固定數(shù)的樣本點(diǎn)再度采樣的重采樣,令筆速標(biāo)準(zhǔn)化。
[0060]例如,此處的重采樣處理,指的是對(duì)筆畫長(zhǎng)度以固定數(shù)N的采樣點(diǎn)按一定間隔再采樣,根據(jù)最初的采樣點(diǎn)附近的2點(diǎn)通過線性插值算出坐標(biāo)值。此處,以N=128進(jìn)行重采樣。圖5的(a)與(b )各自例示重采樣前后的數(shù)據(jù)。
[0061]作為筆畫單體固有的特征量,可利用各種特征量。
[0062]以下說明此種特征量的一例。
[0063]首先,對(duì)于諸如圖5 (b)的重采樣后的筆畫數(shù)據(jù),根據(jù)以外接矩形的長(zhǎng)邊為I邊長(zhǎng)度的正方形,設(shè)定筆畫組的區(qū)域(筆畫區(qū)域)。此時(shí),外接矩形的中心位于筆畫區(qū)域的中央。筆畫區(qū)域的中央指的是例如多個(gè)點(diǎn)的坐標(biāo)的平均位置。然后,將筆畫區(qū)域按X方向和I方向各自均等分割為S個(gè),求得S2個(gè)的局部區(qū)域。此處,S為分割數(shù)的參數(shù),為奇數(shù)較為理想。此處,作為具體例子,S=7 (此時(shí),圖5 (b)的區(qū)域縱橫各分割為7份)。
[0064]接著,就所有重采樣的坐標(biāo)值求得梯度方向direction⑴。
【權(quán)利要求】
1.一種手寫文字檢索裝置,其特征在于,包括: 以筆畫為單位獲取手寫文字列的獲取部; 從所述手寫文字列獲取每個(gè)所述筆畫固有的第I特征量的特征提取部; 將所述筆畫合并到多個(gè)集合的合并部; 向每個(gè)所述筆畫付與基于所述合并結(jié)果的第2特征量的特征量付與部; 根據(jù)所述第I特征量以及所述第2特征量執(zhí)行檢索的檢索部。
2.根據(jù)權(quán)利要求1所述的手寫文字檢索裝置,其特征在于,所述合并部將所述手寫文字列合并到文字區(qū)域、段落區(qū)塊、行區(qū)塊、單詞區(qū)塊、文字區(qū)塊以及部首區(qū)塊這些階層中的一部分或全部。
3.根據(jù)權(quán)利要求1或2所述的手寫文字檢索裝置,其特征在于,所述合并部將所述手寫文字列至少分類為文字區(qū) 域和文字區(qū)域以外的區(qū)域。
4.根據(jù)權(quán)利要求2或3所述的手寫文字檢索裝置,其特征在于,所述第2特征量是對(duì)于各個(gè)所述筆畫所屬的I個(gè)或多個(gè)集合分別表示該集合所包含的全部筆畫總數(shù)的特征量矢量。
5.根據(jù)權(quán)利要求2或3所述的手寫文字檢索裝置,其特征在于,所述第2特征量是對(duì)于各個(gè)所述筆畫所屬的I個(gè)或多個(gè)所述集合分別表示通過對(duì)該集合所包含的全部筆畫采用與算出所述第I特征量的方法相同的方法而得到的特征量的特征量矢量。
6.根據(jù)權(quán)利要求1所述的手寫文字檢索裝置,其特征在于,所述獲取部在線以筆畫為單位獲取手寫文字列。
7.根據(jù)權(quán)利要求1所述的手寫文字檢索裝置,其特征在于,所述獲取部從預(yù)先存儲(chǔ)的手寫文字列中獲取用戶指定的手寫文字列。
8.根據(jù)權(quán)利要求1所述的手寫文字檢索裝置,其特征在于,所述獲取部獲取使用了對(duì)應(yīng)各個(gè)所述構(gòu)造預(yù)先準(zhǔn)備的筆畫列的模板組而形成的手寫文字列。
9.根據(jù)權(quán)利要求廣8中任意一項(xiàng)所述的手寫文字檢索裝置,其特征在于,還含有顯示所述檢索部的檢索結(jié)果的顯示部。
10.根據(jù)權(quán)利要求-9中任意一項(xiàng)所述的手寫文字檢索裝置,其特征在于,所述檢索部檢索含有與獲取的所述手寫文字相似的筆畫列的手寫文件。
11.根據(jù)權(quán)利要求10所述的手寫文字檢索裝置,其特征在于,在顯示檢索結(jié)果時(shí),顯示含有所述筆畫列的手寫文件,且強(qiáng)調(diào)顯示所述筆畫列。
12.—種手寫文字檢索方法,其是手寫文件檢索裝置的手寫文字檢索方法,其特征在于,包括: 以筆畫為單位獲取手寫文字列的步驟; 從所述手寫文字列提取每個(gè)所述筆畫固有的第I特征量的步驟; 將所述筆畫合并到多個(gè)集合的步驟; 向每個(gè)所述筆畫付與基于所述合并結(jié)果的第2特征量的步驟; 根據(jù)所述第I特征量以及所述第2特征量執(zhí)行檢索的步驟。
13.—種記錄介質(zhì),其特征在于,記錄有令計(jì)算機(jī)執(zhí)行以下部件的功能的程序: 以筆畫為單位獲取手寫文字列的獲取部; 從所述手寫文字列獲取每個(gè)所述筆畫固有的第I特征量的特征提取部;將所述筆畫合并到多個(gè)構(gòu)造的合并部;向每個(gè)所述筆畫付與基于所述合并結(jié)果的第2特征量的特征量付與部;根據(jù)所述第 I特征量以及所述第2特征量執(zhí)行檢索的檢索部。
【文檔編號(hào)】G06F17/30GK103455528SQ201210348219
【公開日】2013年12月18日 申請(qǐng)日期:2012年9月18日 優(yōu)先權(quán)日:2012年5月28日
【發(fā)明者】柴田智行, 登內(nèi)洋次郎, 井本和范, 山內(nèi)康晉 申請(qǐng)人:株式會(huì)社東芝