欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

文檔和/或圖像檢索方法及其程序、文檔和/或圖像存儲設(shè)備和檢索設(shè)備的制作方法

文檔序號:6566765閱讀:154來源:國知局

專利名稱::文檔和/或圖像檢索方法及其程序、文檔和/或圖像存儲設(shè)備和檢索設(shè)備的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及一種利用數(shù)字照相機(jī)或掃描器等的文檔和/或圖像檢索方法及其程序,涉及一種文檔和/或圖像存儲設(shè)備和檢索設(shè)備。
背景技術(shù)
:數(shù)字照相機(jī)的普及、多功能化和小型化在模式識別(patternrecognition)禾口々某體J里角罕(mediaunderstanding)4貞;或帶來了誶斤的可能。其中一個(gè)這種可能是將用戶所獲取的圖像鏈接到任一各種服務(wù)。這類可能性在字符和文檔的領(lǐng)域中毫無例外地存在。對于基于照相機(jī)的字符識別和文檔和/或圖像分析開展了深入研究(例如,參考非專利文獻(xiàn)1和2)。特別地,利用裝配到移動電話的數(shù)字照相機(jī)的接口是重要的,并且利用該接口的字符讀取處理和翻"i奪處理等多種處理現(xiàn)正在考慮中(例如,參考非專利文獻(xiàn)3和4)。用于檢索基于圖像的文檔和/或圖像數(shù)據(jù),即,文檔和/或圖^象的在先4支術(shù)方法如下。在Kauniskangas方法中,將文檔和/或圖像均分成段落區(qū)域和圖形區(qū)域,其中,分類段落區(qū)域和圖形區(qū)域并以樹形結(jié)構(gòu)表示它們。為了檢索,判斷詢問和數(shù)據(jù)庫中的文檔和/或圖像的各區(qū)域的匹配程度,并且輸出具有最高匹配度的圖像作為檢索結(jié)果(例如,參考非專利文獻(xiàn)5)。Hull公開了一種基于各單詞的字符的數(shù)量的文檔索引方法和檢索方法、以及一種利用不變量的圖像索引方法。還公開了這樣一種方法,在該方法中,以詞為單位分割文檔的文本,并且通過各單詞的字符數(shù)量的序列所定義的特征量表示該文檔。預(yù)先計(jì)算數(shù)據(jù)庫中的文檔的各部分的特征量,并將其存儲在散列表中。為了檢索輸入的圖像,以相同方式計(jì)算輸入的圖像的特征量。通過基于輸入圖像的特征量訪問散列并進(jìn)行投票來實(shí)現(xiàn)該檢索(例如,參考專利文獻(xiàn)l和非專利文獻(xiàn)6)。上述方法處理平板掃描器等所獲得的高分辨率正確方向圖^f象(correct-orientationimage)。因此,這些方法不能用于基于凄t字照相機(jī)的文檔和/或圖像檢索,將通過本發(fā)明對它們進(jìn)行處理。例如,hull方法基于假定在輸入的圖像中字符是可分開的。在較低清晰度的圖像或經(jīng)過投影變換等幾何變換的圖像的情況下,不滿足該假定,通過本發(fā)明處理該情況。專利文獻(xiàn)l:JP-A-7(1995)-282088非專利文獻(xiàn)1:D.Doermann,J.LiangandH.Li,"ProgressinCamera-BasedDocumentImageAnalysis",Proc.ICDAR,03,pp.606-616(2003)非專利文南足2:K.Kise,S.Omachi,S.Uchida,M.Iwamura,"CurrentstatusandFutureProspectsofCamera-BasedCharacterRecognitionandDocumentImageAnalysis',,TechnichalReportoftheIEICE,P畫U2004-246(2005.3)非專利文獻(xiàn)3:K.Yamada,S.Senda,"UbiquitousInformationInterfaceUsingMobileCamera",Infromationprocessing,45,9,pp.923-297(2004)非專利文南史4:Y.Watanabe,Y.Okada,Y—B.Kim,T.Takeda,"TranslationCamera",Proc.ICPR,98,pp.613-617(1998)非專利文南大5:K.Harmu,"DocumentImageRetrievalwithImprovementsinDatabaseQuality",AcademicDissertationofUniversityofOulu(1999)非專利文獻(xiàn)6:J丄Hull,"DocumentImageMatchingandRetrievalwithMultipleDistortion-InvariantDescriptors",DocumentAnalysisSystems,pp.379-396(1995)
發(fā)明內(nèi)容本發(fā)明要解決的問題本發(fā)明旨在提供一種用于通過使用由數(shù)字照相機(jī)或掃描儀等所捕獲的文檔和/或圖像作為詢問、從文檔和/或圖像數(shù)據(jù)庫檢索文檔和/或圖像的方法。與此有關(guān)的問題如下(1)由數(shù)字照相機(jī)或掃描儀等所捕獲的詢問的文檔和/或圖個(gè)文檔。而且,詢問圖像在分辨率和照明條件上與存儲在數(shù)據(jù)庫中的文檔和/或圖像有極大的不同。這更加使得該問題變得復(fù)雜。換句話說,由于攝影角度,通常識別的詢問的文檔和/或圖像不同于存儲在數(shù)據(jù)庫中的文檔和/或圖像。這使得難以判斷圖像中的對象的同一性。因此,需要一種能夠適應(yīng)攝影角度的差異的方法。(2)為了精確檢查圖像的特征量,應(yīng)該從圖像提取較大數(shù)量的元素以定義特征量。然而,由于較大數(shù)量的元素,判斷同一性需要相當(dāng)長的時(shí)間。因此,需要一種判斷同一性不需要相當(dāng)長時(shí)間的方法。(3)在處理多種文檔和/或圖像的情況下,存在更大量的相似文檔和/或圖像。難以從相似的文檔和/或圖像提耳又正確匹配的圖像。因此,需要一種能夠高精度地判斷從相似的文檔和/或圖像所提取的圖像的同一性的方法。用于解決該問題的方法為了解決這些問題,本發(fā)明中引入以下想法。(1)為了提供文檔和/或圖像的特征量而免受由于幾何變換而引起的變形的影響,特征量的計(jì)算使用對于幾何變換的不變量。在本發(fā)明中,不變量的一個(gè)例子就是交比(cross-ratio)。交比是基于共線的四個(gè)點(diǎn)或共面的5個(gè)點(diǎn)所計(jì)算的值,并且已知為對于投影變換的不變量,投影變換是一種類型的幾何變換。在使用交比的情況下,通過點(diǎn)(特征點(diǎn))定義感興趣的文檔和/或圖像的特征量。在英文文檔的情況下,例如,使用單詞的重心作為用于計(jì)算交比的特征點(diǎn)。為了使可以利用圖像的一部分進(jìn)行檢索,基于針對文檔和/或圖像的各部分所計(jì)算的交比計(jì)算特征量。除投影變換以外,還考慮仿射變換和相似變換。(2)存在巨大量的特征點(diǎn)的可能組合,因此,考慮特征點(diǎn)的所有可能組合的對應(yīng)關(guān)系是不現(xiàn)實(shí)的。因此,在本發(fā)明中,對于檢索使用利用散列的投票處理,而無需特征點(diǎn)的外在對應(yīng)關(guān)系。在存儲中,基于從文檔和/或圖像提取的特征點(diǎn)計(jì)算特征量,并基于根據(jù)特征量所確定的索引將特征量存儲在散列表中。在檢索中,以相同方式確定特征點(diǎn)、特征量和詢問的索引,并且為了向所存儲的文檔和/或圖像投票訪問散列表。對于文檔和/或圖像檢索很少采用傳統(tǒng)已知概念的投票處理。(3)在基于交比的值檢查圖像的同一性的情況下,計(jì)算交比所基于的特征點(diǎn)應(yīng)具有圖像之間的對應(yīng)關(guān)系。然而,當(dāng)相互關(guān)聯(lián)從各圖像提取的N個(gè)點(diǎn)時(shí),有N!個(gè)組合。為了確保充分的判斷精度,應(yīng)該使用足夠大量的特征點(diǎn)。然而,這將導(dǎo)致過大的計(jì)算復(fù)雜度。幾何散列方法中的大的計(jì)算復(fù)雜度0(N"是Hull的發(fā)明的動機(jī)之一。說明了使用三個(gè)或四個(gè)或更多個(gè)特征點(diǎn)(感興趣的點(diǎn))以提供對于旋轉(zhuǎn)和縮放的不變量(后面說明的相似不變量)。然而,即使使用Hull方法,從O(N"個(gè)不同組合中的N個(gè)特征點(diǎn)提取三個(gè)點(diǎn),因此組合的數(shù)量基本與傳統(tǒng)方法中的相等。因此,與傳統(tǒng)方法相比,不能清楚將計(jì)算復(fù)雜度降低了多少。因而,需要一種與傳統(tǒng)方法相比降低計(jì)算復(fù)雜度的方法。這里,0(N)和0(N^均表示該解決方案所需的近似計(jì)算復(fù)雜度。在指定N的情況下,0(N)表示計(jì)算復(fù)雜度不大于aN+b,而0(N3)表示計(jì)算復(fù)雜度不大于aN3+bN2+cN+d(其中,a、b、c、d是常數(shù))。根據(jù)本發(fā)明,定義圍繞感興趣的特定特征點(diǎn)的區(qū)域的特征量。也就是說,從該區(qū)域提取距離感興趣的點(diǎn)最近的n個(gè)點(diǎn)。如果從n個(gè)點(diǎn)選擇m個(gè)點(diǎn)(基于這m個(gè)點(diǎn)計(jì)算交比,4或5〈nKn),甚至在幾何變換的情況下,在來自n個(gè)最近的點(diǎn)的某些作為結(jié)果的m個(gè)點(diǎn)的集合中可以發(fā)現(xiàn)匹配。因此,4全查來自距離各特征點(diǎn)最近的n個(gè)點(diǎn)的所有可能的m個(gè)點(diǎn)的集合。通過適當(dāng)選擇數(shù)量n和m,可以避免巨大量的計(jì)算。在本發(fā)明中,在象在Hull方法中一樣使用對于相似變換的不變量的情況下,將計(jì)算復(fù)雜度從()(N3)降低到了O(N)。在使用對于投影變換的不變量的情況下,將計(jì)算復(fù)雜度從0(N"降低到了O(N)。在使用對于仿射變換的不變量的情況下,將計(jì)算復(fù)雜度從0(N"降低到了O(N)。在基于從m個(gè)點(diǎn)所選擇的四個(gè)或五個(gè)點(diǎn)的集合計(jì)算交比的情況下,存在某些交比等于其它圖像的交比的可能性,但是在所有交比中發(fā)現(xiàn)匹配是極少的。結(jié)果,可以高精確地判斷同一性。換句話說,本發(fā)明提供了一種使用不同于在先技術(shù)的識別處理的切實(shí)可4亍的4全索方法。更具體地,部分或整個(gè)4吏用由數(shù)字照相機(jī)或掃描器等所捕獲的文檔和/或圖像作為"詢問",并且從數(shù)據(jù)庫檢索包含詢問的文檔和/或圖像。這樣一種檢索處理可為用于提取打印后的材料中的注解的預(yù)處理。利用數(shù)字照相機(jī)或掃描器的文檔和/或圖像檢索與在先技術(shù)的文檔和/或圖像檢索顯著的不同在于圖像經(jīng)受各種類型的變形。在在先技術(shù)中,由掃描器在理想條件下所獲得的文檔和/或圖像所經(jīng)受的幾何變形是通常由相似變換引起的旋轉(zhuǎn)變形。相反,由數(shù)字照相機(jī)所拍攝的文檔和/或圖像遭受由于投影變換而引起的變形。在利用掃描器捕獲書籍等三維對象上的文檔和/或圖像的情況下,例如,至少圖像的一部分遭受由于仿射變換或相似變換而引起的變形??紤]到數(shù)字照相機(jī)(尤其裝配至移動電話的數(shù)字照相機(jī))和小型掃描器的特性,希望還可以使用部分文檔和/或圖像作為用于檢索的詢問(可以基于圖像的一部分的圖像檢索)。最終,在本發(fā)明中包含上述兩個(gè)想法。其中一個(gè)想法是對于索引文檔和/或圖像使用對于幾何變換是不變量的交比?;谖臋n和/或圖像的不同部分計(jì)算交比,并且用于索引,從而允許基于部分圖像的檢索。另一個(gè)想法是對于檢索使用利用散列的投票處理。這使得可以相對高速地靈活進(jìn)行檢索,而無需外在相互關(guān)聯(lián)特征點(diǎn)。在計(jì)算機(jī)視覺的領(lǐng)域中,通常使用交比作為對于各種類型的變換的不變量。根據(jù)下面的公式計(jì)算圖l所示的同一平面上的共線點(diǎn)ABCD的交比而且,可以針對從如圖2所示的5個(gè)共面點(diǎn)所獲得的線性排列的4個(gè)點(diǎn)計(jì)算交比。這里,計(jì)算點(diǎn)ABCDE的交比作為點(diǎn)[公式l]A,B,C,D,的交比。而且,還已知如下表示的5個(gè)共面點(diǎn)的不變量。[公式2]P(A,g,C)尸(A,A五)這里,P(A,B,C)是由頂角A、B、C所定義的三角形的面積。在本發(fā)明中,基于這樣的交比計(jì)算文檔和/或圖像唯一的特征量,并將其用于文檔和/或圖像的檢索??梢允褂贸槐纫酝獾膶τ趲缀巫儞Q的不變量(幾何不變量)。幾何不變量即使在幾何變換的情況下也保持不變,并且根據(jù)幾何變換的種類有各種類型的幾何不變量。換句話說,基于根據(jù)f個(gè)共面點(diǎn)所確定的幾何不變量計(jì)算特征量。計(jì)算幾何不變量所需的點(diǎn)的數(shù)量f根據(jù)不變量的類型而不同。下面說明幾何不變量的例子。1.交比如上所述,交比是對于投影變換的不變量,并且基于5個(gè)共面點(diǎn)ABCDE(f=5)的坐標(biāo)計(jì)算為(P(A,B,C)P(A,D,E)/P(A,B,D)P(A,C,E))。由于交比是才殳影不變量,因而即4吏由于投影變形因而點(diǎn)ABCDE的坐標(biāo)發(fā)生改變,交比的值保持不變。2.仿射不變量仿射不變量是對于仿射變換的不變量。與投影變換相比,保持線的平行的仿射變換是更具限制性的。考慮到經(jīng)過投影變換的平面上的有限局部區(qū)域,投影變換近似于仿射變換。因此,認(rèn)為在基于局部排列的點(diǎn)的本發(fā)明的方法中可以代替交比使用仿射不變量。例如,基于四個(gè)共面點(diǎn)ABCD(f二4)的坐標(biāo)計(jì)算仿射不變量為P(A,C,D)/P(A,B,C).3.相似不變量與仿射變換相比,〗又基于縮;^、旋轉(zhuǎn)和轉(zhuǎn)換的相似變換更具限制性。在相似變換中,線間所定義的角度、距離比、以及面積與距離的平方的比是不變量。例如,可以使用針對三個(gè)點(diǎn)ABC(f二3)的計(jì)算為AC/AB的距離比?;趫D像中的特征點(diǎn)所獲得的不變量值是連續(xù)的,并且為了進(jìn)行索引應(yīng)該離散化不變量值。在一個(gè)優(yōu)選方法中,將不變量值量子化成k個(gè)水平,這是通過如下確定的通過在預(yù)先實(shí)驗(yàn)中準(zhǔn)備基于特征點(diǎn)所獲得的不變量值的直方圖,并根據(jù)直方圖中的不變量值的出現(xiàn)頻率向不變量值分配離散值?;谏鲜鱿敕ǎ景l(fā)明提供了一種用于基于所拍攝的數(shù)字圖像從存儲文檔和/或圖像的數(shù)據(jù)庫檢索文檔和/或圖像的文檔和/或圖像檢索方法該方法包括從所拍攝的圖像提取特征,泉;基于特征點(diǎn)的不變量值確定所拍攝的圖像的特征量;以及通過對具有匹配該數(shù)字圖像的特征量的特征量的文檔和/或圖像投票,根據(jù)存儲在數(shù)據(jù)庫中的文檔和/或圖像信息檢索與該數(shù)字圖像相對應(yīng)的文檔和/或圖像。特征點(diǎn)可以是重復(fù)出現(xiàn)在所拍攝的圖像中的特定部分。特征點(diǎn)可以是單詞區(qū)域的重心。在文檔是英語等語言的并包含相互分離的單詞區(qū)域的情況下,通過使用單詞區(qū)域的重心作為特征點(diǎn),可以精確地識別文檔的特征量。特征點(diǎn)可以是后面說明的黑色像素的連結(jié)成分的重心。特征點(diǎn)可以是日本漢字的閉鎖空間。即使文檔是日語等語言的并包含不能相互分開的單詞區(qū)域,通過使用日本漢字的閉鎖空間作為特征點(diǎn),可以精確地識別文檔的特征量。不變量值可以是交比。通過使用交比,可以基于經(jīng)過幾何變換的圖像檢索原始圖像。可以使用利用數(shù)字?jǐn)z像機(jī)或掃描器的數(shù)字照相方法。特征量可以是基于為從各局部特征點(diǎn)集合所選擇的一組特征,*所計(jì)算的不變量值而計(jì)算的值。因此,基于各局部特征點(diǎn)集合計(jì)算特征量,從而與為特征點(diǎn)的所有可能組合計(jì)算不變量值的情況相比,降低了計(jì)算復(fù)雜度。因此,減少了判斷同一性所需的處理時(shí)間。由于特征量的計(jì)算是基于各局部特征點(diǎn)集合,因而可以基于部分圖像進(jìn)行檢索??蛇x地,特征量可以是基于分別為從各局部特征點(diǎn)集合所選擇的多組特征點(diǎn)所確定的多個(gè)不變量值而計(jì)算的特征量,從而確保更高辨別力。利用該配置,使用交比集合作為特征量,這使得可以精確地判斷相似文檔和/或圖像的同一性。本發(fā)明提供了一種使計(jì)算機(jī)執(zhí)行以下步驟的文檔和/或圖像存儲方法輸入文檔和/或圖像;向輸入的文檔和/或圖像分配ID;從輸入的文檔和/或圖像提取定義圖像配置的特征點(diǎn);以及對所提取的各特征點(diǎn)進(jìn)行預(yù)定處理;預(yù)定處理包括以下步驟(1)選擇距離感興趣的特征點(diǎn)p最近的n個(gè)特征點(diǎn);以及(2)對從所選擇的n個(gè)特征點(diǎn)所選擇的m個(gè)特征點(diǎn)(nKn)的所有可能的各集合進(jìn)行預(yù)定處理;步驟(2)中的預(yù)定處理包括以下步驟(a)確定從感興趣的m個(gè)點(diǎn)的集合所選擇的d個(gè)點(diǎn)(其中,d是不大于預(yù)定數(shù)量m的數(shù)量(例如,4或5))的所有可能的集合的特征量;(b)通過預(yù)定計(jì)算,基于所確定的特征量,確定散列表的索引;以及(c)將特征量與點(diǎn)ID和文檔ID相關(guān)聯(lián)存儲在散列表中,其中,在步驟(a)中使用所確定的散列索引確定特征量,將點(diǎn)ID分配給特征點(diǎn)p,而將文檔ID分配給從其提取特征點(diǎn)的文檔和/或圖像。在該存儲方法中,將距離各特征點(diǎn)p最近的n個(gè)特征點(diǎn)定義為局部集合,并且為來自局部集合的m個(gè)點(diǎn)的集合的每一個(gè)計(jì)算特征量。因此,與從所有特征點(diǎn)選擇m個(gè)點(diǎn)的情況相比,降低了為其計(jì)算特征量的m個(gè)點(diǎn)的集合的數(shù)量。因此,減少了計(jì)算所需時(shí)間。而且,該方法允許基于部分圖像的檢索。由于為從m個(gè)特征點(diǎn)所選擇的d個(gè)點(diǎn)的所有可能的集合確定特征量,因而提高了特征量的辨別力。特征量可以由來自m個(gè)特征點(diǎn)的所有可能的5個(gè)點(diǎn)的各集合中的5個(gè)特征點(diǎn)的循環(huán)排列所確定的交比構(gòu)成。在步驟(b)中,可以根據(jù)下面的公式基于特征量計(jì)算散列索引[公式3]其中crn(n二04)是5個(gè)離散交比值,Vmax是離散交比值中最大的一個(gè),而pat是分配給來自m個(gè)點(diǎn)的5個(gè)點(diǎn)的各集合的組合模式ID,并取值0mCs-l。在步驟(b),可以根據(jù)下面的公式基于特征量計(jì)算散列索引其中,k是交比的量子化的水平的數(shù)量,H,是散列表的大小,而crn是來自m個(gè)點(diǎn)的5個(gè)點(diǎn)的集合的交比值。本發(fā)明提供了一種用于檢索通過上述存儲方法所存儲的文檔和/或圖像的檢索方法,該檢索方法使計(jì)算機(jī)執(zhí)行以下步驟讀取所拍攝的圖像;從所讀取的圖像提取定義圖像配置的特征點(diǎn);以及對所拔—取的各特征點(diǎn)進(jìn)行預(yù)定處理;預(yù)定處理包括以下步驟(l)選擇距離感興趣的特征點(diǎn)p最近的n個(gè)特征點(diǎn);以及(2)對從所選擇的n個(gè)特征點(diǎn)所選擇的m個(gè)特征點(diǎn)(m<n)的所有可能的各集合進(jìn)行預(yù)定處理;步驟(2)中的預(yù)定處理包括以下步驟(a)確定從感興趣的m個(gè)點(diǎn)的集合所選擇的d個(gè)點(diǎn)(其中,d是[公式4]不大于預(yù)定數(shù)量m的數(shù)量(例如,4或5))的所有可能的集合的特征量;(b)通過預(yù)定計(jì)算,基于所確定的特征量,確定散列表的索引;以及(c)基于確定的散列索引從散列表獲取預(yù)先輸入的文檔和/或圖像的特征量,將在步驟(a)所確定的特征量和所獲取的特征量進(jìn)行比較,并且對具有匹配特征量的文檔ID投票;以及在步驟(1)和(2)后,基于投票結(jié)果指定與所拍攝的圖像相匹配的文檔和/或圖像的文檔ID。在該檢索方法中,將距離各特征點(diǎn)p最近的n個(gè)特征點(diǎn)定義為局部集合,并且對來自局部集合的m個(gè)點(diǎn)的各集合計(jì)算特征量。因此,與從所有特征點(diǎn)選擇m個(gè)點(diǎn)的情況相比,降低了計(jì)算其的特征量的m個(gè)點(diǎn)的集合的數(shù)量。因此,減少了計(jì)算所需時(shí)間。而且,該方法允許基于部分圖像的4全索。由于為從m個(gè)特征點(diǎn)所選擇的d個(gè)點(diǎn)的所有可能集合確定特征量,因而提高了特征量的辨別力。特征量可以是為來自m個(gè)特征點(diǎn)的所有可能的5個(gè)點(diǎn)的各集合中的5個(gè)特征點(diǎn)的循環(huán)排列所確定的交比。在步驟(b)中,可以根據(jù)下面的公式基于特征量計(jì)算散列索引[公式5]"咖=i>"d+d"+-(乙+其中(^(11=0~4)是5個(gè)離散交比值,V,x是離散交比值中最大的一個(gè),而pat是分配給來自m個(gè)點(diǎn)的5個(gè)點(diǎn)的各集合的組合模式ID,并取值0mCVl。在步驟(b),可以根據(jù)下面的公式基于特征量計(jì)算散列索引[公式6]<formula>formulaseeoriginaldocumentpage21</formula>其中,k是交比的量子化的水平的數(shù)量,&&是散列表的大小,而cg是來自m個(gè)點(diǎn)的5個(gè)點(diǎn)的集合的交比值。例如,可以利用通用個(gè)人計(jì)算機(jī)實(shí)現(xiàn)文檔和/或圖像存儲方法和文檔和/或圖像檢索方法。根據(jù)本發(fā)明的另一方面,提供了一種使計(jì)算機(jī)進(jìn)行用于從存儲文檔和/或圖像的數(shù)據(jù)庫檢索與所拍攝的圖像相對應(yīng)的文檔和/或圖像的處理的程序,該處理包括從所拍攝的圖像提取特征點(diǎn);基于各特征點(diǎn)的不變量值確定圖像的特征量;以及對數(shù)據(jù)庫中具有匹配所確定的特征量的文檔和/或圖像投票。本發(fā)明還提供了一種使計(jì)算機(jī)執(zhí)行以下步驟的文檔和/或圖像存儲程序輸入文檔和/或圖像;向所輸入的文檔和/或圖像分配ID;從所輸入的文檔和/或圖像提取定義圖像配置的特征點(diǎn);以及對所提取的各特征點(diǎn)進(jìn)行預(yù)定處理;預(yù)定處理包括以下步驟(1)選4奪距離感興趣的特征點(diǎn)p最近的n個(gè)特征點(diǎn);以及(2)對從所選擇的n個(gè)特征點(diǎn)所選擇的m個(gè)特征點(diǎn)(m<n)的所有可能的各集合進(jìn)行預(yù)定處理;步驟(2)中的預(yù)定處理包括以下步驟(a)確定從感興趣的m個(gè)點(diǎn)的集合所選擇的d個(gè)點(diǎn)(其中,d是不大于預(yù)定數(shù)量m的數(shù)量(例如,4或5))的所有可能的集合的特征量;(b)通過預(yù)定計(jì)算,基于所確定的特征量,確定散列表的索引;以及(c)將特征量與點(diǎn)ID和文檔ID相關(guān)聯(lián)存儲在散列表中,其中,在步驟(a)中使用所確定的散列索引確定特征量,將點(diǎn)ID分配給特征點(diǎn)p,而將文檔ID分配給從其提取所述特征點(diǎn)的文檔和/或圖像。本發(fā)明還提供了一種用于檢索使用上述存儲程序所輸入的文檔和/或圖像的文檔和/或圖像檢索程序,該檢索程序使計(jì)算機(jī)執(zhí)行以下步驟讀取所拍攝的圖像;從所讀取的圖像提取定義圖像配置的特征點(diǎn);以及對所提取的各特征點(diǎn)進(jìn)行預(yù)定處理;預(yù)定處理包括以下步驟(l)選擇距離感興趣的特征點(diǎn)p最近的n個(gè)特征點(diǎn);以及(2)對從所選擇的n個(gè)特征點(diǎn)所選擇的m個(gè)特征點(diǎn)(nKn)的所有可能的各集合進(jìn)行預(yù)定處理;步驟(2)中的預(yù)定處理包括以下步驟(a)確定從感興趣的m個(gè)點(diǎn)的集合所選擇的d個(gè)點(diǎn)(其中,d是不大于預(yù)定數(shù)量m的數(shù)量(例如,4或5))的所有可能的集合的特征量;(b)通過預(yù)定計(jì)算,基于所確定的特征量,確定散列表的索引;以及(c)基于所確定的散列索引從散列表獲取預(yù)先輸入的文檔和/或圖像的特征量,將在步驟(a)所確定的特征量和所獲取的特征量進(jìn)行比較,并且對具有匹配特征量的文檔ID投票;以及在步驟(1)和(2)后,基于投票結(jié)果指定與所拍攝的圖像相匹配的文檔和/或圖像的文檔ID。例如,可以在通用個(gè)人計(jì)算機(jī)上執(zhí)行文檔和/或圖像存儲程序和文檔和/或圖像檢索程序。根據(jù)本發(fā)明的另一方面,提供了一種存儲設(shè)備,包括輸入部,輸入文檔和/或圖像;特征點(diǎn)提取部,從所輸入的文檔和/或圖像提取定義圖像配置的特征點(diǎn);特征點(diǎn)選擇部,選擇距離所提取的感興趣的特征點(diǎn)p最近的n個(gè)特征點(diǎn);以及特征量存儲部,對從所選4奪的n個(gè)特征點(diǎn)所選擇的m個(gè)特征點(diǎn)(m<n)的所有可能的各集合進(jìn)行預(yù)定處理;預(yù)定處理包括以下步驟(a)確定從感興趣的m個(gè)點(diǎn)的集合所選擇的d個(gè)點(diǎn)(其中,d是不大于預(yù)定數(shù)量m的數(shù)量(例如,4或5))的所有可能的集合的特征量;(b)通過預(yù)定計(jì)算,基于所確定的特征量,確定散列表的索引;以及(c)將特征量與點(diǎn)ID和文檔ID相關(guān)聯(lián)存儲在散列表中,其中,在步驟(a)中使用所確定的散列索引確定特征量,將點(diǎn)ID分配給特征點(diǎn)p,而將文檔ID分配給從其提取特征點(diǎn)的文檔和/或圖像。文檔和/或圖像存儲設(shè)備可以使用通用個(gè)人計(jì)算機(jī)作為硬件。在這種情況下,輸入部包括與用于傳送文檔和/或圖像數(shù)據(jù)的外部裝置進(jìn)行通信的通信I/F、和用于對于存儲數(shù)據(jù)的記錄介質(zhì)進(jìn)行讀寫的驅(qū)動器(例如,DVD驅(qū)動器或CD驅(qū)動器)、或者讀取圖像的掃描器。通過使個(gè)人計(jì)算機(jī)的CPU執(zhí)行所安裝的應(yīng)用程序,進(jìn)行特征點(diǎn)提取部、特征點(diǎn)選4奪部和特征量存儲部的功能??蛇x地,可以利用使用DSP和ASIC的專用石更件^丸行這些功能。而且,本發(fā)明提供了一種存儲由該存儲設(shè)備所存儲的文檔和/或圖像的文檔和/或圖像存儲設(shè)備。該文檔和/或圖像存儲設(shè)備使用通用文件服務(wù)器作為硬件。本發(fā)明還提供了一種用于檢索存儲在上述文檔和/或圖像存儲設(shè)備中的文檔和/或圖像的文檔和/或圖像檢索設(shè)備,該檢索設(shè)備包括讀取部,讀取所拍攝的圖像;特征點(diǎn)提取部,從所讀取的圖像提取定義圖像配置的特征點(diǎn);特征點(diǎn)選擇部,選擇距離所提取的感興趣的特征點(diǎn)P最近的n個(gè)特征點(diǎn);以及投票部,對從所選擇的n個(gè)特征點(diǎn)所選擇的m個(gè)特征點(diǎn)(m<n)的所有可能的各集合進(jìn)行預(yù)定處理;(a)確定從感興趣的m個(gè)點(diǎn)的集合所選擇的d個(gè)點(diǎn)(其中,d是不大于預(yù)定數(shù)量m的數(shù)量(例如,4或5))的所有可能的集合的特征量;(b)通過預(yù)定計(jì)算,基于所確定的特征量,確定散列表的索引;以及(c)基于所確定的散列索引從散列表獲取預(yù)先輸入的文檔和/或圖像的特征量,將在步驟(a)所確定的特征量和所獲取的特征量進(jìn)行比較,并且對具有匹配特征量的文檔ID投票;以及文檔ID指定部,基于通過與各特征點(diǎn)相對應(yīng)的投票所確定的投票結(jié)果,指定與所拍攝的圖像相匹配的文檔和/或圖像的文檔ID。文檔和/或圖像檢索設(shè)備可以使用通用個(gè)人計(jì)算機(jī)作為硬件。在這種情況下,讀取部包括用于接收所拍攝的圖像的通信I/F、以及用于從其中記錄所拍攝的圖像的SD卡(注冊商標(biāo))或存儲器棒(注冊商標(biāo))等記錄介質(zhì)讀取數(shù)據(jù)的I/F。通過使個(gè)人計(jì)算機(jī)的CPU執(zhí)行所安裝的應(yīng)用程序,執(zhí)行特征點(diǎn)提取部、特征點(diǎn)選擇部和投票部的功能??蛇x地,可以利用使用DSP和ASIC的專用硬件進(jìn)行這些功能。文檔和/或圖像檢索設(shè)備可以具有與文檔和/或圖像存儲設(shè)備一樣的功能。可選地,文檔和/或圖像才全索設(shè)備還可以用作文檔和/或圖像存儲設(shè)備。文檔和/或圖像檢索設(shè)備還可以用作文檔和/或圖像存儲設(shè)備以及文檔和/或圖像存儲設(shè)備。這里的術(shù)語"文檔,,是指數(shù)據(jù)庫中積累的和從數(shù)據(jù)庫檢索的文本信息。文檔的例子包括合同文書和宣傳冊等商務(wù)文檔、科學(xué)技術(shù)論文、報(bào)紙和目錄冊。這里將術(shù)語"圖像"定義為拍攝的、被積累在數(shù)據(jù)庫中和從數(shù)據(jù)庫中檢索的非文本模式信息。圖像的例子包括圖形、圖畫、照片和海報(bào)。文檔和/或圖像屬于圖像的范疇。這里的術(shù)語"連結(jié)成分,,是指圖像中相互連結(jié)的一組像素。更具體地,在存在與一個(gè)像素垂直和橫向成連結(jié)關(guān)系的像素的情況下,相互連結(jié)這些像素以形成連結(jié)成分。這里的術(shù)語"特征點(diǎn)"是指表示圖像的特征量的各個(gè)點(diǎn),并且通過圖像處理提取特征點(diǎn)。這里的術(shù)語"不變量"是表示對于幾何變換是不變的參量的通稱。幾何變換的一個(gè)例子是旋轉(zhuǎn)。即使旋轉(zhuǎn)圖像,圖像中的對象的面積也不會改變。因此,對象的面積是對于旋轉(zhuǎn)的示例不變量。而且,邊長比是對于縮放的示例不變量。除旋轉(zhuǎn)和縮放等相似變換以外,幾何變換的例子包括投影變換和仿射變換。這里的術(shù)語"投票"是指在信息處理領(lǐng)域中用于計(jì)算部分證據(jù)(partialevidences)的處理。更具體地,在該處理中,基于所獲取的證據(jù)給予可選項(xiàng)的得分,并且選擇可選項(xiàng)之中具有最高累積得分的那個(gè)。大體而言,證據(jù)具有不同的得分。而且,這里的術(shù)語"詢問"是表示用戶的檢索請求的數(shù)據(jù)。在本發(fā)明中,用戶輸入圖像作為詢問。也就是說,用戶輸入詢問圖像,以從數(shù)據(jù)庫檢索匹配詢問圖像的圖像。本發(fā)明的效果根據(jù)本發(fā)明,從由數(shù)字照相機(jī)或掃描器等所捕獲的圖像提取特征點(diǎn),并且基于特征點(diǎn)計(jì)算用于文檔和/或圖像檢索的不變量值。因此,可以精確地檢索想要的文檔和/或圖像。圖l是用于解釋根據(jù)本發(fā)明的交比的例子的圖;圖2是用于解釋根據(jù)本發(fā)明的交比的另一例子的圖;圖3是示出用于本發(fā)明中的文檔和/或圖像檢索系統(tǒng)的框圖;圖4是示出根據(jù)本發(fā)明的輸入的圖像的例子的說明圖;圖5是示出根據(jù)圖4的二值圖像的說明圖;圖6是通過處理圖5的圖像所獲得的圖像的說明圖;圖7是通過進(jìn)一步處理圖6的圖像所獲得的圖像的說明圖;圖8是用于解釋根據(jù)本發(fā)明的特征點(diǎn)的圖;圖9是用于解釋根據(jù)本發(fā)明的特征點(diǎn)的圖;圖IO是示出根據(jù)本發(fā)明的特征點(diǎn)和交比之間的關(guān)系的說明圖;圖ll是用于解釋根據(jù)本發(fā)明的特征點(diǎn)的圖;圖12是用于解釋根據(jù)本發(fā)明(實(shí)施例l)的存儲處理的過程的圖13是用于解釋根據(jù)本發(fā)明(實(shí)施例l)的散列表的結(jié)構(gòu)的圖;圖14是用于解釋根據(jù)本發(fā)明(實(shí)施例l)的一企索處理的過程的圖;圖15是用于解釋根據(jù)本發(fā)明的一次投票表的圖;圖16是用于解釋根據(jù)本發(fā)明的二次投票表的圖;圖17是示出根據(jù)本發(fā)明的數(shù)據(jù)庫中的圖像的說明圖;圖18是示出根據(jù)本發(fā)明的數(shù)據(jù)庫中的另一圖像的說明圖;圖19是示出本發(fā)明實(shí)驗(yàn)l中所使用的示例拍攝的圖像的說明圖;圖20是示出本發(fā)明實(shí)驗(yàn)l中所使用的另一示例拍攝的圖像的說明圖;圖21是示出本發(fā)明實(shí)驗(yàn)l中所使用的另一示例拍攝的圖像的說明圖;圖22是示出本發(fā)明實(shí)驗(yàn)1中所使用的另一示例拍攝的圖像的說明圖;圖23是示出本發(fā)明實(shí)驗(yàn)2中所使用的示例拍攝的圖像的說明圖;圖24是示出本發(fā)明實(shí)驗(yàn)2中所使用的另一示例拍攝的圖像的說明圖;圖25是示出本發(fā)明實(shí)驗(yàn)2中所使用的另一示例拍攝的圖像的說明圖;圖26是示出本發(fā)明實(shí)驗(yàn)2中所使用的另一示例拍攝的圖像的說明圖;圖27是示出本發(fā)明實(shí)驗(yàn)2中所使用的另一示例拍攝的圖像的說明圖;圖28是用于解釋根據(jù)本發(fā)明(實(shí)施例2)的存儲處理的過程的圖;圖29是用于解釋根據(jù)本發(fā)明(實(shí)施例2)的散列表的結(jié)構(gòu)的圖;圖30是用于解釋根據(jù)本發(fā)明(實(shí)施例2)的檢索處理的過程的圖;圖31是用于解釋根據(jù)本發(fā)明(實(shí)施例2)在投票處理中如何使詢問中的特征點(diǎn)p與所存儲的文檔中的點(diǎn)相互關(guān)聯(lián)的圖;圖32是示出本發(fā)明實(shí)驗(yàn)3中所使用的示例拍攝的圖像的說明圖;圖33是示出本發(fā)明實(shí)驗(yàn)3中確定的存儲在數(shù)據(jù)庫中的頁數(shù)和檢索精度之間的關(guān)系的曲線圖;圖34是示出本發(fā)明實(shí)驗(yàn)3中所使用的示例詢問的說明圖;圖35是示出本發(fā)明實(shí)驗(yàn)4中所確定的存儲在數(shù)據(jù)庫中的頁數(shù)和檢索所需時(shí)間之間的關(guān)系的曲線圖;圖36是用于解釋根據(jù)本發(fā)明的提取特征點(diǎn)的示例過程的流程圖;圖37是示出將文檔中的注解包括進(jìn)電子文檔的系統(tǒng)的示例結(jié)構(gòu)的說明圖;圖38是用于解釋如何使得拍攝的圖像成正確方向的圖;圖39是示出根據(jù)本發(fā)明的文檔和/或圖像存儲設(shè)備的結(jié)構(gòu)的框圖;圖40是示出根據(jù)本發(fā)明的文檔和/或圖像檢索設(shè)備的結(jié)構(gòu)的框圖;圖41是用于解釋來自n個(gè)點(diǎn)(n^8)的所有可能的m個(gè)點(diǎn)的組合(m二7)的圖(實(shí)施例2);圖42是用于解釋m個(gè)點(diǎn)(m^7)的排列的圖,其中,通過f個(gè)點(diǎn)的組合所計(jì)算的不變量值定義每一個(gè)點(diǎn)(實(shí)施例2);圖43是用于解釋不同于圖28所示的存儲過程的圖(實(shí)施例2);圖44是解釋不同于圖30所示的檢索過程的圖(實(shí)施例2);圖45是示出存儲在數(shù)據(jù)庫中的示例文檔的說明圖(實(shí)施例2的實(shí)驗(yàn));圖46是示出示例詢問的說明圖C另一實(shí)驗(yàn));圖47是示出攝影角度和檢索精度之間的關(guān)系的曲線圖(另一實(shí)驗(yàn));圖48是示出處理時(shí)間和作為處理時(shí)間的表示的T(n,m,l)之間的關(guān)系的曲線圖(另一實(shí)驗(yàn));圖49是示出量子化水平的數(shù)量和檢索精度之間的關(guān)系、以及量子化水平的數(shù)量和處理時(shí)間之間的關(guān)系的曲線圖(另一實(shí)驗(yàn));圖50是示出所存儲的頁數(shù)和檢索精度之間的關(guān)系的曲線圖(另一實(shí)驗(yàn));圖51是示出導(dǎo)致失敗檢索的示例詢問的說明圖(另一實(shí)驗(yàn));圖52是示出所存儲的頁數(shù)和檢索速度之間的關(guān)系、以及所存儲的頁數(shù)和列表長度之間的關(guān)系的曲線圖(另一實(shí)驗(yàn));圖53是示出存儲在數(shù)據(jù)庫中的示例文檔的說明圖(另一實(shí)驗(yàn));圖54是示出示例詢問的說明圖(另一實(shí)驗(yàn));圖55是示出具有不同參數(shù)的攝影角度和檢索精度之間的關(guān)系的曲線圖(另一實(shí)驗(yàn));圖56是示出n個(gè)點(diǎn)(n^3)中的m個(gè)點(diǎn)(m=2)的位置關(guān)系的說明圖(另一實(shí)驗(yàn));圖57是用于解釋通過使用本發(fā)明的方法對非文本圖像進(jìn)行的示例處理的圖(d=16,n=28,m=l)(^—實(shí)驗(yàn))。附圖標(biāo)記的說明1:文檔和/或圖像存儲設(shè)備3:4全索i殳備11輸入部15特征點(diǎn)-提取部17特征點(diǎn)選擇部19特征點(diǎn)存儲部21讀耳又部23特征點(diǎn)揭:取部25特4正點(diǎn)選一奪部27投票部29ID指定部31文檔和/或圖像數(shù)據(jù)庫具體實(shí)施方式圖3示出根據(jù)本發(fā)明的文檔和/或圖像檢索系統(tǒng)的結(jié)構(gòu)。通過特征點(diǎn)的提取將文檔和/或圖像轉(zhuǎn)換成一組點(diǎn)。然后,將這一組點(diǎn)輸入給用于存儲的存儲處理、或者輸入給用于檢索的檢索處理。在存儲處理中,基于特征點(diǎn)計(jì)算交比,并將其轉(zhuǎn)換成索引,基于索引,將文檔和/或圖像存儲在散列表中。另一方面,在檢索處理中,以相同方式基于特征點(diǎn)計(jì)算索引,并且通過投票檢索想要的文檔和/或圖像。散列(hash)允許高速訪問數(shù)據(jù)庫中的數(shù)據(jù)。為將被存儲在散列表中的數(shù)據(jù)定義關(guān)鍵字(key),并且將數(shù)據(jù)存儲在基于關(guān)鍵字所計(jì)算的位置(地址)處。更具體地,準(zhǔn)備散列表,將數(shù)據(jù)列表的指針存儲在散列表的各元素中,其中,散列表是通過這些關(guān)鍵字索引的數(shù)組的表。根據(jù)關(guān)鍵字計(jì)算散列表的索引,并參考散列表將數(shù)據(jù)存儲在通過基于所計(jì)算的索引所確定的指針?biāo)x的地址中。用于將關(guān)鍵字轉(zhuǎn)換成散列表的索引的函數(shù)是散列函數(shù)。當(dāng)檢索所存儲的數(shù)據(jù)時(shí),根據(jù)散列函數(shù),基于關(guān)鍵字確定散列表的索引,并且對于數(shù)據(jù)的檢索,使用存儲在基于所確定的索引所參考的散列表的元素中的指針。以下說明該處理的步驟。特征點(diǎn)的提取對于特征,泉的提取重要的是特征點(diǎn)的再現(xiàn)性。也就是說,甚至在幾何變換、噪聲和較低分辨率的影響下,也應(yīng)該完全一致地獲得特征點(diǎn)。4吏用英文文檔中的各個(gè)單詞的重心(centroid)作為特征點(diǎn)以滿足該要求。這是因?yàn)椋谟⑽奈臋n中的單詞之間存在空格,這使得可以相對容易地分離單詞。利用例子簡要說明特征點(diǎn)提取的過程。通過自適應(yīng)二值化將輸入的圖像(圖4)轉(zhuǎn)換成二值圖像(圖5)。接著,以下面的方式從二值圖像檢測單詞區(qū)域。首先,利用高斯濾波器平滑化(模糊)二值圖像。此時(shí),基于對字符大小的估計(jì)(連結(jié)成分的面積的模式值(modevalue)的平方根)自適應(yīng)地確定高斯濾波器的參數(shù)。平滑化后的圖像再次經(jīng)過自適應(yīng)二值化以提供二值圖像(圖6)。該圖像中的連結(jié)成分被當(dāng)作為單詞區(qū)域,并且將各單詞區(qū)域的重心定義為特征點(diǎn)。從圖6所示的圖像獲得圖7所示的特征點(diǎn)。接著,參考圖36所示的流程圖詳細(xì)說明該過程。根據(jù)圖36(a)的流程圖處理輸入的圖像,以提供特征點(diǎn)的集合。第一步驟是大小校正步驟。在其中,輸入的圖像是裝配到移動電話的照相機(jī)所拍攝的圖像,該圖像的大小明顯不同于普通圖像大小。因此,對于大小校正,放大輸入的圖像。接著,進(jìn)行通過下面的公式所定義的自適應(yīng)二值化步驟。[公式7]<formula>formulaseeoriginaldocumentpage31</formula>[公式8]<formula>formulaseeoriginaldocumentpage31</formula>其中,I表示輸入的圖像(灰度圖像),F(xiàn)表示輸出的圖像(二值圖像),T表示通過上面的公式(2)自適應(yīng)定義的閾值,b是用于確定閾值的所參考的塊(block)的大小,而s是用于控制閾值的獲得的值作為閾值。圖36(b)示出預(yù)處理步驟。根據(jù)系統(tǒng)模式,即,用于將文檔和/或圖像存儲在數(shù)據(jù)庫中的數(shù)據(jù)庫結(jié)構(gòu)模式或用于檢索與所拍攝的圖像相對應(yīng)的文檔和/或圖像的檢索模式,以不同的方式進(jìn)行預(yù)處理步驟。如果在系統(tǒng)模式不是數(shù)據(jù)庫結(jié)構(gòu)模式時(shí),以亞曰f通檢索模式進(jìn)行檢索操作,而不使用移動電話照相機(jī),則消除(remove)各自具有較小面積的連結(jié)成分。另一方面,在數(shù)據(jù)庫結(jié)構(gòu)模式中,為了估計(jì)字符大小,確定連結(jié)成分的面積的模式值的平方根。為了確定用于平滑化的參數(shù)c,字符大小乘以HashScale。在平滑化中,根據(jù)下面的公式確定高斯濾波器的標(biāo)準(zhǔn)差cj:[公式9]<formula>formulaseeoriginaldocumentpage31</formula>然后,通過由該公式所定義的高斯濾波器平滑化圖像,并通過自適應(yīng)二值化將圖像再次轉(zhuǎn)換成二值圖像。從而預(yù)處理圖像。參考圖36(c)的流程圖,預(yù)處理步驟隨后的步驟是平滑化參數(shù)估計(jì)步驟。以與上述參數(shù)估計(jì)相同的方式進(jìn)行該步驟。同樣以與上述相同的方式進(jìn)行下一平滑化步驟。在平滑化步驟后,再次通過自適應(yīng)二值化將圖像轉(zhuǎn)換成二值圖像。最后,從通過該處理所獲得的二值圖像提取連結(jié)成分,并將連結(jié)成分的重心確定為特征點(diǎn)。用于索引的特征量的計(jì)算用于存儲和檢索的關(guān)鍵字是如何基于交比計(jì)算散列表的索引。在詳細(xì)說明存儲和檢索前,說明用于確定索引的特征量的計(jì)算?;趫D像中的特征點(diǎn)所計(jì)算的交比的值是連續(xù)值。為了用于確定索引,將交比值離散化成k個(gè)水平。為了吸收由于幾何變換和攝影條件的改變而產(chǎn)生的誤差,數(shù)量k適宜相對小。如果數(shù)值k過小,則降低了辨別力。因此,應(yīng)該適當(dāng)選擇數(shù)量k。這里,所利用例子采用基于預(yù)先實(shí)驗(yàn)的結(jié)果所確定的k=9,但是這不是限制性的。確定各特征點(diǎn)周圍的局部區(qū)域的特征量以使得可以基于圖像的一部分檢索。為圍繞特征點(diǎn)的局部區(qū)域所定義的特征量的可能例子如下(1)距離特征點(diǎn)最近的5個(gè)點(diǎn)的交比;(2)基于從距離特征點(diǎn)最近的n個(gè)點(diǎn)所選擇的5個(gè)點(diǎn)的集合的交比;(3)從距離特征點(diǎn)最近的n個(gè)點(diǎn)所選擇的m個(gè)點(diǎn)的排列和基于從m個(gè)點(diǎn)所選擇的5個(gè)點(diǎn)的集合的交比。在本發(fā)明中,采用最復(fù)雜的特征量(3)。從最簡單的一個(gè)開始說明這三個(gè)特征量。而且,將說明本發(fā)明中所采用的特征量和為什么使用最復(fù)雜的特征量的原因。5個(gè)最近點(diǎn)的交比基于圍繞特征點(diǎn)的局部區(qū)域的交比定義特征量的容易想到的方法是計(jì)算距離特征點(diǎn)最近的5個(gè)點(diǎn)的交比。例如,如圖8所示,選擇距離特征點(diǎn)p最近的5個(gè)點(diǎn)1~5,并計(jì)算這5個(gè)點(diǎn)的交比,以采用其作為點(diǎn)p的特征量。然而,在以圖8和9所示的不同角度所拍攝的文檔和/或圖像中,最近的5個(gè)點(diǎn)可能變化。因此,該方法的問題在于從同一文檔所獲得的文檔和/或圖像不能提供同一特征點(diǎn)的相同特征量?;趶膎個(gè)最近點(diǎn)所選擇的5個(gè)點(diǎn)的集合的交比另一想到的方法是提取從n個(gè)最近點(diǎn)所選擇的5個(gè)點(diǎn)的所有可能的集合,并基于各5個(gè)點(diǎn)的集合計(jì)算交比。圖8和9所示的文檔和/或圖像在5個(gè)最近點(diǎn)上是不一致的,但是在8個(gè)最近點(diǎn)中的7個(gè)點(diǎn)上是一致的。因此,n個(gè)最近點(diǎn)包括基本保持不變的m(〈n)個(gè)點(diǎn)。因此,在計(jì)算從n個(gè)點(diǎn)所選擇的5個(gè)點(diǎn)的所有可能的集合的交比的情況下,推測在基于從共同的m個(gè)點(diǎn)所選擇的5個(gè)點(diǎn)的集合所計(jì)算的交比是一致的。因此,采用基于從n個(gè)點(diǎn)所選擇的5個(gè)點(diǎn)的所有可能的集合所計(jì)算的交比作為特征量。如果在比較步驟中,與基于來自共同的m個(gè)點(diǎn)的5個(gè)點(diǎn)的集合所計(jì)算的交比中的任何一個(gè)一致的交比的數(shù)量不小于預(yù)定數(shù)量,則認(rèn)為文檔和/或圖像中感興趣的特征點(diǎn)是相同的。然而,實(shí)際一全索中該特征量的使用經(jīng)常導(dǎo)致不正確的4全索結(jié)果。參考圖IO,例如,為了簡單,這里假定基于從距離各特征點(diǎn)最近的n個(gè)點(diǎn)所選擇的點(diǎn)的集合,計(jì)算四個(gè)交比。還假定為特征點(diǎn)A所計(jì)算的交比集合為(0.2,1.3,0.3,1.8),而為特征點(diǎn)B所計(jì)算的交比集合為(1.2,1.6,0.1,0.2)。如果以步長0.5離散化這些交比,則特征點(diǎn)A和特征點(diǎn)B的離散化后的交比的集合分別為(O,2,0,3)和(2,3,0,0)。僅考慮交比的值,值0、2和3共同出現(xiàn)在特征點(diǎn)A和B的交比的集合中,因此判斷特征點(diǎn)A和B是相同的。在以該方式對實(shí)際圖像確定交比的情況下,這樣的情況經(jīng)常發(fā)生,結(jié)果導(dǎo)致失敗檢索。從n個(gè)最近點(diǎn)所選擇的m個(gè)點(diǎn)的排列和基于從m個(gè)點(diǎn)所選擇的5個(gè)點(diǎn)的集合的交比上述問題的解決方案是同時(shí)考慮交比的順序。也就是說,在圖10所示的例子中,交比組(O,2,0,3)區(qū)別于交比組(2,3,0,0)。參考圖ll,更具體地,假定圍繞從同一文檔所獲得的不同圖像中的相應(yīng)的點(diǎn)分別定義一組8個(gè)點(diǎn)ABCDEFGH和一組8個(gè)點(diǎn)IJKLMNOP。這兩個(gè)8個(gè)點(diǎn)的組僅在一個(gè)點(diǎn)E、L是不一致的,而在其余7個(gè)點(diǎn)是一致的。因此,在從每一個(gè)8個(gè)點(diǎn)的組中的8個(gè)點(diǎn)選擇7個(gè)點(diǎn)的所有可能的集合的情況下,一組點(diǎn)ABCDFGH與一組點(diǎn)IJKMNOP是相同的。因此,在通過在每一相同的7個(gè)點(diǎn)的集合中從共同的7個(gè)點(diǎn)以預(yù)定順序選擇5個(gè)點(diǎn)來定義有序的5個(gè)點(diǎn)的所有可能的集合的情況下,有序的5個(gè)點(diǎn)的集合是一致的。也就是說,在基于來自每一8個(gè)點(diǎn)的組中的共同的7個(gè)點(diǎn)的所有可能的有序的5個(gè)點(diǎn)的集合來計(jì)算交比的情況下,即,計(jì)算一組點(diǎn)ABCDF和一組點(diǎn)IJKMN的交比和一組點(diǎn)ABCDG和一組點(diǎn)IJKMO的交比等的情況下,作為結(jié)果的7個(gè)點(diǎn)的組的交比序列在交比的順序和各交比的值上是相同的。很少有基于不同的7個(gè)點(diǎn)的集合所確定的交比序列在交比順序和交比值上是相同的。因此,通過釆用交比序列作為特征量可以解決上述問題。概括地說,首先提耳又距離特定點(diǎn)最近的n個(gè)點(diǎn),然后定義從n個(gè)點(diǎn)所選擇的m個(gè)點(diǎn)的所有可能的集合。而且,定義從m個(gè)點(diǎn)按照預(yù)定順序所選擇的有序的5個(gè)點(diǎn)的所有可能的集合,并且順序計(jì)算各有序的5個(gè)點(diǎn)的集合的交比。如果在交比序列中發(fā)現(xiàn)至少1個(gè)交比的值和位置一致,則判斷這些交比序列具有相同特征量。實(shí)施例1存儲基于上述的準(zhǔn)備處理說明存儲處理。當(dāng)將文檔和/或圖像存儲在數(shù)據(jù)庫中時(shí),從文檔和/或圖像提取特征點(diǎn),而且計(jì)算各特征點(diǎn)的特征量并將其與文檔和/或圖像相關(guān)聯(lián)存儲。在獲取所拍攝的圖像的數(shù)據(jù)時(shí),計(jì)算圖像數(shù)據(jù)的特征量,并且檢查存儲在數(shù)據(jù)庫中的各文檔和/或圖像的特征量與所計(jì)算的特征量一致,從而從存儲在數(shù)據(jù)庫中的文檔和/或圖像檢索與所拍攝的圖像的數(shù)據(jù)相對應(yīng)的文檔和/或圖像。圖12示出存儲處理的示例過程。在該處理中,文檔ID是分配給各文檔的標(biāo)識號。點(diǎn)ID是分配給每一文檔中的各點(diǎn)的標(biāo)識號,a。Cm模式ID是分配給從n個(gè)點(diǎn)所選擇的m個(gè)點(diǎn)的各組的且取值0~nCm-l的標(biāo)識號。相似地,amC5模式ID是分配給從m個(gè)點(diǎn)所選擇的5個(gè)點(diǎn)的各組的且取值0~mC5-1的標(biāo)識號。圖13示出散列表的結(jié)構(gòu),將文檔和/或圖像存儲在散列表中。這里將術(shù)語"文檔圖像"定義為文檔的圖像。在存儲處理中,重復(fù)處理序列,在其中,在行5~8確定散列表的索引,并且在行9使用索引將上述的ID存儲在散列表中。根據(jù)圖12所示的過程進(jìn)一步說明存儲處理。在行5~7,基于一組5個(gè)的點(diǎn)計(jì)算5個(gè)交比。使用循環(huán)移位起始點(diǎn)所獲得的5個(gè)點(diǎn)ABCDE的4盾》不^卜歹'J的ABCDE、BCDEA、CDEAB、DEABC和EABCD,獲得5個(gè)交比。在行8,根據(jù)下面的散列函數(shù)計(jì)算散列表的索引[公式IO]<formula>formulaseeoriginaldocumentpage36</formula>其中,crn(n=0~4)是5個(gè)交比的離散值,V腦x是離散交比值的最大值,而pat是mC5模式ID。在行9,使用索引將列表(文檔ID、點(diǎn)ID、nCm模式ID)存儲在散列表中。當(dāng)發(fā)生沖突時(shí),如圖13所示,以列表形式另外存儲數(shù)據(jù)。不僅將文檔ID而且還將點(diǎn)ID和。Cm模式ID存儲在散列表中。這是因?yàn)椋?dāng)在檢索處理中比較特征量時(shí),針對每一列表(文檔ID、點(diǎn)ID和nCm模式ID)確定交比序列中的匹配的交比的數(shù)量。檢索接著說明4全索處理。圖14示出4企索處理的示例過程。在本發(fā)明中,參考圖15所示的一次投票表,檢查是否在交比序列中發(fā)現(xiàn)了至少預(yù)定數(shù)量l個(gè)交比匹配。如果發(fā)現(xiàn)了匹配,在圖16所示的二次投票表中對相應(yīng)的文檔進(jìn)行投票以提供檢索結(jié)果。為了適當(dāng)確定數(shù)量l,通過使用一些可能的數(shù)量l(l、Cm)預(yù)先進(jìn)行實(shí)驗(yàn),并采用提供正確檢索結(jié)果與錯(cuò)誤檢索結(jié)果的最高比的數(shù)量作為數(shù)量l。以與存儲處理相同的方式說明檢索處理。在圖14所示的檢索處理中的行6~9,以與存儲處理相同的方式確定散列表的索引,并在行10從散列表讀取圖13所示的列表。對于列表中的每一元素,對于一次投票表的相應(yīng)單元格(cell)進(jìn)行投票。在重復(fù)這些步驟完成對來自m個(gè)點(diǎn)的所有5個(gè)點(diǎn)的集合的投票后,檢查一次投票表的單元格。如果檢測到了具有不少于l的投票數(shù)量的單元格,則對二次投票表中的相應(yīng)的文檔ID投票最后,最終確定二次投票表中具有最大投票數(shù)量的文檔作為檢索結(jié)果。在行4,通過在點(diǎn)集Pm中移位起始點(diǎn)形成點(diǎn)集Pm的點(diǎn)的所有可能的循環(huán)排列{P,m},并且以上述方式處理循環(huán)排列{P,m}。該步驟對應(yīng)于用于從點(diǎn)集Pm形成m個(gè)循環(huán)排列(P,4的處理。例^口,,人ABCDEFG,開j成^盾^不4非歹'JBCDEFGA禾口CDEFGAB等。該步驟是處理旋轉(zhuǎn)圖像所需要的。實(shí)施例2-更高速的處理將說明根據(jù)本發(fā)明的一種方法,在其中,與實(shí)施例l相比,減少了存儲或檢索所需的處理時(shí)間。在說明改進(jìn)的存儲和檢索方法前,給出對于特征量的計(jì)算的補(bǔ)充"i兌明。特征量的計(jì)算1.特征量需要滿足的條件這里將特征量定義為表示文檔圖像中的各特征點(diǎn)的值。計(jì)算用于檢索的詢問的和將存儲的文檔的特征點(diǎn)的特征量,并且通過將詢問的特征量與所存儲的文檔的每一個(gè)的特征量進(jìn)行比較,判斷詢問是否匹配所存儲的文檔中的任何一個(gè)?;跈z索的準(zhǔn)確度和檢索所需的計(jì)算復(fù)雜度,估計(jì)特征量。認(rèn)為使得可以準(zhǔn)確且高速檢索與詢問相對應(yīng)的所存儲的文檔的特征量是良好的。如下定義了為了準(zhǔn)確度特征量需要滿足的兩個(gè)條件。第一條件是即使在各種類型的變形的影響下,為同一文檔的相同點(diǎn)所計(jì)算的特征量應(yīng)該保持不變。如果為詢問和相應(yīng)的所存儲的文檔計(jì)算不同的特征量,則在檢索處理中不可能發(fā)現(xiàn)匹配的特征點(diǎn)。將該條件稱為"特征量的穩(wěn)定性"。第二條件是為不同點(diǎn)所計(jì)算的特征量應(yīng)該不同。如果為不同的文檔計(jì)算相同的特征量,則在檢索處理中不僅檢測匹配的特征點(diǎn),而且還檢測不相關(guān)的特征點(diǎn)。將這一條件稱為"特征量的辨別力"。而且,第三條件是特征量的計(jì)算需要相對小的計(jì)算復(fù)雜度。當(dāng)然難以使用需要巨大計(jì)算量的特征量,即使該特征量具有更高的穩(wěn)定性和更高的辨別力。因此,除上述的針對準(zhǔn)確度的兩個(gè)條件以外,特征量應(yīng)該滿足為了較小計(jì)算復(fù)雜度的條件。為了更高速和更高準(zhǔn)確度的文檔圖像檢索,特征量應(yīng)該滿足這三個(gè)條件。2.特征量的穩(wěn)定性對于上述三個(gè)條件,首先說明特征量的穩(wěn)定性。在如上所述的本發(fā)明的方法中,基于距離各特征點(diǎn)最近的點(diǎn)的不變量值,計(jì)算特征量。為了穩(wěn)定提供特征量,即使由于透視變形而最近的點(diǎn)的坐標(biāo)發(fā)生變化,計(jì)算特征量所使用的最近的點(diǎn)也應(yīng)該保持不變。如圖8和9所示,在透視變形的影響下,最近的點(diǎn)發(fā)生改變。因此,如果使用基于距離特征點(diǎn)p最近的f個(gè)點(diǎn)所計(jì)算的不變量值作為特征量,則對于同一特征點(diǎn)p不可能提供相同的特征量。因此,在本發(fā)明中,定義從更大范圍中的距離特征點(diǎn)最近的點(diǎn)所選擇的多個(gè)點(diǎn)的集合,并且基于多個(gè)點(diǎn)的各個(gè)集合計(jì)算多個(gè)特征量。這是基于假定即使在透視變形的影響下,圖像中共同存在更大范圍中的n個(gè)最近點(diǎn)(圖8和9中的8個(gè)點(diǎn))中m個(gè)點(diǎn)(圖8和9中的7個(gè)點(diǎn))。Wi定在圖J象中共同存在n個(gè)最近點(diǎn)中的m個(gè)點(diǎn),則如圖41所示,定義來自n個(gè)點(diǎn)的所有可能的m個(gè)點(diǎn)的集合PJ0)、Pm(l).....Pm(nCm-l),并且計(jì)算各點(diǎn)集的特征量。在這種情況下,為各特征點(diǎn)所計(jì)算的特征量至少包括一個(gè)共同的特征量。3.特征量的辨別力接著說明特征量的辨別力。在本發(fā)明的方法中,通過增加用于計(jì)算單個(gè)特征量的特征點(diǎn)的數(shù)量m提高特征量的辨別力。使用基于如圖42所示的從m個(gè)點(diǎn)所選4奪的f個(gè)點(diǎn)的所有可能的集合所計(jì)算的不變量值序列cr(O)、cr(l).....cr(mCf-l)作為m個(gè)點(diǎn)的排列的表示方法,其中,cr(i)是等于具有相同值的cri的交比。隨著數(shù)量m的增大,將計(jì)算的不變量值的數(shù)量增大。因此,降低了偶然重合的可能性。然而,如果數(shù)量m過大,則特征量的穩(wěn)定性降低。這是因?yàn)?,對于特征量的匹配,?yīng)該在所有不變量值中發(fā)現(xiàn)匹配,并且數(shù)量m的增大使得不變量值的數(shù)量mCf增大,從而增大了由于誤差的影響而計(jì)算出不同的不變量值的可能性。4.計(jì)算復(fù)雜度和存儲容量如上所述,數(shù)量n的增大使得可以計(jì)算更大范圍的多個(gè)特征量,從而提高了特征量的穩(wěn)定性。而且,數(shù)量m的增大使得可以基于更大數(shù)量的點(diǎn)計(jì)算各特征量,從而提高了特征量的辨別力。然而,如果過分增大這些參數(shù)的值,則會出現(xiàn)與計(jì)算復(fù)雜度相關(guān)的問題。也就是說,如果數(shù)量m和n過大,則不變量值的計(jì)算的計(jì)算復(fù)雜度增大。因此,存儲和檢索所需的處理時(shí)間相應(yīng)增大。而且,為了存儲所計(jì)算的特征量,存儲器需要更大的存儲容量。5.不變量值的量子化水平穩(wěn)定性和辨別力不僅受參數(shù)n、m的影響,而且還受不變量值的量子化的水平的數(shù)量k的影響。如果數(shù)量k較大(精細(xì)離散化每一不變量值),則由于誤差的影響增大了以不同水平離散化基于f個(gè)點(diǎn)的相同集合所計(jì)算的不變量值的可能性,從而降低了穩(wěn)定性。如果數(shù)量k較小(粗略離散化每一不變量值),則增大了以相同水平離散化基于f個(gè)點(diǎn)的不同集合所計(jì)算的不變量值的可能性,從而降低了辨別力。因此,應(yīng)該適當(dāng)設(shè)置參數(shù)n、m和k以確保利用較小的存儲容量、以更高的準(zhǔn)確度更高速地進(jìn)行檢索處理。存儲參考圖28說明不同于實(shí)施例1的存儲處理的另一示例過程。在存儲處理中,定義從將存儲的文檔中的距離各特征點(diǎn)最近的n個(gè)點(diǎn)所選擇的m個(gè)點(diǎn)的所有可能的集合。然后,基于根據(jù)各個(gè)m個(gè)點(diǎn)的集合所計(jì)算的交比,確定索引,并將交比存儲在圖29所示的散列表中。以下根據(jù)圖28所示的過程說明存儲處理。在行l(wèi),從特征點(diǎn)的集合提取一個(gè)特征點(diǎn)p。在行2,順時(shí)針順序提取距離特征點(diǎn)p最近的n個(gè)點(diǎn)以提供點(diǎn)集Pn。在行3,從點(diǎn)集Pn提取m個(gè)點(diǎn)以提供點(diǎn)集Pm。在行5,計(jì)算從點(diǎn)集Pm所選擇的5個(gè)點(diǎn)的所有可能的集合的交比值,并離散化交比值以提供交比cri。由于來自m個(gè)點(diǎn)的5個(gè)點(diǎn)的集合的數(shù)量是mC5,因而"i"取值0~mC5-l。在行7,基于如此提供的交比cr。根據(jù)散列函數(shù)確定散列表的索引Hindex。在行8,基于散列索引Hindex將文檔ID(將存儲的文檔的標(biāo)識號)、點(diǎn)ID(點(diǎn)的標(biāo)識號)和交比crj(i二O,…,mC5-l)存儲在散列表中。散列函數(shù)如下'厶'"c,-1、mod其中,k是交比的量子化水平的數(shù)量,H^是散列表的大小。在存儲處理中發(fā)生沖突的情況下,以圖29所示的列表添加數(shù)據(jù)。圖43示出存儲處理的另一過程。給出對圖43的說明。在存儲處理中,定義從將存儲的文檔中的距離各特征點(diǎn)最近的n個(gè)點(diǎn)所選擇的m個(gè)點(diǎn)的所有可能的集合。然后,基于根據(jù)各個(gè)m個(gè)點(diǎn)的集合所計(jì)算的不變量值確定索引,并將不變量值存儲在圖29所示的散列表中。在圖43的行1,從特征點(diǎn)的集合提取一個(gè)特征點(diǎn)p。在行2,提取距離特征點(diǎn)P最近的n個(gè)點(diǎn)以提供點(diǎn)集Pn。在行3,從點(diǎn)集Pn提取m個(gè)點(diǎn)以提供點(diǎn)集Pm。在行4,圍繞點(diǎn)p順時(shí)針排序點(diǎn)集Pm中的m個(gè)點(diǎn)以提供特征點(diǎn)序列Lm。在行5,通過從點(diǎn)序列Lm中的點(diǎn)按照預(yù)定順序選擇f個(gè)點(diǎn),提供所有可能的特征點(diǎn)序列Lf,并按照詞典順序排列特征點(diǎn)序列Lf。當(dāng)n^7且f二5時(shí),例如,提供特征點(diǎn)序列((po,pi,p2,p3,P4),(PO,Pl,P2,P3,P5),…,(P2,P3,P4,Ps,P6))作為(Lf(O),…,Lf(7C5-l))。在行7,以上述不變量計(jì)算公式將各特征點(diǎn)序列Lf(i)中的點(diǎn)取代為A、B、C…,從而計(jì)算和離散化不變量值以提供Cr(i)。在行9,根據(jù)下面的散列函數(shù)(3)確定散列表的索引Hindex。在行IO,基于索引Hindex將文檔ID(將存儲的文檔標(biāo)識號)、點(diǎn)ID(點(diǎn)的標(biāo)識號)和不變量值cr(i)(卜O,1,..,mCrl)存儲在散列表中。該實(shí)施例中所使用的散列函數(shù)如下[公式12]<formula>formulaseeoriginaldocumentpage41</formula>其中,k是不變量值的量子化的水平的數(shù)量,而&&是散列表的大小。在存儲處理中發(fā)生沖突的情況下,以圖29所示的列表的形式添加數(shù)據(jù)。為了文檔的存儲對所有特征點(diǎn)p進(jìn)行上述處理。接著說明4僉索處理。圖30示出不同于實(shí)施例l的檢索處理的示例過程。以與存儲處理相同的方式說明4企索處理。在該過程的行5~8,,以與存儲處理中相同的方式確定散列表的索引。在行9,從散列表讀取圖29所示的列表。參考該列表中的元素檢查詢問的交比是否完全匹配所存儲的交比,并且,如果發(fā)現(xiàn)匹配,這里的投票對應(yīng)于用于將詢問中的特征點(diǎn)p與所存儲的文檔中的特征點(diǎn)相關(guān)聯(lián)的處理。如果特征點(diǎn)p與所存儲的文檔中的特征點(diǎn)獨(dú)立相關(guān)聯(lián),則將詢問中的一個(gè)特征點(diǎn)錯(cuò)誤地與多個(gè)點(diǎn)相關(guān)聯(lián),從而^是供了圖31所示的錯(cuò)誤對應(yīng)關(guān)系A(chǔ)-A,,A-A"和B-A,。如果在投票的數(shù)量中包括基于錯(cuò)誤對應(yīng)關(guān)系的投票,則將相對地降低基于正確對應(yīng)關(guān)系的投票的等級(rating),從而導(dǎo)致失敗4全索。在該實(shí)施例中,記錄詢問中的點(diǎn)和所存J諸的文檔中的點(diǎn)之間的對應(yīng)關(guān)系,并對所記錄的對應(yīng)關(guān)系不投票。因此,抑制了基于錯(cuò)誤對應(yīng)關(guān)系的投票。對于每一所存儲的文檔中的所有點(diǎn)進(jìn)行該處理,并且將具有投票表中最大數(shù)量的投票的文檔最終確定為檢索結(jié)果。在行4,通過移位點(diǎn)集Pm中的起始點(diǎn)定義所有可能的點(diǎn)集{P,m},并且處理點(diǎn)集(P,"。該步驟對應(yīng)于用于定義點(diǎn)集Pm中的點(diǎn)ABCDEFG的m個(gè)循環(huán)排列(P,"的處理,即,BCDEFGA和CDt:FGAB等。該步驟是處理旋轉(zhuǎn)圖像所需要的??梢圆鹏迵?jù)圖44所示的過程進(jìn)行該處理。給出對于圖44的說明。在行1~3,以與存儲處理中相同的方式定義p、Pn和Pm。在行4和5,與存儲處理中不同,通過將起始點(diǎn)p。移位至點(diǎn)集Pm中的各點(diǎn),定義特征點(diǎn)序列(L"。由于在圖43中的存儲算法中,在行4僅存儲由Pm形成序列{Lm}t的一個(gè),而不考慮圖像的旋轉(zhuǎn),因而需要這樣。甚至在透視變形的情況下,圍繞點(diǎn)p的特征點(diǎn)的順時(shí)針序列是恒定的,雖然起始點(diǎn)是可移位的。也就是說,在考慮Lm的循環(huán)排列的情況下,存儲處理中所使用的序列必然是循環(huán)排列中的一個(gè)。在行6~10,以與存儲處理中相同的方式確定散列表的索引。在行l(wèi)l,從散列表讀取如圖29所示的列表。在行12~14,基于該列表的元素對所存儲的文檔ID中的相應(yīng)的文檔ID投票。這里,以下面的方式抑制了基于錯(cuò)誤對應(yīng)關(guān)系的投票。使用下面的三個(gè)條件(l)獲得不變量的相同序列;(2)詢問中的一個(gè)點(diǎn)不對應(yīng)于所存儲的文檔中的多個(gè)點(diǎn);和(3)所存儲的文檔中的一個(gè)點(diǎn)不對應(yīng)于詢問中的多個(gè)點(diǎn)。對于詢問圖^象中的所有點(diǎn),基于這些條件進(jìn)行上述處理,以確定各個(gè)所存儲的文檔的投票數(shù)量。然而,如此所確定的投票的數(shù)量仍包括基于錯(cuò)誤對應(yīng)關(guān)系的投票。錯(cuò)誤投票的數(shù)量一般與所存儲的文檔中所包含的特征點(diǎn)的數(shù)量成比例。因此,具有較大數(shù)量特征點(diǎn)的所存儲的文檔獲得不合理地大量投票。為了校正由于錯(cuò)誤投票而引起的錯(cuò)誤,通過下面的公式(4)定義文檔dj的得分S(di):[公式13]S(di)=V(di)-cN(di)…(4)其中,V(di)是di的投票的數(shù)量,N(di)是文檔di中所包含的特征點(diǎn)的數(shù)量;而c是特征點(diǎn)的數(shù)量和通過預(yù)先實(shí)驗(yàn)所確定的錯(cuò)誤投票的數(shù)量之間的比例常數(shù)。最終將具有最高得分的文檔確定為檢索結(jié)果。實(shí)施例l的示例實(shí)-驗(yàn)實(shí)驗(yàn)的概述為了驗(yàn)證根據(jù)實(shí)施例l的方法的有效性,基于由普通數(shù)字照相機(jī)所拍攝的文檔圖像和由移動電話數(shù)字照相機(jī)所拍攝的文檔圖像,進(jìn)行4全索處理。使用具有EF-S18-55mmUSM鏡頭的CANON(注冊商標(biāo))數(shù)字照相機(jī)EOSKissDigital(630萬像素)作為普通數(shù)字照相才幾,而將裝配給移動電話KYOCERATK31的數(shù)字照相機(jī)(18萬像素)用作移動電話數(shù)字照相機(jī)。在文檔圖像數(shù)據(jù)庫中,存儲有通過轉(zhuǎn)換單欄或雙欄的英文論文的PDF文件所準(zhǔn)備的50個(gè)文檔圖像。圖17和18示出數(shù)據(jù)庫中的文檔圖<象的例子。在具有Pentium4(注冊商標(biāo))CPU(l々GHz)和存儲器(768MB)的計(jì)算機(jī)上進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)l:使用普通數(shù)字照相機(jī)的實(shí)驗(yàn)說明使用普通數(shù)字照相機(jī)的實(shí)驗(yàn)的結(jié)果。設(shè)置上述參數(shù)如下n=8,m=7,k=9,而1=10。如上所述,k是為各特征點(diǎn)所計(jì)算的交比的值的離散化的水平的數(shù)量,而l是離散后的交比的數(shù)量,離散化的交比適于基于在一次投票中的投票數(shù)量判斷各特征點(diǎn)的匹配,并且使用離散后的交比作為用于判斷是否基于散列表的元素進(jìn)行二次投票的投票數(shù)量的閾值。使用利用如圖19~22所示的四個(gè)不同攝影范圍拍攝通過拍攝10個(gè)不同的文檔頁所準(zhǔn)備的總共40個(gè)圖像,作為詢問。攝影范圍包括覆蓋整個(gè)文檔頁的攝影范圍A、覆蓋整個(gè)文本區(qū)域的攝影范圍B、覆蓋一半文本區(qū)域的攝影范圍C、以及覆蓋四分之一文本區(qū)域的攝影范圍D。斜拍攝文檔頁。如果正確的文檔圖像具有最大數(shù)量的投票,就認(rèn)為檢索是正確的。測量平均正確檢索率和平均處理時(shí)間。表l示出實(shí)驗(yàn)結(jié)果。不管攝影范圍,從所有輸入的圖像獲得正確的檢索結(jié)果。隨著攝影范圍的縮小,處理時(shí)間縮短。這是因?yàn)闇p少了處理的特征點(diǎn)的數(shù)量。表l<table>tableseeoriginaldocumentpage44</column></row><table>實(shí)驗(yàn)2:使用移動電話數(shù)字照相機(jī)的實(shí)驗(yàn)使用由移動電話數(shù)字照相機(jī)所拍攝的圖23~27的文檔圖像作為用于檢索的詢問。圖24~26的文檔圖像導(dǎo)致成功檢索,而圖23和27的文檔圖像導(dǎo)致失敗檢索。利用圖23的文檔圖像的失敗檢索的原因是由于過低的分辨率,因而不能相互分開輸入的圖像中的單詞,使得不可能正確提取特征點(diǎn)。利用圖27的文檔圖像的失敗檢索的原因是圖像的攝影范圍過于小,使得不可能正確定義最近的點(diǎn)。即使使用具有更低分辨率的移動電話數(shù)字照相機(jī),通過拍攝范圍的必要調(diào)整,檢索也是可以。上述的實(shí)驗(yàn)示出通過以下的文檔圖像檢索方法可以高精度地檢索文檔圖像使用由數(shù)字照相機(jī)所拍攝的文檔圖像作為詢問,并采用使用交比和散列表的投票處理。還可以發(fā)現(xiàn)雖然需要調(diào)整攝影范圍,但是對于檢索甚至可以使用由具有更低分辨率的移動電話數(shù)字照相機(jī)所拍攝的文檔圖像。實(shí)施例2的示例實(shí)驗(yàn)實(shí)驗(yàn)的概述為了驗(yàn)證根據(jù)實(shí)施例2的有效性,確定4全索精度和數(shù)據(jù)庫大小之間的關(guān)系和數(shù)據(jù)庫大小和檢索速度之間的關(guān)系。利用具有EF-S18誦55mmUSM鏡頭的CANON數(shù)字照相機(jī)EOSKissDigital(630萬像素)通過如圖32所示斜拍攝文檔準(zhǔn)備詢問。詢問的數(shù)量是50。另一方面,將通過轉(zhuǎn)換各種英文論文的PDF文件所準(zhǔn)備的10000個(gè)文檔圖像存儲在文檔圖像數(shù)據(jù)庫中。圖17和18示出數(shù)據(jù)庫中的文檔圖像的例子。在實(shí)驗(yàn)中,設(shè)置處理參數(shù)如下n=8,m=7,k=10,Hsize=l.28x108。在實(shí)驗(yàn)中使用具有AMD()pteron(注冊商標(biāo))CPU(1.8GHz)和存儲器(4GB)的計(jì)算機(jī)。實(shí)驗(yàn)3:檢索精度確定存儲在數(shù)據(jù)庫中的頁數(shù)和檢索精度之間的關(guān)系。圖33示出實(shí)驗(yàn)的結(jié)果,該結(jié)果表示隨著頁數(shù)的增加精度降低。在數(shù)據(jù)庫中的頁數(shù)為1OOOO的情況下,利用50個(gè)詢問中的49個(gè)詢問所檢索的正確文檔圖像每一均具有最大的投票數(shù)量。因此,檢索精度為98%。利用其余詢問所檢索的正確文檔圖像具有第五最大投票數(shù)據(jù)。平均檢索時(shí)間是137.7ms。圖34示出導(dǎo)致失敗檢索的詢問的圖像,在失敗檢索中,正確文檔圖像不具有最大的投票數(shù)量。與該詢問圖像一樣,幾乎被表/圖區(qū)域占據(jù)的且包括較小文本區(qū)域的詢問圖像導(dǎo)致失敗檢索。推測是因?yàn)槿绻儐枅D像具有較小數(shù)量的特征點(diǎn),那么將檢索的正確文檔圖像不能獲得足夠數(shù)量的投票。實(shí)-驗(yàn)4:4全索時(shí)間接著確定所存儲的頁數(shù)如何影響檢索時(shí)間。圖35示出該結(jié)果,該結(jié)果表示隨著所存儲的文檔數(shù)量的增加,檢索時(shí)間逐漸增加。圖35還示出散列表中的平均列表長度。這里定義平均存儲的頁數(shù)的增加而平均列表長度增大這一情況表示沖突的次數(shù)增加。推測其是4企索時(shí)間增加的原因。其它示例實(shí)驗(yàn)A.利用交比的檢索性能為了精確估計(jì)利用交比和檢索的文檔圖像索引的性能,通過不同地設(shè)置參數(shù)進(jìn)行實(shí)驗(yàn)。在實(shí)驗(yàn)中,使用通過轉(zhuǎn)換如圖45所示的英文論文的PDF文件所準(zhǔn)備的文檔圖像的數(shù)據(jù)庫和通過利用數(shù)字照相機(jī)拍攝打印后的文檔所準(zhǔn)備的詢問。使用分別包含10個(gè)文檔圖像、IOO個(gè)文檔圖像、1000個(gè)文檔圖像和10000個(gè)文檔圖像的數(shù)據(jù)庫A、B、C和D作為文檔圖像數(shù)據(jù)庫。數(shù)據(jù)庫C是數(shù)據(jù)庫D所包含的一部分,而數(shù)據(jù)庫B是是數(shù)據(jù)庫C所包含的一部分。而且,數(shù)據(jù)庫A是數(shù)據(jù)庫B所包含的一部分。使用CVPR、ICPR和ICCV等具有相似版面的國際會議論文集的PDF文件作為PDF文件。使用通過分別以約60、45和30度拍攝根據(jù)數(shù)據(jù)庫B所打印的文檔所準(zhǔn)備的詢問的圖像l、2和3,作為詢問。詢問l、2、3的圖像數(shù)量均為100個(gè)。圖46示出詢問的例子。4吏用具有EF-S18-55mmUSM鏡頭的CANONEOSKissDigital(630萬像素)準(zhǔn)備詢問圖像。實(shí)驗(yàn)中所使用的散列表的大小為Hsiz^2"-l。使用具有AMDOpteronCPU(l.8GHz)和存儲器(6GB)的計(jì)算機(jī)。實(shí)驗(yàn)l:參數(shù)n、m和性能之間的關(guān)系本發(fā)明提供的性能根據(jù)確定計(jì)算特征量使用的特征點(diǎn)的集合的數(shù)量的參數(shù)n、m改變。通過不同地設(shè)置參數(shù)n、m組合,確定檢索精度、處理時(shí)間和所需存儲容量。在實(shí)驗(yàn)中,使用數(shù)據(jù)庫B和詢問1~3。表2~4示出基于不同攝影角度的實(shí)驗(yàn)的結(jié)果。表2(攝影角度60度)<table>tableseeoriginaldocumentpage47</column></row><table>表3(攝影角度45度)表4(攝影角度30度)<table>tableseeoriginaldocumentpage48</column></row><table>這里將精度定義為每一匹配詢問且具有最大投票數(shù)量的文檔圖像的數(shù)量的比率,而這里將處理時(shí)間定義為除特征點(diǎn)提取處理以外的檢索處理所需的時(shí)間。將列表數(shù)量定義為存儲在散列表中的列表的總數(shù)(每一列表包括一組文檔ID、點(diǎn)ID和交比序列cr(0),…,crUC5-l),如圖29所示),并且l是散列表中的非零列表長度的平均值。在表2-4中,示出了對n和m的各組合通過使用提供最高精度的k的值所獲得的每一結(jié)果。作為參考,還示出了n和m的組合的數(shù)量nCm和mCs。首先,檢查精度。通常,隨著攝影角度的縮小,精度降低。推測是因?yàn)楦蟮耐敢曌冃螌?dǎo)致最近點(diǎn)的更大變化,因而使得不可能確保特征量的穩(wěn)定性。然而,如圖47所示,如果n和m之間的差更大,則抑制了精度的降低。這是因?yàn)椴頽-m等于可允許的錯(cuò)誤的特征點(diǎn)的數(shù)量。接著,檢查處理時(shí)間??紤]到圖44所示的檢索算法的結(jié)構(gòu),假定由計(jì)算特征量所需的時(shí)間、列表處理所需的時(shí)間和迭代次數(shù)確定處理時(shí)間。計(jì)算特征量所需的時(shí)間通常與特征量的交比mCs的數(shù)量成比例,而列表處理所需的時(shí)間與平均列表長度1成比例。迭代次數(shù)為nCmXm。因此,這里通過下面的公式(5),基于參數(shù)n、m和平均列表長度l將處理時(shí)間定義為T(n,m,1):[公式14]r(",/n,/)豕人'/n仏+"/)。)其中,a是對于特征量計(jì)算時(shí)間的列表處理時(shí)間的權(quán)重。圖48示出在a=3時(shí)所獲得的T(n,m,1)與處理時(shí)間的曲線圖。從圖48可以看出,T(n,m,l)通常與處理時(shí)間成比例。因此,推測處理時(shí)間受n、m、l的影響,如公式(5)所示。最后,檢查所需的存儲容量。在表24中,存儲在散列表中的列表數(shù)量與nCm成比例。這是因?yàn)獒槍γ恳稽c(diǎn)存儲特征量。如上所述,必須增大值n-m以確保更高的穩(wěn)定性,但是這相應(yīng)地增大了所需的存儲容曰里。實(shí)驗(yàn)2:量子化水平的數(shù)量和性能之間的關(guān)系本發(fā)明的方法所提供的性能根據(jù)量子化水平的數(shù)量k而改變。通過使用數(shù)據(jù)庫B和詢問1,并將參數(shù)設(shè)置成11=8和111=7,來確定k和精度之間的關(guān)系、以及k和處理時(shí)間之間的關(guān)系。圖49示出該結(jié)果。首先,檢查精度。在k較小時(shí)精度較低,而隨著k的增大精度急劇升高。推測這是因?yàn)楫?dāng)k較小時(shí)特征量的辨另'J力較低,因而不能確保匹配文檔和非匹配文檔之間的適當(dāng)辨別。當(dāng)k過大時(shí),精度急劇下降。推測這是因?yàn)樘卣髁康姆€(wěn)定性降低。接著,檢查處理時(shí)間。處理時(shí)間首先隨著k的增大而急劇減少,然后通常保持恒定。推測這是因?yàn)樵趉較小時(shí)特征量的辨別力較低,并且在散列表中頻繁發(fā)生沖突,從而導(dǎo)致檢索處理中散列訪問時(shí)間的增加。因此,為了確保更高速和更高精度的檢索,應(yīng)當(dāng)適當(dāng)設(shè)置數(shù)量k。實(shí)驗(yàn)3:所存儲的頁數(shù)和檢索精度之間的關(guān)系通過使用數(shù)據(jù)庫AD在10IOOOO之間可變地設(shè)置所存儲的頁數(shù),確定所存儲的頁數(shù)和檢索精度之間的關(guān)系。使用詢問1和2作為詢問。對于這兩個(gè)詢問將參數(shù)設(shè)置成11=8和111=7。此時(shí),如表2和3所示設(shè)置數(shù)量k。圖50示出實(shí)驗(yàn)的結(jié)果。隨著頁數(shù)的增加精度降低。推測這是因?yàn)楫?dāng)數(shù)據(jù)庫具有更大大小時(shí),存儲具有相同特征量的不同文檔的可能性增大。利用詢問2的檢索的精度低于利用詢問1的檢索的精度。推測這是因?yàn)橛捎诟蟮耐敢曌冃味黠@改變了最近點(diǎn),從而使得難以確保特征量的穩(wěn)定性。圖51示出導(dǎo)致失敗檢索的示例詢問圖像。象該詢問圖像一樣,幾乎被表/圖區(qū)域占據(jù)的且包括較小文本區(qū)域的詢問圖像導(dǎo)致失敗檢索。推測這是因?yàn)樗崛〉奶卣鼽c(diǎn)的數(shù)量較小,因此,在檢索中匹配文檔不能獲取足夠數(shù)量的投票。實(shí)驗(yàn)4:所存^(諸的頁數(shù)和處理時(shí)間之間的關(guān)系確定所存儲的頁數(shù)如何影響處理時(shí)間。使用數(shù)據(jù)庫A~D和詢問l,并且如下il置參凄t:n=8,n^7和k二12。圖52示出結(jié)果。隨著所存儲的文檔的數(shù)量的增加,處理時(shí)間逐漸增大。如上所述,處理時(shí)間受參數(shù)n、m和平均列表長度l的影響。在該實(shí)驗(yàn)中,參數(shù)n、m是固定的。圖52示出平均列表長度l。隨著所存儲的頁數(shù)的增加平均列表長度增大,這表示散列表中頻繁發(fā)生沖突。推測其是處理時(shí)間增加的原因。B.相似變換實(shí)驗(yàn)概述為了驗(yàn)證本發(fā)明的相似不變量的有效性,針對檢索精度和處理時(shí)間進(jìn)行比較實(shí)驗(yàn)。在實(shí)驗(yàn)中,使用通過轉(zhuǎn)換如圖53所示的英文論文的電子文檔所準(zhǔn)備的文檔圖像的數(shù)據(jù)庫和通過由數(shù)字照相機(jī)拍攝打印后的文檔所獲得的詢問。使用分別包含IOO個(gè)文檔圖像、1000個(gè)文檔圖像和10000文檔圖像的數(shù)據(jù)庫A、B和C作為文檔圖像數(shù)據(jù)庫。數(shù)據(jù)庫B是數(shù)據(jù)庫C所包含的一部分,而數(shù)據(jù)庫A是數(shù)據(jù)庫B所包含的一部分。使用CVPR、ICPR和ICCV等具有相似版面的國際會議論文集的電子數(shù)據(jù)作為電子文檔。使用通過對于紙張表面分別成約90度、約60度、約45度和約30度拍攝根據(jù)數(shù)據(jù)庫A所打印的文檔所準(zhǔn)備的詢問圖像,作為詢問。對于各攝影角度,詢問圖像的數(shù)量是100個(gè)。圖54示出詢問圖像的例子。使用具有EF-S18-55mmUSM鏡頭的CANONEOSKissDigital(630萬像素)準(zhǔn)備詢問圖像。該實(shí)驗(yàn)中所使用的散列表的大小為Hsc2"-l。使用具有AMDOpteronCPU(28GHz)和存儲器(16GB)的計(jì)算機(jī)。實(shí)驗(yàn)l:攝影角度和檢索精度之間的關(guān)系首先,當(dāng)使用交比或相似不變量值計(jì)算特征量時(shí),確定詢問圖像的攝影角度和檢索精度之間的關(guān)系。在本發(fā)明的方法中,性能根據(jù)確定用于計(jì)算特征量的特征點(diǎn)的集合的數(shù)量的參數(shù)n、m的值和不變量值的量子化的水平數(shù)量k而改變。在該實(shí)驗(yàn)中,使用對于n和m的組合(n^10,m=10、9、8、7)提供最高精度的k的值。而且,使用具有90~30度的:t聶影角度的詢問和包含100個(gè)文檔圖像的數(shù)據(jù)庫A。圖55示出對于(a)交比和(b)相似不變量的n和m的各組合的攝影角度和檢索精度之間的關(guān)系。從圖55(a)(b)可以看出,隨著角度的縮小精度通常降低。推測這是因?yàn)橛捎谧冃我蚨罱奶卣鼽c(diǎn)的排列發(fā)生變化,從而不能滿足在n個(gè)最近點(diǎn)的m個(gè)點(diǎn)中發(fā)現(xiàn)匹配的條件,在n和m之間的差較大的情況下(例如,n=10,m=7),精度的降低相對地小。如圖55所示,在(a)交比的情況下,由于角度的縮小的精度的降低較小,而在(b)相似不變量的情況下,由于角度的縮小的精度的降低較大。推測這是由于以下說明的不變量的性質(zhì)。交比是投影不變量,因此,對于由于透視變形而產(chǎn)生的特征點(diǎn)的位置改變保持不變。然而,對于非透視變形所引起的變化,交比是不穩(wěn)定的。在本發(fā)明的方法中,使用單詞區(qū)域的重心作為特征點(diǎn),并且,如果圖像遭受了透視變形,則特征點(diǎn)的位置改變。因此,當(dāng)圖像經(jīng)過極大的透視變形時(shí),特征點(diǎn)的坐標(biāo)改變,因此基于特征點(diǎn)所計(jì)算的交比的值發(fā)生改變,從而變得不穩(wěn)定。在變形近似于由于相似變換的變形的局部區(qū)域中,相似不變量是穩(wěn)定的。然而,相似變換是過分限制性的,并且,如果透視變形是值得考慮的,則即使在局部區(qū)域中也不可能將透視變形近似于相似變形。值得考慮的透視變形降低了特征量的穩(wěn)疋性。實(shí)驗(yàn)2:所存儲的頁數(shù)和檢索精度之間的關(guān)系接著,確定對于各不變量所存儲的頁數(shù)和檢索精度之間的關(guān)系。將參數(shù)設(shè)置成11=8和111=7,并且使用在所存儲的頁數(shù)為100時(shí)提供最高精度的k的值。表5示出該結(jié)果。象在實(shí)驗(yàn)l中一樣,隨著攝影角度的縮小檢索精度降低。而且,隨著所存儲的頁數(shù)的增加精度降低。推測這是因?yàn)殡S著所存儲的頁數(shù)的增加,存儲具有相似點(diǎn)排列的文檔的可能性增大。象在實(shí)驗(yàn)1中一樣,使用交比的檢索的精度較高,而使用相似不變量的檢索的精度較低。表5<table>tableseeoriginaldocumentpage53</column></row><table>實(shí)驗(yàn)3:所存儲的頁數(shù)和處理時(shí)間之間的關(guān)系對于各不變量確定所存儲的頁數(shù)和處理時(shí)間之間的關(guān)系53所存儲的頁數(shù)檢索精度(%)交比相似不變量---■、、s、-..........…,'.'.'^WT"M1!KSTOS"'.,,i鄰o!亂ooo18989!■^■■■..■■.1-….辟-fts*ss>999廠9S9992692oo,399Ho48S21S9一I,i323ooe,。o爭a51o一4~3一這里將處理時(shí)間定義為用于利用圖44所示的各詢問圖像進(jìn)行檢索處理并排除預(yù)先特征點(diǎn)提取處理所需的時(shí)間的所需的時(shí)間。以與實(shí)驗(yàn)2中相似的方式設(shè)置參數(shù)。作為例子,表5示出利用每一均具有60度攝影角度的詢問圖像的檢索所需的處理時(shí)間。即使改變詢問圖像的攝影角度,處理時(shí)間一般是恒定的。大體來說,處理時(shí)間隨著所存儲的頁數(shù)的增加而增加。推測這是因?yàn)榇鎯υ谏⒘斜碇械母罅康臄?shù)據(jù)導(dǎo)致更高的沖突率。在交比情況下處理時(shí)間相對短,而在相似不變量情況下相對長。推測這是由于用于計(jì)算特征量的不變量值的計(jì)算數(shù)量mCf的不同。在111=7的情況下,數(shù)量mCf隨著f的減小而增大。因此,與交比下的情況相比,在相似不變量的情況下利用f=5的處理時(shí)間更長。在相似不變量的情況下,從10000個(gè)所存儲的頁的檢索需要更加長的處理時(shí)間。推測這是因?yàn)槭褂幂^少數(shù)量的點(diǎn)計(jì)算相似不變量,因此,傾向于將不變量值離散化成相同水平,因而在散列表中導(dǎo)致更大數(shù)量的沖突。C.文檔以外的圖像為了驗(yàn)證本發(fā)明的方法對文檔以外的對象的適用性,通過使用通過由數(shù)字照相機(jī)拍攝海報(bào)和雜志的封面所獲得的圖像進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)概述與文檔圖<象不同,對于特征點(diǎn)處理,通過下面的文獻(xiàn)(例如,參考Y.KeandR.Sukthankar,PCA-SIFT:representationforlocalimagedescriptors,Proc.CVPR,Vol.2,pages506-513,2004)中提出的PCA-SIFT方法處理這些對象的圖1"象。在PCA-SIFT方法中,從圖像提取特征點(diǎn),并且確定表現(xiàn)特征點(diǎn)特征的d維特征向量v=(v!,...,vd)。通過PCA-SIFT所確定的特征點(diǎn)和特征向量是基于SIFT方法(例如,參考D.G.Lowe,Distinctiveimagefeaturesfromscaleinvariantkeypoints,InternationalJournalofComputerVision,Vol.60,No.2,pp.91-110,2004).在該方法中,將通過PCA-SIFT方法所獲得的實(shí)數(shù)的向量V變換成位向量W^(W^…,Wd)備用。可以考慮各種變換方法。例如,可以4吏用這才羊的方法如果Vi^0,則wfl,否則w嚴(yán)0。下面3奪i兌明該方法。如在文檔圖像的處理中一樣,該方法組合使用多個(gè)特征點(diǎn)。圖56對此進(jìn)行簡要示出,在圖56中,點(diǎn)po是感興趣的點(diǎn),并且在點(diǎn)po周圍存在其它的點(diǎn)p!...。圖56示出三個(gè)最近的點(diǎn)的兩個(gè)點(diǎn)的組合(11=3,m=2)。在組合三個(gè)點(diǎn)p。、p!和p2的情況下,將各點(diǎn)的"f立向量表示為W0、Wi和w2,并且以集合形式表示為Wi=(Wli,...,Wdi)。在這種情況下,作為組合的結(jié)果所獲得的特征向量w。,是3維位向量,表示如下Wo,二(Wo,WbW2)二(Wo,…,WdO,Wn,…,Wdi,W,2,…,Wd2)象在文檔圖像的處理中一樣,將該向量轉(zhuǎn)換成散列表的索引。更具體地,根據(jù)下面的公式計(jì)算索引Hmdex:[公式15]其中,r是將組合的特征點(diǎn)的數(shù)量,而Hsize是散列表的大'為了驗(yàn)證該方法的有效性,進(jìn)行實(shí)驗(yàn)。使用包括AMDOpteron(2.8GHz)和存儲器(16GB)的計(jì)算機(jī)。SIFT的特征向量的維數(shù)是128,而PCA-SIFT的維數(shù)是36。在該方法中,為了產(chǎn)生位向量的組合,在范圍9<d<36中可變地設(shè)置原始位向量Wj的維數(shù)。這意p未著如果d二9,則4吏用位向量wu~wi9。對于點(diǎn)的組合,在范圍5<11<30和1<111<3中可變地設(shè)置參數(shù)11、m。還考慮特殊情況,在其中,沒有形成特征點(diǎn)的組合(n二O,m=0)。在該實(shí)驗(yàn)中,使用40個(gè)平面物體。對象包括5個(gè)海報(bào)和35個(gè)名為Comm.OftheACM的雜志的封面。通過照相機(jī)(630萬1象素)拍攝這些對象以提供均具有3042x2048大小的彩色圖像。在該實(shí)驗(yàn)中,將這些彩色圖像均轉(zhuǎn)換成1024x683灰度圖像。準(zhǔn)備以三個(gè)不同角度(45度、60度和75度)水平拍攝對象所獲得的圖像和通過正面拍攝對象所獲得的且具有兩種不同大小(較大大小和較小大小)的圖像,作為詢問圖像。也就是說,為每一對象準(zhǔn)備包括不同視圖的5種類型的圖像。除較大大小圖像以外,每一圖像包含整個(gè)對象圖像。每一較大大小圖像包含約50%的整個(gè)對象圖像。由于以5種不同方式拍攝50個(gè)平面物體,因而使用總共200個(gè)圖像作為詢問圖像。將通過以90度攝影角度拍攝對象所獲得的且均具有中間大小的圖像存儲在數(shù)據(jù)庫中。因此,存儲在數(shù)據(jù)庫中的圖像不同于詢問圖像中的任何一個(gè)。圖57示出根據(jù)該方法的示例處理。圖57(a)示出數(shù)據(jù)庫中的一個(gè)圖像;而圖57(b)~(f)示出如何使詢問圖像(在上面)中的特征點(diǎn)與數(shù)據(jù)庫中的特征點(diǎn)(在下面)相關(guān)聯(lián)。在該例子中,從數(shù)據(jù)庫中的40個(gè)圖像成功檢索正確圖像。在該實(shí)-險(xiǎn)中,還4吏用下面兩種比4交方法。(1)一種方法,在該方法中,照原樣采用通過SIFT方法所獲得的128維實(shí)數(shù)向量,并且從該數(shù)據(jù)庫的檢索是基于最短歐幾里得距離(以下將該方法稱為"SIFT方法");以及(2)另一方法,在該方法中,使用通過PCA-SIFT方法所獲得的36維實(shí)數(shù)向量,并且該檢索是基于歐幾里得距離(以下將該方法稱為"PCA-SIFT方法")。表6示出處理精度和處理時(shí)間。表6<table>tableseeoriginaldocumentpage57</column></row><table>SIFT方法和PCA-SIFT方法均提供100%的檢索精度,但是需要巨大的處理時(shí)間。本發(fā)明的方法有力地減少了處理時(shí)間,同時(shí)提供約90%的處理精度。在本發(fā)明的方法中,使用兩種參數(shù)設(shè)置(c^24,n=0,m=0)和(d^16,n=28,m=l)。與不基于點(diǎn)的組合的檢索處理的前一設(shè)置相比,基于點(diǎn)的組合的檢索處理的后一設(shè)置提供提高的處理精度。表7詳細(xì)示出失敗沖企索。表7<table>tableseeoriginaldocumentpage57</column></row><table>與不基于點(diǎn)的組合的檢索處理(左邊的參數(shù)設(shè)置)相比,在基于點(diǎn)的組合的檢索處理(右邊的參數(shù)設(shè)置)中,失敗檢索中的匹配圖像的平均等級較高。這表示即使在失敗檢索中,也對正確圖像賦予高的等級。在基于點(diǎn)的組合的檢索處理中,三分之二的失敗檢索是由于具有較小攝影角度(45度)的詢問圖像,并且三分之一的失敗檢索是由于較小大小的詢問圖像。在實(shí)際應(yīng)用中重要的以較大角度(60~75度)所拍攝的詢問圖像和較大大小的詢問圖像不發(fā)生錯(cuò)誤檢索。在表7中,還示出了最大數(shù)量的投票與第二最大數(shù)量的投票的平均比(投票數(shù)量的比)。在成功檢索中,最大數(shù)量的投票是大于第二最大數(shù)量的投票7倍。另一方面,在失敗檢索中,最大數(shù)量的投票僅稍稍大于第二最高投票計(jì)數(shù)。參考投票計(jì)數(shù)的比,可以預(yù)測是否檢索正確圖像。通過為該比適當(dāng)設(shè)置閾值,可以消除處理錯(cuò)誤。在上述情況下,通過設(shè)置閾值將處理精度增大至75%,從而消除所有錯(cuò)誤。設(shè)備的示例結(jié)構(gòu)將給出對于用于將文檔和/或圖像存儲在文檔和/或圖像數(shù)據(jù)庫中的本發(fā)明的文檔和/或圖像存儲設(shè)備的示例結(jié)構(gòu)的說明。還給出對于用于從文檔和/或圖像數(shù)據(jù)庫檢索文檔和/或圖像的本發(fā)明的文檔和/或圖像檢索設(shè)備的示例結(jié)構(gòu)的說明,其中,在文檔和/或圖像數(shù)據(jù)庫中,由文檔和/或圖像存儲設(shè)備存儲文檔和/或圖像。圖39是示出本發(fā)明的文檔和/或圖像存儲設(shè)備1的結(jié)構(gòu)的框圖。文檔和/或圖像存儲設(shè)備1包括輸入部11、特征點(diǎn)提取部15、特征點(diǎn)選纟奪部17和特征點(diǎn)存儲部19。輸入部ll是輸入將存儲的文檔和/或圖像的部。特征點(diǎn)提取部15是從文檔和/或圖像提取定義圖像配置的多個(gè)特征點(diǎn)的部。特征點(diǎn)選擇部17是距離所提取的特征點(diǎn)p最近的n個(gè)特征點(diǎn)的部。特征點(diǎn)存儲部19是這樣的部為從所選擇的n個(gè)特征點(diǎn)所選擇的m個(gè)點(diǎn)(nKn)的所有可能的集合中的每一個(gè),根據(jù)實(shí)施例l或?qū)嵤├?中所述的存儲處理,計(jì)算散列表的索引,并將輸入的文檔和/或圖像存儲在文檔和/或圖像數(shù)據(jù)庫31中。圖40是示出本發(fā)明的文檔和/或圖像檢索設(shè)備的結(jié)構(gòu)的框圖。檢索設(shè)備3包括讀取部21、特征點(diǎn)揭:取部23、特征點(diǎn)選擇部25、投票部27和ID指定部29。讀取部21是讀取所拍攝的圖像的部。特征點(diǎn)提取部23是從所讀取的圖像提取定義圖像配置的多個(gè)特征點(diǎn)的部,并對應(yīng)于圖39中的特4£點(diǎn)揭:耳又部15。特征點(diǎn)選擇部25是選擇距離所提取的特征點(diǎn)p中每一個(gè)最近的n個(gè)特征點(diǎn)的部,并對應(yīng)于圖39中的特征點(diǎn)選擇部17。投票部27是根據(jù)實(shí)施例l或?qū)嵤├?所述的檢索處理對具有匹配特征量的文檔ID投票的部。ID指定部29是基于為各特征點(diǎn)投票的計(jì)數(shù)指定與所拍攝的圖像相對應(yīng)的文檔和/或圖像的文檔ID的部。工業(yè)可應(yīng)用性與物理對象的鏈接根據(jù)本發(fā)明的圖像檢索方法,可以在物理對象(文檔、宣傳冊、海報(bào)或布告板)和電子數(shù)據(jù)(因特網(wǎng)的主頁等相關(guān)信息)之間建立鏈接,從而可以基于物理對象的圖像檢索與物理對象相關(guān)的電子數(shù)據(jù)。在將報(bào)紙和雜志文章等文本媒體存儲在因特網(wǎng)上的服務(wù)器中的情況下,例如,用戶可以訪問因特網(wǎng)上的服務(wù)器以僅通過拍攝任一介質(zhì)的圖像來獲取相關(guān)數(shù)據(jù)。因此,本發(fā)明在檢索文本介質(zhì)的圖像中非常有效。本發(fā)明還適用于在廣告宣傳冊和因特網(wǎng)上的主頁之間建立鏈接的目錄購物系統(tǒng)。而且,本發(fā)明可以用于基于通過拍攝海報(bào)所獲得的圖像檢索與海報(bào)的內(nèi)容相關(guān)的信息的應(yīng)用、或者用200680006968.9說明書第51/52頁于基于通過拍攝街道上的布告板所獲得的圖像檢索與該布告板相關(guān)的信息的應(yīng)用。而且,本發(fā)明還可以用于^全索包括附加鄉(xiāng)會地圖信息(簡明地圖)的信息的電子數(shù)據(jù)作為相關(guān)信息的應(yīng)用。在該鏈接中,除文本信息和圖形信息以外,相關(guān)信息還可以包括音頻信息和-現(xiàn)頻信息??梢杂商峁┓?wù)的供應(yīng)商建立鏈接,或者由個(gè)人用戶私人建立鏈接。在用戶想要使數(shù)據(jù)和文檔相關(guān)聯(lián)的情況下,例如,本發(fā)明使用戶通過使用照相機(jī)在電子數(shù)據(jù)和文檔之間建立鏈接。而且,本發(fā)明的實(shí)時(shí)處理能力(高速處理能力)使得可以以與通過照相機(jī)實(shí)時(shí)查看的物理對象(文檔、宣傳冊或海報(bào))的圖像成重疊關(guān)系,顯示電子數(shù)據(jù)。這是信息處理的一種形式,倍稱為"智能信息透鏡"。物理對象之間的4連接如上所述,可以在物理對象和電子數(shù)據(jù)之間建立鏈接。才艮據(jù)本發(fā)明的圖像檢索方法,還可以考慮在物理對象之間建立鏈接。具體的例子如下(1)當(dāng)有兩個(gè)相關(guān)文檔時(shí),根據(jù)需要記錄這兩個(gè)文檔的關(guān)聯(lián)。(2)根據(jù)需要與物理對象(文檔、宣傳冊或海報(bào))相關(guān)聯(lián)記錄人或物(產(chǎn)品等)(根據(jù)需要通過拍攝文檔檢索人或物的照片)。這類信息處理被當(dāng)作為用于通過照片在物理對象之間建立鏈接的處理。注解提取系統(tǒng)的應(yīng)用而且,本發(fā)明的圖像檢索方法可以用于將在文檔中經(jīng)常做出的注解包含進(jìn)電子文檔中。圖37是示出用于將在文檔中做出的注解包含進(jìn)電子文檔中60的系統(tǒng)的示例結(jié)構(gòu)的說明圖。如圖37所示,該系統(tǒng)配置如下(1)將沒有注解的文檔作為原始文檔存儲在數(shù)據(jù)庫中。(2)利用照相機(jī)拍攝有注解的文檔,并且通過本發(fā)明的方法從數(shù)據(jù)庫檢索沒有注解的文檔。結(jié)果,將沒有注解的文檔中的特征點(diǎn)與有注解的文檔中的特征點(diǎn)相關(guān)Jf關(guān)。(3)基于特征點(diǎn)相互關(guān)系,將通過利用照相機(jī)拍攝有注解的文檔所獲得的圖像恢復(fù)成正向(從傾斜拍攝狀態(tài)到正向)。圖38是用于解釋將圖像恢復(fù)成正向的處理的圖。(4)通過從正確取向的圖像減去沒有注解的文檔的圖像,提取注解的圖像。(5)通過將所提取的注解圖像添加給電子文檔,將注解包含在電子文檔中。這使得可以利用相互無縫鏈接的紙質(zhì)文檔和電子文檔。本發(fā)明的注解提取系統(tǒng)不僅可以鏈接到連結(jié)數(shù)字照相機(jī),而且還可以連結(jié)到復(fù)印機(jī)或掃描器。由復(fù)印機(jī)或掃描器所捕獲的圖像經(jīng)過相似變換和仿射變換等幾何變換,而不是僅經(jīng)過照相機(jī)所拍攝的圖像的通常經(jīng)受的投影變換。因此,可以配置注解提取系統(tǒng)以使用相似不變量和仿射不變量。由于與投影變換相比,仿射變換和相似變換限制性更強(qiáng),因而可以提高注解提取的精度。權(quán)利要求1.一種文檔和/或圖像檢索方法,用于通過比較基于所拍攝的數(shù)字圖像的特征點(diǎn)所計(jì)算的特征量與基于存儲在數(shù)據(jù)庫中的各文檔和/或圖像的特征點(diǎn)所計(jì)算的特征量,來從數(shù)據(jù)庫檢索與所拍攝的數(shù)字圖像相對應(yīng)的文檔和/或圖像,所述方法包括從所述拍攝的數(shù)字圖像提取所述特征點(diǎn);對所提取的各特征點(diǎn)定義特征點(diǎn)的局部集合;從所定義的局部集合選擇特征點(diǎn)的子集;對于所述子集中的特征點(diǎn)的組合,確定不變量值作為表征各所選子集的值,所述不變量值對于幾何變換是不變的;通過組合所確定的不變量值計(jì)算特征量;以及基于預(yù)先計(jì)算的文檔和/或圖像的特征量對所述數(shù)據(jù)庫中的文檔和/或圖像進(jìn)行投票處理;從而從所述數(shù)據(jù)庫檢索與所述拍攝的數(shù)字圖像相對應(yīng)的文檔和/或圖像。2.根據(jù)權(quán)利要求l所述的文檔和/或圖像檢索方法,其特征在于,所述特征點(diǎn)是圖像中重復(fù)出現(xiàn)的預(yù)定部分。3.根據(jù)權(quán)利要求l所述的文檔和/或圖像檢索方法,其特征在于,所述特征點(diǎn)是單詞區(qū)域的重心。4.根據(jù)權(quán)利要求l所述的文檔和/或圖像檢索方法,其特征在于,所述特征點(diǎn)是日文漢字字符的孔。5根據(jù)權(quán)利要求l所述的文檔和/或圖像檢索方法,其特征在于,所述不變量值是交比。6根據(jù)權(quán)利要求l所述的文檔和/或圖像檢索方法,其特征在于,采用使用數(shù)字照相機(jī)或掃描器的數(shù)字拍攝方法。7.根據(jù)權(quán)利要求l所述的文檔和/或圖像檢索方法,其特征在于,所述不變量值對于仿射變換是不變的。8.根據(jù)權(quán)利要求l所述的文檔和/或圖像檢索方法,其特征在于,所述不變量值對于相似變換是不變的。9.一種使計(jì)算機(jī)執(zhí)行以下步驟的文檔和/或圖像存儲方法輸入文檔和/或圖像;向所述輸入的文檔和/或圖像分配ID;從所述輸入的文檔和/或圖像提取定義圖像配置的特征點(diǎn);以及對所提取的各特征點(diǎn)進(jìn)行預(yù)定處理;所述預(yù)定處理包括以下步驟(1)選擇距離感興趣的特征點(diǎn)P最近的n個(gè)特征點(diǎn);以及(2)對從所述選擇的n個(gè)特征點(diǎn)所選擇的m個(gè)特征點(diǎn)(m<n)的所有可能的各集合進(jìn)行預(yù)定處理;步驟(2)中的所述預(yù)定處理包括以下步驟(a)確定從感興趣的m個(gè)點(diǎn)的集合所選擇的d個(gè)點(diǎn)(其中,d是不大于預(yù)定數(shù)量m的數(shù)量)的所有可能的集合的特征量;(b)通過預(yù)定計(jì)算,基于所確定的特征量,確定散列表的索引;以及(c)將所述特征量與點(diǎn)ID和文檔ID相關(guān)聯(lián)存儲在所述散列表中,其中,在步驟(a)中使用所確定的散列索引確定所述特征量,將所述點(diǎn)ID分配給所述特征點(diǎn)p,將所述文檔ID分配給從中提取所述特征點(diǎn)p的文檔和/或圖像。10.根據(jù)權(quán)利要求9所述的文檔和/或圖像存儲方法,其特征在于,所述特征量是對由來自m個(gè)特征點(diǎn)的所有可能的5個(gè)點(diǎn)的各集合中的5個(gè)特征點(diǎn)的循環(huán)排列所確定的交比。11.根據(jù)權(quán)利要求9所述的文檔和/或圖像存儲方法,其特征在于,在步驟(b)中根據(jù)下面的公式l基于特征量計(jì)算散列索<formula>formulaseeoriginaldocumentpage4</formula>其中,crn(n=0~4)是5個(gè)離散交比值,Vm^是離散交比值中最大的一個(gè),pat是分配給來自m個(gè)點(diǎn)的5個(gè)點(diǎn)的各集合的組合模式ID,并取值0mCs-l。12.根據(jù)權(quán)利要求9所述的文檔和/或圖像存儲方法,其特征在于,在步驟(b)根據(jù)下面的公式2基于特征量計(jì)算散列索引<formula>formulaseeoriginaldocumentpage4</formula>其中,k是交比的量子化水平的數(shù)量,H^是散列表的大小,crn是來自m個(gè)點(diǎn)的5個(gè)點(diǎn)的集合的交比值。13.—種用于檢索通過根據(jù)權(quán)利要求l所述的存儲方法所存儲的文檔和/或圖像的文檔和/或圖像檢索方法,所述檢索方法使計(jì)算機(jī)執(zhí)行以下步驟讀取所拍攝的圖像;從所讀取的圖像提取定義圖像配置的特征點(diǎn);對所提取的各特征點(diǎn)進(jìn)行預(yù)定處理;所述預(yù)定處理包括以下步驟(1)選擇距離感興趣的特征點(diǎn)p最近的n個(gè)特征點(diǎn);以及(2)對從所選#奪的n個(gè)特征點(diǎn)所選3奪的m個(gè)特征點(diǎn)(m<n)的所有可能的各集合進(jìn)行預(yù)定處理;步驟(2)中的所述預(yù)定處理包括以下步驟(a)確定從感興趣的m個(gè)點(diǎn)的集合所選擇的d個(gè)點(diǎn)(其中,d是不大于預(yù)定數(shù)量m的數(shù)量)的所有可能的集合的特征量;(b)通過預(yù)定計(jì)算,基于所確定的特征量,確定散列表的索引;以及(C)基于所確定的散列索引從所述散列表獲取預(yù)先輸入的文檔和/或圖像的特征量,將在步驟(a)所確定的所述特征量和所獲取的特征量進(jìn)行比較,并且對具有匹配特征量的文檔ID投票;以及在步驟(1)和(2)后,基于投票結(jié)果指定與所拍攝的圖像相匹配的文檔和/或圖像的文檔ID。14.根據(jù)權(quán)利要求13所述的文檔和/或圖像檢索方法,其特征在于,其特征在于,所述特征量是對由來自m個(gè)特征點(diǎn)的所有可能的5個(gè)點(diǎn)的各集合中的5個(gè)特征點(diǎn)的循環(huán)排列所確定的交比。15.根據(jù)權(quán)利要求13所述的文檔和/或圖像檢索方法,其特征在于,在步驟(b)中根據(jù)下面的公式3基于特征量計(jì)算散列索引<formula>formulaseeoriginaldocumentpage5</formula>其中,crn(n=0~4)是5個(gè)離散交比值,V皿x是離散交比值中最大的一個(gè),pat是分配給來自m個(gè)點(diǎn)的5個(gè)點(diǎn)的各集合的組合模式ID,并取值0mC5-l。16.根據(jù)權(quán)利要求13所述的文檔和/或圖像存儲方法,其特征在于,在步驟(b)根據(jù)下面的公式4基于特征量計(jì)算散列索引<formula>formulaseeoriginaldocumentpage5</formula>其中,k是交比的量子化水平的數(shù)量,H^是散列表的大小,crn是來自m個(gè)點(diǎn)的5個(gè)點(diǎn)的集合的交比值。17.—種程序,其使計(jì)算機(jī)執(zhí)行從存儲文檔和/或圖像的數(shù)據(jù)庫檢索與所拍攝的圖像相對應(yīng)的文檔和/或圖像的處理,所述處理包括從所拍攝的圖像提取特征點(diǎn);基于各特征點(diǎn)的不變量值確定圖像的特征量;以及對數(shù)據(jù)庫中具有與所確定的特征量相匹配的文檔和/或圖像進(jìn)行投票。18.—種使計(jì)算機(jī)執(zhí)行以下步驟的文檔和/或圖像存儲程序輸入文檔和/或圖像;向所述輸入的文檔和/或圖像分配ID;從所述輸入的文檔和/或圖像提取定義圖像配置的特征點(diǎn);以及對所提取的各特征點(diǎn)進(jìn)行預(yù)定處理;所述預(yù)定處理包括以下步驟(1)選擇距離感興趣的特征點(diǎn)p最近的n個(gè)特征點(diǎn);以及(2)對從所述選擇的n個(gè)特征點(diǎn)所選擇的m個(gè)特征點(diǎn)(m<n)的所有可能的各集合進(jìn)行預(yù)定處理;步驟(2)中的所述預(yù)定處理包括以下步驟(a)確定從感興趣的m個(gè)點(diǎn)的集合所選擇的d個(gè)點(diǎn)(其中,d是不大于預(yù)定數(shù)量m的數(shù)量)的所有可能的集合的特征量;(b)通過預(yù)定計(jì)算,基于所確定的特征量,確定散列表的索引;以及(c)將所述特征量與點(diǎn)ID和文檔ID相關(guān)聯(lián)存儲在所述散列表中,其中,在步驟(a)中使用所確定的散列索引確定所述特征量,將所述點(diǎn)ID分配給所述特征點(diǎn)p,將所述文檔ID分配給從中提取所述特征點(diǎn)p的文檔和/或圖像。19.一種檢索使用根據(jù)權(quán)利要求18所述的存儲程序輸入的文檔和/或圖像的文檔和/或圖像檢索程序,該檢索程序使計(jì)算機(jī)執(zhí)行以下步驟讀取所拍攝的圖像;從所讀取的圖像提取定義圖像配置的特征點(diǎn);對所提取的各特征點(diǎn)進(jìn)行預(yù)定處理;所述預(yù)定處理包括以下步驟(1)選擇距離感興趣的特征點(diǎn)p最近的n個(gè)特征點(diǎn);以及(2)對從所選擇的n個(gè)特征點(diǎn)所選擇的m個(gè)特征點(diǎn)(m<n)的所有可能的各集合進(jìn)行預(yù)定處理;步驟(2)中的所述預(yù)定處理包括以下步驟(a)確定從感興趣的m個(gè)點(diǎn)的集合所選擇的d個(gè)點(diǎn)(其中,d是不大于預(yù)定數(shù)量m的數(shù)量)的所有可能的集合的特征量;(b)通過預(yù)定計(jì)算,基于所確定的特征量,確定散列表的索引;以及(c)基于所確定的散列索引從所述散列表獲取預(yù)先輸入的文檔和/或圖像的特征量,將在步驟(a)所確定的所述特征量和所述獲取的特征量進(jìn)行比較,對具有匹配特征量的文檔ID投票;以及在步驟(1)和(2)后,基于投票結(jié)果指定與所拍攝的圖像相匹配的文檔和/或圖Y象的文檔ID。20.—種文檔和/或圖像存儲設(shè)備,包括輸入部,輸入文檔和/或圖i象;特征,泉提取部,從所輸入的文檔和/或圖像提取定義圖像配置的特征點(diǎn);特征點(diǎn)選擇部,選擇距離所提取的感興趣的特征點(diǎn)p最近的n個(gè)特4正點(diǎn);以及特征量存儲部,對從所述所選擇的n個(gè)特征點(diǎn)所選擇的m個(gè)特征點(diǎn)(m<n)的所有可能的各集合進(jìn)行預(yù)定處理;所述預(yù)定處理包4舌以下步驟(a)確定從感興趣的m個(gè)點(diǎn)的集合所選擇的d個(gè)點(diǎn)(其中,d是不大于預(yù)定數(shù)量m的數(shù)量)的所有可能的集合的特征量;(b)通過預(yù)定計(jì)算,基于所確定的特征量,確定散列表的索引;以及(c)將所述特征量與點(diǎn)ID和文檔ID相關(guān)聯(lián)存儲在所述散列表中,其中,在步驟(a)中使用所確定的散列索引確定所述特征量,將所述點(diǎn)ID分配給所述特征點(diǎn)p,將所述文檔ID分配給從中提取所述特征點(diǎn)p的文檔和/或圖像。21.—種文檔和/或圖像存儲設(shè)備,其存儲由根據(jù)權(quán)利要求20所述的存儲設(shè)備所存儲的文檔和/或圖像。22.—種文檔和/或圖像檢索設(shè)備,其檢索存儲在根據(jù)權(quán)利要求21所述的文檔和/或圖像存儲設(shè)備中的文檔和/或圖像,該檢索設(shè)備包括讀取部,讀取所拍攝的圖像;特征點(diǎn)提取部,從所讀取的圖像提取定義圖^象配置的特征點(diǎn);特征點(diǎn)選擇部,選擇距離所提取的感興趣的特征點(diǎn)p最近的n個(gè)特征點(diǎn);以及投票部,對從所選擇的n個(gè)特征點(diǎn)所選擇的m個(gè)特征點(diǎn)(nKn)的所有可能的各集合進(jìn)行預(yù)定處理;所述預(yù)定處理包括如下步驟(a)確定從感興趣的m個(gè)點(diǎn)的集合所選擇的d個(gè)點(diǎn)(其中,d是不大于預(yù)定數(shù)量m的數(shù)量)的所有可能的集合的特征量;(b)通過預(yù)定計(jì)算,基于所確定的特征量,確定散列表的索引;以及(c)基于所確定的散列索引從所述散列表獲取預(yù)先輸入的文檔和/或圖像的特征量,將在步驟(a)所確定的所述特征量和所獲取的特征量進(jìn)行比較,并且對具有匹配特征量的文檔ID投票;以及文檔ID指定部,基于通過與所述各特征點(diǎn)相對應(yīng)的投票所確定的投票結(jié)果,指定與所拍攝的圖像相匹配的文檔和/或圖像的文檔ID。全文摘要一種文檔和/或圖像檢索方法,比較基于所拍攝的數(shù)字圖像的特征點(diǎn)所計(jì)算的特征量和基于存儲在數(shù)據(jù)庫中的各文檔和/或圖像的特征點(diǎn)所預(yù)先計(jì)算的特征量,從數(shù)據(jù)庫檢索與所拍攝的數(shù)字圖像相對應(yīng)的文檔和/或圖像。從所拍攝的數(shù)字圖像提取特征點(diǎn);對所提取的各特征點(diǎn)定義特征點(diǎn)的局部集合;從所定義的局部集合選擇特征點(diǎn)以定義局部集合的特征點(diǎn)子集;對于子集中的特征點(diǎn)的組合,確定不變量值作為表征各所選子集的值,不變量值對于幾何變換是不變的;通過組合所確定的不變量值計(jì)算特征量;以及基于預(yù)先計(jì)算的文檔和/或圖像的特征量對數(shù)據(jù)庫中的文檔和/或圖像進(jìn)行投票處理,從而從數(shù)據(jù)庫檢索與所拍攝的數(shù)字圖像相對應(yīng)的文檔和/或圖像。文檔編號G06F17/30GK101133429SQ200680006968公開日2008年2月27日申請日期2006年2月15日優(yōu)先權(quán)日2005年3月1日發(fā)明者中居友弘,巖村雅一,黃瀨浩一申請人:公立大學(xué)法人大阪府立大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
沙湾县| 福安市| 汝南县| 梧州市| 日喀则市| 巩义市| 渝北区| 霸州市| 黄冈市| 达日县| 襄汾县| 肇庆市| 蓝田县| 武清区| 田东县| 外汇| 遵化市| 北川| 察雅县| 左权县| 忻州市| 平乡县| 宝鸡市| 泸水县| 哈巴河县| 高碑店市| 竹山县| 建始县| 平阴县| 友谊县| 自治县| 崇义县| 洛川县| 内乡县| 宁武县| 突泉县| 女性| 渝北区| 镇远县| 顺义区| 仁布县|