專利名稱:數(shù)據(jù)庫搜索方法、系統(tǒng)和控制器的制作方法
數(shù)據(jù)庫搜索方法、系統(tǒng)和控制器領(lǐng)域本發(fā)明涉及用于搜索數(shù)據(jù)項目的數(shù)據(jù)庫的計算機化方法、系統(tǒng)和控制器,數(shù)據(jù)項目特別是但不局限于諸如圖像、音樂、電影、游戲或書籍的媒體項目。
背景技術(shù):
搜尋媒體項目例如現(xiàn)有的照片的數(shù)據(jù)庫是一項經(jīng)常在媒體業(yè)中以及消費者通常進行的任務(wù)。諸如gettyimages. com、images, google, com等的網(wǎng)站通常提供涉及圖像內(nèi)容的基于描述符的編索引的搜索方法。內(nèi)容描述符通常涉及諸如觀念、情感、位置的方面或涉及圖像中的人的特點。用戶通常使用下拉列表中的復選框指定一個或多個內(nèi)容描述符的值,且圖像搜索引擎然后搜索與用戶指定的值匹配的圖像的圖像數(shù)據(jù)庫索引。匹配的圖像然后通常伴隨著諸如分辨率或來源的技術(shù)信息被顯示在滾動窗口中。通常第一頁示出最接近的匹配,其可能涉及諸如色彩平衡的額外的本機特性的某個評估,以及多個其他頁包含較少的接近的匹配。用戶檢查許多圖像,并可以通過指定另外的內(nèi)容描述符值或通過選擇一個參考圖像作為示例來細化搜索。盡管使用描述符的初始搜索產(chǎn)生了許多可能相關(guān)的圖像,但選擇出更感興趣的圖像的搜索的細化常常是令人沮喪的。另外,對滾動以及單獨地檢查大量圖像和文本的混合的需要是令人疲倦和乏味的。因此存在提供改進的數(shù)據(jù)庫搜索技術(shù)的需要,改進的數(shù)據(jù)庫搜索技術(shù)實現(xiàn)有用的數(shù)據(jù)項目的更高效和用戶友好的識別。本發(fā)明的發(fā)明人通過在具代表性的數(shù)據(jù)項目的選擇和顯示的使用方面取得進展,找到了幫助用戶定位感興趣的數(shù)據(jù)項目的更加改進的方法。發(fā)明概述根據(jù)本發(fā)明的第一方面,提供了一種用戶通過用戶接口搜索包含數(shù)據(jù)項目的數(shù)據(jù)庫的方法,其包括以下步驟指定數(shù)據(jù)庫中的一些數(shù)據(jù)項目或所有數(shù)據(jù)項目的初始搜索子集;識別搜索子集中的多個數(shù)據(jù)類別中的每一個類別的代表;將這些代表顯示在用戶接口上;選擇代表中的一個或多個;指定在搜索子集中的在對應于所選擇的代表的數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項目的細化搜索子集;以及重復識別和顯示細化搜索子集的代表的步驟。在一個實施方式中,指定初始搜索子集的步驟包括從用戶接收限制標準并將初始子集定義為滿足限制標準的數(shù)據(jù)項目。限制標準可以是搜索詞的值。 在一個實施方式中,數(shù)據(jù)項目與多維描述符空間中的描述符值相關(guān)聯(lián),并且搜索子集中的數(shù)據(jù)類別是描述符空間中的區(qū)段。考慮獲得適合于所指定的搜索子集的類別,例如通過識別具有對搜索子集的減小的維度的一組適當?shù)拿枋龇乃惴◤母缶S度的描述符空間中的存儲的值的描述符表,可以定義所述多維描述符空間??紤]類別的數(shù)量來選擇減小的維度。在一個實施方式中,描述符空間的原點在搜索子集的中心附近,以便搜索子集的描述符坐標具有正值和負值;以及類別中的至少一個是多維描述符空間中的區(qū)段,相比于其他維度,所述區(qū)段在一個維度中的正方向或負方向上較大。在一個實施方式中,類別的數(shù)量被選擇成使得所有的代表可以一起被顯示給用戶。顯示細化搜索集的代表的步驟可以包括顯示靠近初始搜索子集的代表的細化搜索子集的代表。在一個實施方式中,指定、識別、顯示和選擇的過程適合于重復,直到所有的類別具有不多于一個的成員。 在一個實施方式中,數(shù)據(jù)項目包括數(shù)字媒體。根據(jù)本發(fā)明的第二方面,提供了一種供用戶交互地搜索包含數(shù)據(jù)項目的數(shù)據(jù)庫的數(shù)據(jù)庫搜索系統(tǒng),其包括具有顯示器的用戶接口 ;初始搜索子集指定器,其用于指定數(shù)據(jù)庫中的一些數(shù)據(jù)項目或所有數(shù)據(jù)項目的初始搜索子集;代表識別器,其用于識別搜索子集中的多個數(shù)據(jù)類別中的每一個類別的代表;代表顯示控制器,其用于將代表顯示在顯示器上;代表選擇器,其用于選擇代表中的一個或多個;細化搜索子集指定器,其用于指定在搜索子集中的在對應于所選擇的代表的數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項目的細化搜索子集;重復器,其用于重復識別以及顯示細化搜索子集的代表的步驟。根據(jù)本發(fā)明的第三方面,提供了一種供用戶通過具有顯示器的用戶接口交互地搜索包含數(shù)據(jù)項目的數(shù)據(jù)庫的數(shù)據(jù)庫搜索控制器,其包括初始搜索子集指定器,其用于指定數(shù)據(jù)庫中的一些數(shù)據(jù)項目或所有數(shù)據(jù)項目的初始搜索子集;代表識別器,其用于識別搜索子集中的多個數(shù)據(jù)類別中的每一個類別的代表;代表顯示控制器,其用于將代表顯示在顯示器上;代表選擇器,其用于選擇代表中的一個或多個;細化搜索子集指定器,其用于指定在搜索子集中的在對應于所選擇的代表的數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項目的細化搜索子集;重復器,其用于重復識別以及顯示細化搜索子集的代表的步驟。根據(jù)本發(fā)明的第五方面,提供了計算機可讀介質(zhì),其包括本發(fā)明的第四方面的程序代碼。根據(jù)本發(fā)明的第六方面,提供了數(shù)據(jù)信號,其包括本發(fā)明的第四方面的計算機程序代碼。附圖的簡要描述圖I是本發(fā)明的示例性數(shù)據(jù)庫搜索系統(tǒng)的框圖2示出本發(fā)明的一個實施方式的數(shù)據(jù)庫搜索的方法的流程圖。圖3-6示出根據(jù)本發(fā)明的一個實施方式的在圖像的數(shù)據(jù)庫中的搜索會話中的顯實施方式的詳細描述參考附圖,示出了根據(jù)本發(fā)明的一個實施方式的數(shù)據(jù)庫搜索系統(tǒng)、控制器和方法的不同方面。所述系統(tǒng)可以采用若干不同的形式。在第一種形式中,提供了獨立的系統(tǒng),其中所需要的所有組件或大部分組件存在于本地用戶可操作的計算機和接口中。在第二種形式中,提供了分布式結(jié)構(gòu),其中實現(xiàn)系統(tǒng)所需要的一些組件存在于本地用戶可操作的計算機和接口中,以及一些組件相對用戶被遠程定位。例如,可以使用“胖客戶端”結(jié)構(gòu),其中搜索和/或顯示控制的一部分在本地用戶可操作的計算機和接口上執(zhí)行,而一部分被遠程地例如通過服務(wù)器執(zhí)行;或者可以使用“瘦客戶端”結(jié)構(gòu),其中搜索和顯示控制的大部分被遠程地例如通過服務(wù)器執(zhí)行,而本地機器只用于用戶接口。典型的基于網(wǎng)絡(luò)的實現(xiàn)涉及具有顯示器、鍵盤和鼠標或觸敏屏的傳統(tǒng)的個人計算機,其將數(shù)據(jù)庫搜索控制器實現(xiàn)為可以從網(wǎng)站下載的JavaScript或XML程序。數(shù)據(jù)庫將通常遠離用戶被存儲并由數(shù)據(jù)庫搜索控制器詢問?,F(xiàn)在參考
圖1,最廣泛地來說,核心組件是數(shù)據(jù)庫搜索系統(tǒng)10,其包括用戶接口 20和數(shù)據(jù)庫搜索控制器30,數(shù)據(jù)庫搜索系統(tǒng)10與數(shù)據(jù)存儲器40通信,數(shù)據(jù)存儲器40可以本地以及遠程地被定位。在一個實施方式中,數(shù)據(jù)存儲器40包括數(shù)據(jù)項目數(shù)據(jù)庫420、描述符表422和限制標簽表421。用戶接口 20的組件包括諸如IXD監(jiān)視器的顯示器200以及諸如鼠標的位置選擇器210,用于使用戶使用諸如左鼠標按鈕或右鼠標按鈕的至少一個選擇器按鈕來指示顯示器200上的位置,以使用戶能夠選擇位置并執(zhí)行其他的輸入功能。數(shù)據(jù)庫搜索控制器30與用戶接口 20和數(shù)據(jù)存儲器40進行數(shù)據(jù)通信,并且通常包含處理器或在處理器上被實現(xiàn),處理器根據(jù)在顯示器200上的用戶輸入和輸出來處理搜索。在此,術(shù)語“處理器”用于一般指可執(zhí)行這一功能的任何設(shè)備并且可以包括微處理器、微控制器、可編程邏輯器件或其他計算設(shè)備、通用計算機(例如,PO或服務(wù)器。對于媒體應用,數(shù)據(jù)項目數(shù)據(jù)庫420是媒體數(shù)據(jù)項的大數(shù)據(jù)庫,如在本領(lǐng)域中的普通的,媒體數(shù)據(jù)項伴隨有通常包含與每個媒體項目相關(guān)的基于文本或二進制內(nèi)容的信息的限制標簽表421,而且還可以包含一些本機媒體信息例如媒體類型(例如彩色/黑白)。數(shù)據(jù)存儲器40還包含如在此所描述的每個媒體項目的衍生描述符的描述符表422,描述符表422通常起源于本機視聽描述符,而且也可以起源于基于內(nèi)容的信息。表421和422在數(shù)據(jù)庫建立期間被計算,并可以從媒體項目數(shù)據(jù)庫420遠程地定位,尤其是在本發(fā)明由除了數(shù)據(jù)項目數(shù)據(jù)庫420的所有者之外的一方運用的情況下。表421和422可以例如使用二叉樹全部或部分地被排序或編索引,以加速在數(shù)據(jù)庫420中滿足描述符或限制標簽中的值或值的范圍的項目的識別,如本領(lǐng)域中所熟知的。數(shù)據(jù)庫搜索控制器30具有初始搜索子集指定器310,初始搜索子集指定器310用于通常通過經(jīng)由用戶接口從用戶接收限制標準來指定初始搜索子集。在簡單的實現(xiàn)中,初始搜索子集指定器310可以平凡地僅適合于指定數(shù)據(jù)庫420中的全部數(shù)據(jù)項目或其固定子集。數(shù)據(jù)庫搜索控制器30還具有代表識別器320、代表顯示控制器321和代表選擇器330,代表識別器320用于識別搜索子集420中的一組代表性數(shù)據(jù)項目,每個代表性數(shù)據(jù)項目代表搜索子集中的若干類別中的一個,代表顯不控制器321用于將代表顯不在顯不器200上,以及代表選擇器330用于選擇通常由用戶通過位置選擇器210選擇的代表中的一個或多個。在數(shù)據(jù)庫搜索控制器30中還提供了細化搜索子集指定器331和重復器332,細化搜索子集指定器331用于指定在搜索子集中的在對應于所選擇的代表的數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項目的細化搜索子集,以及重復器332用于將細化搜素子集轉(zhuǎn)移到代表識別器320并用于通過代表顯示控制器321顯示新識別的代表。
現(xiàn)在參考圖2到圖6,在圖2的流程圖中描繪了本發(fā)明的方法方面的一個實施方式,以及在圖3到圖6中在本發(fā)明的方法的步驟中示出了示例性顯示布局。在步驟1201中,用戶通過在限制標準窗口 62中鍵入諸如搜索詞“fruit (水果)”的限制標準并點擊“search(搜索)”按鈕64b來指定初始搜索子集。初始搜索子集指定器310訪問限制標簽表421以識別滿足限制標準的數(shù)據(jù)項目,在這種情況下為包含水果的圖像。這是初始搜索子集。在步驟1202中,使用從在描述符表422中表示的35維空間到10維描述符空間的單值分解來找到20個適合于搜索子集的數(shù)據(jù)類別。在下面的示例中提供了這些過程的細節(jié)。在步驟1203和1204中,每個數(shù)據(jù)類別的代表被識別和顯示,也在下面被更詳細地描述。圖3示出所顯示的20個代表是在顯示器60的左側(cè)上的5乘4網(wǎng)格64。在每個圖像的左上方處是通知用戶搜索子集中的多少數(shù)據(jù)項目在每個對應的數(shù)據(jù)類別中的數(shù)字。在步驟1205中,用戶通過使用位置選擇器210點擊并在步驟1206中確認所選擇的項目將是通過點擊“search”按鈕64b而選擇的代表來選擇值得進一步搜索的代表中的一個或多個。在圖3中示出的會話中,選擇了右上代表64a。在步驟1207中,細化搜索子集被定義為當前搜索子集的包含在對應于所選擇的代表的數(shù)據(jù)類別內(nèi)的那些成員。系統(tǒng)然后重復通過SVD從細化搜索子集的描述符表值到適合于細化搜索子集的新的10維描述符空間來找到適當?shù)念悇e的步驟。20個類別中的每一個類別的代表然后被再次識別并顯示在顯示器的右側(cè)65上。左上代表與之前選擇的代表相同,但可以不一定是這種情況。在屏幕的底部是搜索細化的“面包屑”小徑(breadcrumb traiI)。點擊小徑中的最后一個框會將搜索子集返回到之前的搜索子集。進一步細化的子集從圖5中的代表65a (石榴)選擇以產(chǎn)生二維描述符空間的四個代表,以及如在圖6中所示,作為具有3個成員的類別的代表的石榴66a被再次選擇,以及僅具有3個成員的最后的細化搜索子集67被顯示。隨著分級搜索的繼續(xù),面包屑小徑63擴展,且在搜索子集的代表處的系列被添加到在左邊消失的帶中。用戶可以通過點擊面包屑小徑中的相關(guān)的框來跳回到序列中的任何搜索子集,并可以通過編輯限制標準窗62對搜索子集添加進一步的限制?;趫D像的描述符表的示例設(shè)想在本發(fā)明的典型的實施方式中,從更大維度的描述符空間中的存儲值的描述符表422定義適合于數(shù)據(jù)類別的多維描述符空間。對于圖像的應用,存在很多可用的圖像描述符,其在本發(fā)明中可以用來生成描述符表422。例子包括彩色直方圖、SIFT邊緣檢測、SURF邊緣檢測、Canny邊緣檢測、Tamura紋理特征以及Gabor紋理特征。發(fā)明人當前實現(xiàn)的對于圖像例如照片或靜止的電影的實施方式對描述符表使用一組35個描述符,其在數(shù)據(jù)庫建立期間使用未壓縮的CEDD[參考文獻I]和FTCH[參考文獻2]描述符集的組合中的336個描述符的單值分解(SVD)來獲取。找到搜索子集的數(shù)據(jù)類別的示例
在圖3到圖6中所示的實施方式中,在所有數(shù)據(jù)項目的初始搜索子集中具有“fruit”標簽的20個數(shù)據(jù)類別的代表以5乘4網(wǎng)格64顯示在顯示器60的左邊部分上。在預備步驟中,使用單值分解(SVD)從被限制到搜索子集的描述符表計算適合于搜索子集的新的35維描述符空間。通過選擇前10維將35維減少到10,這10維是對搜索子集的35個描述符的差異的最大的貢獻者,并因此是識別適合于搜索子集的類別的好的開始。這20個類別然后被定義為已減小的10維描述符空間中的區(qū)段。SVD算法的輸出被按比例縮放,以便描述符空間的原點在搜索子集的中心附近,使得搜索子集的描述符坐標具有正值和負值。實現(xiàn)這一目的的簡單方法是通過減去搜索子集中的每個坐標維的最大值和最小值的平均值來相對于粗略計算的中心定義該維。這允許區(qū)段定義為區(qū)域,其中一個坐標在正方向或負方向上比每維產(chǎn)生兩個區(qū)段的其他坐標大。就數(shù)學符號而言,n維描述符空間(例如新的已減小的10維空間)的第k維的點X = (X1, X2. . Xn)的正區(qū)段由下式定義S+k =(所有的點2L,使得對于所有的i關(guān)k, Xk > Xi且| xk|彡Xi |)以及負區(qū)段由下式定義S_k =(所有的點2L,使得對于所有的i關(guān)k, Xk彡Xi且| xk|彡Xi |)這種定義區(qū)段的方法通過B+樹的使用在標準數(shù)據(jù)庫上高效地運行。識別數(shù)據(jù)類別的代表的示例對于在以上示例中找到的類別,可以通過多種方法對每一類別識別代表性的數(shù)據(jù)項目。對標準數(shù)據(jù)庫快速執(zhí)行的方法的示例是識別最大值和最小值。換句話說,對于第k維的正區(qū)段的代表由具有最大的(最正的)Xk的區(qū)段S+k中的數(shù)據(jù)項目定義,以及對于第k維的負區(qū)段的代表由具有最小的(最負的)Xk的區(qū)段S_k中的數(shù)據(jù)項目定義。顯示代表的示例對于在本說明書中詳細說明的圖像示例,代表的顯示可以方便地通過將St1^P S_k的代表放在顯示器網(wǎng)格上的相對位置處來排序,例如,S+!和被放在左上(行1,列I)和右下(5,4)位置上,以及S+2和S_2被放在相鄰的相對的位置(2,I)和(4,4)上,等等。如在圖5和圖6中所看到的,當搜索集被細化到包括逐步減少的數(shù)據(jù)項目時,由于一些區(qū)段變空,代表的數(shù)量減少??梢酝ㄟ^如圖5所示的增大每個代表的圖像尺寸并如圖6所示的為不能整齊地放在網(wǎng)格中的素數(shù)數(shù)量的代表提供不規(guī)則分區(qū),來實現(xiàn)減少數(shù)量的圖像的顯示。音頻描述符空間的示例附圖示出了圖像數(shù)據(jù)庫的示例,但本發(fā)明同樣適用于諸如音樂的音頻數(shù)據(jù)??梢栽诒景l(fā)明中使用的音頻描述符的例子包括梅爾頻率倒譜、零交叉、光譜分析、光譜矩心、光譜滾降、線性預測編碼系數(shù)和節(jié)拍直方圖。發(fā)明人當前實現(xiàn)的對于音樂和音頻數(shù)據(jù)項目的實施方式對多維描述符空間使用例如在jAudio描述符計算軟件[參考文獻3]上實現(xiàn)的、在互聯(lián)網(wǎng)上在http: Ilimir.sourceforRe. net/iAudio. html找到的各種各樣的已知音頻描述符的組合。大量的可用描述符(在這種情況下為330個)在數(shù)據(jù)集上被首次測試以移除傾向于在對某些數(shù)據(jù)類型的SVD算法中引起錯誤的任何(通常大約為30個)描述符。魯棒剩余集(大約300個)然后經(jīng)受如在圖像示例中的SVD算法,以提供要存儲在描述符表422中的一組35個描述符。10維及更低的描述符空間的計算在搜索過程中如以上所描述的進行。音頻顯示的示例在照片的情況下,項目的性質(zhì)在項目的顯示中對于用戶是明顯的。在音頻的情況下很清楚,在代表顯示控制器321中在音頻項目的顯示中適應是合乎需要的,以傳達通常關(guān)于除了視覺方面例如所提供的音樂曲目插圖或?qū)]嫹饷嫱獾囊纛l的性質(zhì)的一些信息。一種方法是使用SVD將描述符坐標進一步從35縮簡到3,并將這3個縮簡的坐標表示為顏色空間中的RGB值。用戶將會明白哪些顏色對應于哪些類型的聲音。基于標簽的描述符應用盡管在以上的示例中數(shù)據(jù)庫建于從本地視聽數(shù)據(jù)計算的描述符,例如圖像的色彩平衡或邊緣信息以及在音樂的情況下的時間序列描述符,但在原始的描述符集中包括搜索詞是可能的,原始的描述符集也可以與本地描述符一起用SVD算法簡縮。 根據(jù)數(shù)據(jù)庫和應用,也存在描述符表422中的描述符集完全從簡縮的描述符來計算的情況。例如,當搜索一部電影或尤其是一本書時,可能發(fā)現(xiàn)諸如演員、導演、作者、情節(jié)、暴力程度等的信息在向用戶提供建議方面比本機描述符更有用。也可能存在各式各樣的二進制描述符,例如,在視頻游戲的情況下,游戲是否具有動作或戰(zhàn)略元素、謎題、精靈或槍。這些內(nèi)容標簽都可以用與本機描述符相同的方式來處理,并使用諸如SVD的算法減少到可控數(shù)量的連續(xù)坐標的多維集。將認識到,雖然從大量描述符的單值分解被描述為計算描述符表422的可控描述符空間以及初始搜索子集和細化搜索子集的減少的維度的多維描述符空間的一種方法,然而本發(fā)明包括分類和識別所產(chǎn)生的代表的任何方式。特別是,可以使用諸如NIPALS的另一聚類算法來代替SVD。而且,描述符空間不限于笛卡爾空間,且例如可以是節(jié)點樹,坐標是代表在樹中的位置的任何方式或任何其他結(jié)構(gòu)。另外,盡管例證了適合于搜索子集的內(nèi)容的自動分類,但本發(fā)明以其最廣泛的形式還包括嚴格的非適應性分類。在權(quán)利要求和說明書中,術(shù)語“初始搜索子集”擴展到領(lǐng)先并被細化成“細化搜索子集”的任何搜索子集,并且不需要是由用戶在搜索會話中指定的絕對的第一搜索子集。本領(lǐng)域中的技術(shù)人員還將認識到,可以對本發(fā)明進行許多其他變化而不偏離本發(fā)明的范圍。在接下來的權(quán)利要求中以及在本發(fā)明的前面的描述中,除了在上下文由于明確的語言或必要的暗示而另外需要的場合外,詞“包括(comprise)”或諸如“包括(comprises)”或“包括(comprising)”的變化形式在包含的意義上使用,即,以指定所陳述的特征的存在但不排除在本發(fā)明的多種實施方式中的另外的特征的存在或添加。應理解,如果在此提到任何已有技術(shù)公布,這樣的參考文獻并不構(gòu)成所述公布 在澳大利亞或任何其他國家形成本領(lǐng)域中的常見的一般知識的一部分的承認。參考文獻I. S. A. Chatzichristofis 和 Y.S. Boutalis 的 “CEDD:C0L0R AND EDGEDIRECTIVITY DESCRIPTOR-A COMPACT DESCRIPTOR FOR IMAGE INDEXING AND RETRIEVAL(CEDD :顏色和邊緣的方向性描述符——用于圖像索引和檢索的簡潔描述符)”,《6thInternational Conference in advanced research on Computer Vision Systems ICVS2008 (2008第6屆關(guān)于計算機視覺系統(tǒng)的高級研究國際會議ICVS)》,Proceedings (學報)LectureNotes in Computer Science (計算機科學講義)(LNCS)pp. 312-322,2008 年 5 月12-15 日,Santorini,Greece。2. S. A. Chatzichristofis 和 Υ· S. Boutalis 的 “FCTH:FUZZY COLOR AND TEXTURE
HIstogram-a low level feature for accurate image retrieval (FCTH:模糊顏色和
紋理直方圖-用于精確的圖像檢索的低水平特征)”,《9th International Workshop on
Image Analysis for Multimedia Interactive Services (關(guān)于用于多媒體交互服務(wù)的圖像分析的第9屆國際研討會)》,Proceedings (學報):IEEE Computer Society (IEEE計算機學會)pp. 191-196,2008 年 5 月 7-9 日,Klagenfurtj Austria。 3. McEnnisj D.、C. McKay、I. Fujinaga 和 P. Depalle 的 2005,jAudio:A featureextraction library Proceedings of the International Conference on MusicInformation Retrieval (關(guān)于音樂信息檢索的國際會議的特征提取庫學報),600-3。
權(quán)利要求
1.一種搜索方法,供用戶通過用戶接口搜索包含數(shù)據(jù)項目的數(shù)據(jù)庫,所述方法包括以下步驟 指定所述數(shù)據(jù)庫中的一些所述數(shù)據(jù)項目或所有所述數(shù)據(jù)項目的初始搜索子集; 識別所述搜索子集中的多個數(shù)據(jù)類別中的每一個類別的代表; 將所述代表顯示在所述用戶接口上; 選擇所述代表中的一個或多個; 指定在所述搜索子集中的在對應于所選擇的代表的所述數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項目的細化搜索子集;以及 重復識別和顯示所述細化搜索子集的代表的步驟。
2.如權(quán)利要求I所述的方法,其中指定初始搜索子集的步驟包括從用戶接收限制標準并將所述初始子集定義為滿足所述限制標準的數(shù)據(jù)項目。
3.如權(quán)利要求2所述的方法,其中所述限制標準是搜索詞的值。
4.如權(quán)利要求I所述的方法,其中所述數(shù)據(jù)項目與多維描述符空間中的描述符值相關(guān)聯(lián),并且所述搜索子集中的所述數(shù)據(jù)類別是所述描述符空間中的區(qū)段。
5.如權(quán)利要求4所述的方法,其中考慮獲得適合于所指定的搜索子集的類別來定義所述多維描述符空間。
6.如權(quán)利要求5所述的方法,其中通過識別具有對所述搜索子集的減小的維度的一組適當?shù)拿枋龇乃惴◤母缶S度的描述符空間中的存儲的值的描述符表來定義所述多維描述符空間。
7.如權(quán)利要求6所述的方法,其中考慮類別的數(shù)量來選擇所述減小的維度。
8.如權(quán)利要求7所述的方法,其中 所述描述符空間的原點在所述搜索子集的中心附近,以便所述搜索子集的所述描述符的坐標具有正值和負值;以及 所述類別中的至少一個是所述多維描述符空間中的區(qū)段,相比于其他維度,所述區(qū)段在一個維度中的正方向或負方向上較大。
9.如權(quán)利要求8所述的方法,其中 所述區(qū)段在一個維度中的正方向上較大,并由所述一個維度中的坐標值的帶符號值以及絕對值比所有其他維度中的坐標值的帶符號值以及絕對值大的點來定義;或者 所述區(qū)段在所述一個維度中的負方向上較大,并由所述一個維度中的坐標值的帶符號值比在其他維度中的坐標值的帶符號值小且絕對值比在其他維度中的坐標值的絕對值大的點來定義。
10.如權(quán)利要求8所述的方法,其中 對應于在所述一個維度中的所述正方向上的較大值的所述區(qū)段的所述代表是在所述搜索子集中具有所述一個維度中的最大帶符號坐標值的數(shù)據(jù)項目;以及 對應于在所述一個維度中的所述負方向上的較大值的所述區(qū)段的所述代表是在所述搜索子集中具有所述一個維度中的最小帶符號坐標值的數(shù)據(jù)項目。
11.如權(quán)利要求I所述的方法,其中所述類別的數(shù)量被選擇成使得所有的所述代表能夠一起被顯示給用戶。
12.如權(quán)利要求11所述的方法,其中顯示所述細化搜索集的代表的步驟包括顯示靠近所述初始搜索子集的代表的所述細化搜索子集的代表。
13.如權(quán)利要求I所述的方法,其中指定、識別、顯示和選擇的過程適合于重復,直到所有的所述類別具有不多于一個的成員。
14.如權(quán)利要求I所述的方法,其中所述數(shù)據(jù)項目包括數(shù)字媒體。
15.一種供用戶交互地搜索包含數(shù)據(jù)項目的數(shù)據(jù)庫的數(shù)據(jù)庫搜索系統(tǒng),包括 具有顯示器的用戶接口; 初始搜索子集指定器,其用于指定所述數(shù)據(jù)庫中的一些所述數(shù)據(jù)項目或所有所述數(shù)據(jù)項目的初始搜索子集; 代表識別器,其用于識別所述搜索子集中的多個數(shù)據(jù)類別中的每一個類別的代表; 代表顯示控制器,其用于將所述代表顯示在所述顯示器上; 代表選擇器,其用于選擇所述代表中的一個或多個; 細化搜索子集指定器,其用于指定在所述搜索子集中的在對應于所選擇的代表的所述數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項目的細化搜索子集; 重復器,其用于重復識別以及顯示所述細化搜索子集的代表的步驟。
16.一種供用戶通過具有顯示器的用戶接口交互地搜索包含數(shù)據(jù)項目的數(shù)據(jù)庫的數(shù)據(jù)庫搜索控制器,包括 初始搜索子集指定器,其用于指定所述數(shù)據(jù)庫中的一些所述數(shù)據(jù)項目或所有所述數(shù)據(jù)項目的初始搜索子集; 代表識別器,其用于識別所述搜索子集中的多個數(shù)據(jù)類別中的每一個類別的代表; 代表顯示控制器,其用于將所述代表顯示在所述顯示器上; 代表選擇器,其用于選擇所述代表中的一個或多個; 細化搜索子集指定器,其用于指定在所述搜索子集中的在對應于所選擇的代表的所述數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項目的細化搜索子集; 重復器,其用于重復識別以及顯示所述細化搜索子集的代表的步驟。
17.分別如權(quán)利要求15或權(quán)利要求16中所述的數(shù)據(jù)庫搜索系統(tǒng)或數(shù)據(jù)庫搜索控制器,其中所述初始搜索子集指定器、代表識別器、代表顯示控制器、代表選擇器、細化搜索子集指定器和重復器中的至少一個至少部分地通過執(zhí)行存儲在存儲器中的代碼的處理器來實現(xiàn)。
18.計算機程序代碼,所述計算機程序代碼當由計算機執(zhí)行時使所述計算機實現(xiàn)權(quán)利要求I到14中的任一項所述的搜索方法。
19.一種計算機可讀介質(zhì),包括權(quán)利要求18所述的程序代碼。
20.一種數(shù)據(jù)信號,包括權(quán)利要求18所述的計算機程序代碼。
全文摘要
提供了一種用戶通過用戶接口搜索包含數(shù)據(jù)項目的數(shù)據(jù)庫的方法、系統(tǒng)和控制器,所述方法包括以下步驟指定數(shù)據(jù)庫中的一些數(shù)據(jù)項目或所有數(shù)據(jù)項目的初始搜索子集(1201);識別搜索子集中的多個數(shù)據(jù)類別中的每一個類別的代表(1203);將代表顯示在用戶接口上(1204);選擇代表中的一個或多個(1205);指定在搜索子集中的在對應于所選擇的代表的數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項目的細化搜索子集(1207);以及重復識別和顯示細化搜索子集的代表的步驟。
文檔編號G06F17/30GK102640146SQ201080050275
公開日2012年8月15日 申請日期2010年9月10日 優(yōu)先權(quán)日2009年9月11日
發(fā)明者喬納森·大衛(wèi)·帕克, 克里斯多佛·格倫頓·貝茨, 基思·大衛(wèi)·德弗雷爾, 大衛(wèi)·彼得·沃爾夫, 布雷特·詹姆斯·格羅諾 申請人:薩姆萬斯集團知識產(chǎn)權(quán)控股私人有限公司