專利名稱:用于組織圖像的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及數(shù)碼照片的處理。
背景技術(shù):
社交因特網(wǎng)站點的使用正在變得越來越普遍。全世界較大比例的人口使用例如Facebook、twitter和其它社交因特網(wǎng)站點等站點與朋友和家人交流并保持聯(lián)系。許多這些因特網(wǎng)站點通常提供在不同照片庫中上載大量照片的可能性。另外,數(shù)字攝像機的廣泛使用使用戶能夠拍攝非常大量的圖片,而無需考慮沖洗照片的成本,這是在過去使用包括要以每張照片一定成本沖洗的一卷膠片的攝像機時的情況。許多移動電話包括數(shù)字攝像機,由此允許移動電話的用戶在任何機會拍攝照片。因為至少在世界某些部分有較大比例的人口擁有包括數(shù)字攝像機的移動電話,因此他們總是有數(shù)字攝像機在手邊。 由于容易拍照片而不必擔心質(zhì)量、沖洗的成本等等,因此拍了非常大量的照片。一個缺點是,在某個時間點,用戶可能想要以某種方式將所有他/她的數(shù)碼照片都分類到類別或庫中,并且還處置質(zhì)量差的照片。因為要分類的照片量可能非常大,因此將它們分類并選擇一些來保存和/或選擇一些上載到因特網(wǎng)站點的任務(wù)可能非常麻煩并且耗時。只是舉一個示例,家庭去度假一段時間。在假期期間,所有家庭成員可能在一天期間的不同時間拍了許多不同主題的不同照片等。當該家庭回到家時,這些照片要被分類,并且一些照片要被選擇以上載到因特網(wǎng)站點,或存儲在膝上型/個人計算機/CD或其它介質(zhì)上的目錄或文件夾中以顯示給朋友和家庭。假設(shè)有5個家庭成員,并且該家庭在外一周,即7天。假設(shè)所有家庭成員在那周的每天都已經(jīng)拍了平均20張照片。那么當該家庭返回家時,將有700張照片要整理。可能該家庭想要挑出大約50張照片代表假期,并且該家庭可能想要將它們顯示給朋友。在另一示例中,數(shù)字攝像機的用戶和/或包括數(shù)字攝像機的移動電話的用戶可能以短間隔拍照片,諸如每天多個照片,但可能不經(jīng)常對他/她的照片進行分類,可能每隔一個月一次。在這種情況下,要分類的照片數(shù)量可能在分類時刻之間大量堆積。已經(jīng)提出并使用了各種方法來對數(shù)碼照片進行分類?,F(xiàn)有方法和技術(shù)采用用于分析這些照片并根據(jù)它們的內(nèi)容(即它們描繪什么)來對它們進行分類的機制。與現(xiàn)有方法和技術(shù)相關(guān)聯(lián)的一個缺點是用戶需要人工選擇感興趣的照片,它們隨后可能可選地被上載到因特網(wǎng)站點。換句話說,當這些照片已經(jīng)例如被分類成組時,該用戶需要整理這些不同組,并選擇感興趣的一個或多個照片。
發(fā)明內(nèi)容
本發(fā)明的一個目的是解決至少一些上面概括的問題。具體地說,本發(fā)明的目的是提供用于使其用戶能夠以盡可能少的人工處理來組織多個數(shù)碼照片的方法和設(shè)備。這些目的以及其它目的可通過提供根據(jù)如下獨立權(quán)利要求的方法和設(shè)備來獲得。
根據(jù)一個方面,定義了在圖像組織設(shè)備中用于組織多個數(shù)碼照片的方法。該方法包括如下步驟接收和/或保存所識別的數(shù)碼照片組;接收定義要從該組中形成多少聚類(cluster)的數(shù)量;接收要用于將這些數(shù)碼照片群集到該數(shù)量的聚類中的簡檔信息;根據(jù)該簡檔信息來群集該數(shù)碼照片組;以及基于該簡檔信息從群集的數(shù)碼照片中識別這些聚類的代表性數(shù)碼照片。這具有如下優(yōu)點該數(shù)碼照片組將以最小人工輸入被組織到聚類中,并且將向該用戶呈現(xiàn)一個聚類、一些聚類或所有聚類的至少一個代表性照片,使他/她能夠容易且快速地看到這些聚類中包括什么類型的照片。在一個示例中,該簡檔包括屬性,這些屬性代表照片的不同特性。根據(jù)一個實施例,這些屬性包括照片的元數(shù)據(jù)和/或有關(guān)所述照片的外觀的特性。這具有如下優(yōu)點基于照片描繪什么或者照片的外觀以及數(shù)碼照片的特定元數(shù)據(jù), 這些數(shù)碼照片可被組織或分類到聚類中。根據(jù)另一實施例,該方法還包括將權(quán)重關(guān)聯(lián)到一些或所有屬性,從而定義每個屬性的重要性。這具有如下優(yōu)點可更精確地定義聚類,使得可以高精度或高準確度來執(zhí)行這些數(shù)碼照片的組織。在一個示例中,該簡檔信息包括定義對于特定用戶有效的屬性集合的用戶簡檔,這些屬性規(guī)定在群集該數(shù)碼照片組時要考慮的不同特性。這具有如下優(yōu)點賦予該方法的用戶定義最佳地對應(yīng)于他/她個人愛好和偏好的簡檔的能力。在另一示例中,該簡檔信息包括定義對于特定情形有效的屬性集合的情形簡檔,所述屬性規(guī)定在群集該數(shù)碼照片組時要考慮的不同特性。這具有如下優(yōu)點用戶可根據(jù)誰將觀看這些數(shù)碼照片或根據(jù)不同數(shù)碼照片描繪的特定情形來定義不同的簡檔。根據(jù)一個實施例,在接收要用于群集這些數(shù)碼照片的簡檔信息的步驟中通過錄入在群集所述數(shù)碼照片組時要考慮的特定屬性來創(chuàng)建該情形簡檔。這具有如下優(yōu)點使該過程的用戶能夠或者錄入特定簡檔,創(chuàng)建新簡檔,或者只是錄入對于群集這些數(shù)碼照片要使用一次的一些屬性。根據(jù)另一實施例,該方法還包括在根據(jù)所述簡檔信息來群集所述數(shù)碼照片組的步驟之前,相對于不同數(shù)碼照片確定不同屬性的確定性,并濾出對于特定屬性具有不確定信息的數(shù)碼照片。在一個示例中,根據(jù)所述簡檔信息來群集所述數(shù)碼照片組的步驟包括按照一個或多個屬性定義聚類,并根據(jù)所述聚類來群集所述數(shù)碼照片組。在另一示例中,該方法還包括在基于所述簡檔信息從群集的數(shù)碼照片中識別所述聚類的代表性數(shù)碼照片的步驟之后將濾出的、具有不確定信息的數(shù)碼照片添加到適當聚類。這具有如下優(yōu)點濾出的數(shù)碼照片未丟掉,在已經(jīng)識別了代表性照片之后添加它們。它還確保難以群集的數(shù)碼照片不能被識別為聚類的代表性數(shù)碼照片。根據(jù)一個實施例,相對于不同數(shù)碼照片確定不同屬性的確定性包括確定這些屬性的熵,其中高熵對應(yīng)于不確定信息。根據(jù)另一實施例,識別代表性數(shù)碼照片的步驟包括識別每個聚類中的照片,該照片最佳對應(yīng)于在該簡檔信息中所定義的那個聚類的屬性。根據(jù)又一實施例,如果錄入了用戶簡檔并且隨后在根據(jù)該簡檔來群集所述數(shù)碼照片組的步驟中使用該用戶簡檔,則該方法還包括接收來自用戶的、有關(guān)識別的代表性數(shù)碼照片的反饋并根據(jù)接收的反饋來調(diào)整用戶簡檔中每個屬性的權(quán)重。這具有如下優(yōu)點可“修整”或優(yōu)化該用戶簡檔以適合該用戶的與該簡檔相關(guān)聯(lián)的期望和偏好。在一個示例中,接收和/或保存所識別的數(shù)碼照片組的步驟包括將所述數(shù)碼照片組上載到數(shù)據(jù)存儲裝置。在另一示例中,接收和/或保存所識別的數(shù)碼照片組的步驟包括將至少一個數(shù)碼照片上載到包括已經(jīng)存在的數(shù)碼照片群集組的數(shù)據(jù)存儲裝置,并且其中所述根據(jù)所述簡檔群集所述數(shù)碼照片組包括將至少一個上載的數(shù)碼照片群集到已經(jīng)存在的數(shù)碼照片群集組中的聚類之一中。這具有如下優(yōu)點用戶可添加單個數(shù)碼照片或幾個數(shù)碼照片,并將它們組織到數(shù)碼照片的已經(jīng)群集或組織的組中。根據(jù)另一方面,定義一種適合于組織多個數(shù)碼照片的設(shè)備。
在一個實施例中,所述設(shè)備包括數(shù)據(jù)庫,適合于接收和/或保存所識別的數(shù)碼照片組;接收單元,適合于接收來自用戶的輸入,所述輸入包括要從所述數(shù)碼照片組中形成的聚類數(shù)量和要用于將所述數(shù)碼照片群集到所述數(shù)量的聚類中的簡檔信息;群集單元,適合于根據(jù)所述簡檔信息來群集所述數(shù)碼照片組;以及識別單元(520),適合于基于所述簡檔信息從群集的數(shù)碼照片中識別所述聚類的代表性數(shù)碼照片。根據(jù)一個實施例,所述簡檔信息包括屬性,所述屬性代表數(shù)碼照片的不同特性。在一個示例中,所述屬性包括照片的元數(shù)據(jù)和/或有關(guān)照片的外觀的特性。在另一示例中,將權(quán)重關(guān)聯(lián)到一些或所有屬性,從而定義每個屬性的重要性。在又一示例中,接收的簡檔信息是定義對于特定用戶有效的屬性集合的用戶簡檔,所述屬性規(guī)定在所述群集所述數(shù)碼照片組時要考慮的不同特性。在又一示例中,接收的簡檔信息是定義對于特定情形有效的屬性集合的情形簡檔,所述屬性規(guī)定在所述群集所述數(shù)碼照片組時要考慮的不同特性。根據(jù)一個實施例,當接收單元接收到在所述群集所述數(shù)碼照片組時要考慮的特定屬性時創(chuàng)建所述情形簡檔。根據(jù)另一實施例,該設(shè)備還適合于在所述群集單元根據(jù)所述簡檔信息來群集所述數(shù)碼照片組之前,相對于不同數(shù)碼照片確定不同屬性的確定性,并濾出對于特定屬性具有不確定信息的照片。根據(jù)又一實施例,根據(jù)所述簡檔信息來群集所述數(shù)碼照片組包括按照一個或多個屬性定義聚類,并根據(jù)所述聚類來群集所述數(shù)碼照片組。在一個示例中,該群集單元還適合于在基于所述簡檔信息從群集的數(shù)碼照片中識別所述聚類的代表性數(shù)碼照片之后將所述濾出的、具有不確定信息的數(shù)碼照片添加到適當聚類。在另一個示例中,相對于不同數(shù)碼照片確定不同屬性的確定性包括確定這些屬性的熵,其中高熵對應(yīng)于不確定信息。在又一個示例中,識別所述代表性數(shù)碼照片包括識別每個聚類中的照片,該照片最佳地對應(yīng)于在該簡檔信息中所定義的那個聚類的屬性。根據(jù)一個實施例,如果所述接收單元接收到用戶簡檔(其隨后由所述群集單元在根據(jù)所述簡檔群集所述數(shù)碼照片組時使用),則該接收單元還適合于接收來自用戶的、有關(guān)識別的代表性數(shù)碼照片的反饋,并且該群集單元還適合于根據(jù)接收的反饋來調(diào)整該用戶簡檔中每個屬性的權(quán)重。根據(jù)另一實施例,該數(shù)據(jù)庫適合于保存已經(jīng)群集的數(shù)碼照片的組并接收至少一個數(shù)碼照片,并且其中該群集單元還適合于將所述接收的至少一個數(shù)碼照片群集到已經(jīng)群集的數(shù)碼照片的組中的一個或多個聚類中。根據(jù)又一實施例,所述設(shè)備是終端,諸如數(shù)字攝像機、移動電話或包括攝像機的任何其它終端。
現(xiàn)在將借助示范實施例并參考附圖更詳細地描述本發(fā)明,附圖中
圖I是例證過程實施例的流程圖。 圖2是例證過程另一實施例的流程圖。圖3是例證過程又一實施例的流程圖。圖4是例證簡檔的框圖。圖5是例證設(shè)備實施例的框圖。圖6是熵曲線。
具體實施例方式這個解決方案可用于解決至少一些上文概括的問題。具體地說,這個解決方案可用于使用戶能夠?qū)⒍鄠€數(shù)碼照片自動組織成聚類(cluster)或組。在現(xiàn)有技術(shù)中,用戶必須人工選擇他/她想要放在影集或文件夾中的照片。他/她還需要在將圖片上載到影集或文件夾之前人工識別不同的關(guān)鍵時刻,即,例如代表某一事件的圖片。這里給出的解決方案將提供以最小人工干預(yù)來幫助用戶根據(jù)不同屬性將多個照片自動組織到不同聚類中的過程和設(shè)備。圖I是流程圖,該流程圖例證用于組織多個數(shù)碼照片的過程的實施例。這個過程包括接收和/或保存所識別的數(shù)碼照片組的第一步驟100。這可用多種方式來進行。兩個示例是將要組織的照片組上載到數(shù)據(jù)庫,或識別包含在數(shù)據(jù)存儲裝置或存儲器中的照片組。該過程的下一步驟110是接收定義要從該數(shù)碼照片組中形成多少聚類的數(shù)量。該過程的一個特征是它將多個數(shù)碼照片(這里稱為數(shù)碼照片組)組織或群集到更小的組(下文稱為聚類)中。要組織的照片組可能非常大,其包括大量的數(shù)碼照片。為了執(zhí)行該過程的這個特征,即,將該數(shù)碼照片組組織成聚類,有必要知道要從該數(shù)碼照片組中形成多少聚類。圖I還例證了該過程的下一步驟120,即,接收要用于群集這些數(shù)碼照片的簡檔信息。這個步驟使該過程能夠知道如何群集該數(shù)碼照片組。為了能夠執(zhí)行將該數(shù)碼照片組群集到聚類中,還有必要知道如何群集該照片組、每個聚類中應(yīng)該包括什么類型的數(shù)碼照片。該信息將由簡檔信息提供??捎貌煌绞絹韺崿F(xiàn)簡檔信息的錄入。在一個示例中,該過程可提示用戶220錄入要用于群集這些數(shù)碼照片的簡檔。將在下文結(jié)合圖2更詳細地對此進行說明。然后,該數(shù)碼照片組的群集130可開始,并且根據(jù)在前一步驟120中錄入的簡檔信息將數(shù)碼照片群集在不同聚類中。到這時,該過程具有了它將該數(shù)碼照片組群集或組織成聚類所需要的所有信息。向該過程提供了要群集的組、該數(shù)碼照片組要群集/組織成的聚類數(shù)量、還有根據(jù)哪個標準或者如何執(zhí)行該群集(如由該簡檔信息所給出的)。圖I還例證了基于錄入的簡檔信息從群集的這些數(shù)碼照片中識別這些聚類的代表性照片的最后步驟140。當原始照片組被群集到不同聚類中時,這個步驟為聚類提供代表性照片。然后可向該方法的用戶提供代表特定聚類的照片,使得他/她將知道或容易看到什么類別的照片被包含在那個特定聚類中。可能存在代表聚類的一個或多個照片。所有聚類或其中一些聚類可由代表性照片來代表。這具有多個優(yōu)點。一個優(yōu)點是該用戶可自動將大量數(shù)碼照片分類。僅需要由該用戶規(guī)定聚類數(shù)量和簡檔信息,并且然后該數(shù)碼照片組或多個數(shù)碼照片被自動分類或組織。然后將向該用戶呈現(xiàn)一個聚類、一些聚類或所有聚類的至少一個代表性照片,使他/她能夠容易且快速地看到在這些聚類中包含什么類型的照片。該用戶不必人工整理和選擇大 量照片,和/或人工選擇組織或群集這些數(shù)碼照片時要使用的不同標準。另外,將向該用戶提供聚類的代表性數(shù)碼照片,使得該用戶不必人工打開每個聚類來查看在這些不同聚類中包括什么類型的數(shù)碼照片。被錄入120并隨后用于群集130這些數(shù)碼照片以及識別140這些聚類的代表性照片的簡檔信息可包括屬性,所述屬性代表數(shù)碼照片的不同特性。屬性可以是可指示或定義數(shù)碼照片描繪什么的任何類別特性。最經(jīng)常期望將照片組織成聚類,其中聚類可包括公開類似情景和/或?qū)ο蟮恼掌?。這些屬性幫助定義在每個聚類中應(yīng)該包括什么類別或類型的數(shù)碼照片。這個特征的一個優(yōu)點是用戶可創(chuàng)建一個或多個簡檔,每個簡檔包括屬性,該屬性代表照片的不同特性。另一個優(yōu)點是當錄入該簡檔信息時,用戶可錄入要使用的簡檔,而無需每當他/她想要組織數(shù)碼照片組時人工錄入每一個屬性。這些屬性包括照片的元數(shù)據(jù)和/或有關(guān)照片的外觀的特性。可能是有利的是當定義簡檔和/或在群集步驟和隨后的識別步驟中要使用什么時,能夠根據(jù)元數(shù)據(jù)和該照片描繪什么(照片的外觀)兩者來規(guī)定多個不同屬性。元數(shù)據(jù)的一些示例是拍攝圖片的時間和日期。可能期望將這些數(shù)碼照片按照相關(guān)于何時它們被拍攝的某種順序來分類,或按一天的時間(諸如白天或晚上)分類。屬性的一些其它示例是照片顯示什么,諸如人、笑臉、風景、山、建筑物等。一些其它示例是拍照片的地方以及沿哪個方向。另一個屬性可以是該照片的銳度,可能期望不顯示模糊照片。當然,可能存在照片描繪什么和可考慮什么元數(shù)據(jù)的許多不同示例。這些不同屬性也可與不同權(quán)重相關(guān)聯(lián),從而定義每個屬性的重要性。權(quán)重可與一些不同屬性或所有不同屬性相關(guān)聯(lián)。這也具有多個優(yōu)點。一些屬性可能比其它屬性更重要,并且應(yīng)該在群集步驟和識別步驟中被特別考慮。這個特征使該過程的用戶能夠更好并且更精確地定義要使用的不同簡檔(以及這些簡檔內(nèi)的聚類)。這也可改進該群集步驟以及特別是還有識別步驟的質(zhì)量,使得聚類更有可能僅包括應(yīng)該作為那個聚類的一部分的照片。在識別步驟中,被識別成代表特定聚類的數(shù)碼照片更有可能最佳地對應(yīng)于那個特定聚類的最重要屬性,也就是具有最高權(quán)重的屬性。
這些屬性可表達為概率,其范圍從O到I。將在下文對此進行更詳細描述??梢越M合不同屬性。例如,可以組合屬性“笑臉”、“地方”和“方向”以將描繪相同或類似對象的數(shù)碼照片歸類。當組織/群集這些數(shù)碼照片時,這些屬性的組合將充當選擇標準的基礎(chǔ)。數(shù)碼照片P由其屬性代表,使得P = Qtt2 f … J ο兩張照片之間的相似性sim(Pl,p2)可表達為 sim(p1# p2) =
心靶K
其中ont是有關(guān)定義屬性之間相似性度量的屬性等級的本體,并且Wk是屬性attk的權(quán)重。不同屬性之間的相似性可根據(jù)該屬性的值計算如下“數(shù)之間的相似性”:在O與I之間的標準化距離,或等效相似性;“二進制值之間的相似性”:如果它們相等,則為1,否則為0,或者等效相似性;“項目與列表之間的相似性”:給定操作集合(例如插入、刪除等)時將第 一單元變換成第二單元或者將第二單元變換成第一單元所需的步驟數(shù)量;“分級列表之間的相似性”從根開始相似的步驟數(shù)量。這些權(quán)重被標準化,并且當群集這些照片時這些權(quán)重將反映每個屬性的重要性。被錄入120的簡檔信息可以是定義對于特定用戶有效的屬性集合的用戶簡檔。這些屬性規(guī)定在群集該數(shù)碼照片組的步驟130中要考慮的不同特性。通過使用用戶簡檔,賦予該過程的用戶如下能力定義最佳地對應(yīng)于他/她的個人愛好和偏好的簡檔。用戶很可能關(guān)于他/她對什么感興趣以及他/她更喜歡看什么具有一些偏好。因而,用戶簡檔可以是為用戶“進行的特制”。被錄入120的簡檔可以是定義對于特定情形有效的屬性集合的情形簡檔。這些屬性規(guī)定在群集該數(shù)碼照片組的步驟中要考慮的不同特性。通過具有情形簡檔,該過程的用戶可錄入不同情形簡檔??赡芷谕鶕?jù)誰將觀看這些數(shù)碼照片或根據(jù)這些數(shù)碼照片中描繪的特定情景來使用不同的簡檔??赡芷谕麑⒉煌愋偷恼掌?情形)顯示給朋友,并將其它類型的照片顯示給家人和親屬。那么,這些情形簡檔將包括不同屬性。也可能是如下情況一些數(shù)碼照片可被上載到社交網(wǎng)絡(luò),并且一些數(shù)碼照片將被存儲在存儲器上的特定文件夾或數(shù)據(jù)庫中。變型有許多,并且因此對于具有不同簡檔的需要可能是基本的。該情形簡檔可被預(yù)先定義。但也可在錄入要用于群集這些數(shù)碼照片的簡檔信息的步驟中通過錄入在群集該數(shù)碼照片組的步驟中要考慮的特定屬性來創(chuàng)建該情形簡檔。如果不存在對應(yīng)于要用于該群集的期望屬性的“良好”簡檔或匹配簡檔,則能夠錄入要用于群集這些數(shù)碼照片的一些特定屬性可能是期望的并且有利的。這使該過程的用戶能夠或者錄入特定簡檔,創(chuàng)建新簡檔,或者只是錄入對于群集這些數(shù)碼照片要使用一次的一些屬性。當然,它也使該過程的用戶能夠創(chuàng)建新簡檔,錄入的這些屬性例如可作為情形簡檔來存儲。圖2是例證該過程另一實施例的流程圖,其中以提示用戶錄入簡檔220或特定屬性作為簡檔信息的這種方式來實現(xiàn)該過程。如果該用戶無法這么做,則在群集260和識別270步驟中,該過程自動檢索并使用預(yù)先定義的用戶簡檔240。圖2中的步驟200和210對應(yīng)于圖I中的步驟100和110。
在該過程的一個實施例中,如圖2中所例證的,有可能的是在根據(jù)錄入的簡檔來群集該數(shù)碼照片組的步驟260之前,確定不同屬性的確定性并濾出250對于特定屬性具有不確定信息的照片。圖2的步驟260對應(yīng)于圖I的步驟130。這可具有多個優(yōu)點。期望根據(jù)錄入的簡檔信息或?qū)傩詠砣杭摂?shù)碼照片組??赡芤恍?shù)碼照片難以分類或群集,并且相對于不同屬性存在某種不確定性。這些照片不應(yīng)該被識別為聚類的代表性照片,并且這由此得以避免。該簡檔或該簡檔信息中的屬性可被看作或表達為如下的概率照片描繪什么和/或元數(shù)據(jù)。一些數(shù)碼照片將比其它照片更容易分類或群集。作為一個示例,對于數(shù)碼照片,它描繪笑臉的概率是O. 5。這意味著,它未描繪笑臉的概率也是O. 5。因此,笑臉的屬性的不確定性高。這種數(shù)碼照片將被濾出150。另一方面假設(shè)對于數(shù)碼照片,它描繪笑臉的概率是O. 8。這意味著,它未描繪笑臉的概率是O. 2。這張數(shù)碼照片中笑臉的屬性的不確定性低,并且該數(shù)碼照片因此易于相對于屬性“笑臉”進行群集。根據(jù)該簡檔信息來群集該數(shù)碼照片組的步驟130、260包括按照一個或多個屬性定義聚類,并根據(jù)所定義的聚類來群集該數(shù)碼照片組。如上所述,該簡檔信息包括不同屬性。該簡檔信息也定義不同聚類,這些聚類又各包括一組一個或多個屬性。當根據(jù)該簡檔信息來群集130、260該數(shù)碼照片組時,根據(jù)在該簡檔信息內(nèi)定義的聚類來群集該數(shù)碼照片組。在識別步驟270之后,當基于錄入的簡檔信息從群集的這些數(shù)碼照片中識別這些聚類的代表性照片時,該過程包括將濾出的、具有不確定信息的數(shù)碼照片添加280到適當聚類的步驟。這具有如下優(yōu)點濾出的數(shù)碼照片未丟掉,而能在適當聚類中找到。適當聚類是根據(jù)那個聚類的屬性該數(shù)碼照片最緊密地對應(yīng)的聚類。具有不確定信息的數(shù)碼照片不意味著它是“壞”照片或不想要的照片。不確定信息指示它不能確定地被群集。例如,假設(shè)群集依照的屬性是笑臉。該照片很可能包括笑臉,但該過程不能夠確定無疑地確定這一點或以高概率來確定這一點。因此,這種照片被濾出,但未被丟棄。在識別代表性照片之后,該數(shù)碼照片被添加到包括笑臉的數(shù)碼照片聚類。結(jié)果,該數(shù)碼照片仍可被該用戶找到,但它不會是那個特定聚類的代表性照片。相對于不同數(shù)碼照片確定不同屬性的確定性包括確定這些屬性的熵,其中高熵對應(yīng)于不確定信息。參考上例,對于一張照片,其中它包括笑臉的概率是O. 5。在此示例中,屬性“笑臉”的熵是高的。同樣,對于其中它包括笑臉的概率是O. 8的照片,屬性“笑臉”的熵是低的?!?br>
熵可用作樣本集合中不確定性的量度。它可被說成特征化示例的隨機集合中的不純度,其例如可表示為隨機變量Y。期望自信息(HY)然后可表達為
H(Y) = SpCy = y)log(p(Y = y)
在該集合中僅2個值(正和負)并假設(shè)我們具有14個樣本(其中9個正和5個負的19+, 5-1)的情況下,熵E變成:
£■([9+, S —J) = -P^log2P* — P-Ioj2P-=-(B i£) — (£) (^)=腦補
如果該集合具有相等分布,例如[5+,5-],則E(Y)=l。如果所有樣本都屬于同一類,例如[10+,O-],則E(Y)=O。見圖6中的圖表,其公開了熵曲線。識別至少一個代表性數(shù)碼照片的步驟270包括識別每個聚類中最佳地對應(yīng)于在該簡檔信息中所定義的那個聚類的屬性的照片。向該過程的用戶呈現(xiàn)每個聚類的至少一個數(shù)碼照片是有利的。照片最佳地對應(yīng)于在該簡檔信息中所定義的那個聚類的屬性的數(shù)碼照片是最靠近質(zhì)心的照片,該質(zhì)心是100%對應(yīng)于由其屬性所定義的聚類的照片。如上面所說明的,屬性可被看作數(shù) 碼照片中存在那個屬性的概率。100%對應(yīng)于由其屬性所定義的聚類的數(shù)碼照片對于那個聚類中的每個屬性都將具有I. O的概率。換言之,那個聚類中每一個屬性的熵都將是O。對于那個聚類中的每一個屬性都具有等于O的熵的這種數(shù)碼照片可能不存在,它可被視為“假設(shè)”數(shù)碼照片。聚類的代表性數(shù)碼照片將是最靠近“假設(shè)”數(shù)碼照片的照片,即對于定義該聚類的屬性具有最低熵的數(shù)碼照片。可在識別代表性數(shù)碼照片的步驟280中考慮其它個人標準,諸如數(shù)碼照片的質(zhì)量、分辨率等等。當向該過程的用戶呈現(xiàn)代表聚類的數(shù)碼照片時,該用戶也將具有看到那個聚類的更多照片的可能性。該用戶將不限于只看到代表性照片。該過程可實現(xiàn)成使得該用戶可選擇在已經(jīng)被呈現(xiàn)了特定聚類中的代表性數(shù)碼照片之后被呈現(xiàn)特定聚類中任意數(shù)量的數(shù)碼照片,或由該代表性數(shù)碼照片代表的那個聚類中的所有數(shù)碼照片。該過程還包括如下可能性該用戶錄入有關(guān)群集和所識別照片的反饋。這在圖3中例證了。如果接收到用戶簡檔并隨后在根據(jù)錄入的用戶簡檔來群集該數(shù)碼照片組的群集步驟130、260中使用300該用戶簡檔,則該用戶可錄入有關(guān)所識別的代表性照片的反饋310。然后可根據(jù)接收的反饋來調(diào)整320該用戶簡檔中每個屬性的權(quán)重。這具有如下優(yōu)點可“修整”或優(yōu)化該用戶簡檔以適合用戶的與該簡檔相關(guān)聯(lián)的期望和偏好。該用戶簡檔代表用戶的偏好,并且如果該簡檔可調(diào)整成使得該過程根據(jù)最可能的用戶偏好來群集該數(shù)碼照片組,則是有利的。當已經(jīng)調(diào)整320這些權(quán)重時,然后存儲330更新的用戶簡檔。如何更新權(quán)重Wkl的一個示例是Wk (t + I) = 廣’
其中V是當前觀察。根據(jù)該過程,接收和/或保存所識別的、要組織的數(shù)碼照片組的步驟100、200包括將該數(shù)碼照片組上載到數(shù)據(jù)存儲裝置。當組織多個照片時需要做的首要事情其中之一是識別哪些照片要被組織。根據(jù)該方法的實現(xiàn),如將在后面描述的那樣,這可用多種方式來進行。這舉例說明了識別要被組織和群集的數(shù)碼照片組的一種方式。換言之,該過程的用戶將要組織的照片組上載到在其上執(zhí)行該過程的某種類型的數(shù)據(jù)存儲裝置。根據(jù)該過程的一個實施例,接收和/或保存所識別的、要組織的數(shù)碼照片組的步驟100、200包括將至少一個數(shù)碼照片上載到包括已經(jīng)存在的照片群集組的數(shù)據(jù)存儲裝置。然后,根據(jù)該簡檔信息來群集該數(shù)碼照片組的步驟130、260包括將至少一個上載的數(shù)碼照片群集到已經(jīng)存在的數(shù)碼照片群集組中的聚類之一中。這構(gòu)成了如何接收和/或保存所識別的、要組織的數(shù)碼照片組100、200的另一示例。在這個示例中,要群集的該照片組包括已經(jīng)存在的數(shù)碼照片群集組加上至少一個上載的數(shù)碼照片。然后,在該群集步驟130、260中,該過程僅必須將新上載的至少一個數(shù)碼照片群集到已經(jīng)存在的數(shù)碼照片群集組中。換言之,這可被看作遞增的群集,其中用戶可簡單地將數(shù)碼照片添加到已經(jīng)存在的數(shù)碼照片群集組。這個示例的一個優(yōu)點是所有已經(jīng)存在的數(shù)碼照片群集組不需要重新群集。僅新添加的至少一個數(shù)碼照片需要被處理以便將它群集到適當聚類。當然,這僅在應(yīng)該對于該群集使用相同簡檔信息的情況下才有效。如果該過程的用戶選擇其它簡檔信息用在群集步驟130、260中,則在根據(jù)新錄入的簡檔信息進行群集時需要考慮所有這些數(shù)碼照片。圖4例證了用戶簡檔400或情形簡檔400的示例。該簡檔包括不同屬性AlrA2, A3f…,~和每個屬性的對應(yīng)權(quán)重W,, Wp W31…鳥。這意味著,通過向每個屬性施加權(quán)重可賦予它或多或少的重要性。換言之,每個屬性具有Ak*Wk的影響。
下面將參考圖5描述適合于組織多個數(shù)碼照片的設(shè)備。該設(shè)備具有與該方法相似或相同的優(yōu)點,并且這些將不重復(fù)了。圖5公開了例證設(shè)備實施例的框圖。圖5中例證的設(shè)備500包括適合于接收和/或保存所識別的數(shù)碼照片組的數(shù)據(jù)庫510、511。該數(shù)據(jù)庫或者可以是設(shè)備500的一部分(如數(shù)據(jù)庫510所例證的),或者它可實現(xiàn)為外部數(shù)據(jù)庫511。設(shè)備500還包括適合于接收來自用戶的輸入的接收單元540,該輸入包括要從該數(shù)碼照片組中形成的聚類的數(shù)量和要用于將數(shù)碼照片群集到該數(shù)量個聚類中的簡檔信息。設(shè)備500還包括適合于根據(jù)該簡檔信息來群集該數(shù)碼照片組的群集單元530,并且它還包括適合于基于該簡檔信息來從群集的數(shù)碼照片中識別這些聚類的代表性數(shù)碼照片的識別單元520。接收單元540從設(shè)備500的用戶接收的簡檔信息包括屬性,所述屬性代表數(shù)碼照片的不同特性。該簡檔信息可存儲在該設(shè)備內(nèi),并且該用戶僅錄入對要使用的簡檔信息的參考。當設(shè)備500接收到該簡檔的參考時,它可檢索所存儲簡檔信息以便使用。備選地,該簡檔信息可由設(shè)備500的用戶人工錄入。該簡檔信息的屬性包括照片的元數(shù)據(jù)和/或從分析數(shù)碼照片中導(dǎo)出的特性。從分析數(shù)碼照片中導(dǎo)出的特性的一些示例是笑臉、人、風景、建筑物、山、海灘、動
物等等。在一個實施例中,由接收單元540接收的簡檔信息的一些或所有屬性與定義每個屬性重要性的權(quán)重相關(guān)聯(lián)。在一個示例中,由接收單元540從設(shè)備500的用戶接收的簡檔信息是定義對于特定用戶有效的屬性集合的用戶簡檔,這些屬性規(guī)定在所述群集該數(shù)碼照片組時要考慮的不同特性。在另一示例中,由接收單元540從設(shè)備500的用戶接收的簡檔信息是定義對于特定情形有效的屬性集合的情形簡檔,這些屬性規(guī)定在所述聚類該數(shù)碼照片組時要考慮的不同特性。在一個示例中,當接收單元540接收到在所述群集該數(shù)碼照片組時要考慮的特定屬性時,創(chuàng)建由接收單元540從設(shè)備500的用戶接收的簡檔。設(shè)備500然后適合于根據(jù)接收的屬性創(chuàng)建簡檔并存儲所創(chuàng)建的簡檔。在一個實施例中,設(shè)備500的群集單元530還適合于在群集單元530根據(jù)該簡檔來群集該數(shù)碼照片組之前,相對于不同數(shù)碼照片確定不同屬性的確定性,并濾出對于特定屬性具有不確定信息的照片。在一個示例中,當群集單元530根據(jù)簡檔信息來群集該數(shù)碼照片組時,按照一個或多個屬性來定義聚類,并且群集單元530根據(jù)這些聚類來群集該數(shù)碼照片組。換言之,群集單元530適合于當根據(jù)該簡檔信息群集該數(shù)碼照片組時,按照一個或多個屬性定義聚類,并根據(jù)這些聚類來群集該數(shù)碼照片組。在一個實施例中,設(shè)備500的群集單元530還適合于在基于該簡檔信息從群集的數(shù)碼照片中識別這些聚類的代表性數(shù)碼照片之后將濾出的具有不確定信息的數(shù)碼照片添加到適當聚類?!ぴ谝粋€實施例中,其中設(shè)備500的群集單元530相對于不同數(shù)碼照片來確定不同屬性的確定性,這包括確定這些屬性的熵,其中高熵對應(yīng)于不確定信息。識別單元520識別聚類的代表性數(shù)碼照片。該識別包括識別每個聚類中最佳地對應(yīng)于在該簡檔信息中所定義的那個聚類的屬性的照片。如果接收單元540接收到用戶簡檔(其隨后由群集單元530在根據(jù)該簡檔來群集該數(shù)碼照片組時使用),則接收單元540在一個實施例中還適合于接收來自用戶的、有關(guān)所識別的數(shù)碼照片的反饋,并且群集單元530還適合于根據(jù)接收的反饋來調(diào)整該用戶簡檔中每個屬性的權(quán)重。在一個實施例中,設(shè)備500的數(shù)據(jù)庫510、511還適合于保存已經(jīng)存在的群集數(shù)碼照片的組并接收至少一個數(shù)碼照片。群集單元530然后還可適合于將至少一個接收的數(shù)碼照片群集到所述已經(jīng)存在的群集數(shù)碼照片的組中的一個或多個適當聚類中。設(shè)備500可以是終端,諸如數(shù)字攝像機、移動電話或包括攝像機的任何其它終端。有利地,設(shè)備500可以是包括攝像機的任何終端。在這種情況下,將在該終端中實現(xiàn)如上所述的方法。包括攝像機的終端通常包括數(shù)據(jù)存儲裝置(諸如存儲器),以保存由其攝像機拍攝的數(shù)碼照片。該終端的用戶然后可在已經(jīng)拍了多個照片之后利用該過程,并根據(jù)特定簡檔或根據(jù)特定屬性在該終端內(nèi)組織這些照片。該用戶也可遞增地將新拍的數(shù)碼照片組織到適當?shù)囊呀?jīng)存在的聚類中。如果(諸如上面所描述的)終端的用戶希望將數(shù)碼照片上載到社交因特網(wǎng)站點,諸如例如Facebook,則他/她可容易地選擇上載整個聚類、部分聚類或那個聚類的代表性數(shù)碼照片。該設(shè)備也可在網(wǎng)絡(luò)中的節(jié)點中實現(xiàn)以向社交因特網(wǎng)站點的用戶提供對該方法的訪問或使用。用戶然后可將多個照片上載到社交因特網(wǎng)站點,并在該因特網(wǎng)站點中根據(jù)該方法組織這些照片。然后,可賦予該用戶選擇哪些照片發(fā)表并使其他人可看到的選項。還有,在此示例中,該因特網(wǎng)站點可能已經(jīng)保存了已經(jīng)群集的多個數(shù)碼照片,并且該用戶可將一個或多個數(shù)碼照片上載到該因特網(wǎng)站點,并將它或它們組織到已經(jīng)存在的聚類中。在另一個示例中,該設(shè)備可實現(xiàn)在個人計算機或膝上型計算機中。至于上面描述的其它示例,用戶可上載多個照片并在該膝上型計算機中組織它們。如在其它示例中那樣,該計算機或膝上型計算機可能已經(jīng)保存了已經(jīng)被群集的多個數(shù)碼照片,并且該用戶可將一個或多個數(shù)碼照片上載到該計算機或膝上型計算機,并將它或它們組織到已經(jīng)存在的聚類中。應(yīng)該注意,圖5僅在邏輯意義上例證了該設(shè)備中的各種功能單元。然而,本領(lǐng)域技術(shù)人員能夠在實踐中使用任何適當?shù)能浖陀布?gòu)件自由地實現(xiàn)這些功能。因而,本發(fā)明一般不限于該設(shè)備和這些功能單元的所示結(jié)構(gòu)。雖然已經(jīng)參考特定示范實施例描述了本發(fā)明,但說明書一般僅打算例證發(fā)明概 念,并不應(yīng)該被視為限制本發(fā)明的范圍。本發(fā)明由所附權(quán)利要求書定義。
權(quán)利要求
1.一種在圖像組織設(shè)備中用于組織多個數(shù)碼照片的方法,所述方法包括如下步驟 -接收和/或保存(100,200)所識別的數(shù)碼照片組, -接收(110,210)定義要從所述組中形成多少聚類的數(shù)量, -接收(120,230,240)要用于將所述數(shù)碼照片群集到所述數(shù)量的聚類中的簡檔信息, -根據(jù)所述簡檔信息來群集(130,260)所述數(shù)碼照片組,以及 -基于所述簡檔信息從群集的數(shù)碼照片中識別(140,270)所述聚類的代表性數(shù)碼照片。
2.如權(quán)利要求I所述的方法,其中所述簡檔包括屬性,所述屬性代表照片的不同特性。
3.如權(quán)利要求2所述的方法,其中所述屬性包括照片的元數(shù)據(jù)和/或有關(guān)所述照片的外觀的特性。
4.如權(quán)利要求1-3中任一項所述的方法,還包括將權(quán)重關(guān)聯(lián)到一些屬性或所有屬性,從而定義每個屬性的重要性。
5.如權(quán)利要求1-4中任一項所述的方法,其中所述簡檔信息包括定義對于特定用戶有效的屬性集合的用戶簡檔,所述屬性規(guī)定在所述群集所述數(shù)碼照片組時要考慮的不同特性。
6.如權(quán)利要求1-4中任一項所述的方法,其中所述簡檔信息包括定義對于特定情形有效的屬性集合的情形簡檔,所述屬性規(guī)定在所述群集所述數(shù)碼照片組時要考慮的不同特性。
7.如權(quán)利要求6所述的方法,其中在接收(120,230,340)要用于群集(130,260)所述數(shù)碼照片的簡檔信息的所述步驟中,通過錄入在所述群集(130,260)所述數(shù)碼照片組時要考慮的特定屬性,來創(chuàng)建所述情形簡檔。
8.如權(quán)利要求1-7中任一項所述的方法,還包括在根據(jù)所述簡檔信息群集所述數(shù)碼照片組的所述步驟(130,260)之前,相對于不同數(shù)碼照片確定不同屬性的確定性,并濾出(250)對于特定屬性具有不確定信息的數(shù)碼照片。
9.如權(quán)利要求1-8中任一項所述的方法,其中根據(jù)所述簡檔信息群集所述數(shù)碼照片組的所述步驟(130,260)包括按照一個或多個屬性定義聚類,并根據(jù)所述聚類來群集所述數(shù)碼照片組。
10.如權(quán)利要求8或9中任一項所述的方法,還包括在基于所述簡檔信息從群集的數(shù)碼照片中識別所述聚類的代表性數(shù)碼照片的所述步驟(270)之后將所述濾出的、具有不確定信息的數(shù)碼照片添加(280)到適當聚類。
11.如權(quán)利要求8-10中任一項所述的方法,其中相對于不同數(shù)碼照片確定不同屬性的確定性包括確定所述屬性的熵,其中高熵對應(yīng)于不確定信息。
12.如權(quán)利要求1-11中任一項所述的方法,其中識別代表性數(shù)碼照片的所述步驟(140,270)包括識別每個聚類中的照片,所述照片最佳地對應(yīng)于在所述簡檔信息中所定義的那個聚類的屬性。
13.如權(quán)利要求1-12中任一項所述的方法,如果錄入了用戶簡檔并且隨后將所述用戶簡檔用在根據(jù)所述簡檔來群集所述數(shù)碼照片組的所述步驟(130,260)中,則所述方法還包括接收來自用戶的、有關(guān)識別的代表性數(shù)碼照片的反饋(310)并根據(jù)所接收的反饋來調(diào)整所述用戶簡檔中每個屬性的權(quán)重(320)。
14.如權(quán)利要求I所述的方法,其中接收和/或保存所識別的數(shù)碼照片組的所述步驟(100, 200)包括將所述數(shù)碼照片組上載到數(shù)據(jù)存儲裝置。
15.如權(quán)利要求I所述的方法,其中接收和/或保存所識別的數(shù)碼照片組的所述步驟(100, 200)包括將至少一個數(shù)碼照片上載到包括已經(jīng)存在的數(shù)碼照片群集組的數(shù)據(jù)存儲裝置,并且其中所述根據(jù)所述簡檔群集(130,260)所述數(shù)碼照片組包括將所述至少一個上載的數(shù)碼照片群集(130,260)到所述已經(jīng)存在的數(shù)碼照片群集組中的聚類之一中。
16.一種圖像組織設(shè)備(500),適合于組織多個數(shù)碼照片,所述圖像組織設(shè)備(500)包括 -數(shù)據(jù)庫(510,511),適合于接收和/或保存所識別的數(shù)碼照片組, -接收單元(540),適合于接收來自用戶的輸入,所述輸入包括要從所述數(shù)碼照片組中形成的聚類數(shù)量以及要用于將所述數(shù)碼照片群集到所述數(shù)量的聚類中的簡檔信息, -群集單元(530),適合于根據(jù)所述簡檔信息來群集所述數(shù)碼照片組,以及 -識別單元(520),適合于基于所述簡檔信息從群集的數(shù)碼照片中識別所述聚類的代表性數(shù)碼照片。
17.如權(quán)利要求16所述的設(shè)備(500),其中所述簡檔信息包括屬性,所述屬性代表數(shù)碼照片的不同特性。
18.如權(quán)利要求17所述的設(shè)備(500),其中所述屬性包括照片的元數(shù)據(jù)和/或有關(guān)所述照片的外觀的特性。
19.如權(quán)利要求16-18中任一項所述的設(shè)備(500),其中將權(quán)重關(guān)聯(lián)到一些屬性或所有屬性,從而定義每個屬性的重要性。
20.如權(quán)利要求16-19中任一項所述的設(shè)備(500),其中所述接收的簡檔信息是定義對于特定用戶有效的屬性集合的用戶簡檔,所述屬性規(guī)定在所述群集所述數(shù)碼照片組時要考慮的不同特性。
21.如權(quán)利要求16-19中任一項所述的設(shè)備(500),其中所述接收的簡檔信息是定義對于特定情形有效的屬性集合的情形簡檔,所述屬性規(guī)定在所述群集所述數(shù)碼照片組時要考慮的不同特性。
22.如權(quán)利要求21所述的設(shè)備(500),其中所述接收單元(540)適合于當所述接收單元(540)接收到在所述群集所述數(shù)碼照片組時要考慮的特定屬性時,創(chuàng)建所述情形簡檔。
23.如權(quán)利要求16-22中任一項所述的設(shè)備(500),所述群集單元(530)還適合于在所述群集單元(530)根據(jù)所述簡檔信息來群集所述數(shù)碼照片組之前,相對于不同數(shù)碼照片確定不同屬性的確定性并濾出對于特定屬性具有不確定信息的照片。
24.如權(quán)利要求16-23中任一項所述的設(shè)備(500),其中所述群集單元(530)還適合于當根據(jù)所述簡檔信息來群集所述數(shù)碼照片組時,按照一個或多個屬性定義聚類,并且根據(jù)所述聚類來群集所述數(shù)碼照片組。
25.如權(quán)利要求23或24中任一項所述的設(shè)備(500),其中所述群集單元(530)還適合于在基于所述簡檔信息從群集的數(shù)碼照片中識別所述聚類的代表性數(shù)碼照片之后,將所述濾出的、具有不確定信息的數(shù)碼照片添加到適當聚類。
26.如權(quán)利要求23-25中任一項所述的設(shè)備(500),其中所述相對于不同數(shù)碼照片確定不同屬性的確定性包括確定所述屬性的熵,其中高熵對應(yīng)于不確定信息。
27.如權(quán)利要求26-25中任一項所述的設(shè)備(500),其中所述識別代表性數(shù)碼照片包括識別每個聚類中的照片,所述照片最佳地對應(yīng)于在所述簡檔信息中所定義的那個聚類的屬性。
28.如權(quán)利要求16-27中任一項所述的設(shè)備(500),其中如果所述接收單元(540)接收到隨后由所述群集單元(530)在根據(jù)所述簡檔來群集所述數(shù)碼照片組時使用的用戶簡檔,則所述接收單元(540)還適合于接收來自用戶的、有關(guān)所識別的代表性數(shù)碼照片的反饋,并且所述群集單元(530)還適合于根據(jù)接收的反饋來調(diào)整所述用戶簡檔中每個屬性的權(quán)重。
29.如權(quán)利要求16所述的設(shè)備(500),其中所述數(shù)據(jù)庫(510,511)適合于保存已經(jīng)群集的數(shù)碼照片的組并接收至少一個數(shù)碼照片,并且其中所述群集單元(530)還適合于將所述接收的至少一個數(shù)碼照片群集到已經(jīng)群集的數(shù)碼照片的所述組中的一個或多個聚類中。
30.如權(quán)利要求16-29中任一項所述的設(shè)備(500),其中所述設(shè)備是終端,諸如數(shù)字攝像機、移動電話或包括攝像機的任何其它終端。
全文摘要
定義了用于組織多個數(shù)碼照片的方法和設(shè)備。該方法包括如下步驟識別數(shù)碼照片組;接收定義要從該組中形成多少聚類的數(shù)量;接收要用于將數(shù)碼照片群集到該數(shù)量的聚類中的簡檔信息;根據(jù)該簡檔信息來群集該數(shù)碼照片組;以及基于該簡檔信息從群集的數(shù)碼照片中識別這些聚類的代表性數(shù)碼照片。
文檔編號G06F17/30GK102918526SQ201080067298
公開日2013年2月6日 申請日期2010年6月7日 優(yōu)先權(quán)日2010年6月7日
發(fā)明者S.莫里茨, J.比約克, M.利德斯特倫, J.索德伯格 申請人:瑞典愛立信有限公司