本申請涉及人工智能,尤其涉及一種基于中心相似性的圖像檢索方法、系統(tǒng)、設備及介質(zhì)。
背景技術:
1、近年來,隨著大數(shù)據(jù)和人工智能技術的快速發(fā)展,哈希學習成為了近似最近鄰搜索的主流研究方向,在國內(nèi)外均取得了顯著的進展。傳統(tǒng)的哈希學習方法依據(jù)是否需要使用數(shù)據(jù)進行預先訓練,可以被分為兩大類:數(shù)據(jù)獨立哈希和數(shù)據(jù)依賴哈希。數(shù)據(jù)獨立哈希是不依賴于訓練數(shù)據(jù)的哈希學習方法,這類方法通過隨機生成的投影矩陣對數(shù)據(jù)進行二值編碼。現(xiàn)有一種局部敏感哈希(locality-sensitive?hashing,lsh),其是一種具有代表性的數(shù)據(jù)獨立哈希算法,它使用隨機線性投影將附近的數(shù)據(jù)映射到相近的二值碼中。另一種核局部敏感哈希(kernelized?locality-sensitive?hashing,klsh)在lsh的基礎上加入了核函數(shù),能更好地學習非線性特征。但是,這類方法存在兩個問題,一是通常需要很長的哈希碼,過長的哈希碼會導致檢索效率低,并且大大增加了哈希碼的存儲成本;二是檢索精度不高。
2、由于深度神經(jīng)網(wǎng)絡在特征提取方面的強大能力,近期有很多工作嘗試將深度學習和哈希學習結合,利用神經(jīng)網(wǎng)絡學習哈希碼,取得了不錯的檢索效果。然而現(xiàn)有方法大多基于成對相似性和三元組相似性進行學習,基于成對相似性的哈希學習側重于學習數(shù)據(jù)兩兩之間的相似性關系,具有局部性,學習的哈希模型無法捕捉全局相似性信息。基于三元組相似性的哈希學習方法為了保證訓練數(shù)據(jù)具有豐富的相似性信息,需要從訓練集中采樣大量的三元組,會導致訓練時間大大增加,并且由于哈希中心不明確,導致哈希碼的類間判別性不足,導致圖像檢索準確性較低。
技術實現(xiàn)思路
1、本申請實施例的目的在于提出一種基于中心相似性的圖像檢索方法、系統(tǒng)、設備及介質(zhì),以減少模型訓練的難度和時間,避免哈希碼的類間判別性不足的問題,提高圖像檢索準確性。
2、為了解決上述技術問題,本申請實施例提供一種基于中心相似性的圖像檢索方法,包括:
3、獲取圖像數(shù)據(jù)集,并采用哈達瑪矩陣和伯努利分布生成所述圖像數(shù)據(jù)集中每一類別的哈希中心;
4、對所述哈希中心進行修正,得到目標哈希中心;
5、基于所述圖像數(shù)據(jù)集構建訓練數(shù)據(jù)集,通過深度哈希網(wǎng)絡提取并激活所述訓練數(shù)據(jù)集中每一輸入圖像的特征,得到低維實值特征;
6、通過所述低維實值特征與所述目標哈希中心計算中心相似性貝葉斯損失,并采用反向傳播的方式基于中心相似性貝葉斯損失訓練所述深度哈希網(wǎng)絡,得到目標檢索模型;
7、獲取待檢索圖像,基于所述目標檢索模型對所述待檢索圖像進行檢索,得到目標相似圖像。
8、為了解決上述技術問題,本申請實施例提供一種基于中心相似性的圖像檢索系統(tǒng),包括:
9、哈希中心生成單元,用于獲取圖像數(shù)據(jù)集,并采用哈達瑪矩陣和伯努利分布生成所述圖像數(shù)據(jù)集中每一類別的哈希中心;
10、哈希中心修正單元,用于對所述哈希中心進行修正,得到目標哈希中心;
11、特征提取單元,用于基于所述圖像數(shù)據(jù)集構建訓練數(shù)據(jù)集,通過深度哈希網(wǎng)絡提取并激活所述訓練數(shù)據(jù)集中每一輸入圖像的特征,得到低維實值特征;
12、模型訓練單元,用于通過所述低維實值特征與所述目標哈希中心計算中心相似性貝葉斯損失,并采用反向傳播的方式基于中心相似性貝葉斯損失訓練所述深度哈希網(wǎng)絡,得到目標檢索模型;
13、目標相似圖像檢索單元,用于獲取待檢索圖像,基于所述目標檢索模型對所述待檢索圖像進行檢索,得到目標相似圖像。
14、為解決上述技術問題,本發(fā)明采用的一個技術方案是:提供一種計算機設備,包括,一個或多個處理器;存儲器,用于存儲一個或多個程序,使得一個或多個處理器實現(xiàn)上述任意一項所述的基于中心相似性的圖像檢索方法。
15、為解決上述技術問題,本發(fā)明采用的一個技術方案是:一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述任意一項所述的基于中心相似性的圖像檢索方法。
16、本發(fā)明實施例提供了一種基于中心相似性的圖像檢索方法、系統(tǒng)、設備及介質(zhì)。其中,方法包括:獲取圖像數(shù)據(jù)集,并采用哈達瑪矩陣和伯努利分布生成所述圖像數(shù)據(jù)集中每一類別的哈希中心;對所述哈希中心進行修正,得到目標哈希中心;基于所述圖像數(shù)據(jù)集構建訓練數(shù)據(jù)集,通過深度哈希網(wǎng)絡提取并激活所述訓練數(shù)據(jù)集中每一輸入圖像的特征,得到低維實值特征;通過所述低維實值特征與所述目標哈希中心計算中心相似性貝葉斯損失,并采用反向傳播的方式基于中心相似性貝葉斯損失訓練所述深度哈希網(wǎng)絡,得到目標檢索模型;獲取待檢索圖像,基于所述目標檢索模型對所述待檢索圖像進行檢索,得到目標相似圖像。本發(fā)明實施例采用哈達瑪矩陣和伯努利分布生成圖像數(shù)據(jù)集中每一類別的哈希中心,并對哈希中心進行修正,確保哈希中心之間具有足夠間距,同時采用了中心相似性貝葉斯損失進行模型訓練,有利于減少模型訓練的難度和時間,提高圖像檢索準確性。
1.一種基于中心相似性的圖像檢索方法,其特征在于,包括:
2.根據(jù)權利要求1所述的基于中心相似性的圖像檢索方法,其特征在于,所述獲取圖像數(shù)據(jù)集,并采用哈達瑪矩陣和伯努利分布生成所述圖像數(shù)據(jù)集中每一類別的哈希中心,包括:
3.根據(jù)權利要求1所述的基于中心相似性的圖像檢索方法,其特征在于,所述對所述哈希中心進行修正,得到目標哈希中心,包括:
4.根據(jù)權利要求1所述的基于中心相似性的圖像檢索方法,其特征在于,所述基于所述圖像數(shù)據(jù)集構建訓練數(shù)據(jù)集,通過深度哈希網(wǎng)絡提取并激活所述訓練數(shù)據(jù)集中每一輸入圖像的特征,得到低維實值特征,包括:
5.根據(jù)權利要求1所述的基于中心相似性的圖像檢索方法,其特征在于,所述通過所述低維實值特征與所述目標哈希中心計算中心相似性貝葉斯損失,并采用反向傳播的方式基于中心相似性貝葉斯損失訓練所述深度哈希網(wǎng)絡,得到目標檢索模型,包括:
6.根據(jù)權利要求5所述的基于中心相似性的圖像檢索方法,其特征在于,所述預設公式為:
7.根據(jù)權利要求1至6任一項所述的基于中心相似性的圖像檢索方法,其特征在于,所述獲取待檢索圖像,基于所述目標檢索模型對所述待檢索圖像進行檢索,得到目標相似圖像,包括:
8.一種基于中心相似性的圖像檢索系統(tǒng),其特征在于,包括:
9.一種計算機設備,其特征在于,包括存儲器和處理器,所述存儲器中存儲有計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如權利要求1至7中任一項所述的基于中心相似性的圖像檢索方法。
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權利要求1至7中任一項所述的基于中心相似性的圖像檢索方法。