本發(fā)明涉及圖像處理,具體涉及一種證件識別方法及系統(tǒng)、計算機設備。
背景技術:
1、在網(wǎng)約車行業(yè)中,各種資格證件的審核是非常重要的一環(huán),這些證件主要可以分為與人相關的證件(人證)和與車相關的證件(車證)。當前,行業(yè)內(nèi)處理證件識別的方法大致分為兩類:
2、第一類是傳統(tǒng)的圖像識別方法,該類方法通過邊緣檢測算法來檢測證件圖像中的邊緣特征,如canny、sobel等算法。然后使用預先定義的模板與圖像進行匹配,以檢測證件的位置和內(nèi)容。最后進行光學字符識別技術(ocr:optical?character?recognition),用于從圖像中提取文本信息,如tesseract。這類傳統(tǒng)方法的缺點是魯棒性差,對光照、旋轉、尺度變化和復雜背景等情況的適應性差。在進行圖片的特征提取上也很局限,無法有效處理復雜的證件圖像,尤其是在證件損壞或有噪聲的情況下。
3、第二類是基于深度學習的方法,如基于卷積神經(jīng)網(wǎng)絡(cnn)的resnet、inception網(wǎng)絡結構,用于檢測證件中的關鍵信息區(qū)域(如照片、文字區(qū)域)的yolo、faster?r-cnn、ssd網(wǎng)絡以及用于處理和識別序列化的文本信息的lstm和transformer架構等。這類基于神經(jīng)網(wǎng)絡的方法能夠處理相對復雜的證件圖像,精度高,對光照、旋轉和尺度變化有較好的魯棒性,特征提取上也能夠自動從數(shù)據(jù)中學習有效特征,無需過多手動設計特征提取器。但是,訓練和推理過程需要較高的計算資源,尤其是深層網(wǎng)絡。此外,需要大量標注數(shù)據(jù)進行訓練,且數(shù)據(jù)質(zhì)量對模型性能有重要影響,模型的內(nèi)部工作機制難以解釋,調(diào)試和優(yōu)化具有挑戰(zhàn)性。
技術實現(xiàn)思路
1、為此,本發(fā)明提供一種證件識別方法及系統(tǒng)、計算機設備,旨在解決現(xiàn)有技術中針對證件識別存在的識別精度低或資源耗費量大的技術問題。
2、為實現(xiàn)以上目的,本發(fā)明采用如下技術方案:
3、依據(jù)本發(fā)明第一方面,本發(fā)明提供一種證件識別方法,所述方法包括:
4、收集多個原始圖片,為各所述原始圖片添加標簽類型,得到樣本圖片集;所述標簽類型包括人證類型、車證類型和/或無關類型;
5、將所述樣本圖片集處理為多組三元組數(shù)據(jù);所述三元組數(shù)據(jù)包括錨點數(shù)據(jù)、正樣本數(shù)據(jù)以及負樣本數(shù)據(jù);
6、計算所述三元組數(shù)據(jù)中正負樣本之間的最大距離,作為第一損失函數(shù);以及,利用基于殘差神經(jīng)網(wǎng)絡結構的圖片分類模型對所述三元組數(shù)據(jù)進行分類,計算對應的第二損失函數(shù);
7、基于所述第一損失函數(shù)和所述第二損失函數(shù)計算所述三元組數(shù)據(jù)的總損失函數(shù);
8、利用所述總損失函數(shù)對所述圖片分類模型迭代更新,得到權重參數(shù)穩(wěn)定的目標圖片分類模型,利用所述目標圖片分類模型識別證件類型。
9、可選地,所述將所述樣本圖片集處理為多組三元組數(shù)據(jù)之前,所述方法還包括:
10、對所述樣本圖片集中的圖片進行數(shù)據(jù)增強,得到多樣化的樣本圖片集;
11、其中,所述數(shù)據(jù)增強包括三維旋轉、左右翻轉、亮度調(diào)整以及對比度調(diào)整中至少之一。
12、可選地,將所述樣本圖片集處理為多組三元組數(shù)據(jù),包括:
13、在所述樣本圖片集中隨機選取一張圖片作為參考圖像;
14、篩選與所述參考圖像的標簽類型相同的第一目標圖片集,在所述第一目標圖片集中隨機選取一張圖片作為正樣本圖像;
15、篩選與所述參考圖像的標簽類型不同的第二目標圖片集,在所述第二目標圖片集中隨機選取一張圖片作為負樣本圖像;
16、利用所述參考圖像、所述正樣本圖像與所述負樣本圖像構成三元組圖像。
17、可選地,所述方法還包括:
18、對所述三元組圖像進行特征編碼,得到所述參考圖像對應的錨點數(shù)據(jù)、所述正樣本圖像對應的正樣本數(shù)據(jù)以及所述負樣本圖像對應的負樣本數(shù)據(jù)。
19、可選地,所述計算所述三元組數(shù)據(jù)中正負樣本之間的最大距離,作為第一損失函數(shù),包括:
20、分別計算所述錨點數(shù)據(jù)與所述正樣本數(shù)據(jù)之間的第一距離和所述錨點數(shù)據(jù)與所述負樣本數(shù)據(jù)之間的第二距離;所述距離為歐式距離或余弦距離;
21、利用所述第一距離和所述第二距離計算正負樣本之間的最大距離,公式表示如下:
22、loss1=l(a,p,n)=max(0,d(a,p)-d(a,n)+b)
23、其中,loss1為第一損失函數(shù);a代表錨點數(shù)據(jù);p代表正樣本數(shù)據(jù);n代表負樣本數(shù)據(jù);d(a,p)為第一距離;d(a,n)為第二距離;b為邊界超參數(shù),用于控制正負樣本之間的距離最小差值。
24、可選地,所述利用基于殘差神經(jīng)網(wǎng)絡結構的圖片分類模型對所述三元組數(shù)據(jù)進行分類,計算對應的第二損失函數(shù),包括:
25、將所述三元組數(shù)據(jù)輸入所述圖片分類模型中進行訓練,得到所述圖片分類模型輸出的分類結果;
26、利用所述分類結果和所述三元組數(shù)據(jù)對應的標簽類型確定分類誤差,基于分類誤差計算所述圖片分類模型的交叉熵損失,公式表示如下:
27、
28、其中,loss2為第二損失函數(shù);c為類別數(shù);yi為標簽類型;為所述圖片分類模型預測為第i類的概率。
29、可選地,所述基于所述第一損失函數(shù)和所述第二損失函數(shù)計算所述三元組數(shù)據(jù)的總損失函數(shù),包括:
30、所述三元組數(shù)據(jù)的總損失函數(shù)為所述第一損失函數(shù)和所述第二損失函數(shù)之和,公式表示如下:
31、loss=loss1+loss2
32、其中,loss為總損失函數(shù);loss1為第一損失函數(shù);loss2為第二損失函數(shù)。
33、可選地,所述利用所述總損失函數(shù)對所述圖片分類模型迭代更新,得到權重參數(shù)穩(wěn)定的目標圖片分類模型,包括:
34、利用梯度下降方法優(yōu)化所述圖片分類模型的權重參數(shù),使所述總損失函數(shù)達到預設閾值;
35、獲取測試數(shù)據(jù)集,對總損失函數(shù)達到預設閾值的圖片分類模型進行測試和驗證,得到滿足準確度要求的圖片分類模型,作為目標圖片分類模型。
36、依據(jù)本發(fā)明第二方面,本發(fā)明提供一種證件識別系統(tǒng),所述系統(tǒng)包括:
37、數(shù)據(jù)獲取模塊,用于收集多個原始圖片,為各所述原始圖片添加標簽類型,得到樣本圖片集;所述標簽類型包括人證類型、車證類型和/或無關類型;
38、數(shù)據(jù)處理模塊,用于將所述樣本圖片集處理為多組三元組數(shù)據(jù);所述三元組數(shù)據(jù)包括錨點數(shù)據(jù)、正樣本數(shù)據(jù)以及負樣本數(shù)據(jù);
39、函數(shù)計算模塊,用于計算所述三元組數(shù)據(jù)中正負樣本之間的最大距離,作為第一損失函數(shù);以及,利用圖片分類模型對所述三元組數(shù)據(jù)進行殘差網(wǎng)絡分類,計算對應的第二損失函數(shù);基于所述第一損失函數(shù)和所述第二損失函數(shù)計算所述三元組數(shù)據(jù)的總損失函數(shù);
40、模型預測模塊,用于利用所述總損失函數(shù)對所述圖片分類模型迭代更新,得到權重參數(shù)穩(wěn)定的目標圖片分類模型,利用所述目標圖片分類模型識別證件類型。
41、依據(jù)本發(fā)明第三方面,本發(fā)明提供一種計算機設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如本發(fā)明第一方面中任一項所述的證件識別方法。
42、本發(fā)明采用以上技術方案,至少具備以下有益效果:
43、通過本發(fā)明方案,收集多個原始圖片,為各所述原始圖片添加標簽類型,得到樣本圖片集;將所述樣本圖片集處理為多組三元組數(shù)據(jù);計算所述三元組數(shù)據(jù)中正負樣本之間的最大距離,作為第一損失函數(shù);以及,利用基于殘差神經(jīng)網(wǎng)絡結構的圖片分類模型對所述三元組數(shù)據(jù)進行分類,計算對應的第二損失函數(shù);基于所述第一損失函數(shù)和所述第二損失函數(shù)計算所述三元組數(shù)據(jù)的總損失函數(shù);利用所述總損失函數(shù)對所述圖片分類模型迭代更新,得到權重參數(shù)穩(wěn)定的目標圖片分類模型,利用所述目標圖片分類模型識別證件類型。由此,結合傳統(tǒng)方法和深度學習方法的優(yōu)點,提高了圖片分類模型的魯棒性和精度,使得網(wǎng)約車行業(yè)司機的個人證件以及車輛的證件的審核業(yè)務滿足線上部署的要求,提升了大大提升了證件識別分類的效率。
44、應當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本發(fā)明。