本發(fā)明涉及光譜分析和機器學習,尤其涉及一種基于transformer和支持向量數據描述(support?vector?data?description,svdd)的led光譜指紋開集識別方法及相關設備。
背景技術:
1、隨著無線通信技術的快速發(fā)展,傳統(tǒng)射頻(rf)通信面臨頻譜擁堵和安全性問題??梢姽馔ㄐ?vlc)作為一種新興技術,利用發(fā)光二極管(led)進行數據傳輸,提供了高帶寬、低成本的解決方案,并增強了通信系統(tǒng)的安全性。然而,隨著vlc系統(tǒng)的廣泛應用,其安全性挑戰(zhàn)逐漸顯現,尤其是在識別未認證或不信任設備方面的問題。因此,確保vlc系統(tǒng)的安全運行并有效識別潛在威脅設備成為當前研究的重要方向。
2、在射頻系統(tǒng)的啟發(fā)下,設備指紋技術被應用于光通信領域,以防止欺騙或模擬攻擊。通過分析發(fā)光二極管(led)發(fā)出的光來提取與led硬件相關的細微特征,并為每個設備生成特定簽名以識別單個設備。
3、(1)傳統(tǒng)識別方法的局限性
4、目前,大多數led光源識別和檢測方法主要依賴光譜分析和簡單的統(tǒng)計方法。這些方法通常通過測量led光源的光譜特征,然后利用統(tǒng)計分析手段進行分類和識別。雖然這些方法在某些情況下能夠提供有效的解決方案,但在處理復雜多樣的光譜數據時,往往存在識別精度低、抗干擾能力差等問題。例如,當led光源的光譜特征相似或受到環(huán)境噪聲干擾時,這些方法的識別效果顯著下降,難以滿足實際應用需求。
5、(2)機器學習方法的應用局限性
6、盡管一些先進的機器學習方法(如神經網絡、支持向量機等)已經應用于光譜識別領域,但這些方法通常需要大量標注數據進行訓練,且在處理高維光譜數據時計算復雜度較高。機器學習方法在處理復雜和高維數據方面具有顯著優(yōu)勢,但在開集識別任務中仍然存在局限性。具體而言,這些方法通常假設訓練和測試數據分布相同,當遇到新的或未知類別數據時,模型的表現可能會顯著下降。此外,機器學習方法的訓練過程需要大量標注數據,數據獲取和標注成本較高,進一步限制了這些方法的廣泛應用。
技術實現思路
1、針對現有的機器學習方法在遇到新的或未知類別光譜數據時,識別準確率較低的問題,本發(fā)明提供一種基于transformer和支持向量數據描述的led光譜指紋開集識別方法及相關設備。
2、第一方面,本發(fā)明提供一種基于transformer和支持向量數據描述的led光譜指紋開集識別方法,包括:
3、步驟1:采集至少一個led設備發(fā)射的光信號并將所述光信號轉換為光譜數據,將所述光譜數據分為訓練集和測試集;
4、步驟2:將訓練集輸入至預設的特征提取網絡進行網絡訓練以學習得到光譜特征向量;其中,所述特征提取網絡包括transformer分支、cnn分支和特征交互模塊;transformer分支提取光譜數據的全局特征,cnn分支提取光譜數據的局部征,所述全局特征和所述局部特征經所述特征交互模塊進行融合得到所述光譜特征向量;
5、步驟3:基于訓練集的所述光譜特征向量,利用svdd算法構建超球體模型,并對超球體模型的參數進行優(yōu)化得到最優(yōu)超球體模型;
6、步驟4:將測試集中測試樣本輸入至訓練好的特征提取網絡得到對應的光譜特征向量,將測試樣本的光譜特征向量輸入至所述最優(yōu)超球體模型進行分類,若測試樣本的光譜特征向量落在所述最優(yōu)超球體模型內部,在判定測試樣本的光譜類別為已知類別,反之,則為未知類別。
7、進一步地,所述transformer分支采用transformer編碼器,所述cnn分支包括兩個第一卷積層,所述特征交互模塊包括兩個第二卷積層、下采樣層和上采樣層;
8、對應地,transformer分支提取光譜數據的全局特征,cnn分支提取光譜數據的局部征,所述全局特征和所述局部特征經所述特征交互模塊進行融合得到所述光譜特征向量,具體包括:
9、利用其中一個第一卷積層將輸入的光譜數據分為若干段,對于每段光譜數據,將不同通道的信息進行拼接以得到對應的第一局部特征,從而得到若干個第一局部特征;
10、若干個所述第一局部特征依次經過一個第二卷積層和下采樣層,得到第一中間特征;
11、將輸入的光譜數據轉換為一個序列,將所述序列與所述第一中間特征融合后輸入至transformer編碼器提取得到全局特征;
12、所述全局特征依次經過另一個第二卷積層和上采樣層,得到第二中間特征;
13、所述第二中間特征與若干個所述第一局部特征融合后輸入至另一個第一卷積層得到第二局部特征;
14、將所述第二局部特征和所述全局特征進行求和,得到所述光譜特征向量。
15、進一步地,步驟2中,所述網絡訓練的過程中,采用由中心損失和交叉熵損失構成的組合損失函數。
16、進一步地,步驟3中,采用粒子群優(yōu)化算法對超球體模型的參數進行優(yōu)化得到最優(yōu)超球體模型;其中,一個粒子代表超球體模型的一組參數,采用超球體模型在所述參數下的分類準確率作為粒子的適應度。
17、進一步地,步驟1中,在采集其中一個led設備發(fā)射的光信號時,存在至少一個其他led設備同時也在發(fā)光。
18、進一步地,針對當前采集的led設備,在不同距離和不同角度下采集所述led設備發(fā)射的光信號。
19、進一步地,步驟2或步驟4中,在將光譜數據輸入至特征提取網絡之前,還包括:對所述光譜數據進行預處理;所述預處理包括:去噪和/或歸一化。
20、第二方面,本發(fā)明提供一種基于transformer和支持向量數據描述的led光譜指紋開集識別系統(tǒng),包括:
21、光譜采集模塊,用于采集至少一個led設備發(fā)射的光信號并將所述光信號轉換為光譜數據,將所述光譜數據分為訓練集和測試集;
22、特征提取模塊,用于將訓練集輸入至預設的特征提取網絡進行網絡訓練以學習得到光譜特征向量;以及將測試集中測試樣本輸入至訓練好的特征提取網絡得到對應的光譜特征向量;其中,所述特征提取網絡包括transformer分支、cnn分支和特征交互模塊;transformer分支提取光譜數據的全局特征,cnn分支提取光譜數據的局部征,所述全局特征和所述局部特征經所述特征交互模塊進行融合得到所述光譜特征向量;
23、分類識別模塊,用于基于訓練集的所述光譜特征向量,利用svdd算法構建超球體模型,并對超球體模型的參數進行優(yōu)化得到最優(yōu)超球體模型;以及將測試樣本的光譜特征向量輸入至所述最優(yōu)超球體模型進行分類,若測試樣本的光譜特征向量若在所述最優(yōu)超球體模型內部,在判定測試樣本的光譜類別為已知類別,反之,則為未知類別。
24、第三方面,本發(fā)明提供一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現如第一方面所述的方法。
25、第四方面,本發(fā)明提供一種非暫態(tài)計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現如第一方面所述的方法。
26、本發(fā)明的有益效果:
27、(1)高識別精度。本發(fā)明結合transformer的深度學習能力,能夠從高維光譜數據中提取豐富的特征信息;svdd算法的應用進一步提高了異常檢測和識別的準確性。在多燈實驗環(huán)境中,本發(fā)明的識別準確率均達到或超過90%。
28、(2)具有開集識別能力。本發(fā)明通過svdd算法,具備開集識別能力,能夠有效識別和分類未知類別的led光源。這顯著增強了系統(tǒng)在動態(tài)、多變環(huán)境中的實用性和靈活性,確保在面對新設備或潛在威脅時能夠及時響應。
29、(3)數據需求量小和計算復雜度低。本發(fā)明結合transformer模型和svdd算法,雖然依然需要一定量的訓練數據,但由于transformer模型的自注意力機制,能夠更高效地利用數據,并在特征提取過程中實現維度的有效降維,因此降低了數據需求量和計算復雜度。