本發(fā)明屬于量子計算和量子信息處理,具體為一種基于支持向量機的量子分類器。
背景技術:
1、隨著計算機科學的不斷發(fā)展,大數(shù)據(jù)時代已經(jīng)到來,而量子計算作為一種新型的計算方式,能夠與大數(shù)據(jù)機器學習相互結(jié)合,構(gòu)建機器學習算法與量子計算機的一體化平臺,實現(xiàn)高速穩(wěn)定發(fā)展。支持向量機(svm)是機器學習中一種能夠?qū)崿F(xiàn)分類任務的典型模型,有大量的應用場景,比如文本分類、圖像識別、基因表達分析、醫(yī)療診斷等。傳統(tǒng)的機器學習模型雖然具有很強的數(shù)據(jù)學習能力,但在處理維數(shù)高、數(shù)據(jù)復雜的對象時,仍然存在計算速度慢,準確率不穩(wěn)定的問題,而量子計算對于這些傳統(tǒng)算法難以解決的問題有很強的針對性,提供全新的改善思路,并讓使用機器學習算法處理高維量子數(shù)據(jù)有新的可能性。
2、支持向量機(support?vector?machine,簡稱svm)是一種二分類模型,它的基本模型定義為特征空間上的間隔最大的線性分類器,間隔最大使它有別于感知機;svm還包括核技巧,這使它成為實質(zhì)上的非線性分類器。在數(shù)據(jù)集中,超平面是一個能夠?qū)?shù)據(jù)分為兩類的決策邊界。在分類問題中,位于分類邊界上的數(shù)據(jù)點被稱為支持向量。這些點對于定義最優(yōu)超平面至關重要。間隔是指分類邊界到最近的支持向量的距離。svm的學習策略就是間隔最大化,可形式化為一個求解凸二次規(guī)劃問題的過程。
3、svm的工作流程,主要包括:
4、(1)數(shù)據(jù)預處理:將數(shù)據(jù)標準化,使其具有零均值和單位方差。
5、(2)選擇核函數(shù):
6、線性核:適用于數(shù)據(jù)線性可分的情況。
7、多項式核:通過多項式映射將數(shù)據(jù)映射到高維空間。
8、徑向基函數(shù)核:適用于非線性問題,可以映射到無限維空間。
9、sigmoid核:模仿神經(jīng)元的激活函數(shù)。
10、(3)優(yōu)化問題:svm通過解決以下優(yōu)化問題來找到最佳超平面:
11、;
12、且滿足,其中,是法向量,決定了超平面的方向,是位移項,決定了超平面與原點之間的距離;是類別標簽;是特征向量。
13、(4)求解支持向量:通過求解上述優(yōu)化問題,可以找到一組支持向量,它們是唯一影響最優(yōu)超平面的訓練樣本。
14、(5)決策函數(shù):在訓練完后,svm的決策函數(shù)為:
15、。
16、得益于svm的優(yōu)點,比如效果好,泛化能力強;適用于中小型數(shù)據(jù)集;可以解決高維問題;可以選擇不同的核函數(shù)適應數(shù)據(jù),svm在許多領域都有應用,包括文本分類、圖像識別、生物信息學等。隨著機器學習的發(fā)展,雖然深度學習在很多任務中已經(jīng)超越了傳統(tǒng)的機器學習方法,但svm由于其獨特的理論優(yōu)勢,在某些問題上仍然是一個有效的選擇。
17、但是目前的方案還存在許多不足,包括:在應用于高維度待處理數(shù)據(jù)時,對量子設備的要求會提高,計算時間也會隨著維度的增長延長,量子支持向量機對于高階核函數(shù)的方案表述會導致量子電路規(guī)模增加,需要搭建復雜的量子門幫助實現(xiàn),對計算設備要求很高,不利于方案實現(xiàn)。機器學習本身的一些弊端無法避免,由于其缺乏合理的數(shù)學理論支持,在參數(shù)優(yōu)化部分無法掌握準確的數(shù)值調(diào)整方向,調(diào)參工作量大,且對于不同數(shù)據(jù)集最優(yōu)參數(shù)往往是不固定的,導致機器的靈活性差,仍然需要人為干預來保持高準確度。
技術實現(xiàn)思路
1、發(fā)明目的:為解決傳統(tǒng)機器學習算法高效處理高維度數(shù)據(jù)是比較困難的,對于量子系統(tǒng),量子態(tài)會根據(jù)維度上升呈現(xiàn)指數(shù)級增長,現(xiàn)有方案無法對這種大規(guī)模的計算資源進行有效分析的問題,本發(fā)明提出了一種基于支持向量機的量子分類器、基于量子分類器的文本分類方法及基于量子分類器的圖像識別方法,涉及用量子電路對經(jīng)典和量子數(shù)據(jù)分類,可用于解決機器學習中的高維數(shù)據(jù)分析處理問題,通過將傳統(tǒng)方案與量子算法相結(jié)合,發(fā)揮量子計算的優(yōu)勢,提高支持向量機在處理復雜問題的訓練速度并保證計算準確性,從而突破傳統(tǒng)方案的瓶頸問題。
2、技術方案:一種基于支持向量機的量子分類器,包括:
3、按照下式得到量子態(tài):
4、;
5、其中,量子態(tài)由量子矩陣求逆算法對svm的優(yōu)化問題進行求解制備得到,量子態(tài)由利用量子特征映射,將待分類數(shù)據(jù)存儲到量子態(tài)中制備得到;
6、采用hadamard門對得到的量子態(tài)進行測量,根據(jù)測量結(jié)果實現(xiàn)數(shù)據(jù)分類:
7、所述的量子矩陣求逆算法對svm的優(yōu)化問題進行求解,包括以下步驟:
8、將svm的優(yōu)化問題轉(zhuǎn)化為等價的線性代數(shù)問題,得到svm的最小二乘近似,表示為矩陣;
9、選擇核函數(shù);
10、將矩陣擴充到維,表示為矩陣;定義酉矩陣,酉矩陣中的一個酉算子存儲矩陣信息;
11、準備兩個量子寄存器系統(tǒng),分別記為和,并初始化為量子態(tài)、;
12、增加一個輔助比特,并處于態(tài);在輔助比特上作用一系列單比特旋轉(zhuǎn)門;
13、在兩個量子寄存器系統(tǒng)和一個輔助比特上交替作用受控的和,表示酉矩陣的逆算子,制備得到量子態(tài)。
14、進一步的,所述的將svm的優(yōu)化問題轉(zhuǎn)化為等價的線性代數(shù)問題,得到svm的最小二乘近似,表示為矩陣,具體操作包括:
15、svm的優(yōu)化問題表示為:
16、;
17、且滿足不等式約束:,其中,是法向量,決定了超平面的方向,是位移項,決定了超平面與原點之間的距離;是類別標簽;是特征向量;
18、通過整合松弛變量并利用的性質(zhì)將不等式約束轉(zhuǎn)換為等價的等式形式,將修正為等式約束;
19、根據(jù)修正后的等式約束,在svm的優(yōu)化問題對應的拉格朗日函數(shù)中增加一個懲罰項,其中,表示用于調(diào)節(jié)訓練誤差與svm的優(yōu)化問題之間平衡的標量;
20、通過計算增加有懲罰項的拉格朗日函數(shù)的偏導數(shù),消去和,得到svm的最小二乘近似:
21、;
22、其中,,,為核矩陣,矩陣的維數(shù)為;表示數(shù)據(jù)點的數(shù)量,表示數(shù)據(jù)點對應的標簽,表示svm參數(shù);
23、svm參數(shù)通過矩陣方程推導出。
24、進一步的,所述矩陣表示為:
25、。
26、進一步的,所述酉矩陣表示為:
27、。
28、進一步的,所述一系列單比特旋轉(zhuǎn)門包括:和,表示為:
29、;
30、;
31、式中,、表示中間變量,表示復函數(shù)。
32、本發(fā)明還公開了一種文本分類方法,包括以下步驟:
33、采用量子分類器對待分類文本進行分類,得到文本分類結(jié)果;
34、所述量子分類器為上述公開的一種基于支持向量機的量子分類器。
35、本發(fā)明還公開了一種圖像識別方法,包括以下步驟:
36、采用量子分類器對待識別圖像進行分類,得到圖像分類結(jié)果;
37、所述量子分類器為上述公開的一種基于支持向量機的量子分類器。
38、有益效果:與現(xiàn)有技術相比,本發(fā)明提出了具有實用價值的支持向量機的量子分類器實現(xiàn)方案,可以用于大部分分類任務,通過將量子特征映射與量子機器學習算法相融合,使其具有可數(shù)學證明的有效性,同時具有豐富的應用場景,總的來說,本發(fā)明具有以下優(yōu)點:
39、(1)高效性:可以低消耗地構(gòu)造量子電路,兩支持向量機的分類效率相比于傳統(tǒng)分類向量機訓練速度顯著提高;
40、(2)穩(wěn)定性:量子支持向量機在輸入數(shù)據(jù)復雜度增長的情況下仍能夠保持較高的分類準確率;
41、(3)創(chuàng)新性:本發(fā)明提供了新穎且高效的量子電路實現(xiàn)與機器學習相融合,拓寬量子計算在數(shù)據(jù)分類領域的應用范圍;
42、(4)實用性:本發(fā)明所應用的量子電路可以在量子計算機上實現(xiàn),且簡單有效易于操作,有豐富的落地場景。