專利名稱:基于半監(jiān)督局部線性回歸的自適應參數(shù)軟測量方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種軟測量儀表技術(shù)領(lǐng)域的方法,具體是一種基于半監(jiān)督局部線性回歸的自適應參數(shù)軟測量方法。
背景技術(shù):
軟測量儀表指的是一種利用計算機建模技術(shù)進行工業(yè)過程控制變量測量的方法,該方法與傳統(tǒng)的傳感器在線測量和人工離線測量的方法不同,具有投入成本低、維護簡單、可靠性高的優(yōu)點。目前存在的軟測量方法一般都是基于監(jiān)督學習方法建立的,監(jiān)督學習方法僅僅使用標記樣本進行模型的訓練,因此大大浪費了那些在實際中能夠大量輕易獲得的,實際反映工業(yè)過程運行情況的未標記樣本的價值。如果能夠在軟測量模型的建模中使 用這些未標記樣本,是應該可以提高軟測量方法的測量精度的。半監(jiān)督學習是目前存在的一種較好地利用了標記樣本和未標記樣本的學習方法,它以標記樣本作為基礎(chǔ),并在學習過程中輔以未標記樣本,從而達到減少標記樣本需求量,利用未標記樣本改進學習效果的目的。隨著數(shù)據(jù)采集和存儲技術(shù)的飛速發(fā)展,在實際工業(yè)過程中,收集大量未標記樣本已相當容易,而獲取大量有標記的樣本則相對較為困難,這是因為獲得這些標記可能需要消耗大量的人力物力,所以在一般的以監(jiān)督學習為基礎(chǔ)的軟測量建模中只能利用數(shù)量非常有限的標記樣本,這有可能使模型出現(xiàn)不夠準確的問題。因此,如果在軟測量方法中弓I入半監(jiān)督學習方法是應該可以有效提高測量精度和結(jié)果可靠度的。軟測量領(lǐng)域中的半監(jiān)督學習問題是一類回歸問題,所以在軟測量方法中應當使用基于半監(jiān)督回歸的學習方法對模型進行訓練,而如果要將軟測量方法運用到實際生產(chǎn)中,就必須考慮軟測量模型的更新問題,使得模型能夠更好地匹配模型輸入數(shù)據(jù)的變化,避免模型的過學習問題出現(xiàn)。
發(fā)明內(nèi)容
本發(fā)明針對傳統(tǒng)軟測量方法中存在的未利用未標記樣本和模型不能有效更新的問題,提供一種基于半監(jiān)督局部線性回歸算法的在線軟測量方法,該方法以局部線性回歸散點平滑方法為理論基礎(chǔ),通過將未標記樣本引入其流形正則化函數(shù),將其改變?yōu)橐环N半監(jiān)督回歸方法,利用該回歸方法對標記樣本和未標記樣本進行軟測量建模,進行控制變量的預測或測量。本發(fā)明是通過以下技術(shù)方案實現(xiàn)的,本發(fā)明首先以局部線性回歸散點平滑方法為理論基礎(chǔ),局部線性回歸散點平滑方法是一種監(jiān)督回歸方法,它只能利用標記樣本進行變量的預測,所以如果將未標記樣本引入其流形正則化函數(shù)進行模型求解的話,就會使其變?yōu)橐环N能夠同時利用標記樣本和未標記樣本的回歸學習方法,稱為半監(jiān)督局部線性回歸學習方法;此外,本發(fā)明還在其基礎(chǔ)上提供了一種適用于半監(jiān)督局部線性回歸的自適應參數(shù)選擇方法,使得模型能夠更加有效地過濾掉標記樣本中測量誤差帶來的影響;最后將自適應參數(shù)的半監(jiān)督局部線性回歸方法使用基于滾動時間窗的方式,實現(xiàn)軟測量模型的在線更新。半監(jiān)督局部線性回歸本質(zhì)上是為了求得某數(shù)據(jù)點上的局部線性系數(shù)向量,該局部線性系數(shù)構(gòu)成的線性方程可以滿足該數(shù)據(jù)點附近的臨近數(shù)據(jù)點,所以通過該局部線性系數(shù)可以預測該數(shù)據(jù)點附近的變量值。所述的半監(jiān)督局部線性回歸學習方法是指假設(shè) 為輸入數(shù)據(jù)集X中的數(shù)據(jù)點,Pi e B,i = 1,2,···,!!分別為各數(shù)據(jù)點上的局部線性系數(shù)向量,其中η為總數(shù)據(jù)個數(shù),B為所有局部線性系數(shù)向量組成的系數(shù)矩陣,則通過求解下式可以得到某輸入數(shù)據(jù)點Xi的局部線性系數(shù)向量
權(quán)利要求
1.一種基于半監(jiān)督局部線性回歸的自適應參數(shù)軟測量方法,其特征在于,首先將未標記樣本引入局部線性回歸的流形正則化函數(shù)進行模型求解,得到半監(jiān)督局部線性回歸的學習方法;接著采用適用于半監(jiān)督局部線性回歸的自適應參數(shù)選擇方法,使得模型能夠過濾掉標記樣本中測量誤差帶來的影響;最后將自適應參數(shù)的半監(jiān)督局部線性回歸方法基于滾動時間窗的方式,實現(xiàn)軟測量模型的在線更新。
2.根據(jù)權(quán)利要求I所述的基于半監(jiān)督局部線性回歸的自適應參數(shù)軟測量方法,其特征在于,所述的半監(jiān)督局部線性回歸學習方法是指假設(shè)Xi e X,i = 1,2,…,η為輸入數(shù)據(jù)集X中的數(shù)據(jù)點,Pi e B,i = 1,2,···,!!分別為各數(shù)據(jù)點上的局部線性系數(shù)向量,其中η為總數(shù)據(jù)個數(shù),B為所有局部線性系數(shù)向量組成的系數(shù)矩陣,則通過求解下式可以得到某輸入數(shù)據(jù)點Xi的局部線性系數(shù)向量
3.根據(jù)權(quán)利要求I或2所述的基于半監(jiān)督局部線性回歸的自適應參數(shù)軟測量方法,其特征在于,所述的適應于半監(jiān)督局部線性回歸的自適應參數(shù)選擇方法是指通過計算標記樣本集中標記樣本的估計斜率,來自適應得到一個半監(jiān)督局部線性回歸中高斯核函數(shù)的高斯核寬h,從而選取一個合適的高斯核寬使方法預測精度提高。
4.根據(jù)權(quán)利要求3所述的基于半監(jiān)督局部線性回歸的自適應參數(shù)軟測量方法,其特征在于,所述的適應于半監(jiān)督局部線性回歸的自適應參數(shù)選擇方法,具體步驟如下首先對部分事先已經(jīng)獲得的輸入數(shù)據(jù)進行離線實驗,找出一個適應于這些數(shù)據(jù)的最優(yōu)高斯核寬,記為h。;再通過下式計算這些數(shù)據(jù)的估計斜率,
5.根據(jù)權(quán)利要求I至4中任一項所述的基于半監(jiān)督局部線性回歸的自適應參數(shù)軟測量方法,其特征在于,所述的在線更新是指對標記數(shù)據(jù)集\,全部數(shù)據(jù)集X和預測集 ',隨著數(shù)據(jù)的讀取,進行數(shù)據(jù)的處理和預測,同時更新這個三個數(shù)據(jù)集。
6.根據(jù)權(quán)利要求I至5中任一項所述的基于半監(jiān)督局部線性回歸的自適應參數(shù)軟測量方法,其特征在于,所述的基于滾動時間窗的方法是指按時間來對數(shù)據(jù)集進行更新,即如果獲取一個數(shù)據(jù)點是標記樣本,則將其加入到標記數(shù)據(jù)集中,并從標記數(shù)據(jù)集中去掉一個最早的數(shù)據(jù)以使標記數(shù)據(jù)集中的標記樣本數(shù)目維持在一個定制,并不斷通過對實時變化的標記數(shù)據(jù)集和全部數(shù)據(jù)進行軟測量模型的建模和預測,實現(xiàn)模型的不斷更新,更適應于新獲取的數(shù)據(jù),避免模型的過學習問題。
7.根據(jù)權(quán)利要求5或6所述的基于半監(jiān)督局部線性回歸的自適應參數(shù)軟測量方法,其特征在于,所述的基于滾動時間窗的方法是指按時間來對數(shù)據(jù)集進行更新,具體過程是這樣的首先利用\和X進行基于半監(jiān)督局部線性回歸的軟測量模型建立,并對數(shù)據(jù)點進行預測得到測量結(jié)果,更新,接著讀取新數(shù)據(jù),更新XjPX,重新進行基于半監(jiān)督局部線性回歸的軟測量模型建立和結(jié)果預測,不斷循環(huán)下去直到預測終止。
全文摘要
本發(fā)明提供一種基于半監(jiān)督局部線性回歸的自適應參數(shù)軟測量方法,首先以局部線性回歸散點平滑方法為理論基礎(chǔ),通過將未標記樣本引入其目標方程的方法將其改造為一種半監(jiān)督的學習方法;然后利用一種計算標記樣本集估計斜率的方法,自適應估計出一個當前標記樣本集的最優(yōu)高斯核寬參數(shù);最后利用該自適應參數(shù)選擇方法實現(xiàn)半監(jiān)督局部線性回歸學習方法的參數(shù)選擇,并基于滾動時間窗的方式實現(xiàn)軟測量模型的在線更新。本發(fā)明充分利用了未標記樣本的價值。針對半監(jiān)督局部線性回歸的特點,可以有效地去除標記樣本測量誤差帶來的影響,提高預測精度。運用滾動時間窗的方法實時更新軟測量模型,使得模型能夠更好地適應輸入數(shù)據(jù)的變化。
文檔編號G06F19/00GK102708294SQ20121014764
公開日2012年10月3日 申請日期2012年5月11日 優(yōu)先權(quán)日2012年5月11日
發(fā)明者張曦, 李哲, 王國良, 閻威武, 陳世和 申請人:上海交通大學, 廣東電網(wǎng)公司電力科學研究院