1.一種基于相鄰數(shù)據(jù)特征的數(shù)據(jù)缺失填充方法,其特征在于:
讀取一段按照時(shí)間順序排列的數(shù)據(jù)序列;所述數(shù)據(jù)序列中,存在n個(gè)數(shù)據(jù),所述數(shù)據(jù)序列為data(x1)、data(x2)……data(xn)表示,x1、x2……xn為時(shí)間序列Q,n為自然數(shù);所述數(shù)據(jù)序列中,缺失了編號(hào)為i的數(shù)據(jù),即data(i),i為等差數(shù)列Q中的一個(gè)值;
填充編號(hào)為i的數(shù)據(jù),包括以下步驟:
1)讀取與編號(hào)為i的數(shù)據(jù)相鄰的數(shù)據(jù)data(i-1);在所述數(shù)據(jù)序列中,從頭開(kāi)始尋找與data(i-1)之差的絕對(duì)值小于0.02的數(shù)據(jù);
如果沒(méi)有找到這樣的數(shù)據(jù),則下一步直接進(jìn)入步驟5);
如果找到這樣的一個(gè)或多個(gè)數(shù)據(jù),令其中一個(gè)數(shù)據(jù)的序列號(hào)為k-1,即該數(shù)據(jù)記為data(k-1),并進(jìn)入下一步,k為時(shí)間序列Q中的一個(gè)值;
2)讀取data(k)和data(i)左邊的三個(gè)數(shù)據(jù),將data(k-3)、data(k-2)和data(k-1)進(jìn)行一次擬合,data(i-3)、data(i-2)和data(i-1)進(jìn)行一次擬合;如果data(k-3)、data(k-2)和data(k-1)的變化趨勢(shì)與data(i-3)、data(i-2)和data(i-1)的變化趨勢(shì)相同,則進(jìn)入下一步;否則,回到步驟1),重新選取data(k-1),但無(wú)法通過(guò)步驟1)選取data(k-1)時(shí),則進(jìn)入步驟5);
3)讀取data(k)和data(i)右邊的三個(gè)數(shù)據(jù),將data(k+3)、data(k+2)和data(k+1)進(jìn)行一次擬合,data(i+3)、data(i+2)和data(i+1)進(jìn)行一次擬合;如果data(k+3)、data(k+2)和data(k+1)的變化趨勢(shì)與data(i+3)、data(i+2)和data(i+1)的變化趨勢(shì)相同,則進(jìn)入下一步;否則,回到步驟1),重新選取data(k-1),但無(wú)法通過(guò)步驟1)選取data(k-1)時(shí),則進(jìn)入步驟5);
4)將data(k)保存到數(shù)據(jù)集K中,回到步驟1),重新選取data(k-1),直到無(wú)法通過(guò)步驟1)選取data(k-1)時(shí),進(jìn)入下一步;
5)若被保存數(shù)據(jù)只有1個(gè)數(shù)據(jù)data(k),則若沒(méi)有數(shù)據(jù)被保存下來(lái),則取缺失值data(i)左右兩側(cè)數(shù)據(jù)的平均值。如果數(shù)據(jù)集K存在j-1(j>2)個(gè)數(shù)據(jù),則將數(shù)據(jù)集K里面的數(shù)據(jù)擬合為f(x),令M=f(j);
6)將數(shù)值M填充到data(i)的位置上。
2.根據(jù)權(quán)利要求1所述的一種基于相鄰數(shù)據(jù)特征的數(shù)據(jù)缺失填充方法,其特征在于:步驟1)開(kāi)始前,對(duì)data(x1)、data(x2)……data(xn)歸一化處理。
3.根據(jù)權(quán)利要求1所述的一種基于相鄰數(shù)據(jù)特征的數(shù)據(jù)缺失填充方法,其特征在于:若第一個(gè)數(shù)據(jù)缺失,則直接忽略該數(shù)據(jù),從第二個(gè)缺失值開(kāi)始填充。
4.根據(jù)權(quán)利要求1所述的一種基于相鄰數(shù)據(jù)特征的數(shù)據(jù)缺失填充方法,其特征在于:所述數(shù)據(jù)序列為data(x1)、data(x2)……data(xn)為每間隔1個(gè)小時(shí)測(cè)得的變壓器油溫。