本發(fā)明屬于石油工程,尤其涉及一種基于載荷數(shù)據(jù)符號(hào)表示的有桿抽油機(jī)井工況監(jiān)測(cè)方法。
背景技術(shù):
1、有桿抽油機(jī)井是應(yīng)用最為廣泛的采油井,在國(guó)內(nèi)外石油工業(yè)中發(fā)揮著重要作用。有桿抽油機(jī)井的主要設(shè)備工作在數(shù)千米深的地下,工作環(huán)境惡劣,經(jīng)常會(huì)出現(xiàn)氣體影響、供液不足、固定閥或游動(dòng)閥漏失、柱塞脫筒等復(fù)雜工況,一旦這些工況沒(méi)有被及時(shí)發(fā)現(xiàn)并解決,不僅會(huì)造成原油產(chǎn)量損失,甚至可能導(dǎo)致惡劣的安全和環(huán)境事故。因此,有桿抽油機(jī)井的工況監(jiān)測(cè)對(duì)于提高采收率和保障油田安全生產(chǎn)具有重要意義。由懸點(diǎn)位移與懸點(diǎn)載荷所形成的封閉曲線,又稱(chēng)地面示功圖,是有桿抽油機(jī)井工況監(jiān)測(cè)的主要數(shù)據(jù)來(lái)源。地面示功圖形狀的差異反映了有桿抽油機(jī)井工況的變化情況?,F(xiàn)有的監(jiān)測(cè)方法主要依賴(lài)專(zhuān)家經(jīng)驗(yàn)來(lái)提取示功圖的形狀特征,從而搭建分類(lèi)器實(shí)現(xiàn)有桿抽油機(jī)井的工況監(jiān)測(cè)。然而,現(xiàn)有的監(jiān)測(cè)方法過(guò)于依賴(lài)專(zhuān)家經(jīng)驗(yàn)等主觀因素,專(zhuān)家水平的高低以及專(zhuān)家經(jīng)驗(yàn)的形式化方法都會(huì)對(duì)監(jiān)測(cè)結(jié)果產(chǎn)生很大的影響,例如,對(duì)于形狀特征較為復(fù)雜的地面示功圖,判斷其所對(duì)應(yīng)工況不僅需要豐富的領(lǐng)域知識(shí)和經(jīng)驗(yàn),還需要準(zhǔn)確的形式化方法來(lái)量化形狀特征。此外,有桿抽油機(jī)井不同工況間載荷數(shù)據(jù)的差異較大,位移數(shù)據(jù)的差異較小,地面示功圖既增加了冗余的位移信息又丟失了載荷數(shù)據(jù)所包含的時(shí)間維度信息,限制了現(xiàn)有監(jiān)測(cè)水平的提升。
2、申請(qǐng)?zhí)枮閏n202210739084.5的專(zhuān)利申請(qǐng)文獻(xiàn)中提出“一種基于機(jī)器學(xué)習(xí)的有桿抽油機(jī)井下故障診斷方法”。該專(zhuān)利實(shí)施方案為:首先,利用專(zhuān)家經(jīng)驗(yàn)將預(yù)處理后的示功圖分割成多個(gè)曲線段,通過(guò)計(jì)算各曲線段的幾何力矩與中心力矩,將其依特定規(guī)律整合為向量,從而構(gòu)建不同工況示功圖的空間樣本集;然后,先利用主成分分析的方法對(duì)空間樣本集初步降維進(jìn)而構(gòu)建截面空間,在均值和方差同時(shí)最小化的條件下,再將截面空間樣本投影到新的弱非線性截面空間;最后,利用局部線性嵌入算法提取弱非線性截面空間中樣本的特征并采用支持向量機(jī)來(lái)判斷有桿抽油機(jī)井的井下工況。
3、申請(qǐng)?zhí)枮閏n202310977728.9的專(zhuān)利申請(qǐng)文獻(xiàn)中提出“基于深度學(xué)習(xí)的抽油機(jī)示功圖故障診斷方法”。該專(zhuān)利實(shí)施方案為:首先,利用數(shù)據(jù)采集設(shè)備收集有桿抽油機(jī)懸點(diǎn)載荷與懸點(diǎn)位移數(shù)據(jù)并繪制成圖像;然后,剔除異常的圖像并利用翻轉(zhuǎn)旋轉(zhuǎn)等操作增強(qiáng)數(shù)據(jù);最后,采用加入注意力機(jī)制的深度神經(jīng)網(wǎng)絡(luò)對(duì)圖像進(jìn)行分類(lèi),從而實(shí)現(xiàn)有桿抽油機(jī)井的工況監(jiān)測(cè)。
4、中國(guó)專(zhuān)利cn202210739084.5“一種基于機(jī)器學(xué)習(xí)的有桿抽油機(jī)井下故障診斷方法”。雖然該方法可以實(shí)現(xiàn)有桿抽油機(jī)井的井下工況監(jiān)測(cè),但該方法所采用的地面示功圖數(shù)據(jù)包含了冗余的位移信息且忽略了載荷數(shù)據(jù)的時(shí)間維度信息,導(dǎo)致難以獲得有桿抽油機(jī)井連續(xù)工作過(guò)程中工況的變化趨勢(shì)。此外,該方法依賴(lài)專(zhuān)家經(jīng)驗(yàn)來(lái)分割地面示功圖,并且需要復(fù)雜的計(jì)算來(lái)量化各曲線段的形狀特征。
5、中國(guó)專(zhuān)利cn202310977728.9“基于深度學(xué)習(xí)的抽油機(jī)示功圖故障診斷方法”。雖然該方法將地面示功圖作為圖像輸入到深度神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像分類(lèi),減少了對(duì)于專(zhuān)家經(jīng)驗(yàn)的依賴(lài)。但該方法中翻轉(zhuǎn)旋轉(zhuǎn)等操作會(huì)改變地面示功圖所包含的工況信息,例如,游動(dòng)閥漏所對(duì)應(yīng)的地面示功圖經(jīng)旋轉(zhuǎn)后類(lèi)似于固定閥漏所對(duì)應(yīng)的地面示功圖。由于忽略了地面示功圖所包含的機(jī)理信息,所以容易造成工況的錯(cuò)誤判斷。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明的目的是提出一種利用載荷時(shí)序數(shù)據(jù)實(shí)現(xiàn)有桿抽油機(jī)井工況自動(dòng)檢測(cè)的方法,用于解決現(xiàn)有的監(jiān)測(cè)方法過(guò)于依賴(lài)專(zhuān)家經(jīng)驗(yàn)等主觀因素,從而導(dǎo)致專(zhuān)家水平的高低以及專(zhuān)家經(jīng)驗(yàn)的形式化方法對(duì)監(jiān)測(cè)結(jié)果產(chǎn)生影響的問(wèn)題。并解決現(xiàn)有的監(jiān)測(cè)方法利用地面示功圖數(shù)據(jù),導(dǎo)致增加了冗余的位移信息又丟失了載荷數(shù)據(jù)所包含的時(shí)間維度信息的問(wèn)題。
2、一種基于載荷數(shù)據(jù)符號(hào)表示的有桿抽油機(jī)井工況監(jiān)測(cè)方法,包括如下步驟:
3、步驟1:獲取有桿抽油機(jī)井的載荷時(shí)序數(shù)據(jù)并對(duì)有桿抽油機(jī)井的載荷時(shí)序數(shù)據(jù)進(jìn)行預(yù)處理,得到預(yù)處理后的有桿抽油機(jī)井的載荷時(shí)序數(shù)據(jù);所述預(yù)處理為標(biāo)準(zhǔn)化;所述有桿抽油機(jī)井的載荷時(shí)序數(shù)據(jù)為不同工況下若干個(gè)不同時(shí)刻的有桿抽油機(jī)井懸點(diǎn)處的載荷值;所述懸點(diǎn)處的載荷值包括抽油桿柱載荷,作用在柱塞上的液柱載荷,慣性載荷以及摩擦載荷;
4、步驟1.1:等時(shí)間間隔采集有桿抽油機(jī)井懸點(diǎn)處的載荷值,進(jìn)而得到有桿抽油機(jī)井一個(gè)沖程內(nèi)的載荷時(shí)序數(shù)據(jù)x={x1,x2,…,xj,…,xn},其中,xj為第j個(gè)時(shí)刻有桿抽油機(jī)井懸點(diǎn)處的載荷值,n為有桿抽油機(jī)井懸點(diǎn)處的載荷值的采樣個(gè)數(shù),1≤j≤n;
5、步驟1.2:計(jì)算載荷時(shí)序數(shù)據(jù)x中有桿抽油機(jī)井懸點(diǎn)處的載荷值的均值和標(biāo)準(zhǔn)差,并對(duì)載荷時(shí)序數(shù)據(jù)x中的有桿抽油機(jī)井懸點(diǎn)處的載荷值進(jìn)行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化的載荷時(shí)序數(shù)據(jù)z;
6、對(duì)于有桿抽油機(jī)井一個(gè)沖程內(nèi)的載荷時(shí)序數(shù)據(jù)x,按照公式(1)進(jìn)行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化的載荷時(shí)序數(shù)據(jù)z={z1,z2,…,zj,…,zn}:
7、
8、式中,zj為標(biāo)準(zhǔn)化的載荷時(shí)序數(shù)據(jù)z中第j個(gè)時(shí)刻的有桿抽油機(jī)井懸點(diǎn)處的載荷值,為載荷時(shí)序數(shù)據(jù)x中有桿抽油機(jī)井懸點(diǎn)處的載荷值的均值,s為載荷時(shí)序數(shù)據(jù)x中有桿抽油機(jī)井懸點(diǎn)處的載荷值的標(biāo)準(zhǔn)差;
9、步驟2:利用分段聚合近似算法對(duì)標(biāo)準(zhǔn)化的載荷時(shí)序數(shù)據(jù)進(jìn)行分段,得到分段均值序列;
10、具體為:確定分段數(shù)目ω,1<ω<n,將標(biāo)準(zhǔn)化的載荷時(shí)序數(shù)據(jù)z={z1,z2,…,zj,…,zn}等分為ω段,將每段利用落在該段內(nèi)的有桿抽油機(jī)井懸點(diǎn)處載荷值的均值表示,由各段的均值組成分段均值序列p={p1,p2,…,ph,…,pω};
11、根據(jù)分段數(shù)目ω,利用公式(2)計(jì)算得到標(biāo)準(zhǔn)化的載荷時(shí)序數(shù)據(jù)各段的均值:
12、
13、其中,ph為標(biāo)準(zhǔn)化的載荷時(shí)序數(shù)據(jù)z中第h段的均值,h為段的編號(hào);
14、步驟3:采用自適應(yīng)核密度估計(jì)方法計(jì)算標(biāo)準(zhǔn)化的載荷時(shí)序數(shù)據(jù)中懸點(diǎn)處載荷值的概率密度函數(shù)和分布函數(shù);
15、步驟3.1:對(duì)于標(biāo)準(zhǔn)化的載荷時(shí)序數(shù)據(jù)z={z1,z2,…,zj,…,zn},利用自適應(yīng)核密度估計(jì)方法計(jì)算標(biāo)準(zhǔn)化的載荷時(shí)序數(shù)據(jù)中懸點(diǎn)處載荷值的概率密度函數(shù)f(z),計(jì)算式如式(3):
16、
17、其中,z為概率密度函數(shù)的某一點(diǎn),δ為帶寬,δ通過(guò)局部密度自適應(yīng)調(diào)整,k(·)為核函數(shù);
18、步驟3.2:根據(jù)概率密度函數(shù)f(z)計(jì)算分布函數(shù)f(z),計(jì)算式如式(5):
19、
20、其中,τ為概率密度函數(shù)的自變量;
21、步驟4:將分段均值序列中各分段的均值映射為符號(hào),形成分段均值序列的符號(hào)序列;
22、步驟4.1:通過(guò)權(quán)衡載荷時(shí)序數(shù)據(jù)結(jié)構(gòu)信息的損失以及符號(hào)表示的效果,確定符號(hào)個(gè)數(shù)k以及符號(hào){e1,e2,…,ek},ek為第k個(gè)符號(hào);
23、步驟4.2:根據(jù)分布函數(shù)f(z)和符號(hào)個(gè)數(shù)k,確定等概率符號(hào)表示分段點(diǎn)t1,t2,…,tk-1,tk-1為第k-1個(gè)等概率符號(hào)表示分段點(diǎn);所述等概率符號(hào)表示分段點(diǎn)為根據(jù)分布函數(shù)確定的等概率區(qū)間的分段點(diǎn),這些分段點(diǎn)使符號(hào)落在各區(qū)間的概率相等;
24、步驟4.3:根據(jù)確定的符號(hào)以及等概率符號(hào)表示分段點(diǎn),按照公式(6)將步驟2中的分段均值序列p={p1,p2,…,ph,…,pω}映射為符號(hào)序列s={s1,s2,…,sh,…,sω};
25、
26、其中,g(ph)為映射函數(shù),遍歷分段均值序列p映射得到符號(hào)序列s={s1,s2,…,sh,…,sω},sh∈{e1,e2,…,ek},1≤h≤ω;
27、步驟5:構(gòu)建特征詞詞典并利用滑動(dòng)窗口提取符號(hào)序列中的特征詞,然后利用向量化方法獲取特征詞坐標(biāo)并以此構(gòu)建符號(hào)序列的特征詞向量;所述特征詞為符號(hào)序列中相鄰的若干個(gè)符號(hào)組成的詞,所述特征詞詞典為所有特征詞的集合;
28、步驟5.1:設(shè)定特征詞中符號(hào)的數(shù)量,獲取由設(shè)定數(shù)量額符號(hào)組成的所有特征詞,進(jìn)而構(gòu)建特征詞詞典;所述特征詞典的維度為特征詞的數(shù)量,特征詞典的每一個(gè)維度對(duì)應(yīng)一個(gè)特征詞;
29、步驟5.2:對(duì)于符號(hào)序列s={s1,s2,…,sh,…,sω},利用滑動(dòng)窗口進(jìn)行分詞,從符號(hào)序列s中提取特征詞詞典中出現(xiàn)的特征詞并構(gòu)建提取到的特征詞的集合;
30、進(jìn)一步地,設(shè)定窗口大小為b,滑動(dòng)步長(zhǎng)為l,從符號(hào)s1開(kāi)始,提取每次滑動(dòng)后窗口內(nèi)包含的特征詞并存儲(chǔ),直到符號(hào)sω,共提取個(gè)特征詞,構(gòu)建提取到的特征詞的集合;
31、步驟5.3:根據(jù)提取到的特征詞的集合計(jì)算特征詞權(quán)重,獲取特征詞坐標(biāo)并以此構(gòu)建特征詞向量;
32、進(jìn)一步地,統(tǒng)計(jì)提取到的特征詞的集合中所有出現(xiàn)的特征詞的頻率,將特征詞的頻率作為權(quán)重,對(duì)于沒(méi)有出現(xiàn)的特征詞,頻率記為0,將特征詞的頻率作為特征詞詞典對(duì)應(yīng)維度下的特征詞坐標(biāo),構(gòu)建符號(hào)序列的特征詞向量w={w1,w2,…,wp},p為特征詞詞典的維度;
33、步驟6:按照步驟1至步驟5構(gòu)建若干工況下的載荷時(shí)序數(shù)據(jù)對(duì)應(yīng)的特征詞向量作為模板并以此構(gòu)建工況知識(shí)庫(kù);
34、進(jìn)一步地,根據(jù)步驟1所述獲取載荷時(shí)序數(shù)據(jù)的方法,采集有桿抽油機(jī)井歷史生產(chǎn)過(guò)程中多個(gè)沖程內(nèi)的載荷時(shí)序數(shù)據(jù),均勻選取包含c種工況的m條載荷時(shí)序數(shù)據(jù),c<m,記為x1,x2,…,xm;對(duì)其中每一條載荷時(shí)序數(shù)據(jù)xi={xi1,xi2,…,xij,…,xin},1≤f≤m,按照步驟1至步驟5所述方法,構(gòu)建特征詞向量wi作為模板并存儲(chǔ),遍歷m條載荷時(shí)序數(shù)據(jù)建立工況知識(shí)庫(kù)kb,如下公式所示:
35、
36、其中,1≤q≤p,1≤i≤m代表第i條特征詞向量中第q維的特征詞坐標(biāo),labeli表示第i條特征詞向量對(duì)應(yīng)的工況類(lèi)別標(biāo)簽;i為載荷時(shí)序數(shù)據(jù)的編號(hào),xij為第i條載荷時(shí)序數(shù)據(jù)中的第j個(gè)時(shí)刻有桿抽油機(jī)井懸點(diǎn)處的載荷值,wi為第i條載荷時(shí)序數(shù)據(jù)對(duì)應(yīng)的特征詞向量;
37、步驟7:引入工況的相似性度量,采集新的載荷時(shí)序數(shù)據(jù)并構(gòu)建對(duì)應(yīng)的特征詞向量,計(jì)算其與工況知識(shí)庫(kù)中各模板的相似程度,通過(guò)模板匹配確定工況類(lèi)別;
38、步驟7.1:采集新的載荷時(shí)序數(shù)據(jù)并按照步驟1至步驟5所述方法構(gòu)建新采集的載荷時(shí)序數(shù)據(jù)對(duì)應(yīng)的特征詞向量;
39、進(jìn)一步地,根據(jù)步驟1至步驟5方法,構(gòu)建新采集載荷時(shí)序數(shù)據(jù)xα={xα1,xα2,…,xαn}對(duì)應(yīng)的特征詞向量
40、步驟7.2:引入工況的相似性度量,建立相似性度量的計(jì)算式;
41、具體為:對(duì)構(gòu)建的新采集載荷時(shí)序數(shù)據(jù)特征詞向量wα與工況知識(shí)庫(kù)中任一模板wi,引入工況的相似性度量計(jì)算式(9):
42、
43、其中,sim(wα,wi)表示特征詞向量wα與工況知識(shí)庫(kù)中任一模板wi之間的相似性度量,d=dag(d1,d2,…,dp)為權(quán)重矩陣,dq是矩陣d的第q個(gè)對(duì)角線元素,1≤q≤p,由歸一化計(jì)算式(10)計(jì)算dq值:
44、
45、其中,為工況知識(shí)庫(kù)中所有特征詞向量中第q個(gè)維度的特征詞坐標(biāo)的方差,為所有特征詞向量1到p維度的特征詞坐標(biāo)的方差組成的集合,min(s2)為所有p個(gè)維度的特征詞坐標(biāo)的方差的最小值,max(s2)為所有p個(gè)維度的特征詞坐標(biāo)的方差的最大值,由計(jì)算式(11)計(jì)算得到:
46、
47、其中,為所有特征詞向量第q維的特征詞坐標(biāo)的均值;
48、步驟7.3:利用相似性度量的計(jì)算式計(jì)算新采集載荷時(shí)序數(shù)據(jù)的特征詞向量與工況知識(shí)庫(kù)中各模板的相似性度量,通過(guò)模板匹配確定工況類(lèi)型;
49、具體為:遍歷工況知識(shí)庫(kù)kb,依次計(jì)算wα與kb中每個(gè)模板的相似性度量,按照相似性度量大小從高到低排列,采用多數(shù)投票表決,根據(jù)投票表決結(jié)果,相似性度量最大的k個(gè)模板所對(duì)應(yīng)的工況標(biāo)簽即為新采集載荷時(shí)序數(shù)據(jù)對(duì)應(yīng)的工況類(lèi)別。
50、與現(xiàn)有技術(shù)相比較,本發(fā)明的有益效果為:
51、1、本發(fā)明將懸點(diǎn)處載荷時(shí)序數(shù)據(jù)作為分析有桿抽油機(jī)井工況的數(shù)據(jù)來(lái)源,充分利用了反應(yīng)工況變化的載荷時(shí)序數(shù)據(jù),還原時(shí)間維度信息的同時(shí)減少了示功圖合成過(guò)程中冗余的位移信息的影響,提高了數(shù)據(jù)利用率和監(jiān)測(cè)效率。
52、2、本發(fā)明提出了一種符號(hào)表示方法用于構(gòu)建載荷時(shí)序數(shù)據(jù)對(duì)應(yīng)的符號(hào)序列,減少了對(duì)專(zhuān)家經(jīng)驗(yàn)的依賴(lài),減弱了基于領(lǐng)域知識(shí)的形式化方法在量化地面示功圖形狀特征時(shí)對(duì)監(jiān)測(cè)結(jié)果產(chǎn)生的影響。
53、3、本發(fā)明提出了一種符號(hào)向量化方法用于構(gòu)建符號(hào)序列的特征詞向量,通過(guò)向量化方法轉(zhuǎn)換數(shù)據(jù)類(lèi)型,便于計(jì)算機(jī)分析與處理,構(gòu)建的特征詞向量便于計(jì)算相似度,提高了檢索與匹配的效率。
54、4、本發(fā)明建立了以載荷時(shí)序數(shù)據(jù)的特征詞向量作為模板的工況知識(shí)庫(kù)來(lái)管理工況的載荷數(shù)據(jù)資源,減少了載荷數(shù)據(jù)中知識(shí)的冗余度,增加了知識(shí)的重用性。
55、5、本發(fā)明引入了一種工況的相似性度量用于知識(shí)庫(kù)的檢索,計(jì)算簡(jiǎn)便且適用性強(qiáng),通過(guò)分配權(quán)重,強(qiáng)化了部分特征詞對(duì)相似性計(jì)算的貢獻(xiàn),提高了度量的準(zhǔn)確性與靈活性。