本技術(shù)涉及迭代學(xué)習(xí)控制,尤其涉及一種被控系統(tǒng)迭代學(xué)習(xí)控制方法、系統(tǒng)、設(shè)備及介質(zhì)。
背景技術(shù):
1、在如今科技飛速發(fā)展的時代,被控系統(tǒng)和控制器已經(jīng)能夠跨越地域的限制,實現(xiàn)遠程的協(xié)同工作。通過無線網(wǎng)絡(luò)這一高效的通信媒介,即便被控系統(tǒng)和控制器身處不同地點,也能確保信息的實時傳輸和指令的準確執(zhí)行,從而操控被控系統(tǒng)正常工作,滿足各種應(yīng)用需求。這種遠距離的無線操控方式不僅提升了工作效率,也極大地拓寬了被控系統(tǒng)和控制器的應(yīng)用范圍。
2、被控系統(tǒng)與控制器之間在進行數(shù)據(jù)傳輸時,由于數(shù)據(jù)量龐大,不僅容易導(dǎo)致系統(tǒng)響應(yīng)的延遲,還時常伴隨著數(shù)據(jù)丟失的風(fēng)險。因此,在數(shù)據(jù)傳輸量大且系統(tǒng)響應(yīng)存在延遲的背景下,如何降低數(shù)據(jù)丟失的影響,實現(xiàn)被控系統(tǒng)的精確控制,已經(jīng)成為了一個技術(shù)難題。
技術(shù)實現(xiàn)思路
1、本技術(shù)提供一種被控系統(tǒng)迭代學(xué)習(xí)控制方法、系統(tǒng)、設(shè)備及介質(zhì),其解決了由于數(shù)據(jù)丟失造成輸入信號停止更新的技術(shù)問題,達到了降低數(shù)據(jù)丟失對輸入信號更新的影響,使得在數(shù)據(jù)丟失的情況下,被控系統(tǒng)的輸出信號仍然能夠快速趨近期望輸出信號,實現(xiàn)被控系統(tǒng)的精確控制的技術(shù)效果。
2、為了達到上述目的,本技術(shù)采用的主要技術(shù)方案包括:
3、第一方面,本技術(shù)實施例提供一種被控系統(tǒng)迭代學(xué)習(xí)控制方法,所述方法包括:
4、獲取被控系統(tǒng)的歷史輸入信號、所述被控系統(tǒng)在當前時刻的當前誤差序列,以及所述被控系統(tǒng)在所述當前時刻的前一時刻的歷史誤差序列;其中,所述歷史輸入信號至少包括前一迭代輪次的輸入信號,所述當前誤差序列是基于所述被控系統(tǒng)的期望輸出序列和在當前迭代輪次的當前輸出序列之差確定的,所述當前輸出序列是將所述前一迭代輪次的輸入信號作為當前輸入信號并控制所述被控系統(tǒng)生成的;
5、在所述當前輸入信號存在數(shù)據(jù)丟失的情況下,在所述歷史輸入信號中確定在所述前一迭代輪次之前的目標輪次輸入信號;
6、根據(jù)所述目標輪次輸入信號、所述當前誤差序列和所述歷史誤差序列,設(shè)置高階反饋迭代學(xué)習(xí)控制律;
7、根據(jù)所述高階反饋迭代學(xué)習(xí)控制律,得到更新后輸入信號,并輸入所述更新后輸入信號至所述被控系統(tǒng);
8、迭代上述得到更新后輸入信號的步驟,直至達到結(jié)束條件。
9、本技術(shù)實施例提出的被控系統(tǒng)迭代學(xué)習(xí)控制方法,當被控系統(tǒng)的輸出序列發(fā)生數(shù)據(jù)丟失時,通過設(shè)置高階反饋迭代學(xué)習(xí)控制律,在常規(guī)控制律的基礎(chǔ)上,根據(jù)歷史誤差序列以及歷史輸入信號中的目標輪次輸入信號對輸入信號進行更新。本方法解決了由于數(shù)據(jù)丟失造成輸入信號停止更新的技術(shù)問題,降低了數(shù)據(jù)丟失對輸入信號更新的影響,使得在數(shù)據(jù)丟失的情況下,被控系統(tǒng)的輸出仍然能夠快速趨近期望輸出,從而實現(xiàn)被控系統(tǒng)的精確控制。
10、可選地,所述高階反饋迭代學(xué)習(xí)控制律包括高階學(xué)習(xí)項和反饋更新項;所述根據(jù)所述目標輪次輸入信號、所述當前誤差序列和所述歷史誤差序列,設(shè)置高階反饋迭代學(xué)習(xí)控制律,包括:
11、基于所述目標輪次輸入信號、所述當前誤差序列和數(shù)據(jù)丟失表征參數(shù),得到所述高階學(xué)習(xí)項,以對所述當前輸入信號進行數(shù)據(jù)補償;
12、基于所述歷史誤差序列和所述數(shù)據(jù)丟失表征參數(shù),得到所述反饋更新項,以在所述目標輪次輸入信號不滿足預(yù)設(shè)迭代要求的情況下,對所述目標輪次輸入信號進行補充。
13、可選地,所述高階學(xué)習(xí)項包括輸入學(xué)習(xí)項和誤差學(xué)習(xí)項;所述基于所述目標輪次輸入信號、所述當前誤差序列和數(shù)據(jù)丟失表征參數(shù),得到所述高階學(xué)習(xí)項,以對所述當前輸入信號進行數(shù)據(jù)補償,包括:
14、根據(jù)輸入學(xué)習(xí)增益對所述目標輪次輸入信號進行學(xué)習(xí),得到所述輸入學(xué)習(xí)項;
15、根據(jù)誤差學(xué)習(xí)增益和所述數(shù)據(jù)丟失表征參數(shù)對所述當前誤差序列進行學(xué)習(xí),確定所述誤差學(xué)習(xí)項。
16、可選地,所述高階學(xué)習(xí)項的形式如下:
17、
18、其中,uf,k+1(n)表示所述高階學(xué)習(xí)項,表示所述輸入學(xué)習(xí)項,表示所述誤差學(xué)習(xí)項;uk-j+1(n)為第k-j+1次迭代輪次第n時刻的輸入信號;γk-j+1(n+1)為第k-j+1次迭代輪次第n+1時刻的數(shù)據(jù)丟失表征參數(shù),γk-j+1(n+1)=1表示未發(fā)生數(shù)據(jù)丟失,γk-j+1(n+1)=0表示發(fā)生了數(shù)據(jù)丟失;為第n+1時刻的當前誤差序列;pj為第j個輸入學(xué)習(xí)增益;lj為第j個誤差學(xué)習(xí)增益;n為目標輪次輸入信號的數(shù)量。
19、可選地,所述輸入學(xué)習(xí)增益和所述誤差學(xué)習(xí)增益滿足以下收斂條件:
20、
21、其中,γj(n+1)為第n+1時刻第j個數(shù)據(jù)丟失表征參數(shù),γj(n+1)=1表示第j個目標輪次輸入信號對應(yīng)的歷史輸出序列未發(fā)生數(shù)據(jù)缺失,γj(n+1)=0表示第j個目標輪次輸入信號對應(yīng)的歷史輸出序列發(fā)生了數(shù)據(jù)缺失;ρj為第j個歷史輸入信號對應(yīng)的收斂系數(shù);c和b與被控系統(tǒng)有關(guān)。
22、可選地,所述反饋更新項的形式如下:
23、
24、其中,ub,k+1(n)表示所述反饋更新項;γk+1(n)為第n時刻當前的數(shù)據(jù)丟失表征參數(shù),γk+1(n)=1表示當前輸出序列對應(yīng)未發(fā)生數(shù)據(jù)丟失,γk+1(n)=0表示當前輸出序列對應(yīng)發(fā)生了數(shù)據(jù)丟失;為第k次迭代輪次的歷史誤差序列;γ為反饋制約系數(shù)。
25、可選地,所述被控系統(tǒng)和控制器之間通過編解碼網(wǎng)絡(luò)連接,所述編解碼網(wǎng)絡(luò)包括編碼器、量化器、網(wǎng)絡(luò)通路和解碼器,所述量化器為單位均勻量化器。
26、第二方面,本技術(shù)實施例提供一種被控系統(tǒng)迭代學(xué)習(xí)控制系統(tǒng),所述系統(tǒng)包括:
27、數(shù)據(jù)獲取模塊,用于獲取被控系統(tǒng)的歷史輸入信號、所述被控系統(tǒng)在當前時刻的當前誤差序列,以及所述被控系統(tǒng)在所述當前時刻的前一時刻的歷史誤差序列;其中,所述歷史輸入信號至少包括前一迭代輪次的輸入信號,所述當前誤差序列是基于所述被控系統(tǒng)的期望輸出序列和在當前迭代輪次的當前輸出序列之差確定的,所述當前輸出序列是將所述前一迭代輪次的輸入信號作為當前輸入信號并控制所述被控系統(tǒng)生成的;
28、目標輪次確定模塊,用于在所述當前輸入信號存在數(shù)據(jù)丟失的情況下,在所述歷史輸入信號中確定在所述前一迭代輪次之前的目標輪次輸入信號;
29、學(xué)習(xí)控制模塊,用于根據(jù)所述目標輪次輸入信號、所述當前誤差序列和所述歷史誤差序列,設(shè)置高階反饋迭代學(xué)習(xí)控制律;
30、信號更新模塊,用于根據(jù)所述高階反饋迭代學(xué)習(xí)控制律,得到更新后輸入信號,并輸入所述更新后輸入信號至所述被控系統(tǒng);
31、迭代計算模塊,用于迭代執(zhí)行上述得到更新后輸入信號的模塊,直至達到結(jié)束條件。
32、第三方面,本技術(shù)實施例提供一種計算機設(shè)備,包括:存儲器和處理器,所述存儲器和所述處理器之間互相通信連接,所述存儲器中存儲有計算機指令,所述處理器通過執(zhí)行所述計算機指令,從而執(zhí)行上述實施例中任一項所述的被控系統(tǒng)迭代學(xué)習(xí)控制方法。
33、第四方面,本技術(shù)實施例提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)上存儲有計算機指令,所述計算機指令用于使計算機執(zhí)行上述實施例中任一項所述的被控系統(tǒng)迭代學(xué)習(xí)控制方法。
34、第五方面,本技術(shù)實施例提供一種計算機程序產(chǎn)品,包括計算機指令,所述計算機指令用于使計算機執(zhí)行上述實施例中任一項所述的被控系統(tǒng)迭代學(xué)習(xí)控制方法。