本技術(shù)實(shí)施例涉及光通信,尤其涉及一種細(xì)粒度光網(wǎng)絡(luò)業(yè)務(wù)調(diào)度方法及裝置。
背景技術(shù):
1、光傳送網(wǎng)絡(luò)(optical?transport?network,otn)以大帶寬、長距離傳輸能力大規(guī)模部署于骨干網(wǎng)和城域網(wǎng),但在面對帶寬要求不高、時(shí)延低等多種類型的小顆粒度業(yè)務(wù)時(shí)存在資源浪費(fèi),無法滿足業(yè)務(wù)需求的問題。光業(yè)務(wù)單元(optical?service?unit,osu)和細(xì)粒度otn(fine-grained?optical?transport?network,fgotn)旨在解決otn在小顆粒度業(yè)務(wù)上的不足,在硬件上提供了更小的帶寬顆粒度,能夠?qū)崿F(xiàn)多顆粒度業(yè)務(wù)的傳輸,但是如何根據(jù)多顆粒度業(yè)務(wù)的類型和需求進(jìn)行優(yōu)化調(diào)度,并未提供解決方案。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本技術(shù)實(shí)施例的目的在于提出一種細(xì)粒度光網(wǎng)絡(luò)數(shù)據(jù)調(diào)度方法及裝置,以解決業(yè)務(wù)的調(diào)度問題。
2、基于上述目的,本技術(shù)實(shí)施例提供了一種細(xì)粒度光網(wǎng)絡(luò)業(yè)務(wù)調(diào)度方法,包括:
3、根據(jù)光業(yè)務(wù)單元所承載的業(yè)務(wù)的算力需求,計(jì)算光業(yè)務(wù)單元的負(fù)載參數(shù);
4、根據(jù)光業(yè)務(wù)單元所承載的業(yè)務(wù)的時(shí)延敏感性參數(shù),計(jì)算光業(yè)務(wù)單元的時(shí)延參數(shù);
5、基于所述負(fù)載參數(shù)和時(shí)延參數(shù),確定所述光業(yè)務(wù)單元在當(dāng)前網(wǎng)絡(luò)狀態(tài)下的復(fù)制動(dòng)態(tài)方程;
6、基于q學(xué)習(xí)方法求解所述復(fù)制動(dòng)態(tài)方程,確定按照時(shí)延優(yōu)化策略調(diào)度業(yè)務(wù)的時(shí)延權(quán)重參數(shù),以及按照負(fù)載均衡策略調(diào)度業(yè)務(wù)的負(fù)載權(quán)重參數(shù);
7、按照所述時(shí)延優(yōu)化策略及相應(yīng)的時(shí)延權(quán)重參數(shù)、按照所述負(fù)載均衡策略及相應(yīng)的負(fù)載權(quán)重參數(shù)調(diào)度業(yè)務(wù)。
8、可選的,基于所述負(fù)載參數(shù)和時(shí)延參數(shù),確定所述光業(yè)務(wù)單元在當(dāng)前網(wǎng)絡(luò)狀態(tài)下的復(fù)制動(dòng)態(tài)方程,包括:
9、根據(jù)所述負(fù)載參數(shù),按照預(yù)設(shè)的負(fù)載收益函數(shù)確定負(fù)載均衡收益;
10、根據(jù)所述時(shí)延參數(shù),按照預(yù)設(shè)的時(shí)延收益函數(shù)確定時(shí)延收益;
11、根據(jù)所述負(fù)載均衡收益和時(shí)延收益,確定所述復(fù)制動(dòng)態(tài)方程。
12、可選的,所述負(fù)載收益函數(shù)為:
13、ul(si)=-mean(l(si))/s?????????????????(3)
14、其中,l(si)為光業(yè)務(wù)單元si的負(fù)載參數(shù),s為歸一化因子,mean()為均值函數(shù);
15、所述時(shí)延收益函數(shù)為:
16、ud(si)=-d(si)???????????????????????(4)
17、其中,d(se)為光業(yè)務(wù)單元si的時(shí)延參數(shù);
18、所述復(fù)制動(dòng)態(tài)方程為:
19、
20、其中,復(fù)制動(dòng)態(tài)方程的穩(wěn)定點(diǎn)對應(yīng)的χd、χl分別為所述時(shí)延權(quán)重參數(shù)和負(fù)載權(quán)重參數(shù),為平均收益,計(jì)算方法為:
21、
22、其中,ud(sd)為執(zhí)行時(shí)延優(yōu)化策略獲得的收益,ul(sl)為執(zhí)行負(fù)載均衡策略的收益。
23、可選的,基于q學(xué)習(xí)方法求解所述復(fù)制動(dòng)態(tài)方程,包括:
24、以所述當(dāng)前網(wǎng)絡(luò)狀態(tài)為當(dāng)前狀態(tài),以選取所述時(shí)延優(yōu)化策略或負(fù)載均衡策略為動(dòng)作,執(zhí)行選取的策略之后按照預(yù)設(shè)的獎(jiǎng)勵(lì)函數(shù)計(jì)算獎(jiǎng)勵(lì)值;
25、根據(jù)該獎(jiǎng)勵(lì)值按照預(yù)設(shè)的q值更新方法更新q值,直至得到q值最大值,將q值最大值對應(yīng)的χd、χl作為復(fù)制動(dòng)態(tài)方程的穩(wěn)定點(diǎn)。
26、可選的,所述獎(jiǎng)勵(lì)函數(shù)為:
27、r=χd×ud(si)+χl×ul(si)??????????????????(13)
28、所述q值更新方法為:
29、
30、其中,η為學(xué)習(xí)率,γ為折扣因子,r為在狀態(tài)s下執(zhí)行動(dòng)作a獲得的獎(jiǎng)勵(lì)值,q(s,a)為在狀態(tài)s下執(zhí)行動(dòng)作a得到的q值,s′為執(zhí)行動(dòng)作a后的新狀態(tài),a′為新狀態(tài)下執(zhí)行的新動(dòng)作,為在新狀態(tài)s′下執(zhí)行動(dòng)作a′得到的最大q值。
31、本技術(shù)實(shí)施例還提供一種細(xì)粒度光網(wǎng)絡(luò)業(yè)務(wù)調(diào)度裝置,包括:
32、負(fù)載計(jì)算模塊,用于根據(jù)光業(yè)務(wù)單元所承載的業(yè)務(wù)的算力需求,計(jì)算光業(yè)務(wù)單元的負(fù)載參數(shù);
33、時(shí)延計(jì)算模塊,用于根據(jù)光業(yè)務(wù)單元所承載的業(yè)務(wù)的時(shí)延敏感性參數(shù),計(jì)算光業(yè)務(wù)單元的時(shí)延參數(shù);
34、方程確定模塊,用于基于所述負(fù)載參數(shù)和時(shí)延參數(shù),確定所述光業(yè)務(wù)單元在當(dāng)前網(wǎng)絡(luò)狀態(tài)下的復(fù)制動(dòng)態(tài)方程;
35、求解模塊,用于基于q學(xué)習(xí)方法求解所述復(fù)制動(dòng)態(tài)方程,確定按照時(shí)延優(yōu)化策略調(diào)度業(yè)務(wù)的時(shí)延權(quán)重參數(shù),以及按照負(fù)載均衡策略調(diào)度業(yè)務(wù)的負(fù)載權(quán)重參數(shù);
36、調(diào)度模塊,用于按照所述時(shí)延優(yōu)化策略及相應(yīng)的時(shí)延權(quán)重參數(shù)、按照所述負(fù)載均衡策略及相應(yīng)的負(fù)載權(quán)重參數(shù)調(diào)度業(yè)務(wù)。
37、可選的,所述方程確定模塊,用于根據(jù)所述負(fù)載參數(shù),按照預(yù)設(shè)的負(fù)載收益函數(shù)確定負(fù)載均衡收益;根據(jù)所述時(shí)延參數(shù),按照預(yù)設(shè)的時(shí)延收益函數(shù)確定時(shí)延收益;根據(jù)所述負(fù)載均衡收益和時(shí)延收益,確定所述復(fù)制動(dòng)態(tài)方程。
38、可選的,所述負(fù)載收益函數(shù)為:
39、ul(si)=-mean(l(si))/s?????????????????(3)
40、其中,l(si)為光業(yè)務(wù)單元si的負(fù)載參數(shù),s為歸一化因子,mean()為均值函數(shù);
41、所述時(shí)延收益函數(shù)為:
42、ud(si)=-d(si)???????????????????????(4)
43、其中,d(si)為光業(yè)務(wù)單元si的時(shí)延參數(shù);
44、所述復(fù)制動(dòng)態(tài)方程為:
45、
46、其中,復(fù)制動(dòng)態(tài)方程的穩(wěn)定點(diǎn)對應(yīng)的χd、χl分別為所述時(shí)延權(quán)重參數(shù)和負(fù)載權(quán)重參數(shù),為平均收益,計(jì)算方法為:
47、
48、其中,ud(sd)為執(zhí)行時(shí)延優(yōu)化策略獲得的收益,ul(sl)為執(zhí)行負(fù)載均衡策略的收益。
49、可選的,所述求解模塊,用于以所述當(dāng)前網(wǎng)絡(luò)狀態(tài)為當(dāng)前狀態(tài),以選取所述時(shí)延優(yōu)化策略或負(fù)載均衡策略為動(dòng)作,執(zhí)行選取的策略之后按照預(yù)設(shè)的獎(jiǎng)勵(lì)函數(shù)計(jì)算獎(jiǎng)勵(lì)值;根據(jù)該獎(jiǎng)勵(lì)值按照預(yù)設(shè)的q值更新方法更新q值,直至得到q值最大值,將q值最大值對應(yīng)的χd、χl作為復(fù)制動(dòng)態(tài)方程的穩(wěn)定點(diǎn)。
50、可選的,所述獎(jiǎng)勵(lì)函數(shù)為:
51、r=χd×ud(si)+χl×ul(si)??????????????????(13)
52、所述q值更新方法為:
53、
54、其中,η為學(xué)習(xí)率,γ為折扣因子,r為在狀態(tài)s下執(zhí)行動(dòng)作a獲得的獎(jiǎng)勵(lì)值,q(s,a)為在狀態(tài)s下執(zhí)行動(dòng)作a得到的q值,s′為執(zhí)行動(dòng)作a后的新狀態(tài),a′為新狀態(tài)下執(zhí)行的動(dòng)作,為在新狀態(tài)s′下執(zhí)行動(dòng)作a′得到的最大q值。
55、從上面所述可以看出,本技術(shù)實(shí)施例提供的細(xì)粒度光網(wǎng)絡(luò)數(shù)據(jù)調(diào)度方法及裝置,根據(jù)光業(yè)務(wù)單元所承載的業(yè)務(wù)的算力需求,計(jì)算光業(yè)務(wù)單元的負(fù)載參數(shù),根據(jù)光業(yè)務(wù)單元所承載的業(yè)務(wù)的時(shí)延敏感性參數(shù),計(jì)算光業(yè)務(wù)單元的時(shí)延參數(shù),基于負(fù)載參數(shù)和時(shí)延參數(shù),確定光業(yè)務(wù)單元在當(dāng)前網(wǎng)絡(luò)狀態(tài)下的復(fù)制動(dòng)態(tài)方程,基于q學(xué)習(xí)方法求解復(fù)制動(dòng)態(tài)方程,確定按照時(shí)延優(yōu)化策略調(diào)度業(yè)務(wù)的時(shí)延權(quán)重參數(shù),及按照負(fù)載均衡策略調(diào)度業(yè)務(wù)的負(fù)載權(quán)重參數(shù);按照時(shí)延優(yōu)化策略及相應(yīng)的時(shí)延權(quán)重參數(shù)、按照負(fù)載均衡策略及相應(yīng)的負(fù)載權(quán)重參數(shù)調(diào)度業(yè)務(wù)。本技術(shù)能夠?qū)崿F(xiàn)不同顆粒度業(yè)務(wù)的優(yōu)化合理調(diào)度,滿足不同業(yè)務(wù)的需求,提高資源利用率和系統(tǒng)性能。