本技術(shù)涉及計(jì)算機(jī),具體涉及智能交通和自動駕駛等,特別涉及一種無人車調(diào)度的方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、通常,無人車應(yīng)用于物流、安防等場景時,需要調(diào)度并控制無人車從轉(zhuǎn)運(yùn)中心出發(fā),途徑各個末端服務(wù)站點(diǎn)后,再返回轉(zhuǎn)運(yùn)中心完成相關(guān)服務(wù)。該無人車調(diào)度問題可以歸納為旅行商問題(travelingsalesmanproblem,tsp),這是一個經(jīng)典的組合優(yōu)化問題。
2、目前,常見的tsp問題求解方法包括動態(tài)規(guī)劃、遺傳算法等。但相關(guān)技術(shù)的方案難以兼顧求解精度和計(jì)算效率,從而無法有效地優(yōu)化對無人車調(diào)度控制,以保證無人車運(yùn)行的可靠性。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)提供了一種無人車調(diào)度的方法、裝置、設(shè)備及存儲介質(zhì),優(yōu)化了對無人車調(diào)度控制,保證了無人車運(yùn)行的可靠性,所述技術(shù)方案如下:
2、第一方面,提供了一種無人車調(diào)度的方法,所述方法包括:
3、獲取預(yù)先構(gòu)建的指定區(qū)域的連通圖;所述連通圖包括與服務(wù)站點(diǎn)對應(yīng)的節(jié)點(diǎn)、以及與所述服務(wù)站點(diǎn)間轉(zhuǎn)移的動作對應(yīng)的邊;
4、基于初始動作價值函數(shù)和所述連通圖,利用預(yù)設(shè)的交叉檢測規(guī)則,獲得當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊與至少一個歷史采樣節(jié)點(diǎn)對應(yīng)的邊之間的交叉情況;
5、基于預(yù)設(shè)的邊權(quán)值獎勵函數(shù)和所述交叉情況,確定每個當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的獎勵函數(shù)值;
6、基于所述每個當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的獎勵函數(shù)值,對所述初始動作價值函數(shù)進(jìn)行迭代優(yōu)化處理,以獲得目標(biāo)調(diào)度信息;
7、基于目標(biāo)調(diào)度信息,獲得無人車的服務(wù)調(diào)度信息,以基于所述服務(wù)調(diào)度信息,控制所述無人車在所述指定區(qū)域內(nèi)進(jìn)行服務(wù)。
8、在一種可能的實(shí)現(xiàn)方式中,所述獲取預(yù)先構(gòu)建的指定區(qū)域的連通圖之前,包括:
9、獲取指定區(qū)域的地圖信息和服務(wù)站點(diǎn);其中,所述地圖信息包括道路信息和路況信息,所述服務(wù)站點(diǎn)包括中心站點(diǎn)和多個末端站點(diǎn);
10、基于所述服務(wù)站點(diǎn)、道路信息和路況信息,確定節(jié)點(diǎn)和所述節(jié)點(diǎn)間的邊的權(quán)重值;
11、基于所述節(jié)點(diǎn)和所述節(jié)點(diǎn)間的邊的權(quán)重值,構(gòu)建所述指定區(qū)域的連通圖。
12、在一種可能的實(shí)現(xiàn)方式中,所述基于初始動作價值函數(shù)和所述連通圖,利用預(yù)設(shè)的交叉檢測規(guī)則,獲得當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊與至少一個歷史采樣節(jié)點(diǎn)對應(yīng)的邊之間的交叉情況,包括:
13、基于初始動作價值函數(shù)和所述連通圖,按照預(yù)設(shè)的探索率,對所述連通圖的節(jié)點(diǎn)進(jìn)行采樣處理,得到多個采樣節(jié)點(diǎn);
14、針對每個當(dāng)前采樣節(jié)點(diǎn),執(zhí)行如下操作:確定當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊、以及所述當(dāng)前采樣節(jié)點(diǎn)之前的至少一個歷史采樣節(jié)點(diǎn)對應(yīng)的邊;
15、利用預(yù)設(shè)的交叉檢測規(guī)則,對所述當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊分別與每個歷史采樣節(jié)點(diǎn)對應(yīng)的邊進(jìn)行交叉檢測處理;
16、基于所述交叉檢測處理的結(jié)果,獲得當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊與至少一個歷史采樣節(jié)點(diǎn)對應(yīng)的邊之間的交叉情況。
17、在一種可能的實(shí)現(xiàn)方式中,所述利用預(yù)設(shè)的交叉檢測規(guī)則,對所述當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊分別與每個歷史采樣節(jié)點(diǎn)對應(yīng)的邊進(jìn)行交叉檢測處理,包括:
18、針對每個歷史采樣節(jié)點(diǎn)對應(yīng)的邊,執(zhí)行如下操作:
19、確定所述當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的向量、歷史采樣節(jié)點(diǎn)對應(yīng)的邊的向量、以及當(dāng)前采樣節(jié)點(diǎn)到歷史采樣節(jié)點(diǎn)的邊的向量;
20、對所述當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的向量和歷史采樣節(jié)點(diǎn)對應(yīng)的邊的向量進(jìn)行叉乘處理,得到第一叉乘結(jié)果;
21、對所述當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的向量和當(dāng)前采樣節(jié)點(diǎn)到歷史采樣節(jié)點(diǎn)的邊的向量進(jìn)行叉乘處理,得到第二叉乘結(jié)果;
22、基于預(yù)設(shè)的交叉條件、所述第一叉乘結(jié)果和所述第二叉乘結(jié)果,獲得交叉檢測處理的結(jié)果。
23、在一種可能的實(shí)現(xiàn)方式中,所述交叉情況包括存在交叉和不存在交叉,所述基于預(yù)設(shè)的邊權(quán)值獎勵函數(shù)和所述交叉情況,確定每個當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的獎勵函數(shù)值,包括:
24、響應(yīng)于所述交叉情況為存在交叉,基于預(yù)設(shè)的邊權(quán)值獎勵函數(shù)和預(yù)設(shè)的邊交叉獎勵函數(shù),確定所述當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的第一獎勵函數(shù)值;
25、響應(yīng)于所述交叉情況為不存在交叉,基于預(yù)設(shè)的邊權(quán)值獎勵函數(shù),確定所述當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的第二獎勵函數(shù)值;
26、基于所述第一獎勵函數(shù)值和第二獎勵函數(shù)值,確定每個當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的獎勵函數(shù)值。
27、在一種可能的實(shí)現(xiàn)方式中,所述基于所述每個當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的獎勵函數(shù)值,對所述初始動作價值函數(shù)進(jìn)行迭代優(yōu)化處理,以獲得目標(biāo)調(diào)度信息,包括:
28、基于所述每個當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的獎勵函數(shù)值和所述每個當(dāng)前采樣節(jié)點(diǎn),對所述初始動作價值函數(shù)進(jìn)行迭代優(yōu)化處理;
29、響應(yīng)于迭代優(yōu)化處理的結(jié)果滿足預(yù)設(shè)的收斂條件,得到目標(biāo)調(diào)度信息。
30、第二方面,提供了一種無人車調(diào)度的裝置,所述裝置包括:
31、獲取單元,用于獲取預(yù)先構(gòu)建的指定區(qū)域的連通圖;所述連通圖包括與服務(wù)站點(diǎn)對應(yīng)的節(jié)點(diǎn)、以及與所述服務(wù)站點(diǎn)間轉(zhuǎn)移的動作對應(yīng)的邊;
32、檢測單元,用于基于初始動作價值函數(shù)和所述連通圖,利用預(yù)設(shè)的交叉檢測規(guī)則,獲得當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊與至少一個歷史采樣節(jié)點(diǎn)對應(yīng)的邊之間的交叉情況;
33、確定單元,用于基于預(yù)設(shè)的邊權(quán)值獎勵函數(shù)和所述交叉情況,確定每個當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的獎勵函數(shù);
34、優(yōu)化單元,用于基于所述每個當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的獎勵函數(shù),對所述初始動作價值函數(shù)進(jìn)行迭代優(yōu)化處理,以獲得目標(biāo)調(diào)度信息;
35、調(diào)度單元,用于基于目標(biāo)調(diào)度信息,獲得無人車的服務(wù)調(diào)度信息,以基于所述服務(wù)調(diào)度信息,控制所述無人車在所述指定區(qū)域內(nèi)進(jìn)行服務(wù)。
36、第三方面,提供了一種計(jì)算機(jī)可讀存儲介質(zhì),所述存儲介質(zhì)中存儲有至少一條指令,所述至少一條指令由處理器加載并執(zhí)行以實(shí)現(xiàn)如上所述的方面和任一可能的實(shí)現(xiàn)方式的方法。
37、第四方面,提供了一種電子設(shè)備,包括:
38、至少一個處理器;以及
39、與所述至少一個處理器通信連接的存儲器;其中,
40、所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行如上所述的方面和任一可能的實(shí)現(xiàn)方式的方法。
41、第五方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時實(shí)現(xiàn)如上所述的方面和任一可能的實(shí)現(xiàn)方式的方法。
42、第六方面,提供了一種自動駕駛車輛,包括如上所述的電子設(shè)備。
43、本技術(shù)提供的技術(shù)方案的有益效果至少包括:
44、由上述技術(shù)方案可知,本技術(shù)實(shí)施例可以通過獲取預(yù)先構(gòu)建的指定區(qū)域的連通圖,進(jìn)而可以基于初始動作價值函數(shù)和所述連通圖,利用預(yù)設(shè)的交叉檢測規(guī)則,獲得當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊與至少一個歷史采樣節(jié)點(diǎn)對應(yīng)的邊之間的交叉情況,基于預(yù)設(shè)的邊權(quán)值獎勵函數(shù)和所述交叉情況,確定每個當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的獎勵函數(shù)值,基于所述每個當(dāng)前采樣節(jié)點(diǎn)對應(yīng)的邊的獎勵函數(shù)值,對所述初始動作價值函數(shù)進(jìn)行迭代優(yōu)化處理,以獲得目標(biāo)調(diào)度信息,基于目標(biāo)調(diào)度信息,獲得無人車的服務(wù)調(diào)度信息,以基于所述服務(wù)調(diào)度信息,控制所述無人車在所述指定區(qū)域內(nèi)進(jìn)行服務(wù),由于在基于連通圖搜索最優(yōu)調(diào)度策略的過程中,考慮到了對服務(wù)站點(diǎn)之間可能存在的路徑交叉的情況的檢測,可以在保證了優(yōu)化處理的計(jì)算效率的同時,還保證了最優(yōu)調(diào)度策略的可靠性,較好地協(xié)調(diào)了優(yōu)化效果和時間效率,從而保證了無人車服務(wù)運(yùn)行的可靠性。
45、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識本技術(shù)的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本技術(shù)的范圍。本技術(shù)的其它特征將通過以下的說明書而變得容易理解。