本申請涉及信息,尤其涉及一種基于粒子群優(yōu)化的駕駛決策規(guī)劃方法、設備、介質(zhì)及產(chǎn)品。
背景技術:
1、基于規(guī)則的決策:基于規(guī)則的決策方法依賴于預定義的一組規(guī)則或邏輯條件,根據(jù)這些規(guī)則來確定車輛的行為。該方法通常使用專家知識和經(jīng)驗來制定規(guī)則,以處理各種駕駛情境和突發(fā)情況。根據(jù)駕駛環(huán)境和交通法規(guī),設計一組規(guī)則。例如,保持車道、避免碰撞、遵守交通信號等。實時監(jiān)測車輛周圍的環(huán)境數(shù)據(jù)(如傳感器數(shù)據(jù)、地圖信息等),判斷是否滿足某個規(guī)則的觸發(fā)條件。一旦觸發(fā)某個規(guī)則,車輛執(zhí)行預定義的行為。例如,如果檢測到前方有障礙物,則減速或變道。
2、基于強化學習的決策:基于強化學習的決策方法通過讓智能體在模擬環(huán)境中進行大量的嘗試和學習,從而找出最佳的決策策略。智能體根據(jù)環(huán)境狀態(tài)選擇動作,并根據(jù)所獲得的獎勵進行學習和優(yōu)化。智能體(例如自動駕駛系統(tǒng))在環(huán)境中進行動作,環(huán)境返回新的狀態(tài)和獎勵。定義智能體所處的狀態(tài)(如車輛位置、速度、周圍車輛信息等)和可以采取的動作(如加速、減速、變道等)。設計獎勵函數(shù),根據(jù)智能體的動作對其進行獎勵或懲罰。例如,安全駕駛、節(jié)能駕駛等。使用強化學習算法(如q-learning、深度q網(wǎng)絡dqn等)不斷優(yōu)化策略,使得智能體在長期內(nèi)獲得最大的累積獎勵。
3、基于歷史數(shù)據(jù)的決策:基于歷史數(shù)據(jù)的決策方法通過分析和利用大量的歷史駕駛數(shù)據(jù),預測未來的駕駛情境并進行決策。該方法通常結(jié)合統(tǒng)計模型、機器學習算法和數(shù)據(jù)挖掘技術。收集和存儲大量的歷史駕駛數(shù)據(jù),包括車輛行駛軌跡、交通狀況、駕駛行為等。從歷史數(shù)據(jù)中提取有用的特征,如交通流量模式、事故高發(fā)區(qū)域等。使用統(tǒng)計模型(如回歸分析、時間序列分析)或機器學習算法(如決策樹、神經(jīng)網(wǎng)絡)對數(shù)據(jù)進行訓練,建立預測模型。根據(jù)實時的環(huán)境數(shù)據(jù)和訓練好的模型,預測未來的駕駛情境,并生成相應的決策。
4、然而,發(fā)明人發(fā)現(xiàn)相關技術中至少存在如下技術問題:
5、當前的決策算法在應對局部交通狀況時反應不夠靈活,現(xiàn)有決策算法亦難以滿足需求。傳統(tǒng)的基于規(guī)則的決策方法對于復雜動態(tài)的交通環(huán)境,決策不夠靈活,且需要在各個場景下設計多種規(guī)則。基于強化學習的決策方法則需要大量的訓練數(shù)據(jù)和計算資源,訓練過程復雜。
技術實現(xiàn)思路
1、本申請的一個目的是提供一種基于粒子群優(yōu)化的駕駛決策規(guī)劃方法,至少用以解決如何在不需要大量數(shù)據(jù)資源的前提下,提高車輛面對局部交通反應的靈活度的問題。
2、為實現(xiàn)上述目的,本申請的一些實施例提供了以下幾個方面:
3、第一方面,本申請的一些實施例還提供了一種基于粒子群優(yōu)化的駕駛決策規(guī)劃方法,所述方法包括:
4、響應于到達預設條件,獲取當前車輛的車道級路徑和環(huán)境車的數(shù)據(jù)信息;
5、將所述當前車輛的車道級路徑和環(huán)境車的數(shù)據(jù)信息輸入到預設的粒子群優(yōu)化算法中,得到所述當前車輛的粗略軌跡;
6、基于所述粗略軌跡,獲取最終目標軌跡;
7、基于所述粗略軌跡有選擇性地將所述最終目標軌跡發(fā)送到預設終端。
8、第二方面,本申請的一些實施例還提供了一種電子設備,所述電子設備包括:一個或多個處理器;以及存儲有計算機程序指令的存儲器,所述計算機程序指令在被執(zhí)行時使所述處理器執(zhí)行如上所述方法的步驟。
9、第三方面,本申請的一些實施例還提供了一種計算機可讀介質(zhì),其上存儲有計算機程序指令,所述計算機程序指令可被處理器執(zhí)行以實現(xiàn)如上所述的方法。
10、第四方面,本申請的一些實施例還提供了一種計算機程序產(chǎn)品,包括計算機程序/指令,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)如上所述方法的步驟。
11、與相關技術相比,本申請實施例提供的方案中,響應于到達預設條件,獲取當前車輛的車道級路徑和環(huán)境車的數(shù)據(jù)信息;將所述當前車輛的車道級路徑和環(huán)境車的數(shù)據(jù)信息輸入到預設的粒子群優(yōu)化算法中,得到所述當前車輛的粗略軌跡;基于所述粗略軌跡,獲取最終目標軌跡;基于所述粗略軌跡有選擇性地將所述最終目標軌跡發(fā)送到預設終端。通過上述配置方式,本申請通過預設的粒子群優(yōu)化算法對所述當前車輛的車道級路徑和環(huán)境車的數(shù)據(jù)信息,來尋找局部最優(yōu)解,與歷史數(shù)據(jù)的決策方法相比,其不需要大量數(shù)據(jù)資源,通過實時數(shù)據(jù)對粗略軌跡進行計算,其靈活度高,能夠應對復雜動態(tài)的交通環(huán)境。
1.一種基于粒子群優(yōu)化的駕駛決策規(guī)劃方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的基于粒子群優(yōu)化的駕駛決策規(guī)劃方法,其特征在于,所述將所述當前車輛的車道級路徑和環(huán)境車的數(shù)據(jù)信息輸入到預設的粒子群優(yōu)化算法中,得到所述當前車輛的粗略軌跡,還包括:
3.根據(jù)權(quán)利要求2所述的基于粒子群優(yōu)化的駕駛決策規(guī)劃方法,其特征在于,還包括根據(jù)以下步驟對所述個體最優(yōu)解和群體最優(yōu)解進行更新迭代:
4.根據(jù)權(quán)利要求2所述的基于粒子群優(yōu)化的駕駛決策規(guī)劃方法,其特征在于,還包括:
5.根據(jù)權(quán)利要求2所述的基于粒子群優(yōu)化的駕駛決策規(guī)劃方法,其特征在于,還包括根據(jù)以下步驟構(gòu)建所述預設的適應度函數(shù):
6.根據(jù)權(quán)利要求1所述的基于粒子群優(yōu)化的駕駛決策規(guī)劃方法,其特征在于,所述基于所述粗略軌跡有選擇性地將所述最終目標軌跡發(fā)送到預設終端,包括:
7.根據(jù)權(quán)利要求1所述的基于粒子群優(yōu)化的駕駛決策規(guī)劃方法,其特征在于,還包括:
8.一種電子設備,其特征在于,所述電子設備包括:
9.一種計算機可讀介質(zhì),其上存儲有計算機程序/指令,其特征在于,所述計算機程序/指令被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至7中任意一項所述方法的步驟。
10.一種計算機程序產(chǎn)品,包括計算機程序/指令,其特征在于,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至7中任意一項所述方法的步驟。