本發(fā)明涉及一種函數(shù)優(yōu)化方法,特別是涉及一種基于大語言模型的sat求解器啟發(fā)式函數(shù)優(yōu)化方法,屬于函數(shù)優(yōu)化方法。
背景技術(shù):
1、國際sat研究社區(qū)每年都會組織sat比賽(satcompetition),它一個國際性的競賽,旨在推動sat求解器的發(fā)展以及與之相關(guān)的技術(shù)和方法的進步。這個比賽為研究者和開發(fā)者提供了一個平臺,用以展示他們的求解器性能,并且通過相互比較,提升各自技術(shù)的效率和效果。每年的比賽結(jié)果也在不斷變化,冠軍花落誰家一直都不是肯定的。
2、在工業(yè)實踐中,如軟件驗證領(lǐng)域使用sat求解器來驗證軟件中復雜的邏輯條件,確保軟件行為符合規(guī)格;在硬件設(shè)計和驗證中,可以利用sat求解技術(shù)來檢查電路設(shè)計的一致性和功能性;sat求解器也被用于密碼學領(lǐng)域,用于分析和攻擊加密算法。
3、對于不同的需求場景,sat求解器的開發(fā)也有不同的側(cè)重點,然而面對這些層出不窮的sat求解器,現(xiàn)有方法并不能做到普適地適應(yīng)各種sat實例,并且在方法的優(yōu)化上存在不小的難度和挑戰(zhàn)。通過大型語言模型(llm)進行代碼生成和改進的領(lǐng)域正在迅速發(fā)展。這一進展得益于近年來自然語言處理和機器學習技術(shù)的突破,特別是深度學習模型在理解和生成人類語言方面取得的巨大成就。llm,如gpt-4等,能夠基于龐大的訓練數(shù)據(jù)集生成高質(zhì)量的代碼,這些數(shù)據(jù)集涵蓋了各種編程語言、框架和代碼庫。因此,利用大語言模型在代碼生成和改進領(lǐng)域的優(yōu)勢,開發(fā)出一種可以普適地優(yōu)化各種sat求解器的方法是非常必要的。這種方法充分發(fā)揮大語言模型的優(yōu)勢,并結(jié)合合適的提示詞和評估方法的引導,可以高效地適用在不同的sat求解器上,并達到使其求解功能得到優(yōu)化的效果。
技術(shù)實現(xiàn)思路
1、本發(fā)明的主要目的是為了提供一種基于大語言模型的sat求解器啟發(fā)式函數(shù)優(yōu)化方法。
2、本發(fā)明的目的可以通過采用如下技術(shù)方案達到:
3、一種基于大語言模型的sat求解器啟發(fā)式函數(shù)優(yōu)化方法,包括如下步驟:
4、步驟一:大語言模型分析sat求解器源碼,提取其中進行優(yōu)化的啟發(fā)式函數(shù);
5、步驟二:根據(jù)制定好的啟發(fā)式函數(shù)選擇策略,選擇本次步驟中進行優(yōu)化的啟發(fā)式函數(shù);
6、步驟三:獲取待優(yōu)化的原始啟發(fā)式函數(shù),訓練集和驗證集,確定實驗參數(shù);
7、步驟四:初始化代碼數(shù)據(jù)庫,在驗證集上運行原始sat求解器,初始化分數(shù)表和分數(shù);
8、步驟五:生成提示詞,提供給大語言模型并獲得大語言模型的反饋;
9、步驟六:提取反饋中的新啟發(fā)式函數(shù),構(gòu)造新sat求解器,編譯通過則更新代碼數(shù)據(jù)庫并進入下一步,否則返回步驟五;
10、步驟七:完成訓練集測試,獲得新sat求解器在訓練集上的分數(shù),與分數(shù)表對應(yīng)條目的分數(shù)做比較,若分數(shù)更高則進入下一步,否則返回步驟五;
11、步驟八:完成驗證集測試,獲得新sat求解器在驗證集上的分數(shù),與分數(shù)表做比較,若分數(shù)更高則進入下一步,否則返回步驟五;
12、步驟九:更新分數(shù)表及分數(shù),重復步驟五-步驟九,直到達到樣本數(shù)限制后進入下一步;
13、步驟十:獲得性能更優(yōu)的sat求解器,完成測試集測試,評估新sat求解器性能,并確定下一階段的超時閾值。
14、優(yōu)選的,步驟一中大語言模型分析sat求解器源碼,提取其中可能進行優(yōu)化的啟發(fā)式函數(shù),所述啟發(fā)式函數(shù)可能包括變量碰撞處理,重啟操作。
15、優(yōu)選的,步驟二根據(jù)制定好的啟發(fā)式函數(shù)選擇策略,選擇本次步驟中進行優(yōu)化的啟發(fā)式函數(shù),所述啟發(fā)式函數(shù)選擇策略會根據(jù)當前優(yōu)化階段選擇函數(shù),或待選函數(shù)交替優(yōu)化。
16、優(yōu)選的,步驟三獲取待優(yōu)化的原始啟發(fā)式函數(shù),準備訓練集和驗證集,確定實驗參數(shù),所述訓練集是所述驗證集的真子集;
17、所述實驗參數(shù)包括測試sat求解器的超時閾值、本次樣本數(shù)限制。
18、優(yōu)選的,步驟四初始化代碼數(shù)據(jù)庫,在驗證集上運行原始sat求解器,初始化分數(shù)表和分數(shù),所述代碼數(shù)據(jù)庫,用于記錄生成的合法函數(shù);
19、所述分數(shù)表是驗證集所有實例在超時閾值內(nèi)的完成情況,完成則計為true,未完成則計為false;
20、所述分數(shù)是驗證集所有實例在超時閾值內(nèi)的完成數(shù)量。
21、優(yōu)選的,步驟五生成提示詞,提供給大語言模型,并獲得大語言模型的反饋,所述提示詞包括用戶給出的對原始啟發(fā)式函數(shù)的描述和來自代碼數(shù)據(jù)庫的代碼示例;
22、所述反饋包括大語言模型給出的更新后的啟發(fā)式函數(shù)和對新函數(shù)的描述。
23、優(yōu)選的,步驟六提取反饋中的新啟發(fā)式函數(shù),構(gòu)造新sat求解器,編譯通過則更新代碼數(shù)據(jù)庫并進入下一步,否則返回步驟五,所述更新代碼數(shù)據(jù)庫包括將合法函數(shù)加入代碼數(shù)據(jù)庫,并在下一次生成提示詞時加入。
24、優(yōu)選的,步驟七完成訓練集測試,獲得新sat求解器在訓練集上的分數(shù),與分數(shù)表對應(yīng)條目的分數(shù)做比較,若分數(shù)更高則進入下一步,否則返回步驟五,所述分數(shù)表對應(yīng)條目的分數(shù)指當前訓練集在分數(shù)表中結(jié)果為true的總數(shù)。
25、優(yōu)選的,步驟八完成驗證集測試,獲得新sat求解器在驗證集上的分數(shù),與分數(shù)表做比較,若分數(shù)更高則進入下一步,否則返回步驟五。
26、優(yōu)選的,步驟九更新分數(shù)表及分數(shù),重復步驟五-步驟九,直到達到樣本數(shù)限制后進入下一步,所述樣本數(shù)限指本次試驗中設(shè)置的最大樣本數(shù),當生成的函數(shù)達到這個閾值后,本次優(yōu)化結(jié)束;
27、步驟十獲得性能更優(yōu)的sat求解器,完成測試集測試,評估新sat求解器性能,并確定下一階段的超時閾值,所述下一階段超時閾值指基于課程學習的思想,在這一階段的優(yōu)化完成后,擴大測試的超時閾值,以在更復雜的問題規(guī)模上獲得性能更優(yōu)的sat求解器。
28、本發(fā)明的有益技術(shù)效果:
29、本發(fā)明提供的一種基于大語言模型的sat求解器啟發(fā)式函數(shù)優(yōu)化方法,本發(fā)明充分利用了大語言模型在代碼生成方面的優(yōu)勢,并使用恰當?shù)姆绞缴商崾驹~,以激發(fā)大語言模型優(yōu)化啟發(fā)式函數(shù)的潛力。
30、本發(fā)明通過基于課程學習的方式,以超時閾值來劃分實驗階段,逐步優(yōu)化sat求解器,以確保在每一個階段都獲得更優(yōu)解法,從而使求解器適應(yīng)不同規(guī)模和復雜度的sat問題。
31、本發(fā)明通過結(jié)合訓練集和驗證集的方式引導大語言模型生成更優(yōu)的啟發(fā)式函數(shù),提高了sat求解器的優(yōu)化效率,同時改善了其泛化能力。
1.一種基于大語言模型的sat求解器啟發(fā)式函數(shù)優(yōu)化方法,其特征在于:包括如下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于大語言模型的sat求解器啟發(fā)式函數(shù)優(yōu)化方法,其特征在于:步驟一中大語言模型分析sat求解器源碼,提取其中可能進行優(yōu)化的啟發(fā)式函數(shù),所述啟發(fā)式函數(shù)可能包括變量碰撞處理,重啟操作。
3.根據(jù)權(quán)利要求2所述的一種基于大語言模型的sat求解器啟發(fā)式函數(shù)優(yōu)化方法,其特征在于:步驟二根據(jù)制定好的啟發(fā)式函數(shù)選擇策略,選擇本次步驟中進行優(yōu)化的啟發(fā)式函數(shù),所述啟發(fā)式函數(shù)選擇策略會根據(jù)當前優(yōu)化階段選擇函數(shù),或待選函數(shù)交替優(yōu)化。
4.根據(jù)權(quán)利要求3所述的一種基于大語言模型的sat求解器啟發(fā)式函數(shù)優(yōu)化方法,其特征在于:步驟三獲取待優(yōu)化的原始啟發(fā)式函數(shù),準備訓練集和驗證集,確定實驗參數(shù),所述訓練集是所述驗證集的真子集;
5.根據(jù)權(quán)利要求4所述的一種基于大語言模型的sat求解器啟發(fā)式函數(shù)優(yōu)化方法,其特征在于:步驟四初始化代碼數(shù)據(jù)庫,在驗證集上運行原始sat求解器,初始化分數(shù)表和分數(shù),所述代碼數(shù)據(jù)庫,用于記錄生成的合法函數(shù);
6.根據(jù)權(quán)利要求5所述的一種基于大語言模型的sat求解器啟發(fā)式函數(shù)優(yōu)化方法,其特征在于:步驟五生成提示詞,提供給大語言模型,并獲得大語言模型的反饋,所述提示詞包括用戶給出的對原始啟發(fā)式函數(shù)的描述和來自代碼數(shù)據(jù)庫的代碼示例;
7.根據(jù)權(quán)利要求6所述的一種基于大語言模型的sat求解器啟發(fā)式函數(shù)優(yōu)化方法,其特征在于:步驟六提取反饋中的新啟發(fā)式函數(shù),構(gòu)造新sat求解器,編譯通過則更新代碼數(shù)據(jù)庫并進入下一步,否則返回步驟五,所述更新代碼數(shù)據(jù)庫包括將合法函數(shù)加入代碼數(shù)據(jù)庫,并在下一次生成提示詞時加入。
8.根據(jù)權(quán)利要求7所述的一種基于大語言模型的sat求解器啟發(fā)式函數(shù)優(yōu)化方法,其特征在于:步驟七完成訓練集測試,獲得新sat求解器在訓練集上的分數(shù),與分數(shù)表對應(yīng)條目的分數(shù)做比較,若分數(shù)更高則進入下一步,否則返回步驟五,所述分數(shù)表對應(yīng)條目的分數(shù)指當前訓練集在分數(shù)表中結(jié)果為true的總數(shù)。
9.根據(jù)權(quán)利要求8所述的一種基于大語言模型的sat求解器啟發(fā)式函數(shù)優(yōu)化方法,其特征在于:步驟八完成驗證集測試,獲得新sat求解器在驗證集上的分數(shù),與分數(shù)表做比較,若分數(shù)更高則進入下一步,否則返回步驟五。
10.根據(jù)權(quán)利要求9所述的一種基于大語言模型的sat求解器啟發(fā)式函數(shù)優(yōu)化方法,其特征在于:步驟九更新分數(shù)表及分數(shù),重復步驟五-步驟九,直到達到樣本數(shù)限制后進入下一步,所述樣本數(shù)限指本次試驗中設(shè)置的最大樣本數(shù),當生成的函數(shù)達到這個閾值后,本次優(yōu)化結(jié)束;