本發(fā)明涉及標書文件檢測的,尤其涉及一種標書文件檢測方法、裝置、電子設備和存儲介質。
背景技術:
1、在傳統(tǒng)的招投標過程中,標書文件的檢測是一個至關重要的環(huán)節(jié),它確保了投標文件的規(guī)范性和一致性,從而保障了招投標過程的公平性和透明度。然而,現(xiàn)有的標書文件檢測方法主要依賴于人工審核。存在效率低下、易出錯、難以標準化審核等問題。公開號為cn?117764039?a的中國發(fā)明專利,公開了基于大模型的投標文件生成方法、系統(tǒng)、終端及存儲介質,其方案雖利用大模型實施標書檢測,但其檢測策略基于相同標準實施,對標書檢測和修改存在冗余處理。
2、因此,標書文件檢測亟需一種自動化、高效、準確的解決方案,以提高招投標文件審核的效率和準確性,確保審核過程的標準化和一致性。
技術實現(xiàn)思路
1、鑒于上述技術問題,本發(fā)明提供的一種標書文件檢測方法、裝置、電子設備和存儲介質,能夠兼顧標書文件檢測的效率和準確性。
2、本發(fā)明實施例提供了以下方案:
3、第一方面,本發(fā)明實施例提供了一種標書文件檢測方法,方法包括:
4、構建標書文件的文件規(guī)范庫,其中,文件規(guī)范庫為已投標書中不同文件的投標規(guī)范所組成的數(shù)據(jù)庫;
5、對文件規(guī)范庫中各投標規(guī)范的重要度進行量化處理,以獲得所有投標規(guī)范的規(guī)范權重;
6、根據(jù)所有文件的投標規(guī)范和對應的規(guī)范權重對預設的文件檢測模型進行訓練,以獲得目標檢測模型;
7、將待投標書的目標文件輸入目標檢測模型,根據(jù)目標檢測模型的輸出結果確定目標文件的規(guī)范檢測結果。
8、在一種可選的實施例中,對文件規(guī)范庫中各投標規(guī)范的重要度進行量化處理,以獲得所有投標規(guī)范的規(guī)范權重,包括:
9、根據(jù)標書評分標準對文件規(guī)范庫中每個投標規(guī)范進行信息熵計算,以獲得每個投標規(guī)范的信息熵;
10、根據(jù)每個投標規(guī)范的信息熵,確定每個投標規(guī)范的規(guī)范權重。
11、在一種可選的實施例中,構建標書文件的文件規(guī)范庫,包括:
12、對已投標書進行格式特征提取,以獲得已投標書的格式規(guī)范;
13、根據(jù)所有格式規(guī)范中各格式規(guī)范之間的相似性進行布爾運算處理,并將處理結果所構建的數(shù)據(jù)庫確定為文件規(guī)范庫。
14、在一種可選的實施例中,根據(jù)所有格式規(guī)范中各格式規(guī)范之間的相似性進行布爾運算處理,并將處理結果所構建的數(shù)據(jù)庫確定為文件規(guī)范庫,包括:
15、根據(jù)所有格式規(guī)范之間的相似性進行規(guī)范類別劃分,以獲得多個規(guī)范集合;
16、對相同類別的規(guī)范集合進行交集運算處理和并集運算處理,以獲得交集運算處理的第一處理結果和并集運算處理的第二處理結果;
17、根據(jù)第一處理結果和第二處理結果更新相同類別規(guī)范集合中的格式規(guī)范,以增大該類別格式規(guī)范的規(guī)范項數(shù)量和規(guī)范覆蓋范圍;
18、將完成更新的規(guī)范集合確定為該類別格式規(guī)范的目標集合,并將所有目標集合所構建的數(shù)據(jù)庫確定為文件規(guī)范庫。
19、在一種可選的實施例中,文件檢測模型包括cnn模型和rnn模型;根據(jù)所有文件的投標規(guī)范和對應的規(guī)范權重對預設的文件檢測模型進行訓練,以獲得目標檢測模型,包括:
20、根據(jù)所有文件的投標規(guī)范和對應的規(guī)范權重,構建圖像訓練集、圖像驗證集、文本訓練集和文本驗證集;
21、根據(jù)圖像訓練集和圖像驗證集分別對cnn模型進行訓練和驗證,直至cnn模型達到訓練的第一預設條件;
22、根據(jù)文本訓練集和文本驗證集分別對rnn模型進行訓練和驗證,直至rnn模型達到訓練的第二預設條件;
23、將達到第一預設條件的cnn模型和達到第二預設條件的rnn模型所構建的檢測模型,確定為目標檢測模型。
24、在一種可選的實施例中,目標檢測模型包括完成訓練的cnn模型和rnn模型;將待投標書的目標文件輸入目標檢測模型,根據(jù)目標檢測模型的輸出結果確定目標文件的規(guī)范檢測結果,包括:
25、將目標文件劃分為待檢測的圖像特征和文本特征;
26、將圖像特征和文本特征分別輸入完成訓練的cnn模型和rnn模型,以獲得目標文件的格式檢測結果;
27、根據(jù)貝葉斯模型對格式檢測結果進行置信度評估,以獲得評估結果;
28、在評估結果未達到目標置信度時,更新目標檢測模型的模型參數(shù)并重新檢測,直至評估結果達到目標置信度;
29、在評估結果達到目標置信度時,根據(jù)格式檢測結果輸出目標文件的規(guī)范檢測結果。
30、在一種可選的實施例中,根據(jù)格式檢測結果輸出目標文件的規(guī)范檢測結果,包括:
31、將格式檢測結果輸入語言處理模型,并根據(jù)語言處理模型所輸出的檢測報告獲得規(guī)范檢測結果,其中,檢測報告包括格式檢測結果所表征的異常格式位置、異常格式類型、異常格式的嚴重程度和調整建議。
32、第二方面,本發(fā)明實施例還提供了一種標書文件檢測裝置,裝置包括:
33、構建模塊,用于構建標書文件的文件規(guī)范庫,其中,文件規(guī)范庫為已投標書中不同文件的投標規(guī)范所組成的數(shù)據(jù)庫;
34、處理模塊,用于對文件規(guī)范庫中各投標規(guī)范的重要度進行量化處理,以獲得所有投標規(guī)范的規(guī)范權重;
35、訓練獲得模塊,用于根據(jù)所有文件的投標規(guī)范和對應的規(guī)范權重對預設的文件檢測模型進行訓練,以獲得目標檢測模型;
36、檢測模塊,用于將待投標書的目標文件輸入目標檢測模型,根據(jù)目標檢測模型的輸出結果確定目標文件的規(guī)范檢測結果。
37、第三方面,本發(fā)明實施例還提供了一種電子設備,包括處理器和存儲器,存儲器耦接到處理器,存儲器存儲指令,當指令由處理器執(zhí)行時使電子設備執(zhí)行第一方面中任一項方法的步驟。
38、第四方面,本發(fā)明實施例還提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)第一方面中任一項方法的步驟。
39、本發(fā)明的一種標書文件檢測方法、裝置、電子設備和存儲介質與現(xiàn)有技術相比,具有以下優(yōu)點:
40、本發(fā)明的技術方案通過構建標書文件的文件規(guī)范庫,由于文件規(guī)范庫為已投標書中不同文件的投標規(guī)范所組成的數(shù)據(jù)庫,可以對文件規(guī)范庫中各投標規(guī)范的重要度進行量化處理,以獲得所有投標規(guī)范的規(guī)范權重;根據(jù)所有文件的投標規(guī)范和對應的規(guī)范權重對預設的文件檢測模型進行訓練,以獲得目標檢測模型;將待投標書的目標文件輸入目標檢測模型,根據(jù)目標檢測模型的輸出結果確定目標文件的規(guī)范檢測結果。該技術方案對不同的投標規(guī)范實施權重配置,可以使目標檢測模型在實施目標文件的檢測時突出關鍵規(guī)范的檢測,減小所有投標規(guī)范在相同檢測標準下的檢測偏差和冗余,進而兼顧了標書文件檢測的效率和準確性。
1.一種標書文件檢測方法,其特征在于,所述方法包括:
2.根據(jù)權利要求1所述的標書文件檢測方法,其特征在于,所述對所述文件規(guī)范庫中各投標規(guī)范的重要度進行量化處理,以獲得所有投標規(guī)范的規(guī)范權重,包括:
3.根據(jù)權利要求1所述的標書文件檢測方法,其特征在于,所述構建標書文件的文件規(guī)范庫,包括:
4.根據(jù)權利要求3所述的標書文件檢測方法,其特征在于,所述根據(jù)所有格式規(guī)范中各格式規(guī)范之間的相似性進行布爾運算處理,并將處理結果所構建的數(shù)據(jù)庫確定為所述文件規(guī)范庫,包括:
5.根據(jù)權利要求1所述的標書文件檢測方法,其特征在于,所述文件檢測模型包括cnn模型和rnn模型;所述根據(jù)所有文件的投標規(guī)范和對應的規(guī)范權重對預設的文件檢測模型進行訓練,以獲得目標檢測模型,包括:
6.根據(jù)權利要求1所述的標書文件檢測方法,其特征在于,所述目標檢測模型包括完成訓練的cnn模型和rnn模型;所述將待投標書的目標文件輸入所述目標檢測模型,根據(jù)所述目標檢測模型的輸出結果確定所述目標文件的規(guī)范檢測結果,包括:
7.根據(jù)權利要求6所述的標書文件檢測方法,其特征在于,所述根據(jù)所述格式檢測結果輸出所述目標文件的規(guī)范檢測結果,包括:
8.一種標書文件檢測裝置,其特征在于,所述裝置包括:
9.一種電子設備,其特征在于,包括處理器和存儲器,所述存儲器耦接到所述處理器,所述存儲器存儲指令,當所述指令由所述處理器執(zhí)行時使所述電子設備執(zhí)行權利要求1-7中任一項所述方法的步驟。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)權利要求1-7中任一項所述方法的步驟。