欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

結(jié)構(gòu)化查詢語言生成方法、裝置、電子設(shè)備及存儲介質(zhì)與流程

文檔序號:40552807發(fā)布日期:2025-01-03 11:12閱讀:10來源:國知局
結(jié)構(gòu)化查詢語言生成方法、裝置、電子設(shè)備及存儲介質(zhì)與流程

本發(fā)明涉及數(shù)據(jù)處理,尤其涉及一種結(jié)構(gòu)化查詢語言生成方法、裝置、電子設(shè)備及存儲介質(zhì)。


背景技術(shù):

1、智能問數(shù)旨在幫助用戶方便快捷地查找數(shù)據(jù)。一個智能問數(shù)系統(tǒng)的核心模塊是text-to-sql模塊,其作用是使用算法模型將自然語言轉(zhuǎn)換為對應(yīng)的sql(structuredquery?language,結(jié)構(gòu)化查詢語言)語句。通過這種方式,用戶無需具備專業(yè)的sql知識,也不需要手動編寫復(fù)雜的sql語句,就能直接查詢底層數(shù)據(jù)庫,從而大大降低了數(shù)據(jù)查詢的門檻。

2、目前,常規(guī)text-to-sql方法流程在使用算法模型生成了sql語句之后,需要人工對生成的sql語句中含編碼的字段做映射,將中文語義轉(zhuǎn)換為特定的數(shù)字編碼,從而最終生成數(shù)據(jù)庫能夠直接執(zhí)行的sql查詢語句。這種人工完成映射過程的方式,不僅效率較低,而且由于涉及諸多映射規(guī)則,工作量大且容易出錯。

3、因此,亟需一種結(jié)構(gòu)化查詢語言生成方法以解決現(xiàn)有技術(shù)中人工完成字段映射所產(chǎn)生的效率低下、錯誤率高的問題。


技術(shù)實現(xiàn)思路

1、本發(fā)明提供一種結(jié)構(gòu)化查詢語言生成方法、裝置、電子設(shè)備及存儲介質(zhì),用以解決現(xiàn)有技術(shù)中人工完成字段映射存在效率低下、錯誤率高的缺陷。

2、本發(fā)明提供一種結(jié)構(gòu)化查詢語言生成方法,包括如下步驟:

3、基于查詢問題,確定目標表格和所述目標表格對應(yīng)的表頭信息,所述查詢問題是自然語言查詢問題,所述目標表格是與所述查詢問題相關(guān)的表格;

4、基于所述查詢問題,檢索所述目標表格中目標字段的編碼信息,得到相關(guān)編碼信息,所述相關(guān)編碼信息是所述目標字段的編碼信息中與所述查詢問題相關(guān)的編碼信息,所述目標字段是與所述查詢問題相關(guān)的編碼字段,所述編碼字段是以編碼形式存儲數(shù)據(jù)的字段;

5、基于所述表頭信息和所述相關(guān)編碼信息,使用預(yù)訓(xùn)練的大語言模型生成結(jié)構(gòu)化查詢語言。

6、根據(jù)本發(fā)明提供的一種結(jié)構(gòu)化查詢語言生成方法,所述表頭信息包括編碼標識信息,所述編碼標識信息用于標識所述目標表格中各字段是否為編碼字段,在所述基于查詢問題,確定目標表格和所述目標表格對應(yīng)的表頭信息之前,還包括:

7、對于所述目標表格中的任一編碼字段,將所述編碼字段的編碼信息存儲至所述編碼字段對應(yīng)的向量庫中,所述編碼字段的編碼信息是所述編碼字段的文字-編碼對照關(guān)系。

8、根據(jù)本發(fā)明提供的一種結(jié)構(gòu)化查詢語言生成方法,所述基于所述查詢問題,檢索所述目標表格中目標字段的編碼信息,得到相關(guān)編碼信息,包括:

9、遍歷所述目標表格中的每個字段,若當前字段是編碼字段,則檢索所述當前字段對應(yīng)的向量庫,得到與所述查詢問題相關(guān)的編碼信息,作為所述相關(guān)編碼信息。

10、根據(jù)本發(fā)明提供的一種結(jié)構(gòu)化查詢語言生成方法,所述檢索所述當前字段對應(yīng)的向量庫,得到與所述查詢問題相關(guān)的編碼信息,作為所述相關(guān)編碼信息,包括:

11、基于預(yù)置評分標準,對所述當前字段對應(yīng)的向量庫中的編碼信息進行打分,得到各所述編碼信息的相關(guān)性評分,各所述編碼信息的相關(guān)性評分反應(yīng)各所述編碼信息與所述查詢問題的相關(guān)性;

12、將所述相關(guān)性評分最大的n個編碼信息作為所述相關(guān)編碼信息,n為正整數(shù)。

13、根據(jù)本發(fā)明提供的一種結(jié)構(gòu)化查詢語言生成方法,所述表頭信息包括所述目標表格的表名、表注釋和表字段信息。

14、根據(jù)本發(fā)明提供的一種結(jié)構(gòu)化查詢語言生成方法,所述基于所述表頭信息和所述相關(guān)編碼信息,使用預(yù)訓(xùn)練的大語言模型生成結(jié)構(gòu)化查詢語言,包括:

15、基于所述相關(guān)編碼信息,更新所述表頭信息;

16、基于所述查詢問題和更新后的表頭信息,使用預(yù)置提示詞prompt,生成查詢語句;

17、將所述查詢語句輸入至預(yù)訓(xùn)練的大語言模型中,得到所述大語言模型輸出的結(jié)構(gòu)化查詢語言。

18、本發(fā)明還提供一種結(jié)構(gòu)化查詢語言生成裝置,包括如下模塊:

19、表格召回模塊,用于:基于查詢問題,確定目標表格和所述目標表格對應(yīng)的表頭信息,所述查詢問題是自然語言查詢問題,所述目標表格是與所述查詢問題相關(guān)的表格;

20、編碼召回模塊,用于:基于所述查詢問題,檢索所述目標表格中目標字段的編碼信息,得到相關(guān)編碼信息,所述相關(guān)編碼信息是所述目標字段的編碼信息中與所述查詢問題相關(guān)的編碼信息,所述目標字段是與所述查詢問題相關(guān)的編碼字段,所述編碼字段是以編碼形式存儲數(shù)據(jù)的字段;

21、語句生成模塊,用于:基于所述表頭信息和所述相關(guān)編碼信息,使用預(yù)訓(xùn)練的大語言模型生成結(jié)構(gòu)化查詢語言。

22、本發(fā)明還提供一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如上述任一種所述結(jié)構(gòu)化查詢語言生成方法。

23、本發(fā)明還提供一種非暫態(tài)計算機可讀存儲介質(zhì),其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)如上述任一種所述結(jié)構(gòu)化查詢語言生成方法。

24、本發(fā)明還提供一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上述任一種所述結(jié)構(gòu)化查詢語言生成方法。

25、本發(fā)明提供的結(jié)構(gòu)化查詢語言生成方法、裝置、電子設(shè)備及存儲介質(zhì),通過基于查詢問題,確定目標表格和所述目標表格對應(yīng)的表頭信息,所述查詢問題是自然語言查詢問題,所述目標表格是與所述查詢問題相關(guān)的表格;基于所述查詢問題,檢索所述目標表格中目標字段的編碼信息,得到相關(guān)編碼信息,所述相關(guān)編碼信息是所述目標字段的編碼信息中與所述查詢問題相關(guān)的編碼信息,所述目標字段是與所述查詢問題相關(guān)的編碼字段,所述編碼字段是以編碼形式存儲數(shù)據(jù)的字段;基于所述表頭信息和所述相關(guān)編碼信息,使用預(yù)訓(xùn)練的大語言模型生成結(jié)構(gòu)化查詢語言。本發(fā)明在檢索到與查詢問題相關(guān)的目標表格之后,進一步檢索與查詢問題相關(guān)的編碼信息,將編碼信息與目標表格的表頭信息一起輸入至預(yù)訓(xùn)練的大語言模型,可以讓大語言模型基于上下文信息直接生成含有編碼信息的標準sql語句,簡潔高效,無需再人工對生成的sql做編碼映射的后處理操作,降低sql語句生成的錯誤率。



技術(shù)特征:

1.一種結(jié)構(gòu)化查詢語言生成方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的結(jié)構(gòu)化查詢語言生成方法,其特征在于,所述檢索所述當前字段對應(yīng)的向量庫,得到與所述查詢問題相關(guān)的編碼信息,作為所述相關(guān)編碼信息,包括:

3.根據(jù)權(quán)利要求1所述的結(jié)構(gòu)化查詢語言生成方法,其特征在于,所述表頭信息包括所述目標表格的表名、表注釋和表字段信息。

4.根據(jù)權(quán)利要求3所述的結(jié)構(gòu)化查詢語言生成方法,其特征在于,所述基于所述表頭信息和所述相關(guān)編碼信息,使用預(yù)訓(xùn)練的大語言模型生成結(jié)構(gòu)化查詢語言,包括:

5.一種結(jié)構(gòu)化查詢語言生成裝置,其特征在于,應(yīng)用如權(quán)利要求1所述的結(jié)構(gòu)化查詢語言生成方法,包括:

6.一種電子設(shè)備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如權(quán)利要求1至4任一項所述結(jié)構(gòu)化查詢語言生成方法。

7.一種非暫態(tài)計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至4任一項所述結(jié)構(gòu)化查詢語言生成方法。

8.一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至4任一項所述結(jié)構(gòu)化查詢語言生成方法。


技術(shù)總結(jié)
本發(fā)明提供一種結(jié)構(gòu)化查詢語言生成方法、裝置、電子設(shè)備及存儲介質(zhì),屬于數(shù)據(jù)處理技術(shù)領(lǐng)域,所述方法包括:基于查詢問題,確定目標表格和對應(yīng)的表頭信息,查詢問題是自然語言查詢問題,目標表格是與查詢問題相關(guān)的表格;基于查詢問題,檢索目標表格中目標字段的編碼信息,得到相關(guān)編碼信息,相關(guān)編碼信息是目標字段的編碼信息中與查詢問題相關(guān)的編碼信息,目標字段是與查詢問題相關(guān)的編碼字段,編碼字段是以編碼形式存儲數(shù)據(jù)的字段;基于表頭信息和相關(guān)編碼信息,使用大語言模型生成結(jié)構(gòu)化查詢語言。本發(fā)明通過檢索相關(guān)的編碼信息后,將編碼信息一起輸入至大模型,實現(xiàn)直接生成含有編碼信息的SQL語句,提高SQL生成效率,降低錯誤率。

技術(shù)研發(fā)人員:陳坤鵬,彭鑫,黃飛,查漢
受保護的技術(shù)使用者:朗新科技集團股份有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/2
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
临夏县| 互助| 长丰县| 石台县| 揭西县| 德化县| 万源市| 武汉市| 湘乡市| 淅川县| 临猗县| 台山市| 彭阳县| 南澳县| 牙克石市| 通渭县| 黄大仙区| 渑池县| 娱乐| 泉州市| 德昌县| 开封县| 松阳县| 黔东| 太仆寺旗| 鸡东县| 兰坪| 闻喜县| 工布江达县| 垦利县| 浦东新区| 赤峰市| 揭阳市| 娄底市| 苍梧县| 江永县| 庆城县| 浦江县| 通河县| 宝鸡市| 双辽市|