本發(fā)明涉及人工智能,尤其涉及一種基于增強(qiáng)rag的測(cè)試用例自動(dòng)生成方法。
背景技術(shù):
1、傳統(tǒng)的系統(tǒng)測(cè)試過程中,都由測(cè)試人員手動(dòng)編寫大綱用例并執(zhí)行,最后完成測(cè)試報(bào)告。
2、rag(retrieval?augmented?generation)技術(shù)是一種結(jié)合檢索和生成功能的自然語言處理技術(shù)。它通過從大型外部數(shù)據(jù)庫中檢索與輸入問題相關(guān)的信息,來輔助生成模型回答問題?,F(xiàn)有的rag技術(shù),可以將該系統(tǒng)所有資料,例如需求定義書、系統(tǒng)設(shè)計(jì)書、測(cè)試報(bào)告模板等等都作為知識(shí)庫交給ai學(xué)習(xí),測(cè)試人員可以通過ai來自動(dòng)生成大綱用例等等。
3、而缺陷在于現(xiàn)有技術(shù)的rag技術(shù)只是將資料切分成片段,再與用戶的輸入進(jìn)行匹配,通過這樣的單路召回得到回答,范圍非常局限而且用詞泛化,只有20%可用,所以本發(fā)明提供了三路召回增強(qiáng)型rag模型,用來提升生成測(cè)試用例的可用性,替換后可用性達(dá)到90%以上。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明主要解決現(xiàn)有技術(shù)rag生成的測(cè)試用例范圍局限而且用詞泛化的技術(shù)問題,提出一種基于增強(qiáng)rag的測(cè)試用例自動(dòng)生成方法,實(shí)現(xiàn)測(cè)試用例書的自動(dòng)化生成,以減少工作內(nèi)容,提升工作效率。
2、本發(fā)明提供了一種基于增強(qiáng)rag的測(cè)試用例自動(dòng)生成方法,包括:
3、對(duì)系統(tǒng)文檔進(jìn)行文字提取,并將提取后的文字切分成文本片段,形成文本向量,存入向量數(shù)據(jù)庫中;
4、將切分后的文本片段,交由本地的第一大語言模型,生成對(duì)應(yīng)的三元組,存入知識(shí)圖譜數(shù)據(jù)庫中;
5、將系統(tǒng)文檔直接交由本地的第一大語言模型,抽出文章大綱,存入關(guān)系型數(shù)據(jù)庫中;
6、根據(jù)用戶輸入的測(cè)試用例需求,從向量數(shù)據(jù)庫、知識(shí)圖譜數(shù)據(jù)庫和關(guān)系型數(shù)據(jù)庫中進(jìn)行檢索,從向量數(shù)據(jù)庫中使用余弦相似度算法得到與測(cè)試用例生成相關(guān)的文本片段,再使用重排模型對(duì)文本片段按照相似性排序;從知識(shí)圖譜數(shù)據(jù)庫中使用實(shí)體關(guān)鍵詞相似度,匹配得到對(duì)應(yīng)的三元組;從關(guān)系型數(shù)據(jù)庫中直接得到對(duì)應(yīng)的文章大綱;
7、將匹配的與測(cè)試用例生成相關(guān)的文本片段、三元組和文章大綱發(fā)送給本地的第二大語言模型;第二大語言模型根據(jù)這些信息自動(dòng)生成具體的測(cè)試用例和詳細(xì)的測(cè)試用例文檔。
8、進(jìn)一步的,所述系統(tǒng)文檔包括但不限于需求定義書、系統(tǒng)設(shè)計(jì)書、測(cè)試報(bào)告模板
9、進(jìn)一步的,使用文本切分工具進(jìn)行,將系統(tǒng)文檔切分成文本片段;
10、用嵌入模型將文本片段轉(zhuǎn)化為文本向量。
11、進(jìn)一步的,所述第一大語言模型,通過創(chuàng)建好的提示詞模版,提取片段中的實(shí)體關(guān)鍵詞,生成對(duì)應(yīng)的三元組。
12、進(jìn)一步的,將系統(tǒng)文檔直接交由本地的第一大語言模型,抽出文章大綱,存入關(guān)系型數(shù)據(jù)庫中,包括:
13、第一大語言模型遍歷系統(tǒng)文檔的頁數(shù),提取出每頁的大綱內(nèi)容,最后將每頁的大綱匯總,第一大語言模型在進(jìn)行總結(jié),得到整體的大綱,存入關(guān)系型數(shù)據(jù)庫中。
14、進(jìn)一步的,所述重排模型利用余弦相似度算法計(jì)算用戶輸入與匹配到文本片段的距離,從而達(dá)到相似性排序。
15、本發(fā)明提供的一種基于增強(qiáng)rag的測(cè)試用例自動(dòng)生成方法,將系統(tǒng)文檔進(jìn)行文本切分后,轉(zhuǎn)成文本向量存入向量數(shù)據(jù)庫中。系統(tǒng)文檔交由本地的第一大語言模型生成的三元組,存入知識(shí)圖譜數(shù)據(jù)庫中;系統(tǒng)文檔交由本地的第一大語言模型抽出的文章大綱,存入關(guān)系型數(shù)據(jù)庫中;再將用戶的輸入與三個(gè)數(shù)據(jù)庫進(jìn)行匹配,得到回答。本發(fā)明采用了獨(dú)特的三路召回增強(qiáng)型rag模型,數(shù)據(jù)工程師提前將待測(cè)試系統(tǒng)的相關(guān)系統(tǒng)文檔上傳。當(dāng)有生成測(cè)試用例的需求時(shí),測(cè)試人員向本地的第二大語言模型發(fā)送需要被測(cè)試的部分。此時(shí)數(shù)據(jù)工程師上傳的相關(guān)系統(tǒng)文檔已被三路召回增強(qiáng)型rag處理成三種數(shù)據(jù),通過代碼邏輯與測(cè)試人員的輸入進(jìn)行匹配,得到最相關(guān)的部分,再全部發(fā)送給本地的第二大語言模型。依靠本地的第二大語言模型強(qiáng)大的自然語言處理能力,就可以自動(dòng)生成測(cè)試用例,再通過代碼邏輯寫入用例書模板,實(shí)現(xiàn)測(cè)試用例書的自動(dòng)化生成。原先測(cè)試人員需要編寫大綱、編寫測(cè)試用例、執(zhí)行用例、寫入用例書,使用了本申請(qǐng)技術(shù)方案之后,直接省去70%的工作部分,執(zhí)行用例之后將結(jié)果寫入用例書即可,極大減少了工作內(nèi)容,提升了工作效率。且相比普通rag,本申請(qǐng)技術(shù)生成的測(cè)試用例結(jié)果可用性可達(dá)90%以上。
1.一種基于增強(qiáng)rag的測(cè)試用例自動(dòng)生成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于增強(qiáng)rag的測(cè)試用例自動(dòng)生成方法,其特征在于,所述系統(tǒng)文檔包括但不限于需求定義書、系統(tǒng)設(shè)計(jì)書、測(cè)試報(bào)告模板。
3.根據(jù)權(quán)利要求1所述的基于增強(qiáng)rag的測(cè)試用例自動(dòng)生成方法,其特征在于,使用文本切分工具進(jìn)行,將系統(tǒng)文檔切分成文本片段;
4.根據(jù)權(quán)利要求3所述的基于增強(qiáng)rag的測(cè)試用例自動(dòng)生成方法,其特征在于,所述第一大語言模型,通過創(chuàng)建好的提示詞模版,提取片段中的實(shí)體關(guān)鍵詞,生成對(duì)應(yīng)的三元組。
5.根據(jù)權(quán)利要求4所述的基于增強(qiáng)rag的測(cè)試用例自動(dòng)生成方法,其特征在于,將系統(tǒng)文檔直接交由本地的第一大語言模型,抽出文章大綱,存入關(guān)系型數(shù)據(jù)庫中,包括:
6.根據(jù)權(quán)利要求5所述的基于增強(qiáng)rag的測(cè)試用例自動(dòng)生成方法,其特征在于,所述重排模型利用余弦相似度算法計(jì)算用戶輸入與匹配到文本片段的距離,從而達(dá)到相似性排序。