本公開涉及缺陷定位與機器學習,特別涉及一種產(chǎn)品缺陷定位模型構(gòu)建方法、產(chǎn)品缺陷定位方法及計算機可讀存儲介質(zhì)。
背景技術(shù):
1、在軟件開發(fā)和測試過程中,缺陷定位至關(guān)重要,傳統(tǒng)的缺陷定位主要依賴于人工進行,而人工缺陷定位存在著諸多問題,例如主觀性強、不一致性和效率提升有限。隨著人工智能的發(fā)展,特別是機器學習和自然語言處理技術(shù)的不斷進步,缺陷定位也可以受益于這些技術(shù)的應(yīng)用,從而極大地改變?nèi)毕荻ㄎ坏姆绞胶托省?/p>
技術(shù)實現(xiàn)思路
1、本公開旨在至少一定程度上解決上述技術(shù)中的技術(shù)問題之一,為此提出了一種產(chǎn)品缺陷定位模型構(gòu)建方法,包括:
2、對產(chǎn)品缺陷描述進行特征提取,得到第一量化特征;所述第一量化特征,包括:產(chǎn)品缺陷描述量化特征與基于數(shù)字解耦的日志記錄量化特征;所述產(chǎn)品缺陷描述量化特征為文本與數(shù)字一體化編碼特征;
3、對層級分類后的產(chǎn)品定位結(jié)論進行特征提取,得到第二量化特征;所述第二量化特征,包括:定位結(jié)論層級量化特征;
4、根據(jù)所述第一量化特征與所述第二量化特征構(gòu)建訓練數(shù)據(jù)集;
5、基于所述訓練數(shù)據(jù)集訓練層次化分類器,得到產(chǎn)品缺陷定位模型。
6、進一步地,對產(chǎn)品缺陷描述進行特征提取,包括:利用bert-wwm模型的高層編碼器對所述產(chǎn)品缺陷描述的高層級語義特征進行向量化的輸出。
7、進一步地,對產(chǎn)品缺陷描述進行特征提取,還包括:對所述產(chǎn)品缺陷描述對應(yīng)日志數(shù)據(jù)進行量化特征提取,其中包括:
8、對所述日志數(shù)據(jù)進行數(shù)據(jù)量化與結(jié)構(gòu)化處理;
9、對處理后的日志數(shù)據(jù)進行特征提取,構(gòu)建數(shù)據(jù)特征向量;
10、將所述數(shù)據(jù)特征向量作為所述日志數(shù)據(jù)的量化特征。
11、進一步地,對層級分類后的產(chǎn)品定位結(jié)論進行特征提取,包括:
12、對所述產(chǎn)品定位結(jié)論進行層級分類;
13、基于獨熱編碼構(gòu)建每個分類層級的標簽向量;
14、將得到的標簽向量集作為所述產(chǎn)品定位結(jié)論的量化特征。
15、進一步地,根據(jù)所述第一量化特征與所述第二量化特征構(gòu)建訓練數(shù)據(jù)集,包括:對所述標簽向量與產(chǎn)品缺陷描述的特征向量進行串接。
16、進一步地,根據(jù)所述第一量化特征與所述第二量化特征構(gòu)建訓練數(shù)據(jù)集,還包括:基于線性判別分析對量化特征進行增強與降維。
17、進一步地,基于線性判別分析對量化特征進行增強與降維,包括:
18、對所述標簽向量與產(chǎn)品缺陷描述的特征向量進行串接;
19、根據(jù)線性判別分析構(gòu)建串接特征向量的每一層對應(yīng)的投影矩陣;
20、利用所述投影矩陣對串接特征向量的相應(yīng)層進行增強與降維。
21、進一步地,基于所述訓練數(shù)據(jù)集訓練層次化分類器,得到產(chǎn)品缺陷定位模型,包括:
22、構(gòu)建包含若干個分類器的第一級分類器組;
23、將所述訓練數(shù)據(jù)集輸入所述第一級分類器組,訓練所述第一級分類器組,獲得若干個第一級分類結(jié)果;
24、構(gòu)建等同于第一分類結(jié)果數(shù)量的第二級分類器組;
25、依次以每個第一分類結(jié)果為引導,訓練與該第一分類結(jié)果對應(yīng)的第二級分類器組,獲得若干個第二級分類結(jié)果;
26、重復(fù)以上方法,構(gòu)建含有多級且每級含有若干分類器組的產(chǎn)品缺陷定位模型;所述產(chǎn)品缺陷定位模型的層級數(shù)等于所述產(chǎn)品定位結(jié)論的層級數(shù);所述產(chǎn)品缺陷定位模型中的每個分類器組包含的分類器數(shù)量相同且與所述訓練數(shù)據(jù)集的規(guī)模成正相關(guān)。
27、本公開還提出一種產(chǎn)品缺陷定位方法,包括:利用基于上述產(chǎn)品缺陷定位模型構(gòu)建方法構(gòu)建得到的產(chǎn)品缺陷定位模型,進行產(chǎn)品缺陷定位。
28、本公開還提出一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)中存儲有計算機程序或指令,所述計算機程序或指令被處理器執(zhí)行時,至少用于實現(xiàn)上述產(chǎn)品缺陷定位方法。
29、與現(xiàn)有技術(shù)相比,本公開的有益效果是:
30、本公開通過混合模態(tài)數(shù)據(jù)深度挖掘,提高輸入數(shù)據(jù)的特征質(zhì)量,確保重要信息不被忽略,結(jié)合lda技術(shù)的層級化特征學習,獲取更具判別性的缺陷分類與定位特征,顯著提高缺陷定位的準確性。此外,本公開給出的方案通過層級化特征學習方法可以有效增強模型的判別能力,使模型在復(fù)雜數(shù)據(jù)環(huán)境下仍能保持高性能的分類與定位能力,給出的模型能夠處理包含文本和數(shù)字的多樣化數(shù)據(jù),適應(yīng)不同類型的數(shù)據(jù)源,提高模型的通用性和應(yīng)用范圍。而且自動化輔助定位模型可以大幅提高缺陷定位的處理速度,能夠快速處理大量數(shù)據(jù),顯著提高工作效率,進一步提升產(chǎn)品整體質(zhì)量。
31、本公開的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本公開而了解。本公開的目的和其他優(yōu)點可通過在所寫的說明書以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。下面通過附圖和實施例,對本公開的技術(shù)方案做進一步的描述。
1.一種產(chǎn)品缺陷定位模型構(gòu)建方法,其特征在于,包括:
2.如權(quán)利要求1所述的方法,其特征在于,對產(chǎn)品缺陷描述進行特征提取,包括:利用bert-wwm模型的高層編碼器對所述產(chǎn)品缺陷描述的高層級語義特征進行向量化輸出。
3.如權(quán)利要求1所述的方法,其特征在于,對產(chǎn)品缺陷描述進行特征提取,還包括:對所述產(chǎn)品缺陷描述對應(yīng)日志數(shù)據(jù)進行量化特征提取,其中包括:
4.如權(quán)利要求2或3所述的方法,其特征在于,對層級分類后的產(chǎn)品定位結(jié)論進行特征提取,包括:
5.如權(quán)利要求4所述的方法,其特征在于,根據(jù)所述第一量化特征與所述第二量化特征構(gòu)建訓練數(shù)據(jù)集,包括:對所述標簽向量與產(chǎn)品缺陷描述的特征向量進行串接。
6.如權(quán)利要求5所述的方法,其特征在于,根據(jù)所述第一量化特征與所述第二量化特征構(gòu)建訓練數(shù)據(jù)集,還包括:基于線性判別分析對量化特征進行增強與降維。
7.如權(quán)利要求6所述的方法,其特征在于,基于線性判別分析對量化特征進行增強與降維,包括:
8.如權(quán)利要求7所述的方法,其特征在于,基于所述訓練數(shù)據(jù)集訓練層次化分類器,得到產(chǎn)品缺陷定位模型,包括:
9.一種產(chǎn)品缺陷定位方法,其特征在于,包括:利用基于權(quán)利要求1-8任意一項所述產(chǎn)品缺陷定位模型構(gòu)建方法構(gòu)建得到的產(chǎn)品缺陷定位模型,進行產(chǎn)品缺陷定位。
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)中存儲有計算機程序或指令,所述計算機程序或指令被處理器執(zhí)行時,至少用于實現(xiàn)權(quán)利要求9所述的方法。