一種基于三支決策的兩階段軟件缺陷預(yù)測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及一種基于=支決策的兩階段軟件缺陷預(yù)測方法,屬于軟件測試技術(shù)領(lǐng) 域。
【背景技術(shù)】
[0002] 隨著軟件規(guī)模的日益增長和復(fù)雜性的增加,如何保證軟件產(chǎn)品的質(zhì)量已經(jīng)成為 軟件產(chǎn)業(yè)面臨的一個重要問題。軟件缺陷預(yù)測技術(shù)是提高軟件質(zhì)量的一個重要手段,通 過使用早期軟件版本的度量數(shù)據(jù)和測試階段收集的歷史故障數(shù)據(jù),預(yù)測軟件模塊的故障趨 勢。軟件缺陷預(yù)測技術(shù)在軟件開發(fā)過程中發(fā)揮著=點作用;1)幫助挑選重構(gòu)代碼候選對象; 2)通過合理安排測試資源提高軟件測試效率;3)提高軟件系統(tǒng)的可靠性。因此軟件缺陷預(yù) 測技術(shù)得到了廣泛的關(guān)注。
[0003]現(xiàn)有研究通常將軟件缺陷預(yù)測看成是一個傳統(tǒng)的二支分類問題,將軟件模塊分類 為有缺陷趨勢模塊和無缺陷趨勢模塊。針對該分類任務(wù),可W直接采用機器學(xué)習(xí)中的分類 模型,如決策樹、貝葉斯網(wǎng)絡(luò)、人工神經(jīng)網(wǎng)絡(luò)、支持向量機等。更進一步的,軟件缺陷預(yù)測是 一類典型的代價敏感學(xué)習(xí)問題,不同分類錯誤帶來的代價不同。目前用于軟件缺陷預(yù)測的 代價敏感分類模型有提升神經(jīng)網(wǎng)絡(luò)算法(boostedneuralnetwork)、代價敏感提升算法 (cost-sensitiveboosting)等。
[0004]在現(xiàn)有的采用分類模型進行軟件缺陷預(yù)測或者代價敏感軟件缺陷預(yù)測研究中,分 類模型都是采用二支決策的方法,即軟件模塊要么為有缺陷趨勢模塊,要么為無缺陷趨勢 模塊。二支決策方法屬于立即決策方式,能夠簡單快速的給出分類結(jié)果,但是存在著誤分類 率較高的問題。如對于一給定軟件模塊,假定其通過分類模型計算得出屬于缺陷趨勢模塊 的條件概率為51%,則屬于無缺陷趨勢模塊的條件概率為49%,簡單二支決策方法會依據(jù)多 數(shù)原則將其判定為有缺陷趨勢模塊,對于該一類處于中間模糊地帶不易劃分的軟件模塊, 立即決策方式誤分率較高,由此帶來的誤分類代價也會增加。
【發(fā)明內(nèi)容】
[0005]本發(fā)明提出了一種基于=支決策的兩階段軟件缺陷預(yù)測方法,第一階段考慮到軟 件缺陷預(yù)測的代價敏感問題,對軟件模塊進行分類采用=支決策方法,依據(jù)不同錯誤分類 帶來的損失代價不同,設(shè)置相應(yīng)的代價函數(shù),計算=支決策所需的闊值對,將誤分率高的軟 件模塊劃分到邊界域中,交由專家進行缺陷診斷,降低缺陷預(yù)測的誤分率,減少代價損失。 第二階段,針對邊界域的決策問題,提出一種沒有專家參與情況下的自動分類方法,即基于 邊界域的多分類器建模模型。
[0006]本發(fā)明為解決其技術(shù)問題采用如下技術(shù)方案: 一種基于=支決策的兩階段軟件缺陷預(yù)測方法,將軟件缺陷預(yù)測方法分為兩個階段: 第一階段;依據(jù)決策闊值對和軟件模塊的條件概率,將軟件模塊劃分到=個不同的區(qū)域中, 對于正域和負域的軟件模塊,將其直接判定為有缺陷模塊和無缺陷模塊,而對于邊界域中 的軟件模塊,則放到第二階段去解決;第二階段;針對邊界域中的軟件模塊,提出了一種 基于邊界域的多分類器建模模型,通過集成學(xué)習(xí)機制對邊界域軟件模塊做出有缺陷和無缺 陷的確定性決策。
[0007] 所述第一階段前,首先計算決策闊值對和軟件模塊的條件概率。
[0008] 所述計算決策闊值對,將軟件缺陷預(yù)測方法看作是一個代價敏感學(xué)習(xí)問題,需要 專家提供損失函數(shù)矩陣,包括6個損失函數(shù),分別是,其中 表示將屬于缺陷的軟件模塊標(biāo)記為有缺陷所帶來的損失;表示將屬于缺陷的軟件模塊 劃分到邊界域所帶來的損失;表示將屬于缺陷的軟件模塊劃分標(biāo)記為無缺陷所帶來的 損失;為>%表示將屬于無缺陷的軟件模塊標(biāo)記為有缺陷所帶來的損失;為。、/表示將屬于無 缺陷的軟件模塊劃分到邊界域所帶來的損失;為W表示將屬于無缺陷的軟件模塊標(biāo)記為無 缺陷所帶來的損失;要求滿足W下條件:
[0009] 第一階段中對所有的軟件模塊采用=支決策的分類方式。
[0010] 所述軟件模塊通過有缺陷模塊的條件概率換^1々和決策闊值對批,巧之間關(guān)系分 類判定,如果>a,則將軟件模塊X預(yù)測為有缺陷模塊;如果.0(尤1々 <聲,則將軟件模 塊^預(yù)測為無缺陷模塊;如果^^曰/切^|句^?,則將軟件模塊1劃分到邊界域中在第二階段 分類進行處理。
[0011] 所述第二階段通過集成學(xué)習(xí)機制對邊界域軟件模塊進行投票給出具體分類結(jié)果。
[0012] 本發(fā)明的有益效果如下; 1、本發(fā)明提出一種軟件缺陷預(yù)測方法,首先采用=支決策的方法通過引入延遲決策,W貝葉斯最小風(fēng)險決策理論為準(zhǔn)則,將易被錯分的軟件模塊劃為延遲決策。然后,通過引入 更多的分類器對第一階段產(chǎn)生的延遲決策軟件模塊進行投票形式集成分類,從而確定延遲 決策軟件模塊是否屬于缺陷一類。
[0013] 2、本發(fā)明基于決策粗趟集的=支決策軟件缺陷預(yù)測兩階段分類方法,具有較高的 軟件缺陷預(yù)測的分類精度和較低的決策風(fēng)險代價。
[0014] 3、本發(fā)明提出的兩階段分類方法,使其分類精度更高、誤分類代價更低。
【附圖說明】
[0015] 圖1為本發(fā)明一個實施例提供的一種軟件缺陷預(yù)測方法流程圖。
【具體實施方式】
[0016] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖對本發(fā)明實施方法 作進一步的詳細描述。
[0017]本發(fā)明的技術(shù)構(gòu)思,主要是針對二支決策帶來的誤分類代價太高,提出基于=支 決策的軟件缺陷預(yù)測模型。
[001引建立軟件缺陷預(yù)測模型需要W下步驟,結(jié)合圖1詳細說明: 步驟1)基于=支決策的軟件模塊缺陷預(yù)測方法。
[001引步驟S100)選定已測試模塊[;,:1而,...,而],已確定是否有缺陷的模塊作為訓(xùn)練數(shù) 據(jù)集,并做好缺陷標(biāo)簽; 步驟S101)應(yīng)用McC油e和化Istead度量方法對軟件模塊進行度量,得到我們需要的 特征,構(gòu)造一個訓(xùn)練集掉?]。
[0020] 步驟S102)設(shè);C;待預(yù)測軟件模塊; :兩種狀態(tài),X為有缺陷趨勢,_擴為無缺陷趨勢; A={。,,如如}己種決策行為,。f為判定軟件模塊X屬于有缺陷趨勢模塊:化域), 為判定軟件模塊為可能有缺陷趨勢模塊;re逆證)(巧(邊界域),Ar為判定軟件模塊不是 有缺陷趨勢模塊;^€^^巧巧(負域); .ppnr);待預(yù)測軟件模塊為缺陷趨勢模塊的條件概率; ;待預(yù)測軟件模塊為無缺陷趨勢模塊的條件概率,^(X|r) +p(JT|r)=i. :其中〇=&5或&^,軟件模塊1實際狀態(tài)為有缺陷趨勢^時分別采取^種決策<3^, ,%r的代價。
[002。 我取1護);其中0 = 或&