基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損系統(tǒng)及方法
【專利摘要】基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損系統(tǒng)及方法,屬于車輛定損領(lǐng)域,為了解決車輛碰撞后,對(duì)于零件檢測(cè)的問(wèn)題,技術(shù)要點(diǎn)是:零件檢測(cè)子系統(tǒng),判斷車輛碰撞時(shí)零件所產(chǎn)生的損傷等級(jí);所述零件檢測(cè)子系統(tǒng)對(duì)零件訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成零件模型,所述零件模型建立使用隨機(jī)森林方法。效果是:上述技術(shù)方案,可以實(shí)現(xiàn)對(duì)于車輛碰撞的零件檢測(cè),在遠(yuǎn)程定損的這個(gè)技術(shù)領(lǐng)域使用了機(jī)器學(xué)習(xí)的方法,針對(duì)的機(jī)器學(xué)習(xí)方法,在定損過(guò)程中,判別的準(zhǔn)確率上得以提升。
【專利說(shuō)明】
基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損系統(tǒng)及方法
技術(shù)領(lǐng)域
[0001]本發(fā)明屬于車輛定損領(lǐng)域,涉及一種基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損系統(tǒng)及方法。
【背景技術(shù)】
[0002]針對(duì)車輛在低速運(yùn)動(dòng)(包括低速道路行駛、車輛??康?過(guò)程中頻發(fā)碰撞事故而導(dǎo)致的理賠糾紛問(wèn)題,遠(yuǎn)程定損技術(shù)通過(guò)采集車輛行駛過(guò)程中的多種信號(hào)(如速度、加速度、角速度、聲音等)并用信號(hào)處理和機(jī)器學(xué)習(xí)技術(shù)加以分析,以判斷碰撞是否發(fā)生以及碰撞后車輛的損毀情況。
[0003]車輛發(fā)生碰撞事故后,前端設(shè)備能夠檢測(cè)出碰撞的發(fā)生并截取碰撞過(guò)程的信號(hào),通過(guò)無(wú)線網(wǎng)絡(luò)發(fā)送至云端,遠(yuǎn)程服務(wù)器從收到的信號(hào)中抽取出事先設(shè)計(jì)的特征值,用機(jī)器學(xué)習(xí)算法進(jìn)行分析,先判斷碰撞數(shù)據(jù)的準(zhǔn)確性,再判斷碰撞物體和工況情況,以確定碰撞數(shù)據(jù)集對(duì)什么零件產(chǎn)生了哪種等級(jí)的損傷,然后根據(jù)零件損傷等級(jí)計(jì)算出參考理賠金額并發(fā)送至保險(xiǎn)公司。這期間會(huì)涉及對(duì)于車型、工況、目標(biāo)、零件和區(qū)域的檢測(cè)。
【發(fā)明內(nèi)容】
[0004]為了解決車輛碰撞后,對(duì)于零件檢測(cè)的問(wèn)題,本發(fā)明提出了一種基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損系統(tǒng)及方法,以實(shí)現(xiàn)定損過(guò)程中的零件檢測(cè)。
[0005]為了解決上述技術(shù)問(wèn)題,本發(fā)明提供的技術(shù)方案的要點(diǎn)是:包括:
[0006]車型選擇子系統(tǒng),選擇車輛所對(duì)應(yīng)的車型數(shù)據(jù)作為總數(shù)據(jù)集;
[0007]數(shù)據(jù)分類子系統(tǒng),讀取CAE仿真數(shù)據(jù)和實(shí)車數(shù)據(jù),并相應(yīng)對(duì)數(shù)據(jù)進(jìn)行分類;
[0008]碰撞檢測(cè)子系統(tǒng),判斷車輛在行車過(guò)程中是否發(fā)生碰撞;所述碰撞檢測(cè)子系統(tǒng)對(duì)碰撞訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成碰撞模型,所述碰撞模型建立使用隨機(jī)森林方法;
[0009]工況檢測(cè)子系統(tǒng),判斷碰撞發(fā)生的所有工況信息;所述工況檢測(cè)子系統(tǒng)對(duì)工況訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成工況模型,所述工況模型建立使用隨機(jī)森林方法;
[0010]零件檢測(cè)子系統(tǒng),判斷車輛碰撞時(shí)零件所產(chǎn)生的損傷等級(jí);所述零件檢測(cè)子系統(tǒng)對(duì)零件訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成零件模型,所述零件模型建立使用隨機(jī)森林方法。
[0011 ]有益效果:上述技術(shù)方案,可以實(shí)現(xiàn)對(duì)于車輛碰撞的零件檢測(cè),在遠(yuǎn)程定損的這個(gè)技術(shù)領(lǐng)域使用了機(jī)器學(xué)習(xí)的方法,針對(duì)的機(jī)器學(xué)習(xí)方法,在定損過(guò)程中,判別的準(zhǔn)確率上得以提升;本發(fā)明通過(guò)選擇車型來(lái)導(dǎo)入該車型所對(duì)應(yīng)的數(shù)據(jù),而數(shù)據(jù)分類則是為了模型訓(xùn)練和測(cè)試的目的而加入的步驟;零件的檢測(cè)是該方案實(shí)現(xiàn)的目的,是經(jīng)過(guò)一系列操作所要得到的結(jié)果。
【附圖說(shuō)明】
[0012]圖1為本發(fā)明所述的系統(tǒng)的結(jié)構(gòu)示意框圖。
【具體實(shí)施方式】
[0013]為了對(duì)本發(fā)明作出更為清楚的解釋,下面對(duì)本發(fā)明涉及的技術(shù)術(shù)語(yǔ)作出定義:
[0014]工況:碰撞角度、方向、目標(biāo)、區(qū)域等全體碰撞信息;
[0015]車型:汽車型號(hào);
[0016]目標(biāo):碰撞目標(biāo);
[0017]區(qū)域:碰撞位置;
[0018]零件:汽車零件;
[0019]工況檢測(cè):檢測(cè)本車碰撞角度、方向、目標(biāo)、區(qū)域等全體碰撞信息;
[0020]車型檢測(cè):檢測(cè)與本車發(fā)生碰撞的汽車型號(hào);
[0021]目標(biāo)檢測(cè):檢測(cè)本車碰撞目標(biāo);
[0022]區(qū)域檢測(cè):檢測(cè)本車碰撞位置;
[0023]零件檢測(cè):檢測(cè)本車汽車零件。
[0024]實(shí)施例1:
[0025]—種基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損系統(tǒng),包括:
[0026]車型選擇子系統(tǒng),選擇車輛所對(duì)應(yīng)的車型數(shù)據(jù)作為總數(shù)據(jù)集;
[0027]數(shù)據(jù)分類子系統(tǒng),讀取CAE仿真數(shù)據(jù)和實(shí)車數(shù)據(jù),并相應(yīng)對(duì)數(shù)據(jù)進(jìn)行分類;
[0028]碰撞檢測(cè)子系統(tǒng),判斷車輛在行車過(guò)程中是否發(fā)生碰撞;所述碰撞檢測(cè)子系統(tǒng)對(duì)碰撞訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成碰撞模型,所述碰撞模型建立使用隨機(jī)森林方法;
[0029]工況檢測(cè)子系統(tǒng),判斷碰撞發(fā)生的所有工況信息;所述工況檢測(cè)子系統(tǒng)對(duì)工況訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成工況模型,所述工況模型建立使用隨機(jī)森林方法;
[0030]零件檢測(cè)子系統(tǒng),判斷車輛碰撞時(shí)零件所產(chǎn)生的損傷等級(jí);所述零件檢測(cè)子系統(tǒng)對(duì)零件訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成零件模型,所述零件模型建立使用隨機(jī)森林方法。
[0031 ]所述碰撞檢測(cè)子系統(tǒng)包括,碰撞訓(xùn)練模塊、碰撞測(cè)試模塊、碰撞驗(yàn)證模塊,所述碰撞訓(xùn)練模塊用于對(duì)碰撞訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成碰撞模型,碰撞測(cè)試模塊用于將碰撞測(cè)試數(shù)據(jù)帶入碰撞模型中檢測(cè)碰撞模型的結(jié)果,碰撞驗(yàn)證模塊使用真實(shí)跑車數(shù)據(jù)驗(yàn)證碰撞模型的可靠性和準(zhǔn)確率;
[0032]所述工況檢測(cè)子系統(tǒng)包括,工況訓(xùn)練模塊、工況測(cè)試模塊、工況驗(yàn)證模塊,所述工況訓(xùn)練模塊用于對(duì)工況訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成工況模型,所述工況測(cè)試模塊用于將工況測(cè)試數(shù)據(jù)帶入模型中檢測(cè)工況模型的結(jié)果,工況驗(yàn)證模塊使用真實(shí)跑車數(shù)據(jù)驗(yàn)證工況模型的可靠性和準(zhǔn)確率;
[0033]所述零件檢測(cè)子系統(tǒng)包括,零件訓(xùn)練模塊、零件測(cè)試模塊、零件驗(yàn)證模塊,所述零件訓(xùn)練模塊用于將零件訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成零件模型,零件測(cè)試模塊用于將零件測(cè)試數(shù)據(jù)帶入模型中檢測(cè)零件模型的結(jié)果,零件驗(yàn)證模塊使用真實(shí)跑車數(shù)據(jù)驗(yàn)證零件模型的可靠性和準(zhǔn)確率。
[0034]所述隨機(jī)森林方法的步驟是:
[0035]步驟1.使用隨機(jī)森林方法建立模型;
[0036]步驟2.使用隨機(jī)森林的預(yù)測(cè)。
[0037]其中,所述步驟I包括:
[0038]步驟1.1.給定訓(xùn)練集S,測(cè)試集T,特征維數(shù)F;
[0039]確定參數(shù):使用到的CART的數(shù)量t,每棵樹(shù)的深度d,每個(gè)節(jié)點(diǎn)使用到的特征數(shù)量f;
[0040]終止條件:節(jié)點(diǎn)上最少樣本數(shù)s,節(jié)點(diǎn)上最少的信息增益m;
[0041]對(duì)于第Ι-t 棵樹(shù),i = l_t:
[0042]步驟1.2.從S中有放回的抽取大小和S—樣的訓(xùn)練集S( i),作為根節(jié)點(diǎn)的樣本,從根節(jié)點(diǎn)開(kāi)始訓(xùn)練;
[0043]步驟1.3.如果當(dāng)前節(jié)點(diǎn)上達(dá)到終止條件,則設(shè)置當(dāng)前節(jié)點(diǎn)為葉子節(jié)點(diǎn);
[0044]如果是分類問(wèn)題,該葉子節(jié)點(diǎn)的預(yù)測(cè)輸出為當(dāng)前節(jié)點(diǎn)樣本集合中數(shù)量最多的那一類C( j),概率P為c( j)占當(dāng)前樣本集的比例;
[0045]如果是回歸問(wèn)題,預(yù)測(cè)輸出為當(dāng)前節(jié)點(diǎn)樣本集各個(gè)樣本值的平均值,然后繼續(xù)訓(xùn)練其他節(jié)點(diǎn);
[0046]如果當(dāng)前節(jié)點(diǎn)沒(méi)有達(dá)到終止條件,則從F維特征中無(wú)放回的隨機(jī)選取f維特征,利用f維特征,尋找分類效果最好的一維特征k及其閾值th,當(dāng)前節(jié)點(diǎn)上樣本第k維特征小于th的樣本被劃分到左節(jié)點(diǎn),其余的被劃分到右節(jié)點(diǎn),繼續(xù)訓(xùn)練其他節(jié)點(diǎn);有關(guān)分類效果的評(píng)判標(biāo)準(zhǔn)在后面會(huì)講。
[0047]步驟1.4.重復(fù)步驟2至步驟3,直到所有節(jié)點(diǎn)都訓(xùn)練過(guò)了或者被標(biāo)記為葉子節(jié)點(diǎn)。
[0048]步驟1.5.重復(fù)重復(fù)步驟2至步驟4,直到所有CART都被訓(xùn)練過(guò);
[0049]所述步驟2包括,對(duì)于第Ι-t棵樹(shù),i = l_t,進(jìn)行如下操作:
[OO5O ]步驟2.1.從當(dāng)前樹(shù)的根節(jié)點(diǎn)開(kāi)始,根據(jù)當(dāng)前節(jié)點(diǎn)的閾值t h,判斷是進(jìn)入左節(jié)點(diǎn)(〈th),還是進(jìn)入右節(jié)點(diǎn)(> = th),直到到達(dá)某個(gè)葉子節(jié)點(diǎn),并輸出預(yù)測(cè)值;
[0051 ]步驟2.2.重復(fù)執(zhí)行步驟2.1,直到所有的t棵樹(shù)都輸出了預(yù)測(cè)值;
[0052]如果是分類問(wèn)題,則輸出為所有樹(shù)中預(yù)測(cè)概率總和最大的那一個(gè)類,即對(duì)每個(gè)c(j)的P進(jìn)行累計(jì);如果是回歸問(wèn)題,則輸出為所有樹(shù)的輸出的平均值。
[0053]對(duì)于分類問(wèn)題(將某個(gè)樣本劃分到某一類),也就是離散變量問(wèn)題,CART使用Gini值作為評(píng)判標(biāo)準(zhǔn)。定義為Gini = 1-E (P( i )*P( i)),P( i)為當(dāng)前節(jié)點(diǎn)上數(shù)據(jù)集中第i類樣本的比例。例如:分為2類,當(dāng)前節(jié)點(diǎn)上有100個(gè)樣本,屬于第一類的樣本有70個(gè),屬于,第二類的樣本有30個(gè),則Gini = 1-0.7 X 07-0.3X03 = 0.42,可以看出,類別分布越平均,Gini值越大,類分布越不均勾,Gini值,越小。在尋找最佳的分類特征和閾值時(shí),評(píng)判標(biāo)準(zhǔn)為:argmax(Gin1-GiniLeft-GiniRight),即尋找最佳的特征f和閾值th,使,得當(dāng)前節(jié)點(diǎn)的Gini值減去左子節(jié)點(diǎn)的Gini和右子節(jié)點(diǎn)的Gini值最大。
[0054]實(shí)施例2:
[0055]—種基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損方法,包括以下步驟:
[0056]步驟一.選擇車輛所對(duì)應(yīng)的車型數(shù)據(jù)作為總數(shù)據(jù)集;
[0057]步驟二.讀取CAE仿真數(shù)據(jù)和實(shí)車數(shù)據(jù),并相應(yīng)對(duì)數(shù)據(jù)進(jìn)行分類;
[0058]步驟三.判斷車輛在行車過(guò)程中是否發(fā)生碰撞;所述碰撞檢測(cè)子系統(tǒng)對(duì)碰撞訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成碰撞模型,所述碰撞模型建立使用隨機(jī)森林方法;
[0059]步驟四.判斷碰撞發(fā)生的所有工況信息;所述工況檢測(cè)子系統(tǒng)對(duì)工況訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成工況模型,所述工況模型建立使用隨機(jī)森林方法;
[0060]步驟五.判斷車輛碰撞時(shí)零件所產(chǎn)生的損傷等級(jí);所述零件檢測(cè)子系統(tǒng)對(duì)零件訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成零件模型,所述零件模型建立使用隨機(jī)森林方法。
[0061]具體步驟是:
[0062]步驟三包括:
[0063]S3.1.使用碰撞檢測(cè)子系統(tǒng)對(duì)CAE碰撞仿真數(shù)據(jù)處理,再對(duì)其進(jìn)行分類以產(chǎn)生碰撞訓(xùn)練數(shù)據(jù)和碰撞測(cè)試數(shù)據(jù);
[0064]S3.2.在碰撞訓(xùn)練模塊中對(duì)碰撞訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)并產(chǎn)生碰撞模型,來(lái)模擬碰撞訓(xùn)練數(shù)據(jù)的效果;
[0065]S3.3.在碰撞測(cè)試模塊中使用碰撞測(cè)試數(shù)據(jù)來(lái)測(cè)試碰撞模型的結(jié)果;
[0066]S3.4.使用真實(shí)跑車數(shù)據(jù)作為碰撞驗(yàn)證數(shù)據(jù)并帶入碰撞驗(yàn)證模塊,來(lái)驗(yàn)證碰撞模型的準(zhǔn)確性;
[0067]步驟四包括:
[0068]S4.1.使用工況檢測(cè)子系統(tǒng)對(duì)CAE工況仿真數(shù)據(jù)處理,再對(duì)其進(jìn)行分類產(chǎn)生工況訓(xùn)練數(shù)據(jù)和工況測(cè)試數(shù)據(jù);
[0069]S4.2.在工況訓(xùn)練模塊中對(duì)工況訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)并產(chǎn)生工況模型,來(lái)模擬工況訓(xùn)練數(shù)據(jù)的效果;
[0070]S4.3.在工況測(cè)試模塊中使用工況測(cè)試數(shù)據(jù)來(lái)測(cè)試工況模型的結(jié)果;
[0071]S4.4.使用真實(shí)跑車數(shù)據(jù)作為工況驗(yàn)證數(shù)據(jù)并帶入工況驗(yàn)證模塊,來(lái)驗(yàn)證工況模型的準(zhǔn)確性;
[0072]步驟五包括:
[0073]S1.使用零件檢測(cè)子系統(tǒng)對(duì)CAE零件仿真數(shù)據(jù)處理,再對(duì)其進(jìn)行分類以產(chǎn)生零件訓(xùn)練數(shù)據(jù)和零件測(cè)試數(shù)據(jù);
[0074]S2.在零件訓(xùn)練模塊中對(duì)零件訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)并產(chǎn)生零件模型,來(lái)模擬零件訓(xùn)練數(shù)據(jù)的效果;
[0075]S3.在零件測(cè)試模塊中使用零件測(cè)試數(shù)據(jù)來(lái)測(cè)試零件模型的結(jié)果;
[0076]S4.使用真實(shí)跑車數(shù)據(jù)作為零件驗(yàn)證數(shù)據(jù)并帶入零件驗(yàn)證模塊,來(lái)驗(yàn)證零件模型的準(zhǔn)確性。
[0077]所述隨機(jī)森林方法的步驟是:
[0078]步驟1.使用隨機(jī)森林方法建立模型;
[0079]步驟2.使用隨機(jī)森林的預(yù)測(cè)。
[0080]其中,所述步驟I包括:
[0081 ]步驟1.1.給定訓(xùn)練集S,測(cè)試集T,特征維數(shù)F;
[0082]確定參數(shù):使用到的CART的數(shù)量t,每棵樹(shù)的深度d,每個(gè)節(jié)點(diǎn)使用到的特征數(shù)量f;
[0083]終止條件:節(jié)點(diǎn)上最少樣本數(shù)s,節(jié)點(diǎn)上最少的信息增益m;
[0084]對(duì)于第Ι-t 棵樹(shù),i = l_t:
[0085]步驟1.2.從S中有放回的抽取大小和S—樣的訓(xùn)練集S( i),作為根節(jié)點(diǎn)的樣本,從根節(jié)點(diǎn)開(kāi)始訓(xùn)練;
[0086]步驟1.3.如果當(dāng)前節(jié)點(diǎn)上達(dá)到終止條件,則設(shè)置當(dāng)前節(jié)點(diǎn)為葉子節(jié)點(diǎn);
[0087]如果是分類問(wèn)題,該葉子節(jié)點(diǎn)的預(yù)測(cè)輸出為當(dāng)前節(jié)點(diǎn)樣本集合中數(shù)量最多的那一類C( j),概率P為c( j)占當(dāng)前樣本集的比例;
[0088]如果是回歸問(wèn)題,預(yù)測(cè)輸出為當(dāng)前節(jié)點(diǎn)樣本集各個(gè)樣本值的平均值,然后繼續(xù)訓(xùn)練其他節(jié)點(diǎn);
[0089]如果當(dāng)前節(jié)點(diǎn)沒(méi)有達(dá)到終止條件,則從F維特征中無(wú)放回的隨機(jī)選取f維特征,利用f維特征,尋找分類效果最好的一維特征k及其閾值th,當(dāng)前節(jié)點(diǎn)上樣本第k維特征小于th的樣本被劃分到左節(jié)點(diǎn),其余的被劃分到右節(jié)點(diǎn),繼續(xù)訓(xùn)練其他節(jié)點(diǎn)。
[0090]步驟1.4.重復(fù)步驟2至步驟3,直到所有節(jié)點(diǎn)都訓(xùn)練過(guò)了或者被標(biāo)記為葉子節(jié)點(diǎn)。[0091 ] 步驟1.5.重復(fù)重復(fù)步驟2至步驟4,直到所有CART都被訓(xùn)練過(guò);
[0092]所述步驟2包括,對(duì)于第Ι-t棵樹(shù),i = l_t,進(jìn)行如下操作:
[0093]步驟2.1.從當(dāng)前樹(shù)的根節(jié)點(diǎn)開(kāi)始,根據(jù)當(dāng)前節(jié)點(diǎn)的閾值th,判斷是進(jìn)入左節(jié)點(diǎn)(<th),還是進(jìn)入右節(jié)點(diǎn)(> = th),直到到達(dá)某個(gè)葉子節(jié)點(diǎn),并輸出預(yù)測(cè)值;
[0094]步驟2.2.重復(fù)執(zhí)行步驟2.1,直到所有的t棵樹(shù)都輸出了預(yù)測(cè)值;
[0095]如果是分類問(wèn)題,則輸出為所有樹(shù)中預(yù)測(cè)概率總和最大的那一個(gè)類,即對(duì)每個(gè)c(j)的P進(jìn)行累計(jì);如果是回歸問(wèn)題,則輸出為所有樹(shù)的輸出的平均值。
[0096]對(duì)于分類問(wèn)題(將某個(gè)樣本劃分到某一類),也就是離散變量問(wèn)題,CART使用Gini值作為評(píng)判標(biāo)準(zhǔn)。定義為Gini = 1-E (P( i )*P( i)),P( i)為當(dāng)前節(jié)點(diǎn)上數(shù)據(jù)集中第i類樣本的比例。例如:分為2類,當(dāng)前節(jié)點(diǎn)上有100個(gè)樣本,屬于第一類的樣本有70個(gè),屬于,第二類的樣本有30個(gè),則Gini = 1-0.7 X 07-0.3X03 = 0.42,可以看出,類別分布越平均,Gini值越大,類分布越不均勾,Gini值,越小。在尋找最佳的分類特征和閾值時(shí),評(píng)判標(biāo)準(zhǔn)為:argmax(Gin1-GiniLeft-GiniRight),即尋找最佳的特征f和閾值th,使,得當(dāng)前節(jié)點(diǎn)的Gini值減去左子節(jié)點(diǎn)的Gini和右子節(jié)點(diǎn)的Gini值最大。
[0097]實(shí)施例3:
[0098]作為實(shí)施例1或2的進(jìn)一步補(bǔ)充:對(duì)隨機(jī)森林方法進(jìn)行說(shuō)明:
[0099]在機(jī)器學(xué)習(xí)中,隨機(jī)森林由許多的決策樹(shù)組成,因?yàn)檫@些決策樹(shù)的形成采用了隨機(jī)的方法,因此也叫做隨機(jī)決策樹(shù)。隨機(jī)森林中的樹(shù)之間是沒(méi)有關(guān)聯(lián)的。當(dāng)測(cè),試數(shù)據(jù)進(jìn)入隨機(jī)森林時(shí),其實(shí)就是讓每一顆決策樹(shù)進(jìn)行分類,最后取所有決策樹(shù)中分類結(jié)果最多的那類為最終的結(jié)果。因此隨機(jī)森林是一個(gè)包含多個(gè)決策樹(shù)的分類,器,并且其輸出的類別是由個(gè)別樹(shù)輸出的類別的眾數(shù)而定。隨機(jī)森林可以既可以處理屬性為離散值的量,比如ID3算法,也可以處理屬性為連續(xù)值的量,比如,C4.5算法。另外,隨機(jī)森林還可以用來(lái)進(jìn)行無(wú)監(jiān)督學(xué)習(xí)聚類和異常點(diǎn)檢測(cè)。
[0100]隨機(jī)森林由決策樹(shù)組成,決策樹(shù)實(shí)際上是將空間用超平面進(jìn)行劃分的一種方法,每次分割的時(shí)候,都將當(dāng)前的空間一分為二,比如說(shuō)下面的決策樹(shù)(其屬性的值都是連續(xù)的實(shí)數(shù)):
[0101 ]隨機(jī)深林的優(yōu)點(diǎn):比較適合做多分類問(wèn)題;訓(xùn)練和預(yù)測(cè)速度快;對(duì)訓(xùn)練數(shù)據(jù)的容錯(cuò)能力,是一種有效地估計(jì)缺失數(shù)據(jù)的一種方法,當(dāng)數(shù)據(jù)集中有大比例的數(shù)據(jù)缺失時(shí),仍然可以保持精度不變;能夠有效地處理大的數(shù)據(jù)集;可以處理沒(méi)有刪減的成千上萬(wàn)的變量;能夠在分類的過(guò)程中可以生成一個(gè)泛化誤差的內(nèi)部無(wú)偏估計(jì);能夠檢測(cè)到特征之間的相互影響以及重要性程度;不過(guò)出現(xiàn)過(guò)度擬合;實(shí)現(xiàn)簡(jiǎn)單容易并行化。
[0102]本發(fā)明使用隨機(jī)森林方法建立模型方法,具體實(shí)現(xiàn)方法如下:
[0103]步驟1.給定訓(xùn)練集S,測(cè)試集T,特征維數(shù)F。確定參數(shù):使用到的CART的數(shù)量t,每棵樹(shù)的深度d,每個(gè)節(jié)點(diǎn)使用到的特征數(shù)量f,終止條件:節(jié)點(diǎn)上最少樣本數(shù)S,節(jié)點(diǎn)上最少的信息增益m。
[0104]對(duì)于第l_t 棵樹(shù),i = l_t:
[0105]步驟2.從S中有放回的抽取大小和S—樣的訓(xùn)練集S(i),作為根節(jié)點(diǎn)的樣本,從根節(jié)點(diǎn)開(kāi)始訓(xùn)練
[0106]步驟3.如果當(dāng)前節(jié)點(diǎn)上達(dá)到終止條件,則設(shè)置當(dāng)前節(jié)點(diǎn)為葉子節(jié)點(diǎn),如果是分類問(wèn)題,該葉子節(jié)點(diǎn)的預(yù)測(cè)輸出為當(dāng)前節(jié)點(diǎn)樣本集合中數(shù)量最多的那一類c(j),,概率P為c(j)占當(dāng)前樣本集的比例;如果是回歸問(wèn)題,預(yù)測(cè)輸出為當(dāng)前節(jié)點(diǎn)樣本集各個(gè)樣本值的平均值。然后繼續(xù)訓(xùn)練其他節(jié)點(diǎn)。如果當(dāng)前節(jié)點(diǎn)沒(méi)有達(dá)到終止條,件,則從F維特征中無(wú)放回的隨機(jī)選取f維特征。利用這f維特征,尋找分類效果最好的一維特征k及其閾值th,當(dāng)前節(jié)點(diǎn)上樣本第k維特征小于th的樣本被劃,分到左節(jié)點(diǎn),其余的被劃分到右節(jié)點(diǎn)。繼續(xù)訓(xùn)練其他節(jié)點(diǎn)。有關(guān)分類效果的評(píng)判標(biāo)準(zhǔn)在后面會(huì)講。
[0107]步驟4.重復(fù)(2)(3)直到所有節(jié)點(diǎn)都訓(xùn)練過(guò)了或者被標(biāo)記為葉子節(jié)點(diǎn)。
[0108]步驟5.重復(fù)(2),(3),(4)直到所有CART都被訓(xùn)練過(guò)。
[0109]利用隨機(jī)森林的預(yù)測(cè)過(guò)程如下:
[0110]對(duì)于第ι-t 棵樹(shù),i = l_t:
[0?11 ]步驟1.從當(dāng)前樹(shù)的根節(jié)點(diǎn)開(kāi)始,根據(jù)當(dāng)前節(jié)點(diǎn)的閾值th,判斷是進(jìn)入左節(jié)點(diǎn)(〈th)還是進(jìn)入右節(jié)點(diǎn)(> = th),直到到達(dá),某個(gè)葉子節(jié)點(diǎn),并輸出預(yù)測(cè)值。
[0112]步驟2.重復(fù)執(zhí)行(I)直到所有t棵樹(shù)都輸出了預(yù)測(cè)值。如果是分類問(wèn)題,則輸出為所有樹(shù)中預(yù)測(cè)概率總和最大的那一個(gè)類,即對(duì)每個(gè)c(j)的P進(jìn)行累計(jì);如果是回歸問(wèn)題,則輸出為所有樹(shù)的輸出的平均值。
[0113]注:有關(guān)分類效果的評(píng)判標(biāo)準(zhǔn),因?yàn)槭褂玫氖荂ART,因此使用的也是CART的評(píng)判標(biāo)準(zhǔn),和C3.0,C4.5都不相同。
[0114]對(duì)于分類問(wèn)題(將某個(gè)樣本劃分到某一類),也就是離散變量問(wèn)題,CART使用Gini值作為評(píng)判標(biāo)準(zhǔn)。定義為Gini = 1-, Σ (P(i)*P(i)),P(i)為當(dāng)前節(jié)點(diǎn)上數(shù)據(jù)集中第i類樣本的比例。例如:分為2類,當(dāng)前節(jié)點(diǎn)上有100個(gè)樣本,屬于第一類的樣本有70個(gè),屬于,第二類的樣本有30個(gè),則Gini = 1-0.7 X 07-0.3X03 = 0.42,可以看出,類別分布越平均,Gini值越大,類分布越不均勾,Gini值,越小。在尋找最佳的分類特征和閾值時(shí),評(píng)判標(biāo)準(zhǔn)為:argmax(Gin1-GiniLeft-GiniRight),即尋找最佳的特征f和閾值th,使,得當(dāng)前節(jié)點(diǎn)的Gini值減去左子節(jié)點(diǎn)的Gini和右子節(jié)點(diǎn)的Gini值最大。
[0115]實(shí)施例4:具有與實(shí)施例1或2或3相同的技術(shù)方案,更為具體的是:
[0116]上述方案中的總體數(shù)據(jù)集:全部是CAE仿真數(shù)據(jù)和跑車數(shù)據(jù);分為三份如下
[0117]1.訓(xùn)練數(shù)據(jù)集:是用來(lái)訓(xùn)練模型或確定模型參數(shù)(CAE仿真數(shù)據(jù)和跑車數(shù)據(jù))。
[0118]2.驗(yàn)證數(shù)據(jù)集:是用來(lái)做模型選擇(model ,select1n),即做模型的最終優(yōu)化及確定的(CAE仿真數(shù)據(jù)和跑車數(shù)據(jù))。
[0119]3.測(cè)試數(shù)據(jù)集:則純粹是為了測(cè)試已經(jīng)訓(xùn)練好的模型的推廣能力。(CAE仿真數(shù)據(jù)和跑車數(shù)據(jù))。
[0120]本實(shí)施例中還對(duì)定損過(guò)程中涉及的濾波、加權(quán)選取、特征提取、歸一化、特征變換作出了說(shuō)明。
[0121]1.濾波器技術(shù):已實(shí)現(xiàn)的濾波方法包括FIR濾波、FIR切比雪夫逼近法、切比雪夫?yàn)V波、巴特沃茲濾波等,在主程序的Filtering.m文件實(shí)現(xiàn)。各濾波器均為常見(jiàn)的濾波器,Matlab都有相應(yīng)的函數(shù)實(shí)現(xiàn),具體算法可參考信號(hào)處理專業(yè)書籍。此處給出FIR濾波器的內(nèi)容和流程的介紹。
[0122]有限沖擊響應(yīng)數(shù)字濾波器(FIR,Finite,Impulse,Response)是一種全零點(diǎn)的系統(tǒng),F(xiàn)IR濾波器的設(shè)計(jì)在保證幅度特性滿足技術(shù)要求的同事,很容易做到嚴(yán)格的線性相位特性,所以據(jù)有穩(wěn)定和線性相位特性是FIR濾波器的突出優(yōu)點(diǎn)。切比雪夫逼近法是一種等波紋逼近法,能夠使誤差頻帶均勻分布,對(duì)同樣的技術(shù)指標(biāo),這種比肩發(fā)需要的濾波器階數(shù)低,對(duì)于同樣階數(shù)的濾波器,這種逼近法最大誤差最小,其設(shè)計(jì)的主要步驟如下:
[0123]步驟1:濾波器參數(shù)的設(shè)置
[0124]濾波器的參數(shù)包括:通帶截止頻率、阻帶截止頻率、通帶最大衰減和阻帶最小衰減;
[0125]步驟2:設(shè)置在通帶和阻帶上理想的幅頻響應(yīng)
[0126]步驟3:給定在通帶截止頻率和阻帶截止頻率點(diǎn)上的加權(quán)
[0127]步驟4:利用方程計(jì)算切比雪夫逼近法濾波器系數(shù)
[0128]步驟5:保存系數(shù)
[0129]步驟6:提取系數(shù)進(jìn)行數(shù)據(jù)濾波
[0130]其中:濾波器參數(shù)的設(shè)置是為了保證信號(hào)在進(jìn)行處理的過(guò)程中不會(huì)出現(xiàn)失真現(xiàn)象,濾波后的信號(hào)的截止頻率和采樣頻率需要滿足奈奎斯特定理,也就是在濾波后信號(hào)的最高頻率不能超過(guò)原信號(hào)采樣頻率的1/2,否則就會(huì)出現(xiàn)漏頻現(xiàn)象。根據(jù)目前項(xiàng)目中的信號(hào)采集板的采樣頻率主要是50Hz和IKHz,以50Hz為例根據(jù)公式F#±,〈50/2,故選擇濾波器截止頻率在25以下。
[0131]2.特征提取技術(shù):特征抽取是在碰撞信號(hào)上進(jìn)行的。判斷碰撞使用的特征包括窗口內(nèi)加速度絕對(duì)值的最大值、窗口內(nèi)加速度最大值與最小值之間的差值、窗口內(nèi)加速度的平均能量(窗口內(nèi)所有點(diǎn)的加速度的平方和除以點(diǎn)數(shù))、窗口內(nèi)各點(diǎn)斜率的絕對(duì)值的平均值。
[0132]判斷零件種類所使用的特征包括速度、加速度最大值到最小值之間的平均能量、最大值和最小值之間的幅值,/,兩者之間的寬度、加速度最大值、加速度最小值、最大值所在半波的寬度、最小值所在半波的寬度、最大值和最小值之間的差值、最大值到最小值之間的跨度、各點(diǎn)斜率的絕對(duì)值的平均值、信號(hào)進(jìn)行傅立葉變換后O?38頻率范圍內(nèi)的信號(hào)的各個(gè)頻率分量的幅值。
[0133]3.歸一化技術(shù):為了消除特征之間的量綱或數(shù)量級(jí)不同而對(duì)分類任務(wù)造成的不利影響,需要對(duì)特征數(shù)據(jù)進(jìn)行歸一化處理,使得各特征值之間具有可比性,避免數(shù)值較大的特征淹沒(méi)數(shù)值較小的特征。原始的特征數(shù)據(jù)經(jīng)過(guò)歸一化處理后,各特征處于相同的值域范圍。由于Z-Score的性能表現(xiàn)更好,使用Z-Score做為歸一化方法。
[0134]4.特征變換技術(shù):在特征較多的情況下,為了消除特征之間的相關(guān)性并減少冗余特征,需要對(duì)特征進(jìn)行變換,用盡可能少的新特征來(lái)反映樣本信息。在實(shí)驗(yàn)樣本較少的情況下(本項(xiàng)目的實(shí)際情況)降低過(guò)多的特征維數(shù),還能在一定程度上避免過(guò)擬合或欠擬合的發(fā)生。根據(jù)實(shí)際需要,目前已實(shí)現(xiàn)的特征變換是PCA。通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),PCA對(duì)于提高本項(xiàng)目的分類性能并無(wú)幫助,甚至還有所下降,這是由于目前所使用的特征較少,沒(méi)有冗余特征,因此暫不使用PCA,但是隨著后續(xù)特征的逐步增加,不排除以后使用PCA的可能性。
[0135]附圖1中,記載的:車型選擇即為本發(fā)明中的車型選擇子系統(tǒng);數(shù)據(jù)分類模塊即為本發(fā)明中的數(shù)據(jù)分類子系統(tǒng);碰撞判斷模塊即為本發(fā)明中的碰撞檢測(cè)子系統(tǒng);工況檢測(cè)模塊即為本發(fā)明的工況檢測(cè)子系統(tǒng);車型檢測(cè)模塊即為本發(fā)明的車型檢測(cè)子系統(tǒng);零件檢測(cè)模塊即零件檢測(cè)子系統(tǒng);目標(biāo)檢測(cè)模塊即為本發(fā)明的目標(biāo)檢測(cè)子系統(tǒng),區(qū)域檢測(cè)模塊即為本發(fā)明的區(qū)域檢測(cè)子系統(tǒng)。
[0136]以上所述,僅為本發(fā)明創(chuàng)造較佳的【具體實(shí)施方式】,但本發(fā)明創(chuàng)造的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明創(chuàng)造披露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明創(chuàng)造的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應(yīng)涵蓋在本發(fā)明創(chuàng)造的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損系統(tǒng),其特征在于,包括: 車型選擇子系統(tǒng),選擇車輛所對(duì)應(yīng)的車型數(shù)據(jù)作為總數(shù)據(jù)集; 數(shù)據(jù)分類子系統(tǒng),讀取CAE仿真數(shù)據(jù)和實(shí)車數(shù)據(jù),并相應(yīng)對(duì)數(shù)據(jù)進(jìn)行分類; 碰撞檢測(cè)子系統(tǒng),判斷車輛在行車過(guò)程中是否發(fā)生碰撞;所述碰撞檢測(cè)子系統(tǒng)對(duì)碰撞訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成碰撞模型,所述碰撞模型建立使用隨機(jī)森林方法; 工況檢測(cè)子系統(tǒng),判斷碰撞發(fā)生的所有工況信息;所述工況檢測(cè)子系統(tǒng)對(duì)工況訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成工況模型,所述工況模型建立使用隨機(jī)森林方法; 零件檢測(cè)子系統(tǒng),判斷車輛碰撞時(shí)零件所產(chǎn)生的損傷等級(jí);所述零件檢測(cè)子系統(tǒng)對(duì)零件訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成零件模型,所述零件模型建立使用隨機(jī)森林方法。2.如權(quán)利要求1所述的基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損系統(tǒng),其特征在于, 所述碰撞檢測(cè)子系統(tǒng)包括,碰撞訓(xùn)練模塊、碰撞測(cè)試模塊、碰撞驗(yàn)證模塊,所述碰撞訓(xùn)練模塊用于對(duì)碰撞訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成碰撞模型,碰撞測(cè)試模塊用于將碰撞測(cè)試數(shù)據(jù)帶入碰撞模型中檢測(cè)碰撞模型的結(jié)果,碰撞驗(yàn)證模塊使用真實(shí)跑車數(shù)據(jù)驗(yàn)證碰撞模型的可靠性和準(zhǔn)確率; 所述工況檢測(cè)子系統(tǒng)包括,工況訓(xùn)練模塊、工況測(cè)試模塊、工況驗(yàn)證模塊,所述工況訓(xùn)練模塊用于對(duì)工況訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成工況模型,所述工況測(cè)試模塊用于將工況測(cè)試數(shù)據(jù)帶入模型中檢測(cè)工況模型的結(jié)果,工況驗(yàn)證模塊使用真實(shí)跑車數(shù)據(jù)驗(yàn)證工況模型的可靠性和準(zhǔn)確率; 所述零件檢測(cè)子系統(tǒng)包括,零件訓(xùn)練模塊、零件測(cè)試模塊、零件驗(yàn)證模塊,所述零件訓(xùn)練模塊用于將零件訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成零件模型,零件測(cè)試模塊用于將零件測(cè)試數(shù)據(jù)帶入模型中檢測(cè)零件模型的結(jié)果,零件驗(yàn)證模塊使用真實(shí)跑車數(shù)據(jù)驗(yàn)證零件模型的可靠性和準(zhǔn)確率。3.如權(quán)利要求1或2所述的基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損系統(tǒng),其特征在于,所述隨機(jī)森林方法的步驟是: 步驟I.使用隨機(jī)森林方法建立模型; 步驟2.使用隨機(jī)森林的預(yù)測(cè)。4.如權(quán)利要求3所述的基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損系統(tǒng),所述步驟I包括: 步驟1.1.給定訓(xùn)練集S,測(cè)試集T,特征維數(shù)F,確定以下參數(shù):使用到的CART的數(shù)量t,每棵樹(shù)的深度d,每個(gè)節(jié)點(diǎn)使用到的特征數(shù)量f; 確定終止條件:節(jié)點(diǎn)上最少樣本數(shù)S,節(jié)點(diǎn)上最少的信息增益m; 對(duì)于第1-t棵樹(shù),i = Ι-t: 步驟1.2.從訓(xùn)練集S中有放回的抽取大小和訓(xùn)練集S—樣的訓(xùn)練集S( i),作為根節(jié)點(diǎn)的樣本,從根節(jié)點(diǎn)開(kāi)始訓(xùn)練; 步驟1.3.如果當(dāng)前節(jié)點(diǎn)上達(dá)到終止條件,則設(shè)置當(dāng)前節(jié)點(diǎn)為葉子節(jié)點(diǎn); 如果是分類問(wèn)題,該葉子節(jié)點(diǎn)的預(yù)測(cè)輸出為當(dāng)前節(jié)點(diǎn)樣本集合中數(shù)量最多的那一類c(j),概率P為C( j)占當(dāng)前樣本集的比例; 如果是回歸問(wèn)題,預(yù)測(cè)輸出為當(dāng)前節(jié)點(diǎn)樣本集各個(gè)樣本值的平均值,然后繼續(xù)訓(xùn)練其他節(jié)點(diǎn); 如果當(dāng)前節(jié)點(diǎn)沒(méi)有達(dá)到終止條件,則從F維特征中無(wú)放回的隨機(jī)選取f維特征,利用f維特征,尋找分類效果最好的一維特征k及其閾值th,當(dāng)前節(jié)點(diǎn)上樣本第k維特征小于th的樣本被劃分到左節(jié)點(diǎn),其余的被劃分到右節(jié)點(diǎn),繼續(xù)訓(xùn)練其他節(jié)點(diǎn); 步驟1.4.重復(fù)步驟1.2至步驟1.3,直到所有節(jié)點(diǎn)都訓(xùn)練過(guò)了或者被標(biāo)記為葉子節(jié)點(diǎn); 步驟1.5.重復(fù)重復(fù)步驟1.2至步驟1.4,直到所有CART都被訓(xùn)練過(guò)。5.如權(quán)利要求3所述的基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損系統(tǒng),其特征在于,所述步驟2,對(duì)于第1-t棵樹(shù),i = 1-t,進(jìn)行如下操作: 步驟2.1.從當(dāng)前樹(shù)的根節(jié)點(diǎn)開(kāi)始,根據(jù)當(dāng)前節(jié)點(diǎn)的閾值th,判斷是進(jìn)入左節(jié)點(diǎn)(〈th),還是進(jìn)入右節(jié)點(diǎn)(> = th),直到到達(dá)某個(gè)葉子節(jié)點(diǎn),并輸出預(yù)測(cè)值; 步驟2.2.重復(fù)執(zhí)行步驟2.1,直到所有的t棵樹(shù)都輸出了預(yù)測(cè)值; 如果是分類問(wèn)題,則輸出為所有樹(shù)中預(yù)測(cè)概率總和最大的那一個(gè)類,即對(duì)每個(gè)c(j)的P進(jìn)行累計(jì);如果是回歸問(wèn)題,則輸出為所有樹(shù)的輸出的平均值。6.—種基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損方法,其特征在于,包括以下步驟: 步驟一.選擇車輛所對(duì)應(yīng)的車型數(shù)據(jù)作為總數(shù)據(jù)集; 步驟二.讀取CAE仿真數(shù)據(jù)和實(shí)車數(shù)據(jù),并相應(yīng)對(duì)數(shù)據(jù)進(jìn)行分類; 步驟三.判斷車輛在行車過(guò)程中是否發(fā)生碰撞;對(duì)碰撞訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成碰撞模型,所述碰撞模型建立使用隨機(jī)森林方法; 步驟四.判斷碰撞發(fā)生的所有工況信息;對(duì)工況訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成工況模型,所述工況模型建立使用隨機(jī)森林方法; 步驟五.判斷車輛碰撞時(shí)零件所產(chǎn)生的損傷等級(jí);對(duì)零件訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)從而生成零件模型,所述零件模型建立使用隨機(jī)森林方法。7.如權(quán)利要求6所述的基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損方法,其特征在于,具體步驟是: 步驟三包括: 53.1.使用碰撞檢測(cè)子系統(tǒng)對(duì)CAE碰撞仿真數(shù)據(jù)處理,再對(duì)其進(jìn)行分類以產(chǎn)生碰撞訓(xùn)練數(shù)據(jù)和碰撞測(cè)試數(shù)據(jù); 53.2.在碰撞訓(xùn)練模塊中對(duì)碰撞訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)并產(chǎn)生碰撞模型,來(lái)模擬碰撞訓(xùn)練數(shù)據(jù)的效果; 53.3.在碰撞測(cè)試模塊中使用碰撞測(cè)試數(shù)據(jù)來(lái)測(cè)試碰撞模型的結(jié)果; 53.4.使用真實(shí)跑車數(shù)據(jù)作為碰撞驗(yàn)證數(shù)據(jù)并帶入碰撞驗(yàn)證模塊,來(lái)驗(yàn)證碰撞模型的準(zhǔn)確性; 步驟四包括: 54.1.使用工況檢測(cè)子系統(tǒng)對(duì)CAE工況仿真數(shù)據(jù)處理,再對(duì)其進(jìn)行分類產(chǎn)生工況訓(xùn)練數(shù)據(jù)和工況測(cè)試數(shù)據(jù); 54.2.在工況訓(xùn)練模塊中對(duì)工況訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)并產(chǎn)生工況模型,來(lái)模擬工況訓(xùn)練數(shù)據(jù)的效果; 54.3.在工況測(cè)試模塊中使用工況測(cè)試數(shù)據(jù)來(lái)測(cè)試工況模型的結(jié)果; 54.4.使用真實(shí)跑車數(shù)據(jù)作為工況驗(yàn)證數(shù)據(jù)并帶入工況驗(yàn)證模塊,來(lái)驗(yàn)證工況模型的準(zhǔn)確性; 步驟五包括: 51.使用零件檢測(cè)子系統(tǒng)對(duì)CAE零件仿真數(shù)據(jù)處理,再對(duì)其進(jìn)行分類以產(chǎn)生零件訓(xùn)練數(shù)據(jù)和零件測(cè)試數(shù)據(jù); 52.在零件訓(xùn)練模塊中對(duì)零件訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)并產(chǎn)生零件模型,來(lái)模擬零件訓(xùn)練數(shù)據(jù)的效果; 53.在零件測(cè)試模塊中使用零件測(cè)試數(shù)據(jù)來(lái)測(cè)試零件模型的結(jié)果; 54.使用真實(shí)跑車數(shù)據(jù)作為零件驗(yàn)證數(shù)據(jù)并帶入零件驗(yàn)證模塊,來(lái)驗(yàn)證零件模型的準(zhǔn)確性。8.如權(quán)利要求6或7所述的基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損方法,其特征在于,所述隨機(jī)森林方法的步驟是: 步驟I.使用隨機(jī)森林方法建立模型; 步驟2.使用隨機(jī)森林的預(yù)測(cè)。9.如權(quán)利要求8所述的基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損方法,所述步驟I包括: 所述步驟I包括: 步驟1.1.給定訓(xùn)練集S,測(cè)試集T,特征維數(shù)F,確定以下參數(shù):使用到的CART的數(shù)量t,每棵樹(shù)的深度d,每個(gè)節(jié)點(diǎn)使用到的特征數(shù)量f; 確定終止條件:節(jié)點(diǎn)上最少樣本數(shù)S,節(jié)點(diǎn)上最少的信息增益m; 對(duì)于第1-t棵樹(shù),i = Ι-t: 步驟1.2.從訓(xùn)練集S中有放回的抽取大小和訓(xùn)練集S—樣的訓(xùn)練集S( i),作為根節(jié)點(diǎn)的樣本,從根節(jié)點(diǎn)開(kāi)始訓(xùn)練; 步驟1.3.如果當(dāng)前節(jié)點(diǎn)上達(dá)到終止條件,則設(shè)置當(dāng)前節(jié)點(diǎn)為葉子節(jié)點(diǎn); 如果是分類問(wèn)題,該葉子節(jié)點(diǎn)的預(yù)測(cè)輸出為當(dāng)前節(jié)點(diǎn)樣本集合中數(shù)量最多的那一類c(j),概率P為C( j)占當(dāng)前樣本集的比例; 如果是回歸問(wèn)題,預(yù)測(cè)輸出為當(dāng)前節(jié)點(diǎn)樣本集各個(gè)樣本值的平均值,然后繼續(xù)訓(xùn)練其他節(jié)點(diǎn); 如果當(dāng)前節(jié)點(diǎn)沒(méi)有達(dá)到終止條件,則從F維特征中無(wú)放回的隨機(jī)選取f維特征,利用f維特征,尋找分類效果最好的一維特征k及其閾值th,當(dāng)前節(jié)點(diǎn)上樣本第k維特征小于th的樣本被劃分到左節(jié)點(diǎn),其余的被劃分到右節(jié)點(diǎn),繼續(xù)訓(xùn)練其他節(jié)點(diǎn); 步驟1.4.重復(fù)步驟1.2至步驟1.3,直到所有節(jié)點(diǎn)都訓(xùn)練過(guò)了或者被標(biāo)記為葉子節(jié)點(diǎn); 步驟1.5.重復(fù)重復(fù)步驟1.2至步驟1.4,直到所有CART都被訓(xùn)練過(guò)。10.如權(quán)利要求8所述的基于人工智能隨機(jī)森林方法建立不同車型分零件遠(yuǎn)程定損方法,其特征在于,所述步驟2,對(duì)于第1-t棵樹(shù),i = 1-t,進(jìn)行如下操作: 步驟2.1.從當(dāng)前樹(shù)的根節(jié)點(diǎn)開(kāi)始,根據(jù)當(dāng)前節(jié)點(diǎn)的閾值th,判斷是進(jìn)入左節(jié)點(diǎn)(〈th),還是進(jìn)入右節(jié)點(diǎn)(> = th),直到到達(dá)某個(gè)葉子節(jié)點(diǎn),并輸出預(yù)測(cè)值; 步驟2.2.重復(fù)執(zhí)行步驟2.1,直到所有的t棵樹(shù)都輸出了預(yù)測(cè)值; 如果是分類問(wèn)題,則輸出為所有樹(shù)中預(yù)測(cè)概率總和最大的那一個(gè)類,即對(duì)每個(gè)c(j)的P進(jìn)行累計(jì);如果是回歸問(wèn)題,則輸出為所有樹(shù)的輸出的平均值。
【文檔編號(hào)】G06K9/62GK106056150SQ201610365554
【公開(kāi)日】2016年10月26日
【申請(qǐng)日】2016年5月27日
【發(fā)明人】田雨農(nóng), 劉俊俍
【申請(qǐng)人】大連樓蘭科技股份有限公司