欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種用于預(yù)估m(xù)ocvd工藝結(jié)果的數(shù)據(jù)挖掘方法

文檔序號:6508595閱讀:323來源:國知局
一種用于預(yù)估m(xù)ocvd工藝結(jié)果的數(shù)據(jù)挖掘方法
【專利摘要】本發(fā)明公開了一種用于預(yù)估MOCVD工藝結(jié)果的數(shù)據(jù)挖掘方法,該方法將MOCVD工藝中寫入到日志記錄表中的多條操作記錄合并、統(tǒng)計(jì),挖掘出其中較為頻繁的操作記錄集,然后推導(dǎo)出這些記錄之間的關(guān)聯(lián)規(guī)則,最后根據(jù)MOCVD工藝結(jié)果的好壞,評估、分析這些操作對工藝結(jié)果所造成的影響,如果工藝結(jié)果理想,那么這些記錄集可以作為下次工藝的參考;如果不理想,那么可以提醒工藝人員在進(jìn)行下一次工藝時(shí),盡量避免進(jìn)行同樣的一系列操作。
【專利說明】—種用于預(yù)估MOCVD工藝結(jié)果的數(shù)據(jù)挖掘方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及MOCVD工藝結(jié)果數(shù)據(jù)挖掘領(lǐng)域,特別是一種用于預(yù)估MOCVD工藝結(jié)果的數(shù)據(jù)挖掘方法。
【背景技術(shù)】
[0002]隨著計(jì)算機(jī)硬件技術(shù)的提高,計(jì)算機(jī)對數(shù)據(jù)的處理能力也在日漸提升,加上當(dāng)前互聯(lián)網(wǎng)絡(luò)的發(fā)展以及普及,數(shù)據(jù)信息量在不斷上漲,人們已經(jīng)進(jìn)入了一個(gè)信息爆炸的時(shí)代。人們除了利用現(xiàn)有的關(guān)系數(shù)據(jù)庫標(biāo)準(zhǔn)查詢語句得到一般的直觀的信息以外,很多時(shí)候因?yàn)闃I(yè)務(wù)的需求不得不挖掘其內(nèi)含的、未知的卻又實(shí)際存在的數(shù)據(jù)關(guān)系,而這些數(shù)據(jù)關(guān)系往往是對業(yè)務(wù)存在極大價(jià)值,也是人們迫切想要知道的信息。這就對個(gè)人,尤其是對企業(yè)而言,如何從這些海量的數(shù)據(jù)當(dāng)中挖掘出潛在的,有用的信息提出了不小的挑戰(zhàn)。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息的過程。
[0003]一項(xiàng)MOCVD工藝包含了質(zhì)量流量計(jì)、壓力控制計(jì)、溫度、轉(zhuǎn)速等多個(gè)設(shè)備的實(shí)時(shí)數(shù)據(jù)。一項(xiàng)工藝一般要進(jìn)行數(shù)個(gè)小時(shí),從工藝開始到結(jié)束,會產(chǎn)生大量的實(shí)時(shí)數(shù)據(jù)以及操作記錄。除了在工藝運(yùn)行前預(yù)備的工藝運(yùn)行方案以外,現(xiàn)場工藝運(yùn)行中的一些實(shí)時(shí)操作也會對工藝結(jié)果造成影響,甚至有可能直接關(guān)系到工藝結(jié)果的好壞。因此,一項(xiàng)工藝運(yùn)行當(dāng)中的操作記錄,即使在工藝運(yùn)行過程當(dāng)中沒有出現(xiàn)意外或者報(bào)警,在一定程度上也存在可參考的價(jià)值。所以從這些實(shí)時(shí)的現(xiàn)場記錄當(dāng)中,挖掘出其中潛在的關(guān)聯(lián)關(guān)系也對下次工藝的運(yùn)行具有一定的參考意義。

【發(fā)明內(nèi)容】

[0004]本發(fā)明所要解決的技術(shù)問題是,針對現(xiàn)有技術(shù)不足,提供一種用于預(yù)估MOCVD工藝結(jié)果的數(shù)據(jù)挖掘方法,預(yù)估計(jì)現(xiàn)場工藝運(yùn)行中的實(shí)時(shí)操作對工藝結(jié)果的影響程度,并根據(jù)工藝結(jié)果的好壞,估計(jì)每一項(xiàng)操作的可行性,為下一次工藝操作提供指導(dǎo)。
[0005]為解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是:一種用于預(yù)估MOCVD工藝結(jié)果的數(shù)據(jù)挖掘方法,該方法為:
[0006]I)將MOCVD工藝數(shù)據(jù)以字符串格式存儲在原始數(shù)據(jù)庫中;
[0007]2)統(tǒng)計(jì)所述原始數(shù)據(jù)庫中各MOCVD操作事件出現(xiàn)的次數(shù),保留出現(xiàn)次數(shù)不小于最小支持度S的MOCVD操作事件,并記為I維元素,利用所述I維元素生成I維元素集L1 ;其中,最小支持度S取值范圍為2?6 ;
[0008]3)將I維元素集L1中的I維元素兩兩合并,生成2維候選項(xiàng)目集C2 ;
[0009]4)計(jì)算2維候選項(xiàng)目集C2中的2維元素在原始數(shù)據(jù)庫中的支持度,即統(tǒng)計(jì)C2中組成每個(gè)2維元素的I維元素在原始數(shù)據(jù)庫各條操作記錄中同時(shí)出現(xiàn)的次數(shù),刪除2維候選項(xiàng)目集C2中支持度小于最小支持度的2維元素,并將2維候選項(xiàng)目集C2中支持度不小于最小支持度的2維元素記錄在2維元素項(xiàng)目集L2中;[0010]5)統(tǒng)計(jì)2維元素項(xiàng)目集L2中I維元素的頻度,即統(tǒng)計(jì)2維元素項(xiàng)目集L2中所有I維元素出現(xiàn)的次數(shù),并刪除L2中包含有出現(xiàn)次數(shù)小于2的I維元素的2維元素,并用剩余的2維元素組成新的2維元素項(xiàng)目集L21 ;
[0011]6)利用新的2維元素項(xiàng)目集L21,根據(jù)步驟3)~步驟5)類推,直到生成k維候選項(xiàng)目集ck,并且利用Ck不能再生成下一維項(xiàng)目集;
[0012]7)計(jì)算Ck的支持度S(Ck),即計(jì)算Ck中組成每個(gè)k維元素的I維元素在原始數(shù)據(jù)庫各條操作記錄中同時(shí)出現(xiàn)的次數(shù);設(shè)Ca為Ck的子集,設(shè)Ca中的元素為m維元素,計(jì)算Ca的支持度S (Ca),S (Ca)的支持度即Ck中組成每個(gè)m維元素的I維元素在原始數(shù)據(jù)庫各條操作記錄中同時(shí)出現(xiàn)的次數(shù);其中,m < k ;
[0013]8)如果S (Ck) /S (Ca)≥最小置信度C,那么就存在如下規(guī)則Ca—〉Cs (a),其中Cs (a)為Ca在Ck中的補(bǔ)集,Ca—〉Cs (a)表示“由于執(zhí)行了 Ca中元素的操作,可能發(fā)生Cs(a)中元素的操作”,最小置信度C的取值范圍為0.4~I。
[0014]所述步驟I)中,原始數(shù)據(jù)庫為日志記錄表,所述日記記錄表中包括若干條操作記錄,每條操作記錄均包括登記編號和操作事件。
[0015]所述步驟2)中,最小支持度S取值為3或4。
[0016]所述步驟8)中,最小置信度C取值為0.6或0.7。
[0017]MOCVD工藝數(shù)據(jù)一般為以下幾種類型:質(zhì)量流量計(jì)數(shù)據(jù)包括H2、N2、NH3三種載氣流量,SiH4(硅烷)流量以及MO源(三甲基鋁、三甲基鎵、三乙基鎵、二茂鎂、三甲基銦)的流量;壓力控制計(jì)數(shù)據(jù)包括反應(yīng)室壓力、三種載氣壓力和MO源壓力;石墨盤的溫度和轉(zhuǎn)速。工藝操作主要就是對上述對象進(jìn)行設(shè)置、更改。
[0018]與現(xiàn)有技術(shù)相比,本發(fā)明所具有的有益效果為:本發(fā)明將MOCVD工藝中寫入到日志記錄表中的多條操作記錄合并、統(tǒng)計(jì),挖掘出其中較為頻繁的操作記錄集,然后推導(dǎo)出這些記錄之間的關(guān)聯(lián)規(guī)則,最后根據(jù)MOCVD工藝結(jié)果的好壞,評估、分析這些操作對工藝結(jié)果所造成的影響,如果工藝結(jié)果理想,那么這些記錄集可以作為下次工藝的參考;如果不理想,那么可以提醒工藝人員在進(jìn)行下一次工藝時(shí),盡量避免進(jìn)行同樣的一系列操作;本發(fā)明可靠性高,對MOCVD工藝的運(yùn)行具有重要的參考意義。
【專利附圖】

【附圖說明】
[0019]圖1為本發(fā)明一實(shí)施例挖掘最大頻繁項(xiàng)目集的示意圖。
【具體實(shí)施方式】
[0020]本發(fā)明的數(shù)據(jù)挖掘步驟如下:
[0021]步驟1:統(tǒng)計(jì)所有I維元素出現(xiàn)的次數(shù),保留次數(shù)不小于最小支持度的I維元素,生成I維頻繁項(xiàng)目集U。
[0022]步驟2:通過合并L1中所有I維頻繁項(xiàng),生成2維候選項(xiàng)集,以此類推。通過第(k-Ι)維頻繁項(xiàng)集Llri,合并生成k維候選項(xiàng)集Ck。因?yàn)樽畲箜?xiàng)目集的子集必為最大項(xiàng)目集。所以在計(jì)算Ck中元素支持度時(shí),先刪除Ck中所有(k-Ι)維子集不在Llrl中的項(xiàng)目集。
[0023]步驟3:掃描原始數(shù)據(jù)庫,計(jì)算Ck中每個(gè)元素在原始數(shù)據(jù)庫中的支持度。然后將統(tǒng)計(jì)后的支持度同最小支持度比較,刪除那些支持度小于最小支持度的項(xiàng)目,生成k維頻繁項(xiàng)集Lk。
[0024]步驟4:統(tǒng)計(jì)Lk中每個(gè)1維元素的個(gè)數(shù),若它的計(jì)數(shù)小于k-1的話,說明該元素不是組成Lk+1項(xiàng)目集的元素。因?yàn)閷σ粋€(gè)1維元素而言,要成為k維項(xiàng)目集中的元素的話,該元素在k-1階頻繁項(xiàng)目集中的計(jì)數(shù)必須大于或等于k-1個(gè),否則不可能生成k維項(xiàng)目集。
[0025]步驟5:重復(fù)步驟2的內(nèi)容,直到不能再生成下一維項(xiàng)目集。
[0026]原始數(shù)據(jù)集是存儲MOCVD工藝數(shù)據(jù)的一個(gè)數(shù)據(jù)集合,包含了數(shù)十張數(shù)據(jù)表,日志記錄表是其中之一,表中每條日志記錄包含了登記編號、登記日期、工藝編號、日志類型以及操作事件這5列內(nèi)容。每條記錄的內(nèi)容都是以字符串的格式存儲在數(shù)據(jù)表中。
[0027]本發(fā)明的數(shù)據(jù)挖掘方法是以日志表中的操作事件為對象,對每條操作事件進(jìn)行編號,然后按兩兩組合的方式合并每條記錄,生成高一維的數(shù)據(jù)記錄集,然后統(tǒng)計(jì)這些數(shù)據(jù)記錄集個(gè)數(shù),挖掘出最大頻繁項(xiàng)集。記錄集的維數(shù)就是集合中每個(gè)元素包含的操作事件的個(gè)數(shù),其中元素相當(dāng)于前面的操作事件的內(nèi)容,是一個(gè)字符串?dāng)?shù)據(jù)。
[0028]本發(fā)明的核心思想是利用頻繁項(xiàng)集的任何非空子集必定是頻繁的,非頻繁項(xiàng)集的任何超集必定是非頻繁的這一定論,以遞歸的方式,每次對數(shù)據(jù)庫進(jìn)行掃描來計(jì)算每一維的候選項(xiàng)集的支持度,發(fā)現(xiàn)所有的最大頻繁項(xiàng)集后,進(jìn)一步生成關(guān)聯(lián)規(guī)則。
[0029]由于工藝數(shù)據(jù)量龐大,所以不可避免會出現(xiàn)影響算法效率的問題,主要是每一步產(chǎn)生候選項(xiàng)目集時(shí)循環(huán)產(chǎn)生的組合過多??紤]到上述問題,本發(fā)明采用了候選集元素計(jì)數(shù)的方法來減少產(chǎn)生候選集的組合,提高發(fā)明效率。
[0030]本發(fā)明中,最小支持度范圍為[2,6],定義太小可能會得到很多無意義的結(jié)果。一般,數(shù)值越大得到的結(jié)果就越精確。但是定義過大又可能得不到任何結(jié)果,所以一般設(shè)置其為3或4。同理,最小置信度范圍為[0.4,I],一般取值為0.6或0.7較為適中。
[0031]圖1中,假定最小支持度support=3,最小置信度confidence=。.7, T1, T2....Tn表示每一事務(wù)的編號。I1,I2....In表示工藝中每一次操作記錄,屬于字符串格式,如下表1所示:
[0032]表1圖1中I維元素代表的操作
[0033]
【權(quán)利要求】
1.一種用于預(yù)估MOCVD工藝結(jié)果的數(shù)據(jù)挖掘方法,其特征在于,該方法為: 1)將MOCVD工藝數(shù)據(jù)及對所述MOCVD工藝數(shù)據(jù)的工藝操作以字符串格式存儲在原始數(shù)據(jù)庫中; 2)統(tǒng)計(jì)所述原始數(shù)據(jù)庫中各MOCVD操作事件出現(xiàn)的次數(shù),保留出現(xiàn)次數(shù)不小于最小支持度S的MOCVD操作事件,并記為I維元素,利用所述I維元素生成I維元素集L1 ;其中,最小支持度S取值范圍為2~6 ; 3)將I維元素集L1中的I維元素兩兩合并,生成2維候選項(xiàng)目集C2; 4)計(jì)算2維候選項(xiàng)目集C2中的2維元素在原始數(shù)據(jù)庫中的支持度,即統(tǒng)計(jì)C2中組成每個(gè)2維元素的I維元素在原始數(shù)據(jù)庫各條操作記錄中同時(shí)出現(xiàn)的次數(shù),刪除2維候選項(xiàng)目集C2中支持度小于最小支持度的2維元素,并將2維候選項(xiàng)目集C2中支持度不小于最小支持度的2維元素記錄在2維元素項(xiàng)目集L2中; 5)統(tǒng)計(jì)2維元素項(xiàng)目集L2中I維元素的頻度,即統(tǒng)計(jì)2維元素項(xiàng)目集L2中所有I維元素出現(xiàn)的次數(shù),并刪除L2中包含有出現(xiàn)次數(shù)小于2的I維元素的2維元素,并用剩余的2維元素組成新的2維元素項(xiàng)目集L21 ; 6)利用新的2維元素項(xiàng)目集L21,根據(jù)步驟3)~步驟5)類推,直到生成k維候選項(xiàng)目集Ck,并且利用Ck不能再生成下一維項(xiàng)目集; 7)計(jì)算Ck的支持度S(Ck),即計(jì)算Ck中組成每個(gè)k維元素的I維元素在原始數(shù)據(jù)庫各條操作記錄中同時(shí)出現(xiàn)的次數(shù);設(shè)Ca為Ck的子集,設(shè)Ca中的元素為m維元素,計(jì)算Ca的支持度S (Ca),S (Ca)的支持度即Ck中組成每個(gè)m維元素的I維元素在原始數(shù)據(jù)庫各條操作記錄中同時(shí)出現(xiàn)的次數(shù);其中,m < k ; 8)如果S(Ck)/S (Ca)≥最小置信度C,那么就存在如下規(guī)則Ca—〉Cs (a),其中Cs (a)為(;在(;中的補(bǔ)集,C->Cs(a)表示“由于執(zhí)行了 Ca中元素的操作,可能發(fā)生Cs (a)中元素的操作”,最小置信度C的取值范圍為0.4~I。
2.根據(jù)權(quán)利要求1所述的用于預(yù)估MOCVD工藝結(jié)果的數(shù)據(jù)挖掘方法,其特征在于,所述步驟I)中,原始數(shù)據(jù)庫為日志記錄表,所述日記記錄表中包括若干條操作記錄,每條操作記錄均包括登記編號和操作事件。
3.根據(jù)權(quán)利要求1所述的用于預(yù)估MOCVD工藝結(jié)果的數(shù)據(jù)挖掘方法,其特征在于,所述步驟2)中,最小支持度S取值為3或4。
4.根據(jù)權(quán)利要求1所述的用于預(yù)估MOCVD工藝結(jié)果的數(shù)據(jù)挖掘方法,其特征在于,所述步驟8)中,最小置信度C取值為0.6或0.7。
5.根據(jù)權(quán)利要求1所述的用于預(yù)估MOCVD工藝結(jié)果的數(shù)據(jù)挖掘方法,其特征在于,所述MOCVD工藝數(shù)據(jù)包括H2、N2, NH3> SiH4, MO源的流量,反應(yīng)室壓力,H2、N2, NH3> MO源壓力,以及石墨盤的溫度和轉(zhuǎn)速;其中所述MO源為三甲基鋁、三甲基鎵、三乙基鎵、二茂鎂、三甲基銦中的一種或多種;所述工藝操作是指對所述MOCVD工藝數(shù)據(jù)進(jìn)行設(shè)置、更改操作。
【文檔編號】G06F17/30GK103605649SQ201310369410
【公開日】2014年2月26日 申請日期:2013年8月22日 優(yōu)先權(quán)日:2013年8月22日
【發(fā)明者】陳立寧, 林伯奇, 肖慧, 何華云, 羅宏洋, 魏唯 申請人:中國電子科技集團(tuán)公司第四十八研究所
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
定陶县| 庆元县| 沽源县| 彰武县| 邹城市| 安溪县| 东乌珠穆沁旗| 东明县| 罗山县| 包头市| 玉树县| 合山市| 页游| 繁峙县| 外汇| 香河县| 平凉市| 新泰市| 漾濞| 文安县| 遂宁市| 乌兰浩特市| 珠海市| 黄山市| 绥江县| 溧阳市| 息烽县| 望都县| 南昌县| 德昌县| 荣成市| 昌都县| 高雄市| 汽车| 象州县| 郯城县| 信阳市| 虎林市| 兴安县| 容城县| 集贤县|