欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于plm數(shù)據(jù)庫面向dpipp產品族的挖掘算法

文檔序號:10489509閱讀:689來源:國知局
一種基于plm數(shù)據(jù)庫面向dpipp產品族的挖掘算法
【專利摘要】本發(fā)明公開了一種基于PLM(產品生命周期管理)多空間數(shù)據(jù)的產品族挖掘方法。所述的方法以PLM數(shù)據(jù)庫中產品結構樹(Product Structure Tree,PST)或物料清單(Bill of Material,BOM)為數(shù)據(jù)源,利用產品數(shù)據(jù)物理空間、邏輯空間和屬性空間的信息比對,實現(xiàn)了產品族的分析和提取,其特征在于利用基于產品主特征向量比對的算法和對算法輸出結果進行聚類分析,通過對聚類結果設定閾值得到最終產品族劃分方案。本發(fā)明具有計算方便、可操作性強、適用范圍廣、能夠較為準確快速地劃分出產品族等特點;本發(fā)明能夠在DPIPP(分布式參數(shù)化智能產品平臺)的建立上提出一種較為科學的方法;本發(fā)明能夠減少MC(大批量定制)實施過程中的成本,對MC有著重要意義。
【專利說明】
一種基于PLM數(shù)據(jù)庫面向DPIPP產品族的挖掘算法
技術領域
[0001]本發(fā)明屬于構建產品平臺技術領域,特別是涉及一種基于PLM(生命周期管理)數(shù) 據(jù)庫面向DPIPP(分布式參數(shù)化智能產品平臺)產品族挖掘算法。
【背景技術】
[0002] 隨著產品全生命周期管理(Product Life-cycle Management,PLM)技術的逐漸普 及,企業(yè)的產品數(shù)據(jù)呈高級數(shù)的增長。這些產品數(shù)據(jù)存在數(shù)據(jù)庫中,包含了先進的管理思 想,蘊含著大量的產品和過程知識。如何科學地管理、利用這些產品數(shù)據(jù),是降低企業(yè)成本 的關鍵。在大批量定制環(huán)境下,為滿足客戶的多樣性需求,需要不斷增加系列產品的品種。 在這些系列產品中不同產品的BOM(物料清單Bi 11 of Mater ial,Β0Μ)結構存在相似性,且 包含大量的相同零件。產品系列的增加將導致BOM產生冗余,產品數(shù)據(jù)的高級數(shù)增長將導致 管理效率的降低及管理成本的增加。同時,客戶個性化需求的增加對產品的設計提出更高 的要求。因此,提出通過構建一種產品族模型,以有限數(shù)量的數(shù)據(jù)描述大量的產品品種。產 品族(Product Family,PF)是共享通用技術、組件且滿足一定范圍相互關聯(lián)市場需求的一 組產品。它們是由一些功能相同、結構相似產品組成的產品模型。而如何從現(xiàn)有的產品數(shù)據(jù) 及設計經(jīng)驗中總結和開發(fā)出產品族等資源,構建面向大批量定制設計的產品平臺,是企業(yè) 實現(xiàn)大批量定制產品策略的關鍵。
[0003] 國內外關于產品族獲取方法的研究主要采用的是主動規(guī)劃的產品戰(zhàn)略,即從產品 源頭規(guī)劃和設計產品族,從PLM數(shù)據(jù)庫中挖掘產品族的做法還很少。產品族的劃分是是一個 復雜的多準則決策問題。大多數(shù)學者主要采用描述性方法、數(shù)學規(guī)劃方法和人工智能方法, 以功能相關和結構相關的模塊劃分準則的基礎,以產品間零件的相似性、通用性、可重用性 為判斷標準,通過聚類處理,以概率為衡量標準,研究了某一產品族的劃分。這些方法對少 量的數(shù)據(jù)處理有很大的優(yōu)勢,然而對于企業(yè)PLM中的產品數(shù)據(jù),其計算量是驚人的。由于挖 掘的產品對象包含的零部件眾多,且存在層次結構關系,同時,零部件之間也存在結構相同 的同構類和結構不同的非同構類。同構類的功能可能不同,如其尺寸參數(shù)的變異對產品生 命周期的其他階段(功能、性能、工藝等)存在著影響;而非同構類在許多參數(shù)域范圍內,它 們的功能、工藝也可能一致,如同一種功能可由不同結構模塊來實現(xiàn)。因此上述方法也很難 實現(xiàn)產品族的準確劃分。
[0004] 基于以上產品族劃分方法的局限性,本發(fā)明利用產品數(shù)據(jù)物理空間、邏輯空間和 屬性空間,即產品零部件的存儲關系、邏輯關系及其功能信息,借鑒生物信息學中DNA分子 序列比對技術,提出了一種基于產品多空間數(shù)據(jù)的產品族挖掘方法。該方法包括基于產品 主特征向量比對的算法和對算法輸出結果進行聚類分析。通過對聚類結果設定閾值得到最 終產品族劃分方案。通過對產品族的挖掘,提高產品數(shù)據(jù)的管理效率,并為產品平臺的構建 奠定了基礎。

【發(fā)明內容】

[0005] 針對以上問題,本發(fā)明的目的是提供一種科學地管理、利用產品數(shù)據(jù),降低企業(yè)成 本的,增加系列產品的品種,滿足客戶的多樣性需求的基于PLM數(shù)據(jù)庫面向DPIPP產品族挖 掘算法。
[0006] 本發(fā)明所采用的技術方案是:
[0007] 一種基于PLM數(shù)據(jù)庫面向DPIPP產品族的挖掘算法,其特征在于,
[0008] 步驟1,產品信息初選步驟:通過查詢物理空間來實現(xiàn),物理空間是用來存儲邏輯 空間與屬性空間的元數(shù)據(jù),元數(shù)據(jù)是用來描述數(shù)據(jù)的數(shù)據(jù),指示存儲位置、資源查找、文件 記錄等信息。邏輯空間指的是產品零部件間的邏輯關系;屬性空間指的是產品及零部件的 屬性信息,包括結構屬性、功能屬性、工藝屬性、管理屬性。具體是:零部件編碼、零部件名 稱、結構參數(shù)等,它們都存儲于屬性表中。物理空間存儲了邏輯空間及屬性空間的數(shù)據(jù)的物 理地址,獲取物理地址之后,可以通過SQL SELLECT以及WHERE語句可以查詢到所有相關數(shù) 據(jù),即可以對相關數(shù)據(jù)進行篩選以及對不必要的數(shù)據(jù)進行剔除;
[0009] 步驟2,對產品進行數(shù)據(jù)清洗與規(guī)范化處理步驟哦,過程包括數(shù)據(jù)規(guī)范化處理與結 構邏輯檢查兩個子步驟;。
[0010] 數(shù)據(jù)規(guī)范化處理子步驟包括:產品編碼一致化處理、二義性處理和屬性數(shù)據(jù)缺失 或錯誤的規(guī)范化處理。
[0011] 與結構邏輯檢查子步驟包括:結構完整性檢查和關聯(lián)關系正確性檢查。結構完整 性檢查是指要遍歷到產品的每一個零部件,即產品零部件組成是否完整。關聯(lián)關系正確性 檢查是指產品的零部件邏輯連接關系是否正確。下面以產品P具體說明:
[0012] 結構完整性檢查即對產品P組成結構的完整性進行檢查,若能從PLM數(shù)據(jù)庫中搜索 到產品p BOM表中所有零部件,即說明該產品組成結構完整,否則不完整。
[0013] 步驟3,將樹形結構轉換成一種適合比對的數(shù)據(jù)格式,以避免復雜空間結構的直接 比較。本發(fā)明采用正則化,即利用一個簡單的字符串來表達一個復雜的數(shù)據(jù)結構。包括對邏 輯空間以及屬性空間正則化;
[0014]步驟4,產品屬性空間包括功能,工藝,結構,管理等屬性信息,這里選用功能屬性 進行產品族劃分。PLM數(shù)據(jù)庫中產品零件功能屬性存儲在屬性表中。對于某一項特定功能如 驅動、傳動、執(zhí)行、連接支承等,如果某一零件具有該功能在比對中記為數(shù)字1,否則記為0, 并分別根據(jù)產品邏輯空間或屬性空間中產品零部件序列順序構成向量進行比對?;冢?br>[0015]
[0016] 式:一
[0017] 。丄m丄丄…4 …
[0018] 具體包括:
[0019] 步驟4.1,將第1個產品邏輯空間主特征向量依次與剩下的n-1個產品邏輯空間向 量進行比對,并分別求得分,定義為S' u;
[0020] 步驟4.2,將第1個產品屬性空間主特征向量依次與剩下的n-1個產品屬性空間向 量進行比對,并分別求得分,定義為S〃 u;
[0021] 步驟4.3,將上述兩兩比對得分求和,存在預先定義的數(shù)組中,定義為Su = S7ij+ S~J;
[0022] 步驟4.4,然后再將第2(3,4,……,n_l)個產品主向量依次與其后的η_2(η_3,n_ 4,……,1)個向量進行比對,直到所有向量分別比對完成。重復第三步,并輸出得分,算法結 束。
[0023] 步驟4.5,基于公式一得到相應的個Similarity值,設置相似度閾值進行聚類分 析就能得到產品族挖掘結果。
[0024] 所述步驟4.1和步驟4.2中的獲取過程相同,具體如下:
[0025] 經(jīng)過以上的正則化處理之后,用字符分別代替了產品的組成零部件,將比對的兩 個產品邏輯空間主特征向量或屬性空間主特征向量,即A= (al,a2…,am),B= (bl,b2,···, bn)排列成二維表,計算得分矩陣:使用迭代方法計算出兩個序列的相似分值,存于一個矩 陣中,即計算上表中Mk, 1。
[0026] 在計算每個Mk, 1時,不僅計算其得分值,還要用一個指針記錄下該最佳得分值的路 徑,即是從三種情形中的哪種情形得到的。
[0027]
[0028] 式三
[0029]式中,k代表序列A的長度,其中ke {1,2,'",η} ;1是序列B的長度,其中Ie {1, 2,…,n} Jk,丨表示當前元素,Mk,η表示與當前元素水平方向相鄰的元素,Mk- 1;1表示與當前 元素垂直方向相鄰的元素。Da(k),b⑴表示序列A的第k個元素與序列B的第1個元素比對的分 值;D a(kM表示A的第k個元素與空位比對的分值;Do,b⑴表示空位與B的第1個元素比對的分 值。其中打分模板,即Da(k),b⑴、Da(kM、D〇,b⑴的分值米用固定空位罰分模型,或根據(jù)產品屬 性的重要程度確定。本發(fā)明采用的固定空位罰分模型為= = -i(a+M,D(Q,a) = D(a, 0) - -2 ο
[0030] 得到的]\^,11為5、或5〃小
[0031] 在上述的一種基于PLM數(shù)據(jù)庫面向DPIPP產品族的挖掘算法,數(shù)據(jù)規(guī)范化處理子步 驟的具體步驟包括:
[0032]處理步驟一,產品編碼一致化處理:根據(jù)產品結構樹的邏輯關系從01開始排序。排 序標準參照產品模型的不同功能模塊;模塊內零件順序按照重要性程度編成先后順序。 [0033]處理步驟二,二義性處理:檢查出存在二義性問題的產品數(shù)據(jù)對象。檢測方法采用 改進的臨近排序算法。具體分為以下四步:
[0034] 第一步:在PLM數(shù)據(jù)庫中選取需要檢測的產品數(shù)據(jù)對象,一個對象就是一條記錄, 字段包括產品名稱、結構、功能、工藝等屬性。
[0035] 第二步:選取排序關鍵字,例如在閥門PLM數(shù)據(jù)庫中,關鍵字段為結構、功能、工藝 等主屬性。
[0036] 第三步:記錄排序,選擇上一步選取的排序關鍵字對整個數(shù)據(jù)集執(zhí)行多趟排序,使 二義性記錄在物理位置上盡量相近。
[0037] 第四步:將檢測出存在二義性問題的產品數(shù)據(jù)對象與數(shù)據(jù)字典進行比對并更正。
[0038] 二義性記錄檢測方法是,選擇一個大小為w的固定窗口,并將它在數(shù)據(jù)集上從上往 下滑動,窗口內的第一條記錄與窗口中剩余的所有記錄逐一進行比對。在相似度計算過程 中,首先使用算法計算每對字段的相似度,再根據(jù)每個字段的權重計算出兩條記錄之間的 相似度。然后設定一個閾值,如果兩條記錄的相似值大于給定的閾值,即認為這兩條記錄是 對同一個對象的描述,即存在二義性,閾值的大小一般根據(jù)經(jīng)驗設定。隨著窗口的不斷滑 動,直到數(shù)據(jù)集中所有二義性記錄都被檢測出來,算法結束。
[0039] 處理步驟三,屬性數(shù)據(jù)缺失或錯誤的規(guī)范化處理:
[0040] 步驟3.1,隨機選擇一個分析方法:
[0041] 選擇一,統(tǒng)計分析的方法:利用切比雪夫定理,計算屬性值的期望、標準差取值范 圍,并考察每一個屬性取值區(qū)間,來判斷該屬性是否是異常或錯誤的。
[0042] 選擇二,分箱方法:屬性值被分布到一些等高或等寬的"箱"中,然后計算箱中元素 的平均值,以此值來代替缺失屬性或異常屬性。
[0043]選擇三,使用行業(yè)標準或屬性間約束關系對屬性值進行分析:屬性A的取值是屬性 B取值的M倍,若在實際檢測中不滿足該約束規(guī)則,則說明該屬性取值存在問題。
[0044] 步驟3.2,產品的結構邏輯檢查,具體包括:結構完整性檢查和關聯(lián)關系正確性檢 查。結構完整性檢查是指要遍歷到產品的每一個零部件,即產品零部件組成是否完整。關聯(lián) 關系正確性檢查是指產品的零部件邏輯連接關系是否正確,具體是:
[0045] 結構完整性檢查即對產品p組成結構的完整性進行檢查,若能從PLM數(shù)據(jù)庫中搜索 到產品p BOM表中所有零部件,即說明該產品組成結構完整,否則不完整。
[0046] 關聯(lián)關系正確性檢查即對產品p零部件之間的關聯(lián)關系進行檢查。
[0047]在上述的一種基于PLM數(shù)據(jù)庫面向DPIPP產品族的挖掘算法,邏輯空間以及屬性空 間正則化的具體方法為:
[0048] 正則化步驟一,產品邏輯空間正則化:正則化分為如下兩步進行,對產品p按層級 關系進行廣度優(yōu)先遍歷,然后對產品P零部件進行一致性處理:在進行序列比對時,若序列 由復雜字符組成,不適合使用計算機語言進行處理,則需先進行一致化處理;
[0049] 正則化步驟二,產品屬性空間正則化:產品屬性空間包括功能,工藝,結構,管理屬 性信息,這里選用功能屬性進行產品族劃分。PLM數(shù)據(jù)庫中產品零件功能屬性存儲在屬性表 中。對于某一項特定功能,如果某一零件具有該功能在比對中記為數(shù)字1,否則記為0,并根 據(jù)產品邏輯空間中產品零部件序列順序構成向量進行比對。
[0050] 本發(fā)明利用產品數(shù)據(jù)物理空間、邏輯空間和屬性空間,即產品零部件的存儲關系、 邏輯關系及其功能信息,借鑒生物信息學中DNA分子序列比對技術,包括基于產品主特征向 量比對的算法和對算法輸出結果進行聚類分析,通過對聚類結果設定閾值得到最終產品族 劃分方案。
[0051] 產品數(shù)據(jù)物理空間、邏輯空間和屬性空間用于來表達存儲在數(shù)據(jù)庫中產品信息, 產品所有相關信息的存儲及其之間的關聯(lián)關系構成了產品的物理空間,節(jié)點(零部件)及其 連接關系構成了產品的邏輯空間,節(jié)點的定義及描述構成了產品的屬性空間;
[0052]生物信息學中DNA分子序列比對技術用于將樹形結構轉換成一種適合比對的數(shù)據(jù) 格式,以避免復雜空間結構的直接比較;
[0053]產品主特征向量比對的算法用于對產品族進行挖掘,將產品資源進一步整合,判 斷出盡可能相似的一族產品,差異較大不同族之間產品;
[0054] 對算法輸出結果進行聚類分析用于做出動態(tài)聚類圖,將分析出來相似的產品族聚 集起來與所設置的閾值進行比較;閾值用于設置相似度閾值就可以得到產品族的劃分結 果,相似度閾值大小不同就能得到不同的劃分結果,可以根據(jù)實際生產需求選擇最恰當?shù)?劃分結果。運用該方法劃分的結果,有利于下一步進行產品族體系構建和可配置模型的建 立,具有一定的實用性和有效性。
[0055] 因此,本發(fā)明具有計算方便、可操作性強、適用范圍廣、能夠較為準確快速地劃分 出產品族等特點;本發(fā)明能夠在DPIPP(分布式參數(shù)化智能產品平臺)的建立上提出一種較 為科學的方法;本發(fā)明能夠減少MC(大批量定制)實施過程中的成本,對MC有著重要意義。
【附圖說明】
[0056] 圖1是本發(fā)明中記錄檢測中的窗口移動示意圖.
[0057] 圖2是本發(fā)明中產品p主結構樹示意圖.
[0058]圖3是本發(fā)明中實施例的產品族挖掘方法流程示意圖.
[0059] 圖4是本發(fā)明中實施例的產品族結構分類算法流程示意圖.
[0060] 圖5是本發(fā)明中主特征向量二維表.
[0061] 圖6是本發(fā)明中得分矩陣中元素Mk,l計算方法示意圖.
【具體實施方式】
[0062] 為了便于本領域普通技術人員理解和實施本發(fā)明,下面結合附圖及實施例對本發(fā) 明作進一步的詳細描述,應當理解,此處所描述的實施示例僅用于說明和解釋本發(fā)明,并不 用于限定本發(fā)明。其中,圖3中,1為物理空間初選,2為邏輯空間比對,3為屬性空間比對. [0063] 本發(fā)明的產品信息初選通過查詢物理空間來實現(xiàn),物理空間是用來存儲邏輯空間 與屬性空間的元數(shù)據(jù),元數(shù)據(jù)是用來描述數(shù)據(jù)的數(shù)據(jù),指示存儲位置、資源查找、文件記錄 等信息。邏輯空間指的是產品零部件間的邏輯關系。屬性空間指的是產品及零部件的屬性 信息,包括結構屬性、功能屬性、工藝屬性、管理屬性等。如零部件編碼、零部件名稱、結構參 數(shù)等,它們都存儲于屬性表中。物理空間存儲了邏輯空間及屬性空間的數(shù)據(jù)的物理地址,獲 取物理地址之后,可以通過SQL SELLECT以及WHERE語句可以查詢到所有相關數(shù)據(jù),即可以 對相關數(shù)據(jù)進行篩選以及對不必要的數(shù)據(jù)進行剔除。
[0064] 本發(fā)明基于產品多空間數(shù)據(jù)序列比對的產品族挖掘算法流程圖如圖4所示,該算 法分別輸入η個產品邏輯空間、屬性空間主特征向量。算法輸出的得分值不能直接用于聚類 處理,需要將Si, j歸一化。
[0065]
[0066] (3)
[0067]
[0068]其中,MAX I Si, j I為理論最大值,即產品自己的比較得分,MINI Si, j I為理論最小值。 [0069] 具體步驟如下:
[0070]第一,將第1個產品邏輯空間主特征向量依次與剩下的n-1個產品邏輯空間向量進 行比對,并分別求得分,定義為s' u;
[0071] 第二,將第1個產品屬性空間主特征向量依次與剩下的n-1個產品屬性空間向量進 行比對,并分別求得分,定義為s〃 U;
[0072] 第三,將上述兩兩比對得分求和,存在預先定義的數(shù)組中,定義為Slj = Y
[0073] 第四,然后再將第2(3,4,……,n-l)個產品主向量依次與其后的n-2(n-3,n-4,……,1)個向量進行比對,直到所有向量分別比對完成。重復第三步,并輸出得分,算法結 束。
[0074] 第五,基于公式(3)可得到相應的個Similarity值,設置相似度閾值進行聚類分 析就能得到產品族挖掘結果。
[0075] 本發(fā)明為了處理PLM數(shù)據(jù)庫中產品數(shù)據(jù)類型多、提取量大、關聯(lián)復雜,甚至可能存 在缺失、噪聲和二義性等問題。首先進行數(shù)據(jù)清洗與規(guī)范化處理,其過程主要包括數(shù)據(jù)規(guī)范 化處理與結構邏輯檢查兩個方面。
[0076] 數(shù)據(jù)規(guī)范化處理包括:產品編碼一致化處理、二義性處理和屬性數(shù)據(jù)缺失或錯誤 的規(guī)范化處理。下面對三種處理方式做簡要說明。
[0077] (1)產品編碼一致化處理
[0078]編碼需遵循唯一性、完整性、簡潔性、易處理性和繼承性的原則。在PLM數(shù)據(jù)庫中, 每一個數(shù)據(jù)對象都有自己的編碼,并遵循相應的編碼規(guī)則。但是由于設計人員或部門不同, 他們的編碼規(guī)則可能不一致。為方便挖掘,本節(jié)對產品編碼方案進行了詳細的設計。例如零 部件編碼,利用數(shù)據(jù)字典中編碼規(guī)則,即制造件在產品編碼后加上兩位數(shù)字表示,并根據(jù)產 品結構樹的邏輯關系從01開始排序。排序標準參照產品模型的不同功能模塊,如依次為支 承連接模塊、驅動模塊、傳動模塊、執(zhí)行模塊等;模塊內零件順序按照重要性程度編成先后 順序。
[0079] (2)二義性處理
[0080] 二義性是指產品數(shù)據(jù)對象在命名時存在不規(guī)范性,首要的任務就是要檢查出存在 二義性問題的產品數(shù)據(jù)對象。檢測方法采用改進的臨近排序算法。具體分為以下四步:
[0081] 第一步:在PLM數(shù)據(jù)庫中選取需要檢測的產品數(shù)據(jù)對象,一個對象就是一條記錄, 字段包括產品名稱、結構、功能、工藝等屬性。
[0082] 第二步:選取排序關鍵字,例如在閥門PLM數(shù)據(jù)庫中,關鍵字段為結構、功能、工藝 等主屬性。
[0083] 第三步:記錄排序,選擇上一步選取的排序關鍵字對整個數(shù)據(jù)集執(zhí)行多趟排序,使 二義性記錄在物理位置上盡量相近。
[0084] 第四步:將檢測出存在二義性問題的產品數(shù)據(jù)對象與數(shù)據(jù)字典進行比對并更正。
[0085] 二義性記錄檢測方法如圖1所示,選擇一個大小為w的固定窗口,并將它在數(shù)據(jù)集 上從上往下滑動,窗口內的第一條記錄與窗口中剩余的所有記錄逐一進行比對。在相似度 計算過程中,首先使用算法計算每對字段的相似度,再根據(jù)每個字段的權重計算出兩條記 錄之間的相似度。然后設定一個閾值,如果兩條記錄的相似值大于給定的閾值,即認為這兩 條記錄是對同一個對象的描述,即存在二義性,閾值的大小一般根據(jù)經(jīng)驗設定。隨著窗口的 不斷滑動,直到數(shù)據(jù)集中所有二義性記錄都被檢測出來,算法結束。
[0086] (3)屬性數(shù)據(jù)缺失或錯誤的規(guī)范化處理
[0087]統(tǒng)計分析的方法:利用切比雪夫定理,計算屬性值的期望、標準差取值范圍,并考 察每一個屬性取值區(qū)間,來判斷該屬性是否是異?;蝈e誤的。
[0088]分箱(binning):屬性值被分布到一些等高或等寬的"箱"中,然后計算箱中元素的 平均值,以此值來代替缺失屬性或異常屬性。
[0089] 使用行業(yè)標準或屬性間約束關系對屬性值進行分析,例如屬性1的取值是屬性2取 值的兩倍,若在實際檢測中不滿足該約束規(guī)則,則說明該屬性取值存在問題。
[0090] 產品的結構邏輯檢查包括:結構完整性檢查和關聯(lián)關系正確性檢查。結構完整性 檢查是指要遍歷到產品的每一個零部件,即產品零部件組成是否完整。關聯(lián)關系正確性檢 查是指產品的零部件邏輯連接關系是否正確。下面以產品P具體說明:
[0091] 結構完整性檢查即對產品P組成結構的完整性進行檢查,若能從PLM數(shù)據(jù)庫中搜索 到產品p BOM表中所有零部件,即說明該產品組成結構完整,否則不完整。
[0092] 關聯(lián)關系正確性檢查即對產品p零部件之間的關聯(lián)關系進行檢查。例如,若發(fā)現(xiàn)圖 2中零件3-1、零件3-2、零件3-3的父節(jié)點為部件1,說明產品p零部件連接關系不正確,需要 更正。只有產品P中所有零部件之間的連接關系與圖2符合,才能說明該產品邏輯連接關系 正確。
[0093] 為便于序列比對,要將樹形結構轉換成一種適合比對的數(shù)據(jù)格式,以避免復雜空 間結構的直接比較。本發(fā)明采用正則化,即利用一個簡單的字符串來表達一個復雜的數(shù)據(jù) 結構。下面將對邏輯空間以及屬性空間正則化做簡要說明:
[0094] (a)產品邏輯空間正則化
[0095]以產品p為例說明如何實現(xiàn)其邏輯空間的正則化,產品p主結構如圖2所示。
[0096] 正則化分為如下兩步進行:
[0097]對產品p按層級關系進行廣度優(yōu)先遍歷:順序為部件1、零件2、部件3、零件4、零件 1-1、零件1-2、零件3-1、零件3-2、零件3-3。
[0098]對產品p零部件進行一致性處理:在進行序列比對時,若序列由復雜字符組成,不 適合使用計算機語言進行處理,則需先進行一致化處理。例如使用字母a代表部件l,b代表 零件1-1,c代表零件1-2,d代表零件2,e代表部件3,f代表零件3-1,g代表零件3-2,h代表零 件3-3,i代表零件4,依照支承連接模塊、驅動模塊、傳動模塊、執(zhí)行模塊等模塊順序,則產品 P正則化表達式為向量(a,d,e,i,b,c,f,g,h)
[0099] (b)產品屬性空間正則化
[0100] 產品屬性空間包括功能,工藝,結構,管理等屬性信息,這里選用功能屬性進行產 品族劃分。PLM數(shù)據(jù)庫中產品零件功能屬性存儲在屬性表中。對于某一項特定功能如驅動、 傳動、執(zhí)行、連接支承等,如果某一零件具有該功能在比對中記為數(shù)字1,否則記為〇,并根據(jù) 產品邏輯空間中產品零部件序列順序構成向量進行比對。
[0101] 本發(fā)明經(jīng)過以上的正則化處理之后,用字符分別代替了產品的組成零部件,將比 對的兩個產品邏輯空間主特征向量,即A= (al,a2…,am),B = (bl,b2,···,bn)排列成二維表 (如圖5),計算得分矩陣:使用迭代方法計算出兩個序列的相似分值,存于一個矩陣中,即計 算上表中Mk, 1,計算方法如圖6。
[0102] 在計算每個Mk,1時,不僅計算其得分值,還要用一個指針記錄下該最佳得分值的路 徑,即是從三種情形中的哪種情形得到的。
[0103]
[0104] (2)
[0105] 式中,k代表序列A的長度,其中1^6{1,2,一,111};1是序列8的長度,其中16{1, 2,…,n} Jk,丨表示當前元素,Mk,η表示與當前元素水平方向相鄰的元素,Mk- 1;1表示與當前 元素垂直方向相鄰的元素。Da(k),b⑴表示序列A的第k個元素與序列B的第1個元素比對的分 值;D a(kM表示A的第k個元素與空位比對的分值;Do,b⑴表示空位與B的第1個元素比對的分 值。其中打分模板,即Da(k),b⑴、Da(kM、D〇,b⑴的分值米用固定空位罰分模型,或根據(jù)產品屬 性的重要程度確定。本發(fā)明采用的固定空位罰分模型為:D(a,a) = l,D(a,b) = -l(a矣b),D(0,a) -D(a, 0) - -2 ο
[0106] 由于同一功能可由不同結構模塊來實現(xiàn),例如驅動方式分為手動和電動。因此通 過上述產品主結構邏輯空間的序列比對不能完全確定產品族的劃分是否合理。對此,本發(fā) 明提出從功能方面入手,通過零部件模塊功能的比對來進一步確認產品族劃分的可靠性。 產品零件功能向量的排列順序與產品邏輯空間中產品零部件序列順序相同。具體比對方法 如邏輯空間向量比對,打分模型采用功能相同即為數(shù)字1與1的比較,得分記為1,否則記為 0〇
[0107] 應當理解的是,本說明書未詳細闡述的部分均屬于現(xiàn)有技術。
[0108] 應當理解的是,上述針對較佳實施例的描述較為詳細,并不能因此而認為是對本 發(fā)明專利保護范圍的限制,本領域的普通技術人員在本發(fā)明的啟示下,在不脫離本發(fā)明權 利要求所保護的范圍情況下,還可以做出替換或變形,均落入本發(fā)明的保護范圍之內,本發(fā) 明的請求保護范圍應以所附權利要求為準。
【主權項】
1. 一種基于PLM數(shù)據(jù)庫面向DPIPP產品族的挖掘算法,其特征在于, 步驟1,產品信息初選步驟:通過查詢物理空間來實現(xiàn),物理空間是用來存儲邏輯空間 與屬性空間的元數(shù)據(jù),元數(shù)據(jù)是用來描述數(shù)據(jù)的數(shù)據(jù),指示存儲位置、資源查找、文件記錄 等信息;邏輯空間指的是產品零部件間的邏輯關系;屬性空間指的是產品及零部件的屬性 信息,包括結構屬性、功能屬性、工藝屬性、管理屬性;具體是:零部件編碼、零部件名稱、結 構參數(shù)等,它們都存儲于屬性表中;物理空間存儲了邏輯空間及屬性空間的數(shù)據(jù)的物理地 址,獲取物理地址之后,可W通過SQL S化LECTW及W肥RE語句可W查詢到所有相關數(shù)據(jù),即 可W對相關數(shù)據(jù)進行篩選W及對不必要的數(shù)據(jù)進行剔除; 步驟2,對產品進行數(shù)據(jù)清洗與規(guī)范化處理步驟哦,過程包括數(shù)據(jù)規(guī)范化處理與結構邏 輯檢查兩個子步驟;; 數(shù)據(jù)規(guī)范化處理子步驟包括:產品編碼一致化處理、二義性處理和屬性數(shù)據(jù)缺失或錯 誤的規(guī)范化處理; 與結構邏輯檢查子步驟包括:結構完整性檢查和關聯(lián)關系正確性檢查;結構完整性檢 查是指要遍歷到產品的每一個零部件,即產品零部件組成是否完整;關聯(lián)關系正確性檢查 是指產品的零部件邏輯連接關系是否正確;下面W產品P具體說明: 結構完整性檢查即對產品P組成結構的完整性進行檢查,若能從PLM數(shù)據(jù)庫中捜索到產 品P BOM表中所有零部件,即說明該產品組成結構完整,否則不完整; 步驟3,將樹形結構轉換成一種適合比對的數(shù)據(jù)格式,W避免復雜空間結構的直接比 較;本發(fā)明采用正則化,即利用一個簡單的字符串來表達一個復雜的數(shù)據(jù)結構;包括對邏輯 空間W及屬性空間正則化; 步驟4,產品屬性空間包括功能,工藝,結構,管理等屬性信息,運里選用功能屬性進行 產品族劃分;PLM數(shù)據(jù)庫中產品零件功能屬性存儲在屬性表中;對于某一項特定功能如驅 動、傳動、執(zhí)行、連接支承等,如果某一零件具有該功能在比對中記為數(shù)字1,否則記為0,并 分別根據(jù)產品邏輯空間或屬性空間中產品零部件序列順序構成向量進行比對;基于:巧一 具體包括: 步驟4.1,將第1個產品邏輯空間主特征向量依次與剩下的n-1個產品邏輯空間向量進 行比對,并分別求得分,定義為S/ 1J ; 步驟4.2,將第1個產品屬性空間主特征向量依次與剩下的n-1個產品屬性空間向量進 行比對,并分別求得分,定義為S" 1J ; 步驟4.3,將上述兩兩比對得分求和,存在預先定義的數(shù)組中,定義為Su = S/ U+S" 1J; 步驟4.4,然后再將第2(3,4,……,11-1)個產品主向量依次與其后的11-2(11-3,11- 4,……,1)個向量進行比對,直到所有向量分別比對完成;重復第Ξ步,并輸出得分,算法結 束; 步驟4.5,基于公式一得到相應的巧個Simi lari ty值,設置相似度闊值進行聚類分析就 能得到產品族挖掘結果; 所述步驟4.1和步驟4.2中S/ U^ U的獲取過程相同,具體如下: 經(jīng)過W上的正則化處理之后,用字符分別代替了產品的組成零部件,將比對的兩個產 品邏輯空間主特征向量或屬性空間主特征向量,即A=(曰1,曰2···,am),B= (bl,b2,···,bn)排 列成二維表,計算得分矩陣:使用迭代方法計算出兩個序列的相似分值,存于一個矩陣中, 即計算上表中Mk,i; 在計算每個Mk,i時,不僅計算其得分值,還要用一個指針記錄下該最佳得分值的路徑, 即是從Ξ種情形中的哪種情形得到的; !〇,〇 = 0 式二式Η 式中,k代表序列A的長度,其中ke{l,2,是序列Β的長度,其中l(wèi)e{l,2, ···,!!}; Mk,i表示當前元素,Mk,1-1表示與當前元素水平方向相鄰的元素,Mk-1,1表示與當前元素垂直 方向相鄰的元素;Da(k),b(l)表示序列A的第k個元素與序列B的第1個元素比對的分值;Da(k),0 表示A的第k個元素與空位比對的分值;Do,b(i)表示空位與B的第1個元素比對的分值;其中打 分模板,即Da(k),b(l)、Da(k),0、D〇,b(l)的分值采用固定空位罰分模型,或根據(jù)產品屬性的重要程 度確定;本發(fā)明采用的固定空位罰分模型為:〇(。,。)= 扣的=-l(att),D化a) = D(a,o) = -2; 得到的Mm,n為S^i域S"1J。2.根據(jù)權利要求1所述的一種基于PLM數(shù)據(jù)庫面向DPIPP產品族的挖掘算法,其特征在 于,數(shù)據(jù)規(guī)范化處理子步驟的具體步驟包括: 處理步驟一,產品編碼一致化處理:根據(jù)產品結構樹的邏輯關系從01開始排序;排序標 準參照產品模型的不同功能模塊;模塊內零件順序按照重要性程度編成先后順序; 處理步驟二,二義性處理:檢查出存在二義性問題的產品數(shù)據(jù)對象;檢測方法采用改進 的臨近排序算法;具體分為W下四步: 第一步:在PLM數(shù)據(jù)庫中選取需要檢測的產品數(shù)據(jù)對象,一個對象就是一條記錄,字段 包括產品名稱、結構、功能、工藝等屬性; 第二步:選取排序關鍵字,例如在閥口PLM數(shù)據(jù)庫中,關鍵字段為結構、功能、工藝等主 屬性; 第Ξ步:記錄排序,選擇上一步選取的排序關鍵字對整個數(shù)據(jù)集執(zhí)行多趟排序,使二義 性記錄在物理位置上盡量相近; 第四步:將檢測出存在二義性問題的產品數(shù)據(jù)對象與數(shù)據(jù)字典進行比對并更正; 二義性記錄檢測方法是,選擇一個大小為W的固定窗口,并將它在數(shù)據(jù)集上從上往下滑 動,窗口內的第一條記錄與窗口中剩余的所有記錄逐一進行比對;在相似度計算過程中,首 先使用算法計算每對字段的相似度,再根據(jù)每個字段的權重計算出兩條記錄之間的相似 度;然后設定一個闊值,如果兩條記錄的相似值大于給定的闊值,即認為運兩條記錄是對同 一個對象的描述,即存在二義性,闊值的大小一般根據(jù)經(jīng)驗設定;隨著窗口的不斷滑動,直 到數(shù)據(jù)集中所有二義性記錄都被檢測出來,算法結束; 處理步驟Ξ,屬性數(shù)據(jù)缺失或錯誤的規(guī)范化處理: 步驟3.1,隨機選擇一個分析方法: 選擇一,統(tǒng)計分析的方法:利用切比雪夫定理,計算屬性值的期望、標準差取值范圍,并 考察每一個屬性取值區(qū)間,來判斷該屬性是否是異常或錯誤的; 選擇二,分箱方法:屬性值被分布到一些等高或等寬的"箱"中,然后計算箱中元素的平 均值,W此值來代替缺失屬性或異常屬性; 選擇Ξ,使用行業(yè)標準或屬性間約束關系對屬性值進行分析:屬性A的取值是屬性B取 值的Μ倍,若在實際檢測中不滿足該約束規(guī)則,則說明該屬性取值存在問題; 步驟3.2,產品的結構邏輯檢查,具體包括:結構完整性檢查和關聯(lián)關系正確性檢查;結 構完整性檢查是指要遍歷到產品的每一個零部件,即產品零部件組成是否完整;關聯(lián)關系 正確性檢查是指產品的零部件邏輯連接關系是否正確,具體是: 結構完整性檢查即對產品Ρ組成結構的完整性進行檢查,若能從PLM數(shù)據(jù)庫中捜索到產 品Ρ ΒΟΜ表中所有零部件,即說明該產品組成結構完整,否則不完整; 關聯(lián)關系正確性檢查即對產品Ρ零部件之間的關聯(lián)關系進行檢查。3.根據(jù)權利要求1所述的一種基于PLM數(shù)據(jù)庫面向DPIPP產品族的挖掘算法,其特征在 于,邏輯空間W及屬性空間正則化的具體方法為: 正則化步驟一,產品邏輯空間正則化:正則化分為如下兩步進行,對產品Ρ按層級關系 進行廣度優(yōu)先遍歷,然后對產品Ρ零部件進行一致性處理:在進行序列比對時,若序列由復 雜字符組成,不適合使用計算機語言進行處理,則需先進行一致化處理; 正則化步驟二,產品屬性空間正則化:產品屬性空間包括功能,工藝,結構,管理屬性信 息,運里選用功能屬性進行產品族劃分;PLM數(shù)據(jù)庫中產品零件功能屬性存儲在屬性表中; 對于某一項特定功能,如果某一零件具有該功能在比對中記為數(shù)字1,否則記為0,并根據(jù)產 品邏輯空間中產品零部件序列順序構成向量進行比對。
【文檔編號】G06F17/30GK105844398SQ201610164258
【公開日】2016年8月10日
【申請日】2016年3月22日
【發(fā)明人】彭衛(wèi)平, 雷金, 蔣瑞, 胡向陽, 竇俊豪, 雷佻鈺, 張秋華
【申請人】武漢大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
鸡东县| 盘锦市| 长海县| 德安县| 华容县| 阿荣旗| 沂水县| 吴桥县| 义马市| 华容县| 芮城县| 客服| 德清县| 连城县| 庄河市| 德令哈市| 马鞍山市| 武乡县| 井陉县| 安乡县| 辉南县| 新平| 阳信县| 扎囊县| 志丹县| 铜山县| 德庆县| 金川县| 沁水县| 琼海市| 抚远县| 桐城市| 青铜峡市| 青神县| 周宁县| 平利县| 西充县| 临海市| 松阳县| 尚义县| 城口县|