專利名稱:基于模糊規(guī)則推理的并行應用性能脆弱點分析方法及系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及高性能計算機并行系統(tǒng)設計與性能調優(yōu)技術,特別是涉及一種基于模糊規(guī)則推理的并行應用性能脆弱點分析方法及系統(tǒng)。
背景技術:
在并行系統(tǒng)應用中,進程經(jīng)常需要訪問遠程進程提供的數(shù)據(jù),致使一個進程的進展依賴于另一個進程的進展,這就可能導致一些進程由于等待其它進程的數(shù)據(jù)而不得不處于等待狀態(tài),或者因無更多的任務可做而處于空閑狀態(tài)。在點到點通信中,發(fā)送進程和接收進程的不同步,可能使接收進程提早進入接收狀態(tài),等待發(fā)送進程,或者阻塞發(fā)送進程提早進入發(fā)送狀態(tài)等待接收進程。集合同步與此類似,它的完成需要每一個參與的進程都到達一個特定的點,于是有些進程可能提早進入,不得不等待其它的進程。因此,有相當一部分的通信和同步時間通??梢詺w因于等待狀態(tài)。尤其是將通信密集型應用擴展到大量進程上時,這樣的等待狀態(tài)將嚴重影響性能。目前對并行應用性能的分析大多采用統(tǒng)計方法,但是傳統(tǒng)統(tǒng)計方法存在幾個問題(1)傳統(tǒng)統(tǒng)計工作一般是由技術人員根據(jù)經(jīng)驗,通過分析并行應用運行日志等監(jiān)控數(shù)據(jù)的方式進行,其效果很大程度上取決于個人經(jīng)驗以及分析人員的認真程度,因而分析結果不具有科學性、客觀性,工作效率也比較低。(2)常規(guī)的并行系統(tǒng)應用性能分析工作由于過于依賴人工判別,因此不可避免的導致效率低下、誤判率高、經(jīng)驗難以繼承、可擴張性差等問題。隨著計算模式下的大規(guī)模并行系統(tǒng)的應用,需要分析的監(jiān)控數(shù)據(jù)會成為海量數(shù)據(jù),而這些海量數(shù)據(jù)之間可能存在復雜的關系,使用傳統(tǒng)統(tǒng)計方法很難對其數(shù)據(jù)間的關系進行處理,而計算機人工智能及模糊數(shù)學的發(fā)展為大規(guī)模并行系統(tǒng)性能的智能分析提供了 ■石出。
發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有技術不足,提出一種基于模糊規(guī)則推理的并行應用性能脆弱點分析方法及系統(tǒng),能夠高效、準確的發(fā)現(xiàn)系統(tǒng)性能脆弱點,為后續(xù)性能調優(yōu)工作提供輔助決策支持。本發(fā)明所采用的技術方案—種基于模糊規(guī)則推理的并行應用性能脆弱點分析方法,首先將導致并行程序性能低效的各種情況進行抽象,獲得并行程序性能特征模式,構建并行程序性能脆弱點特征模式推理規(guī)則庫,然后1)采用基于重放的并行痕跡分析方法進行痕跡文件特征提取,通過分布式存儲和并行處理技術,在同應用程序實際執(zhí)行同樣多的CPU上重放原始通信,使得每個進程獨立地分析本地痕跡數(shù)據(jù),在遍歷痕跡數(shù)據(jù)時,根據(jù)每個事件區(qū)域和相關系統(tǒng)資源的重要性,識別需要的特征,生成特征文件;
5
2)將模糊數(shù)學方法引入產(chǎn)生式規(guī)則定義和推理中,采用基于模糊方法的匹配機制,自動搜索事件痕跡的特征模式,實現(xiàn)特征模式的匹配和發(fā)現(xiàn),發(fā)現(xiàn)和定位并行程序的性能脆弱點,最終為進一步的計算機并行系統(tǒng)性能調優(yōu)工作提供輔助決策。一種基于模糊規(guī)則推理的并行應用性能脆弱點分析系統(tǒng),主要由推理機模塊、知識庫、特征提取模塊、綜合數(shù)據(jù)庫和用戶接口模塊組成;其中知識庫存儲用于結論的推理、問題的求解的專家經(jīng)驗的判斷性知識,以及推理、求解過程中的各種控制知識;推理機是系統(tǒng)的組織控制機構,控制、協(xié)調整個系統(tǒng),根據(jù)輸入數(shù)據(jù),利用知識庫中的知識規(guī)則按一定的策略進行推理,對知識庫和綜合數(shù)據(jù)庫進行搜索和查詢,準確有效地使用規(guī)則,得到相應結論,使問題得到求解,并通過用戶接口模塊向用戶提交推理結果;綜合數(shù)據(jù)庫是專家系統(tǒng)的數(shù)據(jù)交換中心,規(guī)則推理的前提與結果、推理產(chǎn)生的中問結果、痕跡文件中獲取的性能特征數(shù)據(jù)等都存儲在全局數(shù)據(jù)庫中,與推理機進行交互;特征提取模塊,通過基于重放的并行痕跡分析方法,從分布存儲的痕跡文件中提取特征值,形成知識庫中所需要的事實,為規(guī)則的建立提供事實基礎,同時,將需要分析的并行程序的分布式痕跡文件進行預處理,提取所需要特征,送入推理機,推理機根據(jù)這些特征和相應的規(guī)則,實現(xiàn)推理。本發(fā)明的有益積極效果1、本發(fā)明基于模糊規(guī)則推理的并行應用性能脆弱點分析方法及系統(tǒng),通過專家系統(tǒng)的設計構建,實現(xiàn)了智能化、高效、準確、可擴展的并行程序性能分析,能夠高效、準確的發(fā)現(xiàn)系統(tǒng)性能脆弱點,為后續(xù)性能調優(yōu)工作提供輔助決策支持?;谥R庫的專家系統(tǒng),作為一個具有大量專門知識和經(jīng)驗的程序系統(tǒng),可根據(jù)某一領域內(nèi)的專家知識和經(jīng)驗進行推理和判斷,模擬人類專家的決策過程,以解決需要專家專業(yè)知識才能解決的復雜問題。專家系統(tǒng)不僅能夠很好的保留所有分析工作的經(jīng)驗總結,并被分析人員共享使用,其智能推理機制又能夠促進對人工經(jīng)驗的提煉總結,從中獲取更深層次的規(guī)則。同時專家系統(tǒng)良好的擴充性能夠保證隨著分析人員經(jīng)驗的增加,其推理的智能性和有效性也隨之提升,促進了專家系統(tǒng)整體執(zhí)行效率的提高。2、本發(fā)明針對通信密集型并行系統(tǒng)應用中的低效行為的發(fā)現(xiàn)與定位問題,通過抽象提取的方法,得到程序性能脆弱點特征模式,通過基于重放的并行痕跡分析方法進行痕跡文件特征提取?;谡蛲评頇C制,采取“模糊方法的產(chǎn)生式規(guī)則推理技術”實現(xiàn)特征模式的匹配和發(fā)現(xiàn),從而發(fā)現(xiàn)導致并行系統(tǒng)應用性能出現(xiàn)瓶頸、下降的主要因素,為后續(xù)調優(yōu)策略進行輔助決策。
圖1 為本發(fā)明基于模糊規(guī)則推理的并行應用性能脆弱點分析專家系統(tǒng)組成結構圖;圖2:遲發(fā)送模式示意圖;圖3 并行痕跡分析流程圖;圖4 遲發(fā)送模式的特征提取示意圖。
具體實施例方式實施例一本發(fā)明基于模糊規(guī)則推理的并行應用性能脆弱點分析方法,首先將導致并行程序性能低效的各種情況進行抽象,獲得并行程序性能特征模式,構建并行程序性能脆弱點特征模式推理規(guī)則庫,然后1)采用基于重放的并行痕跡分析方法進行痕跡文件特征提取,通過分布式存儲和并行處理技術,在同應用程序實際執(zhí)行同樣多的CPU上重放原始通信,使得每個進程獨立地分析本地痕跡數(shù)據(jù),在遍歷痕跡數(shù)據(jù)時,根據(jù)每個事件區(qū)域和相關系統(tǒng)資源的重要性,識別需要的特征,生成特征文件;2)將模糊數(shù)學方法引入產(chǎn)生式規(guī)則定義和推理中,采用基于模糊方法的匹配機制,自動搜索事件痕跡的特征模式,實現(xiàn)特征模式的匹配和發(fā)現(xiàn),發(fā)現(xiàn)和定位并行程序的性能脆弱點,最終為進一步的計算機并行系統(tǒng)性能調優(yōu)工作提供輔助決策。實施例二 本實施例結合圖1 圖4,進一步說明本發(fā)明基于模糊規(guī)則推理的并行應用性能脆弱點分析方法的具體實施方式
。所述分析方法包括1、模式定義為了更好地描述性能脆弱點,將影響程序執(zhí)行性能的各種執(zhí)行行為抽象出來,形成性能模式,為規(guī)則的定義建立基礎。(1)抽象機制復合事件是痕跡文件中的一個事件集,它滿足與特定性能問題有關的條件。雖然事件的類型不盡相同,每種事件有不同的屬性,但是每個事件都至少提供一個時間屬性和一個表示引發(fā)它發(fā)生的控制流的位置屬性。這種程序執(zhí)行的表示方法稱為“基本事件模型”?;臼录P蛢H能對事件順序存取,有很大的局限性。通過增加狀態(tài)序列和指針屬性, 可將其擴充為增強事件模型。增強事件模型提供一種抽象機制,更容易描述表示低效行為的復合事件,并能夠以事件位置為參考隨機訪問事件。狀態(tài)序列將事件映射到一個事件集,這個事件集代表了事件發(fā)生時并行系統(tǒng)的執(zhí)行狀態(tài)。這就允許用執(zhí)行狀態(tài)來描述復合事件。一個事件通過移除元素或/和添加元素到集合中引起一個狀態(tài)改變,從而修改代表部件狀態(tài)的事件集。因此,對每一個部件的狀態(tài), 一個事件痕跡定義一個狀態(tài)序列。這個初始狀態(tài)總是一個空集。轉移規(guī)則定義了一個事件怎樣使一個狀態(tài)轉變成它的后續(xù)狀態(tài)。例如,為每一對處理器保持一個消息序列。這個初始序列是空的。每當發(fā)送事件發(fā)生時,就將它添加進隊列,并且每當接收事件發(fā)生時,就將相應的發(fā)送事件移除隊列。其它狀態(tài)序列可以描述MPI集合通信,OpenMP并行操作,和鎖同步,區(qū)域棧,還有調用樹等。指針屬性連接兩個相互對應的事件,所以它可以沿對應事件的路徑定義復合事件。指針屬性被添加到基本模型已定義的屬性中,并且具有對應事件的位置值。如從一個消息接收事件到對應的消息發(fā)送事件的屬性指針。訪問過接收事件后,它很容易訪問對應的發(fā)送事件,因為發(fā)送事件的位置被保存在接收事件的一個屬性中。另外還有其它指針屬性描述不同類型的通信,比如,獲得和釋放鎖,進入和離開一個區(qū)域。(2)模式定義將復合事件進行抽象后,通??梢詫ζ溥M行形式化定義。每個模式的形式化定義一般由4部分構成。(a)根聲明。(b)實例化部分。(c)約束。(d) —個精確的表達式。
如在基于MPI的并行程序中,對于MPI_Recv、MPI_ffait等阻塞接收操作,如果接 收者較早到達,就處于阻塞等待狀態(tài),直到它所等待的發(fā)送者將消息發(fā)出。這種情形會導致 接收進程的低效。如圖2所示為遲發(fā)送模式示意圖。在基于MPI的并行程序中,對于MPI_ Recv, MPI_ffait等阻塞接收操作,如果接收者較早到達,就處于阻塞等待狀態(tài),直到它所等 待的發(fā)送者將消息發(fā)出。這種情形會導致接收進程的低效。此為遲發(fā)送模式。我們把這種情形抽象為“遲發(fā)送”模式。該模式可形式化描述如下ROOTRECV r ;INSTANTIATIONs: = r. sendptr ;
e2: = r. exitptr ;
THEN B其中,Rulelayer為規(guī)則所在層數(shù);Number為同一層規(guī)則的規(guī)則序號;IF"'THEN… 為產(chǎn)生式規(guī)則,n為自然數(shù)。許多條這樣的規(guī)則構成了知識庫。以遲發(fā)送模式為例,構建產(chǎn)生式規(guī)則如下
IF通信方式為點對點(Pl)且發(fā)送事件和接收事件是一對(P》且接收事件到達的時間早于發(fā)送事件到達時間(P3) THEN它為遲發(fā)送模式(P4)。使用謂詞邏輯表示為Pl Λ P2 Λ P3 —P4(嚴重程度)3、分布式并行特征提取技術為了在大規(guī)模的痕跡文件中分析發(fā)現(xiàn)復雜的低效行為模式,關鍵任務是對痕跡文件的特征提取,本系統(tǒng)采用基于重放的并行痕跡分析方法,如圖3所示。該方法擴展了順序痕跡分析方法,通過分布式存儲和并行處理技術,在同應用程序實際執(zhí)行同樣多的CPU上重放原始通信,使得每個進程獨立地分析本地痕跡數(shù)據(jù),而不像順序痕跡分析方法需要順序地分析單一的全局痕跡數(shù)據(jù)。隨著痕跡事件規(guī)模的擴大,并行痕跡分析方法可以適應大規(guī)模搜索,快速隨機獲取某個事件及上下文通信。在遍歷痕跡數(shù)據(jù)時,根據(jù)每個事件區(qū)域和相關系統(tǒng)資源的重要性,識別需要的特征,生成特征文件。如圖3所示為并行痕跡分析流程圖對于目標應用的每個進程,創(chuàng)建一個分析進程來分析它的本地痕跡文件,分析進程間的數(shù)據(jù)交換可通過MPI通信完成。在開始痕跡分析之前,先將痕跡數(shù)據(jù)裝入內(nèi)存,使用標識映射表將本地標識符轉換為全局標識符,以確保創(chuàng)建的事件實例指向正確的對象。由并行特征分析器從痕跡文件中進行分析,提取其中特征值。在痕跡分析期間,保持整個事件痕跡駐留在主存中,可以透明執(zhí)行到單個事件的隨機存取。統(tǒng)一每個進程可能使用不同的本地標識符來標識同一個對象。為在分析過程中建立一個全局視圖,必須建立一個從本地到全局標識的映射表,此過程被稱為統(tǒng)一。合并每個并行分析進程只分析本地痕跡文件,因此當分析完成時,需要將本地分析結果合并到整體特征文件中。對于目標應用的每個進程,創(chuàng)建一個分析進程來分析它的痕跡文件,分析進程間的數(shù)據(jù)交換可通過MPI通信完成。在開始痕跡分析之前,先將痕跡數(shù)據(jù)裝入內(nèi)存,使用映射表將本地標識符轉換為全局標識符,以確保創(chuàng)建的事件實例指向正確的對象。在痕跡分析期間,保持整個事件痕跡駐留在主存中,可以透明執(zhí)行到單個事件的隨機存取。考慮上述點對點通信的遲發(fā)送模式的并行重放特征提取的實例。如圖4所示為遲發(fā)送模式的特征提取示意圖。檢測由兩邊(發(fā)送和接收事件)的通信事件觸發(fā)。每當分析進程發(fā)現(xiàn)一個發(fā)送事件,就創(chuàng)建一個包含該事件的消息及相關的enter事件(enter事件用指針屬性enterptr定位),然后使用點對點消息的方式將這個消息發(fā)送到接收者進程。當目標進程到達接收事件時,接收上面提到的包含遠程成分的消息。同本地的有效成分(接收和進入事件)一起,獲取兩個enter事件的時戳,計算等待發(fā)送者所花費的時間,并計算等待時間與通信時間的比例,為后續(xù)性能脆弱點定位和判斷提供事實依據(jù)。在這個并行重放中,檢測由兩邊(發(fā)送和接收事件)的通信事件觸發(fā)。每當分析進程發(fā)現(xiàn)一個發(fā)送事件,就創(chuàng)建一個包含該事件的消息及相關的enter事件(enter事件用指針屬性enterptr定位),然后使用點對點消息的方式將這個消息發(fā)送到接收者進程。當目標進程到達接收事件時,接收上面提到的包含遠程成分的消息。同本地的有效成分(接收和進入事件)一起,獲取兩個enter事件的時戳,計算等待發(fā)送者所花費的時間,并計算等待時間與通信時間的比例,為后續(xù)性能脆弱點定位和判斷提供事實依據(jù)。
4、基于模糊方法的規(guī)則推理本方案的推理機制采用正向推理策略,也就是由現(xiàn)象根據(jù)規(guī)則推出結論的方法, 根據(jù)用戶提供的特征數(shù)據(jù),在知識庫中搜索LHS部分與其相匹配的規(guī)則,然后推出規(guī)則的 RHS部分,從而得到一個結論。如果該結論仍然作為知識庫中某個規(guī)則的LHS的組成部分, 則表明此次推理過程并未結束,需要按照上述正向推理策略,繼續(xù)進行推理,直到所得結論無法應用任何規(guī)則的LHS部分為止。至此,推理過程結束,所得結論即對應于某個模式的存在。推理的實質,是對知識庫中規(guī)則的LHS部分進行的模式匹配,而規(guī)則的LHS部分通常是由多個事實通過布爾運算連接而成。由于很多低效行為會表現(xiàn)出多種不同的特征,其與本質特征之間具有一定的模糊性,上述的確定性規(guī)則在應用到推理過程中就有可能會出現(xiàn)難以接受的結論。因此我們將模糊數(shù)學方法引入產(chǎn)生式規(guī)則定義和推理中,很好地解決了多種不同特征共同作用于某種低效行為方式。基于模糊方法的產(chǎn)生式規(guī)則定義如下IF A1(A) and A2 (r2) and—and An (rn) THEN B (a)其中,AiG = 1,2,···,η)為低效行為特征;B為規(guī)則的結論,即屬于哪種模式;ri(i =1,2,…,η)為低效行為特征的模糊隸屬度閾值;a為規(guī)則的可信度。具體計算方法如下(1)對于條件&(1 = 1,2,…,η),分別計算其存在的置信度巧(0-1),若其超過閾值,則認為條件Ai成立;否則,不成立。(2)根據(jù)規(guī)則定義,計算結論B的可信度β (遲發(fā)送例子中,可信度為B的嚴重程度),若結論B的可信度β大于規(guī)則的可信度閾值a,則結論B成立,且可信度為β。(3)重復后續(xù)規(guī)則推理。將結論B及其置信度β作為更高層規(guī)則的條件代入,從而繼續(xù)后續(xù)規(guī)則的推理,直至推理結束。以遲發(fā)送模式的推理為例,產(chǎn)生式推理規(guī)則為IF通信方式為點對點(Pl)且發(fā)送事件和接收事件是一對(P》且接收事件到達的時間早于發(fā)送事件到達時間(Ρ3) THEN它為遲發(fā)送模式(P4)。使用謂詞邏輯表示為Pl Λ P2 Λ P3 — P4 (嚴重程度 β )若條件Pi (i = 1,2,3)滿足時,即其置信度大于設定的閾值,條件成立,可得到結
論B的可信度β為
^ e、.time - e, .timeβ = ^―-~,
e 2 .time - ex .time當β > a時,結論成立,且結論B的可信度為β。以此為條件,可以繼續(xù)對“遲發(fā)送、錯誤順序”模式進行推理,判定該模式的存在性。實施例三參見圖1,本實施例為基于模糊規(guī)則推理的并行應用性能脆弱點分析系統(tǒng),實現(xiàn)并行應用性能脆弱點分析與發(fā)現(xiàn)的輔助決策,其系統(tǒng)構成如圖1所示系統(tǒng)主要由推理機、知識庫、特征提取模塊、綜合數(shù)據(jù)庫和用戶接口模塊等部分組成。知識庫存儲用于結論的推理、問題的求解的專家經(jīng)驗的判斷性知識,以及推理、求解過程中的各種控制知識。系統(tǒng)的核心是知識,其性能取決于知識庫中知識的數(shù)量、質量及表示方法。知識表示方法決定了知識庫的組織結構并直接影響整個系統(tǒng)的工作效率。推理機是系統(tǒng)的組織控制機構,控制、協(xié)調整個系統(tǒng),根據(jù)輸入數(shù)據(jù),利用知識庫中的知識規(guī)則按一定的策略進行推理,對知識庫和綜合數(shù)據(jù)庫進行搜索和查詢,準確有效地使用規(guī)則,得到相應結論,使問題得到求解,并通過用戶接口向用戶提交推理結果。在推理機的作用下,普通用戶能夠如同領域專家一樣解決具體領域的困難問題。綜合數(shù)據(jù)庫是系統(tǒng)的數(shù)據(jù)交換中心,規(guī)則推理的前提與結果、推理產(chǎn)生的中問結果、痕跡文件中獲取的性能特征數(shù)據(jù)等都存儲在全局數(shù)據(jù)庫中,與推理機進行交互。特征提取模塊是本方案的關鍵技術,通過基于重放的并行痕跡分析方法,從分布存儲的痕跡文件中提取特征值,形成知識庫中所需要的事實,為規(guī)則的建立提供事實基礎, 另一方面,將需要分析的并行程序的分布式痕跡文件進行預處理,提取所需要特征,送入推理機,推理機根據(jù)這些特征和相應的規(guī)則,實現(xiàn)推理。
權利要求
1.一種基于模糊規(guī)則推理的并行應用性能脆弱點分析方法,首先將導致并行程序性能低效的各種情況進行抽象,獲得并行程序性能特征模式,構建并行程序性能脆弱點特征模式推理規(guī)則庫,然后1)采用基于重放的并行痕跡分析方法進行痕跡文件特征提取,通過分布式存儲和并行處理技術,在同應用程序實際執(zhí)行同樣多的CPU上重放原始通信,使得每個進程獨立地分析本地痕跡數(shù)據(jù),在遍歷痕跡數(shù)據(jù)時,根據(jù)每個事件區(qū)域和相關系統(tǒng)資源的重要性,識別需要的特征,生成特征文件;2)將模糊數(shù)學方法引入產(chǎn)生式規(guī)則定義和推理中,采用基于模糊方法的匹配機制,自動搜索事件痕跡的特征模式,實現(xiàn)特征模式的匹配和發(fā)現(xiàn),發(fā)現(xiàn)和定位并行程序的性能脆弱點,最終為進一步的計算機并行系統(tǒng)性能調優(yōu)工作提供輔助決策。
2.根據(jù)權利要求1所述的基于模糊規(guī)則推理的并行應用性能脆弱點分析方法,其特征是為了更好地描述性能脆弱點,將影響程序執(zhí)行性能的各種執(zhí)行行為抽象出來,形成性能模式,為規(guī)則的定義建立基礎;1)復合事件是痕跡文件中的一個事件集,它滿足與特定性能問題有關的條件,每個事件都至少提供一個時間屬性和一個表示引發(fā)它發(fā)生的控制流的位置屬性,通過增加狀態(tài)序列和指針屬性,可將其擴充為增強事件模型;狀態(tài)序列將事件映射到一個事件集,這個事件集代表了事件發(fā)生時并行系統(tǒng)的執(zhí)行狀態(tài),用執(zhí)行狀態(tài)來描述復合事件,一個事件通過移除元素或/和添加元素到集合中引起一個狀態(tài)改變,從而修改代表部件狀態(tài)的事件集;指針屬性連接兩個相互對應的事件,通過指針屬性沿對應事件的路徑定義復合事件; 指針屬性被添加到基本模型已定義的屬性中,并且具有對應事件的位置值;2)將復合事件進行抽象后,以對其進行形式化定義;每個模式的形式化定義一般由4 部分構成(a)根聲明,(b)實例化部分,(c)約束,(d) 一個精確的表達式。
3.根據(jù)權利要求1或2所述的基于模糊規(guī)則推理的并行應用性能脆弱點分析方法,其特征是用謂詞邏輯表達產(chǎn)生式規(guī)則IF A THEN B表示為A — B,其中A、B表示一定事實,在該產(chǎn)生式規(guī)則的基礎上,定義合成產(chǎn)生式規(guī)則和層次產(chǎn)生式規(guī)則,合成產(chǎn)生式規(guī)則即產(chǎn)生式規(guī)則的前提或結論部分含“與”、“或”關系;層次產(chǎn)生式規(guī)則是借助于多層或嵌套式的規(guī)則,其形式為Rulelayer Number :IF A1 [and A2 and and Aj THEN B其中,Rulelayer為規(guī)則所在層數(shù);Number為同一層規(guī)則的規(guī)則序號;IF*"THEN···為產(chǎn)生式規(guī)則;許多條這樣的規(guī)則構成了知識庫。
4.根據(jù)權利要求3所述的基于模糊規(guī)則推理的并行應用性能脆弱點分析方法,其特征是采用基于重放的并行痕跡分析方法分析全局痕跡數(shù)據(jù),隨著痕跡事件規(guī)模的擴大,并行痕跡分析方法可以適應大規(guī)模搜索,快速隨機獲取某個事件及上下文通信,其過程包括統(tǒng)一每個進程使用不同的本地標識符來標識同一個對象,為在分析過程中建立一個全局視圖,建立一個從本地到全局標識的映射表,此過程被稱為統(tǒng)一;合并每個并行分析進程只分析本地痕跡文件,當分析完成時,將本地分析結果合并到整體特征文件中;對于目標應用的每個進程,創(chuàng)建一個分析進程來分析它的痕跡文件,分析進程間的數(shù)據(jù)交換可通過MPI通信完成;在開始痕跡分析之前,先將痕跡數(shù)據(jù)裝入內(nèi)存,使用映射表將本地標識符轉換為全局標識符,以確保創(chuàng)建的事件實例指向正確的對象;在痕跡分析期間, 保持整個事件痕跡駐留在主存中,以透明執(zhí)行到單個事件的隨機存取;在這個并行重放中,檢測由發(fā)送和接收事件的通信事件觸發(fā);每當分析進程發(fā)現(xiàn)一個發(fā)送事件,就創(chuàng)建一個包含該事件的消息及相關的enter事件,然后使用點對點消息的方式將這個消息發(fā)送到接收者進程,當目標進程到達接收事件時,接收上面提到的包含遠程成分的消息;然后同本地的接收和進入事件一起,獲取兩個enter事件的時戳,計算等待發(fā)送者所花費的時間,并計算等待時間與通信時間的比例,為后續(xù)性能脆弱點定位和判斷提供事實依據(jù)。
5.根據(jù)權利要求4所述的基于模糊規(guī)則推理的并行應用性能脆弱點分析方法,其特征是基于模糊方法的規(guī)則推理過程如下推理機制采用正向推理策略,也就是由現(xiàn)象根據(jù)規(guī)則推出結論的方法,根據(jù)用戶提供的特征數(shù)據(jù),在知識庫中搜索LHS部分與其相匹配的規(guī)則,然后推出規(guī)則的RHS部分,從而得到一個結論;如果該結論仍然作為知識庫中某個規(guī)則的LHS的組成部分,則表明此次推理過程并未結束,需要按照上述正向推理策略,繼續(xù)進行推理,直到所得結論無法應用任何規(guī)則的LHS部分為止;至此,推理過程結束,所得結論即對應于某個模式的存在; 基于模糊方法的產(chǎn)生式規(guī)則定義如下 IF A1 (rx) and A2 (r2) and—and An (rn) THEN B (a)其中,Ai(i=l,2, ,n)為低效行為特征;B為規(guī)則的結論,即屬于哪種模式;ri(i=l,2, ,η)為低效行為特征的模糊隸屬度閾值;a為規(guī)則的可信度; 具體計算方法如下(1)對于條件&(1=1,2,,η),分別計算其存在的置信度A (0-1),若其超過閾值,則認為條件Ai成立;否則,不成立;(2)根據(jù)規(guī)則定義,計算結論B的可信度β,若結論B的可信度β大于規(guī)則的可信度閾值a,則結論B成立,且可信度為β ;(3)重復后續(xù)規(guī)則推理,將結論B及其置信度β作為更高層規(guī)則的條件代入,從而繼續(xù)后續(xù)規(guī)則的推理,直至推理結束。
6.一種基于模糊規(guī)則推理的并行應用性能脆弱點分析系統(tǒng),其特征是主要由推理機模塊、知識庫、特征提取模塊、綜合數(shù)據(jù)庫和用戶接口模塊組成;其中知識庫存儲用于結論的推理、問題的求解的專家經(jīng)驗的判斷性知識,以及推理、求解過程中的各種控制知識;推理機是系統(tǒng)的組織控制機構,控制、協(xié)調整個系統(tǒng),根據(jù)輸入數(shù)據(jù),利用知識庫中的知識規(guī)則按一定的策略進行推理,對知識庫和綜合數(shù)據(jù)庫進行搜索和查詢,準確有效地使用規(guī)則,得到相應結論,使問題得到求解,并通過用戶接口模塊向用戶提交推理結果;綜合數(shù)據(jù)庫是專家系統(tǒng)的數(shù)據(jù)交換中心,規(guī)則推理的前提與結果、推理產(chǎn)生的中問結果、痕跡文件中獲取的性能特征數(shù)據(jù)等都存儲在全局數(shù)據(jù)庫中,與推理機進行交互;特征提取模塊,通過基于重放的并行痕跡分析方法,從分布存儲的痕跡文件中提取特征值,形成知識庫中所需要的事實,為規(guī)則的建立提供事實基礎,同時,將需要分析的并行程序的分布式痕跡文件進行預處理,提取所需要特征,送入推理機,推理機根據(jù)這些特征和相應的規(guī)則,實現(xiàn)推理。
全文摘要
本發(fā)明涉及高性能計算機并行系統(tǒng)設計與性能調優(yōu)技術,特別是涉及一種基于模糊規(guī)則推理的并行應用性能脆弱點分析方法及系統(tǒng)。所述分析方法,首先將導致并行程序性能低效的各種情況進行抽象,獲得并行程序性能特征模式,構建并行程序性能脆弱點特征模式推理規(guī)則庫,然后采用基于重放的并行痕跡分析方法進行痕跡文件特征提取,識別需要的特征,生成特征文件;將模糊數(shù)學方法引入產(chǎn)生式規(guī)則定義和推理中,采用基于模糊方法的匹配機制,自動搜索事件痕跡的特征模式,實現(xiàn)特征模式的匹配和發(fā)現(xiàn),發(fā)現(xiàn)和定位并行程序的性能脆弱點,最終為進一步的計算機并行系統(tǒng)性能調優(yōu)工作提供輔助決策。所述系統(tǒng)主要由推理機模塊、知識庫、特征提取模塊、綜合數(shù)據(jù)庫和用戶接口模塊組成。
文檔編號G06F17/30GK102289491SQ20111022979
公開日2011年12月21日 申請日期2011年8月11日 優(yōu)先權日2011年8月11日
發(fā)明者于磊, 侯雪梅, 徐冰, 李志博, 杜祝平 申請人:上海紅神信息技術有限公司, 中國人民解放軍信息工程大學