專利名稱:組任務(wù)管理的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機操作系統(tǒng)任務(wù)管理的方法,特別是一種組任務(wù)管理(GTM)的 方法及根據(jù)此制成的組件。
背景技術(shù):
組任務(wù)管理組件是運行在UNIX操作系統(tǒng)環(huán)境下的守護進程。類似于unix下 crontab進程,通過定時掃描配置信息運行參數(shù)表去執(zhí)行滿足執(zhí)行條件的工作。工 作是由一個或多個任務(wù)組成,每個任務(wù)都是一個獨立的邏輯單元,當(dāng)所有任務(wù)都 執(zhí)行完畢,工作才算做完。組件對工作中任務(wù)的執(zhí)行順序做預(yù)先的定義;組件執(zhí) 行過程將嚴(yán)格按照任務(wù)執(zhí)行線路(路由)進行。每項工作只有一個任務(wù)路由,每 個任務(wù)路由是由多條任務(wù)路徑構(gòu)成。在unix下通過crontab可以配置多個任務(wù), 但這些任務(wù)都是互不影響的。
發(fā)明內(nèi)容
本發(fā)明目的是針對現(xiàn)有技術(shù)中的不足,本發(fā)明提出了一種組任務(wù)管理(GTM) 的方法和組件,每個任務(wù)路由是由多條任務(wù)路徑構(gòu)成,在unix下通過crontab可 以配置多個任務(wù),可以串行、串/并行混合執(zhí)行任務(wù)。
本發(fā)明的技術(shù)方案是組任務(wù)管理GTM的方法,運行在UNIX操作系統(tǒng)環(huán)境下 的守護進程,通過定時掃描配置信息運行參數(shù)表去執(zhí)行滿足執(zhí)行條件的工作,工 作由一個或多個任務(wù)組成,每個任務(wù)都是一個獨立的邏輯單元,當(dāng)所有任務(wù)都執(zhí) 行完畢,工作才完成,組件對工作中任務(wù)的執(zhí)行順序做預(yù)先的定義;組件執(zhí)行過 程將嚴(yán)格按照任務(wù)執(zhí)行路由進行,每項工作只有一個任務(wù)路由,每個任務(wù)路由是 由多條任務(wù)路徑構(gòu)成。任務(wù)的執(zhí)行順序是串行或串/并行混合
任務(wù)串行執(zhí)行的步驟是只有當(dāng)任務(wù)Ti執(zhí)行完成后才能執(zhí)行Ti+l;當(dāng)最后 一個Ti+l執(zhí)行完成后才能執(zhí)行結(jié)束步驟TE;當(dāng)TE被執(zhí)行時,該工作被執(zhí)行完成, i是自然數(shù);
任務(wù)混合執(zhí)行的歩驟是只有當(dāng)所有并行任務(wù)執(zhí)行完成后才能執(zhí)行下一任務(wù), 以此類推,前面并行任務(wù)執(zhí)行完成后,才能以串行方式執(zhí)行后面的任務(wù),直到所 有任務(wù)完成,再執(zhí)行TE,當(dāng)TE被執(zhí)行時,該工作被執(zhí)行完成。
當(dāng)發(fā)生超時運行或錯誤的工作時本組件進行告警;告警的方式是短信或郵件。 短信告警設(shè)置允許告警開始和結(jié)束時間;發(fā)送告警短信的間隔時間可控。
本發(fā)明的效果是與現(xiàn)有技術(shù)相比,本方法及構(gòu)成的組件可以進行串行、串/ 并行混合執(zhí)行任務(wù)。
圖1是工作串行執(zhí)行任務(wù)路由圖
圖2是工作串/并fi^混合執(zhí)行任務(wù)路由圖 圖3是任務(wù)結(jié)點的狀態(tài)轉(zhuǎn)化圖
圖4是組任務(wù)管理GTM組件結(jié)構(gòu)圖
具體實施例方式
下面結(jié)合附圖與具體實施方式
對本發(fā)明作進一步說明。
1、串行執(zhí)行。在unix下通過crontab可以配置多個任務(wù),但這些任務(wù)都是 互不影響的,組任務(wù)管理(GTM)組件可以通過配置任務(wù)執(zhí)行的順序?qū)⒍鄠€任務(wù)以鏈 表的方式串行執(zhí)行,且后一個任務(wù)的執(zhí)行必須建立在前一個任務(wù)執(zhí)行成功的基礎(chǔ) 上。
2、 混合執(zhí)行。在unix下通過crontab可以配置多個任務(wù),但這些任務(wù)都是互 不影響的,組任務(wù)管理(GTM)組件可以通過配置任務(wù)執(zhí)行的順序?qū)⒍鄠€任務(wù)以串并 混合的方式執(zhí)行,即可以在成功執(zhí)行完一個任務(wù)的基礎(chǔ)上并發(fā)執(zhí)行多個任務(wù),等待 多任務(wù)完成后繼續(xù)執(zhí)行某一個單獨的任務(wù)的串并型多任務(wù)混合處理機制.且后一 個任務(wù)的執(zhí)行必須建立在前一個或多個任務(wù)執(zhí)行成功的基礎(chǔ)上.
3、 告警。通過告警,對發(fā)生超時運行或錯誤的工作向相關(guān)的負責(zé)人進行提醒, 以便進一步找出告警原因,通過人工干預(yù)的方式解決問題;可以通過短信和郵件 的方式進行。對于短信告警可以設(shè)置允許告警開始和結(jié)束時間,只有在這一段時 間里,方可向指定的手機號碼發(fā)送短信。對于短信的密度也可以做到控制,要求 在允許告警的時間范圍內(nèi),每隔多長時間發(fā)送告警短信一次,以免短信過于集中 讓人產(chǎn)生厭惡感。
配置說明 一個工作被完整定義至少需要3張參數(shù)表,分別是工作表,路 由表,任務(wù)表。
工作定義 一項工作簡單的理解就是一件要做的事情。通常處理復(fù)雜事情的 有效方法是分而治之,把一項龐大、繁雜的工作分解成多個目標(biāo)明確、容易實現(xiàn) 的任務(wù)來完成是比較恰當(dāng)?shù)姆椒?。?dāng)這些分解后的小任務(wù)被完成了,那么這項工 作也就被完成了。
字段說明每項工作的D是區(qū)別一個工作的唯一標(biāo)識;每項工作都由工作名 稱,工作所屬的子系統(tǒng),工作的狀態(tài),執(zhí)行類型,上次執(zhí)行時間,本次執(zhí)行時間, 下次執(zhí)行時間,時間間隔,是否告警,工作的優(yōu)先級,超時開關(guān)設(shè)置,工作開始 生效時間,工作結(jié)束i效時間,工作使用標(biāo)志組成。在目前的組任務(wù)管理組件中 僅僅支持兩種執(zhí)行類型 一種是定時類型 一種是觸發(fā)類型。對于定時類型工作, 當(dāng)下次執(zhí)行時間到達時,組件便自動執(zhí)行該工作;對于觸發(fā)類型工作,每次需要 執(zhí)行時,需要人工觸發(fā)其執(zhí)行。當(dāng)這項工作的執(zhí)行類型是觸發(fā)類型,那么下次執(zhí) 行時間,時間間隔字段不需要定義。如果工作的執(zhí)行類型是定時類型,則需要配 置下次執(zhí)行時間,時間間隔。下次執(zhí)行時間第一次執(zhí)行時,由手工配置,以后由 系統(tǒng)自動修改時間間隔的配置。
定時間隔表示對兩次工作之間執(zhí)行時間間隔可以按,月,周,天,小時, 分鐘。
每萬教療一沈-a,邁o"t力5/臘iLo^e,"
每三yf教療一沈'廚f一ofeteW求7 每厥天說療一汰.'艦t一血e" 每三個V、好炎療一 汰.'"e;r t—ofe teA5/W 每西十分好教療一汰,"e^—cfe"+必/0扭朋,
超時開關(guān)設(shè)置當(dāng)其值為O時,表示其關(guān)閉超時設(shè)置;否則為打開超時開關(guān)(即 當(dāng)該工作運行時間超過timeout分鐘后,該工作的狀態(tài)將由正常運行狀態(tài)轉(zhuǎn)成超 時運行狀態(tài)。如果告警標(biāo)志為'l',則會對超時運行的工作進行告警。此時需 要在參數(shù)表(td—s—alarm)配置一條告警記錄.
任務(wù)結(jié)點的狀態(tài)轉(zhuǎn)化,參考圖3,并根據(jù)圖4的組件。
任務(wù)定義每項任務(wù)是構(gòu)成一個工作的邏輯組成單元。每項任務(wù)都有自己唯 一標(biāo)識的ID,任務(wù)名稱,插件類型,插件名,通道號,開始生效時間,結(jié)束生效 時間,生效標(biāo)志,插件位置,是否加密連接信息,連接用戶名,連接口令,連接 SID等組成。對于同一個項任務(wù)可以應(yīng)用于不同的工作中,也就是說它可以被一個 或多個工作所共享。 一個典型的例子,在組任務(wù)管理組件中,定義兩個系統(tǒng)級任 務(wù);它們被用來表示所有工作中必需的一個開始任務(wù)(ID為0)和一個結(jié)束任務(wù) (ID為-1)。它們在工作路由中作為虛擬結(jié)點存在,所有路由都有從開始任務(wù)結(jié) 點開始執(zhí)行,從結(jié)束結(jié)點執(zhí)行來結(jié)束整個工作。組任務(wù)管理組件目前支持兩種插 件類型 一種是UNIX下后臺應(yīng)用程序或shell腳本; 一種是存儲過程。在插件 名中,如果插件類型是后臺應(yīng)用程序或shell腳本,則插件名稱中可以包含指定 的絕對路徑;否則,在組件中指定的shell路徑下查找并執(zhí)行。如shell腳本 l.sh,在插件名中即可以配置成SHOME/bin/l.sh,也可以配置成1. sh。對于后一 種,僅僅在組任務(wù)管理的當(dāng)前工作目錄或特定shell目錄下査找并執(zhí)行。
通道號是作為任務(wù)固定傳遞參數(shù)而存在的。它由組任務(wù)管理組件使用人員配置 并被對應(yīng)的存儲過程或后臺應(yīng)用程序(包括shell腳本)去解釋。
例如,在B0SS1.0的應(yīng)用中,當(dāng)一個表的數(shù)據(jù)量很大時,通常把這些記錄數(shù)據(jù) 進行分組處理;你可以讓特定的通道號任務(wù)處理特定組數(shù)據(jù)(IO個通道[編號從0 到9]的任務(wù)去處理0到9999組的數(shù)據(jù),則0通道處理0-999組數(shù)據(jù),1通道處理 1000-1999數(shù)據(jù),以此類推)。再如,欠費處理的存儲過程,包括欠費停機,欠費 預(yù)銷號,欠費銷號功能;這些功能合在一個存儲過程中,這時可以通過在通道號 配置成不同的數(shù)值來讓存儲過程解釋并使用不同的功能。
插件位置主要針對任務(wù)類型為存儲過程而設(shè)置的。對于非存儲過程類型,其 必須配置成"LOCAL",因為目前組任務(wù)管理組件所執(zhí)行shell腳本或后臺應(yīng)用程 序前提是它們必須和組件管理組件在同一臺應(yīng)用服務(wù)器上,無法支持跨系統(tǒng)執(zhí)行。 如果任務(wù)類型是存儲過程,可以通過配置成"REMOTE",以達到功能的擴展可 以運行同一個數(shù)據(jù)庫實例下屬于不同用戶的存儲過程;可以運行不同數(shù)據(jù)庫實例 下的存儲過程。否則,當(dāng)位置被配置成"LOCAL"時,只能運行和核心參數(shù)表屬于 同一個用戶下的存儲過程。當(dāng)任務(wù)類型是存儲過程并且插件位置為"REMOTE"時,
是否加密連接信息、連接用戶名、連接口令、連接SID才有^義。當(dāng)rSSNCRYPT 為"N0"時,連接數(shù)據(jù)庫的用戶,密碼,SID是以明碼的形式保存在對應(yīng)任務(wù)中; 否則,將以加密的形式保存.存儲過程的定義必須有固定的參數(shù)傳入、傳出格式, v—resultcode存儲過程的返回碼;v—resultinfo存儲過程的返回信息。詳細請看 配置解析.在存儲中不需要做事務(wù)控制,事務(wù)的控制是存儲過程的外部實現(xiàn)的。
路由每一個工作都對應(yīng)著一個唯一的執(zhí)行路由。主控進程按照路由中展示 的任務(wù)先后執(zhí)行順序,執(zhí)行滿足條件的任務(wù)。當(dāng)執(zhí)行到路由中最后一個虛擬結(jié)束 任務(wù)結(jié)點時,預(yù)示著整個工作完成,這時工作的狀態(tài)從運行狀態(tài)回到準(zhǔn)備就緒狀 態(tài),等待下次執(zhí)行時間的到來。路由分類,對路由進行簡單分類.-
I) 串行路由,參考圖1 :TB-〉Tl-〉T2->T3->T4->T5-〉TE
在上述工作路由圖中,只有當(dāng)任務(wù)Ti(i^一4)執(zhí)行完成后才能執(zhí)行Ti+l;當(dāng)最后 一個Ti+l (即T5)執(zhí)行完成后才能執(zhí)行TE;當(dāng)TE被執(zhí)行時,才認為該工作被執(zhí) 行完成。組成工作的任務(wù)按照路由順序地串行執(zhí)
II) 并行路由:任務(wù)T1、 T2、 T3、 T4、 T5并發(fā)執(zhí)行。當(dāng)Ti5)都執(zhí)行完成后, 才能執(zhí)行TE。當(dāng)TE被執(zhí)行時,才認為該工作被執(zhí)行完成。
in)混合路由
在上述工作路由圖中,任務(wù)T1,T2,T4并發(fā)執(zhí)行。只有當(dāng)任務(wù)T1,T4執(zhí)行完 成后才能執(zhí)行T3;只有當(dāng)T2,T4執(zhí)行完成后才能執(zhí)行T5;當(dāng)T3和T5都執(zhí)行完成 后,才能執(zhí)行TE。當(dāng)TE被執(zhí)行時,才認為該工作被執(zhí)行完成。(參照 ucr—yy01_kf. td—s_work表中欠費數(shù)據(jù)生成工作的配置)無論是哪一種工作路由 圖,在組成工作的任務(wù)中都存在兩個虛擬任務(wù)結(jié)點。任何路由都是從虛擬開始任 務(wù)結(jié)點作為路由開始頂點,以虛擬結(jié)束結(jié)點作為路由結(jié)束頂點。把從一個任務(wù)結(jié) 點到達另一個任務(wù)結(jié)點的有向連線,稱為有向邊(directed edge)。在工作路由 圖中每一條有向邊構(gòu)成路由表中的一條記錄。在工作路由圖中,指向同一個任務(wù) 結(jié)點的多條有向邊具有相同的控制信息(即被執(zhí)行任務(wù)的控制信息)。這些控制 信息包括狀態(tài)、進程ID、開始執(zhí)行時間、結(jié)束執(zhí)行時間、是否設(shè)置超時、超時 時間間隔、從超時狀態(tài)轉(zhuǎn)化為失敗狀態(tài)的時間間隔、超時動作碼、失敗動作碼、 失敗重試控制次數(shù)、當(dāng)前失敗重試控制次數(shù),最近一次失敗重試時間、失敗重試時 間間隔。在組任務(wù)管理組件中,指向同一個任務(wù)結(jié)點的有向邊可能為多條,這些 有向邊上控制信息在工作路由表的配置是冗余的,但是必須的。
參考圖3,任務(wù)結(jié)點的狀態(tài)轉(zhuǎn)化圖,狀態(tài)包括準(zhǔn)備就緒(S—PREPARED)、正 常運行(S—RUNNING)、超時運行(S—TORUNNING)、重試運行(S—REDORUNNING)、 正常結(jié)束(S—END)、跳出結(jié)束(S一SK麵D)、失敗(S—FAULT)。 對于某一個工作的生命周期中,這些狀態(tài)不會全部出現(xiàn);而且任務(wù)結(jié)點某些狀態(tài) 的出現(xiàn)是和有向邊上的控制信息設(shè)置有關(guān)系。如,在控制信息中沒有設(shè)置超時, 則該有向邊所指的任務(wù)結(jié)點不可能出現(xiàn)S一TORUNNING狀態(tài)。任務(wù)結(jié)點的某些狀態(tài) 的出現(xiàn)和你對執(zhí)行該結(jié)點時所采取告警和失敗策略有關(guān)。進程ID是執(zhí)行該任務(wù)
結(jié)點時的子進程ID。如果該結(jié)點是虛擬結(jié)束任務(wù)結(jié)點,則該迸程ID是主^5T迸程: ID。開始執(zhí)行時間和結(jié)束執(zhí)行時間記錄該任務(wù)結(jié)點從開始執(zhí)行到執(zhí)行結(jié)束的時間 記錄。是否設(shè)置超時是為該結(jié)點運行時間作出限制。當(dāng)任務(wù)執(zhí)行時間超時這一限 制(即超時時間間隔),則該任務(wù)的狀態(tài)將轉(zhuǎn)變成超時運行狀態(tài)。如果沒有設(shè)置, 則不會有超時運行狀態(tài)。對于超時運行狀態(tài)的任務(wù),你可以決定讓它一直"超時" 下去,也可以讓它到達某一個閥值(即從超時狀態(tài)轉(zhuǎn)化為失敗狀態(tài)的時間間隔) 自動轉(zhuǎn)化成失敗狀態(tài)。這種"決定"取決于你所配置的超時動作碼。在超時動作 碼中,TC—NOTRANSIT會該結(jié)點一直超時下去,直到它失敗或結(jié)束;TC一TRANSIT會 讓該結(jié)點超時運行一段時間后就此"打住"。對于失敗動作碼是對失敗的處理策 略忽略(默認該任務(wù)結(jié)點執(zhí)行成功);重試(有限或無限嘗試)。
當(dāng)失敗動作碼為重試時,則失敗重試控制次數(shù)、當(dāng)前失敗重試控制次數(shù)、最 近一次失敗重試時間、失敗重試時間間隔起作用。失敗重試控制次數(shù)小于等于0, 則為無限嘗試失敗,直到該任務(wù)成功執(zhí)行為止。
告警通過告警,對發(fā)生超時運行或錯誤的工作向相關(guān)的負責(zé)人進行提醒, 以便進一步找出告警原因,通過人工干預(yù)的方式解決問題;可以通過短信和郵件 的方式進行。對于短信告警可以設(shè)置允許告警開始和結(jié)束時間,只有在這一段時 間里,方可向指定的手機號碼發(fā)送短信。對于短信的密度也可以做到控制,要求 在允許告警的時間范圍內(nèi),每隔多長時間發(fā)送告警短信一次,以免短信過于集中 讓人產(chǎn)生厭惡感。每一條告警配置參數(shù)屬于某項特定的工作。當(dāng)工作處于超時運 行或出錯狀態(tài),則可以根據(jù)工作的是否告警標(biāo)志來決定是否向用戶發(fā)出告警通知。 向用戶發(fā)出通知依賴于告警參數(shù)表。它包括工作ID、告警ID、告警方式、最近一 次告警時間、告警間隔、允許告警開始時間、允許告警結(jié)束時間、移動電話號碼、 電子郵件地址、告警是否生效標(biāo)志等組成。目前組件支持的告警方式 一種是短 信方式;另一種是郵件方式。組件并不保證被告警的用戶一定收到告警通知信息; 它僅僅把相關(guān)的告警信息插入對應(yīng)的告警接口表中,如短信接口表,而由相關(guān)的 接口處理程序完成接口信息的處理。告警間隔的時間單位為分鐘。允許告警開始 時間和允許告警結(jié)束時間的格式為hh24mi的格式串,如,允許從早晨08: 00到 晚上9: OO這段時間內(nèi)
向用戶發(fā)短信告警通知信息,其對應(yīng)的時間格式串分別為"0800", "2100"。 最近一次告警時間是組件在告警時自動維護,不需要人工干預(yù)。當(dāng)用戶不希望 收到告警通知信息,他可以把告警是否生效標(biāo)志置成不生效。
權(quán)利要求
1、組任務(wù)管理的方法,采用運行在UNIX操作系統(tǒng)環(huán)境下的守護進程的組任務(wù)管理GTM組件,通過定時掃描配置信息運行參數(shù)表去執(zhí)行滿足執(zhí)行條件的工作,工作由一個或多個任務(wù)組成,每個任務(wù)都是一個獨立的邏輯單元,當(dāng)所有任務(wù)都執(zhí)行完畢,工作才完成,組件對工作中任務(wù)的執(zhí)行順序做預(yù)先的定義;組件執(zhí)行過程將嚴(yán)格按照任務(wù)執(zhí)行路由進行,每項工作只有一個任務(wù)路由,每個任務(wù)路由是由多條任務(wù)路徑構(gòu)成,其特征是任務(wù)的執(zhí)行順序是串行或串/并行混合任務(wù)串行執(zhí)行的步驟是只有當(dāng)任務(wù)Ti執(zhí)行完成后才能執(zhí)行Ti+1;當(dāng)最后一個Ti+1執(zhí)行完成后才能執(zhí)行結(jié)束步驟TE;當(dāng)TE被執(zhí)行時,該工作被執(zhí)行完成,i是自然數(shù);任務(wù)混合執(zhí)行的步驟是只有當(dāng)所有并行任務(wù)執(zhí)行完成后才能執(zhí)行下一任務(wù),以此類推,前面并行任務(wù)執(zhí)行完成后,才能以串行方式執(zhí)行后面的任務(wù),直到所有任務(wù)完成,再執(zhí)行TE,當(dāng)TE被執(zhí)行時,該工作被執(zhí)行完成。
2、 根據(jù)權(quán)利要求1所述組任務(wù)管理GTM的方法,其特征是所述組件當(dāng)發(fā)生超 時運行或錯誤的工作時進行告警;告警的方式采用短信或郵件。
3、 根據(jù)權(quán)利要求2所述組任務(wù)管理GTM的方法,其特征是所述短信告警設(shè)置 允許告警開始和結(jié)束時間;發(fā)送告警短信的間隔時間可控。
全文摘要
組任務(wù)管理的方法,采用運行在UNIX操作系統(tǒng)環(huán)境下的守護進程的組任務(wù)管理GTM組件,通過定時掃描配置信息運行參數(shù)表去執(zhí)行滿足執(zhí)行條件的工作,工作由一個或多個任務(wù)組成,每個任務(wù)都是一個獨立的邏輯單元,當(dāng)所有任務(wù)都執(zhí)行完畢,工作才完成,組件對工作中任務(wù)的執(zhí)行順序做預(yù)先的定義;組件執(zhí)行過程將嚴(yán)格按照任務(wù)執(zhí)行路由進行,每項工作只有一個任務(wù)路由,每個任務(wù)路由是由多條任務(wù)路徑構(gòu)成,任務(wù)的執(zhí)行順序是串行或串/并行混合任務(wù)串行執(zhí)行的步驟是只有當(dāng)任務(wù)Ti執(zhí)行完成后才能執(zhí)行Ti+1;當(dāng)最后一個Ti+1執(zhí)行完成后才能執(zhí)行結(jié)束步驟TE;當(dāng)TE被執(zhí)行時,該工作被執(zhí)行完成,i是自然數(shù)。
文檔編號G06F9/46GK101110041SQ200710130908
公開日2008年1月23日 申請日期2007年8月23日 優(yōu)先權(quán)日2007年8月23日
發(fā)明者嚴(yán)克平, 希 朱 申請人:南京聯(lián)創(chuàng)科技股份有限公司