專利名稱:一種數(shù)據(jù)庫性能監(jiān)控方法
技術(shù)領(lǐng)域:
本發(fā)明屬于數(shù)據(jù)庫性能監(jiān)控技術(shù)領(lǐng)域,具體涉及一種數(shù)據(jù)庫性能監(jiān)控方法。
背景技術(shù):
長期以來,對核心數(shù)據(jù)庫的監(jiān)控只能發(fā)現(xiàn)數(shù)據(jù)庫徹底宕機的情況,而對于 數(shù)據(jù)庫性能惡化問題則無法及時發(fā)現(xiàn)。在業(yè)界,也沒有一種成熟的數(shù)據(jù)庫性能 監(jiān)控方案,對數(shù)據(jù)庫的監(jiān)控只能定性不能定量。目前,數(shù)據(jù)庫監(jiān)控的難點在于, 數(shù)據(jù)庫內(nèi)部的性能指標(biāo)成百上千,單個指標(biāo)都可以采集到,但單個指標(biāo)的惡化 不能說明問題,需要有一個綜合性的指標(biāo)能反映整個數(shù)據(jù)庫的綜合性能。發(fā)明內(nèi)容為解決現(xiàn)有技術(shù)中存在的問題,本發(fā)明旨在提供一種能夠及時發(fā)現(xiàn)數(shù)據(jù)庫 性能惡化的有效監(jiān)控方法的技術(shù)方案。所述的一種數(shù)據(jù)庫性能監(jiān)控方法,包括以下步驟從被監(jiān)控數(shù)據(jù)庫獲取性 能數(shù)據(jù)CPU等待時間、1/0等待時間和數(shù)據(jù)庫總等待時間;將上述性能數(shù)據(jù)按 以下公式計算被監(jiān)控數(shù)據(jù)庫的當(dāng)前綜合性能指標(biāo)值I, Te= (CPU等待時間+I/O 等待時間)/數(shù)據(jù)庫總等待時間X100%;將上述當(dāng)前綜合性能指標(biāo)值Te與預(yù)先 設(shè)定的正常值i;比較大小,若Te小于Ta,則提示被監(jiān)控數(shù)據(jù)庫性能存在問題。所述的數(shù)據(jù)庫性能監(jiān)控方法,也可以將上述當(dāng)前綜合性能指標(biāo)值Te與預(yù)先 設(shè)定的性能惡劣值Tb比較大小,若Te小于Tb,則提示被監(jiān)控數(shù)據(jù)庫性能惡劣。所述的數(shù)據(jù)庫性能監(jiān)控方法,其中,所述的正常值1取值范圍為40% 60 %,優(yōu)選為50%。 所述的數(shù)據(jù)庫性能監(jiān)控方法,其中,所述的性能惡劣值Tb取值范圍為10X 20%,優(yōu)選為15%。數(shù)據(jù)庫中的各類等待時間參數(shù)是數(shù)據(jù)庫性能參數(shù)的重要方面,主要包括 CPU等待時間等待CPU運算的時間; I/O等待時間等待系統(tǒng)I/O讀寫的時間; 內(nèi)存等待時間等待內(nèi)存讀寫的時間;鎖等待時間等待鎖釋放的時間; 其他各種等待時間。根據(jù)長期的數(shù)據(jù)庫運維經(jīng)驗,CPU等待時間和I/O等待時間是數(shù)據(jù)庫整體 業(yè)務(wù)壓力的主要體現(xiàn),通常情況下都占了數(shù)據(jù)庫總體等待時間的很大比例,而 諸如內(nèi)存等待、鎖等待等在正常情況下都不會成為業(yè)務(wù)壓力的主要瓶頸。但是, 當(dāng)數(shù)據(jù)庫性能發(fā)生惡化時,異常情況往往都會表現(xiàn)在內(nèi)存等待、鎖等待等指標(biāo)上,而相應(yīng)的,此時的CPU等待,1/0等待的比例就會迅速下降?;谏鲜龇治?,將(CPU等待時間+I/O等待時間)/數(shù)據(jù)庫總等待時間* 100%作為數(shù)據(jù)庫性能的一個綜合指標(biāo),并將該指標(biāo)與預(yù)先設(shè)定的正常指標(biāo)值/性能惡 劣指標(biāo)值比較,根據(jù)比較結(jié)果生成告警,從而及時、有效的監(jiān)控數(shù)據(jù)庫性能,告警準(zhǔn)確率達(dá)95。/^,有效率達(dá)80%。當(dāng)然,針對不同的應(yīng)用情況,上述的正常指標(biāo)值/性能惡劣指標(biāo)值范圍可以 根據(jù)實際情況有所調(diào)整。
圖1為本發(fā)明所述的數(shù)據(jù)庫性能監(jiān)控方法的一較佳實施例的流程示意圖。 圖2為本發(fā)明具體實施例中的監(jiān)控告警統(tǒng)計圖。
具體實施方式
現(xiàn)結(jié)合說明書附圖,詳細(xì)說明本發(fā)明的一較佳實施例及其應(yīng)用效果。參見圖l,針對浙江移動現(xiàn)階段的Oracle數(shù)據(jù)庫,采用所述的數(shù)據(jù)庫性能監(jiān) 控方法實現(xiàn)該數(shù)據(jù)庫綜合性能的監(jiān)控通過現(xiàn)有的Pridse監(jiān)控工具每15分鐘會 生成一份Oracle數(shù)據(jù)庫性能數(shù)據(jù),其中包含非常多的Oracle數(shù)據(jù)庫性能指標(biāo)數(shù) 據(jù),從上述性能指標(biāo)數(shù)據(jù)中提取CPU等待時間、1/0等待時間和數(shù)據(jù)庫總等待 時間;然后根據(jù)我們的綜合性能運算公式Te二 (CPU等待時間+I/0等待時間) /數(shù)據(jù)庫總等待時間*100%,得到該數(shù)據(jù)庫的當(dāng)前綜合性能指標(biāo)值Te;將Tc與 預(yù)先設(shè)定的正常閥值Ta比較大小,1的取值范圍為40% 60%,優(yōu)選為50%,若Te小于Ta,則提示被監(jiān)控數(shù)據(jù)庫性能存在問題,生成相應(yīng)的監(jiān)控告警,通知相關(guān)維護人員處理;同時,也可以將Te與預(yù)先設(shè)定的性能惡劣值Tb比較大小, Tb取值范圍為10% 20%,優(yōu)選為15%,若Te小于Tb,則提示被監(jiān)控數(shù)據(jù)庫 性能惡劣,生成相應(yīng)的監(jiān)控告警,通知相關(guān)維護人員處理。另一方面,也可將 上述性能指標(biāo)數(shù)據(jù)存檔以備后用。上述數(shù)據(jù)庫性能監(jiān)控方法應(yīng)用于浙江移動數(shù)據(jù)庫綜合性能告警,從2007年4 月至7月的告警分類統(tǒng)計圖來看,參見圖2,其中,有效1/有效2均表示告警被 有效處理,有效1表示通過工作日志可以明確判斷該告警有效避免了后續(xù)的意 外情況,有效2表示無法明確判斷是否有效避免了意外情況,突發(fā)值表示該告 警處理時數(shù)據(jù)庫性能已經(jīng)恢復(fù)到正常水平,但該部分告警起到了提醒的作用, 系統(tǒng)組可以有針對性地對數(shù)據(jù)庫性能進行關(guān)注,突發(fā)值表示該告警處理時數(shù)據(jù) 庫性能已經(jīng)恢復(fù)到正常水平,但該部分告警起到了提醒的作用,系統(tǒng)組可以有 針對性地對數(shù)據(jù)庫性能進行關(guān)注,誤報主要由于營業(yè)庫從學(xué)院路回切至樞紐樓
時告警配置沒有及時修改造成,現(xiàn)已調(diào)整,不會再出現(xiàn)誤報,少量重復(fù)告警。從圖2可知,該期間監(jiān)控告警共計出現(xiàn)了42次,告警準(zhǔn)確率達(dá)到95%,有效率 達(dá)到80%;若除去配置問題產(chǎn)生的誤報,該監(jiān)控方法的告警準(zhǔn)確率達(dá)到100%, 有效率達(dá)到85。%;可見,該數(shù)據(jù)庫性能監(jiān)控方法已在實際生產(chǎn)中發(fā)揮了良好的 作用。
權(quán)利要求
1.一種數(shù)據(jù)庫性能監(jiān)控方法,其特征在于,包括以下步驟從被監(jiān)控數(shù)據(jù)庫獲取性能數(shù)據(jù)CPU等待時間、I/O等待時間和數(shù)據(jù)庫總等待時間;將上述性能數(shù)據(jù)按以下公式計算被監(jiān)控數(shù)據(jù)庫的當(dāng)前綜合性能指標(biāo)值TcTc=(CPU等待時間+I/O等待時間)/數(shù)據(jù)庫總等待時間×100%;將上述當(dāng)前綜合性能指標(biāo)值Tc與預(yù)先設(shè)定的正常值Ta比較大小,若Tc小于Ta,則提示被監(jiān)控數(shù)據(jù)庫性能存在問題。
2. 如權(quán)利要求1所述的數(shù)據(jù)庫性能監(jiān)控方法,其特征在于所述當(dāng)前綜合性能指標(biāo)值Te與預(yù)先設(shè)定的性能惡劣值Tb比較大小,若Tc小于Tb,則提示被監(jiān)控數(shù)據(jù)庫性能惡劣。
3. 如權(quán)利要求1所述的數(shù)據(jù)庫性能監(jiān)控方法,其特征在于所述的正常值 1取值范圍為40% 60%。
4. 如權(quán)利要求3所述的數(shù)據(jù)庫性能監(jiān)控方法,其特征在于所述的正常值Ta為50%。
5. 如權(quán)利要求2所述的數(shù)據(jù)庫性能監(jiān)控方法,其特征在于所述的性能惡 劣值Tb取值范圍為10% 20%。
6. 如權(quán)利要求5所述的數(shù)據(jù)庫性能監(jiān)控方法,其特征在于所述的性能惡 劣值Tb為15%。
全文摘要
本發(fā)明公開了一種數(shù)據(jù)庫性能監(jiān)控方法,屬于數(shù)據(jù)庫性能監(jiān)控技術(shù)領(lǐng)域。所述的監(jiān)控方法,從數(shù)據(jù)庫中獲取相關(guān)性能參數(shù),將(CPU等待時間+I/O等待時間)/數(shù)據(jù)庫總等待時間*100%作為數(shù)據(jù)庫性能的一個綜合指標(biāo),并將該指標(biāo)與預(yù)先設(shè)定的正常指標(biāo)值/性能惡劣指標(biāo)值比較,根據(jù)比較結(jié)果生成告警。所述監(jiān)控方法能夠及時、有效的監(jiān)控數(shù)據(jù)庫性能。
文檔編號G06F11/34GK101158916SQ20071015688
公開日2008年4月9日 申請日期2007年11月19日 優(yōu)先權(quán)日2007年11月19日
發(fā)明者王曉征 申請人:中國移動通信集團浙江有限公司