本發(fā)明涉及一種醫(yī)療大數(shù)據(jù)倉庫的創(chuàng)建方法及系統(tǒng)。
背景技術(shù):
隨著醫(yī)療行業(yè)競爭的加劇、新醫(yī)改方案的出臺等因素的影響,目前醫(yī)院所處大環(huán)境出現(xiàn)了新的變化,生存與發(fā)展面臨著新的挑戰(zhàn)。同時隨著醫(yī)療模式轉(zhuǎn)型的逐步轉(zhuǎn)變,醫(yī)院的轉(zhuǎn)型模式已經(jīng)從粗放式向精細(xì)化、終末式向環(huán)節(jié)化、經(jīng)驗(yàn)式向循證化的管理方向轉(zhuǎn)變,醫(yī)院需要綜合的、多維的、智能的、易操作的智能分析系統(tǒng)為醫(yī)院提供科學(xué)全面的數(shù)據(jù)支持,推動醫(yī)院管理從根據(jù)經(jīng)驗(yàn)的粗放型管理轉(zhuǎn)向依拖數(shù)據(jù)的精細(xì)化管理轉(zhuǎn)變。
雖然在醫(yī)院信息化方面已經(jīng)取得了長足的進(jìn)步,但目前仍然存在一些不足,具體表現(xiàn)在:
1)隨著數(shù)字化的不斷深入,建立了面向不同需求的應(yīng)用系統(tǒng),但由于這些系統(tǒng)來均自不同的廠家,這就造成了醫(yī)院的信息在各個應(yīng)用系統(tǒng)之間無法互聯(lián)互通的問題,數(shù)據(jù)是豐富的,但知識貧乏,各個系統(tǒng)之間缺乏有效信息共享手段,導(dǎo)致信息孤島的形成,阻礙了醫(yī)院信息化的進(jìn)程。
2)信息化經(jīng)歷了多年的發(fā)展應(yīng)用,積累了大量的數(shù)據(jù),但大部分?jǐn)?shù)據(jù)卻是放在醫(yī)院的不同服務(wù)器上,在進(jìn)行整合應(yīng)用時存在數(shù)據(jù)來源不清、數(shù)據(jù)質(zhì)量不高,異構(gòu)系統(tǒng)之間數(shù)據(jù)集成困難,缺乏統(tǒng)一的標(biāo)準(zhǔn),數(shù)據(jù)信息一般都是淺層次應(yīng)用,一般都是只分析不利用,對監(jiān)控指標(biāo)未形成有效的閉環(huán)管控,難以推動醫(yī)院管理的持續(xù)改進(jìn)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的就是為了解決上述問題,提供一種醫(yī)療大數(shù)據(jù)倉庫的創(chuàng)建方法及系統(tǒng),它具有通過構(gòu)建數(shù)據(jù)倉庫來減輕對醫(yī)院服務(wù)器訪問的壓力優(yōu)點(diǎn)。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
一種醫(yī)療大數(shù)據(jù)倉庫的創(chuàng)建方法,包括如下步驟:
步驟(1):將各個醫(yī)療衛(wèi)生信息系統(tǒng)的業(yè)務(wù)數(shù)據(jù)庫中的共享數(shù)據(jù)和非共享數(shù)據(jù)通過ETL工具抽取、清洗、轉(zhuǎn)換到ODS數(shù)據(jù)緩沖區(qū);
步驟(2):將ODS數(shù)據(jù)緩沖區(qū)的共享數(shù)據(jù)通過ETL工具抽取、清洗、轉(zhuǎn)換到ODS的共享數(shù)據(jù)區(qū)中;
步驟(3):將ODS數(shù)據(jù)緩沖區(qū)的非共享數(shù)據(jù)抽取到數(shù)據(jù)倉庫中;將ODS的共享數(shù)據(jù)區(qū)的共享數(shù)據(jù)抽取到數(shù)據(jù)倉庫中。
所述共享數(shù)據(jù)包括:醫(yī)院資源中患者、醫(yī)生、設(shè)備的基礎(chǔ)信息;例如:患者的卡號、姓名、性別、身份證號;醫(yī)生的工號、職稱、掛診科室;設(shè)備型號、生產(chǎn)廠家、有效使用期;
所述非共享數(shù)據(jù)包括:患者的醫(yī)囑信息、患者的檢查信息(影像)、醫(yī)生的晉升記錄、醫(yī)生的培訓(xùn)記錄、醫(yī)生的手術(shù)記錄和設(shè)備的維修記錄;
所述步驟(1)的步驟如下:
步驟(101):通過ETL工具從各個醫(yī)療衛(wèi)生信息系統(tǒng)的業(yè)務(wù)數(shù)據(jù)庫中抽取數(shù)據(jù);所述業(yè)務(wù)數(shù)據(jù)庫包括HIS、LIS或PACS;
步驟(102):向抽取數(shù)據(jù)中添加設(shè)定的數(shù)據(jù)抽取日期;
步驟(103):將添加數(shù)據(jù)抽取日期的數(shù)據(jù)存儲到ODS數(shù)據(jù)緩沖區(qū)中。
所述步驟(2)的步驟如下:
步驟(201):通過ETL工具從ODS數(shù)據(jù)緩沖區(qū)中抽取編碼類數(shù)據(jù)和指標(biāo)類數(shù)據(jù);
步驟(202):根據(jù)需要,將編碼類數(shù)據(jù)利用EMPI患者索引轉(zhuǎn)換成統(tǒng)一信息編碼,將統(tǒng)一信息編碼存儲到ODS的共享數(shù)據(jù)區(qū)中;
步驟(203):根據(jù)需要,依據(jù)指標(biāo)類數(shù)據(jù)人為設(shè)定指標(biāo)量綱規(guī)范,將指標(biāo)量綱規(guī)范存儲到ODS的共享數(shù)據(jù)區(qū)中。
所述編碼類數(shù)據(jù)包括:業(yè)務(wù)字典,所述業(yè)務(wù)字典包括:醫(yī)囑字典、費(fèi)用項(xiàng)目、患者列表、員工列表;
所述指標(biāo)類數(shù)據(jù)包括:業(yè)務(wù)數(shù)據(jù),所述業(yè)務(wù)數(shù)據(jù)包括:門診人次、藥品費(fèi)用、抗菌藥物使用、住院收入。
所述步驟(3)的抽取采用增量抽取方法,如果在抽取過程中無法判斷增量,則在抽取時,應(yīng)用ETL工具通過CDC技術(shù)實(shí)現(xiàn)增量抽取。
所述步驟(3)在抽取的過程中加入抽取時間標(biāo)志。
所述步驟(3)的步驟如下:
步驟(301):從ODS中依據(jù)指標(biāo)量綱規(guī)范(醫(yī)療數(shù)據(jù)指標(biāo)的源數(shù)據(jù))、數(shù)據(jù)倉庫模型(數(shù)據(jù)倉庫建設(shè)結(jié)構(gòu))和統(tǒng)一信息編碼(匯總信息后的信息統(tǒng)一標(biāo)識)抽取數(shù)據(jù);
步驟(302):
將ODS共享數(shù)據(jù)區(qū)指標(biāo)類數(shù)據(jù)依據(jù)指標(biāo)量綱規(guī)范和數(shù)據(jù)倉庫模型轉(zhuǎn)換為事實(shí)表數(shù)據(jù);
將ODS共享數(shù)據(jù)區(qū)編碼類數(shù)據(jù)依據(jù)統(tǒng)一信息編碼和數(shù)據(jù)倉庫模型轉(zhuǎn)換為緯度表數(shù)據(jù);
將ODS數(shù)據(jù)緩沖區(qū)的非共享數(shù)據(jù)中的指標(biāo)類數(shù)據(jù)依據(jù)指標(biāo)量綱規(guī)范和數(shù)據(jù)倉庫模型轉(zhuǎn)換為事實(shí)表數(shù)據(jù);
將ODS數(shù)據(jù)緩沖區(qū)的非共享數(shù)據(jù)中的編碼類數(shù)據(jù)依據(jù)統(tǒng)一信息編碼和數(shù)據(jù)倉庫模型轉(zhuǎn)換為緯度表數(shù)據(jù);
步驟(303):對事實(shí)表數(shù)據(jù)根據(jù)主鍵進(jìn)行字段更改捕捉;若字段有更改,則獲取字段對應(yīng)的變更數(shù)據(jù),更新字段數(shù)據(jù)有效性標(biāo)示,將變更的數(shù)據(jù)抽取到數(shù)據(jù)倉庫中,結(jié)束;若字段沒有變化,獲取新增數(shù)據(jù),將新增數(shù)據(jù)抽取到數(shù)據(jù)倉庫中,結(jié)束;
捕捉(304):對維度表數(shù)據(jù)根據(jù)主鍵進(jìn)行維度變化捕捉,若無變化就結(jié)束,若有變化則進(jìn)行緩慢變化維處理,將變更的數(shù)據(jù)抽取到數(shù)據(jù)倉庫中,結(jié)束。
以上步驟的技術(shù)效果是:實(shí)現(xiàn)數(shù)據(jù)的增量抽取。
所述數(shù)據(jù)倉庫模型是指根據(jù)醫(yī)療行業(yè)業(yè)務(wù)結(jié)合《基于電子病歷的醫(yī)院信息平臺建設(shè)方案》、《衛(wèi)生信息數(shù)據(jù)元目錄》標(biāo)準(zhǔn)按照八大主題域統(tǒng)一規(guī)劃設(shè)計(jì);
所述八大主題域,包括:賬務(wù)主題、組織機(jī)構(gòu)和人員主題、醫(yī)療活動主題、醫(yī)療服務(wù)主題、醫(yī)囑主題、患者主題、資源主題和病歷主題。
一種醫(yī)療大數(shù)據(jù)倉庫的創(chuàng)建系統(tǒng),包括:ETL服務(wù)器,所述ETL服務(wù)器分別與醫(yī)院的HIS、LIS、PACS、EMR業(yè)務(wù)數(shù)據(jù)庫連接,所述ETL服務(wù)器將醫(yī)院的各個業(yè)務(wù)數(shù)據(jù)庫的數(shù)據(jù)采集過來后,進(jìn)行抽取、清洗、轉(zhuǎn)換,然后存儲到數(shù)據(jù)庫服務(wù)器的ODS數(shù)據(jù)緩沖區(qū)中,然后將ODS數(shù)據(jù)緩沖區(qū)中的共享數(shù)據(jù)通過ETL工具抽取、清洗、轉(zhuǎn)換到ODS的共享數(shù)據(jù)區(qū)中;將ODS數(shù)據(jù)緩沖區(qū)的非共享數(shù)據(jù)抽取到數(shù)據(jù)倉庫中;將ODS的共享數(shù)據(jù)區(qū)的共享數(shù)據(jù)抽取到數(shù)據(jù)庫服務(wù)器的數(shù)據(jù)倉庫中;應(yīng)用服務(wù)器根據(jù)客戶端的輸入指令,從數(shù)據(jù)庫服務(wù)器中調(diào)取相應(yīng)的數(shù)據(jù)。
將共享數(shù)據(jù)從ODS的共享數(shù)據(jù)區(qū)抽取到數(shù)據(jù)倉庫中,可以避免對業(yè)務(wù)數(shù)據(jù)庫作同一數(shù)據(jù)的多次抽取工作。
將各個醫(yī)療衛(wèi)生信息系統(tǒng)的數(shù)據(jù)抽取到ODS數(shù)據(jù)緩沖區(qū),主要是為了避免數(shù)據(jù)抽取造成的業(yè)務(wù)數(shù)據(jù)庫過高負(fù)載,在抽取過程總不做任何的轉(zhuǎn)換處理操作。
根據(jù)數(shù)據(jù)緩沖區(qū)數(shù)據(jù)加載時間的判斷,以及統(tǒng)一信息編碼、公共數(shù)據(jù)模型等規(guī)范,完成由ODS數(shù)據(jù)緩沖區(qū)到ODS共享數(shù)據(jù)區(qū)的數(shù)據(jù)處理工作,根據(jù)實(shí)際系統(tǒng)處理的優(yōu)化考慮,此部分既可以直接使用數(shù)據(jù)庫存儲過程或者ETL來完成。
對于ODS到數(shù)據(jù)倉庫的數(shù)據(jù)處理工作,應(yīng)根據(jù)實(shí)際SQL語句優(yōu)化情況考慮使用數(shù)據(jù)庫存儲過程或者ETL工具實(shí)現(xiàn)。
對于數(shù)據(jù)倉庫存儲的數(shù)據(jù),不能夠進(jìn)行更新或者刪除。
對于數(shù)據(jù)倉庫中的維度表,在處理的過程中需要充分考慮緩慢變化維。
根據(jù)應(yīng)用程序使用數(shù)據(jù)的不同以及SQL語句優(yōu)化處理的不同,可以將數(shù)據(jù)倉庫進(jìn)行邏輯分層,如根據(jù)不同的程序使用建立多個數(shù)據(jù)集市。此部分操作可以由存儲過程或者ETL實(shí)現(xiàn)。
本發(fā)明的有益效果:
1、減輕醫(yī)院業(yè)務(wù)數(shù)據(jù)庫的壓力,醫(yī)院不在需要投入大量的硬件設(shè)備來解決業(yè)務(wù)數(shù)據(jù)庫的性能問題,將歷史數(shù)據(jù)遷移到數(shù)據(jù)倉庫中,業(yè)務(wù)數(shù)據(jù)庫的職能更加清晰。
2、減少醫(yī)院的成本,不需要為了業(yè)務(wù)數(shù)據(jù)庫的壓力增加硬件設(shè)備的投入,醫(yī)院業(yè)務(wù)數(shù)據(jù)庫只保留正常業(yè)務(wù)需要的數(shù)據(jù)即可,不需要硬件的繼續(xù)投入。
3、一次投入多出受益,醫(yī)院各個部門使用的數(shù)據(jù)不在從醫(yī)院的各個業(yè)務(wù)數(shù)據(jù)庫獲取,全部轉(zhuǎn)移到數(shù)據(jù)倉庫中獲取。
4、大大提高醫(yī)院使用數(shù)據(jù)的效率、節(jié)省時間。沒有數(shù)據(jù)倉庫之前所有的數(shù)據(jù)都需要從各個業(yè)務(wù)數(shù)據(jù)庫獲取,既費(fèi)時又費(fèi)力,通過數(shù)據(jù)倉庫的建立,所有業(yè)務(wù)的數(shù)據(jù)都將通過數(shù)據(jù)倉庫獲取到,并且獲取數(shù)據(jù)的時間都是秒級的。
附圖說明
圖1為數(shù)據(jù)中心建設(shè)流程;
圖2為共享數(shù)據(jù)區(qū)數(shù)據(jù)源;
圖3為共享數(shù)據(jù)區(qū)的數(shù)據(jù)流程;
圖4為本發(fā)明的系統(tǒng)架構(gòu)圖;
圖5為ETL服務(wù)器;
圖6為應(yīng)用服務(wù)器;
圖7為數(shù)據(jù)庫服務(wù)器。
具體實(shí)施方式
下面結(jié)合附圖與實(shí)施例對本發(fā)明作進(jìn)一步說明。
如圖1-3所示,一種醫(yī)療大數(shù)據(jù)倉庫的創(chuàng)建方法,包括如下步驟:
步驟(1):將各個醫(yī)療衛(wèi)生信息系統(tǒng)的業(yè)務(wù)數(shù)據(jù)庫中的共享數(shù)據(jù)和非共享數(shù)據(jù)通過ETL工具抽取、清洗、轉(zhuǎn)換到ODS數(shù)據(jù)緩沖區(qū);
步驟(2):將ODS數(shù)據(jù)緩沖區(qū)的共享數(shù)據(jù)通過ETL工具抽取、清洗、轉(zhuǎn)換到ODS的共享數(shù)據(jù)區(qū)中;
步驟(3):將ODS數(shù)據(jù)緩沖區(qū)的非共享數(shù)據(jù)抽取到數(shù)據(jù)倉庫中;將ODS的共享數(shù)據(jù)區(qū)的共享數(shù)據(jù)抽取到數(shù)據(jù)倉庫中。
所述共享數(shù)據(jù)包括:醫(yī)院資源中患者、醫(yī)生、設(shè)備的基礎(chǔ)信息;例如:患者的卡號、姓名、性別、身份證號;醫(yī)生的工號、職稱、掛診科室;設(shè)備型號、生產(chǎn)廠家、有效使用期;
所述非共享數(shù)據(jù)包括:患者的醫(yī)囑信息、患者的檢查信息(影像)、醫(yī)生的晉升記錄、醫(yī)生的培訓(xùn)記錄、醫(yī)生的手術(shù)記錄和設(shè)備的維修記錄。
所述步驟(1)的步驟如下:
步驟(101):通過ETL工具從各個醫(yī)療衛(wèi)生信息系統(tǒng)的業(yè)務(wù)數(shù)據(jù)庫中抽取數(shù)據(jù);所述業(yè)務(wù)數(shù)據(jù)庫包括HIS、LIS或PACS;
步驟(102):向抽取數(shù)據(jù)中添加設(shè)定的數(shù)據(jù)抽取日期;
步驟(103):將添加數(shù)據(jù)抽取日期的數(shù)據(jù)存儲到ODS數(shù)據(jù)緩沖區(qū)中。
所述步驟(2)的步驟如下:
步驟(201):通過ETL工具從ODS數(shù)據(jù)緩沖區(qū)中抽取編碼類數(shù)據(jù)和指標(biāo)類數(shù)據(jù);
所述編碼類數(shù)據(jù)包括:業(yè)務(wù)字典,所述業(yè)務(wù)字典包括:醫(yī)囑字典、費(fèi)用項(xiàng)目、患者列表、員工列表;
所述指標(biāo)類數(shù)據(jù)包括:業(yè)務(wù)數(shù)據(jù),所述業(yè)務(wù)數(shù)據(jù)包括:門診人次、藥品費(fèi)用、抗菌藥物使用、住院收入;
步驟(202):根據(jù)需要,將編碼類數(shù)據(jù)利用EMPI患者索引轉(zhuǎn)換成統(tǒng)一信息編碼,將統(tǒng)一信息編碼存儲到ODS的共享數(shù)據(jù)區(qū)中;
步驟(203):根據(jù)需要,依據(jù)指標(biāo)類數(shù)據(jù)人為設(shè)定指標(biāo)量綱規(guī)范,將指標(biāo)量綱規(guī)范存儲到ODS的共享數(shù)據(jù)區(qū)中。
所述步驟(3)的抽取采用增量抽取方法,如果在抽取過程中無法判斷增量,則在抽取時,應(yīng)用ETL工具通過CDC技術(shù)實(shí)現(xiàn)增量抽取。
所述步驟(3)在抽取的過程中加入抽取時間標(biāo)志。
所述步驟(3)的步驟如下:
步驟(301):從ODS中依據(jù)指標(biāo)量綱規(guī)范(醫(yī)療數(shù)據(jù)指標(biāo)的源數(shù)據(jù))、數(shù)據(jù)倉庫模型(數(shù)據(jù)倉庫建設(shè)結(jié)構(gòu))和統(tǒng)一信息編碼(匯總信息后的信息統(tǒng)一標(biāo)識)抽取數(shù)據(jù);
步驟(302):
將ODS共享數(shù)據(jù)區(qū)指標(biāo)類數(shù)據(jù)依據(jù)指標(biāo)量綱規(guī)范和數(shù)據(jù)倉庫模型轉(zhuǎn)換為事實(shí)表數(shù)據(jù);
將ODS共享數(shù)據(jù)區(qū)編碼類數(shù)據(jù)依據(jù)統(tǒng)一信息編碼和數(shù)據(jù)倉庫模型轉(zhuǎn)換為緯度表數(shù)據(jù);
將ODS數(shù)據(jù)緩沖區(qū)的非共享數(shù)據(jù)中的指標(biāo)類數(shù)據(jù)依據(jù)指標(biāo)量綱規(guī)范和數(shù)據(jù)倉庫模型轉(zhuǎn)換為事實(shí)表數(shù)據(jù);
將ODS數(shù)據(jù)緩沖區(qū)的非共享數(shù)據(jù)中的編碼類數(shù)據(jù)依據(jù)統(tǒng)一信息編碼和數(shù)據(jù)倉庫模型轉(zhuǎn)換為緯度表數(shù)據(jù);
步驟(303):對事實(shí)表數(shù)據(jù)根據(jù)主鍵進(jìn)行字段更改捕捉;若字段有更改,則獲取字段對應(yīng)的變更數(shù)據(jù),更新字段數(shù)據(jù)有效性標(biāo)示,將變更的數(shù)據(jù)抽取到數(shù)據(jù)倉庫中,結(jié)束;若字段沒有變化,獲取新增數(shù)據(jù),將新增數(shù)據(jù)抽取到數(shù)據(jù)倉庫中,結(jié)束;
捕捉(304):對維度表數(shù)據(jù)根據(jù)主鍵進(jìn)行維度變化捕捉,若無變化就結(jié)束,若有變化則進(jìn)行緩慢變化維處理,將變更的數(shù)據(jù)抽取到數(shù)據(jù)倉庫中,結(jié)束。
名詞解釋:
事實(shí)表:事實(shí)數(shù)據(jù)表可能包含業(yè)務(wù)交易數(shù)據(jù),如掛號、繳費(fèi)產(chǎn)生的數(shù)據(jù),事實(shí)數(shù)據(jù)表通常包含大量的行。
維度表:維度表包含了事實(shí)表中指定屬性的相關(guān)詳細(xì)信息,比如,患者屬性,存儲信息等。
有效性標(biāo)示:指的是數(shù)據(jù)在不同的時間范圍內(nèi)反映的內(nèi)容變化。
緩慢變化維:隨時間發(fā)生變化的維度;
緩慢變化維的提出是因?yàn)樵诂F(xiàn)實(shí)世界中,維度的屬性并不是靜態(tài)的,它會隨著時間的流失發(fā)生緩慢的變化。這種隨時間發(fā)生變化的維度我們一般稱之為緩慢變化維,并且把處理維度表的歷史變化信息的問題稱為處理緩慢變化維的問題,有時也簡稱為處理SCD的問題。
直接抽取
實(shí)時的數(shù)據(jù)抽取方式
提供了實(shí)時的數(shù)據(jù)整合平臺。通過此項(xiàng)功能,可以實(shí)現(xiàn)實(shí)時數(shù)據(jù)的處理。這個過程是雙向的、實(shí)時的數(shù)據(jù)集成數(shù)據(jù),根據(jù)需要對立即處理的、實(shí)時的流式數(shù)據(jù)進(jìn)行零延時數(shù)據(jù)傳輸。
增量抽取
對于數(shù)據(jù)量大的系統(tǒng),必須考慮增量抽取。一般情況下,業(yè)務(wù)數(shù)據(jù)庫會記錄業(yè)務(wù)發(fā)生的時間,我們可以用來做增量的標(biāo)志,每次抽取之前首先判斷ODS中記錄最大的時間,然后根據(jù)這個時間去業(yè)務(wù)數(shù)據(jù)庫取大于這個時間所有的記錄。如果業(yè)務(wù)數(shù)據(jù)庫沒有時間戳且改造起來困難,則使用ORACLE的物化視圖,在物化視圖上建立觸發(fā)器。這樣源數(shù)據(jù)增、刪、改的時候就可以動態(tài)改變中間庫的數(shù)據(jù)。
全部抽取
每次ETL操作均刪除目標(biāo)表數(shù)據(jù),由ETL全新加載數(shù)據(jù)。對于維表加代理鍵不適應(yīng),當(dāng)OLTP系統(tǒng)產(chǎn)生刪除數(shù)據(jù)操作時,OLAP層將不會記錄到所刪除的歷史數(shù)據(jù)。不可以實(shí)現(xiàn)數(shù)據(jù)的遞增加載。
4、數(shù)據(jù)裝載
(1)全部覆蓋
在裝載數(shù)據(jù)前,清空數(shù)據(jù)集市中對應(yīng)的歷史數(shù)據(jù),然后將轉(zhuǎn)換后滿足數(shù)據(jù)集市要求的業(yè)務(wù)數(shù)據(jù)裝載到相應(yīng)的表中。通??梢圆捎脭?shù)據(jù)庫提供的裝載工具直接進(jìn)行裝載。
(2)記錄追加。
在裝載時,不清空也不更改數(shù)據(jù)集市中的歷史數(shù)據(jù),直接將轉(zhuǎn)換后滿足數(shù)據(jù)集市要求的業(yè)務(wù)數(shù)據(jù)插入到相應(yīng)的表中。通常可以采用數(shù)據(jù)庫提供的裝載工具直接進(jìn)行裝載
(3)記錄更新
根據(jù)轉(zhuǎn)換后需要裝載到數(shù)據(jù)集市中的滿足數(shù)據(jù)集市要求的業(yè)務(wù)數(shù)據(jù)和數(shù)據(jù)集市中現(xiàn)有業(yè)務(wù)數(shù)據(jù)的情況進(jìn)行不同操作:如果轉(zhuǎn)換后的數(shù)據(jù)在數(shù)據(jù)集市中已經(jīng)存在,則更改數(shù)據(jù)集市中的數(shù)據(jù)以跟最新情況保持一致;如果轉(zhuǎn)換后的數(shù)據(jù)在數(shù)據(jù)集市中不存在,則將轉(zhuǎn)換后的數(shù)據(jù)插入數(shù)據(jù)集市。
如圖4所示,一種醫(yī)療大數(shù)據(jù)倉庫的創(chuàng)建系統(tǒng),包括:ETL服務(wù)器,所述ETL服務(wù)器分別與醫(yī)院的HIS、LIS、PACS、EMR業(yè)務(wù)數(shù)據(jù)庫連接,所述ETL服務(wù)器將醫(yī)院的各個業(yè)務(wù)數(shù)據(jù)庫的數(shù)據(jù)采集過來后,進(jìn)行抽取、清洗、轉(zhuǎn)換,然后存儲到數(shù)據(jù)庫服務(wù)器中,應(yīng)用服務(wù)器根據(jù)客戶端的輸入指令,從數(shù)據(jù)庫服務(wù)器中調(diào)取相應(yīng)的數(shù)據(jù)。
客戶端包括:院長、科主任、護(hù)士長、醫(yī)生、護(hù)士電腦客戶端。
Database Server、ETL Server、Application Server是數(shù)據(jù)倉庫需要的服務(wù)器,每類服務(wù)器都由一臺或多臺服務(wù)器組成。醫(yī)院HIS、LIS、PACS、EMR等業(yè)務(wù)數(shù)據(jù)庫的數(shù)據(jù)經(jīng)由ETL Server經(jīng)過抽取、清洗、轉(zhuǎn)換到Database Server,Application Server存放基于數(shù)據(jù)倉庫的應(yīng)用服務(wù)。院長、科主任、護(hù)士長、醫(yī)生、護(hù)士等員工通過終端PC機(jī)跟Application Server交互獲取數(shù)據(jù)。
如圖5所示,ETL Server主要功能是對數(shù)據(jù)進(jìn)行抽取、清洗和轉(zhuǎn)換,包含數(shù)據(jù)處理流程:醫(yī)院業(yè)務(wù)數(shù)據(jù)庫->ODS,ODS->數(shù)據(jù)倉庫。
如圖6所示,Application Server主要功能是接收醫(yī)院PC端發(fā)送的數(shù)據(jù)請求,Server端將查詢結(jié)果反饋回PC端的一種數(shù)據(jù)使用交互模式。
如圖7所示,Database Server主要功能是存儲數(shù)據(jù),包括ODS和數(shù)據(jù)倉庫中的數(shù)據(jù)。
上述雖然結(jié)合附圖對本發(fā)明的具體實(shí)施方式進(jìn)行了描述,但并非對本發(fā)明保護(hù)范圍的限制,所屬領(lǐng)域技術(shù)人員應(yīng)該明白,在本發(fā)明的技術(shù)方案的基礎(chǔ)上,本領(lǐng)域技術(shù)人員不需要付出創(chuàng)造性勞動即可做出的各種修改或變形仍在本發(fā)明的保護(hù)范圍以內(nèi)。