專利名稱::用于解析醫(yī)療數(shù)據(jù)的系統(tǒng)和方法
技術(shù)領(lǐng)域:
:本發(fā)明一般涉及解析醫(yī)療數(shù)據(jù)(medicaldata)。更具體地說,本發(fā)明涉及用于解4斤用藥指導(dǎo)(medicationinstruction)的系統(tǒng)和方法。
背景技術(shù):
:醫(yī)院一般利用計(jì)算機(jī)系統(tǒng)來管理醫(yī)院中的各個(gè)科室,并且通過多個(gè)計(jì)算機(jī)系統(tǒng)來收集關(guān)于每個(gè)病人的數(shù)據(jù)。例如,病人可能入院進(jìn)行超聲心動(dòng)圖(TransthoracicEcho,TTE)檢查。醫(yī)院信息系統(tǒng)(HIS)會(huì)獲得與該病人有關(guān)的信息(例如,基本信息(demographics)和保險(xiǎn))并將其存儲(chǔ)在病歷(patientrecord)中。然后,該信息被傳送到心血管科系統(tǒng)(一般稱為心血管信息系統(tǒng),或CVIS)。一般CVIS是一個(gè)公司的產(chǎn)品,而HIS是另一個(gè)公司的產(chǎn)品。結(jié)果,這兩者之間的數(shù)據(jù)庫可能存在差異。此外,信息系統(tǒng)可能捕獲/保留和發(fā)送不同粒度等級(jí)的數(shù)據(jù)。一旦CVIS接收到病人信息,就可以為病人安排在超聲波實(shí)驗(yàn)室(echolab)中進(jìn)行TTE檢查的時(shí)間。接著,由超聲波檢查醫(yī)師進(jìn)行TTE檢查。獲得圖像和測(cè)量數(shù)據(jù)并將它們發(fā)送到CVIS服務(wù)器。讀取的醫(yī)師(readingphysician)(例如超聲心動(dòng)圖醫(yī)師(echocardiographer))坐在診斷工作臺(tái)(reviewstation)前,調(diào)出該病人的TTE研究(study)。然后,超聲心動(dòng)圖醫(yī)師開始檢查所述圖像和測(cè)量數(shù)據(jù),并創(chuàng)建關(guān)于該研究的完整醫(yī)學(xué)報(bào)告。當(dāng)超聲心動(dòng)圖醫(yī)師完成該醫(yī)學(xué)報(bào)告時(shí),該報(bào)告被發(fā)送到CVIS服務(wù)器,在那里該報(bào)告被存儲(chǔ),并且通過病人身份識(shí)別(identification)數(shù)據(jù)與該病人相關(guān)聯(lián)。所述完成的醫(yī)學(xué)報(bào)告是可被發(fā)送到數(shù)據(jù)倉庫以用于公共數(shù)據(jù)挖掘(mining)的一類才艮告的例子。諸如文件(documentation)和/或處方(prescription)的用藥指導(dǎo)也可以通過電子方式生成并存儲(chǔ)在數(shù)據(jù)倉庫中。今天,醫(yī)療設(shè)備制造商和藥品公司在收集關(guān)于其產(chǎn)品實(shí)際利用的臨床數(shù)據(jù)方面面臨越來越大的挑戰(zhàn)。隨著病人醫(yī)學(xué)報(bào)告變得計(jì)算機(jī)化,獲得實(shí)際利用數(shù)據(jù)的能力變得越來越簡單。另外,更容易對(duì)數(shù)據(jù)進(jìn)行組合和分析(例如挖掘),以獲得更大量的有用信息。隨著醫(yī)療技術(shù)變得越來越復(fù)雜,臨床分析也可能變得更加復(fù)雜。不斷增長的數(shù)據(jù)量被通過電子方式生成和存檔。隨著臨床信息系統(tǒng)的出現(xiàn),病人病史(patient'shistory)也許可以通過點(diǎn)觸按鈕來獲得。盡管信息的可訪問性是有利的,但在臨床環(huán)境中時(shí)間是稀缺資源。為了全面實(shí)現(xiàn)醫(yī)療技術(shù)進(jìn)步的益處,非常希望對(duì)臨床信息進(jìn)行組織和標(biāo)準(zhǔn)化。即使對(duì)臨床信息或圖像相關(guān)信息進(jìn)行了組織,但當(dāng)前的系統(tǒng)往往以開發(fā)者所確定的、無法被該領(lǐng)域中的一個(gè)或多個(gè)醫(yī)療從業(yè)者使用的格式來組織數(shù)據(jù)。此外,信息還有可能以不適于在其它上下文中進(jìn)行數(shù)據(jù)檢索和使用的格式來存儲(chǔ)。因此,需要以更加容易理解和利用的方式來組織數(shù)據(jù)和指示(instructions)。醫(yī)師手寫的處方包括諸如藥物、劑型(formulation)(例如液體、片劑、膠嚢)、劑量(例如多少劑(howmanyformulations))、用藥途徑(例如口服)、療程、頻率/間隔、和/或限定詞(如根據(jù)需要或按說明書)的信息。電子病案(medicalrecord)系統(tǒng),例如Logician,可以標(biāo)準(zhǔn)化或處理諸如藥物、形式和數(shù)量(例如布洛芬100mg片劑)的信息,但處方的其它內(nèi)容卻一般處于自由形式(例如自由形式的文本串)。如果已知一些信息,則可以確定其它處方信息(例如藥片數(shù)量和給定療程內(nèi)每天服用多少片)。因此,非常希望有一種用于處理自由形式處方信息的系統(tǒng)。藥劑師和臨床系統(tǒng)與醫(yī)師協(xié)作,開出(ordering)處方并例如在電子病案中記載藥物。第三方知識(shí)庫(knowledgebases)具有病人可以購買的藥物的完整列表,包括劑量、形式和用藥途徑。然而,僅僅知道劑量、形式和用藥途徑信息是不夠的。知道應(yīng)當(dāng)多久用藥一次以及應(yīng)當(dāng)用的藥量也是很重要的。這些以及其它信息可以在開處方的醫(yī)師輸入的重要指示(significantinstruction)或"sigs,,中找到。目前,sig并沒有^皮標(biāo)準(zhǔn)化,而是隨著醫(yī)師的不同而不同。然而一般諸如劑量、形式和用藥途徑的信息都是標(biāo)準(zhǔn)化的。因此,非常需要一種對(duì)于藥品施用的干凈、清楚且完備的指示。另外,還非常需要一種用于讀取和解釋sig的可靠的系統(tǒng)。提高sig解釋的可靠性對(duì)于病人安全來說十分重要??煽康淖x取和存儲(chǔ)sig還可以提高病人護(hù)理的質(zhì)量。減少sig翻譯的錯(cuò)誤還會(huì)為醫(yī)療保健供應(yīng)商、藥房和保險(xiǎn)公司省錢。舉例來說,sig解釋的結(jié)構(gòu)數(shù)據(jù)捕獲會(huì)有助于數(shù)據(jù)挖掘和判決支持。在電子病案或電子醫(yī)療報(bào)告中,希望信息是清楚的,但是許多醫(yī)師可能不會(huì)使用要求他們?cè)谳斎霐?shù)據(jù)和指示時(shí)過于工整和結(jié)構(gòu)化的系統(tǒng)。許多醫(yī)師偏好自由形式的指示書寫。因此,非常希望系統(tǒng)在自然語言和結(jié)構(gòu)語言之間進(jìn)行平衡。此外,希望允許縮寫和醫(yī)學(xué)行話(例如"lpoqd,,="每天口服一片,,),以及常用指示的多個(gè)不同的變化。因此,非常希望有一種系統(tǒng)來將不同的命令、筆記和指示翻譯成有限的、不連續(xù)的、定量的信息。因此,存在對(duì)于用來處理用藥指導(dǎo)的系統(tǒng)和方法的需要。
發(fā)明內(nèi)容本發(fā)明的特定實(shí)施例提供用于處理醫(yī)療數(shù)據(jù)的系統(tǒng)和方法。特定實(shí)施例例如提供一種用于處理用藥醫(yī)囑中的重要指示的改進(jìn)的方法。所述方法包括步驟訪問醫(yī)療數(shù)據(jù);從該醫(yī)療數(shù)據(jù)中提取至少一個(gè)包含重要指示的文本串;以及解析所述文本串,以將至少一個(gè)標(biāo)識(shí)符與所述文本串中的每一個(gè)相關(guān)聯(lián)。所述方法還可以包括將所述文本串解構(gòu)成用于每一個(gè)所述文本串的多個(gè)子串。在一個(gè)實(shí)施例中,所述解析的步驟包括將至少一個(gè)標(biāo)識(shí)符與每個(gè)子串相關(guān)聯(lián)。此外,例如用戶和/或軟件程序可以一企查(review)所述文本串,以將所述標(biāo)識(shí)符與每一個(gè)所述文本串相關(guān)聯(lián)。在一個(gè)實(shí)施例中,所述標(biāo)識(shí)符是例如數(shù)值。特定實(shí)施例提供一種用于處理醫(yī)療數(shù)據(jù)的改進(jìn)的方法。所述方法包括步驟識(shí)別醫(yī)療數(shù)據(jù)中的文本串;將所述文本串與來自庫中的標(biāo)準(zhǔn)化標(biāo)識(shí)符相關(guān)聯(lián);以及輸出所述與文本串相關(guān)聯(lián)的標(biāo)準(zhǔn)化標(biāo)識(shí)符。在一個(gè)實(shí)施例中,可以打印和/或包括所述與文本串相關(guān)聯(lián)的標(biāo)準(zhǔn)化標(biāo)識(shí)符的報(bào)告和/或醫(yī)囑。在一個(gè)實(shí)施例中,可以對(duì)所述庫進(jìn)行修改以容納(accommodate)所述文本串。例如,如果文本串之前沒有被見到過,則所述庫可以被修改和/或替換,以將標(biāo)識(shí)符與該文本串相關(guān)聯(lián)。用戶和/或軟件程序可用來檢查所述文本串,以便例如將標(biāo)準(zhǔn)化標(biāo)識(shí)符與該文本串相關(guān)聯(lián)。在一個(gè)實(shí)施例中,文本串可以被解構(gòu)成多個(gè)子串。然后將標(biāo)準(zhǔn)化標(biāo)識(shí)符與每個(gè)子串相關(guān)聯(lián)。所述標(biāo)準(zhǔn)化標(biāo)識(shí)符可以是例如數(shù)值。在一個(gè)實(shí)施例中,所述文本串包括重要的用藥指導(dǎo)或"sigs"。特定實(shí)施例提供一種用于處理用藥指導(dǎo)的系統(tǒng)。所述系統(tǒng)包括數(shù)據(jù)源,包括醫(yī)療數(shù)據(jù);以及數(shù)據(jù)處理器,其從所述數(shù)據(jù)源接收數(shù)據(jù),并根據(jù)詞典處理該數(shù)據(jù)。所述數(shù)據(jù)處理器將該數(shù)據(jù)解構(gòu)成段并解析所述段。所述醫(yī)療數(shù)據(jù)可以包括例如用藥指導(dǎo)和/或觀察值。在一個(gè)實(shí)施例中,所述數(shù)據(jù)處理器將所述數(shù)據(jù)解構(gòu)成重要指示,并解析該用藥方法。所述數(shù)據(jù)處理器例如將數(shù)字標(biāo)識(shí)符與每一個(gè)所述段相關(guān)聯(lián)。特定實(shí)施包括一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其包括一組用于計(jì)算機(jī)的指令。所述一組指令包括提取例程,其從醫(yī)療指示中提取至少一個(gè)包含用藥方法的字母數(shù)字串。所述一組指令還包括解析例程,其解析所述至少一個(gè)字母數(shù)字串,以將至少一個(gè)標(biāo)識(shí)符與所述至少一個(gè)字母數(shù)字串中的每一個(gè)相關(guān)聯(lián)。圖1示出了根據(jù)本發(fā)明實(shí)施例的用于處理重要指示的方法的流程圖。圖2示出了根據(jù)本發(fā)明實(shí)施例的用于觀察值凈化(scrubbing)的方法的流程圖。圖3示出了根據(jù)本發(fā)明實(shí)施例使用的用于處理醫(yī)療數(shù)據(jù)和指示的數(shù)據(jù)處理系統(tǒng)。當(dāng)結(jié)合附圖閱讀時(shí),以上概述以及下面對(duì)本發(fā)明實(shí)施例的具體描述將變得更好理解。出于舉例說明本發(fā)明的目的,在附圖中示出了特定實(shí)施例。但是應(yīng)當(dāng)理解,本發(fā)明不限于附圖中示出的安排和手段。具體實(shí)施例方式本發(fā)明的特定實(shí)施例處理例如用藥醫(yī)囑(medicationorders)中的用藥方法或"sigs"。僅僅出于示例的目的,sigs的幾個(gè)例子可以包括"1tabpoqd"("每天口服一片")、"10unitsscqAmand5unitsscqHS"("每天早上皮下注射10單位,每天就寢時(shí)間皮下注射5單位,,)、"twopills2amand2pm(total80mg/da)"("凌晨兩點(diǎn)和下午兩點(diǎn)兩丸(總劑量為每天80mg)")、".5-1mgevery4to6hrprn"("根據(jù)需要每4至6小時(shí)0.5mg至1mg")、和/或"1dailyexcept1.5tabsm-w-f,("每周一、三、五每天l片半,其它時(shí)間每天l片")??梢越馕鲇盟庒t(yī)囑和其它文本或數(shù)據(jù),從而將文本中包含的sigs和其它信息替換成標(biāo)準(zhǔn)化格式或數(shù)字格式。該格式使得指示或其它數(shù)據(jù)可以在例如多個(gè)源和/或用戶之間傳輸、存儲(chǔ)、操作和/或以其它方式處理。在一個(gè)實(shí)施例中,可以從例如電子病案(EMR)、光學(xué)字符識(shí)別(OCR)、用藥醫(yī)囑系統(tǒng)、數(shù)據(jù)庫、計(jì)算機(jī)化醫(yī)師醫(yī)囑條目(entry)(CPOE)和/或其它電子格式中獲得sigs。在一個(gè)實(shí)施例中,自動(dòng)化機(jī)制提取從電子病案系統(tǒng),諸如Logician,或其它數(shù)據(jù)源接收的sigs,并將表示sigs的字符串(string)發(fā)送到詞匯處理服務(wù)器,諸如術(shù)語服務(wù)器。在一個(gè)實(shí)施例中,發(fā)送的數(shù)據(jù)包括使用計(jì)數(shù)(usagecount)。使用計(jì)數(shù)可用于例如確定處理哪個(gè)sigs。使用計(jì)數(shù)還可用于確定多個(gè)sigs之間的解析優(yōu)先級(jí)。在一個(gè)實(shí)施例中,只有那些自從上一次傳輸?shù)皆~匯處理服務(wù)器之后接收的字符串與對(duì)于上次傳送和當(dāng)前傳送之間的時(shí)間段的使用計(jì)數(shù)一起發(fā)送。圖1示出了根據(jù)本發(fā)明實(shí)施例的用于處理用藥方法的方法IOO的流程圖。首先,在步驟110,開始在術(shù)語服務(wù)器或其它詞匯服務(wù)器接收數(shù)據(jù),并將數(shù)據(jù)放置在登臺(tái)(staging)數(shù)據(jù)表中。自動(dòng)處理確定每個(gè)新登臺(tái)的表?xiàng)l目(tableentry)以前是否見過(例如表中的數(shù)據(jù)是否已經(jīng)存在于處理過的詞匯表或其它數(shù)據(jù)結(jié)構(gòu)中)。如果表?xiàng)l目以前被檢查過,則將歷史使用計(jì)數(shù)增加新接收的計(jì)數(shù)。如果表?xiàng)l目以前沒有被處理過,則將新接收的sig寫入新詞匯表(例如"SIG")并更新使用計(jì)數(shù)。在一個(gè)實(shí)施例中,向sig分配可在后續(xù)處理中使用的sig標(biāo)識(shí)符("sig一id,,)。新詞匯表中存在將所有新sigs的sig一id存儲(chǔ)到sig解析表(例如"SIGTOPARSE")中的插入觸發(fā)器。sig解析表可以用作自動(dòng)解析驅(qū)動(dòng)機(jī)制。在一個(gè)實(shí)施例中,"SIGTOPARSE"包括sig、sig的相應(yīng)代碼、以及使用計(jì)數(shù)。在一個(gè)實(shí)施例中,"SIGTOPARSE"表包括sigjd或代碼,而sig和使用計(jì)數(shù)可以通過參考其它表來獲得。接下來,在步驟120,將"SIGTOPARSE"表用作驅(qū)動(dòng)器,從新詞匯表中檢索仍未解析過的sigs。解析的初始步驟為,嘗試識(shí)別正在處理的sig中出現(xiàn)的任何重要的新詞和/或短語,例如劑量/用藥途徑(dose/route)短語。劑量/用藥途徑短語由其后跟隨有劑量/用藥途徑"標(biāo)簽"(tag)的數(shù)字組成。標(biāo)簽可以包括嵌入的空白(whitespace)和/或跟隨有例如附加的空白-數(shù)字-劑量/用藥途徑標(biāo)簽組合。詞或短語(wordsorphrases)可以是各種類型的,包括例如劑量/用藥途徑、用藥途徑、間隔、療程、標(biāo)準(zhǔn)、適應(yīng)癥、和/或停用詞(stopword)。例如sig"ltabpoqd"包括詞"ltabpo"和"qd"。新的劑量/用藥途徑短語被寫入sig詞表(例如"SIGWORDORPHRASE"),以用于TerminologySpecialist(術(shù)語專家)或其它系統(tǒng)的后續(xù)解釋。在一種實(shí)施方式中,如下識(shí)別短語。通過尋找第一個(gè)數(shù)字/有效sig量度單位(valid-sig-uom)組合來識(shí)別劑量/用藥途徑短語。有效sig量度單位,諸如"tab"、"mg/d"、和"p.o."可以存儲(chǔ)在表中(例如"SIGUOM,,)。在一個(gè)實(shí)施例中,字符串中跟隨在量度單位之后的字符之后,跟隨有空白或其它分隔符。特定實(shí)施例嘗試處理最終跟隨有實(shí)際單位/度量單位數(shù)字的非單位/度量單位數(shù)字的出現(xiàn)。在一個(gè)實(shí)施例中,例如向初始劑量/用藥途徑短語分配詞計(jì)數(shù)2。在步驟130,一旦識(shí)別出第一個(gè)劑量/用藥途徑短語,就確定在所述第一個(gè)短語之后的任何附加的空白劑量/用藥途徑短語。例如,隨后的劑量/用藥途徑短語可以連接到初始的短語,并且例如,對(duì)于每個(gè)短語,可以將詞計(jì)數(shù)增加2。一旦在正在構(gòu)造的劑量/用藥途徑短語之后遇到非空白劑量/用藥途徑字符,則劑量/用藥途徑解析完成。如果作為結(jié)果的劑量/用藥途徑短語在sig詞表(sigwordtable)("SIGWORDORPHRASE")中不存在,則將提取的短語存儲(chǔ)到"SIGWORDORPHRASE"中,詞類型為例如"劑量/用藥途徑"。然后在步驟140,—旦"SIGWORDORPHRASE"已經(jīng)潛在增加了在當(dāng)前sig中找到的新的劑量/用藥途徑短語,則執(zhí)行掃描以確定在當(dāng)前正在解析的sig中出現(xiàn)了"SIGWORDORPHRASE"中包含的"塊"(chunk)(劑量/用藥途徑等)中的哪個(gè)"塊"(詞和/或短語)。例如,"ltabpoqd"包含兩個(gè)塊作為劑量/用藥途徑詞的"ltabpo"以及作為間隔詞的"qd"。所述確定可以重復(fù),以用于例如包括表示短語類型的預(yù)定義標(biāo)簽和與該標(biāo)簽相關(guān)聯(lián)的數(shù)字?jǐn)?shù)據(jù)(例如間隔、療程和頻率)兩者的其它短語。在一個(gè)實(shí)施中,以從最長塊開始的遞減次序執(zhí)行該搜索。由于每個(gè)塊被識(shí)別為嵌在sig中,因此如果塊沒有與任何已經(jīng)被識(shí)別為嵌在sig中、并且已經(jīng)被寫入sig解析工作表(例如"SIGPARSE")中的塊重疊,則將該塊寫到sig解析工作表中。通過首先處理最長的塊,并在較短塊與較長塊重疊時(shí)識(shí)別重疊,處理可以集中在最長且可能最有價(jià)值的塊上。在一個(gè)實(shí)施例中,僅僅將不與較長塊重疊的那些塊寫到sig解析工作表中。在步驟150,一旦識(shí)別在sig中出現(xiàn)哪些塊的掃描完成并且結(jié)果被存儲(chǔ)在工作表中,就從"SIGTOPARSE"中刪除當(dāng)前sig的相關(guān)行。在步驟160,—旦利用將解析的所有sigs的信息構(gòu)建(populate)了工作表,就為了IM亍(forperformance)而動(dòng)態(tài)地分沖斤該表。接下來,在步驟170,識(shí)別sig中出現(xiàn)的塊并將其存儲(chǔ)在永久表(permanenttable)中以記住在sig中出現(xiàn)哪些詞或短語(例如"SIGSIGWORD")。工作表"SIGPARSE"是該處理的驅(qū)動(dòng)器。對(duì)于與工作表中的至少一行相關(guān)聯(lián)的每個(gè)sig,將sig—id/sigword—id組合存儲(chǔ)在"SIGSIGWORD"中。從相關(guān)sig字符串的圖像中去除塊子串,以便一旦所有識(shí)別出的塊都被捕獲到"SIGSIGWORD"中,就可以確定是否還余留任何原始sig的剩余(residue)。所述剩余是指除空白和特殊字符之外的任何字符。如果仍余留有任何剩余,則將剩余字符串存儲(chǔ)在剩余數(shù)據(jù)結(jié)構(gòu)中,以用于以后的評(píng)價(jià)以及潛在的將塊手動(dòng)添加到"SIGWORDORPHRASE"中。一旦為給定sig構(gòu)造了"SIGSIGWORD"記錄,就將相關(guān)行從工作表中刪除。在步驟180,一旦為感興趣的sigs構(gòu)造了"SIGSIGWORD"記錄,就必須"重構(gòu)"sig以確定該sig的總體含義。也就是,基于哪些塊被識(shí)別為嵌在sig中,確定與sig相關(guān)聯(lián)的"桶"(bucket)數(shù)據(jù)或添加了值的屬性,并組合與這些單個(gè)詞或短語相關(guān)聯(lián)的添加了值的屬性。在sig重構(gòu)階,爻,可以應(yīng)用業(yè)務(wù)邏輯或重構(gòu)規(guī)則以幫助保證由每個(gè)組成的詞或短語貢獻(xiàn)的添加了值的數(shù)據(jù)不會(huì)與其它組成的詞或短語貢獻(xiàn)的添加了值的數(shù)據(jù)沖突。"SIGSIGWORD"表可以是重構(gòu)處理的驅(qū)動(dòng)器。在一個(gè)實(shí)施例中,重構(gòu)規(guī)則可以包括例如以下內(nèi)容。首先,對(duì)沒有在結(jié)果sig表(例如"RECONSTRUCTEDSIG")中被表示的sig進(jìn)行重構(gòu)。對(duì)組成的sig詞被標(biāo)記為已經(jīng)被分析過并且已經(jīng)由TerminologySpecialist或其它驗(yàn)證系統(tǒng)認(rèn)可的(例如狀態(tài)=1003)sigs進(jìn)衧重構(gòu)?;诶?艮據(jù)sig詞數(shù)據(jù)結(jié)構(gòu)中的詞類型識(shí)別出的1)劑量/用藥途徑、2)用藥途徑、3)間隔、4)療程、5)其它處方信息來執(zhí)行重構(gòu)。在特定實(shí)施例中,可以根據(jù)sig或其它數(shù)據(jù)來設(shè)置軟件和/或報(bào)告標(biāo)記。如果在重構(gòu)處理中已經(jīng)識(shí)別出了例如低/高劑量、低/高間隔、或低/高療程值,并且隨后的sig詞與例如沖突的低/高劑量、間隔或療程和/或沖突的低/高劑量單位值相關(guān)聯(lián),則可以設(shè)置"complex_sig"標(biāo)記并且不保留該sig的其它桶值。然后,該complex—sig值可以由例如技術(shù)人員和/或系統(tǒng)單獨(dú)處理。在一個(gè)實(shí)施例中,如果通過類型為"用藥途徑"的sig詞提供了用藥途徑信息,并且沒有低劑量信息與該sig相關(guān)聯(lián)(是指沒有"劑量/用藥途徑"信息),則例如將低劑量值設(shè)置為l并將低劑量單位設(shè)置為"EA"。在一個(gè)實(shí)施例中,如果與sig相關(guān)聯(lián)的sig詞包括"pm_flag",則該標(biāo)記意味著"根據(jù)需要,,的指示。如果prn—flag="Y",則作為結(jié)果的該sig的pm—flag="Y"。如果與sig相關(guān)耳關(guān)的任何sig詞包括"as—directed—flag"="Y",則作為結(jié)果的該sig的as—directed—flag="Y"。如果識(shí)別出低間隔,但是既沒有設(shè)置低劑量值也沒有設(shè)置低劑量單位值,沒有與sig相關(guān)聯(lián)的sig詞是"劑量/用藥途徑"類型,并且在解析后沒有余留的剩余,則例如low—dose被設(shè)置為1,并且low—dose—unit被設(shè)置為"EA"。如果識(shí)別出高間隔,但是既沒有設(shè)置高劑量值也沒有設(shè)置高劑量單位值,沒有與sig相關(guān)聯(lián)的sig詞是"劑量/用藥途徑"類型,并且在解析之后沒有余留的剩余,則例如high—dose被設(shè)置為1,并且high—dose—unit被設(shè)置為"EA"。其它標(biāo)記可以包括例如一天中的時(shí)間標(biāo)記(例如"am—flag,,、"midday—flag"或"pm—flag")、指示sig已經(jīng)被解析的解析完成標(biāo)記、指示將重新解析Sig的全部或部分的重新解析標(biāo)記、和/或指示sig解析狀態(tài)的狀態(tài)標(biāo)記。也可以生成包括在sig解析過程中沒有被處理的數(shù)據(jù)的sig剩余串。然后,在步驟190,將作為結(jié)果的重構(gòu)的行寫到結(jié)果sig表中(例如"RECONSTRUCTEDSIG")。在一個(gè)實(shí)施例中,如果complex—sig標(biāo)記被設(shè)置,則在正在寫入的行中,complex—sig—flag被設(shè)置,并且可以針對(duì)該sig執(zhí)行進(jìn)一步的處理。在一個(gè)實(shí)施例中,重構(gòu)的sig可以被寫到數(shù)據(jù)庫(諸如報(bào)告數(shù)據(jù)庫)中,并且用來生成一個(gè)或多個(gè)報(bào)告,諸如用藥指導(dǎo)報(bào)告、診斷/治療報(bào)告、和/或臨床試驗(yàn)報(bào)告。例如,可以生成關(guān)于每日用藥劑量和/或應(yīng)當(dāng)?shù)某运庮l率的報(bào)告。因此,特定實(shí)施例提供了用于解析例如處方、報(bào)告或其它文件中的sig的系統(tǒng)。整個(gè)sig可以被寫入到表中,以便由術(shù)語專家或術(shù)語軟件對(duì)其進(jìn)行檢查?;蛘?,sig可以被分割成詞和/或短語(塊)??梢宰R(shí)別之前解析過的詞和/或短語。之前沒有解析過的重要詞和/或短語可以被寫入到表中,以由技術(shù)員和/或軟件程序識(shí)別。然后,可以由技術(shù)員和/或軟件為塊分配值,諸如代碼值。從未知sig塊中去除之前解析過的塊減少了人員和/或軟件程序評(píng)價(jià)的量。例如,系統(tǒng)定位指示用藥劑量和用藥途徑的文本。系統(tǒng);險(xiǎn)查該文本以確定該文本的全部或部分之前是否已經(jīng)評(píng)價(jià)過并被分配了代碼。如果該文本的至少一部分之前沒有被評(píng)價(jià)過,則系統(tǒng)處理該文本,以將數(shù)字與劑量和用藥途徑信息、以及間隔信息和其它信息相關(guān)聯(lián)。也就是,sig被分成塊。人員和/或系統(tǒng)確定塊的含義。然后,系統(tǒng)重構(gòu)整個(gè)sig,在處理中應(yīng)用業(yè)務(wù)邏輯,以判斷該指示的總體含義。因此,在特定實(shí)施例中,sig處理系統(tǒng)是自適應(yīng)系統(tǒng)。也就是,系統(tǒng)見到的信息越多,則系統(tǒng)處理的信息就越少。此外,系統(tǒng)可以使用塊的同義詞,以便提供更靈活、更快速的處理系統(tǒng)。在一個(gè)實(shí)施例中,與電子病案分離的創(chuàng)建數(shù)據(jù)庫,諸如離線數(shù)據(jù)庫。該數(shù)據(jù)庫可用于例如研究和質(zhì)量報(bào)告。sig處理可以例如實(shí)時(shí)或基本實(shí)時(shí)地執(zhí)行,并且/或者可以在稍晚的時(shí)間執(zhí)行。處理過的sig可以例如存儲(chǔ)在電子病案中。然后,電子病案可以被發(fā)送到處方藥房。處理過的Sig可用于完善缺失的信息和/或確定例如處方重新填寫信息。在一個(gè)實(shí)施例中,可以向醫(yī)生提供命令菜單以簡化和標(biāo)準(zhǔn)化sig。通過使用標(biāo)準(zhǔn)的、公共引用的命令,系統(tǒng)可以例如僅僅必須處理在標(biāo)準(zhǔn)列表或詞典中沒有找到的命令。在特定實(shí)施例中,信息可出于安全目的用于評(píng)估開處方的模式(prescribingpattem)??梢詷?gòu)造工具以使醫(yī)師和制藥公司了解到指南被遵守的程度。例如可以生成有關(guān)護(hù)理質(zhì)量和/或安全的統(tǒng)計(jì)信息。此外,可以使用特定實(shí)施例來提供藥理學(xué)結(jié)果報(bào)告。通過參考病人信息的數(shù)據(jù)庫,可以評(píng)價(jià)治療的有效性。解析過的數(shù)據(jù)可用來評(píng)價(jià)安全相關(guān)問題并減少由于例如特定劑量和藥物而帶來的副作用。預(yù)期這樣的分析也可以被用來組織和分析臨床試驗(yàn)數(shù)據(jù)。在一個(gè)實(shí)施例中,當(dāng)在臨床試驗(yàn)中開具藥物處方時(shí),醫(yī)師可以從預(yù)定的指導(dǎo)列表中進(jìn)行選擇。因此,可以在試驗(yàn)中引入更嚴(yán)格的控制,并可以減少變化。在一個(gè)實(shí)施例中,可以收集來自處方的數(shù)據(jù)和其它臨床試驗(yàn)數(shù)據(jù),并將其用于促進(jìn)臨床試驗(yàn)。可以提取和聚集(aggregate)來自多個(gè)客戶/病人的數(shù)據(jù)。受保護(hù)的信息可以被去除(即,去除病人身份標(biāo)識(shí)或使病人匿名化)??梢远x病人群體信息以用于分析。然后可以查詢包括病人試驗(yàn)數(shù)據(jù)的數(shù)據(jù)庫??梢蕴崛【哂心涿矸輼?biāo)識(shí)標(biāo)志的數(shù)據(jù),并將其與臨床試驗(yàn)的一些或所有身份標(biāo)識(shí)信息重新關(guān)聯(lián)??梢跃奂瘉碜远鄠€(gè)源的數(shù)據(jù),將其匿名化,并出售給制藥公司。臨床試驗(yàn)?zāi)技?recruitment),數(shù)據(jù)處理和分析可以被集中到一個(gè)系統(tǒng)和/或地點(diǎn)。實(shí)驗(yàn)室數(shù)據(jù)、圖像、筆記和其它信息可以被整合和處理。歷史、基本信息、遺傳信息和其它信息可以被跟蹤和整合到例如電子病案中。因此,臨床試驗(yàn)處理可以被流水線化。在一個(gè)實(shí)施例中,醫(yī)學(xué)報(bào)告或其它文件中的觀察值也可以被處理。例如,醫(yī)學(xué)報(bào)告表,諸如Logician醫(yī)療數(shù)據(jù)表,可以包括來自檢查的醫(yī)師或其它醫(yī)學(xué)專業(yè)人員的一個(gè)或多個(gè)觀察值。觀察值(例如"obs,,或"obsvalue")域可以是例如自由格式域。在特定方案中,當(dāng)obsvalue數(shù)據(jù)被加載到例如Star方案(Starschema)中的觀察事實(shí)表中時(shí),來自表數(shù)據(jù)的自由格式obsvalue域被轉(zhuǎn)換成數(shù)值。觀察項(xiàng)(terms)可以被"凈化,,或解析,并被加載到報(bào)告數(shù)據(jù)庫中,以將數(shù)值與觀察值相關(guān)聯(lián)。圖2示出了根據(jù)本發(fā)明實(shí)施例的用于觀察值凈化的方法200的流程圖。在一個(gè)實(shí)施例中,方法300涉及如下步驟。首先,在步驟210,識(shí)別將被凈化的觀察結(jié)果(observation)。該識(shí)別可以例如通過客戶請(qǐng)求來啟動(dòng),或者可以自動(dòng)識(shí)別。然后,在步驟220,由具有臨床背景的人員對(duì)來自觀察結(jié)果保存表的數(shù)據(jù)進(jìn)行高水平的分析,并確定例如測(cè)量的標(biāo)準(zhǔn)單位、測(cè)量的替換單位、以及可接受范圍?;蛘撸梢允褂密浖绦騺矸治鰜碜杂^察結(jié)果保存表的數(shù)據(jù)。接下來,在步驟230,基于所提供的信息配置控制表。然后,在步驟240,測(cè)試運(yùn)行將原始串和凈化后的串寫到測(cè)試表中,以進(jìn)行進(jìn)一步的分析,并且確定"干凈凈化,,百分比。觀察值可能落到例如四個(gè)桶中。例如,結(jié)果"-1"指示系統(tǒng)不能凈化該域,并且該值不包含數(shù)字信息。結(jié)果"-2"例如指示系統(tǒng)不能凈化該域,并且發(fā)現(xiàn)具有無法識(shí)別的量度單位的數(shù)值。結(jié)果"-3"例如指示該域被凈化,但是得到的數(shù)值在可接受范圍之外。結(jié)果"值',例如指示該域被凈化為數(shù)值,該數(shù)值按照為該觀察結(jié)果定義的標(biāo)準(zhǔn)量度單位來表示。接下來,在步驟250,根據(jù)需要提煉控制信息(范圍、附加量度單位等),并且測(cè)試重新運(yùn)行。在步驟260,—旦控制信息被充分定義,則將數(shù)據(jù)加載到觀察事實(shí)表中。圖3示出了根據(jù)本發(fā)明實(shí)施例的用于處理醫(yī)療數(shù)據(jù)和所使用的指示的數(shù)據(jù)處理系統(tǒng)300。系統(tǒng)300包括數(shù)據(jù)源310、數(shù)據(jù)處理器320和輸出330。數(shù)據(jù)源310、數(shù)據(jù)處理器320和輸出330可以經(jīng)由互連數(shù)據(jù)源310、數(shù)據(jù)處理器320和輸出330中的一個(gè)或多個(gè)的有線或無線連接進(jìn)行通信。數(shù)據(jù)源310、數(shù)據(jù)處理器320和/或輸出330可以被實(shí)施為分離的單元和/或被以各種組合形式組合。例如,計(jì)算機(jī)可以裝載(house)數(shù)據(jù)源310,數(shù)據(jù)處理器320和輸出330。數(shù)據(jù)源310包括諸如病案(電子的或具有OCR的紙張)、文本文件或其它醫(yī)療數(shù)據(jù)的數(shù)據(jù)。數(shù)據(jù)處理器320是從數(shù)據(jù)源310接收數(shù)據(jù)的軟件和/或硬件處理單元。數(shù)據(jù)處理器320分析數(shù)據(jù),并且可以將數(shù)據(jù)解構(gòu)成段(segment)或"塊"(chucks)。然后,數(shù)據(jù)處理器320根據(jù)例如詞典和/或規(guī)則或標(biāo)準(zhǔn)集來解析、凈化或以其它方式處理整體或部分?jǐn)?shù)據(jù)。數(shù)據(jù)處理器320可以根據(jù)來自軟件程序和/或來自用戶的指令處理數(shù)據(jù)。例如,技術(shù)員可以將數(shù)據(jù)處理器320配置成解析數(shù)據(jù)中的sig。可替代地,或者附加地,技術(shù)員可以將數(shù)據(jù)處理器320配置成解析數(shù)據(jù)中的觀察值。在一個(gè)實(shí)施例中,數(shù)據(jù)處理器320包括將與被解析的數(shù)據(jù)相關(guān)聯(lián)的標(biāo)識(shí)符或值的庫。該庫可以例如由用戶和/或軟件更新來更新。在數(shù)據(jù)處理器320對(duì)來自數(shù)據(jù)源310的數(shù)據(jù)進(jìn)行了處理之后,數(shù)據(jù)處理器320將處理后的數(shù)據(jù)發(fā)送到輸出330。輸出330可以包括例如打印機(jī)、存儲(chǔ)器和/或其它傳輸或存儲(chǔ)設(shè)備。輸出330可以存儲(chǔ)處理后的數(shù)據(jù)(例如存儲(chǔ)在電子病案數(shù)據(jù)庫中),和/或可以生成例如打印的輸出(例如處方)。因此,特定實(shí)施例提供了用于在臨床信息系統(tǒng)中解析數(shù)據(jù)的系統(tǒng)和方法。特定實(shí)施例將數(shù)據(jù)轉(zhuǎn)換成可由臨床信息系統(tǒng)使用以進(jìn)行例如報(bào)告、處理、和臨床診斷/治療的格式。詞匯表可以被用于將文本串轉(zhuǎn)換成概念。可以從數(shù)據(jù)中清除(cleanse)受保護(hù)的健康信息。詞可以被映射到語義上一致的概念??梢允褂酶拍疃皇抢缭紨?shù)據(jù)來去除垃圾數(shù)據(jù)。特定實(shí)施例將sig翻譯成有意義的數(shù)字或事實(shí)。字符串被解析和分解成多個(gè)部分(parts)。識(shí)別具有數(shù)字意義的字符串的組成部分。然后,將字符串的組成部分重組,以概括該sig。因此,用藥指導(dǎo)和處方指示可以被解釋。特定實(shí)施例進(jìn)行從自然語言到?jīng)]有受保護(hù)信息的臨床概念的翻譯。特定實(shí)施例提供用于翻譯的自動(dòng)化系統(tǒng)。例如,該系統(tǒng)可以評(píng)價(jià)病人的主要病癥,然后將該病癥與醫(yī)學(xué)概念進(jìn)行匹配,以使處理和解釋更加容易。特定實(shí)施例凈化醫(yī)療數(shù)據(jù),以將自由格式的觀察值域轉(zhuǎn)換成數(shù)值。特定實(shí)施例定義觀察項(xiàng)詞匯表,以用于將觀察值語言凈化為用于報(bào)告的觀察項(xiàng)。特定實(shí)施例比較原始字符串和凈化后的字符串,以確保在將數(shù)據(jù)加載到觀察事實(shí)表中之前,信息被充分定義。因此,自由形式的文本串可以被映射到特定值或一組特定值。對(duì)自由形式的文本值進(jìn)行處理,以便從自由形式的字符串中提取更多定義的信息。盡管已經(jīng)參照特定實(shí)施例對(duì)本發(fā)明進(jìn)行了描述,但是本領(lǐng)域技術(shù)人員將會(huì)理解,在不脫離本發(fā)明的范圍的前提下,可以進(jìn)行各種改變和等效替換。此外,可以對(duì)本發(fā)明的教導(dǎo)進(jìn)行許多改變,以適應(yīng)具體的情況或素材,這不會(huì)脫離本發(fā)明的范圍。因此,本發(fā)明并非意圖被限制于所公開的具體實(shí)施例,而是,本發(fā)明將包括落在所附權(quán)利要求書范圍內(nèi)的所有實(shí)施例。權(quán)利要求1、一種用于處理用藥醫(yī)囑中的重要指示的改進(jìn)的方法,所述方法包括訪問醫(yī)療數(shù)據(jù);從該醫(yī)療數(shù)據(jù)中提取至少一個(gè)包含重要指示的文本串;以及解析所述至少一個(gè)文本串,以將至少一個(gè)標(biāo)識(shí)符與所述至少一個(gè)文本串中的每一個(gè)相關(guān)聯(lián)。2、如權(quán)利要求1所述的方法,還包括將所述至少一個(gè)文本串解構(gòu)成用于所述至少一個(gè)文本串中的每一個(gè)的多個(gè)子串。3、如權(quán)利要求2所述的方法,其中,所述解析的步驟還包括將標(biāo)識(shí)符與每個(gè)子串相關(guān)聯(lián)。4、如權(quán)利要求l所述的方法,其中,所述解析的步驟還包括,檢查所述至少一個(gè)文本串,以將所述至少一個(gè)標(biāo)識(shí)符與所述至少一個(gè)文本串中的每一個(gè)相關(guān)聯(lián)。5、如權(quán)利要求4所述的方法,其中,用戶和軟件程序中的至少一個(gè)檢查所述至少一個(gè)文本串,以將所述至少一個(gè)標(biāo)識(shí)符與所述至少一個(gè)文本串中的每一個(gè)相關(guān)聯(lián)。6、如權(quán)利要求l所述的方法,其中,所述至少一個(gè)標(biāo)識(shí)符包括數(shù)值。7、一種用于處理醫(yī)療數(shù)據(jù)的改進(jìn)的方法,所述方法包括識(shí)別醫(yī)療數(shù)據(jù)中的文本串;將所述文本串與來自庫中的標(biāo)準(zhǔn)化標(biāo)識(shí)符相關(guān)聯(lián);以及輸出所述與文本串相關(guān)聯(lián)的標(biāo)準(zhǔn)化標(biāo)識(shí)符。8、如權(quán)利要求7所述的方法,其中,所述輸出的步驟包括打印包括所述與文本串相關(guān)聯(lián)的標(biāo)準(zhǔn)化標(biāo)識(shí)符的報(bào)告或醫(yī)囑中的至少一個(gè)。9、如權(quán)利要求7所述的方法,其中,所述輸出的步驟包括存儲(chǔ)包括所述與文本串相關(guān)聯(lián)的標(biāo)準(zhǔn)化標(biāo)識(shí)符的報(bào)告或醫(yī)囑中的至少一個(gè)。10、如權(quán)利要求7所述的方法,還包括對(duì)所述庫進(jìn)行修改以容納所述文本串。11、如權(quán)利要求7所述的方法,其中用戶和軟件程序中的至少一個(gè)檢查所述文本串,以將標(biāo)準(zhǔn)化標(biāo)識(shí)符與所述文本串相關(guān)聯(lián)。12、如權(quán)利要求7所述的方法,還包括將所述文本串解構(gòu)成多個(gè)子串。13、如權(quán)利要求12所述的方法,其中,所述關(guān)聯(lián)的步驟還包括將標(biāo)準(zhǔn)化標(biāo)識(shí)符與每個(gè)子串相關(guān)聯(lián)。14、如權(quán)利要求7所述的方法,其中,所述標(biāo)準(zhǔn)化標(biāo)識(shí)符包括數(shù)值。15、如權(quán)利要求7所述的方法,其中,所述文本串包括重要的用藥指導(dǎo)。16、一種用于處理用藥指導(dǎo)的系統(tǒng),所述系統(tǒng)包括數(shù)據(jù)源,包括醫(yī)療數(shù)據(jù);以及數(shù)據(jù)處理器,其從所述數(shù)據(jù)源接收數(shù)據(jù),并根據(jù)詞典處理該數(shù)據(jù),其中,所述數(shù)據(jù)處理器將該數(shù)據(jù)解構(gòu)成段并解析所述段。17、如權(quán)利要求16所述的系統(tǒng),其中,所述醫(yī)療數(shù)據(jù)包括用藥指導(dǎo)。18、如權(quán)利要求16所述的系統(tǒng),其中,所述數(shù)據(jù)處理器將所述數(shù)據(jù)解構(gòu)成重要指示,并解析該重要指示。19、如權(quán)利要求16所述的系統(tǒng),其中,所述數(shù)據(jù)處理器將數(shù)字標(biāo)識(shí)符與每一個(gè)所述段相關(guān)聯(lián)。20、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其包括一組用于計(jì)算機(jī)的指令,所述一組指令包括提取例程,其從醫(yī)療指示中提取至少一個(gè)包含重要指示的字母數(shù)字串;以及解析例程,其解析所述至少一個(gè)字母數(shù)字串,以將至少一個(gè)標(biāo)識(shí)符與所述至少一個(gè)字母數(shù)字串中的每一個(gè)相關(guān)聯(lián)。全文摘要本發(fā)明的特定實(shí)施例提供用于處理醫(yī)療數(shù)據(jù)的系統(tǒng)和方法。所述方法包括步驟識(shí)別醫(yī)療數(shù)據(jù)中的文本串;將所述文本串與來自庫中的標(biāo)準(zhǔn)化標(biāo)識(shí)符相關(guān)聯(lián);以及輸出所述與文本串相關(guān)聯(lián)的標(biāo)準(zhǔn)化標(biāo)識(shí)符。在一個(gè)實(shí)施例中,可以打印和/或存儲(chǔ)包括與所述文本串相關(guān)聯(lián)的標(biāo)準(zhǔn)化標(biāo)識(shí)符的報(bào)告和/或醫(yī)囑。在一個(gè)實(shí)施例中,可以對(duì)庫進(jìn)行修改,以容納所述文本串。可以由例如用戶和/或軟件程序來檢查文本串,以便將標(biāo)準(zhǔn)化標(biāo)識(shí)符與文本串相關(guān)聯(lián)。在一個(gè)實(shí)施例中,文本串可以被解構(gòu)成多個(gè)子串。然后,標(biāo)準(zhǔn)化標(biāo)識(shí)符與每個(gè)子串相關(guān)聯(lián)。標(biāo)準(zhǔn)化標(biāo)識(shí)符可以是例如數(shù)值。文檔編號(hào)G06F17/27GK101198952SQ200680021545公開日2008年6月11日申請(qǐng)日期2006年4月12日優(yōu)先權(quán)日2005年4月15日發(fā)明者弗雷德·E·馬薩里,斯圖爾特·洛佩茲,邁克爾·I·利伯曼申請(qǐng)人:通用電氣公司