本發(fā)明涉及一種用于從電子文檔提取信息的方法和系統(tǒng)。
背景技術(shù):當(dāng)可以通過(guò)大型患者庫(kù)獲取集成信息時(shí),出現(xiàn)了較新的決策支持系統(tǒng),其使得醫(yī)生能夠受益于醫(yī)治類似患者的其他醫(yī)生的一致意見(jiàn)。這些系統(tǒng)依賴于基于內(nèi)容的檢索技術(shù),該檢索技術(shù)使用患者診斷數(shù)據(jù)中的基礎(chǔ)相似度推斷所診斷疾病的相似度。診斷信息的一個(gè)重要來(lái)源是測(cè)量報(bào)告。這些文檔匯總了許多診斷設(shè)置中的發(fā)現(xiàn),并記錄了在各種測(cè)試下從設(shè)備獲得的重要測(cè)量。此類報(bào)告還可以包含各種結(jié)構(gòu)的書(shū)面描述和表明診斷結(jié)論的文檔具體發(fā)現(xiàn)。盡管以自然語(yǔ)言完全理解此類報(bào)告是一個(gè)極富挑戰(zhàn)性的問(wèn)題,但通常需要從這些報(bào)告中提取足夠的臨床信息以完成患者的縱向臨床記錄。盡管電子病歷系統(tǒng)捕獲臨床數(shù)據(jù),但對(duì)診斷有用的信息通常位于其他系統(tǒng)中并采取非結(jié)構(gòu)化形式,因此完成患者的完整縱向記錄可能需要分析非結(jié)構(gòu)化數(shù)據(jù)。臨床報(bào)告,特別是轉(zhuǎn)錄系統(tǒng)、放射系統(tǒng)、心血管系統(tǒng)中提供的那些報(bào)告,構(gòu)成臨床數(shù)據(jù)的重要來(lái)源,例如人口統(tǒng)計(jì)信息(免疫、過(guò)敏癥)、家族史(患有疾病的親屬)、診斷檢查測(cè)量(例如,左心室面積)、藥物、療程和其他治療及其效果。提取這些類型的信息可以減少為兩種基本類型的操作—即,查找指示被提取的臨床信息類型的文本短語(yǔ),以及查找指示測(cè)量與其值配對(duì)的名稱-值對(duì)。一個(gè)實(shí)例包括從報(bào)告中推斷診斷標(biāo)簽,這是醫(yī)療保健中許多證據(jù)生成活動(dòng)的重要預(yù)處理步驟。了解診斷標(biāo)簽有助于對(duì)數(shù)據(jù)進(jìn)行分類并將診斷標(biāo) 簽用于直接查找患有特定疾病的患者。它還允許對(duì)患有類似疾病的患者進(jìn)行分組以實(shí)現(xiàn)決策支持,并且能夠?qū)﹄娮硬v(EMR)系統(tǒng)中記錄的診斷進(jìn)行一致性檢查。它還可以具有質(zhì)量控制和收入周期管理的暗示,因?yàn)槿鄙俚幕虿徽_的診斷代碼可以導(dǎo)致因不健全的計(jì)費(fèi)而產(chǎn)生的收入損失以及由于漏診而產(chǎn)生的護(hù)理責(zé)任和質(zhì)量問(wèn)題。從報(bào)告中推斷診斷標(biāo)簽可能頗具挑戰(zhàn)性,因?yàn)獒t(yī)生很少使用相同的短語(yǔ)作為診斷代碼的定義(ICD9)。例如,可能必須從例如“存在患者二尖瓣狹窄的跡象”的文本內(nèi)的描述推斷二尖瓣狹窄的診斷代碼(394.0)。盡管自由文本搜索引擎可以在此類報(bào)告內(nèi)的短語(yǔ)中查找精確的單詞匹配,但它們無(wú)法容易地處理例如上述仍然保留整體含義的短語(yǔ)的形成變化。查找對(duì)應(yīng)于某條所需信息(例如診斷標(biāo)簽)的文本短語(yǔ)需要(a)知曉相關(guān)的詞匯表術(shù)語(yǔ),(b)將這些術(shù)語(yǔ)在醫(yī)療文本中出現(xiàn)的可能變體預(yù)先編入目錄,(c)發(fā)現(xiàn)暗示含義相反的可靠否定,以及(d)用于查找容許術(shù)語(yǔ)使用變化的匹配短語(yǔ)的強(qiáng)健算法。
技術(shù)實(shí)現(xiàn)要素:描述了一種系統(tǒng)的實(shí)施例。在一個(gè)實(shí)施例中,所述系統(tǒng)是短語(yǔ)匹配系統(tǒng)。所述系統(tǒng)包括:訓(xùn)練引擎,其被配置為:從訓(xùn)練語(yǔ)料庫(kù)學(xué)習(xí)術(shù)語(yǔ)和術(shù)語(yǔ)變體,其中所述術(shù)語(yǔ)和所述術(shù)語(yǔ)變體對(duì)應(yīng)于與所述訓(xùn)練語(yǔ)料庫(kù)相關(guān)的專用詞典;以及生成在所述訓(xùn)練語(yǔ)料庫(kù)中找到的否定指示符的列表;以及匹配引擎,其被配置為:在一組電子文檔中執(zhí)行所述術(shù)語(yǔ)和所述術(shù)語(yǔ)變體的部分匹配以產(chǎn)生初始匹配結(jié)果;以及針對(duì)所述初始匹配結(jié)果使用所述否定指示符執(zhí)行否定測(cè)試并使用所述術(shù)語(yǔ)和所述術(shù)語(yǔ)變體執(zhí)行肯定術(shù)語(yǔ)測(cè)試,以便從所述初始匹配結(jié)果中刪除使所述否定測(cè)試或所述肯定術(shù)語(yǔ)測(cè)試失敗的匹配,從而產(chǎn)生最終匹配結(jié)果。還描述了所述系統(tǒng)的其他實(shí)施例。還描述了一種計(jì)算機(jī)程序產(chǎn)品的實(shí)施例。在一個(gè)實(shí)施例中,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可讀存儲(chǔ)設(shè)備以存儲(chǔ)計(jì)算機(jī)可讀程序,其中當(dāng)所述計(jì)算機(jī)可讀程序由計(jì)算機(jī)中的處理器執(zhí)行時(shí),導(dǎo)致所述計(jì)算機(jī)執(zhí)行操作以 便從電子文檔提取信息。所述操作包括:從訓(xùn)練語(yǔ)料庫(kù)學(xué)習(xí)術(shù)語(yǔ)和術(shù)語(yǔ)變體,其中所述術(shù)語(yǔ)和所述術(shù)語(yǔ)變體對(duì)應(yīng)于與所述訓(xùn)練語(yǔ)料庫(kù)相關(guān)的專用詞典;生成在所述訓(xùn)練語(yǔ)料庫(kù)中找到的否定指示符的列表;在一組電子文檔中執(zhí)行所述術(shù)語(yǔ)和所述術(shù)語(yǔ)變體的部分匹配以產(chǎn)生初始匹配結(jié)果;以及針對(duì)所述初始匹配結(jié)果使用所述否定指示符執(zhí)行否定測(cè)試并使用所述術(shù)語(yǔ)和所述術(shù)語(yǔ)變體執(zhí)行肯定術(shù)語(yǔ)測(cè)試,以便從所述初始匹配結(jié)果中刪除使所述否定測(cè)試或所述肯定術(shù)語(yǔ)測(cè)試失敗的匹配,從而產(chǎn)生最終匹配結(jié)果。還描述了所述計(jì)算機(jī)程序產(chǎn)品的其他實(shí)施例。還描述了一種方法的實(shí)施例。在一個(gè)實(shí)施例中,所述方法是用于從電子文檔提取信息的方法。所述方法包括:從訓(xùn)練語(yǔ)料庫(kù)學(xué)習(xí)術(shù)語(yǔ)和術(shù)語(yǔ)變體,其中所述術(shù)語(yǔ)和所述術(shù)語(yǔ)變體對(duì)應(yīng)于與所述訓(xùn)練語(yǔ)料庫(kù)相關(guān)的專用詞典;生成在所述訓(xùn)練語(yǔ)料庫(kù)中找到的否定指示符的列表;在一組電子文檔中執(zhí)行所述術(shù)語(yǔ)和所述術(shù)語(yǔ)變體的部分匹配以產(chǎn)生初始匹配結(jié)果;以及針對(duì)所述初始匹配結(jié)果使用所述否定指示符執(zhí)行否定測(cè)試并使用所述術(shù)語(yǔ)和所述術(shù)語(yǔ)變體執(zhí)行肯定術(shù)語(yǔ)測(cè)試,以便從所述初始匹配結(jié)果中刪除使所述否定測(cè)試或所述肯定術(shù)語(yǔ)測(cè)試失敗的匹配,從而產(chǎn)生最終匹配結(jié)果。還描述了所述方法的其他實(shí)施例。附圖說(shuō)明圖1示出了短語(yǔ)匹配系統(tǒng)的一個(gè)實(shí)施例的示意圖;圖2示出了用于從電子文檔提取信息的方法的一個(gè)實(shí)施例的流程圖;圖3示出了用于從電子文檔提取信息的方法的一個(gè)實(shí)施例的流程圖;圖4示出了用于從電子文檔提取信息的方法的一個(gè)實(shí)施例的流程圖。在說(shuō)明書(shū)中,可以使用相似的參考編號(hào)標(biāo)識(shí)相似的元素。具體實(shí)施方式將容易地理解,實(shí)施例的組件如通常在此描述以及在附圖中示出的那樣,可以以各種不同的配置來(lái)布置和設(shè)計(jì)。因此,以下對(duì)各種實(shí)施例的更 詳細(xì)的描述如在附圖中表示的那樣,并非旨在限制本公開(kāi)的范圍,而只是表示各種實(shí)施例。盡管在附圖中呈現(xiàn)了實(shí)施例的不同方面,但附圖不一定按比例繪制,除非具體指明??梢砸云渌囟ㄐ问綄?shí)現(xiàn)本發(fā)明而不偏離本發(fā)明的精神或本質(zhì)特性。所述實(shí)施例在所有方面都只是被視為示例性的而非限制性的。因此,本發(fā)明的范圍由所附權(quán)利要求而非此詳細(xì)描述來(lái)指示。所有在權(quán)利要求的等效含義和范圍之內(nèi)的更改都旨在被包含在權(quán)利要求的范圍內(nèi)。本說(shuō)明書(shū)中對(duì)特性、優(yōu)點(diǎn)的引用或類似語(yǔ)言并非暗示可以與本發(fā)明一起實(shí)現(xiàn)的所有特性和優(yōu)點(diǎn)應(yīng)在本發(fā)明的任何單個(gè)實(shí)施例中。相反,應(yīng)當(dāng)理解,引用所述特性和優(yōu)點(diǎn)的語(yǔ)言指與實(shí)施例一起描述的特定特性、優(yōu)點(diǎn)或特征包括在本發(fā)明的至少一個(gè)實(shí)施例中。因此,本說(shuō)明書(shū)中對(duì)特性、優(yōu)點(diǎn)的討論和類似語(yǔ)言可以(但并不一定)指同一實(shí)施例。此外,本發(fā)明的所述特性、優(yōu)點(diǎn)和特性可以以任何適當(dāng)?shù)姆绞浇M合在一個(gè)或多個(gè)實(shí)施例中。本領(lǐng)域的技術(shù)人員將認(rèn)識(shí)到,根據(jù)此處的描述,可以在沒(méi)有特定實(shí)施例的一個(gè)或多個(gè)特定特性或優(yōu)點(diǎn)的情況下實(shí)現(xiàn)本發(fā)明。在其他情況下,可以在特定實(shí)施例中認(rèn)識(shí)到可能不存在于本發(fā)明的所有實(shí)施例中的其他特性和優(yōu)點(diǎn)。本說(shuō)明書(shū)中對(duì)“一個(gè)實(shí)施例”、“實(shí)施例”的引用或類似語(yǔ)言指結(jié)合指示的實(shí)施例描述的特定特性、結(jié)構(gòu)或特征被包括在本發(fā)明的至少一個(gè)實(shí)施例中。因此,本說(shuō)明書(shū)中出現(xiàn)的短語(yǔ)“在一個(gè)實(shí)施例中”、“在實(shí)施例中”和類似語(yǔ)言可以(但并不一定)都指同一實(shí)施例。盡管在此描述了許多實(shí)施例,但至少某些所述實(shí)施例提供了一種用于根據(jù)對(duì)應(yīng)于給定詞典的術(shù)語(yǔ)和術(shù)語(yǔ)變體從電子文檔提取信息的系統(tǒng)和方法。更具體地說(shuō),所述系統(tǒng)在分析要與詞典匹配的電子文檔之前,從與所述詞典相關(guān)的文檔訓(xùn)練語(yǔ)料庫(kù)中學(xué)習(xí)一組術(shù)語(yǔ)和術(shù)語(yǔ)變體。在某些實(shí)施例中,可以手動(dòng)管理所學(xué)習(xí)的術(shù)語(yǔ)和術(shù)語(yǔ)變體以便優(yōu)化在匹配電子文檔時(shí)使用的術(shù)語(yǔ)和術(shù)語(yǔ)變體。所述系統(tǒng)針對(duì)所述電子文檔執(zhí)行部分匹配以縮小所述一組文檔的范圍。所述系統(tǒng)然后針對(duì)所述部分匹配結(jié)果執(zhí)行否定測(cè)試和 肯定術(shù)語(yǔ)測(cè)試,以便通過(guò)刪除使任何一個(gè)測(cè)試失敗的任何部分匹配來(lái)獲得最終匹配結(jié)果。在一個(gè)實(shí)施例中,所述系統(tǒng)和方法用于從文本臨床報(bào)告中提取對(duì)應(yīng)于國(guó)際疾病與相關(guān)健康問(wèn)題統(tǒng)計(jì)分類第9版(ICD-9)或任何ICD版本的診斷標(biāo)簽。某些常規(guī)系統(tǒng)使用自然語(yǔ)言處理系統(tǒng)連同其他技術(shù)(例如詞干、句子解析技術(shù)、基于詞典的方法、停止詞刪除、術(shù)語(yǔ)識(shí)別、否定發(fā)現(xiàn)等)從特定報(bào)告(例如,哮喘報(bào)告)中提取主要診斷和合并癥。盡管這些系統(tǒng)可以提供良好的精確匹配,但此類系統(tǒng)的記憶力(recall)可能較低。其他常規(guī)系統(tǒng)可以提供良好的記憶力,但精確匹配較低。一種根據(jù)使用術(shù)語(yǔ)和術(shù)語(yǔ)變體(其中手動(dòng)產(chǎn)生術(shù)語(yǔ)和術(shù)語(yǔ)變體)前綴的最長(zhǎng)通用子綴或單詞子集執(zhí)行初始部分匹配的系統(tǒng)和方法可提供高精確度和高記憶力。圖1示出了短語(yǔ)匹配系統(tǒng)100的一個(gè)實(shí)施例的示意圖。示出的短語(yǔ)匹配系統(tǒng)100包括能夠執(zhí)行在此描述的功能和操作的各種組件,將在下面更詳細(xì)地描述這些組件。在一個(gè)實(shí)施例中,短語(yǔ)匹配系統(tǒng)100的至少某些組件在計(jì)算機(jī)系統(tǒng)中實(shí)現(xiàn)。例如,短語(yǔ)匹配系統(tǒng)100的一個(gè)或多個(gè)組件的功能可以由計(jì)算機(jī)程序指令實(shí)現(xiàn),所述計(jì)算機(jī)程序指令存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)設(shè)備102上并由處理設(shè)備104(例如CPU)執(zhí)行。短語(yǔ)匹配系統(tǒng)100可以包括其他組件,例如磁盤存儲(chǔ)設(shè)備108、輸入/輸出設(shè)備106、訓(xùn)練引擎110和匹配引擎112。短語(yǔ)匹配系統(tǒng)100的部分或全部組件可以被存儲(chǔ)在單個(gè)計(jì)算設(shè)備上或計(jì)算設(shè)備網(wǎng)絡(luò)(包括無(wú)線通信網(wǎng)絡(luò))上。短語(yǔ)匹配系統(tǒng)100可以包括多于或少于在此示出的組件或子系統(tǒng)。在某些實(shí)施例中,短語(yǔ)匹配系統(tǒng)100可以用于實(shí)現(xiàn)在此描述的方法,如圖4中所示。在一個(gè)實(shí)施例中,短語(yǔ)匹配系統(tǒng)100包括訓(xùn)練引擎110。訓(xùn)練引擎110允許短語(yǔ)匹配系統(tǒng)100從給定應(yīng)用的訓(xùn)練語(yǔ)料庫(kù)114中提取數(shù)據(jù)。訓(xùn)練語(yǔ)料庫(kù)114可以與包括對(duì)應(yīng)于所述給定應(yīng)用的術(shù)語(yǔ)的專用詞典相關(guān)。訓(xùn)練語(yǔ)料庫(kù)114可以包括大量電子文檔或報(bào)告,這些電子文檔或報(bào)告已知包括所述專用詞典中的術(shù)語(yǔ)。在一個(gè)實(shí)施例中,訓(xùn)練引擎110根據(jù)包含在訓(xùn)練語(yǔ)料庫(kù)114中的數(shù)據(jù)從訓(xùn)練語(yǔ)料庫(kù)114學(xué)習(xí)術(shù)語(yǔ)和術(shù)語(yǔ)變體116。所述術(shù)語(yǔ)變體可以包括所述術(shù)語(yǔ)的同義詞、與所述術(shù)語(yǔ)共享通用詞干的單詞,以及所述術(shù)語(yǔ)的其他變體。在一個(gè)實(shí)施例中,所述術(shù)語(yǔ)變體包括每個(gè)術(shù)語(yǔ)的前綴118。每個(gè)術(shù)語(yǔ)的前綴118可以是僅由此術(shù)語(yǔ)和此術(shù)語(yǔ)的變體共享的唯一前綴118。在某些實(shí)施例中,唯一前綴118可以是由所述術(shù)語(yǔ)和所述術(shù)語(yǔ)變體共享的詞干。在某些實(shí)施例中,前綴118可以是術(shù)語(yǔ)和術(shù)語(yǔ)變體116的任何長(zhǎng)度的前綴118,以便前綴118仍然唯一。在一個(gè)實(shí)施例中,訓(xùn)練引擎110被配置為學(xué)習(xí)術(shù)語(yǔ)和術(shù)語(yǔ)變體116的修飾符120,包括描述術(shù)語(yǔ)和術(shù)語(yǔ)變體116的嚴(yán)重程度、數(shù)量、大小等的形容詞(例如“適度”或“極度”)和其他修飾符120。在某些實(shí)施例中,訓(xùn)練引擎110可以通過(guò)訓(xùn)練語(yǔ)料庫(kù)114自動(dòng)學(xué)習(xí)修飾符120。在其他實(shí)施例中,訓(xùn)練引擎110可以通過(guò)手動(dòng)輸入學(xué)習(xí)修飾符120。訓(xùn)練引擎110還可以學(xué)習(xí)包括在訓(xùn)練語(yǔ)料庫(kù)114中有關(guān)術(shù)語(yǔ)和術(shù)語(yǔ)變體116的否定指示符122。否定指示符122可以包括在術(shù)語(yǔ)或術(shù)語(yǔ)變體116的預(yù)定鄰近使用的否定單詞或短語(yǔ)以指示不存在與術(shù)語(yǔ)或術(shù)語(yǔ)變體116相關(guān)的條件。例如,如果包括術(shù)語(yǔ)或術(shù)語(yǔ)變體116的短語(yǔ)另外指示特定醫(yī)療或其他條件的存在,則此短語(yǔ)中的否定指示符122指示此條件不存在。在一個(gè)實(shí)施例中,短語(yǔ)匹配系統(tǒng)100包括匹配引擎112。匹配引擎112可以被配置為將術(shù)語(yǔ)和術(shù)語(yǔ)變體116與一組電子文檔相匹配。電子文檔中的匹配可以在顯示設(shè)備或其他輸出設(shè)備上顯示以便用戶查看。在一個(gè)實(shí)施例中,匹配引擎112獲得部分初始匹配結(jié)果124以縮小電子文檔中的材料的范圍。初始匹配結(jié)果124可以基于包含一個(gè)或多個(gè)術(shù)語(yǔ)和術(shù)語(yǔ)變體116的短語(yǔ)中的單詞的最長(zhǎng)通用子綴(LCS)。在某些實(shí)施例中,所述一組電子文檔可能不包括確切的術(shù)語(yǔ)和術(shù)語(yǔ)變體116以匹配專用詞典中的相關(guān)條件或短語(yǔ)。因此,使用LCS產(chǎn)生初始部分匹配結(jié)果可以允許匹配引擎112查找由于僅搜索確切短語(yǔ)而遺漏的匹配。LCS可以是單詞的子集,其中每個(gè)單詞按照其出現(xiàn)的順序是術(shù)語(yǔ)或術(shù)語(yǔ)變體116之一的前綴118。在一個(gè)實(shí)施例中,每個(gè)術(shù)語(yǔ)和術(shù)語(yǔ)變體116的前綴118是由查詢短語(yǔ)中的單詞共享的最長(zhǎng)通用前綴118。例如,試圖 匹配術(shù)語(yǔ)“二尖瓣反流”的查詢短語(yǔ)可以與諸如“患者的二尖瓣已經(jīng)顯示反流跡象”之類的字符串中的子綴匹配。在此實(shí)例中,查詢短語(yǔ)和給定字符串或句子之間的LCS是“二尖瓣反流”。如在此描述的,LCS可以包括每個(gè)術(shù)語(yǔ)或術(shù)語(yǔ)變體的通用于匹配的字符串中的單詞的前綴118。在一個(gè)實(shí)施例中,匹配引擎112被配置為確定電子文檔中每個(gè)解析的句子或短語(yǔ)的LCS得分126。其中LCS具有高于預(yù)定閾值的得分的一組候選短語(yǔ)可以在初始匹配結(jié)果124中保留為候選匹配。然后可以詳細(xì)評(píng)估每個(gè)保留的短語(yǔ)以了解查詢短語(yǔ)的否定和肯定證據(jù),從而獲得最終匹配結(jié)果128。為了查找否定指示,匹配引擎112可以檢查句子中每個(gè)子綴周圍的區(qū)域以獲得候選否定,例如訓(xùn)練引擎110學(xué)習(xí)的任何否定??梢酝ㄟ^(guò)檢查在訓(xùn)練語(yǔ)料庫(kù)114中出現(xiàn)的句子或短語(yǔ)的通用模式并記錄包括在所述短語(yǔ)中的任何否定來(lái)學(xué)習(xí)否定。如果給出條件的否定指示,則每個(gè)否定可以是一組有序單詞。在子綴周圍搜索否定指示的區(qū)域可以是句子中的最小包含謂詞(enclosingpredicate)??梢允褂弥T如“而且”、“但是”和“與…一起”之類的通用連接詞劃分句子以獲得此類短語(yǔ)區(qū)域。還可以針對(duì)此任務(wù)使用其他增強(qiáng)來(lái)執(zhí)行自然語(yǔ)言處理(NLP)算法和方法中提供的短語(yǔ)提取。匹配引擎112還可以查找ICD-9代碼標(biāo)簽描述中預(yù)期的短語(yǔ)的肯定指示。匹配引擎112可能需要這些術(shù)語(yǔ)來(lái)返回肯定結(jié)果,并且可以在先前訓(xùn)練階段根據(jù)大型訓(xùn)練語(yǔ)料庫(kù)114使用訓(xùn)練引擎110從ICD-9代碼標(biāo)簽描述預(yù)先匯編這些術(shù)語(yǔ)。在某些實(shí)施例中,訓(xùn)練引擎110可以學(xué)習(xí)通用肯定指示術(shù)語(yǔ)(例如,“患者患有…”)。部分匹配結(jié)果增加了術(shù)語(yǔ)和術(shù)語(yǔ)變體116檢測(cè)的穩(wěn)健性。在某些實(shí)施例中,基于LCS的部分匹配結(jié)果可能引入某些虛假肯定,但這可以通過(guò)執(zhí)行否定和肯定術(shù)語(yǔ)測(cè)試以減少虛假肯定數(shù)量以及虛假否定數(shù)量來(lái)克服。圖2示出了用于從電子文檔提取信息的方法204的一個(gè)實(shí)施例的流程圖。盡管結(jié)合圖1的短語(yǔ)匹配系統(tǒng)100描述了方法204,但可以使用其他類型的短語(yǔ)匹配系統(tǒng)100實(shí)現(xiàn)方法204的各實(shí)施例。在一個(gè)實(shí)施例中,訓(xùn)練引擎110接收已編譯文檔的訓(xùn)練語(yǔ)料庫(kù)114。訓(xùn)練語(yǔ)料庫(kù)114對(duì)應(yīng)于與每個(gè)所編譯文檔相關(guān)的專用詞典200。專用詞典200可以包括單詞或短語(yǔ),例如醫(yī)療術(shù)語(yǔ)或疾病標(biāo)簽。在一個(gè)實(shí)施例中,訓(xùn)練語(yǔ)料庫(kù)114中的一組文檔包括單個(gè)報(bào)告或文檔的不同重復(fù)。在某些實(shí)施例中,訓(xùn)練語(yǔ)料庫(kù)114包括對(duì)應(yīng)于專用詞典200的各種文檔類型。訓(xùn)練引擎110可以從訓(xùn)練語(yǔ)料庫(kù)114內(nèi)的短語(yǔ)/單詞中提取對(duì)應(yīng)于詞典200的術(shù)語(yǔ)。在某些實(shí)施例中,訓(xùn)練引擎110然后通過(guò)以下操作學(xué)習(xí)每個(gè)術(shù)語(yǔ)的變體:確定所述術(shù)語(yǔ)的詞根并在訓(xùn)練語(yǔ)料庫(kù)114或通用詞典200中查找其他單詞以了解共享所述詞根的單詞。在其他實(shí)施例中,訓(xùn)練引擎110可以通過(guò)確定術(shù)語(yǔ)的同義詞來(lái)學(xué)習(xí)術(shù)語(yǔ)變體??梢允褂闷渌椒▽W(xué)習(xí)術(shù)語(yǔ)變體。當(dāng)訓(xùn)練引擎110已學(xué)習(xí)術(shù)語(yǔ)和術(shù)語(yǔ)變體116時(shí),匹配引擎112使用術(shù)語(yǔ)和術(shù)語(yǔ)變體116在一組電子文檔202中查找匹配。一組電子文檔202可以是能夠被搜索、解析并與術(shù)語(yǔ)和術(shù)語(yǔ)變體116匹配的任何一組電子文檔202。在一個(gè)實(shí)施例中,匹配引擎112使用術(shù)語(yǔ)和術(shù)語(yǔ)變體116查找部分初始匹配結(jié)果124,并保留具有按照詞典200中描述的原始順序匹配的特定百分比單詞的文檔。獲得初始匹配結(jié)果124之后,匹配引擎112然后從初始匹配結(jié)果124獲得最終匹配結(jié)果128。在某些實(shí)施例中,匹配引擎112通過(guò)針對(duì)初始匹配結(jié)果124執(zhí)行否定和肯定術(shù)語(yǔ)測(cè)試來(lái)獲得最終匹配結(jié)果128。否定測(cè)試可以包括在初始匹配結(jié)果124中搜索否定指示符122并丟棄任何具有否定指示符122的結(jié)果??隙ㄐg(shù)語(yǔ)測(cè)試可以包括搜索需要在初始匹配結(jié)果124中出現(xiàn)的關(guān)鍵詞或短語(yǔ)并丟棄任何不包括肯定術(shù)語(yǔ)的結(jié)果。圖3示出了用于從電子文檔提取信息的方法300的一個(gè)實(shí)施例的流程圖。盡管結(jié)合圖1的短語(yǔ)匹配系統(tǒng)100描述了方法300,但可以使用其他類型的短語(yǔ)匹配系統(tǒng)100實(shí)現(xiàn)方法300的各實(shí)施例。在一個(gè)實(shí)施例中,短語(yǔ)匹配系統(tǒng)100包括訓(xùn)練過(guò)程302以產(chǎn)生對(duì)應(yīng)于醫(yī)療術(shù)語(yǔ)和短語(yǔ)的專用詞典200的審核后的(curated)術(shù)語(yǔ)詞典306,例 如ICD-9來(lái)源詞典。詞典200可以包括診斷、療程、藥物和其他醫(yī)療術(shù)語(yǔ)。訓(xùn)練過(guò)程302可以包括將詞典200和與詞典200相關(guān)的訓(xùn)練語(yǔ)料庫(kù)114導(dǎo)入到訓(xùn)練引擎110中。訓(xùn)練引擎110使用詞典200中的術(shù)語(yǔ)和短語(yǔ)來(lái)學(xué)習(xí)在訓(xùn)練語(yǔ)料庫(kù)114中使用的術(shù)語(yǔ)和術(shù)語(yǔ)的變體。訓(xùn)練引擎110可以從訓(xùn)練語(yǔ)料庫(kù)114中提取所有單詞并使用語(yǔ)言處理技術(shù)將它們解析成句子。在某些實(shí)施例中,訓(xùn)練語(yǔ)料庫(kù)114中的解析后的句子可以包括與來(lái)自詞典200的術(shù)語(yǔ)和術(shù)語(yǔ)變體116結(jié)合使用的否定指示符122或肯定術(shù)語(yǔ)。在某些實(shí)施例中,訓(xùn)練引擎110可以確定術(shù)語(yǔ)和術(shù)語(yǔ)變體116的前綴118并將所述前綴存儲(chǔ)在前綴詞典中。訓(xùn)練引擎110還可以接收來(lái)自通用詞典的輸入以確定可以幫助訓(xùn)練引擎110解析和學(xué)習(xí)術(shù)語(yǔ)和術(shù)語(yǔ)變體116的其他單詞,例如連接詞。在一個(gè)實(shí)施例中,在訓(xùn)練引擎110已學(xué)習(xí)術(shù)語(yǔ)和術(shù)語(yǔ)變體116之后,可以手動(dòng)審核(304)或更正否定指示符122和/或肯定術(shù)語(yǔ)、所學(xué)習(xí)的單詞和短語(yǔ)。例如,具備有關(guān)詞典200中的術(shù)語(yǔ)和術(shù)語(yǔ)變體116的知識(shí)的醫(yī)生可以通過(guò)選擇要由匹配引擎112使用的關(guān)鍵術(shù)語(yǔ)并刪除其他不必要的術(shù)語(yǔ)來(lái)手動(dòng)過(guò)濾所學(xué)習(xí)的單詞和短語(yǔ)列表。手動(dòng)審核的單詞和短語(yǔ)可以被存儲(chǔ)在審核后的術(shù)語(yǔ)詞典306中以便與匹配引擎112結(jié)合使用。在一個(gè)實(shí)施例中,匹配引擎112包括術(shù)語(yǔ)檢測(cè)器308。所述術(shù)語(yǔ)檢測(cè)器可以包括短語(yǔ)發(fā)現(xiàn)器310,其被配置為解析來(lái)自一組電子文檔202的文本輸入中的短語(yǔ),這些短語(yǔ)要與審核后的術(shù)語(yǔ)詞典306中的術(shù)語(yǔ)和術(shù)語(yǔ)變體116匹配。在某些實(shí)施例中,所述術(shù)語(yǔ)檢測(cè)器可以包括來(lái)自多個(gè)審核后的術(shù)語(yǔ)詞典306的輸入。短語(yǔ)發(fā)現(xiàn)器310可以接收確定如何解析文本輸入和匹配引擎112的其他方面的搜索參數(shù)。在某些實(shí)施例中,術(shù)語(yǔ)檢測(cè)器308可以包括輸入以指示用于與文本輸入匹配的詞典306的類型。在其中術(shù)語(yǔ)檢測(cè)器308可以用于使用單獨(dú)專用或?qū)徍撕蟮脑~典306的多個(gè)應(yīng)用的實(shí)施例中,這可能尤其有用。短語(yǔ)發(fā)現(xiàn)器310可以被配置為搜索文本輸入以獲得包括來(lái)自審核后的詞典306的術(shù)語(yǔ)和術(shù)語(yǔ)變體116的句子或短語(yǔ),以便產(chǎn)生匹配結(jié)果。圖4示出了用于從電子文檔提取信息的方法400的一個(gè)實(shí)施例的流程圖。盡管結(jié)合圖1的短語(yǔ)匹配系統(tǒng)100描述了方法400,但可以使用其他類型的短語(yǔ)匹配系統(tǒng)100實(shí)現(xiàn)方法400的各實(shí)施例。在一個(gè)實(shí)施例中,短語(yǔ)匹配系統(tǒng)100從訓(xùn)練語(yǔ)料庫(kù)114中學(xué)習(xí)(405)術(shù)語(yǔ)和術(shù)語(yǔ)變體116。術(shù)語(yǔ)和術(shù)語(yǔ)變體116可以對(duì)應(yīng)于專用詞典200,例如包括疾病標(biāo)簽代碼名稱的ICD-9來(lái)源詞典。在某些實(shí)施例中,ICD-9來(lái)源詞典可以按疾病類別或詞典200的某種其他子集被分為更小的詞典。短語(yǔ)匹配系統(tǒng)100然后可以生成(410)在訓(xùn)練語(yǔ)料庫(kù)114中找到的否定指示符122的列表。在一個(gè)實(shí)施例中,短語(yǔ)匹配系統(tǒng)100使用N元語(yǔ)法(N-gram)參數(shù)生成否定指示符122的列表,所述N元語(yǔ)法參數(shù)確定在其中找到否定指示符122的每個(gè)短語(yǔ)的最大連續(xù)單詞數(shù)量。在其中找到否定指示符122的短語(yǔ)可以是任何給定句子的部分或全部。在一個(gè)實(shí)施例中,短語(yǔ)匹配系統(tǒng)100在執(zhí)行部分匹配之前,接收輸入以便手動(dòng)完善(415)從訓(xùn)練語(yǔ)料庫(kù)114學(xué)習(xí)的術(shù)語(yǔ)和術(shù)語(yǔ)變體116。所述手動(dòng)完善可以包括刪除術(shù)語(yǔ)或術(shù)語(yǔ)變體116或者添加其他術(shù)語(yǔ)或術(shù)語(yǔ)變體116。所述手動(dòng)完善還可以包括修改短語(yǔ)匹配系統(tǒng)100使用的否定指示符122和肯定術(shù)語(yǔ)以獲得最終匹配結(jié)果128。在一個(gè)實(shí)施例中,短語(yǔ)匹配系統(tǒng)100針對(duì)一組電子文檔202執(zhí)行(420)術(shù)語(yǔ)和術(shù)語(yǔ)變體116的部分匹配以產(chǎn)生初始匹配結(jié)果124。在一個(gè)實(shí)施例中,執(zhí)行部分前綴匹配包括將一組電子文檔202劃分為句子。在劃分一組電子文檔202之后,短語(yǔ)匹配系統(tǒng)100可以確定(425)在執(zhí)行部分匹配時(shí)每個(gè)句子的LCS得分126。LCS得分126可以對(duì)應(yīng)于每個(gè)句子的最大術(shù)語(yǔ)和術(shù)語(yǔ)變體匹配子集??梢员A艟哂懈哂陬A(yù)定閾值的LCS得分126的句子。如果LCS得分126低于閾值,則丟棄(430)所述部分匹配。在一個(gè)實(shí)施例中,短語(yǔ)匹配系統(tǒng)100使用從訓(xùn)練語(yǔ)料庫(kù)114學(xué)習(xí)的否定指示符122針對(duì)初始匹配結(jié)果124執(zhí)行(435)否定測(cè)試。在一個(gè)實(shí)施例中,短語(yǔ)匹配系統(tǒng)100還使用術(shù)語(yǔ)和術(shù)語(yǔ)變體116針對(duì)初始匹配結(jié)果124執(zhí)行(440)肯定術(shù)語(yǔ)測(cè)試。在一個(gè)實(shí)施例中,所述肯定術(shù)語(yǔ)測(cè)試包括根據(jù) N元語(yǔ)法參數(shù)在最大數(shù)量的單詞中搜索術(shù)語(yǔ)修飾符120,術(shù)語(yǔ)修飾符120修改術(shù)語(yǔ)和術(shù)語(yǔ)變體116。術(shù)語(yǔ)修飾符120可以包括描述條件嚴(yán)重程度的形容詞(例如,“適度”、“嚴(yán)重”等)。短語(yǔ)匹配系統(tǒng)100然后可以從初始結(jié)果中丟棄(430)使否定測(cè)試或肯定術(shù)語(yǔ)測(cè)試失敗的部分匹配。保留(445)通過(guò)否定測(cè)試和肯定術(shù)語(yǔ)測(cè)試的部分匹配以獲得最終匹配結(jié)果128。在一個(gè)實(shí)施例中,學(xué)習(xí)術(shù)語(yǔ)和術(shù)語(yǔ)變體116包括學(xué)習(xí)每個(gè)術(shù)語(yǔ)和術(shù)語(yǔ)變體的通用前綴118。通用前綴118可以對(duì)單個(gè)單詞是唯一的。在某些實(shí)施例中,前綴118可以是詞干。在某些實(shí)施例中,通用前綴118可以是任何長(zhǎng)度以滿足唯一性要求。在一個(gè)實(shí)施例中,執(zhí)行部分匹配包括將每個(gè)術(shù)語(yǔ)和術(shù)語(yǔ)變體的通用前綴118與一組電子文檔202匹配。匹配每個(gè)術(shù)語(yǔ)的通用前綴118可以允許短語(yǔ)匹配系統(tǒng)100快速確定特定術(shù)語(yǔ)是否位于每個(gè)目標(biāo)句子或短語(yǔ)中。例如,如果要搜索的術(shù)語(yǔ)以“m”開(kāi)頭并且目標(biāo)句子不包括任何以字母“m”開(kāi)頭的單詞,則短語(yǔ)匹配系統(tǒng)100知道此術(shù)語(yǔ)不包括在目標(biāo)句子中。下面將描述短語(yǔ)匹配系統(tǒng)100使用的算法的一個(gè)實(shí)施例。短語(yǔ)匹配系統(tǒng)100可以學(xué)習(xí)表明ICD代碼的診斷短語(yǔ)列表,所述ICD代碼考慮了通用醫(yī)療術(shù)語(yǔ)的名稱變體(例如,反流和機(jī)能不全是同義詞)以及這些短語(yǔ)的肯定標(biāo)識(shí)所需的一組最小前綴118以形成專用ICD-9詞典。然后使用文字方面的任何標(biāo)準(zhǔn)句子分隔技術(shù)從文本報(bào)告提取句子。使用在短語(yǔ)中查找最長(zhǎng)通用子綴的新算法在每個(gè)句子中查找一組部分匹配術(shù)語(yǔ)。然后針對(duì)查詢短語(yǔ)的否定和肯定證據(jù)詳細(xì)評(píng)估每個(gè)此類保留的句子。最后,所述算法查找ICD-9代碼標(biāo)簽描述中預(yù)期的短語(yǔ)的肯定指示。在一個(gè)實(shí)施例中,所述算法首先使用也由醫(yī)生審核的關(guān)鍵術(shù)語(yǔ)自動(dòng)分析ICD-9代碼詞典。1.從實(shí)際報(bào)告的大型訓(xùn)練語(yǔ)料庫(kù)提取所有單詞,并產(chǎn)生所有非停止詞及其所有前綴的倒排詞典。如果多個(gè)單詞共享一個(gè)前綴,則放置布爾標(biāo)志。這將形成前綴詞典。2.從ICD-9疾病標(biāo)簽代碼名稱列表開(kāi)始,在前綴詞典中查找名稱短語(yǔ)中的每個(gè)非停止詞,并保留其是唯一的最大前綴(布爾標(biāo)志為false)。在某些情況下,可以保留整個(gè)單詞。3.從收集的候選前綴列表保留關(guān)鍵術(shù)語(yǔ)(由醫(yī)生手動(dòng)審核)。所述前綴可以確保保留用于指示疾病標(biāo)簽短語(yǔ)的最小子字符串以便最大程度地提高記憶力。醫(yī)生進(jìn)行的最終過(guò)濾可以確保保留的前綴是臨床上重要的術(shù)語(yǔ)。例如,在ICD-9疾病標(biāo)簽中找到的一個(gè)常見(jiàn)單詞是“unspecified(未指定)”。在前綴形式中,從此形成的術(shù)語(yǔ)可以是“unspecif”。因?yàn)檫@在實(shí)際疾病描述中很少提及并且可能必須進(jìn)行推斷,所以醫(yī)生可能決定不考慮將其作為搜索術(shù)語(yǔ)。所述算法然后通過(guò)挖掘大型報(bào)告集合來(lái)發(fā)現(xiàn)否定術(shù)語(yǔ)列表。諸如“無(wú)”和“未找到”之類的一些否定指示符122可以很容易被記錄。對(duì)于更模糊的否定指示符122,可以使用基于子短語(yǔ)出現(xiàn)頻率的受限、重復(fù)的組合生成過(guò)程。否定指示符122可以包括短語(yǔ)中相對(duì)少量的單詞。給定大型訓(xùn)練語(yǔ)料庫(kù)114,可以從該語(yǔ)料庫(kù)提取來(lái)自每個(gè)句子的所有N元語(yǔ)法,如下所示:1.將報(bào)告劃分為句子。可以使用不同的句子提取技術(shù)實(shí)現(xiàn)此目的。2.將K個(gè)連續(xù)單詞分組為短語(yǔ)(包括停止詞),其中K可變。盡管基于能夠在這些連續(xù)單詞組(稱為小短語(yǔ)(phraselet))之一中找到否定N元語(yǔ)法片段的假設(shè),可以使用范圍1至10,但可以嘗試不同的K范圍。3.跨集合以分級(jí)順序標(biāo)繪這些小短語(yǔ)的出現(xiàn)頻率,并根據(jù)其部分否定證據(jù)保留M種選擇。例如,短語(yǔ)“沒(méi)有…的證據(jù)”可以是明確的選擇。自動(dòng)篩選可以為觀察者提供從中進(jìn)行選擇的可能短語(yǔ)范圍。在一個(gè)實(shí)施例中,可以應(yīng)用醫(yī)生具備的報(bào)告知識(shí)來(lái)進(jìn)行M種選擇。4.從保留的短語(yǔ),M個(gè)短語(yǔ)形成M×M/2個(gè)短語(yǔ)組合以擴(kuò)展否定搜索。例如,短語(yǔ)“沒(méi)有…的證據(jù)”和“…但未看到”可以聯(lián)結(jié)為一個(gè)短語(yǔ)—“沒(méi)有<tab>的證據(jù)但未看到”。5.然后可以使用前綴截止得分(prefixcutoffscore)為1.0的最長(zhǎng)通用前綴的部分匹配算法在訓(xùn)練語(yǔ)料庫(kù)內(nèi)的所有句子中搜索每個(gè)保留的短語(yǔ)—所述短語(yǔ)中的每個(gè)單詞具有精確匹配(如果存在)??梢杂涗浢總€(gè)此類短語(yǔ)的出現(xiàn)頻率。在短語(yǔ)匹配期間可以忽略聯(lián)結(jié)的短語(yǔ)中的“<tab>”。6.使用新獲得的小短語(yǔ)重復(fù)操作3-5,直到最高術(shù)語(yǔ)的出現(xiàn)頻率下降到預(yù)定閾值(例如,<1%)或者所述短語(yǔ)中的單詞數(shù)量超過(guò)最大數(shù)量。7.保留的最終小短語(yǔ)列表形成否定N元語(yǔ)法。所述N元語(yǔ)法中的每個(gè)連續(xù)詞塊由“<tab>”分隔,以允許精確匹配(對(duì)于所述連續(xù)詞塊)和部分匹配(在由“tab”分隔的單詞之間)??梢栽诙囗?xiàng)式時(shí)間(polynomialtime)內(nèi)執(zhí)行學(xué)習(xí)術(shù)語(yǔ)和術(shù)語(yǔ)變體116以及否定指示符122的操作,以避免否則可能需要的呈指數(shù)的子集操作。此外,可以在匹配任何文檔之前執(zhí)行此類操作。所述算法然后基于最長(zhǎng)通用子綴執(zhí)行部分匹配算法。給定來(lái)自審核后的ICD-9詞典的疾病名稱列表,以及從中推斷診斷代碼的新報(bào)告,所述算法如下所示運(yùn)行:1.將報(bào)告劃分為句子。2.對(duì)于來(lái)自審核后的ICD-9詞典的所有疾病名稱,執(zhí)行與句子的部分匹配。保留那些具有高于閾值的最長(zhǎng)通用子綴(LCSx)得分的句子。不同的閾值選擇將改變精確度和記憶力,并且可以根據(jù)所需的精確度和記憶力從受試者操作特征(ROC)曲線中選擇不同的閾值選擇。在一個(gè)實(shí)施例中,使用為0.6的選擇。使用動(dòng)態(tài)編程查找最長(zhǎng)通用子綴,如下所示:a.給定查詢短語(yǔ)S={s1,s2,…sK}K個(gè)單詞和候選句子T={t1,t2,…tN},則最長(zhǎng)通用子綴LCSx(S,T)={c1,c2,…cL},其中L是在T中找到部分匹配的S中的最大單詞子集。S中單詞si的部分匹配是T中具有大于閾值的共享前綴的單詞tj。使閾值 為1.0將縮減到查找S的單詞的精確匹配的情況,盡管最長(zhǎng)通用子序列仍然允許匹配S中部分?jǐn)?shù)量的單詞。可以使用動(dòng)態(tài)編程并使用前綴匹配來(lái)查找最長(zhǎng)通用子綴,所述動(dòng)態(tài)編程類似于最長(zhǎng)通用子序列,但對(duì)在單詞級(jí)別執(zhí)行動(dòng)態(tài)編程進(jìn)行重要修改。對(duì)于此情況,使用數(shù)組C[i,j]計(jì)算匹配直到第i個(gè)單詞的S片段和直到第j個(gè)單詞的T片段的得分,如下所示:所述算法在短語(yǔ)匹配期間還將否定與肯定指示術(shù)語(yǔ)一起使用。一旦保留通過(guò)部分短語(yǔ)匹配的一組句子,就獲得報(bào)告內(nèi)的診斷代碼的進(jìn)一步證據(jù),如下所示:3.對(duì)于來(lái)自所學(xué)習(xí)的否定短語(yǔ)列表的每個(gè)否定小短語(yǔ)以及候選部分匹配句子:a.對(duì)于選定小短語(yǔ)中的每個(gè)單詞組i.如果針對(duì)該單詞組未找到精確匹配,則接受ICD代碼的部分匹配并退出。b.如果選定小短語(yǔ)中的所有單詞組都匹配,則丟棄ICD代碼的部分匹配。4.對(duì)于每個(gè)保留的候選部分匹配句子,以及在考慮之中的ICD-9代碼疾病標(biāo)簽:a.對(duì)于來(lái)自ICD-9詞典的與候選疾病標(biāo)簽對(duì)應(yīng)的每個(gè)必須具有的關(guān)鍵術(shù)語(yǔ)i.如果未在候選句子中找到關(guān)鍵術(shù)語(yǔ)的精確匹配,則丟棄所述匹配。5.保留所有匹配句子及其對(duì)應(yīng)的ICD-9代碼和疾病標(biāo)簽。6.刪除重復(fù)的ICD-9代碼和疾病標(biāo)簽(不同的疾病標(biāo)簽可以具有相同的ICD-9代碼)以留出冗余。這是從所述報(bào)告推斷的診斷標(biāo)簽的最終列表。短語(yǔ)匹配系統(tǒng)100的一個(gè)實(shí)施例包括至少一個(gè)直接或通過(guò)系統(tǒng)總線(例如數(shù)據(jù)、地址和/或控制總線)間接耦合到存儲(chǔ)器元件的處理器。所述存儲(chǔ)器元件可以包括在程序代碼的實(shí)際執(zhí)行期間采用的本地存儲(chǔ)器、大容量存儲(chǔ)裝置以及提供至少某些程序代碼的臨時(shí)存儲(chǔ)以減少必須在執(zhí)行期間從大容量存儲(chǔ)裝置檢索代碼的次數(shù)的高速緩沖存儲(chǔ)器。還應(yīng)指出,所述方法的至少某些操作可以使用軟件指令來(lái)實(shí)現(xiàn),所述軟件指令存儲(chǔ)在計(jì)算機(jī)可用存儲(chǔ)介質(zhì)上以便由計(jì)算機(jī)執(zhí)行。作為一個(gè)實(shí)例, 計(jì)算機(jī)程序產(chǎn)品的一個(gè)實(shí)施例包括計(jì)算機(jī)可用存儲(chǔ)介質(zhì)以存儲(chǔ)計(jì)算機(jī)可讀程序,當(dāng)在計(jì)算機(jī)上執(zhí)行所述計(jì)算機(jī)可讀程序時(shí),導(dǎo)致所述計(jì)算機(jī)執(zhí)行操作,包括用于從電子文檔提取信息的操作。盡管在此以特定順序示出和描述了所述方法(多個(gè))的操作,但可以改變每個(gè)方法的操作順序以便可以以相反的順序執(zhí)行特定操作,或者以便可以至少部分地與其他操作同時(shí)執(zhí)行特定操作。在另一個(gè)實(shí)施例中,可以以間歇和/或交替方式實(shí)現(xiàn)不同操作的指令或子操作。本發(fā)明的實(shí)施例可以采取完全硬件實(shí)施例、完全軟件實(shí)施例或包含硬件和軟件元素兩者的實(shí)施例的形式。在一個(gè)實(shí)施例中,本發(fā)明以軟件實(shí)現(xiàn),所述軟件包括但不限于固件、駐留軟件、微代碼等。此外,本發(fā)明的實(shí)施例可以采取可從計(jì)算機(jī)可用或計(jì)算機(jī)可讀介質(zhì)訪問(wèn)的計(jì)算機(jī)程序產(chǎn)品的形式,所述計(jì)算機(jī)可用或計(jì)算機(jī)可讀介質(zhì)提供了可以被計(jì)算機(jī)或任何指令執(zhí)行系統(tǒng)使用或與計(jì)算機(jī)或任何指令執(zhí)行系統(tǒng)結(jié)合的程序代碼。出于此描述的目的,計(jì)算機(jī)可用或計(jì)算機(jī)可讀介質(zhì)可以是任何能夠包含、存儲(chǔ)、傳送、傳播或傳輸由指令執(zhí)行系統(tǒng)、裝置或設(shè)備使用或與指令執(zhí)行系統(tǒng)、裝置或設(shè)備結(jié)合的程序的裝置。所述計(jì)算機(jī)可用或計(jì)算機(jī)可讀介質(zhì)可以是電、磁、光、電磁、紅外線或半導(dǎo)體系統(tǒng)(或裝置或設(shè)備)或傳播介質(zhì)。計(jì)算機(jī)可讀介質(zhì)的實(shí)例包括半導(dǎo)體或固態(tài)存儲(chǔ)器、磁帶、可移動(dòng)計(jì)算機(jī)盤、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、硬磁盤和光盤。光盤的當(dāng)前實(shí)例包括壓縮盤-只讀存儲(chǔ)器(CD-ROM)、壓縮盤-讀/寫(xiě)(CD-R/W)和數(shù)字視頻盤(DVD)。輸入/輸出或I/O設(shè)備(包括但不限于鍵盤、顯示器、指點(diǎn)設(shè)備等)可以直接或通過(guò)中間I/O控制器與所述系統(tǒng)相連。此外,網(wǎng)絡(luò)適配器也可以與所述系統(tǒng)相連以便使數(shù)據(jù)處理系統(tǒng)能夠通過(guò)中間專用或公共網(wǎng)絡(luò)與其他數(shù)據(jù)處理系統(tǒng)或遠(yuǎn)程打印機(jī)或存儲(chǔ)設(shè)備相連。調(diào)制解調(diào)器、電纜調(diào)制解調(diào)器以及以太網(wǎng)卡只是少數(shù)幾種當(dāng)前可用的網(wǎng)絡(luò)適配器類型。在上面的描述中,提供了各種實(shí)施例的特定細(xì)節(jié)。然而,可以在少于所有這些特定細(xì)節(jié)的情況下實(shí)現(xiàn)某些實(shí)施例。在其他情況下,為了簡(jiǎn)潔和 清晰起見(jiàn),對(duì)特定方法、過(guò)程、組件、結(jié)構(gòu)和/或功能的描述未如對(duì)實(shí)現(xiàn)本發(fā)明的各種實(shí)施例的描述那樣詳細(xì)。盡管描述和示出了本發(fā)明的特定實(shí)施例,但本發(fā)明并不限于如此描述和示出的各部分的特定形式或布置。本發(fā)明的范圍由在此所附權(quán)利要求及其等同物限定。