本發(fā)明涉及數(shù)據(jù)獲取技術(shù)領(lǐng)域,具體提供一種通用型臨床試驗(yàn)電子數(shù)據(jù)獲取系統(tǒng)和獲取方法。
背景技術(shù):在臨床研究或藥品臨床試驗(yàn)中,往往要收集病患者的病例報(bào)告表,而臨床研究或藥品臨床試驗(yàn)中所用于統(tǒng)計(jì)分析的病例報(bào)告表必須是電子病例報(bào)告表。目前,在大多數(shù)臨床研究數(shù)據(jù)中心中,還是通過手工錄入的方式將紙質(zhì)病例報(bào)告表內(nèi)容輸入計(jì)算機(jī)中形成電子病例報(bào)告表,對(duì)臨床數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。為了保證數(shù)據(jù)的準(zhǔn)確性,通常需要經(jīng)過兩次錄入甚至三次錄入,并對(duì)各次錄入的數(shù)據(jù)進(jìn)行比較以期糾正因人工錄入過程中引入的數(shù)據(jù)錯(cuò)誤。由于數(shù)據(jù)管理中間過程有大量的人工干預(yù),工作效率有限,數(shù)據(jù)發(fā)生錯(cuò)誤的可能性也會(huì)成倍地增加,而為了消除這種錯(cuò)誤,又不得不增加更多的人力。中國(guó)專利CN102968572A公開了一種骨科病例信息采集系統(tǒng)及其獲取方法,其中,所述骨科病例信息采集系統(tǒng)包括紙質(zhì)病例掃描采集模塊、電子病例自動(dòng)轉(zhuǎn)換模塊、骨科影像采集模塊和病例信息共享平臺(tái);其中,所述的紙質(zhì)病例掃描采集模塊包括:掃描模塊、圖像處理機(jī)文字識(shí)別模塊、數(shù)據(jù)存數(shù)模塊和數(shù)據(jù)傳輸接口,所述的掃描模塊包括高速掃描儀,掃描模塊將病人的紙質(zhì)病例信息轉(zhuǎn)換為圖像信息,圖像處理及文字識(shí)別模塊為文檔掃描軟件,將掃描的圖像信息轉(zhuǎn)換成電子病例文本;所述的電子病例自動(dòng)轉(zhuǎn)換模塊包括:HL7資源模塊、HL7對(duì)照模塊、HL7轉(zhuǎn)換模塊、HL7應(yīng)用接口模塊和HL7信息發(fā)送接受模塊;所述的骨科影像采集模塊包括:采集模塊、存儲(chǔ)模塊和數(shù)據(jù)傳輸接口。所述的病例信息共享平臺(tái)包括:紙質(zhì)病例信息接口、電子病例信息接口、骨科影像信息數(shù)據(jù)接口、數(shù)據(jù)處理模塊、數(shù)據(jù)存數(shù)模塊和數(shù)據(jù)共享模塊。所述骨科病例信息獲取方法包括如下步驟:(1)通過紙質(zhì)病例掃描采集模塊采集紙質(zhì)骨科病例信息;(2)通過電子病例自動(dòng)轉(zhuǎn)換模塊采集骨科電 子病例信息;(3)通過骨科影像采集模塊采集骨科影像信息;(4)將上述步驟采集的信息通過互聯(lián)網(wǎng)傳輸給病例信息共享平臺(tái);(5)數(shù)據(jù)共享平臺(tái)收集、整理病例信息,并提供給醫(yī)生和病人查詢。上述技術(shù)方案雖然能夠?qū)⒓堎|(zhì)病例轉(zhuǎn)換為電子病例,但是沒有對(duì)轉(zhuǎn)換后的電子病例進(jìn)行校驗(yàn),一旦所轉(zhuǎn)換的電子病例中存在因轉(zhuǎn)換而造成的信息錯(cuò)誤,則該錯(cuò)誤就不能被校驗(yàn)出來。當(dāng)在治療或研究過程中,若用于醫(yī)生、病人以及研究人員所查詢的電子病例中存在錯(cuò)誤的信息,則會(huì)對(duì)病人在治療過程中造成為誤診、對(duì)臨床研究或藥品臨床試驗(yàn)造成試驗(yàn)數(shù)據(jù)不準(zhǔn)確。而且,具體到藥物試驗(yàn),不僅要采集試驗(yàn)階段的電子病例信息,還需要采集試驗(yàn)結(jié)束后一定時(shí)間內(nèi)受試者信息、上述專利文獻(xiàn)中,僅僅采集試驗(yàn)階段的電子病例信息,導(dǎo)致信息采集不全,無法全面評(píng)估試驗(yàn)效果;而且無法實(shí)現(xiàn)全過程試驗(yàn)數(shù)據(jù)獲取的自動(dòng)化,導(dǎo)致現(xiàn)有試驗(yàn)過程中數(shù)據(jù)獲取效率低下和精確度差。
技術(shù)實(shí)現(xiàn)要素:本發(fā)明所要解決的技術(shù)問題是現(xiàn)有技術(shù)中無法實(shí)現(xiàn)全過程試驗(yàn)數(shù)據(jù)獲取的自動(dòng)化帶來的效率低下和精確度差的技術(shù)問題,從而提供一種通用型臨床試驗(yàn)電子數(shù)據(jù)獲取系統(tǒng)和獲取方法。為解決上述技術(shù)問題,本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:一種通用型臨床試驗(yàn)電子數(shù)據(jù)獲取系統(tǒng),包括客戶端系統(tǒng)、應(yīng)用服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器;其中,所述客戶端系統(tǒng)在試驗(yàn)開始前用于訪問所述應(yīng)用服務(wù)器,實(shí)現(xiàn)受試者隨機(jī)號(hào)分配;所述客戶端系統(tǒng)在試驗(yàn)過程中用于訪問所述應(yīng)用服務(wù)器,實(shí)現(xiàn)受試者藥物號(hào)分配;所述客戶端系統(tǒng)同時(shí)負(fù)責(zé)在試驗(yàn)過程中采集試驗(yàn)數(shù)據(jù)并在試驗(yàn)結(jié)束后收集隨訪數(shù)據(jù),并將采集到的所述試驗(yàn)數(shù)據(jù)和收集到的隨訪數(shù)據(jù)發(fā)送給應(yīng)用服務(wù)器,所述應(yīng)用服務(wù)器接收所述試驗(yàn)數(shù)據(jù)和隨訪數(shù)據(jù)并在處理后發(fā)送給所述數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ)。所述客戶端系統(tǒng)包括掃描裝置,所述掃描裝置,用于通過掃描試驗(yàn)階段的紙質(zhì)病例報(bào)告表生成病例報(bào)告 表圖像,并把所述病例報(bào)告表圖像發(fā)送給所述應(yīng)用服務(wù)器;所述應(yīng)用服務(wù)器包括識(shí)別裝置;所述識(shí)別裝置,接收所述掃描裝置發(fā)送的病例報(bào)告表圖像,并對(duì)所述病例報(bào)告表圖像進(jìn)行圖像、文字識(shí)別處理得到電子病例報(bào)告表;所述識(shí)別裝置進(jìn)一步包括第一OCR模塊、第二OCR模塊和校驗(yàn)?zāi)K,其中,所述第一OCR模塊,對(duì)病例報(bào)告表圖像進(jìn)行圖像、文字識(shí)別處理得到第一電子病例報(bào)告表,將所述第一電子病例報(bào)告表傳輸給所述校驗(yàn)?zāi)K;所述第二OCR模塊,具有與所述第一OCR模塊不同的識(shí)別算法,對(duì)所述第一OCR模塊識(shí)別的所述病例報(bào)告表圖像進(jìn)行圖像、文字識(shí)別處理得到第二電子病例報(bào)告表,將所述第二電子病例報(bào)告表傳輸給所述校驗(yàn)?zāi)K;所述校驗(yàn)?zāi)K,用于對(duì)電子病例報(bào)告表進(jìn)行校驗(yàn),其進(jìn)一步包括電子病例報(bào)告表對(duì)比單元和第一核對(duì)單元,所述電子病例報(bào)告表對(duì)比單元,接收所述第一OCR模塊和所述第二OCR模塊發(fā)送的第一電子病例報(bào)告表、第二電子病例報(bào)告表,對(duì)所述第一OCR模塊和所述第二OCR模塊發(fā)送的電子病例報(bào)告表進(jìn)行比較校驗(yàn),經(jīng)過比較校驗(yàn)后,若所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表一致,則將所述第一電子病例報(bào)告表或所述第二電子病例報(bào)告表作為第一暫態(tài)電子病例報(bào)告表的形式輸出;否則將所述第一電子病例報(bào)告表、所述第二電子病例報(bào)告表中不一致的內(nèi)容進(jìn)行標(biāo)記后輸出給所述第一核對(duì)單元;所述第一核對(duì)單元,接收所述電子病例報(bào)告表對(duì)比單元標(biāo)記后輸出的所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表,并對(duì)所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表中標(biāo)記的不一致的內(nèi)容進(jìn)行人工核對(duì)更正,將人工核對(duì)更正后的所述第一電子病例報(bào)告表或所述第二電子病例報(bào)告表作為第一暫態(tài)電子病例報(bào)告表輸出至所述數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ);所述校驗(yàn)?zāi)K還包括語法檢查單元和第二核對(duì)單元,所述語法檢查單元,接收所述第一暫態(tài)電子病例報(bào)告表,對(duì)所述第一暫 態(tài)電子病例報(bào)告表中的語句進(jìn)行語法檢查,若語法檢查結(jié)果正確則將所述第一暫態(tài)電子病例報(bào)告表作為第二暫態(tài)電子病例報(bào)告表輸出;否則將所述電子病例報(bào)告表中經(jīng)過語法檢查不正確的地方進(jìn)行語法錯(cuò)誤標(biāo)記后輸出給所述第二核對(duì)單元;所述第二核對(duì)單元,接收所述語法檢查單元發(fā)送的經(jīng)過語法錯(cuò)誤標(biāo)記的所述第一暫態(tài)電子病例報(bào)告表,并對(duì)所述第一暫態(tài)電子病例報(bào)告表進(jìn)行人工核對(duì),將人工核對(duì)后的所述第一暫態(tài)電子病例報(bào)告表作為第二暫態(tài)電子病例報(bào)告表輸出。所述校驗(yàn)?zāi)K還包括隨機(jī)截取校驗(yàn)單元和第三核對(duì)單元,其中,所述隨機(jī)截取校驗(yàn)單元進(jìn)一步包括隨機(jī)截取模塊和數(shù)據(jù)庫(kù),所述隨機(jī)截取模塊,接收所述第二暫態(tài)電子病例報(bào)告表,對(duì)所述第二暫態(tài)電子病例報(bào)告表中的語句進(jìn)行隨機(jī)截取得到隨機(jī)短語,并將所述隨機(jī)短語在所述數(shù)據(jù)庫(kù)中進(jìn)行查詢,若所述隨機(jī)短語為關(guān)鍵詞語、關(guān)鍵語句的全部或一部分,則將所述第二暫態(tài)電子病例報(bào)告表作為終態(tài)電子病例報(bào)告表輸出;否則將所述電子病例報(bào)告表中截取的隨機(jī)短語進(jìn)行標(biāo)記后輸出;所述數(shù)據(jù)庫(kù),用于接收關(guān)鍵詞語及關(guān)鍵語句并將接到的所述關(guān)鍵詞語及關(guān)鍵語句存儲(chǔ);所述第三核對(duì)單元,接收所述隨機(jī)截取模塊發(fā)送的標(biāo)記后的所述第二暫態(tài)電子病例報(bào)告表,并對(duì)其進(jìn)行人工核對(duì),將人工核對(duì)后的所述第二暫態(tài)電子病例報(bào)告表作為終態(tài)電子病例報(bào)告表輸出。所述客戶端系統(tǒng)包括聯(lián)網(wǎng)計(jì)算機(jī),所述聯(lián)網(wǎng)計(jì)算機(jī)用于訪問應(yīng)用服務(wù)器,并按照所述應(yīng)用服務(wù)器上的提示錄入受試者信息,并將錄入的所述受試者信息發(fā)送給所述數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ);所述應(yīng)用服務(wù)器進(jìn)一步包括分配隨機(jī)號(hào)模塊,所述分配隨機(jī)號(hào)模塊用于從數(shù)據(jù)庫(kù)服務(wù)器中讀取所述受試者信息并根據(jù)所述受試者信息,調(diào)用隨機(jī)分配算法將每個(gè)所述受試者隨機(jī)分配到不同的組,并為每個(gè)所述受試者分配隨機(jī)號(hào),最后將分配的隨機(jī)號(hào)通過所述聯(lián)網(wǎng)計(jì)算機(jī)反饋給所述研究者,并將 分配的所述隨機(jī)號(hào)存儲(chǔ)至所述數(shù)據(jù)庫(kù)服務(wù)器中。所述客戶端系統(tǒng)還包括電話機(jī),所述電話機(jī)與應(yīng)用服務(wù)器相連;所述應(yīng)用服務(wù)器進(jìn)一步包括:語音應(yīng)答模塊,在所述電話機(jī)與所述應(yīng)用服務(wù)器建立連接后,根據(jù)系統(tǒng)預(yù)先錄制的提示語音,發(fā)出提示語音提示研究者逐項(xiàng)輸入受試者信息,其中,所述受試者信息包括分配給所述受試者的隨機(jī)號(hào);并接收研究者輸入的所述受試者信息,然后將接收到的所述受試者信息存儲(chǔ)到所述數(shù)據(jù)庫(kù)服務(wù)器中;給藥物號(hào)模塊,讀取所述受試者信息并根據(jù)所述受試者信息,為每個(gè)所述受試者分配藥物號(hào),并將分配的藥物號(hào)通過所述語音應(yīng)答模塊和電話機(jī)反饋給所述研究者。所述客戶端系統(tǒng)還包括電話機(jī),所述電話機(jī)與應(yīng)用服務(wù)器相連;所述應(yīng)用服務(wù)器,還進(jìn)一步包括:語音應(yīng)答模塊,在所述電話機(jī)與所述應(yīng)用服務(wù)器建立連接后,根據(jù)系統(tǒng)預(yù)先錄制的提示語音,提示通過按鍵輸入受試者身份識(shí)別號(hào)以及通過語音依次輸入對(duì)受試者隨訪問題的答案信息,并將接收到的受試者身份識(shí)別號(hào)和對(duì)受試者隨訪問題的答案信息輸出;語音識(shí)別模塊,接收所述語音應(yīng)答模塊發(fā)送的所述受試者身份識(shí)別號(hào)和對(duì)所述受試者隨訪問題的答案信息,并對(duì)所述受試者隨訪問題的答案信息進(jìn)行語音識(shí)別,將識(shí)別后的所述受試者隨訪問題的答案信息和與之對(duì)應(yīng)的所述受試者身份識(shí)別號(hào)輸出至數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ)。同時(shí),提供一種通用型臨床試驗(yàn)電子數(shù)據(jù)獲取方法,包括如下步驟,試驗(yàn)前階段,通過客戶端系統(tǒng)訪問應(yīng)用服務(wù)器,并實(shí)現(xiàn)隨機(jī)號(hào)分配;在試驗(yàn)過程中,通過客戶端系統(tǒng)訪問應(yīng)用服務(wù)器,并實(shí)現(xiàn)受試者藥物號(hào)分配;通過客戶端系統(tǒng)采集試驗(yàn)數(shù)據(jù)并發(fā)送給應(yīng)用服務(wù)器;試驗(yàn)結(jié)束后,通過客戶端系統(tǒng)采集隨訪數(shù)據(jù)并發(fā)送給應(yīng)用服務(wù)器;所述應(yīng)用服務(wù)器接收所述客戶端系統(tǒng)發(fā)送的數(shù)據(jù)并處理后存儲(chǔ)至數(shù)據(jù)庫(kù)服務(wù)器。所述客戶端系統(tǒng)按照如下步驟采集試驗(yàn)數(shù)據(jù);S0:掃描試驗(yàn)階段的紙質(zhì)病例報(bào)告表以生成病例報(bào)告表圖像,并將所述病例報(bào)告表圖像發(fā)送;S1:接收病例報(bào)告表圖像,并對(duì)所述對(duì)病例報(bào)告表圖像進(jìn)行圖像、文字識(shí)別處理得到第一電子病例報(bào)告表,將所述第一電子病例報(bào)告表輸出;S2:接收步驟S1中識(shí)別的所述病例報(bào)告表圖像,并對(duì)所述病例報(bào)告表圖像用不同于步驟S1中的識(shí)別算法進(jìn)行圖像、文字識(shí)別處理得到第二電子病例報(bào)告表,將所述第二電子病例報(bào)告表輸出;S3:接收所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表,并對(duì)所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表進(jìn)行比較校驗(yàn);若所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表內(nèi)容一致,則將所述第一電子病例報(bào)告表或所述第二電子病例報(bào)告表作為第一暫態(tài)電子病例報(bào)告表輸出;否則將所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表中不一致的內(nèi)容進(jìn)行標(biāo)記后輸出;S4:接收標(biāo)記后輸出的所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表,并對(duì)所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表中標(biāo)記的不一致的內(nèi)容進(jìn)行人工核對(duì)更正,將人工核對(duì)更正后的所述第一電子病例報(bào)告表或所述第二電子病例報(bào)告表作為第一暫態(tài)電子病例報(bào)告表輸出至數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ)。還包括以下語法檢查的步驟:S51:接收所述第一暫態(tài)電子病例報(bào)告表,并對(duì)所述第一暫態(tài)電子病例報(bào)告表中的語句進(jìn)行語法檢查,若語法檢查結(jié)果正確則將所述暫態(tài)病例報(bào)告表作為第二暫態(tài)電子病例報(bào)告表輸出;否則將所述第一暫態(tài)電子病例報(bào)告表中經(jīng)過語法檢查不正確的地方進(jìn)行語法錯(cuò)誤標(biāo)記后輸出;S52:接收語法錯(cuò)誤標(biāo)記后輸出的所述第一暫態(tài)電子病例報(bào)告表,并對(duì)所述第一暫態(tài)電子病例報(bào)告表上語法錯(cuò)誤標(biāo)記的內(nèi)容進(jìn)行人工核對(duì),將人工核對(duì)后的所述第一暫態(tài)電子病例報(bào)告表作為第二暫態(tài)電子病例報(bào)告表輸出。在所述語法檢查步驟之后還包括短語核對(duì)的步驟:S61:接收所述第二暫態(tài)電子病例報(bào)告表,對(duì)所述第二暫態(tài)電子病例報(bào)告表中的語句進(jìn)行隨機(jī)截取得到隨機(jī)短語,并將所述隨機(jī)短語在預(yù)定的數(shù)據(jù)庫(kù)中進(jìn)行查詢,若所述隨機(jī)短語為所述數(shù)據(jù)庫(kù)中存儲(chǔ)的關(guān)鍵詞語或關(guān)鍵語句的全部或一部分,則將所述第二暫態(tài)電子病例報(bào)告表作為終態(tài)電子病例報(bào)告表輸出;否則,對(duì)所述第二暫態(tài)電子病例報(bào)告表中截取的所述隨機(jī)短語進(jìn)行短語核對(duì)錯(cuò)誤標(biāo)記后輸出;S62:接收短語核對(duì)錯(cuò)誤標(biāo)記后輸出的所述第二暫態(tài)電子病例報(bào)告表,并對(duì)所述第二暫態(tài)電子病例報(bào)告表中短語核對(duì)錯(cuò)誤標(biāo)記的所述隨機(jī)短語進(jìn)行人工核對(duì),將人工核對(duì)后的所述第二暫態(tài)電子病例報(bào)告表作為終態(tài)電子病例報(bào)告表輸出。所述步驟S61中的數(shù)據(jù)庫(kù)按照以下步驟生成:S5’1:將預(yù)先確定的關(guān)鍵詞語及關(guān)鍵語句存儲(chǔ)到數(shù)據(jù)庫(kù);S5’2:記錄所述隨機(jī)短語訪問數(shù)據(jù)庫(kù)的次數(shù),若次數(shù)超過預(yù)定的n次,則將所述隨機(jī)短語作為關(guān)鍵詞語或者關(guān)鍵語句存儲(chǔ)到所述數(shù)據(jù)庫(kù)中。還包括如下步驟:S20:試驗(yàn)結(jié)束后通過電話機(jī)訪問應(yīng)用服務(wù)器;S21:所述電話機(jī)與所述應(yīng)用服務(wù)器建立連接后,根據(jù)系統(tǒng)預(yù)先錄制的提示語音,提示通過按鍵輸入受試者身份識(shí)別號(hào)以及通過語音依次輸入對(duì)受試者隨訪問題的答案信息,并將接收到的受試者身份識(shí)別號(hào)和對(duì)受試者隨訪問題的答案信息輸出;S22:接收所述受試者身份識(shí)別號(hào)和對(duì)所述受試者隨訪問題的答案信息,并對(duì)所述受試者隨訪問題的答案信息進(jìn)行語音識(shí)別,將識(shí)別后的所述受試者隨訪 問題的答案信息和與之對(duì)應(yīng)的所述受試者身份識(shí)別號(hào)輸出至數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ)。本發(fā)明的上述技術(shù)方案相比現(xiàn)有技術(shù)具有以下優(yōu)點(diǎn):(1)本發(fā)明所述的一種通用型臨床試驗(yàn)電子數(shù)據(jù)獲取系統(tǒng)和獲取方法,通過客戶端系統(tǒng)生成受試者隨機(jī)號(hào)和藥物號(hào),并完成試驗(yàn)階段信息采集以及試驗(yàn)后的隨訪數(shù)據(jù)采集,使得貫穿整個(gè)試驗(yàn)過程的數(shù)據(jù)采集全部實(shí)現(xiàn)電子化,減少大量人工勞動(dòng),大大提高了獲取試驗(yàn)數(shù)據(jù)的效率和精度,且通用型強(qiáng)。(2)本發(fā)明所述的一種通用型臨床試驗(yàn)電子數(shù)據(jù)獲取系統(tǒng)和獲取方法,通過掃描裝置采集試驗(yàn)數(shù)據(jù)圖像即電子病例報(bào)告表,對(duì)采集的電子病例報(bào)告表使用兩種不同的識(shí)別算法進(jìn)行OCR識(shí)別,對(duì)識(shí)別結(jié)果不一致的內(nèi)容再進(jìn)行人工核對(duì)。保證大部分識(shí)別和核對(duì)工作通過OCR算法和校驗(yàn)?zāi)K和步驟自動(dòng)實(shí)現(xiàn),少數(shù)識(shí)別后不一致的內(nèi)容再由人工進(jìn)行核對(duì),及時(shí)發(fā)現(xiàn)錯(cuò)誤并進(jìn)行人工核對(duì),保證了采集的數(shù)據(jù)準(zhǔn)確性,同時(shí),也提高了數(shù)據(jù)采集系統(tǒng)的自動(dòng)化程度和數(shù)據(jù)采集速度,便于工業(yè)化實(shí)施。同時(shí),考慮到整個(gè)試驗(yàn)系統(tǒng)既需要采集試驗(yàn)階段數(shù)據(jù),又需要獲取試驗(yàn)結(jié)束后一定時(shí)間內(nèi)的隨訪數(shù)據(jù),本發(fā)明的通用型臨床試驗(yàn)電子數(shù)據(jù)獲取系統(tǒng)和獲取方法進(jìn)一步通過電話機(jī)和應(yīng)用服務(wù)器采集隨訪數(shù)據(jù),適應(yīng)了試驗(yàn)結(jié)束后受試者正常生活帶來的不便于到指定地點(diǎn)提供隨訪數(shù)據(jù)的缺陷,通過分布在不同地區(qū)并且已經(jīng)普遍使用的電話機(jī)訪問所述應(yīng)用服務(wù)器,完成隨訪數(shù)據(jù)的二十四小時(shí)不間斷采集,保證隨訪數(shù)據(jù)不流失。無需任何額外的硬件設(shè)備,所述應(yīng)用服務(wù)器可以在同一時(shí)間完成多個(gè)不同受試者隨訪數(shù)據(jù)的采集,省時(shí)省力。(3)本發(fā)明所述的一種通用型臨床試驗(yàn)電子數(shù)據(jù)獲取系統(tǒng)和獲取方法,所述校驗(yàn)?zāi)K還包括語法檢查單元,能夠?qū)λ龅谝粫簯B(tài)電子病例報(bào)告表中的語句進(jìn)行語法檢查,進(jìn)一步增加了系統(tǒng)的識(shí)別精度。所述校驗(yàn)?zāi)K還包括隨機(jī)截取校驗(yàn)單元,能夠隨機(jī)對(duì)所述第二暫態(tài)電子病例報(bào)告表中的語句進(jìn)行截取得到隨機(jī)短語,并將所述隨機(jī)短語在所述數(shù)據(jù)庫(kù)中進(jìn)行查詢,若所述隨機(jī)短語為所述關(guān)鍵詞語及關(guān)鍵語句的全部或一部分,則將所述第二暫態(tài)電子病例報(bào)告表作為終態(tài)電子病例報(bào)告表輸出;否則將所述電子病例報(bào)告表中截 取的隨機(jī)短語處標(biāo)記并對(duì)其進(jìn)行人工核對(duì),將人工核對(duì)后的終態(tài)電子病例報(bào)告表輸出。本發(fā)明能夠?qū)Φ诙簯B(tài)電子病例報(bào)告表中語句的準(zhǔn)確性進(jìn)行校驗(yàn),有效增加了系統(tǒng)的識(shí)別準(zhǔn)確性。附圖說明為了使本發(fā)明的內(nèi)容更容易被清楚的理解,下面結(jié)合附圖,對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明,其中,圖1是本發(fā)明一個(gè)實(shí)施例的通用型臨床試驗(yàn)電子數(shù)據(jù)獲取系統(tǒng)的框架圖;圖2是本發(fā)明一個(gè)實(shí)施例的通用型臨床試驗(yàn)電子數(shù)據(jù)獲取方法的部分流程圖。具體實(shí)施方式實(shí)施例1本發(fā)明一個(gè)實(shí)施例的通用型臨床試驗(yàn)電子數(shù)據(jù)獲取系統(tǒng),包括客戶端系統(tǒng)、應(yīng)用服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器;其中,所述客戶端系統(tǒng)在試驗(yàn)開始前用于訪問所述應(yīng)用服務(wù)器,實(shí)現(xiàn)受試者隨機(jī)號(hào)分配;所述客戶端系統(tǒng)在試驗(yàn)過程中用于訪問所述應(yīng)用服務(wù)器,實(shí)現(xiàn)受試者藥物號(hào)分配;所述客戶端系統(tǒng)同時(shí)負(fù)責(zé)在試驗(yàn)過程中采集試驗(yàn)數(shù)據(jù)并在試驗(yàn)結(jié)束后收集隨訪數(shù)據(jù),并將采集到的所述試驗(yàn)數(shù)據(jù)和收集到的隨訪數(shù)據(jù)發(fā)送給應(yīng)用服務(wù)器,所述應(yīng)用服務(wù)器接收所述試驗(yàn)數(shù)據(jù)和隨訪數(shù)據(jù)并在處理后發(fā)送給所述數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ)。實(shí)施例2參見圖1所示,作為本發(fā)明一個(gè)實(shí)施例的通用型試驗(yàn)數(shù)據(jù)采集系統(tǒng),在上述實(shí)施例的基礎(chǔ)上,所述客戶端系統(tǒng)包括用于采集試驗(yàn)階段中的試驗(yàn)數(shù)據(jù)的掃描裝置、用于在試驗(yàn)前階段用于分配受試者的隨機(jī)號(hào)的聯(lián)網(wǎng)計(jì)算機(jī)、用于在試驗(yàn)階段分配藥物號(hào)的電話機(jī)和用于在試驗(yàn)結(jié)束后采集隨訪數(shù)據(jù)的電話機(jī),一般,用于在試驗(yàn)階段分配藥物號(hào)的電話機(jī)和用于在試驗(yàn)結(jié)束后采集隨訪數(shù)據(jù)的電話機(jī)為分布在不同物理地點(diǎn)的不同電話機(jī),其中,試驗(yàn)開始前,所述聯(lián)網(wǎng)計(jì)算機(jī)用于訪問應(yīng)用服務(wù)器,并按照所述應(yīng)用服務(wù)器上的提示錄入受試者信息,并將錄入的所述受試者信息發(fā)送給所述數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ);所述應(yīng)用服務(wù)器進(jìn)一步包括分配隨機(jī)號(hào)模塊,所述分配隨機(jī)號(hào)模塊用于從數(shù)據(jù)庫(kù)服務(wù)器中讀取所述受試者信息并根據(jù)所述受試者信息,調(diào)用隨機(jī)分配算法將每個(gè)所述受試者隨機(jī)分配到不同的組,并為每個(gè)所述受試者分配隨機(jī)號(hào),最后將分配的隨機(jī)號(hào)通過所述聯(lián)網(wǎng)計(jì)算機(jī)反饋給所述研究者,并將分配的所述隨機(jī)號(hào)存儲(chǔ)至所述數(shù)據(jù)庫(kù)服務(wù)器中。在試驗(yàn)過程中,所述電話機(jī)與應(yīng)用服務(wù)器相連;所述應(yīng)用服務(wù)器進(jìn)一步包括:語音應(yīng)答模塊,在所述電話機(jī)與所述應(yīng)用服務(wù)器建立連接后,根據(jù)系統(tǒng)預(yù)先錄制的提示語音,發(fā)出提示語音提示研究者逐項(xiàng)輸入受試者信息,其中,所述受試者信息包括分配給所述受試者的隨機(jī)號(hào);并接收研究者輸入的所述受試者信息,然后將接收到的所述受試者信息存儲(chǔ)到所述數(shù)據(jù)庫(kù)服務(wù)器中;給藥物號(hào)模塊,讀取所述受試者信息并根據(jù)所述受試者信息,為每個(gè)所述受試者分配藥物號(hào),并將分配的藥物號(hào)通過所述語音應(yīng)答模塊和電話機(jī)反饋給所述研究者。試驗(yàn)過程中,所述掃描裝置,用于通過掃描試驗(yàn)階段中的紙質(zhì)病例報(bào)告表生成病例報(bào)告表圖像,并把所述病例報(bào)告表圖像發(fā)送給所述識(shí)別裝置,所述掃描裝置可以為掃描儀、照相機(jī)等電子設(shè)備。所述應(yīng)用服務(wù)器包括識(shí)別裝置,所述識(shí)別裝置用于接收所述掃描裝置發(fā)送的病例報(bào)告表圖像,并對(duì)所述病例報(bào)告表圖像進(jìn)行圖像、文字識(shí)別處理得到電子病例報(bào)告表;所述識(shí)別裝置進(jìn)一步包括第一OCR模塊、第二OCR模塊和校驗(yàn)?zāi)K,其中,所述第一OCR模塊,采用第一OCR算法對(duì)病例報(bào)告表圖像進(jìn)行圖像、文字識(shí)別處理得到第一電子病例報(bào)告表,將所述第一電子病例報(bào)告表傳輸給所 述校驗(yàn)?zāi)K。所述的病例報(bào)告表為臨床研究或藥品臨床試驗(yàn)中的原始數(shù)據(jù)在和法律文件,其具有一定的格式及項(xiàng)目,所述的項(xiàng)目中的全部或部分需要受試人員在紙質(zhì)病例報(bào)告表中手工填寫。本發(fā)明針對(duì)經(jīng)過受試人員填寫后的所述病例報(bào)告表圖像進(jìn)行OCR(OpticalCharacterRecognition光學(xué)字符識(shí)別)來得到電子病例報(bào)告表,完成紙質(zhì)數(shù)據(jù)項(xiàng)電子數(shù)據(jù)的轉(zhuǎn)化。所述OCR模塊能夠根據(jù)算法來分析文字的形態(tài)特征,判斷文字的標(biāo)準(zhǔn)編碼,并按照通用格式存儲(chǔ)為計(jì)算機(jī)文本文件,現(xiàn)有的OCR技術(shù)已經(jīng)能夠處理印刷質(zhì)量比較差的字符或較為一般的手寫體字符。所述第二OCR模塊,采用第二OCR算法對(duì)所述第一OCR模塊識(shí)別的所述病例報(bào)告表圖像進(jìn)行圖像、文字識(shí)別處理得到第二電子病例報(bào)告表,將所述第二電子病例報(bào)告表傳輸給所述校驗(yàn)?zāi)K。所述第一OCR算法和第二OCR算法不同。所述第一OCR模塊和第二OCR模塊分別根據(jù)不同算法對(duì)同樣的所述病例報(bào)告表圖像進(jìn)行識(shí)別,能夠使病例報(bào)告表圖像在不同算法下得到所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表,能夠增加所述電子病例報(bào)告表對(duì)比單元對(duì)所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表進(jìn)行比較的準(zhǔn)確性。所述校驗(yàn)?zāi)K,用于對(duì)電子病例報(bào)告表進(jìn)行校驗(yàn),其進(jìn)一步包括電子病例報(bào)告表對(duì)比單元和第一核對(duì)單元。所述電子病例報(bào)告表對(duì)比單元,接收所述第一OCR模塊和所述第二OCR模塊發(fā)送的第一電子病例報(bào)告表、第二電子病例報(bào)告表,對(duì)所述第一OCR模塊和所述第二OCR模塊發(fā)送的電子病例報(bào)告表進(jìn)行比較校驗(yàn),經(jīng)過比較校驗(yàn)后,若所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表一致,則將所述第一電子病例報(bào)告表或所述第二電子病例報(bào)告表作為第一暫態(tài)電子病例報(bào)告表的形式輸出;否則將所述第一電子病例報(bào)告表、所述第二電子病例報(bào)告表中不一致的內(nèi)容進(jìn)行標(biāo)記后輸出給所述第一核對(duì)單元。所述第一核對(duì)單元,接收所述電子病例報(bào)告表對(duì)比單元標(biāo)記后輸出的所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表,并對(duì)所述第一電子 病例報(bào)告表和所述第二電子病例報(bào)告表中標(biāo)記的不一致的內(nèi)容進(jìn)行人工核對(duì)更正,將人工核對(duì)更正后的所述第一電子病例報(bào)告表或所述第二電子病例報(bào)告表作為第一暫態(tài)電子病例報(bào)告表輸出。所述的暫態(tài)報(bào)告表既可以作為本發(fā)明最后的輸出數(shù)據(jù)輸出至所述數(shù)據(jù)服務(wù)器中存儲(chǔ),也可以作為其他模塊輸入數(shù)據(jù)以進(jìn)行進(jìn)一步的數(shù)據(jù)校正,校正后的獲得的終態(tài)報(bào)告表為最終輸出系統(tǒng)的電子病例報(bào)告表輸出至所述數(shù)據(jù)服務(wù)器中存儲(chǔ)。試驗(yàn)結(jié)束后,受試者使用電話機(jī)與應(yīng)用服務(wù)器相連;相應(yīng)地所述應(yīng)用服務(wù)器進(jìn)一步包括:語音應(yīng)答模塊,在所述電話機(jī)與所述應(yīng)用服務(wù)器建立連接后,根據(jù)系統(tǒng)預(yù)先錄制的提示語音,提示通過按鍵輸入受試者身份識(shí)別號(hào)以及通過語音依次輸入對(duì)受試者隨訪問題的答案信息,并將接收到的受試者身份識(shí)別號(hào)和對(duì)受試者隨訪問題的答案信息輸出。語音識(shí)別模塊,接收所述語音應(yīng)答模塊發(fā)送的所述受試者身份識(shí)別號(hào)和對(duì)所述受試者隨訪問題的答案信息,并對(duì)所述受試者隨訪問題的答案信息進(jìn)行語音識(shí)別,將識(shí)別后的所述受試者隨訪問題的答案信息和與之對(duì)應(yīng)的所述受試者身份識(shí)別號(hào)輸出至數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ)。實(shí)施例3作為本發(fā)明其他實(shí)施例的通用型試驗(yàn)數(shù)據(jù)采集系統(tǒng),上述實(shí)施例中用于完成受試者隨機(jī)號(hào)分配的聯(lián)網(wǎng)計(jì)算機(jī)被電話機(jī)代替,其中,電話機(jī),與應(yīng)用服務(wù)器相連;應(yīng)用服務(wù)器,進(jìn)一步包括:數(shù)據(jù)庫(kù),用于存儲(chǔ)系統(tǒng)數(shù)據(jù);語音應(yīng)答模塊,在所述電話機(jī)與所述應(yīng)用服務(wù)器建立連接后,根據(jù)系統(tǒng)預(yù)先錄制的提示語音,發(fā)出提示語音提示研究者逐項(xiàng)輸入受試者信息;并接收研究者輸入的所述受試者信息,然后將接收到的所述受試者信息存儲(chǔ)到所述數(shù)據(jù)庫(kù)中;分配隨機(jī)號(hào)模塊,讀取所述受試者信息并根據(jù)所述受試者信息,調(diào) 用隨機(jī)分配算法將每個(gè)所述受試者隨機(jī)分配到不同的組,并為每組的每個(gè)所述受試者分配隨機(jī)號(hào),并將分配的隨機(jī)號(hào)通過所述語音應(yīng)答模塊和電話機(jī)反饋給所述研究者。實(shí)施例4當(dāng)然,作為本發(fā)明其他實(shí)施例的通用型試驗(yàn)數(shù)據(jù)采集系統(tǒng),在上述實(shí)施例的基礎(chǔ)上,上述實(shí)施例中用于完成受試者藥物號(hào)分配的電話機(jī)被聯(lián)網(wǎng)計(jì)算機(jī)代替,所述電話機(jī)與應(yīng)用服務(wù)器相連。所述應(yīng)用服務(wù)器相應(yīng)地進(jìn)一步包括:語音應(yīng)答模塊,在所述電話機(jī)與所述應(yīng)用服務(wù)器建立連接后,根據(jù)系統(tǒng)預(yù)先錄制的提示語音,發(fā)出提示語音提示研究者逐項(xiàng)輸入受試者信息,其中,所述受試者信息包括分配給所述受試者的隨機(jī)號(hào);并接收研究者輸入的所述受試者信息,然后將接收到的所述受試者信息存儲(chǔ)到所述數(shù)據(jù)庫(kù)中。給藥物號(hào)模塊,讀取所述受試者信息并根據(jù)所述受試者信息,為每個(gè)所述受試者分配藥物號(hào),并將分配的藥物號(hào)通過所述語音應(yīng)答模塊和電話機(jī)反饋給所述研究者。實(shí)施例5作為本發(fā)明其他實(shí)施例的通用型試驗(yàn)數(shù)據(jù)采集系統(tǒng),在上述實(shí)施例的基礎(chǔ)上,上述實(shí)施例中用于采集試驗(yàn)數(shù)據(jù)的所述掃描裝置可以為電話或者聯(lián)網(wǎng)計(jì)算機(jī)代替,用于采集試驗(yàn)過程中數(shù)據(jù),并將采集的試驗(yàn)數(shù)據(jù)發(fā)送給應(yīng)用服務(wù)器,由所述應(yīng)用服務(wù)器處理后發(fā)送至數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ),同樣能實(shí)現(xiàn)本發(fā)明的目的,屬于本發(fā)明的保護(hù)范圍。實(shí)施例6作為一種具體實(shí)施方式,上述實(shí)施例中用于采集隨訪數(shù)據(jù)的電話機(jī)被聯(lián)網(wǎng)計(jì)算機(jī)取代,所述聯(lián)網(wǎng)計(jì)算機(jī)用于遠(yuǎn)程訪問應(yīng)用服務(wù)器,并根據(jù)所述應(yīng)用服務(wù)器的提示輸入受試者身份識(shí)別號(hào)以及逐條錄入對(duì)受試者隨訪題目的答案 信息。應(yīng)用服務(wù)器,接收所述聯(lián)網(wǎng)計(jì)算機(jī)發(fā)送的所述受試者身份識(shí)別號(hào)和對(duì)所述受試者隨訪問題的答案信息,并將接收到的所述受試者隨訪問題的答案信息和與之對(duì)應(yīng)的所述受試者身份識(shí)別號(hào)輸出至數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ)。數(shù)據(jù)庫(kù)服務(wù)器,與所述應(yīng)用服務(wù)器相連,接收所述應(yīng)用服務(wù)器輸出的所述受試者隨訪問題的答案信息和所述受試者身份識(shí)別號(hào)并對(duì)應(yīng)存儲(chǔ)。實(shí)施例7作為本發(fā)明其他實(shí)施例的通用型試驗(yàn)數(shù)據(jù)采集系統(tǒng),在上述任一實(shí)施例的基礎(chǔ)上,所述客戶端系統(tǒng)還包括用與完成受試者招募的電話機(jī),所述電話機(jī)進(jìn)一步包括:話筒,用于輸入語音并將輸入的語音發(fā)送給加密模塊;加密模塊,接收所述話筒輸入的語音并進(jìn)行加密后發(fā)送給應(yīng)用服務(wù)器;所述應(yīng)用服務(wù)器進(jìn)一步包括:語音應(yīng)答模塊,在所述電話機(jī)與所述應(yīng)用服務(wù)器建立連接后,根據(jù)系統(tǒng)預(yù)先錄制的提示語音,提示通過語音輸入應(yīng)招者信息,并將接收到的應(yīng)招者信息發(fā)送給解密模塊;解密模塊,接收所述語音應(yīng)答模塊發(fā)送的應(yīng)招者信息并進(jìn)行解密后發(fā)送給語音識(shí)別模塊;語音識(shí)別模塊,接收所述解密模塊發(fā)送的解密后的所述應(yīng)招者信息,并對(duì)所述應(yīng)招者信息進(jìn)行語音識(shí)別,將識(shí)別后的所述應(yīng)招者信息輸出至數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ);數(shù)據(jù)庫(kù)服務(wù)器,與所述應(yīng)用服務(wù)器相連,接收所述應(yīng)用服務(wù)器輸出的所述應(yīng)招者信息并對(duì)應(yīng)存儲(chǔ)。本發(fā)明所述的一種通用型臨床試驗(yàn)電子數(shù)據(jù)獲取系統(tǒng),通過客戶端系統(tǒng)生成受試者隨機(jī)號(hào)和藥物分配號(hào),并完成試驗(yàn)階段信息采集以及試驗(yàn)后的隨訪數(shù)據(jù)采集,使得貫穿整個(gè)試驗(yàn)過程的數(shù)據(jù)采集全部實(shí)現(xiàn)電子化,通用型強(qiáng)。進(jìn)一步地,本發(fā)明所述的一種通用型臨床試驗(yàn)電子數(shù)據(jù)獲取系統(tǒng),通過 掃描裝置采集試驗(yàn)數(shù)據(jù)圖像即電子病例報(bào)告表,對(duì)采集的電子病例報(bào)告表使用兩種不同的識(shí)別算法進(jìn)行OCR識(shí)別,對(duì)識(shí)別結(jié)果不一致的內(nèi)容再進(jìn)行人工核對(duì)。保證大部分識(shí)別和核對(duì)工作通過OCR算法和校驗(yàn)?zāi)K和步驟自動(dòng)實(shí)現(xiàn),少數(shù)識(shí)別后不一致的內(nèi)容再由人工進(jìn)行核對(duì),及時(shí)發(fā)現(xiàn)錯(cuò)誤并進(jìn)行人工核對(duì),保證了采集的數(shù)據(jù)準(zhǔn)確性,同時(shí),也提高了數(shù)據(jù)采集系統(tǒng)的自動(dòng)化程度和數(shù)據(jù)采集速度,便于工業(yè)化實(shí)施。同時(shí),考慮到整個(gè)試驗(yàn)系統(tǒng)既需要采集試驗(yàn)階段數(shù)據(jù),又需要獲取試驗(yàn)結(jié)束后一定時(shí)間內(nèi)的隨訪數(shù)據(jù),本發(fā)明的通用型臨床試驗(yàn)電子數(shù)據(jù)獲取系統(tǒng)和獲取方法進(jìn)一步通過電話機(jī)和應(yīng)用服務(wù)器采集隨訪數(shù)據(jù),適應(yīng)了試驗(yàn)結(jié)束后受試者正常生活帶來的不便于到指定地點(diǎn)提供隨訪數(shù)據(jù)的缺陷,通過分布在不同地區(qū)并且已經(jīng)普遍使用的電話機(jī)訪問所述應(yīng)用服務(wù)器,完成隨訪數(shù)據(jù)的二十四小時(shí)不間斷采集,保證隨訪數(shù)據(jù)不流失。無需任何額外的硬件設(shè)備,所述應(yīng)用服務(wù)器可以在同一時(shí)間完成多個(gè)不同受試者隨訪數(shù)據(jù)的采集,省時(shí)省力。實(shí)施例8作為本發(fā)明的其他實(shí)施例,在上述實(shí)施例的基礎(chǔ)上,所述校驗(yàn)?zāi)K還包括語法檢查單元和第二核對(duì)單元。所述語法檢查單元,接收所述電子病例報(bào)告表對(duì)比單元輸出的第一暫態(tài)電子病例報(bào)告表,對(duì)所述第一暫態(tài)電子病例報(bào)告表中的語句進(jìn)行語法檢查,若語法檢查結(jié)果正確則將所述第一暫態(tài)電子病例報(bào)告表作為第二暫態(tài)電子病例報(bào)告表輸出;否則將所述電子病例報(bào)告表中經(jīng)過語法檢查不正確的地方進(jìn)行語法錯(cuò)誤標(biāo)記后輸出給所述第二核對(duì)單元。所述語法檢查單元,能夠?qū)λ龅谝粫簯B(tài)電子病例報(bào)告表中的語句進(jìn)行語法檢查,進(jìn)一步增加了系統(tǒng)的識(shí)別精度。所述第二核對(duì)單元,接收所述語法檢查單元發(fā)送的經(jīng)過語法錯(cuò)誤標(biāo)記的所述第一暫態(tài)電子病例報(bào)告表,并對(duì)所述第一暫態(tài)電子病例報(bào)告表進(jìn)行人工核對(duì),將人工核對(duì)后的所述第一暫態(tài)電子病例報(bào)告表作為第二暫態(tài)電子病例報(bào)告表輸出。實(shí)施例9作為本發(fā)明的其他實(shí)施例,在上述包括校驗(yàn)?zāi)K的實(shí)施例的基礎(chǔ)上,所述校驗(yàn)?zāi)K還包括隨機(jī)截取校驗(yàn)單元和第三核對(duì)單元。其中,所述隨機(jī)截取校驗(yàn)單元進(jìn)一步包括隨機(jī)截取模塊和數(shù)據(jù)庫(kù)。所述隨機(jī)截取模塊,接收所述第二暫態(tài)電子病例報(bào)告表,對(duì)所述第二暫態(tài)電子病例報(bào)告表中的語句進(jìn)行隨機(jī)截取得到隨機(jī)短語,并將所述隨機(jī)短語搜索的關(guān)鍵字在所述數(shù)據(jù)庫(kù)中進(jìn)行搜索查詢,若所述隨機(jī)短語為數(shù)據(jù)庫(kù)中存儲(chǔ)的關(guān)鍵詞語、關(guān)鍵語句的全部或一部分,則認(rèn)為隨機(jī)截取校驗(yàn)正確,將所述第二暫態(tài)電子病例報(bào)告表作為終態(tài)電子病例報(bào)告表輸出;否則將所述電子病例報(bào)告表中截取的隨機(jī)短語進(jìn)行標(biāo)記后輸出。所述數(shù)據(jù)庫(kù),用于接收關(guān)鍵詞語及關(guān)鍵語句并將接到的所述關(guān)鍵詞語及關(guān)鍵語句存儲(chǔ),所述的關(guān)鍵詞語及關(guān)鍵語句為中醫(yī)藥辭典、現(xiàn)代漢語辭典等專業(yè)工具書中的詞語及語句。所述第三核對(duì)單元,接收所述隨機(jī)截取模塊發(fā)送的標(biāo)記后的所述第二暫態(tài)電子病例報(bào)告表,并對(duì)其進(jìn)行人工核對(duì),將人工核對(duì)后的所述第二暫態(tài)電子病例報(bào)告表作為終態(tài)電子病例報(bào)告表輸出。本發(fā)明能夠?qū)λ龅诙簯B(tài)電子病例報(bào)告表中詞語及語句的準(zhǔn)確性進(jìn)行校驗(yàn),有效增加了系統(tǒng)的識(shí)別準(zhǔn)確性。作為其他更優(yōu)選的實(shí)施例,在上述實(shí)施例的通用型臨床試驗(yàn)電子數(shù)據(jù)獲取系統(tǒng)的基礎(chǔ)上,所述語音識(shí)別模塊進(jìn)一步包括至少兩個(gè)語音識(shí)別單元和一個(gè)校驗(yàn)單元,其中,至少兩個(gè)所述語音識(shí)別單元應(yīng)用的語音識(shí)別算法不同,經(jīng)過多個(gè)所述語音識(shí)別單元識(shí)別結(jié)果相同的內(nèi)容可認(rèn)為識(shí)別結(jié)果準(zhǔn)確,直接輸出至數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ);經(jīng)過多個(gè)所述語音識(shí)別單元識(shí)別結(jié)果不同的內(nèi)容可能識(shí)別錯(cuò)誤,對(duì)該部分內(nèi)容進(jìn)行突出顯示,后續(xù)對(duì)該突出顯示的內(nèi)容進(jìn)行人工核對(duì)后再輸出至數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ),保證采集的隨訪數(shù)據(jù)的準(zhǔn)確性。進(jìn)而保證所述通用型數(shù)據(jù)采集系統(tǒng)采集的所有數(shù)據(jù)的準(zhǔn)確性。同樣,作為本發(fā)明其他實(shí)施例,所述識(shí)別裝置可以包括兩個(gè)以上的OCR模塊,同樣能實(shí)現(xiàn)本發(fā)明的目的,屬于本發(fā)明的保護(hù)范圍。實(shí)施例10一種通用型臨床試驗(yàn)電子數(shù)據(jù)獲取方法,包括如下步驟:試驗(yàn)前階段,通過客戶端系統(tǒng)訪問應(yīng)用服務(wù)器,并實(shí)現(xiàn)隨機(jī)號(hào)分配。在試驗(yàn)過程中,通過客戶端系統(tǒng)訪問應(yīng)用服務(wù)器,并實(shí)現(xiàn)受試者藥物號(hào)分配;通過客戶端系統(tǒng)采集試驗(yàn)數(shù)據(jù)并發(fā)送給應(yīng)用服務(wù)器。試驗(yàn)結(jié)束后,通過客戶端系統(tǒng)采集隨訪數(shù)據(jù)并發(fā)送給應(yīng)用服務(wù)器;所述應(yīng)用服務(wù)器接收所述客戶端系統(tǒng)發(fā)送的數(shù)據(jù)并處理后存儲(chǔ)至數(shù)據(jù)庫(kù)服務(wù)器。實(shí)施例11作為本發(fā)明所述的一種通用型臨床試驗(yàn)電子數(shù)據(jù)獲取方法,在上述實(shí)施例的基礎(chǔ)上,如圖2所示,所述試驗(yàn)數(shù)據(jù)采集的步驟具體包括:S0:掃描紙質(zhì)病例報(bào)告表以生成病例報(bào)告表圖像,并將所述病例報(bào)告表圖像發(fā)送。S1:接收病例報(bào)告表圖像,并對(duì)所述對(duì)病例報(bào)告表圖像進(jìn)行圖像、文字識(shí)別處理得到第一電子病例報(bào)告表,將所述第一電子病例報(bào)告表輸出。S2:接收步驟S1中識(shí)別的所述病例報(bào)告表圖像,并對(duì)所述病例報(bào)告表圖像用不同于步驟S1中的識(shí)別算法進(jìn)行圖像、文字識(shí)別處理得到第二電子病例報(bào)告表,將所述第二電子病例報(bào)告表輸出。S3:接收所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表,并對(duì)所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表進(jìn)行比較校驗(yàn);若所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表內(nèi)容一致,則將所述第一電子病例報(bào)告表或所述第二電子病例報(bào)告表作為第一暫態(tài)電子病例報(bào)告表輸出;否則將所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表中不一致的內(nèi)容進(jìn)行標(biāo)記后輸出。S4:接收標(biāo)記后輸出的所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表,并對(duì)所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表中標(biāo)記的不 一致的內(nèi)容進(jìn)行人工核對(duì)更正,將人工核對(duì)更正后的所述第一電子病例報(bào)告表或所述第二電子病例報(bào)告表作為終態(tài)病例報(bào)告表輸出至數(shù)據(jù)庫(kù)服務(wù)器存儲(chǔ)。本發(fā)明所述的識(shí)別方法能夠在大大提高紙質(zhì)病例報(bào)告表轉(zhuǎn)換為電子病例報(bào)告表的工作效率的同時(shí),有效減少錯(cuò)誤電子病例報(bào)告表的輸出,提高了臨床病例報(bào)告表識(shí)別系統(tǒng)的識(shí)別準(zhǔn)確性和識(shí)別速度。所述步驟S1和步驟S2分別根據(jù)不同算法對(duì)所述紙質(zhì)病例報(bào)告表進(jìn)行識(shí)別,能夠使病例報(bào)告表圖像在不同算法下得到所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表,能夠增加所述電子病例報(bào)告表對(duì)比單元對(duì)所述第一電子病例報(bào)告表和所述第二電子病例報(bào)告表進(jìn)行比較的準(zhǔn)確性。實(shí)施例12作為本發(fā)明其他實(shí)施的通用型臨床試驗(yàn)電子數(shù)據(jù)獲取方法,在上述通用型臨床試驗(yàn)電子數(shù)據(jù)獲取方法的實(shí)施例的基礎(chǔ)上,,在所述步驟S4之后還包括語法檢查的步驟。S51:接收所述第一暫態(tài)電子病例報(bào)告表,并對(duì)所述第一暫態(tài)電子病例報(bào)告表中的語句進(jìn)行語法檢查,若語法檢查結(jié)果正確則將所述暫態(tài)病例報(bào)告表作為第二暫態(tài)電子病例報(bào)告表輸出;否則將所述第一暫態(tài)電子病例報(bào)告表中經(jīng)過語法檢查不正確的地方進(jìn)行語法錯(cuò)誤標(biāo)記后輸出。S52:接收語法錯(cuò)誤標(biāo)記后輸出的所述第一暫態(tài)電子病例報(bào)告表,并對(duì)所述第一暫態(tài)電子病例報(bào)告表上語法錯(cuò)誤標(biāo)記的內(nèi)容進(jìn)行人工核對(duì),將人工核對(duì)后的所述第一暫態(tài)電子病例報(bào)告表作為第二暫態(tài)電子病例報(bào)告表輸出。所述語法檢查步驟能夠?qū)λ龅谝浑娮硬±龍?bào)告表或所述第二電子病例報(bào)告表中的語句進(jìn)行語法檢查,進(jìn)一步增加了系統(tǒng)的識(shí)別精度。實(shí)施例13作為本發(fā)明其他實(shí)施的通用型臨床試驗(yàn)電子數(shù)據(jù)獲取方法,在上述通用型臨床試驗(yàn)電子數(shù)據(jù)獲取方法的實(shí)施例的基礎(chǔ)上,所述語法檢查步驟之后還包括短語核對(duì)的步驟,S61:接收所述第二暫態(tài)電子病例報(bào)告表,對(duì)所述第二暫態(tài)電子病例報(bào)告表中的語句進(jìn)行隨機(jī)截取得到隨機(jī)短語,并將所述隨機(jī)短語在預(yù)定的數(shù)據(jù)庫(kù)中進(jìn)行查詢,若所述隨機(jī)短語為所述數(shù)據(jù)庫(kù)中存儲(chǔ)的關(guān)鍵詞語或關(guān)鍵語句的全部或一部分,則將所述第二暫態(tài)電子病例報(bào)告表作為終態(tài)電子病例報(bào)告表輸出;否則,對(duì)所述第二暫態(tài)電子病例報(bào)告表中截取的所述隨機(jī)短語進(jìn)行短語核對(duì)錯(cuò)誤標(biāo)記后輸出。S62:接收短語核對(duì)錯(cuò)誤標(biāo)記后輸出的所述第二暫態(tài)電子病例報(bào)告表,并對(duì)所述第二暫態(tài)電子病例報(bào)告表中短語核對(duì)錯(cuò)誤標(biāo)記的所述隨機(jī)短語進(jìn)行人工核對(duì),將人工核對(duì)后的所述第二暫態(tài)電子病例報(bào)告表作為終態(tài)電子病例報(bào)告表輸出。本實(shí)施例能夠?qū)Φ诙簯B(tài)電子病例報(bào)告表中語句的準(zhǔn)確性進(jìn)行校驗(yàn),有效增加了系統(tǒng)的識(shí)別準(zhǔn)確性。實(shí)施例14作為本發(fā)明其他實(shí)施的通用型臨床試驗(yàn)電子數(shù)據(jù)獲取方法,在上述包括步驟S61的通用型臨床試驗(yàn)電子數(shù)據(jù)獲取方法的實(shí)施例的基礎(chǔ)上,所述步驟S61中的數(shù)據(jù)庫(kù)按照以下步驟生成:S5’1:將關(guān)鍵詞語及關(guān)鍵語句預(yù)先存儲(chǔ)到數(shù)據(jù)庫(kù)。S5’2:記錄所述隨機(jī)短語訪問數(shù)據(jù)庫(kù)的次數(shù),若次數(shù)超過預(yù)定的n次,則將所述隨機(jī)短語作為關(guān)鍵詞語或者關(guān)鍵語句存儲(chǔ)到所述數(shù)據(jù)庫(kù)中。該步驟能夠根據(jù)識(shí)別出的關(guān)鍵詞語及關(guān)鍵語句及時(shí)的對(duì)所述數(shù)據(jù)庫(kù)中的關(guān)鍵詞語及關(guān)鍵語句進(jìn)行系統(tǒng)的自動(dòng)補(bǔ)充,具有實(shí)時(shí)更新適用性強(qiáng)的優(yōu)點(diǎn)。顯然,上述實(shí)施例僅僅是為清楚地說明所作的舉例,而并非對(duì)實(shí)施方式的限定。對(duì)于所屬領(lǐng)域的普通技術(shù)人員來說,在上述說明的基礎(chǔ)上還可以做出其它不同形式的變化或變動(dòng)。這里無需也無法對(duì)所有的實(shí)施方式予以窮舉。而由此所引伸出的顯而易見的變化或變動(dòng)仍處于本發(fā)明創(chuàng)造的保護(hù)范圍之中。