技術(shù)總結(jié)
本發(fā)明公開了一種將體檢診斷數(shù)據(jù)轉(zhuǎn)化為疾病標(biāo)簽的方法,包括:(1)對(duì)體檢診斷數(shù)據(jù)進(jìn)行文本分詞和新詞發(fā)現(xiàn)處理,得到詞序列;(2)在詞序列中,提取所需要的疾病詞匯,得到疾病名稱;(3)對(duì)疾病名稱中的同義詞進(jìn)行歸并,得到歸并的疾病名稱;(4)對(duì)疾病名稱進(jìn)行聚類,建立疾病類目樹;(5)根據(jù)歸并的疾病名稱和疾病類目樹進(jìn)行疾病標(biāo)記,得到疾病標(biāo)簽。該方法采用多種自然語言處理技術(shù)挖掘體檢診斷數(shù)據(jù)中疾病結(jié)果,提取其中疾病分類結(jié)構(gòu)并進(jìn)行編碼數(shù)字化,為體檢記錄提供標(biāo)準(zhǔn)疾病名稱標(biāo)簽,從而更直接的描述體檢的結(jié)果并可以為其他大數(shù)據(jù)醫(yī)療服務(wù)。
技術(shù)研發(fā)人員:吳健;周立水;顧盼;邱奇波;鄧水光;李瑩;尹建偉;吳朝暉
受保護(hù)的技術(shù)使用者:浙江大學(xué)
文檔號(hào)碼:201611198280
技術(shù)研發(fā)日:2016.12.22
技術(shù)公布日:2017.05.17