欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于血常規(guī)數(shù)據(jù)的白血病人工智能初篩模型的建立方法及系統(tǒng)

文檔序號:40480930發(fā)布日期:2024-12-31 12:48閱讀:18來源:國知局
基于血常規(guī)數(shù)據(jù)的白血病人工智能初篩模型的建立方法及系統(tǒng)

本發(fā)明涉及醫(yī)學(xué),具體涉及一種基于ai技術(shù)的白血病篩查。


背景技術(shù):

1、白血病是一類造血干細(xì)胞惡性增殖性疾病,主要特征是骨髓中未成熟的血細(xì)胞不受控制的惡性增殖,也是中國十大惡性腫瘤之一。該疾病的發(fā)生與遺傳及環(huán)境污染和不同地域人們生活習(xí)慣的差異等因素具有一定關(guān)系。據(jù)2019年統(tǒng)計,男性死亡率為4.5/10萬,高于3.8/10萬的女性患者。兒童和青少年好發(fā)于5歲以下及5-14歲年齡組,以急性淋巴細(xì)胞白血病最為嚴(yán)重,占兒童腫瘤發(fā)病率及死亡率首位。由此可見,白血病給人民的健康造成了嚴(yán)重的損害,同時也給社會及家庭帶來嚴(yán)重的負(fù)擔(dān)。

2、急性白血病病人往往不會自己知道得了白血病,通常根據(jù)先發(fā)的前期癥狀去醫(yī)院就診,如:感冒發(fā)燒、牙齦出血、皮下出血、貧血等。白血病的初步診斷目前主要是依靠白細(xì)胞形態(tài)學(xué)的檢查,由于工作強度大、連續(xù)工作導(dǎo)致疲勞等原因,使得人工的檢驗效率低下。因此,快速準(zhǔn)確篩查白血病對于挽救病人生命有著重大的臨床意義。


技術(shù)實現(xiàn)思路

1、為了克服上述技術(shù)缺陷,本發(fā)明的第一個方面提供一種基于血常規(guī)數(shù)據(jù)的白血病人工智能初篩模型的建立方法,其包括:

2、步驟s1:采用分析模塊分別訓(xùn)練若干訓(xùn)練數(shù)據(jù)庫,依次得到若干對應(yīng)的規(guī)則集,并將若干假陰率<5%的規(guī)則集合并匯總得到最終的規(guī)則集,即白血病風(fēng)險篩選模型;

3、步驟s2:白血病風(fēng)險篩選模型對驗證數(shù)據(jù)庫進行統(tǒng)計得到假陰率,假陰率<5%的規(guī)則集判斷為驗證達標(biāo)的規(guī)則集,如果規(guī)則集的假陰率≥5%,則返回步驟s2,調(diào)整啟動規(guī)則訓(xùn)練前的設(shè)置,再次啟動規(guī)則訓(xùn)練,得到新的規(guī)則集,直至滿足假陰率<5%;

4、步驟s3:對白血病風(fēng)險篩選模型進行多次迭代,通過多輪的模型計算尋找出在特定迭代次數(shù)、計算時間限制下的白血病風(fēng)險篩選模型的最優(yōu)模型。

5、進一步地,在步驟s1之前,進一步包括:

6、步驟s11:準(zhǔn)備病歷數(shù)據(jù);從醫(yī)院電子病歷平臺采集患者電子病歷,搜集診斷結(jié)果為白血病患者與非白血病患者的電子病歷;

7、步驟s12:醫(yī)學(xué)特征提?。簩Σ襟Es11中得到的合格的電子病歷數(shù)據(jù)進行白血病醫(yī)學(xué)特征提取,提取醫(yī)學(xué)特征及醫(yī)學(xué)特征值;所述白血病醫(yī)學(xué)特征包括基本信息、血常規(guī)項目、血常規(guī)研究參數(shù)、xn儀器q-flag信息;

8、步驟s13:特征數(shù)據(jù)標(biāo)準(zhǔn)化及數(shù)據(jù)清洗:對步驟s12得到的白血病臨床及檢驗的大數(shù)據(jù)資料進行特征數(shù)據(jù)標(biāo)準(zhǔn)化,去除有缺失值的數(shù)據(jù),得到標(biāo)準(zhǔn)數(shù)據(jù)樣本,標(biāo)準(zhǔn)數(shù)據(jù)樣本包括標(biāo)準(zhǔn)醫(yī)學(xué)特征數(shù)據(jù)集及標(biāo)準(zhǔn)診斷結(jié)果集,標(biāo)準(zhǔn)醫(yī)學(xué)特征數(shù)據(jù)集與標(biāo)準(zhǔn)診斷結(jié)果集中的數(shù)據(jù)是一一對應(yīng)關(guān)系;

9、步驟s14:特征篩選:對標(biāo)準(zhǔn)數(shù)據(jù)利用laboman?ai軟件進行統(tǒng)計、規(guī)則挖掘,篩選出與白血病相關(guān)的特征參數(shù),所述與白血病相關(guān)的特征參數(shù)包括:總標(biāo)本數(shù)、真實陽性標(biāo)本數(shù)、真實陰性標(biāo)本數(shù)、預(yù)測陽性標(biāo)本數(shù)、預(yù)測陰性標(biāo)本數(shù)、假陰率、假陽率、真陰率、真陽率、放行率、總有效率、陽性預(yù)示值、陰性預(yù)示值、特異度、靈敏度、約登指數(shù)、假陰率-置信區(qū)間、t檢驗、重點病例覆蓋率,19項統(tǒng)計指標(biāo);

10、步驟s15:數(shù)據(jù)集拆分:對數(shù)據(jù)進行預(yù)切分,將數(shù)據(jù)平分為若干訓(xùn)練數(shù)據(jù)庫和一驗證數(shù)據(jù)庫。

11、進一步地,所述血常規(guī)項目包括35個具體特征字段,詳見下表:

12、

13、

14、所述血常規(guī)研究參數(shù)包括52個具體特征字段,詳見下表:

15、

16、

17、

18、所述xn儀器q-flag信息包括14個具體特征字段,詳見下表:

19、 項目名稱 解釋 blasts/abn?lympho? 存在母細(xì)胞的可能性/淋巴細(xì)胞異常的可能性 blasts?* 存在爆炸的可能性 abn?lympho?* 淋巴細(xì)胞異常的可能性 left?shift? 左移的可能性 atypical?lympho? 非典型淋巴細(xì)胞的可能性 nrbc?present 高有核紅細(xì)胞計數(shù) ig?present 未成熟粒細(xì)胞增多 rbc?agglutination? 紅細(xì)胞凝集的可能性 turbidity/hgb?interf? 乳糜瀉對hgb影響的可能性 iron?deficiency? 缺鐵的可能性 hgb?defect? hgb異常的可能性 fragments? 紅細(xì)胞碎片化的可能性 anemia 貧血 plt?clumps? plt結(jié)塊的可能性

20、。

21、進一步地,步驟s13包括:

22、s131特征數(shù)據(jù)標(biāo)準(zhǔn)化:建立標(biāo)準(zhǔn)庫和白血病專業(yè)數(shù)據(jù)庫,基于白血病專業(yè)數(shù)據(jù)庫人工構(gòu)建血常規(guī)項目、研究參數(shù)、q-flag信息及其他醫(yī)學(xué)實體名詞標(biāo)準(zhǔn)庫,標(biāo)準(zhǔn)庫中包含每個醫(yī)學(xué)名詞的標(biāo)準(zhǔn)名稱及出現(xiàn)過的相似名稱,并進行編碼便于唯一標(biāo)識,形成特征標(biāo)準(zhǔn)庫,對步驟s12提取的醫(yī)學(xué)特征和醫(yī)學(xué)特征值,將其中同一種特征不同的表述對照特征標(biāo)準(zhǔn)庫進行替換,統(tǒng)一特征描述,得到標(biāo)準(zhǔn)化的醫(yī)學(xué)特征數(shù)據(jù),具體的,對醫(yī)學(xué)特征值的替換,主要為符號、字母、文字、單位、醫(yī)學(xué)代碼的替換,統(tǒng)一符號、字母、文字、單位、醫(yī)學(xué)代碼;

23、s132數(shù)據(jù)清洗:對數(shù)據(jù)進行以下預(yù)處理:(1)標(biāo)注特征數(shù)據(jù)和標(biāo)簽信息;(2)標(biāo)本關(guān)鍵特征數(shù)據(jù)信息丟失較多,丟棄該標(biāo)本;(3)標(biāo)本的標(biāo)簽信息缺失,丟棄該標(biāo)本;(4)對空值字段使用該字段的平均值填充;對于缺失比例非常大的字段,如>=80%的,丟棄該字段。

24、進一步地,所述若干訓(xùn)練數(shù)據(jù)庫包括訓(xùn)練數(shù)據(jù)庫a、訓(xùn)練數(shù)據(jù)庫b、訓(xùn)練數(shù)據(jù)庫c,所述步驟s1包括:(1)啟動規(guī)則訓(xùn)練前,在分析模塊中預(yù)先設(shè)置:模型訓(xùn)練強度、組合條件數(shù)、最大訓(xùn)練輪次、假陰率閾值、運行時限、自動合并冗余規(guī)則開啟或關(guān)閉、重點必中的開啟或關(guān)閉,7項設(shè)置;將訓(xùn)練數(shù)據(jù)庫a導(dǎo)入分析模塊;然后啟動規(guī)則訓(xùn)練,運行結(jié)束后得到初步規(guī)則集初a;對于得到的規(guī)則集初a,使用單規(guī)則過擬合、單規(guī)則假陰率、單規(guī)則假陽率,3項指標(biāo)進行優(yōu)化規(guī)則;(2)根據(jù)挖掘的規(guī)則集,查看統(tǒng)計結(jié)果,如果假陰率低于5%的規(guī)則集判斷為訓(xùn)練達標(biāo)的規(guī)則集;如果沒有達到假陰率低于5%,則返回步驟(1),調(diào)整啟動規(guī)則訓(xùn)練前的設(shè)置,修改組合條件數(shù)、假陰率閾值、運行時限,再次啟動規(guī)則訓(xùn)練,直至滿足假陰率低于5%,得到最終的規(guī)則集a;(3)重復(fù)步驟s1,分別利用數(shù)據(jù)庫b、數(shù)據(jù)庫c得到規(guī)則集b、規(guī)則集c;(4)最后將規(guī)則集a、規(guī)則集b、規(guī)則集c匯總得到最終的規(guī)則集,稱為白血病風(fēng)險篩查模型。

25、本技術(shù)的第二個方面提供一種基于血常規(guī)數(shù)據(jù)的白血病人工智能初篩模型的建立系統(tǒng),其包括:

26、分析模塊,所述分析模塊用于訓(xùn)練所述若干訓(xùn)練數(shù)據(jù)庫,依次得到若干對應(yīng)的規(guī)則集,并將若干假陰率<5%的規(guī)則集合并匯總得到最終的規(guī)則集,即白血病風(fēng)險篩選模型;還用于采用所述白血病風(fēng)險篩選模型對驗證數(shù)據(jù)庫進行統(tǒng)計得到假陰率,假陰率<5%的規(guī)則集判斷為驗證達標(biāo)的規(guī)則集,如果規(guī)則集的假陰率≥5%,則調(diào)整啟動規(guī)則訓(xùn)練前的設(shè)置,再次啟動規(guī)則訓(xùn)練,得到新的規(guī)則集,直至滿足假陰率<5%;

27、迭代模塊,所述迭代模塊用于對白血病風(fēng)險篩選模型進行多次迭代,通過多輪的模型計算尋找出在特定迭代次數(shù)、計算時間限制下的白血病風(fēng)險篩選模型的最優(yōu)模型。

28、進一步地,所述分析模塊包括由n組子模型、n組統(tǒng)計模塊及一組選擇模塊組成;每一所述子模型包括決策樹算法模塊,子模型通過對特征數(shù)據(jù)進行劃分,根據(jù)決策樹算法模塊不斷構(gòu)建適合的規(guī)則,并重復(fù)決策樹算法模塊步驟若干次,選擇出當(dāng)前輪次的合格模型,通過n組子模型的協(xié)同計算,最終統(tǒng)計并選擇出一組最優(yōu)的模型;統(tǒng)計模塊用于以一組模型挖掘得出的規(guī)則組作為輸入,根據(jù)樣本集中的實際標(biāo)注標(biāo)簽數(shù)據(jù),計算各種統(tǒng)計學(xué)指標(biāo);選擇模塊用于以一系列統(tǒng)計模塊的統(tǒng)計學(xué)指標(biāo)作為輸入,選出一系列統(tǒng)計數(shù)據(jù)對應(yīng)的子模型中具有最優(yōu)假陰率、假陽率指標(biāo)的一組子模型。

29、進一步地,基于血常規(guī)數(shù)據(jù)的白血病人工智能初篩模型的建立系統(tǒng)進一步包括數(shù)據(jù)采集與處理模塊,所述數(shù)據(jù)采集與處理模塊包括:

30、病歷數(shù)據(jù)采集模塊,所述病歷數(shù)據(jù)采集模塊用于從醫(yī)院電子病歷平臺采集患者電子病歷,搜集診斷結(jié)果為白血病患者與非白血病患者的電子病歷;

31、醫(yī)學(xué)特征提取模塊,所述醫(yī)學(xué)特征提取模塊用于對病歷數(shù)據(jù)采集模塊得到的合格的電子病歷數(shù)據(jù)進行白血病醫(yī)學(xué)特征提取,提取醫(yī)學(xué)特征及醫(yī)學(xué)特征值;所述白血病醫(yī)學(xué)特征包括基本信息、血常規(guī)項目、血常規(guī)研究參數(shù)、xn儀器q-flag信息;所述血常規(guī)研究參數(shù)包括52個具體特征字段,詳見下表:

32、

33、

34、

35、所述xn儀器q-flag信息包括14個具體特征字段,詳見下表:

36、 項目名稱 解釋 blasts/abn?lympho? 存在母細(xì)胞的可能性/淋巴細(xì)胞異常的可能性 blasts?* 存在爆炸的可能性 abn?lympho?* 淋巴細(xì)胞異常的可能性 left?shift? 左移的可能性 atypical?lympho? 非典型淋巴細(xì)胞的可能性 nrbc?present 高有核紅細(xì)胞計數(shù) ig?present 未成熟粒細(xì)胞增多 rbc?agglutination? 紅細(xì)胞凝集的可能性 turbidity/hgb?interf? 乳糜瀉對hgb影響的可能性 iron?deficiency? 缺鐵的可能性 hgb?defect? hgb異常的可能性 fragments? 紅細(xì)胞碎片化的可能性 anemia 貧血 plt?clumps? plt結(jié)塊的可能性

37、特征數(shù)據(jù)標(biāo)準(zhǔn)化及數(shù)據(jù)清洗模塊,所述特征數(shù)據(jù)標(biāo)準(zhǔn)化及數(shù)據(jù)清洗模塊用于對白血病臨床及檢驗的大數(shù)據(jù)資料進行特征數(shù)據(jù)標(biāo)準(zhǔn)化,去除有缺失值的數(shù)據(jù),得到標(biāo)準(zhǔn)數(shù)據(jù)樣本,標(biāo)準(zhǔn)數(shù)據(jù)樣本包括標(biāo)準(zhǔn)醫(yī)學(xué)特征數(shù)據(jù)集及標(biāo)準(zhǔn)診斷結(jié)果集,標(biāo)準(zhǔn)醫(yī)學(xué)特征數(shù)據(jù)集與標(biāo)準(zhǔn)診斷結(jié)果集中的數(shù)據(jù)是一一對應(yīng)關(guān)系;

38、特征篩選模塊,所述特征篩選模塊用于對標(biāo)準(zhǔn)數(shù)據(jù)利用laboman?ai軟件進行統(tǒng)計、規(guī)則挖掘,篩選出與白血病相關(guān)的特征參數(shù),所述與白血病相關(guān)的特征參數(shù)包括:總標(biāo)本數(shù)、真實陽性標(biāo)本數(shù)、真實陰性標(biāo)本數(shù)、預(yù)測陽性標(biāo)本數(shù)、預(yù)測陰性標(biāo)本數(shù)、假陰率、假陽率、真陰率、真陽率、放行率、總有效率、陽性預(yù)示值、陰性預(yù)示值、特異度、靈敏度、約登指數(shù)、假陰率-置信區(qū)間、t檢驗、重點病例覆蓋率,19項統(tǒng)計指標(biāo);

39、數(shù)據(jù)集拆分模塊,所述數(shù)據(jù)集拆分模塊用于對數(shù)據(jù)進行預(yù)切分,將數(shù)據(jù)平分為若干訓(xùn)練數(shù)據(jù)庫和一驗證數(shù)據(jù)庫。

40、進一步地,特征數(shù)據(jù)標(biāo)準(zhǔn)化及數(shù)據(jù)清洗包括:

41、特征數(shù)據(jù)標(biāo)準(zhǔn)化模塊,所述特征數(shù)據(jù)標(biāo)準(zhǔn)化模塊用于建立標(biāo)準(zhǔn)庫和白血病專業(yè)數(shù)據(jù)庫,基于白血病專業(yè)數(shù)據(jù)庫人工構(gòu)建血常規(guī)項目、研究參數(shù)、q-flag信息及其他醫(yī)學(xué)實體名詞標(biāo)準(zhǔn)庫,標(biāo)準(zhǔn)庫中包含每個醫(yī)學(xué)名詞的標(biāo)準(zhǔn)名稱及出現(xiàn)過的相似名稱,并進行編碼便于唯一標(biāo)識,形成特征標(biāo)準(zhǔn)庫,對提取的醫(yī)學(xué)特征和醫(yī)學(xué)特征值,將其中同一種特征不同的表述對照特征標(biāo)準(zhǔn)庫進行替換,統(tǒng)一特征描述,得到標(biāo)準(zhǔn)化的醫(yī)學(xué)特征數(shù)據(jù),具體的,對醫(yī)學(xué)特征值的替換,主要為符號、字母、文字、單位、醫(yī)學(xué)代碼的替換,統(tǒng)一符號、字母、文字、單位、醫(yī)學(xué)代碼;

42、數(shù)據(jù)清洗模塊,所述數(shù)據(jù)清洗模塊用于對數(shù)據(jù)進行以下預(yù)處理:(1)標(biāo)注特征數(shù)據(jù)和標(biāo)簽信息;(2)標(biāo)本關(guān)鍵特征數(shù)據(jù)信息丟失較多,丟棄該標(biāo)本;(3)標(biāo)本的標(biāo)簽信息缺失,丟棄該標(biāo)本;(4)對空值字段使用該字段的平均值填充;對于缺失比例非常大的字段,如≥80%的,丟棄該字段。

43、進一步地,所述若干訓(xùn)練數(shù)據(jù)庫包括訓(xùn)練數(shù)據(jù)庫a、訓(xùn)練數(shù)據(jù)庫b、訓(xùn)練數(shù)據(jù)庫c,所述分析模塊用于:(1)啟動規(guī)則訓(xùn)練前,在分析模塊中預(yù)先設(shè)置:模型訓(xùn)練強度、組合條件數(shù)、最大訓(xùn)練輪次、假陰率閾值、運行時限、自動合并冗余規(guī)則開啟或關(guān)閉、重點必中的開啟或關(guān)閉,7項設(shè)置;將訓(xùn)練數(shù)據(jù)庫a導(dǎo)入分析模塊;然后啟動規(guī)則訓(xùn)練,運行結(jié)束后得到初步規(guī)則集初a;對于得到的規(guī)則集初a,使用單規(guī)則過擬合、單規(guī)則假陰率、單規(guī)則假陽率,3項指標(biāo)進行優(yōu)化規(guī)則;(2)根據(jù)挖掘的規(guī)則集,查看統(tǒng)計結(jié)果,如果假陰率<5%的規(guī)則集判斷為訓(xùn)練達標(biāo)的規(guī)則集;如果假陰率≥5%,則返回步驟(1),調(diào)整啟動規(guī)則訓(xùn)練前的設(shè)置,修改組合條件數(shù)、假陰率閾值、運行時限,再次啟動規(guī)則訓(xùn)練,直至滿足假陰率<5%,得到最終的規(guī)則集a;(3)重復(fù)(1)和(2),分別利用數(shù)據(jù)庫b、數(shù)據(jù)庫c得到規(guī)則集b、規(guī)則集c;(4)最后將規(guī)則集a、規(guī)則集b、規(guī)則集c匯總得到最終的規(guī)則集,稱為白血病風(fēng)險篩查模型。

44、采用了上述技術(shù)方案后,與現(xiàn)有技術(shù)相比,具有以下有益效果:

45、本技術(shù)利用決策樹算法的學(xué)習(xí)能力,把數(shù)據(jù)分為若干訓(xùn)練數(shù)據(jù)組和一驗證數(shù)據(jù)組,若干訓(xùn)練數(shù)據(jù)組用于規(guī)則的建立,這樣就可以得到多套規(guī)則,最終合并規(guī)則就可實現(xiàn)假陰率的降低,達到假陰性率低于1.5%,遠(yuǎn)優(yōu)越于假陰率低于5%的統(tǒng)計要求。采用本發(fā)明建立的白血病人工智能初篩模型能夠快速、準(zhǔn)確地篩查出白血病,對于挽救病人生命有著重大的臨床意義。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
门头沟区| 闽清县| 裕民县| 湾仔区| 黄冈市| 萍乡市| 张家口市| 攀枝花市| 梓潼县| 皮山县| 彭州市| 申扎县| 景宁| 彭阳县| 麻栗坡县| 运城市| 吴旗县| 邓州市| 吐鲁番市| 阳朔县| 建瓯市| 鹿邑县| 蒙山县| 阳谷县| 赣州市| 文成县| 武邑县| 中方县| 乌拉特前旗| 延川县| 花莲市| 滕州市| 铜鼓县| 黎平县| 霍山县| 尉氏县| 庆安县| 遵化市| 镇沅| 龙川县| 大庆市|