技術領域:
本發(fā)明涉及一種中醫(yī)方藥數(shù)據(jù)分析挖掘系統(tǒng)。
背景技術:
:
中醫(yī)藥是中華民族的瑰寶,是重要的社會資源。而中醫(yī)藥的最主要的載體就是中藥方藥。中醫(yī)方藥作為從歷代中醫(yī)先賢智慧的結(jié)晶,得到了越來越多的重視。正因如此,隨著現(xiàn)在科學技術的發(fā)展,對原始的中醫(yī)方藥作進行分析挖掘以得到深層次的信息也愈加重要。但是現(xiàn)有的分析方法局限于利用一些現(xiàn)有的分析方法移植到中藥領域進行分析,或者是雖然專用于中藥,但是分析維度局限性較大,無法分析出各個方藥之間的潛在信息?,F(xiàn)有技術對此并沒有解決之策。
技術實現(xiàn)要素:
:
本發(fā)明的目的就是針對現(xiàn)有技術存在的上述缺點,提供了一種中醫(yī)方藥數(shù)據(jù)分析挖掘系統(tǒng),系統(tǒng)設計合理,能夠得到深層次的中醫(yī)方藥信息,解決了現(xiàn)有技術中存在的問題。
本發(fā)明為解決上述技術問題所采用的技術方案是:
一種中醫(yī)方藥數(shù)據(jù)分析挖掘系統(tǒng),包括方藥數(shù)據(jù)庫、數(shù)據(jù)輸入模塊、標準輸出模塊、數(shù)據(jù)分析挖掘模塊;
所述數(shù)據(jù)輸入模塊用于輸入方藥數(shù)據(jù);
所述方藥數(shù)據(jù)庫用于接收數(shù)據(jù)輸入模塊的方藥數(shù)據(jù),并為各個模塊提供方藥數(shù)據(jù);
所述標準輸出模塊用于從方藥數(shù)據(jù)庫中提取方藥數(shù)據(jù)并按照指定格式輸出格式數(shù)據(jù);
所述數(shù)據(jù)分析挖掘模塊用于從方藥數(shù)據(jù)庫獲取方藥數(shù)據(jù),并對方藥數(shù)據(jù)進行數(shù)據(jù)分析挖掘處理。
優(yōu)選的,所述方藥數(shù)據(jù)包括如下五個維度:方劑名稱、指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀。
優(yōu)選的,所述標準輸出模塊輸出適于sas、spss的格式數(shù)據(jù)。
優(yōu)選的,所述數(shù)據(jù)分析挖掘模塊包括分析模塊,聚類模塊、關聯(lián)模塊、組合模塊;
所述分析模塊用于對方藥數(shù)據(jù)分別根據(jù)指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀分別進行成組分析;
所述聚類模塊根據(jù)設定聚類閾值,在指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀中五個維度中綜合判斷,對藥物進行成組分析;
所述關聯(lián)模塊根據(jù)分析模塊得到的指定中藥成組分析情況,對藥物出現(xiàn)頻次超過設定閾值的藥物進行與其他藥物的網(wǎng)絡聯(lián)系統(tǒng)計;
所述組合模塊根據(jù)分析模塊得到的藥物分析情況,對藥物出現(xiàn)頻次超過設定值的藥物分別分析與其他藥物同時出現(xiàn)的頻次。
優(yōu)選的,所述關聯(lián)模塊給出的各個藥物后統(tǒng)計該藥物出現(xiàn)頻次和與該藥物有網(wǎng)絡聯(lián)系的藥物數(shù)量。
優(yōu)選的,所述聚類閾值包括數(shù)值閾值模塊和維度描述比較模塊,所述維度描述比較模塊用于分別將不同方藥中的指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀進行相似度對比,若相似度達到設定值,則將信息傳遞給數(shù)值閾值模塊;所述數(shù)值閾值模塊統(tǒng)計指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀中經(jīng)維度描述比較模塊比較后,相似度高的維度的數(shù)目,并判斷是否達到聚類閾值的要求。
與現(xiàn)有技術相比,本發(fā)明的優(yōu)點是:優(yōu)化系統(tǒng)本身功能,提供對外的接口,即標準輸出模塊可以輸出適合sas和spss的格式數(shù)據(jù);提供不同的分析維度進行數(shù)據(jù)分析,分析模塊提供原始的分析基礎,聚類模塊能夠在指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀五個維度內(nèi)尋找相切和的點,并把這些點根據(jù)聚類閾值的限制,揭開方藥數(shù)據(jù)之間的聯(lián)系,而關聯(lián)模塊和組合模塊用于對一些高頻次出現(xiàn)的藥物進行數(shù)據(jù)挖掘,并得到和其相關的其他藥物的組合信息。
附圖說明:
圖1為本發(fā)明的示意圖。
具體實施方式:
為能清楚說明本方案的技術特點,下面通過具體實施方式,并結(jié)合其附圖,對本發(fā)明進行詳細闡述。
如圖1所示,一種中醫(yī)方藥數(shù)據(jù)分析挖掘系統(tǒng),包括方藥數(shù)據(jù)庫、數(shù)據(jù)輸入模塊、標準輸出模塊、數(shù)據(jù)分析挖掘模塊;
所述數(shù)據(jù)輸入模塊用于輸入方藥數(shù)據(jù);
所述方藥數(shù)據(jù)庫用于接收數(shù)據(jù)輸入模塊的方藥數(shù)據(jù),并為各個模塊提供方藥數(shù)據(jù);
所述標準輸出模塊用于從方藥數(shù)據(jù)庫中提取方藥數(shù)據(jù)并按照指定格式輸出格式數(shù)據(jù);
所述數(shù)據(jù)分析挖掘模塊用于從方藥數(shù)據(jù)庫獲取方藥數(shù)據(jù),并對方藥數(shù)據(jù)進行數(shù)據(jù)分析挖掘處理。實現(xiàn)方藥數(shù)據(jù)的輸入和輸出。
所述方藥數(shù)據(jù)包括方劑名稱、指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀。通過設定方藥數(shù)據(jù)的范圍,能夠強化輸入信息的有效性,也能便于后期進行數(shù)據(jù)分析挖掘時,基礎數(shù)據(jù)的充足。
所述標準輸出模塊輸出適于sas、spss的格式數(shù)據(jù)。提供本系統(tǒng)與其他傳統(tǒng)系統(tǒng)的一個輸出口。
所述數(shù)據(jù)分析挖掘模塊包括分析模塊,聚類模塊、關聯(lián)模塊、組合模塊;
所述分析模塊用于對方藥數(shù)據(jù)分別根據(jù)指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀分別進行成組分析;分析模塊主要是根據(jù)指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀對方藥進行成組分析,根據(jù)藥物進行成組分析能夠解析出各個藥物在所有方藥中出現(xiàn)的頻次;根據(jù)中醫(yī)證候進行成組分析能夠看出各個中醫(yī)癥候有哪些方藥可以進行治療;根據(jù)西醫(yī)疾病進行成組分析則能夠根據(jù)西醫(yī)疾病的名稱與對其有治療效果的方藥對應起來;根據(jù)中醫(yī)疾病進行成組分析則能夠根據(jù)中醫(yī)疾病的名稱與對其有治療效果的方藥對應起來;根據(jù)根據(jù)中醫(yī)癥狀進行成組分析能夠看出各個中醫(yī)癥狀有哪些方藥可以進行治療。
所述聚類模塊根據(jù)設定聚類閾值,在指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀中五個維度中綜合判斷,對藥物進行成組分析;所述聚類閾值包括數(shù)值閾值模塊和維度描述比較模塊,所述數(shù)值閾值模塊為指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀中相似度高的數(shù)目;所述維度描述比較模塊用于分別將不同方藥中的指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀進行相似度對比。進行多個維度的判斷能夠識別出哪些藥物與相應的中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀分別對應,從而挖掘出一個深層次的對應關系。由此可以得到,哪一味或者哪幾味藥對相應的中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀有最核心的作用。數(shù)值閾值模塊規(guī)定了在如下五個維度:指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥候,相似度高的數(shù)目為多少時,對方藥數(shù)據(jù)進行成組分析;維度描述比較模塊用于對指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥候逐個進行對比,并確定是否近似,若近似度達到80%或者以上,則將此維度計入數(shù)值閾值模塊。
所述關聯(lián)模塊根據(jù)分析模塊得到的指定中藥成組分析情況,對藥物出現(xiàn)頻次超過設定閾值的藥物進行與其他藥物的網(wǎng)絡聯(lián)系統(tǒng)計;
所述組合模塊根據(jù)分析模塊得到的藥物分析情況,對藥物出現(xiàn)頻次超過設定值的藥物分別分析與其他藥物同時出現(xiàn)的頻次。
所述關聯(lián)模塊給出的各個藥物后統(tǒng)計該藥物出現(xiàn)頻次和與該藥物有網(wǎng)絡聯(lián)系的藥物數(shù)量。關聯(lián)模塊和組合模塊用于對一些高頻次出現(xiàn)的藥物進行數(shù)據(jù)挖掘,并得到和其相關的其他藥物的組合信息。
本系統(tǒng)用于中醫(yī)方藥的數(shù)據(jù)處理以及分析挖掘工作,首先通過數(shù)據(jù)輸入模塊解決了數(shù)據(jù)輸入的問題,并且在數(shù)據(jù)輸入模塊通過設置子目錄解決了數(shù)據(jù)輸入規(guī)范化的問題;而數(shù)據(jù)輸出模塊則解決了內(nèi)部數(shù)據(jù)與其他分析軟件數(shù)據(jù)交互的問題;數(shù)據(jù)分析挖掘模塊則立足于方藥的基礎數(shù)據(jù),通過其內(nèi)部的分析模塊提供基礎的分析數(shù)據(jù),在此基礎上,聚類模塊立足于系統(tǒng)的整體分析,在指定中藥、中醫(yī)證候、西醫(yī)疾病、中醫(yī)疾病、中醫(yī)癥狀五個維度內(nèi)尋找各個方藥相切和的點,并把這些點根據(jù)聚類閾值的限制,給出最終的聚類結(jié)果,為研究人員發(fā)現(xiàn)其內(nèi)在聯(lián)系,提供底層的數(shù)據(jù)和思路;而關聯(lián)模塊和組合模塊用于對一些高頻次出現(xiàn)的藥物進行數(shù)據(jù)挖掘,并得到和其相關的其他藥物的組合信息,從而為某些疾病的治療提供一基礎性方藥,并為各個藥物之間存在的協(xié)同等作用提供數(shù)據(jù)基礎和依據(jù)。
上述具體實施方式不能作為對本發(fā)明保護范圍的限制,對于本技術領域的技術人員來說,對本發(fā)明實施方式所做出的任何替代改進或變換均落在本發(fā)明的保護范圍內(nèi)。
本發(fā)明未詳述之處,均為本技術領域技術人員的公知技術。