專利名稱:一種大黃魚(yú)刺激隱核蟲(chóng)病害程度的判別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及大黃魚(yú),尤其是涉及一種大黃魚(yú)刺激隱核蟲(chóng)病害程度的判別方法。
背景技術(shù):
刺激隱核蟲(chóng)是目前嚴(yán)重威脅海洋魚(yú)類的一種傳播性極強(qiáng)的寄生蟲(chóng),已被列為農(nóng)業(yè)部2008年12月11日發(fā)布的新版《一、二、三類動(dòng)物疫病病種名錄》中的二類動(dòng)物疫病。特別是該病給大黃魚(yú)養(yǎng)殖產(chǎn)業(yè)帶來(lái)了嚴(yán)重?fù)p失。例如,2005年起,刺激隱核蟲(chóng)病及細(xì)菌性繼發(fā)感染每年給大黃魚(yú)養(yǎng)殖產(chǎn)業(yè)帶來(lái)了超過(guò)3億元的經(jīng)濟(jì)損失。大黃魚(yú)刺激隱核蟲(chóng)病的嚴(yán)重暴發(fā)流行與我國(guó)大黃魚(yú)主產(chǎn)區(qū)這一動(dòng)態(tài)、不穩(wěn)定的開(kāi)放復(fù)雜養(yǎng)殖生態(tài)系統(tǒng)密切相關(guān),受養(yǎng)殖海域的水文、物理、化學(xué)及生物因子的多重影響明顯。例如,刺激隱核蟲(chóng)病的季節(jié)性流行規(guī)律直接與氣溫和水溫等氣候條件的周年變化相關(guān);鹽度、溶解氧、水深、水流速度等水文物理?xiàng)l件以及COD、氨氮、亞硝酸鹽和硝酸鹽等水質(zhì)因子直接反映著養(yǎng)殖海區(qū)的水環(huán)境質(zhì)量, 并影響著刺激隱核蟲(chóng)感染附著、增殖暴發(fā)乃至流行進(jìn)程。流行病學(xué)研究表明,大黃魚(yú)刺激隱核蟲(chóng)病發(fā)生及其分布具有明顯的時(shí)空差異,不同海域或同一海域不同養(yǎng)殖水環(huán)境時(shí)期,該病發(fā)生進(jìn)程與嚴(yán)重程度明顯不同。生產(chǎn)中,養(yǎng)殖戶常在刺激隱核蟲(chóng)病發(fā)季節(jié)適時(shí)進(jìn)行拖排作業(yè),將漁排轉(zhuǎn)移到低發(fā)病率的較安全海區(qū), 在一定程度上可以避免刺激隱核蟲(chóng)病造成的重大損失。然而,養(yǎng)殖戶自身對(duì)于環(huán)境因子與疾病發(fā)生關(guān)系的認(rèn)知是感性而片面的、定性而非定量的、相對(duì)模糊和不精確的!如果能闡明養(yǎng)殖水環(huán)境因子與疾病發(fā)生的內(nèi)在定量關(guān)系,準(zhǔn)確理解刺激隱核蟲(chóng)病發(fā)生的時(shí)空變化規(guī)律,將有助于指導(dǎo)養(yǎng)殖戶對(duì)大黃魚(yú)宜養(yǎng)海域的選擇,并在刺激隱核蟲(chóng)病高發(fā)期間適時(shí)移排、 適地安置、布局優(yōu)化,具有重大的產(chǎn)業(yè)應(yīng)用前景。雖然我國(guó)自上世紀(jì)90年代就開(kāi)展了大黃魚(yú)刺激隱核蟲(chóng)病相關(guān)的流行病學(xué)研究探索,2005年,我國(guó)系統(tǒng)開(kāi)展了大黃魚(yú)主產(chǎn)區(qū)的環(huán)境監(jiān)測(cè)和疾病監(jiān)測(cè)工作,迄今已積累了大量的水環(huán)境因子監(jiān)測(cè)數(shù)據(jù)和疾病觀測(cè)數(shù)據(jù),但是至今仍主要偏重于定性解釋,在大黃魚(yú)刺激隱核蟲(chóng)病與環(huán)境因子之間的定量分析方面的研究工作十分缺乏,我國(guó)已有依據(jù)透明度、溫度和平均風(fēng)速對(duì)大黃魚(yú)養(yǎng)殖疾病(所有疾病)的預(yù)測(cè)方法(中國(guó)專利200710068792. 6)。 但是,大黃魚(yú)養(yǎng)殖疾病種類多樣,流行特點(diǎn)各異,特別是同一時(shí)間點(diǎn)內(nèi)多種疾病并發(fā)時(shí)所涉及的環(huán)境因子效應(yīng)非常復(fù)雜,影響不同疾病的主效因子不完全相同,依據(jù)特定的水質(zhì)因子對(duì)所有疾病實(shí)施預(yù)測(cè)難度較大。而且水質(zhì)對(duì)疾病影響很可能是一種非線性的關(guān)系,上述專利采用的是線性模型的擬合,準(zhǔn)確性較低,而且沒(méi)有考慮到其他因子的影響,比較片面。用大量的因子來(lái)分析對(duì)疾病的影響,并篩選對(duì)疾病影響權(quán)重較大的因子,用這些因子來(lái)預(yù)測(cè)疾病的發(fā)生嚴(yán)重程度是個(gè)比較合理、周全的思路。而且目前用機(jī)器學(xué)習(xí)方法來(lái)分析非線性問(wèn)題,分析大量因子對(duì)某些事件的影響并預(yù)測(cè)某些事件可能發(fā)生的等級(jí)比較先進(jìn)、合理、準(zhǔn)確性高,并且也有不少的專利報(bào)導(dǎo),如西北電網(wǎng)有限公司所發(fā)明的《基于神經(jīng)網(wǎng)絡(luò)的風(fēng)速預(yù)測(cè)方法》(中國(guó)專利200910219123.31);浙江大學(xué)發(fā)明的《一種風(fēng)電場(chǎng)短期風(fēng)速預(yù)測(cè)方法》 (中國(guó)專利201019146035.5);中國(guó)石油化工股份有限公司發(fā)明的《基于支持向量機(jī)的熱裂解產(chǎn)物收率的預(yù)測(cè)方法》(中國(guó)專利200810225363.X);北京大學(xué)發(fā)明的《基于對(duì)比模式的隨機(jī)森林分類方法和分類器》(中國(guó)專利201010265846.X)等等,而目前還沒(méi)有報(bào)導(dǎo)用機(jī)器學(xué)習(xí)法分析并預(yù)測(cè)水質(zhì)因子對(duì)水產(chǎn)動(dòng)物疾病發(fā)生的影響,再者很多文獻(xiàn)表明隨機(jī)森林法在分類、預(yù)測(cè)性能上好過(guò)與其他方法。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種大黃魚(yú)刺激隱核蟲(chóng)病害程度的判別方法。本發(fā)明包括以下步驟1)數(shù)據(jù)預(yù)處理,具體方法如下(1)將可能引發(fā)刺激隱核蟲(chóng)病的水環(huán)境因子分類,具體方法如下從水環(huán)境監(jiān)測(cè)數(shù)據(jù)中選取14個(gè)可能影響刺激隱核蟲(chóng)病發(fā)生的水文、氣候、物理、 化學(xué)、生物等影響因子年份、月份、監(jiān)測(cè)站位、水溫、透明度、溶解氧、COD、活性磷酸鹽、 Ν03--Ν、Ν02—Ν、ΝΗ4+-Ν、石油類,并依次用數(shù)字1 14排序;(2)疾病嚴(yán)重程度賦值根據(jù)其嚴(yán)重程度分為正常、少量發(fā)病、中等程度發(fā)病、大面積發(fā)病4個(gè)等級(jí),記錄為1 4 ;(3)構(gòu)建環(huán)境因子-疾病情況對(duì)應(yīng)數(shù)據(jù)列表建立“環(huán)境因子-疾病情況.txt”文檔,所述文檔的特征是①純數(shù)據(jù)文檔只含序號(hào)、監(jiān)測(cè)值、疾病嚴(yán)重程度值等純數(shù)據(jù)不含各因子標(biāo)題;②排序方式所有數(shù)據(jù)按照序號(hào), 14個(gè)影響因子數(shù)據(jù)和1個(gè)疾病嚴(yán)重程度數(shù)據(jù)從左到右依次排列,即16列;2)全部14個(gè)影響因子數(shù)學(xué)方法構(gòu)建將全部影響因子都用于構(gòu)建數(shù)學(xué)方法,具體方法如下(1)數(shù)據(jù)隨機(jī)分組數(shù)據(jù)分組所有的數(shù)據(jù)按用途被隨機(jī)分為兩大類①訓(xùn)練集用于構(gòu)建數(shù)學(xué)方法; ②測(cè)試集用于評(píng)價(jià)所構(gòu)建數(shù)學(xué)方法的準(zhǔn)確率和可靠性;分組方式隨機(jī)抽取初始數(shù)據(jù)組2/3的數(shù)據(jù)作為訓(xùn)練集,剩下1/3數(shù)據(jù)作為測(cè)試集;(2)構(gòu)建數(shù)學(xué)判別方法用隨機(jī)森林分類算法(以下簡(jiǎn)記為RF)分析訓(xùn)練集數(shù)據(jù),建立14個(gè)影響因子對(duì)大黃魚(yú)刺激隱核蟲(chóng)病發(fā)生情況的全因子判別方法,所用的程序是R軟件環(huán)境中加載的隨機(jī)森林程序包;(3)方法的準(zhǔn)確性評(píng)價(jià)用所獲測(cè)試集數(shù)據(jù)中的14個(gè)影響因子數(shù)據(jù)代入所建數(shù)學(xué)判別方法中,計(jì)算出疾病發(fā)生嚴(yán)重程度值,并與實(shí)測(cè)疾病嚴(yán)重程度賦值進(jìn)行比較,分析準(zhǔn)確率和可靠性;3)降維方法構(gòu)建上述全因子判別方法需要采集14個(gè)水環(huán)境因子進(jìn)行疾病判別,利用隨機(jī)森林算法計(jì)算各個(gè)影響因子重要性,并選擇部分較能反應(yīng)方法效率的因子集合,構(gòu)建維度較低的方法,具體步驟如下(1)權(quán)重因子排序?qū)γ總€(gè)水環(huán)境因子效應(yīng)進(jìn)行評(píng)價(jià),計(jì)算影響刺激隱核蟲(chóng)病發(fā)生的權(quán)重值,并選擇出權(quán)重最大的5個(gè)影響因子;(2)低維疾病判別方法(降維方法)構(gòu)建及篩選分別建立權(quán)重最大的3個(gè)影響因子(月份、水溫、溶解氧)、4個(gè)影響因子(月份、 水溫、溶解氧、NH4+-N)、5個(gè)影響因子(月份、水溫、溶解氧、NH4+-N、C0D)對(duì)疾病情況的判別方法,降維方法構(gòu)建方法同上述未降維(全因子)判別方法的構(gòu)建方法,并分別進(jìn)行準(zhǔn)確性分析;確定因子維度合適的判別方法根據(jù)準(zhǔn)確率(不低于90% )和因子數(shù)量(宜少), 篩選出判別大黃魚(yú)刺激隱核蟲(chóng)疾病發(fā)生情況的理想因子,確定因子維度合適的判別方法;(3)降維方法準(zhǔn)確性評(píng)價(jià)降維方法與全因子方法準(zhǔn)確率比較及差異顯著性分析分別將全因子方法與降維方法判別的疾病值輸出,與原始的疾病值一一對(duì)應(yīng),用SPSS18.0中的相關(guān)性分析、配對(duì)樣品T檢驗(yàn)分析功能分別分析降維方法判別值-全因子方法判別值、降維方法判別值-原始疾病值及全因子方法判別值-原始疾病值之間顯著性差異。本發(fā)明所提供的一種判別刺激隱核蟲(chóng)病與水環(huán)境因子相互關(guān)系的理想判別方法是基于月份、水溫、溶解氧、NH4+-N這4個(gè)因子所構(gòu)建的降維簡(jiǎn)化方法。本發(fā)明從14個(gè)水環(huán)境因子中篩選出對(duì)大黃魚(yú)刺激隱核蟲(chóng)病發(fā)生影響權(quán)重最大的幾個(gè)水環(huán)境因子,進(jìn)而構(gòu)建降維簡(jiǎn)化的數(shù)學(xué)方法,以便在保證較高準(zhǔn)確率和可靠性的基礎(chǔ)上,只需要采集較少的水環(huán)境數(shù)據(jù)信息,就能達(dá)到判別刺激隱核蟲(chóng)病發(fā)生程度的目的。本發(fā)明提供先進(jìn)算法的數(shù)學(xué)方法,確保判別準(zhǔn)確率和可靠性,本發(fā)明公開(kāi)該數(shù)學(xué)方法的用途,表明它可通過(guò)水環(huán)境因子的測(cè)定,判別在某一特定海域養(yǎng)殖大黃魚(yú)時(shí)刺激隱核蟲(chóng)病的可能發(fā)生狀況及嚴(yán)重程度,方便指導(dǎo)大黃魚(yú)刺激隱核蟲(chóng)病的有效防控。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)1)定量判別本發(fā)明闡明了刺激隱核蟲(chóng)病與水環(huán)境因子的定量關(guān)系。現(xiàn)有技術(shù)對(duì)二者之間相互關(guān)系僅有定性的描述,尚無(wú)定量判別的公開(kāi)報(bào)道。2)簡(jiǎn)單方便現(xiàn)有技術(shù)未能闡明影響刺激隱核蟲(chóng)病的主效因子。本發(fā)明從眾多可能的影響因子中甄別和篩選出影響該病的4個(gè)主效因子,構(gòu)建了維度較低的方法,不僅方便養(yǎng)殖戶運(yùn)用該方法判別疾病發(fā)生狀況,而且簡(jiǎn)化了水環(huán)境因子的需測(cè)數(shù)據(jù),大大減少了
工作量。3)準(zhǔn)確率高本發(fā)明提供的降維方法判別準(zhǔn)確率超過(guò)90%,與全因子方法的準(zhǔn)確
率無(wú)顯著差異。4)應(yīng)用前景較好現(xiàn)有技術(shù)僅對(duì)刺激隱核蟲(chóng)病的定性描述,無(wú)法有力指導(dǎo)養(yǎng)殖戶根據(jù)水環(huán)境質(zhì)量判斷養(yǎng)殖海區(qū)是否合適養(yǎng)殖大黃魚(yú),是否會(huì)暴發(fā)嚴(yán)重的刺激隱核蟲(chóng)病。本發(fā)明提供的判別方法不僅可解決上述問(wèn)題,適用于判別大黃魚(yú)刺激隱核蟲(chóng)病發(fā)生,而且還可為其它海水魚(yú)類刺激隱核蟲(chóng)的發(fā)生提供重要參考。
圖1為基于隨機(jī)森林的全因子數(shù)學(xué)方法構(gòu)建的步驟流程圖。圖2為隨機(jī)森林算法中每棵樹(shù)生長(zhǎng)的流程圖。圖3為用生成的方法對(duì)測(cè)試集進(jìn)行測(cè)試的原理圖。
具體實(shí)施例方式下面結(jié)合實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明,但并不作為本發(fā)明對(duì)權(quán)利范圍的限制。實(shí)施例11.數(shù)據(jù)預(yù)處理獲取福建寧德三都灣、福州羅源灣、福鼎沙埕港3個(gè)海水網(wǎng)箱人工大黃魚(yú)養(yǎng)殖最集中的海域的水質(zhì)等環(huán)境因子的月監(jiān)測(cè)數(shù)據(jù)(見(jiàn)表1),及其對(duì)應(yīng)的刺激隱核蟲(chóng)病發(fā)生情況 (水質(zhì)數(shù)據(jù)來(lái)自國(guó)家海洋局東海分局閩東海洋環(huán)境監(jiān)測(cè)中心站,疾病數(shù)據(jù)來(lái)自福建省海洋水產(chǎn)技術(shù)推廣總站病防科,數(shù)據(jù)采集、分析均按照國(guó)家規(guī)范標(biāo)準(zhǔn)),為計(jì)算方便,影響因子按表1中順序分別記錄為1 14 ;疾病情況根據(jù)其嚴(yán)重程度分為正常、少量發(fā)病、中等程度發(fā)病、大面積發(fā)病4個(gè)等級(jí)記錄為1 4 ;月份按1 12月分別記為1 12 ;監(jiān)測(cè)站位按三都灣、羅源灣、沙埕港分別記錄為1 3 ;最后建立“環(huán)境因子-疾病情況.txt”文檔,數(shù)據(jù)按照影響因子和疾病情況從左到右依次排列,即15列,且該文檔只含數(shù)據(jù)不含各因子標(biāo)題。表.1數(shù)據(jù)分析所用影響因子列表
權(quán)利要求
1. 一種大黃魚(yú)刺激隱核蟲(chóng)病害程度的判別方法,其特征在于包括以下步驟1)數(shù)據(jù)預(yù)處理,具體方法如下(1)將可能引發(fā)刺激隱核蟲(chóng)病的水環(huán)境因子分類;(2)疾病嚴(yán)重程度賦值根據(jù)其嚴(yán)重程度分為正常、少量發(fā)病、中等程度發(fā)病、大面積發(fā)病4個(gè)等級(jí),記錄為1 4;(3)構(gòu)建環(huán)境因子-疾病情況對(duì)應(yīng)數(shù)據(jù)列表建立“環(huán)境因子-疾病情況.txt”文檔,所述文檔的特征是①純數(shù)據(jù)文檔只含序號(hào)、 監(jiān)測(cè)值、疾病嚴(yán)重程度值等純數(shù)據(jù)不含各因子標(biāo)題;②排序方式所有數(shù)據(jù)按照序號(hào),14個(gè)影響因子數(shù)據(jù)和1個(gè)疾病嚴(yán)重程度數(shù)據(jù)從左到右依次排列,即16列;2)構(gòu)建全部14個(gè)影響因子數(shù)學(xué)方法將全部影響因子都用于構(gòu)建數(shù)學(xué)方法,具體方法如下(1)數(shù)據(jù)隨機(jī)分組數(shù)據(jù)分組所有的數(shù)據(jù)按用途被隨機(jī)分為兩大類①訓(xùn)練集用于構(gòu)建數(shù)學(xué)方法;②測(cè)試集用于評(píng)價(jià)所構(gòu)建數(shù)學(xué)方法的準(zhǔn)確率和可靠性;分組方式隨機(jī)抽取初始數(shù)據(jù)組2/3的數(shù)據(jù)作為訓(xùn)練集,剩下1/3數(shù)據(jù)作為測(cè)試集;(2)構(gòu)建數(shù)學(xué)判別方法用隨機(jī)森林分類算法,分析訓(xùn)練集數(shù)據(jù),建立14個(gè)影響因子對(duì)大黃魚(yú)刺激隱核蟲(chóng)病發(fā)生情況的全因子判別方法,所用的程序是R軟件環(huán)境中加載的隨機(jī)森林程序包;(3)方法的準(zhǔn)確性評(píng)價(jià)用所獲測(cè)試集數(shù)據(jù)中的14個(gè)影響因子數(shù)據(jù)代入所建數(shù)學(xué)判別方法中,計(jì)算出疾病發(fā)生嚴(yán)重程度值,并與實(shí)測(cè)疾病嚴(yán)重程度賦值進(jìn)行比較,分析準(zhǔn)確率和可靠性;3)構(gòu)建降維方法全因子判別方法需要采集14個(gè)水環(huán)境因子進(jìn)行疾病判別,利用隨機(jī)森林算法計(jì)算各個(gè)影響因子重要性,并選擇部分較能反應(yīng)方法效率的因子集合,構(gòu)建維度較低的方法,具體步驟如下(1)權(quán)重因子排序?qū)γ總€(gè)水環(huán)境因子效應(yīng)進(jìn)行評(píng)價(jià),計(jì)算影響刺激隱核蟲(chóng)病發(fā)生的權(quán)重值,并選擇出權(quán)重最大的5個(gè)影響因子;(2)低維疾病判別方法構(gòu)建及篩選分別建立權(quán)重最大的3個(gè)影響因子、4個(gè)影響因子、5個(gè)影響因子對(duì)疾病情況的判別方法,降維方法構(gòu)建方法同上述未降維判別方法的構(gòu)建方法,并分別進(jìn)行準(zhǔn)確性分析;確定因子維度合適的判別方法根據(jù)準(zhǔn)確率和因子數(shù)量,篩選出判別大黃魚(yú)刺激隱核蟲(chóng)疾病發(fā)生情況的理想因子,確定因子維度合適的判別方法;(3)降維方法準(zhǔn)確性評(píng)價(jià)降維方法與全因子方法準(zhǔn)確率比較及差異顯著性分析分別將全因子方法與降維方法判別的疾病值輸出,與原始的疾病值一一對(duì)應(yīng),用SPSS18. 0中的相關(guān)性分析、配對(duì)樣品T檢驗(yàn)分析功能分別分析降維方法判別值-全因子方法判別值、降維方法判別值-原始疾病值及全因子方法判別值-原始疾病值之間顯著性差異。
2.如權(quán)利要求1所述的一種大黃魚(yú)刺激隱核蟲(chóng)病害程度的判別方法,其特征在于在步驟1)第(1)部分中,所述將可能引發(fā)刺激隱核蟲(chóng)病的水環(huán)境因子分類的具體方法如下從水環(huán)境監(jiān)測(cè)數(shù)據(jù)中選取14個(gè)可能影響刺激隱核蟲(chóng)病發(fā)生的水文、氣候、物理、化學(xué)、 生物等影響因子年份、月份、監(jiān)測(cè)站位、水溫、透明度、溶解氧、COD、活性磷酸鹽、NO3-N, N02--N、NH4+-N、石油類,并依次用數(shù)字1 14排序。
3.如權(quán)利要求1所述的一種大黃魚(yú)刺激隱核蟲(chóng)病害程度的判別方法,其特征在于在步驟3)第(2)部分中,所述3個(gè)影響因子為月份、水溫、溶解氧。
4.如權(quán)利要求1所述的一種大黃魚(yú)刺激隱核蟲(chóng)病害程度的判別方法,其特征在于在步驟3)第⑵部分中,所述4個(gè)影響因子為月份、水溫、溶解氧、NH4+-N。
5.如權(quán)利要求1所述的一種大黃魚(yú)刺激隱核蟲(chóng)病害程度的判別方法,其特征在于在步驟3)第⑵部分中,所述5個(gè)影響因子為月份、水溫、溶解氧、NH4+-N、COD。
全文摘要
一種大黃魚(yú)刺激隱核蟲(chóng)病害程度的判別方法,涉及大黃魚(yú)。先數(shù)據(jù)預(yù)處理,再構(gòu)建全部14個(gè)影響因子數(shù)學(xué)方法,最后構(gòu)建降維方法。具有定量判別、簡(jiǎn)單方便、高準(zhǔn)確率和高可靠性等特點(diǎn)。隨機(jī)抽樣測(cè)試表明,通過(guò)所提供的方法,利用水環(huán)境因子實(shí)測(cè)數(shù)值能夠準(zhǔn)確判定大黃魚(yú)刺激隱核蟲(chóng)病可能發(fā)生的嚴(yán)重程度,判別準(zhǔn)確率可達(dá)90%以上。適用于判定大黃魚(yú)刺激隱核蟲(chóng)病可能發(fā)生的海域及嚴(yán)重程度,指導(dǎo)大黃魚(yú)刺激隱核蟲(chóng)病的有效防控。適用于判別大黃魚(yú)刺激隱核蟲(chóng)病發(fā)生,而且還可為其它海水魚(yú)類刺激隱核蟲(chóng)的發(fā)生提供重要參考。
文檔編號(hào)A01K61/00GK102550455SQ201210009919
公開(kāi)日2012年7月11日 申請(qǐng)日期2012年1月13日 優(yōu)先權(quán)日2012年1月13日
發(fā)明者丁少雄, 呂偉航, 毛勇, 王軍, 王洪杰, 蘇永全, 蔡曉鵬 申請(qǐng)人:廈門大學(xué)