本發(fā)明實施例涉及分詞模型處理技術(shù)領(lǐng)域,尤其涉及一種基于人工智能的分詞模型的定制方法、裝置、設(shè)備和介質(zhì)。
背景技術(shù):
人工智能(artificialintelligence),英文縮寫為ai。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計算機(jī)科學(xué)的一個分支,它企圖了解智能的實質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。
中文分詞指的是將一個漢字序列切分成一個一個單獨的詞。中文分詞是文本挖掘的基礎(chǔ),對于輸入的一段中文,成功的進(jìn)行中文分詞,可以達(dá)到電腦自動識別語句含義的效果。
現(xiàn)有的中文分詞模型一般都是通用分詞模型,無法針對專業(yè)領(lǐng)域或特定場景對文本進(jìn)行準(zhǔn)確的分詞。現(xiàn)有技術(shù)中一般是通過使用專業(yè)領(lǐng)域或特定場景的分詞訓(xùn)練語料重新訓(xùn)練現(xiàn)有的通用分詞模型,得到專業(yè)領(lǐng)域或特定場景對應(yīng)的分詞模型。
上述獲取專業(yè)領(lǐng)域或特定場景對應(yīng)的分詞模型的方法,費時費力,且難以保證分詞質(zhì)量。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明實施例提供了一種基于人工智能的分詞模型的定制方法、裝置、設(shè)備和介質(zhì),以解決現(xiàn)有技術(shù)中通過對現(xiàn)有分詞模型進(jìn)行重新訓(xùn)練以獲得針對專業(yè)領(lǐng)域或特定場景的分詞模型費時費力的技術(shù)缺陷。
在第一方面,本發(fā)明實施例提供了一種基于人工智能的分詞模型的定制方法,包括:
獲取定制分詞訓(xùn)練語料;
根據(jù)所述定制分詞訓(xùn)練語料,使用增量訓(xùn)練法或權(quán)值干預(yù)法修正第一設(shè)定分詞模型,得到與所述定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
在第二方面,本發(fā)明實施例提供了一種基于人工智能的分詞模型的定制裝置,包括:
訓(xùn)練語料獲取模塊,用于獲取定制分詞訓(xùn)練語料;
分詞模型修正模塊,用于根據(jù)所述定制分詞訓(xùn)練語料,使用增量訓(xùn)練法或權(quán)值干預(yù)法修正第一設(shè)定分詞模型,得到與所述定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
在第三方面,本發(fā)明實施例提供了一種設(shè)備,所述設(shè)備包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序,
當(dāng)所述一個或多個程序被所述一個或多個處理器執(zhí)行,使得所述一個或多個處理器實現(xiàn)本發(fā)明實施例所述的基于人工智能的分詞模型的定制方法。
在第四方面,本發(fā)明實施例提供了一種包含計算機(jī)可執(zhí)行指令的存儲介質(zhì),所述計算機(jī)可執(zhí)行指令在由計算機(jī)處理器執(zhí)行時用于執(zhí)行本發(fā)明實施例所述的基于人工智能的分詞模型的定制方法。
本發(fā)明實施例提供了一種基于人工智能的分詞模型的定制方法、裝置、設(shè)備和介質(zhì),通過先獲取定制分詞訓(xùn)練語料,然后根據(jù)定制分詞訓(xùn)練語料,使用增量訓(xùn)練法或權(quán)值干預(yù)法修正第一設(shè)定分詞模型,得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型,解決了現(xiàn)有技術(shù)中通過對現(xiàn)有分詞模型進(jìn)行重新訓(xùn)練以獲得針對專業(yè)領(lǐng)域或特定場景的分詞模型費時費力的技術(shù)缺陷,實現(xiàn)了快速、簡單地依據(jù)用戶的實際分詞需求對現(xiàn)有分詞模型進(jìn)行修正,獲得滿足用戶特定分詞需求的分詞模型。
附圖說明
圖1是本發(fā)明實施例一提供的一種基于人工智能的分詞模型的定制方法的流程圖;
圖2是本發(fā)明實施例二提供的一種基于人工智能的分詞模型的定制方法的流程圖;
圖3是本發(fā)明實施例三提供的一種基于人工智能的分詞模型的定制方法的流程圖;
圖4是本發(fā)明實施例四提供的一種基于人工智能的分詞模型的定制裝置的結(jié)構(gòu)圖;
圖5是本發(fā)明實施例五中的一種設(shè)備的結(jié)構(gòu)圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖對本發(fā)明具體實施例作進(jìn)一步的詳細(xì)描述??梢岳斫獾氖?,此處所描述的具體實施例僅僅用于解釋本發(fā)明,而非對本發(fā)明的限定。
另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部內(nèi)容。在更加詳細(xì)地討論示例性實施例之前應(yīng)當(dāng)提到的是,一些示例性實施例被描述成作為流程圖描繪的處理或方法。雖然流程圖將各項操作(或步驟)描述成順序的處理,但是其中的許多操作可以被并行地、并發(fā)地或者同時實施。此外,各項操作的順序可以被重新安排。當(dāng)其操作完成時所述處理可以被終止,但是還可以具有未包括在附圖中的附加步驟。所述處理可以對應(yīng)于方法、函數(shù)、規(guī)程、子例程、子程序等等。
實施例一
圖1為本發(fā)明實施例一提供的一種基于人工智能的分詞模型的定制法的流程圖,本實施例的方法可以由基于人工智能的分詞模型的定制裝置來執(zhí)行,該裝置可通過硬件和/或軟件的方式實現(xiàn),并一般可集成于提供分詞模型定制的服務(wù)器中。本實施例的方法具體包括:
110、獲取定制分詞訓(xùn)練語料。
在本實施例中,定制分詞訓(xùn)練語料具體是指分詞方法符合專業(yè)領(lǐng)域要求、符合特定場景要求或是滿足用戶的特殊需求的已分詞語料。定制分詞訓(xùn)練語料的獲取方式具體可以是用戶直接輸入,也可以是從用戶輸入的鏈接地址下載,還可以是從內(nèi)部存儲的分詞語料中提取等,本實施例對此不進(jìn)行限制。
120、根據(jù)定制分詞訓(xùn)練語料,使用增量訓(xùn)練法或權(quán)值干預(yù)法修正第一設(shè)定分詞模型,得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
在本實施例中,第一設(shè)定分詞模型具體可以是通用分詞模型、也可以是專用分詞模型,本實施例對此不進(jìn)行限制,當(dāng)然,第一設(shè)定分詞模型也可以是經(jīng)過本實施例的步驟110和步驟120生成的定制分詞模型,也就是說,可以對定制分詞模型再次進(jìn)行定制。
進(jìn)一步地,在本實施例中,第一設(shè)定分詞模型的獲取方式具體可以是用戶輸入,也可以是從用戶輸入的鏈接地址下載,還可以是從內(nèi)部存儲的分詞模型中選取等,本實施例對此不進(jìn)行限制。
本領(lǐng)域技術(shù)人員可以理解的是,現(xiàn)有的分詞模型一般都是通用分詞模型,通用分詞模型對日常用語,常用詞組等內(nèi)容的分詞結(jié)果較為準(zhǔn)確,但是,對于專業(yè)領(lǐng)域的專業(yè)詞組以及某些特定場景下的特有分詞難以進(jìn)行準(zhǔn)確地劃分,因此,本實施例中使用定制分詞訓(xùn)練語料對第一設(shè)定分詞模型進(jìn)行修正,以使修正后的分詞模型可以依據(jù)定制分詞訓(xùn)練語料中的分詞方式對文本進(jìn)行正確的分詞處理。
在本實施例中,使用增量訓(xùn)練法修正第一設(shè)定分詞模型的過程具體可以是:使用第一設(shè)定分詞模型對定制分詞訓(xùn)練語料進(jìn)行分詞處理,得到分詞結(jié)果;比較分詞結(jié)果和定制分詞訓(xùn)練語料,根據(jù)設(shè)定規(guī)則獲取更新參數(shù);根據(jù)更新參數(shù),更新第一設(shè)定分詞模型,得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
在本實施例中,使用權(quán)值干預(yù)法修正第一設(shè)定分詞模型的過程具體可以是:根據(jù)定制分詞訓(xùn)練語料,生成分詞模型修正參數(shù);根據(jù)分詞模型修正參數(shù)和第一設(shè)定分詞模型的模型參數(shù),生成與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
在本實施例中,在得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型之后,可以將定制分詞模型存儲在設(shè)定存儲區(qū)域中,也可以將定制分詞模型輸出給用戶,還可以依據(jù)用戶的需求將定制分詞模型存儲在設(shè)定服務(wù)器中,上述三種方式也可以同時實施,也可以任選其中兩種方法同時實施。
進(jìn)一步地,在本實施例中,在得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型之后,還可以將定制分詞訓(xùn)練語料存儲在設(shè)定存儲區(qū)域中,進(jìn)一步地,還可以在設(shè)定的時間點或接收到操作指令之后,對存儲的所有定制分詞訓(xùn)練語料進(jìn)行統(tǒng)計分析,然后根據(jù)統(tǒng)計分析的結(jié)果對第一設(shè)定分詞模型或其他分詞模型進(jìn)行修正,修正的方法具體可以是增量訓(xùn)練法等。
本發(fā)明實施例一提供了一種基于人工智能的分詞模型的定制方法,通過先獲取定制分詞訓(xùn)練語料,然后根據(jù)定制分詞訓(xùn)練語料,使用增量訓(xùn)練法或權(quán)值干預(yù)法修正第一設(shè)定分詞模型,得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型,解決了現(xiàn)有技術(shù)中通過對現(xiàn)有分詞模型進(jìn)行重新訓(xùn)練以獲得針對專業(yè)領(lǐng)域或特定場景的分詞模型費時費力的技術(shù)缺陷,實現(xiàn)了快速、簡單地依據(jù)用戶的實際分詞需求對現(xiàn)有分詞模型進(jìn)行修正,獲得滿足用戶特定分詞需求的分詞模型。
實施例二
圖2是本發(fā)明實施例二提供的一種基于人工智能的分詞模型的定制方法的流程圖。本實施例以上述實施例為基礎(chǔ)進(jìn)行優(yōu)化,在本實施例中,將根據(jù)定制分詞訓(xùn)練語料,使用增量訓(xùn)練法或權(quán)值干預(yù)法修正第一設(shè)定分詞模型,得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型,具體化為:使用第一設(shè)定分詞模型對定制分詞訓(xùn)練語料進(jìn)行分詞處理,得到分詞結(jié)果;根據(jù)設(shè)定規(guī)則比較分詞結(jié)果和定制分詞訓(xùn)練語料,獲取更新參數(shù);根據(jù)更新參數(shù),更新第一設(shè)定分詞模型,得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
進(jìn)一步地,還具體包括:存儲定制分詞訓(xùn)練語料以及定制分詞模型。
進(jìn)一步地,還具體包括:依據(jù)設(shè)定時間周期或獲取的修正指令,獲取存儲的所有定制分詞訓(xùn)練語料,生成標(biāo)準(zhǔn)分詞訓(xùn)練語料;根據(jù)標(biāo)準(zhǔn)分詞訓(xùn)練語料,使用增量訓(xùn)練法修正第二設(shè)定分詞模型。
相應(yīng)的,本實施例的方法具體包括:
210、獲取定制分詞訓(xùn)練語料。
220、使用第一設(shè)定分詞模型對定制分詞訓(xùn)練語料進(jìn)行分詞處理,得到分詞結(jié)果。
在本實施例中,在獲取定制分詞訓(xùn)練語料之后,會依據(jù)用戶的操作指令獲取第一設(shè)定分詞模型,然后使用第一設(shè)定分詞模型對定制分詞訓(xùn)練語料進(jìn)行分詞處理。
在本實施例中,使用第一設(shè)定分詞模型對定制分詞訓(xùn)練語料進(jìn)行分詞處理的方法可以是:首先根據(jù)第一設(shè)定分詞模型獲取轉(zhuǎn)移矩陣并根據(jù)第一設(shè)定分詞模型和定制分詞訓(xùn)練語料獲取發(fā)射矩陣,然后,對發(fā)射矩陣和轉(zhuǎn)移矩陣進(jìn)行馬爾可夫解碼,進(jìn)而獲得分詞結(jié)果。
230、根據(jù)設(shè)定規(guī)則比較分詞結(jié)果和定制分詞訓(xùn)練語料,獲取更新參數(shù)。
在本實施例中,設(shè)定規(guī)則具體可以是隨機(jī)梯度下降法等。更新參數(shù)具體是指第一設(shè)定分詞模型的各個模型參數(shù)需要更正的數(shù)值。
240、根據(jù)更新參數(shù),更新第一設(shè)定分詞模型,得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
在本實施例中,在獲取更新參數(shù)之后,會根據(jù)更新參數(shù)對第一設(shè)定分詞模型的模型參數(shù)進(jìn)行修正,得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型,修正后的第一設(shè)定分詞模型不但可以實現(xiàn)原有分詞效果,同時還可以實現(xiàn)對定制分詞需訓(xùn)練語料中的詞組的準(zhǔn)確分詞。
250、存儲定制分詞訓(xùn)練語料以及定制分詞模型。
在本實施例中,在得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型之后,會將該定制分詞模型存儲在設(shè)定存儲區(qū)域中或根據(jù)用戶的指令存儲在設(shè)定的服務(wù)器中。另外,定制分詞訓(xùn)練語料和定制分詞模型可以存儲在相同的設(shè)定存儲區(qū)域中,也可以存儲在不同的設(shè)定存儲區(qū)域中,本實施例對此不進(jìn)行限制。
進(jìn)一步地,當(dāng)將定制分詞模型根據(jù)用戶的指令存儲在設(shè)定的服務(wù)器中時,會將存儲地址以鏈接的形式告知用戶,以便用戶之后進(jìn)行下載等操作,其中,設(shè)定的服務(wù)器具體可以是云服務(wù)器等。
260、依據(jù)設(shè)定時間周期或獲取的修正指令,獲取存儲的所有定制分詞訓(xùn)練語料,生成標(biāo)準(zhǔn)分詞訓(xùn)練語料。
本實施例的步驟260和步驟270給出了對第二設(shè)定分詞進(jìn)行修正的過程,也就是說,在本實施例中,在獲取定制分詞模型之后,還會對第二設(shè)定分詞模型進(jìn)行修正,其中,第二設(shè)定分詞模型具體可以是步驟240中得到的定制分詞模型,也可以是第一設(shè)定分詞模型。
在本實施例中,會依據(jù)設(shè)定的時間周期或在獲取用戶輸入的修正指令后,首先會獲取存儲的所有定制分詞訓(xùn)練語料,然后對獲取的所有定制分詞訓(xùn)練語料進(jìn)行統(tǒng)計分析,最后根據(jù)統(tǒng)計分析的結(jié)果生成標(biāo)準(zhǔn)分詞訓(xùn)練語料。
270、根據(jù)標(biāo)準(zhǔn)分詞訓(xùn)練語料,使用增量訓(xùn)練法修正第二設(shè)定分詞模型。
在本實施例中,使用增量訓(xùn)練法修正第二設(shè)定分詞模型的方法具體可以是:使用第二設(shè)定分詞模型對標(biāo)準(zhǔn)分詞訓(xùn)練語料進(jìn)行分詞處理,得到分詞結(jié)果;根據(jù)設(shè)定規(guī)則比較分詞結(jié)果和標(biāo)準(zhǔn)分詞訓(xùn)練語料,獲取更新參數(shù);根據(jù)更新參數(shù),更新第二設(shè)定分詞模型,得到與標(biāo)準(zhǔn)分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
本發(fā)明實施例二提供了一種基于人工智能的分詞模型的定制方法,具體化了第一設(shè)定分詞模型的修正方法,可以簡便、快速地獲得定制分詞模型,還優(yōu)化增加了對定制分詞訓(xùn)練語料和定制分詞模型的存儲,進(jìn)一步地,優(yōu)化增加了根據(jù)存儲的定制分詞訓(xùn)練語料對第二設(shè)定分詞模型進(jìn)行修正,對第二設(shè)定分詞模型進(jìn)行了優(yōu)化。利用該方法可以無需對第一設(shè)定分詞模型進(jìn)行重新訓(xùn)練,即可簡便、快速地獲得與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型,同時,還可以根據(jù)存儲的定制分詞訓(xùn)練語料不斷地對分詞模型進(jìn)行優(yōu)化,提升分詞效果,從而形成一個良好的循環(huán),同時節(jié)省了收集語料和標(biāo)注語料的時間和成本。
實施例三
圖3是本發(fā)明實施例三提供的一種基于人工智能的分詞模型的定制方法的流程圖。本實施例以上述實施例為基礎(chǔ)進(jìn)行優(yōu)化,在本實施例中,將根據(jù)定制分詞訓(xùn)練語料,使用增量訓(xùn)練法或權(quán)值干預(yù)法修正第一設(shè)定分詞模型,得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型,具體化為:根據(jù)定制分詞訓(xùn)練語料,生成分詞模型修正參數(shù);根據(jù)分詞模型修正參數(shù)和第一設(shè)定分詞模型的模型參數(shù),生成與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
進(jìn)一步地,將存儲定制分詞訓(xùn)練語料以及定制分詞模型,具體化為:將定制分詞模型存儲在自身的設(shè)定存儲區(qū)域;依據(jù)存儲規(guī)則,輸出定制分詞模型至客戶端,和/或?qū)⒍ㄖ品衷~模型存儲至外部設(shè)定服務(wù)器。
相應(yīng)的,本實施例的方法具體包括:
310、獲取定制分詞訓(xùn)練語料。
320、根據(jù)定制分詞訓(xùn)練語料,生成分詞模型修正參數(shù)。
在本實施例中,分詞模型修正參數(shù)的獲取方法具體可以是將定制分詞訓(xùn)練語料的特征權(quán)值作為分詞模型修正參數(shù)等。其中,定制分詞訓(xùn)練語料的特征權(quán)值可以通過神經(jīng)網(wǎng)絡(luò)獲取。
330、根據(jù)分詞模型修正參數(shù)和第一設(shè)定分詞模型的模型參數(shù),生成與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
在本實施例中,生成與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型的方法具體可以是將分詞模型修正參數(shù)與第一設(shè)定分詞模型的模型參數(shù)合并,但是各自的數(shù)值不做任何改變,由此獲得與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型的模型參數(shù),根據(jù)該模型參數(shù)可進(jìn)而獲得與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
在一個具體的例子中,分詞模型修正參數(shù)用矩陣
340、將定制分詞模型存儲在自身的設(shè)定存儲區(qū)域。
在本實施例中,在生成定制分詞模型之后,會將定制分詞模型存儲在自身的設(shè)定存儲區(qū)域中。
350、依據(jù)存儲規(guī)則,輸出定制分詞模型至客戶端,和/或?qū)⒍ㄖ品衷~模型存儲至外部設(shè)定服務(wù)器。
在本實施例中,存儲規(guī)則具體是指用戶輸入的對定制分詞模型存儲方式的操作指令。具體來說,上述操作指令具體可以有三種:第一種是僅將定制分詞模型輸出至客戶端;第二種是僅將定制分詞模型存儲至外部設(shè)定服務(wù)器中;第三種是不但要將定制分詞模型輸出至客戶端,同時也要講定制分詞模型存儲至外部設(shè)定服務(wù)器中。其中,外部設(shè)定服務(wù)器具體可以是云服務(wù)器。當(dāng)將定制分詞模型存儲至外部設(shè)定服務(wù)器中時,存儲完成之后,會將存儲地址以鏈接的形式告知用戶,以便用戶之后進(jìn)行下載等操作。
本發(fā)明實施例三提供了一種基于人工智能的分詞模型的定制方法,具體化了第一設(shè)定分詞模型的修正方法,簡單、快速地獲得與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型,同時,還具體化了定制分詞模型的存儲方式,增加了定制分詞模型存儲的靈活性。利用該方法可以無需對第一設(shè)定分詞模型進(jìn)行重新訓(xùn)練,即可簡單、快速地獲得與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型,同時,還可以給用戶提供多種定制分詞模型的存儲方式,以便用戶以后對定制分詞模型進(jìn)行使用和修正。
實施例四
圖4是本發(fā)明實施例四提供的一種基于人工智能的分詞模型的定制裝置的結(jié)構(gòu)圖。如圖4所示,所述裝置包括:訓(xùn)練語料獲取模塊401以及分詞模型修正模塊402,其中:
訓(xùn)練語料獲取模塊401,用于獲取定制分詞訓(xùn)練語料;
分詞模型修正模塊402,用于根據(jù)定制分詞訓(xùn)練語料,使用增量訓(xùn)練法或權(quán)值干預(yù)法修正第一設(shè)定分詞模型,得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
本發(fā)明實施例四提供了一種基于人工智能的分詞模型的定制裝置,通過先獲取定制分詞訓(xùn)練語料,然后根據(jù)定制分詞訓(xùn)練語料,使用增量訓(xùn)練法或權(quán)值干預(yù)法修正第一設(shè)定分詞模型,得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型,解決了現(xiàn)有技術(shù)中通過對現(xiàn)有分詞模型進(jìn)行重新訓(xùn)練以獲得針對專業(yè)領(lǐng)域或特定場景的分詞模型費時費力的技術(shù)缺陷,實現(xiàn)了快速、簡單地依據(jù)用戶的實際分詞需求對現(xiàn)有分詞模型進(jìn)行修正,獲得滿足用戶特定分詞需求的分詞模型。
在上述各實施例的基礎(chǔ)上,分詞模型修正模塊可以包括:
分詞處理單元,用于使用第一設(shè)定分詞模型對定制分詞訓(xùn)練語料進(jìn)行分詞處理,得到分詞結(jié)果;
更新參數(shù)獲取單元,用于比較分詞結(jié)果和定制分詞訓(xùn)練語料,根據(jù)設(shè)定規(guī)則獲取更新參數(shù);
模型更新單元,用于根據(jù)更新參數(shù),更新第一設(shè)定分詞模型,得到與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
在上述各實施例的基礎(chǔ)上,分詞模型修正模塊可以包括:
修正參數(shù)生成單元,用于根據(jù)定制分詞訓(xùn)練語料,生成分詞模型修正參數(shù);
第一模型修正單元,用于根據(jù)所詞模型修正參數(shù)和第一設(shè)定分詞模型的模型參數(shù),生成與定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
在上述各實施例的基礎(chǔ)上,還可以包括:
語料存儲模塊,用于存儲定制分詞訓(xùn)練語料以及定制分詞模型。
在上述各實施例的基礎(chǔ)上,還可以包括:
標(biāo)準(zhǔn)分詞訓(xùn)練語料生成單元,用于依據(jù)設(shè)定時間周期或獲取的修正指令,獲取存儲的所有定制分詞訓(xùn)練語料,生成標(biāo)準(zhǔn)分詞訓(xùn)練語料;
第二模型修正單元,用于根據(jù)標(biāo)準(zhǔn)分詞訓(xùn)練語料,使用增量訓(xùn)練法修正第二設(shè)定分詞模型。
在上述各實施例的基礎(chǔ)上,語料存儲模塊可以包括:
模型存儲單元,用于將定制分詞模型存儲在自身的設(shè)定存儲區(qū)域;
模型輸出單元,用于依據(jù)存儲規(guī)則,輸出定制分詞模型至客戶端,和/或?qū)⒍ㄖ品衷~模型存儲至外部設(shè)定服務(wù)器。
本發(fā)明實施例所提供的基于人工智能的分詞模型的定制裝置可用于執(zhí)行本發(fā)明任意實施例提供的基于人工智能的分詞模型的定制方法,具備相應(yīng)的功能模塊,實現(xiàn)相同的有益效果。
實施例五
圖5為本發(fā)明實施例五提供的一種設(shè)備的結(jié)構(gòu)示意圖。圖5示出了適于用來實現(xiàn)本發(fā)明實施方式的示例性設(shè)備12的框圖。圖5顯示的設(shè)備12僅僅是一個示例,不應(yīng)對本發(fā)明實施例的功能和使用范圍帶來任何限制。
如圖5所示,設(shè)備12以通用計算設(shè)備的形式表現(xiàn)。設(shè)備12的組件可以包括但不限于:一個或者多個處理器或者處理單元16,系統(tǒng)存儲器28,連接不同系統(tǒng)組件(包括系統(tǒng)存儲器28和處理單元16)的總線18。
總線18表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲器總線或者存儲器控制器,外圍總線,圖形加速端口,處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。舉例來說,這些體系結(jié)構(gòu)包括但不限于工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(isa)總線,微通道體系結(jié)構(gòu)(mac)總線,增強(qiáng)型isa總線、視頻電子標(biāo)準(zhǔn)協(xié)會(vesa)局域總線以及外圍組件互連(pci)總線。
設(shè)備12典型地包括多種計算機(jī)系統(tǒng)可讀介質(zhì)。這些介質(zhì)可以是任何能夠被設(shè)備12訪問的可用介質(zhì),包括易失性和非易失性介質(zhì),可移動的和不可移動的介質(zhì)。
系統(tǒng)存儲器28可以包括易失性存儲器形式的計算機(jī)系統(tǒng)可讀介質(zhì),例如隨機(jī)存取存儲器(ram)30和/或高速緩存存儲器32。設(shè)備12可以進(jìn)一步包括其它可移動/不可移動的、易失性/非易失性計算機(jī)系統(tǒng)存儲介質(zhì)。僅作為舉例,存儲系統(tǒng)34可以用于讀寫不可移動的、非易失性磁介質(zhì)(圖c未顯示,通常稱為“硬盤驅(qū)動器”)。盡管圖5中未示出,可以提供用于對可移動非易失性磁盤(例如“軟盤”)讀寫的磁盤驅(qū)動器,以及對可移動非易失性光盤(例如cd-rom,dvd-rom或者其它光介質(zhì))讀寫的光盤驅(qū)動器。在這些情況下,每個驅(qū)動器可以通過一個或者多個數(shù)據(jù)介質(zhì)接口與總線18相連。存儲器28可以包括至少一個程序產(chǎn)品,該程序產(chǎn)品具有一組(例如至少一個)程序模塊,這些程序模塊被配置以執(zhí)行本發(fā)明各實施例的功能。
具有一組(至少一個)程序模塊42的程序/實用工具40,可以存儲在例如存儲器28中,這樣的程序模塊42包括但不限于操作系統(tǒng)、一個或者多個應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實現(xiàn)。程序模塊42通常執(zhí)行本發(fā)明所描述的實施例中的功能和/或方法。
設(shè)備12也可以與一個或多個外部設(shè)備14(例如鍵盤、指向設(shè)備、顯示器24等)通信,還可與一個或者多個使得用戶能與該設(shè)備12交互的設(shè)備通信,和/或與使得該設(shè)備12能與一個或多個其它計算設(shè)備進(jìn)行通信的任何設(shè)備(例如網(wǎng)卡,調(diào)制解調(diào)器等等)通信。這種通信可以通過輸入/輸出(i/o)接口22進(jìn)行。并且,設(shè)備12還可以通過網(wǎng)絡(luò)適配器20與一個或者多個網(wǎng)絡(luò)(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖所示,網(wǎng)絡(luò)適配器20通過總線18與設(shè)備12的其它模塊通信。應(yīng)當(dāng)明白,盡管圖中未示出,可以結(jié)合設(shè)備12使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設(shè)備驅(qū)動器、冗余處理單元、外部磁盤驅(qū)動陣列、raid系統(tǒng)、磁帶驅(qū)動器以及數(shù)據(jù)備份存儲系統(tǒng)等。
處理單元16通過運行存儲在系統(tǒng)存儲器28中的程序,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,例如實現(xiàn)本發(fā)明實施例所提供的基于人工智能的分詞模型的定制方法,所述基于人工智能的分詞模型的定制方法包括:
獲取定制分詞訓(xùn)練語料;
根據(jù)所述定制分詞訓(xùn)練語料,使用增量訓(xùn)練法或權(quán)值干預(yù)法修正第一設(shè)定分詞模型,得到與所述定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
實施例六
本發(fā)明實施例六還提供了一種包含計算機(jī)可執(zhí)行指令的存儲介質(zhì),所述計算機(jī)可執(zhí)行指令在由計算機(jī)處理器執(zhí)行時用于執(zhí)行如本發(fā)明實施例所述的基于人工智能的分詞模型的定制方法,所述基于人工智能的分詞模型的定制方法包括:
獲取定制分詞訓(xùn)練語料;
根據(jù)所述定制分詞訓(xùn)練語料,使用增量訓(xùn)練法或權(quán)值干預(yù)法修正第一設(shè)定分詞模型,得到與所述定制分詞訓(xùn)練語料對應(yīng)的定制分詞模型。
本發(fā)明實施例的計算機(jī)存儲介質(zhì),可以采用一個或多個計算機(jī)可讀的介質(zhì)的任意組合。計算機(jī)可讀介質(zhì)可以是計算機(jī)可讀信號介質(zhì)或者計算機(jī)可讀存儲介質(zhì)。計算機(jī)可讀存儲介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算機(jī)可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個或多個導(dǎo)線的電連接、便攜式計算機(jī)磁盤、硬盤、隨機(jī)存取存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機(jī)可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
計算機(jī)可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括但不限于電磁信號、光信號或上述的任意合適的組合。計算機(jī)可讀的信號介質(zhì)還可以是計算機(jī)可讀存儲介質(zhì)以外的任何計算機(jī)可讀介質(zhì),該計算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
計算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括——但不限于無線、電線、光纜、rf等等,或者上述的任意合適的組合。
可以以一種或多種程序設(shè)計語言或其組合來編寫用于執(zhí)行本發(fā)明操作的計算機(jī)程序代碼,所述程序設(shè)計語言包括面向?qū)ο蟮某绦蛟O(shè)計語言—諸如java、smalltalk、c++,還包括常規(guī)的過程式程序設(shè)計語言—諸如”c”語言或類似的程序設(shè)計語言。程序代碼可以完全地在用戶計算機(jī)上執(zhí)行、部分地在用戶計算機(jī)上執(zhí)行、作為一個獨立的軟件包執(zhí)行、部分在用戶計算機(jī)上部分在遠(yuǎn)程計算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計算機(jī)的情形中,遠(yuǎn)程計算機(jī)可以通過任意種類的網(wǎng)絡(luò)——包括局域網(wǎng)(lan)或廣域網(wǎng)(wan)—連接到用戶計算機(jī),或者,可以連接到外部計算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。
注意,上述僅為本發(fā)明的較佳實施例及所運用技術(shù)原理。本領(lǐng)域技術(shù)人員會理解,本發(fā)明不限于這里所述的特定實施例,對本領(lǐng)域技術(shù)人員來說能夠進(jìn)行各種明顯的變化、重新調(diào)整和替代而不會脫離本發(fā)明的保護(hù)范圍。因此,雖然通過以上實施例對本發(fā)明進(jìn)行了較為詳細(xì)的說明,但是本發(fā)明不僅僅限于以上實施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。