技術(shù)總結(jié)
本發(fā)明公開(kāi)了一種基于層疊式神經(jīng)網(wǎng)絡(luò)的中文模糊限制信息范圍檢測(cè)方法,其特征在于包括如下步驟:對(duì)待分析實(shí)驗(yàn)語(yǔ)料中含有模糊限制語(yǔ)的句子,進(jìn)行分詞處理;使用句法解析器對(duì)分詞處理后的句子進(jìn)行句法解析,得到所述句子的短語(yǔ)結(jié)構(gòu)樹(shù);通過(guò)基于短語(yǔ)的候選樣例篩選策略找到候選短語(yǔ),進(jìn)而確定候選短語(yǔ)的邊界詞,包括左邊界詞和右邊界詞;使用抽取窗口分別抽取所述的左、右邊界詞和模糊限制語(yǔ)的上下文信息;將左、右邊界詞和模糊限制語(yǔ)的上下文信息作為候選樣例詞序列并映射到實(shí)數(shù)向量空間,轉(zhuǎn)換為詞向量形式;輸入基于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)LSTM和卷積神經(jīng)網(wǎng)絡(luò)CNN相結(jié)合的層疊式學(xué)習(xí)模型LSTM?CNN進(jìn)行學(xué)習(xí),得到邊界分類器;對(duì)測(cè)試數(shù)據(jù)進(jìn)行分類,得到左、右邊界的分類結(jié)果。
技術(shù)研發(fā)人員:周惠巍;寧時(shí)賢;楊云龍;劉壯
受保護(hù)的技術(shù)使用者:大連理工大學(xué)
文檔號(hào)碼:201611222553
技術(shù)研發(fā)日:2016.12.27
技術(shù)公布日:2017.05.03