技術總結
本發(fā)明涉及基于改進的Nivre算法構建越南語依存樹庫的方法,屬自然語言處理技術領域。本發(fā)明首先構建初始訓練語料、擴展語料和測試語料;然后利用構建的初始訓練語料基于改進的Nivre算法訓練出兩個依存分析弱學習器S1和S2作為兩個充分冗余的視圖;再利用訓練出的兩個弱學習器S1和S2對擴展語料進行依存分析并構建越南語依存樹庫模型;最后對測試語料進行依存分析測試并最終構建出越南語依存樹庫。本發(fā)明能夠對越南語的句法分析、機器翻譯和信息獲取等上層應用提供有力支撐;能有效避免了人工標記越南語句子依存關系的過程,節(jié)省了人力物力的時間;能夠有效利用大量無標記的越南語句子級語料提升依存分析的準確率。
技術研發(fā)人員:余正濤;邱國柯;郭劍毅;文永華;王紅斌;陳瑋
受保護的技術使用者:昆明理工大學
文檔號碼:201610599528
技術研發(fā)日:2016.07.27
技術公布日:2016.12.21