技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明公開了一種基于向量空間模型的英漢語料提取方法,包括:步驟1、分別對(duì)漢語和英語語料庫(kù)進(jìn)行預(yù)處理;步驟2、構(gòu)建雙向前后文詞語向量空間模型;步驟3、進(jìn)行計(jì)權(quán)等效分析,將第一升序集合{km,k2,k1,k3··ki··k4}中的英語單詞依次進(jìn)行計(jì)權(quán)等效相似度Sim(ki)|計(jì)權(quán)計(jì)算,所述計(jì)權(quán)等效相似度Sim(ki)|計(jì)權(quán)為:其中,ωai為第一計(jì)權(quán)因子,ωbi為第二計(jì)權(quán)因子;步驟4、將Sim(k1)|計(jì)權(quán)、Sim(k2)|計(jì)權(quán)、…Sim(ki)|計(jì)權(quán)、…、Sim(km)|計(jì)權(quán)中最大數(shù)值對(duì)應(yīng)的英語單詞確定為漢語語料中心詞語的詞對(duì),建立中英雙語詞表。本發(fā)明的基于向量空間模型的英漢語料提取方法基于雙向向量空間模型,大大提高語言在翻譯過程中傳輸?shù)臏?zhǔn)確度。
技術(shù)研發(fā)人員:楊天地;徐冰;劉曲
受保護(hù)的技術(shù)使用者:錦州醫(yī)科大學(xué)
技術(shù)研發(fā)日:2017.06.06
技術(shù)公布日:2017.10.03