欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種文檔稿件中語(yǔ)句標(biāo)注的方法

文檔序號(hào):6526711閱讀:449來(lái)源:國(guó)知局
一種文檔稿件中語(yǔ)句標(biāo)注的方法
【專利摘要】本發(fā)明公開(kāi)了一種文檔稿件中語(yǔ)句標(biāo)注的方法,包括:確定源文檔及與所述源文檔具有映射關(guān)系的譯稿,掃描出所述源文檔中出現(xiàn)的所有語(yǔ)句;根據(jù)分析到的每個(gè)語(yǔ)句中的詞匯參數(shù)和語(yǔ)句參數(shù)計(jì)算出每個(gè)語(yǔ)句的屬性參數(shù);將所述屬性參數(shù)值大于預(yù)定閾值的語(yǔ)句在所述源文檔及其譯稿中均進(jìn)行標(biāo)注。本發(fā)明解決了無(wú)法對(duì)文檔中的翻譯難點(diǎn)進(jìn)行統(tǒng)一標(biāo)注的問(wèn)題,并且提高了對(duì)語(yǔ)句標(biāo)注的準(zhǔn)確性,同時(shí)節(jié)省了所需要的大量人力資源。
【專利說(shuō)明】一種文檔稿件中語(yǔ)句標(biāo)注的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及翻譯【技術(shù)領(lǐng)域】,具體而言,涉及一種文檔稿件中語(yǔ)句標(biāo)注的方法。
【背景技術(shù)】 [0002]對(duì)譯稿進(jìn)行審校是翻譯流程中非常重要的環(huán)節(jié),為保證翻譯質(zhì)量,一個(gè)完整的翻譯流程對(duì)翻譯稿件一般會(huì)有1-2次的審校過(guò)程。一般情況下,通過(guò)校對(duì)人員找到并標(biāo)注翻譯過(guò)程中出現(xiàn)的問(wèn)題,然后由審校人員進(jìn)行審閱并解決,這些翻譯過(guò)程中出現(xiàn)的問(wèn)題主要包括:翻譯難點(diǎn)、專業(yè)術(shù)語(yǔ)的一致性、源語(yǔ)言句子錯(cuò)誤、源語(yǔ)言上下文不一致等。對(duì)翻譯難點(diǎn)的判定和標(biāo)注是其中最常見(jiàn)也是最重要的問(wèn)題,普通對(duì)于翻譯難點(diǎn)判斷和標(biāo)注是通過(guò)校正人員人工發(fā)現(xiàn)并標(biāo)注的方法來(lái)實(shí)現(xiàn),這種方法由于不同校對(duì)人員對(duì)于翻譯難度的理解不一致,相對(duì)比較主觀,無(wú)法做到準(zhǔn)確、一致,同時(shí)這個(gè)過(guò)程也需要耗費(fèi)大量的人力。

【發(fā)明內(nèi)容】

[0003]本發(fā)明旨在提供一種文檔稿件中語(yǔ)句標(biāo)注的方法,解決了無(wú)法對(duì)翻譯難點(diǎn)進(jìn)行準(zhǔn)確、一致的標(biāo)記的問(wèn)題。
[0004]本發(fā)明公開(kāi)了一種文檔稿件中語(yǔ)句標(biāo)注的方法,包括:
[0005]確定源文檔及與所述源文檔具有映射關(guān)系的譯稿,掃描出所述源文檔中出現(xiàn)的所有語(yǔ)句;
[0006]根據(jù)分析到的每個(gè)語(yǔ)句中的詞匯參數(shù)和語(yǔ)句參數(shù)計(jì)算出每個(gè)語(yǔ)句的屬性參數(shù);
[0007]將所述屬性參數(shù)值大于預(yù)定閾值的語(yǔ)句在所述源文檔及其譯稿中均進(jìn)行標(biāo)注。
[0008]優(yōu)選地,所述詞匯參數(shù)至少包括:
[0009]詞匯等級(jí)、習(xí)語(yǔ)數(shù)和實(shí)義詞密度。
[0010]優(yōu)選地,分析所述詞匯等級(jí)的過(guò)程包括:
[0011]掃描出所述語(yǔ)句中的所有詞匯;
[0012]將得到的每個(gè)所述詞匯在詞匯分級(jí)表中進(jìn)行匹配,得到每個(gè)所述詞匯的詞匯級(jí)別;所述詞匯級(jí)別為一級(jí)、二級(jí)、三級(jí)或四級(jí);
[0013]分別統(tǒng)計(jì)所述詞匯級(jí)別為二級(jí)或二級(jí)以上的級(jí)別的所述詞匯的數(shù)量;
[0014]按照詞匯等級(jí)計(jì)算公式計(jì)算出所述語(yǔ)句的詞匯等級(jí),所述詞匯等級(jí)計(jì)算公式如下:
[0015]
【權(quán)利要求】
1.一種文檔稿件中語(yǔ)句標(biāo)注的方法,其特征在于,包括: 確定源文檔及與所述源文檔具有映射關(guān)系的譯稿,掃描出所述源文檔中出現(xiàn)的所有語(yǔ)句; 根據(jù)分析到的每個(gè)語(yǔ)句中的詞匯參數(shù)和語(yǔ)句參數(shù)計(jì)算出每個(gè)語(yǔ)句的屬性參數(shù); 將所述屬性參數(shù)值大于預(yù)定閾值的語(yǔ)句在所述源文檔及其譯稿中均進(jìn)行標(biāo)注。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述詞匯參數(shù)至少包括: 詞匯等級(jí)、習(xí)語(yǔ)數(shù)和實(shí)義詞密度。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,分析所述詞匯等級(jí)的過(guò)程包括: 掃描出所述語(yǔ)句中的所有詞匯; 將得到的每個(gè)所述詞匯在詞匯分級(jí)表中進(jìn)行匹配,得到每個(gè)所述詞匯的詞匯級(jí)別;所述詞匯級(jí)別為一級(jí)、二級(jí)、三級(jí)或四級(jí); 分別統(tǒng)計(jì)所述詞匯級(jí)別為二級(jí)或二級(jí)以上的級(jí)別的所述詞匯的數(shù)量; 按照詞匯等級(jí)計(jì)算公式計(jì)算出所述語(yǔ)句的詞匯等級(jí),所述詞匯等級(jí)計(jì)算公式如下:
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,分析語(yǔ)句中的實(shí)義詞密度的過(guò)程包括: 確定所述語(yǔ)句中的所有詞匯,并對(duì)每個(gè)詞匯進(jìn)行詞性標(biāo)注,篩選出所述詞匯中的所有實(shí)義詞; 將得到的所有所述實(shí)義詞按照一定順序進(jìn)行排列; 根據(jù)同義詞本體工具得到每個(gè)所述實(shí)義詞的義項(xiàng)數(shù)meaningSi,并統(tǒng)計(jì)所述實(shí)義詞的義項(xiàng)總數(shù);其中i為所述實(shí)義詞的序號(hào); 按照實(shí)義詞詞義密度計(jì)算公式計(jì)算,得到所述語(yǔ)句的實(shí)義詞詞義密度;所述實(shí)義詞詞義密度計(jì)算公式如下:
5.根據(jù)權(quán)利要求2的方法,其特征在于,分析所述語(yǔ)句中的習(xí)語(yǔ)數(shù)的過(guò)程包括: 通過(guò)習(xí)語(yǔ)本體工具找到所述語(yǔ)句中的所有習(xí)語(yǔ),并統(tǒng)計(jì)所述習(xí)語(yǔ)的數(shù)量。
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述語(yǔ)句參數(shù)至少包括: 語(yǔ)句長(zhǎng)度、語(yǔ)句中的子句數(shù)和所述子句的平均長(zhǎng)度。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述語(yǔ)句中的詞匯數(shù)量作為所述語(yǔ)句長(zhǎng)度。
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,分析所述語(yǔ)句的子句平均長(zhǎng)度的過(guò)程包括: 統(tǒng)計(jì)所述語(yǔ)句中的子句數(shù)量;將所述語(yǔ)句中的詞匯總數(shù)除以所述子句數(shù)量,結(jié)果作為所述子句的平均長(zhǎng)度。
9.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述語(yǔ)句的屬性參數(shù)為翻譯難度值; 計(jì)算所述翻譯難度值的過(guò)程包括: 根據(jù)翻譯難度計(jì)算公式計(jì)算,得到語(yǔ)句的翻譯難度值;所述翻譯難度計(jì)算公式如下:Ciiffsentence = K1 *word+K2 *gradeword+K3 *densitynotional+K4 eCount-Clause+^ *MLC+K6 *countidiom ; 其中,diff—sentence為所述語(yǔ)句的翻譯難度值,word為所述語(yǔ)句的句長(zhǎng),grade—word為所述語(yǔ)句的詞匯等級(jí),density—notional為所述語(yǔ)句的實(shí)義詞密度,count—clause為所述語(yǔ)句的子句數(shù),MLC為語(yǔ)句中的子句的平均長(zhǎng)度,count—idiom為所述語(yǔ)句的習(xí)語(yǔ)數(shù),K1ΛK2、K3、K4、K5和K6為語(yǔ)句翻譯難`度調(diào)節(jié)系數(shù)。
【文檔編號(hào)】G06F17/27GK103729344SQ201310746427
【公開(kāi)日】2014年4月16日 申請(qǐng)日期:2013年12月30日 優(yōu)先權(quán)日:2013年12月30日
【發(fā)明者】江潮 申請(qǐng)人:傳神聯(lián)合(北京)信息技術(shù)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
临颍县| 象山县| 泰和县| 宜兴市| 峨眉山市| 武宁县| 高台县| 汤阴县| 巩留县| 阜阳市| 博白县| 大邑县| 景泰县| 运城市| 玉龙| 大荔县| 剑川县| 大足县| 贺州市| 永平县| 嘉峪关市| 公安县| 浏阳市| 印江| 郧西县| 大田县| 建始县| 堆龙德庆县| 美姑县| 庄浪县| 新化县| 凤庆县| 砚山县| 新干县| 乡宁县| 津市市| 双桥区| 乐都县| 营山县| 聂荣县| 阳江市|