欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

翻譯文件的拆分和分配方法

文檔序號(hào):6362824閱讀:351來(lái)源:國(guó)知局
專利名稱:翻譯文件的拆分和分配方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種辦公文件拆分和分配方法,具體涉及翻譯文件的拆分和分配方法。
背景技術(shù)
對(duì)于現(xiàn)在的社會(huì),國(guó)際交上的交流成家常便飯。隨之帶來(lái)的翻譯量越來(lái)越大,文件 字?jǐn)?shù)越來(lái)越多。以現(xiàn)在CAT技術(shù)的流行,翻譯速度大大提升。但是在翻譯前的準(zhǔn)備過(guò)程往往占據(jù)了相當(dāng)長(zhǎng)的時(shí)間。例如對(duì)于翻譯公司來(lái)說(shuō),一份約3萬(wàn)字的文件分別給10個(gè)人做,在前期需要用時(shí)半天甚至更久的時(shí)間來(lái)完成文件拆分和分配。更嚴(yán)重的事,猶豫文字過(guò)多,很容易導(dǎo)致分割時(shí)視覺(jué)混淆導(dǎo)致拆分有誤。許多文件中會(huì)有很多段落是完全相同的,這樣翻譯只是多了一些無(wú)用的事。這樣無(wú)形的增加了翻譯成本。而目前市面上所有的拆分工具器目的是為了將文件化整為零,方便攜帶,其算法按字節(jié)流分割。此方法對(duì)文字的分割基本是無(wú)用的。所以翻譯界在翻譯文字過(guò)多文件時(shí)往往需要多個(gè)人同時(shí)進(jìn)行翻譯,翻譯前都會(huì)花大量時(shí)間用于文字的拆分。

發(fā)明內(nèi)容
本發(fā)明克服了現(xiàn)有技術(shù)的不足,提供一種對(duì)需要翻譯的文件進(jìn)行拆分和分配的方法,該方法將多種辦公文件按段算字?jǐn)?shù)的方法直接拆分成指定份數(shù),再分發(fā)給譯員進(jìn)行翻譯,而且在拆分之前先對(duì)是否有隱藏文件進(jìn)行處理,該方法從文件的分割,隱藏相同段落,到分配可以將整個(gè)時(shí)間減少到3-10分鐘。這樣就提高了翻譯效率,避免了重復(fù)翻譯,解決了現(xiàn)有技術(shù)中存在的技術(shù)問(wèn)題。為解決上述的技術(shù)問(wèn)題,本發(fā)明采用以下技術(shù)方案
一種翻譯文件的拆分和分配方法,包括以下步驟
步驟1,開(kāi)始;
步驟2,導(dǎo)入文件;
步驟3,進(jìn)行處理前需要的參數(shù)設(shè)置或采用默認(rèn)設(shè)置,包括設(shè)置誤差值D ;
步驟4,預(yù)處理,得到導(dǎo)入文件格式,打開(kāi)文件,檢測(cè)里面的內(nèi)容,分析出可分成的份數(shù)

步驟5,判斷用戶是否需要隱藏相同段落,如果是進(jìn)入步驟6,如果不是直接進(jìn)入步驟
7 ;
步驟6 :遍歷文件找出相同段落,去除相同段落;
步驟7 :根據(jù)步驟4或步驟6的處理后得到的可拆分份數(shù)進(jìn)行選擇,確定分成的份數(shù)為
N;步驟8 :導(dǎo)出拆分文件選擇路徑;
步驟9 :根據(jù)用戶所選份數(shù)N和用戶自定義參數(shù)設(shè)置或默認(rèn)參數(shù)設(shè)置進(jìn)行拆分,根據(jù)誤差百分比進(jìn)行以段為主,字?jǐn)?shù)為輔的拆分法,具體包括
步驟9-1,算出總字?jǐn)?shù)M和找出總段數(shù)G,用總字?jǐn)?shù)除以份數(shù)得到平均字?jǐn)?shù)A ;
步驟9-2,拆分出第一份依次遍歷第一至第G段,從第一段開(kāi)始,若第一段的字?jǐn)?shù)大于或等于A-A*D,則將第一段作為第一份拆分出來(lái),若第一段的字?jǐn)?shù)小于A-A*D,則計(jì)算第一段和第二段的總字?jǐn)?shù),若總字?jǐn)?shù)次大于或等于A-A*D,則將第一、二段作為第一份拆分出來(lái),若不是,則再計(jì)算第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第一份拆分出來(lái);
步驟9-3,拆分出第二份依次遍歷步驟9-2拆分之后余下的段落,從余下的第一段開(kāi)始,若余下第一段的字?jǐn)?shù)大于或等于A-A*D,則將余下的第一段作為第一份拆分出來(lái),若余下的第一段的字?jǐn)?shù)小于A-A*D,則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù),若總字?jǐn)?shù)大于或等于A-A*D,則將余下的第一、二段作為第一份拆分出來(lái),若不是,則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第二份拆分出來(lái);
步驟9-4,拆分出第三份依次遍歷步驟9-3拆分之后余下的段落,從余下的第一段開(kāi)始,若余下第一段的字?jǐn)?shù)大于或等于A-A*D,則將余下的第一段作為第一份拆分出來(lái),若余下的第一段的字?jǐn)?shù)小于A-A*D,則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù),若總字?jǐn)?shù)大于或等于A-A*D,則將余下的第一、二段作為第一份拆分出來(lái),若不是,則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第三份拆分出來(lái);
以此類推直至步驟9-N,拆分出第N-I份依次遍歷步驟9-N-2拆分之后余下的段落,從余下的第一段開(kāi)始,若余下第一段的字?jǐn)?shù)大于或等于A-A*D,則將余下的第一段作為第一份拆分出來(lái),若余下的第一段的字?jǐn)?shù)小于A-A*D,則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù),若總字?jǐn)?shù)大于或等于A-A*D,則將余下的第一、二段作為第一份拆分出來(lái),若不是,則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第N-I份拆分出來(lái);
步驟9-N+1,如果余下段落數(shù)目大于零,則將余下的段落拆分成第N份并進(jìn)入步驟10 ;如果當(dāng)進(jìn)行完步驟9-N后,余下段落數(shù)目為零時(shí),則提示客戶由于總字?jǐn)?shù)和總段數(shù)過(guò)少,需要將調(diào)整誤差值D調(diào)大,之后再回到步驟9-1重新開(kāi)始步驟9-1至步驟9-N+1,直至滿足拆成N份為止再進(jìn)入步驟10 ;或不計(jì)較拆分的份數(shù)少一份,而進(jìn)入步驟10 ;
步驟10,將拆分好的文件保存到用戶指定的路徑。更進(jìn)一步的技術(shù)方案是 所述的誤差值D的選擇范圍為4%-40%,當(dāng)文件字?jǐn)?shù)越多時(shí),誤差值就越小,而當(dāng)文
件字?jǐn)?shù)越少時(shí),誤差值D應(yīng)越大。所述的步驟9-N+1中,若余下段落的總字?jǐn)?shù)低于平均字?jǐn)?shù)的4%時(shí),則提示客戶拆分?jǐn)?shù)量過(guò)分不均,需要將調(diào)整誤差值D調(diào)大,需要回到步驟3將調(diào)整誤差值D調(diào)大,之后再回到步驟9-1重新開(kāi)始至步驟9-N+1,直至滿足拆成的第N份大于或等于平均字?jǐn)?shù)的4%為止。所述的總字?jǐn)?shù)包括標(biāo)點(diǎn)和文字。所述的總字?jǐn)?shù)僅包括文字,不包括標(biāo)點(diǎn)。所述的誤差值D可以通過(guò)公式70/A-N/G/10來(lái)進(jìn)行計(jì)算,若算出來(lái)的D小于4%,則將D設(shè)置為4%,若算出來(lái)的D大于40%,則將D設(shè)置為40%。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是
I、本申請(qǐng)涉及的翻譯文件拆分方法效率高,相同段隱藏可以節(jié)約翻譯成本。2、本申請(qǐng)涉及的翻譯文件拆分方法采用以段為主,字?jǐn)?shù)為輔的拆分法,并設(shè)置了滿足字?jǐn)?shù)拆分的合理拆分,既解決了以往由于斷句不完整 無(wú)法翻譯的問(wèn)題,同時(shí)也滿足了拆分精度的要求。解決了人為拆分耗時(shí)過(guò)大,加大項(xiàng)目成本的問(wèn)題。
具體實(shí)施例方式本發(fā)明涉及一種翻譯文件的拆分和分配方法,包括以下步驟
步驟1,開(kāi)始;
步驟2,導(dǎo)入文件;
步驟3,進(jìn)行處理前需要的參數(shù)設(shè)置或采用默認(rèn)設(shè)置,包括設(shè)置誤差值D ;
步驟4,預(yù)處理,得到導(dǎo)入文件格式,打開(kāi)文件,檢測(cè)里面的內(nèi)容,分析出可分成的份數(shù)最大值;此最大值不能大于總段數(shù);
步驟5,判斷用戶是否需要隱藏相同段落,如果是進(jìn)入步驟6,如果不是直接進(jìn)入步驟
7 ;
步驟6 :遍歷文件找出相同段落,去除相同段落;
步驟7 :根據(jù)步驟4或步驟6的處理后得到的可拆分份數(shù)進(jìn)行選擇,確定分成的份數(shù)為
N;
步驟8 :導(dǎo)出拆分文件選擇路徑;
步驟9 :根據(jù)用戶所選份數(shù)N和用戶自定義參數(shù)設(shè)置或默認(rèn)參數(shù)設(shè)置進(jìn)行拆分,根據(jù)誤差百分比進(jìn)行以段為主,字?jǐn)?shù)為輔的拆分法,具體包括
步驟9-1,算出總字?jǐn)?shù)M和找出總段數(shù)G,用總字?jǐn)?shù)除以份數(shù)得到平均字?jǐn)?shù)A ;
步驟9-2,拆分出第一份依次遍歷第一至第G段,從第一段開(kāi)始,若第一段的字?jǐn)?shù)大于或等于A-A*D,則將第一段作為第一份拆分出來(lái),若第一段的字?jǐn)?shù)小于A-A*D,則計(jì)算第一段和第二段的總字?jǐn)?shù),若總字?jǐn)?shù)次大于或等于A-A*D,則將第一、二段作為第一份拆分出來(lái),若不是,則再計(jì)算第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第一份拆分出來(lái);
步驟9-3,拆分出第二份依次遍歷步驟9-2拆分之后余下的段落,從余下的第一段開(kāi)始,若余下第一段的字?jǐn)?shù)大于或等于A-A*D,則將余下的第一段作為第一份拆分出來(lái),若余下的第一段的字?jǐn)?shù)小于A-A*D,則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù),若總字?jǐn)?shù)大于或等于A-A*D,則將余下的第一、二段作為第一份拆分出來(lái),若不是,則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第二份拆分出來(lái);步驟9-4,拆分出第三份依次遍歷步驟9-3拆分之后余下的段落,從余下的第一段開(kāi)始,若余下第一段的字?jǐn)?shù)大于或等于A-A*D,則將余下的第一段作為第一份拆分出來(lái),若余下的第一段的字?jǐn)?shù)小于A-A*D,則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù),若總字?jǐn)?shù)大于或等于A-A*D,則將余下的第一、二段作為第一份拆分出來(lái),若不是,則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第三份拆分出來(lái);
以此類推直至步驟9-N,拆分出第N-I份依次遍歷步驟9-N-2拆分之后余下的段落,從余下的第一段開(kāi)始,若余下第一段的字?jǐn)?shù)大于或等于A-A*D,則將余下的第一段作為第一份拆分出來(lái),若余下的第一段的字?jǐn)?shù)小于A-A*D,則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù),若總字?jǐn)?shù)大于或等于A-A*D,則將余下的第一、二段作為第一份拆分出來(lái),若不是,則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第N-I份拆分出來(lái);
步驟9-N+1,如果余下段落數(shù)目大于零,則將余下的段落拆分成第N份并進(jìn)入步驟10 ;如果當(dāng)進(jìn)行完步驟9-N后,余下段落數(shù)目為零時(shí),則提示客戶由于總字?jǐn)?shù)和總段數(shù)過(guò)少,需要回到步驟3將調(diào)整誤差值D調(diào)大,之后再回到步驟9-1重新開(kāi)始至步驟9-N+1,直至滿足拆成N份為止再進(jìn)入步驟10 ;或不計(jì)較份數(shù)直接忽略進(jìn)入步驟10 ;
在上面的步驟9-N+1中,若余下段落的總字?jǐn)?shù)低于平均字?jǐn)?shù)的4%時(shí),則提示客戶拆分?jǐn)?shù)量過(guò)分不均,需要將調(diào)整誤差值D調(diào)大,之后再回到步驟9-1重新開(kāi)始步驟9-1至步驟9-N+1,直至滿足拆成的第N份大于或等于平均字?jǐn)?shù)的4%為止。步驟10,將拆分好的文件保存到用戶指定的路徑。誤差值D的選擇范圍為4%——40%,當(dāng)文件字?jǐn)?shù)越多時(shí),誤差值就越小,而當(dāng)文件字?jǐn)?shù)越少時(shí),誤差值D應(yīng)越大。我們的總字?jǐn)?shù)即可以包括標(biāo)點(diǎn)和文字,也可以總字?jǐn)?shù)僅包括文字,不上述的誤差值D=70/A-N/G/10,若算出來(lái)的D小于4%,則將D設(shè)置為4%,若算出來(lái)的D大于40%,則將D設(shè)置為40%。
下面我們?cè)賮?lái)以一個(gè)具體的例子來(lái)對(duì)步驟9的詳細(xì)過(guò)程進(jìn)行舉例說(shuō)明。舉例I ;我們有10段文字需要拆分成5份。 第一段文字有120個(gè)字,第二段文字有100個(gè)字,第三段文字有50個(gè)字,第四段文字有60個(gè)字,第五段文字有77個(gè)字。第六段文字有88個(gè)字,第七段文字有200個(gè)字,第八段文字有90個(gè)字,第九段文字有10個(gè)字,第十段文字有98個(gè)字。假設(shè)我們先將誤差值D設(shè)置為10%。此十段總字?jǐn)?shù)為893個(gè)字。由于要分成5份,平均每份算出來(lái)即為178.6個(gè)字。需要滿足的條件為每一份字?jǐn)?shù)大于或等于178. 6-178. 6*10%=160. 74 個(gè)字。接著我們開(kāi)始進(jìn)行拆分第一份,先看第一段文字有120個(gè)字,不滿足字?jǐn)?shù)條件,需要繼續(xù)。則將第一、二段總字?jǐn)?shù)算出來(lái)為220個(gè)字,滿足字?jǐn)?shù)條件,將第一、二段作為第一份拆分出來(lái)。拆分第二份,第三段文字有50個(gè)字,不滿足字?jǐn)?shù)條件,需要繼續(xù)。將第三、四段總字?jǐn)?shù)算出來(lái)為110個(gè)字,還是不滿足字?jǐn)?shù)條件,再將第三、四、五段總字?jǐn)?shù)算出來(lái)為187個(gè)字,滿足了字?jǐn)?shù)條件,馬上將第三、四、五段作為第二份拆分出來(lái)。
按照同樣方法,就會(huì)將第五、六段作為第三份拆分出來(lái),第七至第十段作為第四份拆分出來(lái)。此時(shí)會(huì)有提示客戶由于總字?jǐn)?shù)和總段數(shù)過(guò)少,需要將調(diào)整誤差值D調(diào)大,我們回到之前的步驟3將誤差值設(shè)置為20%,則需要滿足的字?jǐn)?shù)條件為大于或等于142. 88。這樣分下來(lái)的結(jié)果還是和剛才一樣。當(dāng)我們將誤差設(shè)置為30%時(shí),需要滿足的字?jǐn)?shù)條件為大于或等于125. 02。這樣分下來(lái)的結(jié)果還是和剛才一樣。當(dāng)我們將誤差值設(shè)置為35%時(shí),需要滿足的字?jǐn)?shù)條件為大于或等于116. 09。這樣的話,第一段拆分成第一份,第二、三拆分成第二份,第四、五段拆分成第三份,第六、七段拆分成第四份,余下為第五份。舉例2
舉例2 ;我們有40段文字需要拆分成5份。第一段文字有20個(gè)字,第二段文字有276個(gè)字,第三段文字有99個(gè)字,第四段文字有18個(gè)字,第五段文字有60個(gè)字。第六段文字有403個(gè)字,第七段文字有112個(gè)字,第八段文字有39個(gè)字,第九段文字有198個(gè)字,第十段文字有298個(gè)字,第H^一段文字有120個(gè)字,第十二段文字有100個(gè)字,第十三段文字有275個(gè)字,第十四段文字有255個(gè)字,第十五段文字有87個(gè)字。第十六段文字有54個(gè)字,第十七段文字有67個(gè)字,第十八段文字有566個(gè)字,第十九段文字有135個(gè)字,第二十段文字有248個(gè)字,第二i^一段文字有75個(gè)字,第二十二段文字有95個(gè)字,第二十三段文字有321個(gè)字,第二十四段文字有15個(gè)字,第二十五段文字有271個(gè)字,第二十六段文字有245個(gè)字,第二十七段文字有76個(gè)字,第二十八段文字有435個(gè)字,第二十九段文字有291個(gè)字,第三十段文字有156個(gè)字,第三i^一段文字有86個(gè)字,第三十二段文字有93個(gè)字,第三十三段文字有111個(gè)字,第三十四段文字有8個(gè)字,第三十五段文字有448個(gè)字。第三十六段文字有67個(gè)字,第三十七段文字有38個(gè)字,第三十八段文字有29個(gè)字,第三十九段文字有89個(gè)字,第四十段文字有7個(gè)字。根據(jù)誤差值計(jì)算公式得到D=70/1277. 2-5/40/10=0. 04。此十段總字?jǐn)?shù)為6386個(gè)字。由于要分成5份,平均每份算出來(lái)即為1277. 2個(gè)字。需要滿足的條件為每一份字?jǐn)?shù)大于或等于 1277. 2-1277. 2*4%=1220. 2 個(gè)字。接著我們開(kāi)始進(jìn)行拆分第一份,先看第一段文字有20個(gè)字,不滿足字?jǐn)?shù)條件,需要繼續(xù)。則將第一、二段總字?jǐn)?shù)算出來(lái)為296個(gè)字,還是不滿足字?jǐn)?shù)條件,需要繼續(xù)。再將第一、二、三段總字?jǐn)?shù)算出來(lái)為395,還是不滿足字?jǐn)?shù)條件,需要繼續(xù)。再將第一、二、三、四段總字?jǐn)?shù)算出來(lái)為413,還是不滿足字?jǐn)?shù)條件,需要繼續(xù)。再將第一、二、三、四、五段總字?jǐn)?shù)算出來(lái)為473,還是不滿足字?jǐn)?shù)條件,需要繼續(xù)。再將第一、二、三、四、五、六段總字?jǐn)?shù)算出來(lái)為876,還是不滿足字?jǐn)?shù)條件,需要繼續(xù)。再將第一、二、三、四、五、六、七段總字?jǐn)?shù)算出來(lái)為988,還是不滿足字?jǐn)?shù)條件,需要繼續(xù)。再將第一、二、三、四、五、六、七、八段總字?jǐn)?shù)算出來(lái)為1027,還是不滿足字?jǐn)?shù)條件,需要繼續(xù)。再將第一、二、三、四、五、六、七、八、九段總字?jǐn)?shù)算出來(lái)為1225,滿足了字?jǐn)?shù)條件,將第一至九段作為第一份拆分出來(lái)。
拆分第二份,第十段文字有298個(gè)字,不滿足字?jǐn)?shù)條件,需要繼續(xù)。將十、十一段總字?jǐn)?shù)算出來(lái)為418個(gè)字,還是不滿足字?jǐn)?shù)條件,再將第十、十一、十二段總字?jǐn)?shù)算出來(lái)為518個(gè)字,還是不滿足字?jǐn)?shù)條件,再將第十、十一、十二、十三段總字?jǐn)?shù)算出來(lái)為793個(gè)字,還是不滿足字?jǐn)?shù)條件,再將第十、十一、十二、十三、十四段總字?jǐn)?shù)算出來(lái)為1048個(gè)字,還是不滿足字?jǐn)?shù)條件,再將第十、十一、十二、十三、十四、十五段總字?jǐn)?shù)算出來(lái)為1135個(gè)字,還是不滿足字?jǐn)?shù)條件,再將第十、十一、十二、十三、十四、十五、十六段總字?jǐn)?shù)算出來(lái)為1189個(gè)字,還是不滿足字?jǐn)?shù)條件,再將第十、十一、十二、十三、十四、十五、十六、十七段總字?jǐn)?shù)算出來(lái)為1256個(gè)字,滿足了字?jǐn)?shù)條件,馬上將第十至十七段作為第二份拆分出來(lái)。
按照同樣方法,就會(huì)將第十八至二十三段作為第三份拆分出來(lái),第二十四至第二十九段作為第四份拆分出來(lái)。第三十至四十段作為第五份拆分出來(lái)。第三份、第四份、第五份的字?jǐn)?shù)分別為1440個(gè)字、1333個(gè)字和1132個(gè)字。
權(quán)利要求
1.一種翻譯文件的拆分和分配方法,其特征在于包括以下步驟 步驟1,開(kāi)始; 步驟2,導(dǎo)入文件; 步驟3,進(jìn)行處理前需要的參數(shù)設(shè)置或采用默認(rèn)設(shè)置,包括設(shè)置誤差值D ; 步驟4,預(yù)處理,得到導(dǎo)入文件格式,打開(kāi)文件,檢測(cè)里面的內(nèi)容,分析出可分成的份數(shù)最大值; 步驟5,判斷用戶是否需要隱藏相同段落,如果是進(jìn)入步驟6,如果不是直接進(jìn)入步驟7 ; 步驟6 :遍歷文件找出相同段落,去除相同段落; 步驟7 :根據(jù)步驟4或步驟6的處理后得到的可拆分份數(shù)進(jìn)行選擇,確定需要拆分成的份數(shù)N ; 步驟8 :導(dǎo)出拆分文件選擇路徑; 步驟9 :根據(jù)用戶所選的需要拆分成的份數(shù)N和用戶自定義參數(shù)設(shè)置或默認(rèn)參數(shù)設(shè)置進(jìn)行拆分,根據(jù)誤差值D進(jìn)行以段為主,字?jǐn)?shù)為輔的拆分法,具體包括 步驟9-1,算出總字?jǐn)?shù)M和找出總段數(shù)G,用總字?jǐn)?shù)除以份數(shù)得到平均字?jǐn)?shù)A ; 步驟9-2,拆分出第一份依次遍歷第一至第G段,從第一段開(kāi)始,若第一段的字?jǐn)?shù)大于或等于A-A*D,則將第一段作為第一份拆分出來(lái),若第一段的字?jǐn)?shù)小于A-A*D,則計(jì)算第一段和第二段的總字?jǐn)?shù),若總字?jǐn)?shù)次大于或等于A-A*D,則將第一、二段作為第一份拆分出來(lái),若不是,則再計(jì)算第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第一份拆分出來(lái); 步驟9-3,拆分出第二份依次遍歷步驟9-2拆分之后余下的段落,從余下的第一段開(kāi)始,若余下第一段的字?jǐn)?shù)大于或等于A-A*D,則將余下的第一段作為第一份拆分出來(lái),若余下的第一段的字?jǐn)?shù)小于A-A*D,則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù),若總字?jǐn)?shù)大于或等于A-A*D,則將余下的第一、二段作為第一份拆分出來(lái),若不是,則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第二份拆分出來(lái); 步驟9-4,拆分出第三份依次遍歷步驟9-3拆分之后余下的段落,從余下的第一段開(kāi)始,若余下第一段的字?jǐn)?shù)大于或等于A-A*D,則將余下的第一段作為第一份拆分出來(lái),若余下的第一段的字?jǐn)?shù)小于A-A*D,則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù),若總字?jǐn)?shù)大于或等于A-A*D,則將余下的第一、二段作為第一份拆分出來(lái),若不是,則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第三份拆分出來(lái); 以此類推直至步驟9-N,拆分出第N-I份依次遍歷步驟9-N-2拆分之后余下的段落,從余下的第一段開(kāi)始,若余下第一段的字?jǐn)?shù)大于或等于A-A*D,則將余下的第一段作為第一份拆分出來(lái),若余下的第一段的字?jǐn)?shù)小于A-A*D,則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù),若總字?jǐn)?shù)大于或等于A-A*D,則將余下的第一、二段作為第一份拆分出來(lái),若不是,則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D,就可以將第N-I份拆分出來(lái);步驟9-N+1,如果余下段落數(shù)目大于零,則將余下的段落拆分成第N份并進(jìn)入步驟10 ;如果當(dāng)進(jìn)行完步驟9-N后,余下段落數(shù)目為零時(shí),則提示客戶由于總字?jǐn)?shù)和總段數(shù)過(guò)少,需要回到步驟3將調(diào)整誤差值D調(diào)大,之后再回到步驟9-1重新開(kāi)始至步驟9-N+1,直至滿足拆成N份為止再進(jìn)入步驟10; 步驟10,將拆分好的文件保存到用戶指定的路徑。
2.根據(jù)權(quán)利要求I所述的翻譯文件的拆分和分配方法,其特征在于所述的誤差值D的選擇范圍為4%-40%,當(dāng)文件字?jǐn)?shù)越多時(shí),誤差值就越小,而當(dāng)文件字?jǐn)?shù)越少時(shí),誤差值D應(yīng)越大。
3.根據(jù)權(quán)利要求I所述的翻譯文件的拆分和分配方法,其特征在于所述的步驟9-N+1中,若余下段落的總字?jǐn)?shù)低于平均字?jǐn)?shù)的4%時(shí),則提示客戶拆分?jǐn)?shù)量過(guò)分不均,需要將調(diào)整誤差值D調(diào)大,之后再回到步驟9-1重新開(kāi)始步驟9-1至步驟9-N+1,直至滿足拆成的第N份大于或等于平均字?jǐn)?shù)的4%為止。
4.根據(jù)權(quán)利要求I所述的翻譯文件的拆分和分配方法,其特征在于所述的總字?jǐn)?shù)包括標(biāo)點(diǎn)和文字。
5.根據(jù)權(quán)利要求I所述的翻譯文件的拆分和分配方法,其特征在于所述的總字?jǐn)?shù)僅包括文字,不包括標(biāo)點(diǎn)。
6.根據(jù)權(quán)利要求2所述的翻譯文件的拆分和分配方法,其特征在于所述的誤差值D=70/A-N/G/10,若算出來(lái)的D小于4%,則將D設(shè)置為4%,若算出來(lái)的D大于40%,則將D設(shè)置為40%。
全文摘要
本發(fā)明公開(kāi)了一種翻譯文件的拆分和分配方法,包括以下步驟開(kāi)始;導(dǎo)入文件;進(jìn)行處理前需要的參數(shù)設(shè)置或采用默認(rèn)設(shè)置,包括設(shè)置誤差值D;預(yù)處理,得到導(dǎo)入文件格式,打開(kāi)文件,檢測(cè)里面的內(nèi)容,分析出可分成的份數(shù)最大值;判斷用戶是否需要隱藏相同段落,遍歷文件找出相同段落,去除相同段落;確定需要拆分成的份數(shù)N;導(dǎo)出拆分文件選擇路徑;根據(jù)用戶所選的需要拆分成的份數(shù)N和用戶自定義參數(shù)設(shè)置或默認(rèn)參數(shù)設(shè)置進(jìn)行拆分,根據(jù)誤差值D進(jìn)行以段為主,字?jǐn)?shù)為輔的拆分法。本發(fā)明設(shè)置了滿足字?jǐn)?shù)拆分的合理拆分,既解決了以往由于斷句不完整無(wú)法翻譯的問(wèn)題,同時(shí)也滿足了拆分精度的要求。解決了人為拆分耗時(shí)過(guò)大,加大項(xiàng)目成本的問(wèn)題。
文檔編號(hào)G06F17/27GK102622340SQ201210085140
公開(kāi)日2012年8月1日 申請(qǐng)日期2012年3月28日 優(yōu)先權(quán)日2012年3月28日
發(fā)明者伍華, 張馬成, 楊明, 王興強(qiáng), 王小龍 申請(qǐng)人:成都優(yōu)譯信息技術(shù)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
承德市| 时尚| 思茅市| 雅安市| 漠河县| 治多县| 安图县| 辽中县| 轮台县| 秦安县| 福清市| 攀枝花市| 庄河市| 达日县| 宁远县| 安仁县| 咸丰县| 阜阳市| 兴海县| 泰州市| 吉林市| 平潭县| 惠州市| 阿荣旗| 永昌县| 武隆县| 和静县| 富蕴县| 泽库县| 彰化县| 乌鲁木齐市| 富裕县| 平阳县| 定边县| 敦煌市| 永嘉县| 长治市| 虹口区| 龙海市| 成武县| 肥乡县|