翻譯文件的拆分和分配方法

文檔序號(hào)：6362824閱讀：351來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：翻譯文件的拆分和分配方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種辦公文件拆分和分配方法，具體涉及翻譯文件的拆分和分配方法。
背景技術(shù)：
對(duì)于現(xiàn)在的社會(huì)，國(guó)際交上的交流成家常便飯。隨之帶來(lái)的翻譯量越來(lái)越大，文件字?jǐn)?shù)越來(lái)越多。以現(xiàn)在CAT技術(shù)的流行，翻譯速度大大提升。但是在翻譯前的準(zhǔn)備過(guò)程往往占據(jù)了相當(dāng)長(zhǎng)的時(shí)間。例如對(duì)于翻譯公司來(lái)說(shuō)，一份約3萬(wàn)字的文件分別給10個(gè)人做，在前期需要用時(shí)半天甚至更久的時(shí)間來(lái)完成文件拆分和分配。更嚴(yán)重的事，猶豫文字過(guò)多，很容易導(dǎo)致分割時(shí)視覺(jué)混淆導(dǎo)致拆分有誤。許多文件中會(huì)有很多段落是完全相同的，這樣翻譯只是多了一些無(wú)用的事。這樣無(wú)形的增加了翻譯成本。而目前市面上所有的拆分工具器目的是為了將文件化整為零，方便攜帶，其算法按字節(jié)流分割。此方法對(duì)文字的分割基本是無(wú)用的。所以翻譯界在翻譯文字過(guò)多文件時(shí)往往需要多個(gè)人同時(shí)進(jìn)行翻譯，翻譯前都會(huì)花大量時(shí)間用于文字的拆分。

發(fā)明內(nèi)容
本發(fā)明克服了現(xiàn)有技術(shù)的不足，提供一種對(duì)需要翻譯的文件進(jìn)行拆分和分配的方法，該方法將多種辦公文件按段算字?jǐn)?shù)的方法直接拆分成指定份數(shù)，再分發(fā)給譯員進(jìn)行翻譯，而且在拆分之前先對(duì)是否有隱藏文件進(jìn)行處理，該方法從文件的分割，隱藏相同段落，到分配可以將整個(gè)時(shí)間減少到3-10分鐘。這樣就提高了翻譯效率，避免了重復(fù)翻譯，解決了現(xiàn)有技術(shù)中存在的技術(shù)問(wèn)題。為解決上述的技術(shù)問(wèn)題，本發(fā)明采用以下技術(shù)方案
一種翻譯文件的拆分和分配方法，包括以下步驟
步驟1，開(kāi)始；
步驟2，導(dǎo)入文件；
步驟3，進(jìn)行處理前需要的參數(shù)設(shè)置或采用默認(rèn)設(shè)置，包括設(shè)置誤差值D ；
步驟4，預(yù)處理，得到導(dǎo)入文件格式，打開(kāi)文件，檢測(cè)里面的內(nèi)容，分析出可分成的份數(shù)

步驟5，判斷用戶是否需要隱藏相同段落，如果是進(jìn)入步驟6，如果不是直接進(jìn)入步驟
7 ；
步驟6 :遍歷文件找出相同段落，去除相同段落；
步驟7 :根據(jù)步驟4或步驟6的處理后得到的可拆分份數(shù)進(jìn)行選擇，確定分成的份數(shù)為
N；步驟8 :導(dǎo)出拆分文件選擇路徑；
步驟9 :根據(jù)用戶所選份數(shù)N和用戶自定義參數(shù)設(shè)置或默認(rèn)參數(shù)設(shè)置進(jìn)行拆分，根據(jù)誤差百分比進(jìn)行以段為主，字?jǐn)?shù)為輔的拆分法，具體包括
步驟9-1，算出總字?jǐn)?shù)M和找出總段數(shù)G，用總字?jǐn)?shù)除以份數(shù)得到平均字?jǐn)?shù)A ;
步驟9-2，拆分出第一份依次遍歷第一至第G段，從第一段開(kāi)始，若第一段的字?jǐn)?shù)大于或等于A-A*D，則將第一段作為第一份拆分出來(lái)，若第一段的字?jǐn)?shù)小于A-A*D，則計(jì)算第一段和第二段的總字?jǐn)?shù)，若總字?jǐn)?shù)次大于或等于A-A*D，則將第一、二段作為第一份拆分出來(lái)，若不是，則再計(jì)算第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D，就可以將第一份拆分出來(lái)；
步驟9-3，拆分出第二份依次遍歷步驟9-2拆分之后余下的段落，從余下的第一段開(kāi)始，若余下第一段的字?jǐn)?shù)大于或等于A-A*D，則將余下的第一段作為第一份拆分出來(lái)，若余下的第一段的字?jǐn)?shù)小于A-A*D，則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù)，若總字?jǐn)?shù)大于或等于A-A*D，則將余下的第一、二段作為第一份拆分出來(lái)，若不是，則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D，就可以將第二份拆分出來(lái)；
步驟9-4，拆分出第三份依次遍歷步驟9-3拆分之后余下的段落，從余下的第一段開(kāi)始，若余下第一段的字?jǐn)?shù)大于或等于A-A*D，則將余下的第一段作為第一份拆分出來(lái)，若余下的第一段的字?jǐn)?shù)小于A-A*D，則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù)，若總字?jǐn)?shù)大于或等于A-A*D，則將余下的第一、二段作為第一份拆分出來(lái)，若不是，則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D，就可以將第三份拆分出來(lái)；
以此類推直至步驟9-N，拆分出第N-I份依次遍歷步驟9-N-2拆分之后余下的段落，從余下的第一段開(kāi)始，若余下第一段的字?jǐn)?shù)大于或等于A-A*D，則將余下的第一段作為第一份拆分出來(lái)，若余下的第一段的字?jǐn)?shù)小于A-A*D，則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù)，若總字?jǐn)?shù)大于或等于A-A*D，則將余下的第一、二段作為第一份拆分出來(lái)，若不是，則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D，就可以將第N-I份拆分出來(lái)；
步驟9-N+1，如果余下段落數(shù)目大于零，則將余下的段落拆分成第N份并進(jìn)入步驟10 ；如果當(dāng)進(jìn)行完步驟9-N后，余下段落數(shù)目為零時(shí)，則提示客戶由于總字?jǐn)?shù)和總段數(shù)過(guò)少，需要將調(diào)整誤差值D調(diào)大，之后再回到步驟9-1重新開(kāi)始步驟9-1至步驟9-N+1，直至滿足拆成N份為止再進(jìn)入步驟10 ;或不計(jì)較拆分的份數(shù)少一份，而進(jìn)入步驟10 ；
步驟10，將拆分好的文件保存到用戶指定的路徑。更進(jìn)一步的技術(shù)方案是所述的誤差值D的選擇范圍為4%-40%,當(dāng)文件字?jǐn)?shù)越多時(shí),誤差值就越小，而當(dāng)文
件字?jǐn)?shù)越少時(shí)，誤差值D應(yīng)越大。所述的步驟9-N+1中，若余下段落的總字?jǐn)?shù)低于平均字?jǐn)?shù)的4%時(shí)，則提示客戶拆分?jǐn)?shù)量過(guò)分不均，需要將調(diào)整誤差值D調(diào)大，需要回到步驟3將調(diào)整誤差值D調(diào)大，之后再回到步驟9-1重新開(kāi)始至步驟9-N+1，直至滿足拆成的第N份大于或等于平均字?jǐn)?shù)的4%為止。所述的總字?jǐn)?shù)包括標(biāo)點(diǎn)和文字。所述的總字?jǐn)?shù)僅包括文字，不包括標(biāo)點(diǎn)。所述的誤差值D可以通過(guò)公式70/A-N/G/10來(lái)進(jìn)行計(jì)算，若算出來(lái)的D小于4%，則將D設(shè)置為4%，若算出來(lái)的D大于40%，則將D設(shè)置為40%。
與現(xiàn)有技術(shù)相比，本發(fā)明的有益效果是
I、本申請(qǐng)涉及的翻譯文件拆分方法效率高，相同段隱藏可以節(jié)約翻譯成本。2、本申請(qǐng)涉及的翻譯文件拆分方法采用以段為主，字?jǐn)?shù)為輔的拆分法，并設(shè)置了滿足字?jǐn)?shù)拆分的合理拆分，既解決了以往由于斷句不完整無(wú)法翻譯的問(wèn)題，同時(shí)也滿足了拆分精度的要求。解決了人為拆分耗時(shí)過(guò)大，加大項(xiàng)目成本的問(wèn)題。
具體實(shí)施例方式本發(fā)明涉及一種翻譯文件的拆分和分配方法，包括以下步驟
步驟1，開(kāi)始；
步驟2，導(dǎo)入文件；
步驟3，進(jìn)行處理前需要的參數(shù)設(shè)置或采用默認(rèn)設(shè)置，包括設(shè)置誤差值D ；
步驟4，預(yù)處理，得到導(dǎo)入文件格式，打開(kāi)文件，檢測(cè)里面的內(nèi)容，分析出可分成的份數(shù)最大值；此最大值不能大于總段數(shù)；
步驟5，判斷用戶是否需要隱藏相同段落，如果是進(jìn)入步驟6，如果不是直接進(jìn)入步驟
7 ；
步驟6 :遍歷文件找出相同段落，去除相同段落；
步驟7 :根據(jù)步驟4或步驟6的處理后得到的可拆分份數(shù)進(jìn)行選擇，確定分成的份數(shù)為
N；
步驟8 :導(dǎo)出拆分文件選擇路徑；
步驟9 :根據(jù)用戶所選份數(shù)N和用戶自定義參數(shù)設(shè)置或默認(rèn)參數(shù)設(shè)置進(jìn)行拆分，根據(jù)誤差百分比進(jìn)行以段為主，字?jǐn)?shù)為輔的拆分法，具體包括
步驟9-1，算出總字?jǐn)?shù)M和找出總段數(shù)G，用總字?jǐn)?shù)除以份數(shù)得到平均字?jǐn)?shù)A ;
步驟9-2，拆分出第一份依次遍歷第一至第G段，從第一段開(kāi)始，若第一段的字?jǐn)?shù)大于或等于A-A*D，則將第一段作為第一份拆分出來(lái)，若第一段的字?jǐn)?shù)小于A-A*D，則計(jì)算第一段和第二段的總字?jǐn)?shù)，若總字?jǐn)?shù)次大于或等于A-A*D，則將第一、二段作為第一份拆分出來(lái)，若不是，則再計(jì)算第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D，就可以將第一份拆分出來(lái)；
步驟9-3，拆分出第二份依次遍歷步驟9-2拆分之后余下的段落，從余下的第一段開(kāi)始，若余下第一段的字?jǐn)?shù)大于或等于A-A*D，則將余下的第一段作為第一份拆分出來(lái)，若余下的第一段的字?jǐn)?shù)小于A-A*D，則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù)，若總字?jǐn)?shù)大于或等于A-A*D，則將余下的第一、二段作為第一份拆分出來(lái)，若不是，則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D，就可以將第二份拆分出來(lái)；步驟9-4，拆分出第三份依次遍歷步驟9-3拆分之后余下的段落，從余下的第一段開(kāi)始，若余下第一段的字?jǐn)?shù)大于或等于A-A*D，則將余下的第一段作為第一份拆分出來(lái)，若余下的第一段的字?jǐn)?shù)小于A-A*D，則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù)，若總字?jǐn)?shù)大于或等于A-A*D，則將余下的第一、二段作為第一份拆分出來(lái)，若不是，則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D，就可以將第三份拆分出來(lái)；
以此類推直至步驟9-N，拆分出第N-I份依次遍歷步驟9-N-2拆分之后余下的段落，從余下的第一段開(kāi)始，若余下第一段的字?jǐn)?shù)大于或等于A-A*D，則將余下的第一段作為第一份拆分出來(lái)，若余下的第一段的字?jǐn)?shù)小于A-A*D，則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù)，若總字?jǐn)?shù)大于或等于A-A*D，則將余下的第一、二段作為第一份拆分出來(lái)，若不是，則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D，就可以將第N-I份拆分出來(lái)；
步驟9-N+1，如果余下段落數(shù)目大于零，則將余下的段落拆分成第N份并進(jìn)入步驟10 ；如果當(dāng)進(jìn)行完步驟9-N后，余下段落數(shù)目為零時(shí)，則提示客戶由于總字?jǐn)?shù)和總段數(shù)過(guò)少，需要回到步驟3將調(diào)整誤差值D調(diào)大，之后再回到步驟9-1重新開(kāi)始至步驟9-N+1，直至滿足拆成N份為止再進(jìn)入步驟10 ;或不計(jì)較份數(shù)直接忽略進(jìn)入步驟10 ；
在上面的步驟9-N+1中，若余下段落的總字?jǐn)?shù)低于平均字?jǐn)?shù)的4%時(shí)，則提示客戶拆分?jǐn)?shù)量過(guò)分不均，需要將調(diào)整誤差值D調(diào)大，之后再回到步驟9-1重新開(kāi)始步驟9-1至步驟9-N+1，直至滿足拆成的第N份大于或等于平均字?jǐn)?shù)的4%為止。步驟10，將拆分好的文件保存到用戶指定的路徑。誤差值D的選擇范圍為4%——40%，當(dāng)文件字?jǐn)?shù)越多時(shí)，誤差值就越小，而當(dāng)文件字?jǐn)?shù)越少時(shí)，誤差值D應(yīng)越大。我們的總字?jǐn)?shù)即可以包括標(biāo)點(diǎn)和文字，也可以總字?jǐn)?shù)僅包括文字，不上述的誤差值D=70/A-N/G/10，若算出來(lái)的D小于4%，則將D設(shè)置為4%，若算出來(lái)的D大于40%，則將D設(shè)置為40%。
下面我們?cè)賮?lái)以一個(gè)具體的例子來(lái)對(duì)步驟9的詳細(xì)過(guò)程進(jìn)行舉例說(shuō)明。舉例I ;我們有10段文字需要拆分成5份。第一段文字有120個(gè)字，第二段文字有100個(gè)字，第三段文字有50個(gè)字，第四段文字有60個(gè)字，第五段文字有77個(gè)字。第六段文字有88個(gè)字，第七段文字有200個(gè)字，第八段文字有90個(gè)字，第九段文字有10個(gè)字，第十段文字有98個(gè)字。假設(shè)我們先將誤差值D設(shè)置為10%。此十段總字?jǐn)?shù)為893個(gè)字。由于要分成5份，平均每份算出來(lái)即為178.6個(gè)字。需要滿足的條件為每一份字?jǐn)?shù)大于或等于178. 6-178. 6*10%=160. 74 個(gè)字。接著我們開(kāi)始進(jìn)行拆分第一份，先看第一段文字有120個(gè)字，不滿足字?jǐn)?shù)條件，需要繼續(xù)。則將第一、二段總字?jǐn)?shù)算出來(lái)為220個(gè)字，滿足字?jǐn)?shù)條件，將第一、二段作為第一份拆分出來(lái)。拆分第二份，第三段文字有50個(gè)字，不滿足字?jǐn)?shù)條件，需要繼續(xù)。將第三、四段總字?jǐn)?shù)算出來(lái)為110個(gè)字，還是不滿足字?jǐn)?shù)條件，再將第三、四、五段總字?jǐn)?shù)算出來(lái)為187個(gè)字，滿足了字?jǐn)?shù)條件，馬上將第三、四、五段作為第二份拆分出來(lái)。
按照同樣方法，就會(huì)將第五、六段作為第三份拆分出來(lái)，第七至第十段作為第四份拆分出來(lái)。此時(shí)會(huì)有提示客戶由于總字?jǐn)?shù)和總段數(shù)過(guò)少，需要將調(diào)整誤差值D調(diào)大，我們回到之前的步驟3將誤差值設(shè)置為20%，則需要滿足的字?jǐn)?shù)條件為大于或等于142. 88。這樣分下來(lái)的結(jié)果還是和剛才一樣。當(dāng)我們將誤差設(shè)置為30%時(shí)，需要滿足的字?jǐn)?shù)條件為大于或等于125. 02。這樣分下來(lái)的結(jié)果還是和剛才一樣。當(dāng)我們將誤差值設(shè)置為35%時(shí)，需要滿足的字?jǐn)?shù)條件為大于或等于116. 09。這樣的話，第一段拆分成第一份，第二、三拆分成第二份，第四、五段拆分成第三份，第六、七段拆分成第四份，余下為第五份。舉例2
舉例2 ;我們有40段文字需要拆分成5份。第一段文字有20個(gè)字，第二段文字有276個(gè)字，第三段文字有99個(gè)字，第四段文字有18個(gè)字，第五段文字有60個(gè)字。第六段文字有403個(gè)字，第七段文字有112個(gè)字，第八段文字有39個(gè)字，第九段文字有198個(gè)字，第十段文字有298個(gè)字，第H^一段文字有120個(gè)字，第十二段文字有100個(gè)字，第十三段文字有275個(gè)字，第十四段文字有255個(gè)字，第十五段文字有87個(gè)字。第十六段文字有54個(gè)字，第十七段文字有67個(gè)字，第十八段文字有566個(gè)字，第十九段文字有135個(gè)字，第二十段文字有248個(gè)字，第二i^一段文字有75個(gè)字，第二十二段文字有95個(gè)字，第二十三段文字有321個(gè)字，第二十四段文字有15個(gè)字，第二十五段文字有271個(gè)字，第二十六段文字有245個(gè)字，第二十七段文字有76個(gè)字，第二十八段文字有435個(gè)字，第二十九段文字有291個(gè)字，第三十段文字有156個(gè)字，第三i^一段文字有86個(gè)字，第三十二段文字有93個(gè)字，第三十三段文字有111個(gè)字，第三十四段文字有8個(gè)字，第三十五段文字有448個(gè)字。第三十六段文字有67個(gè)字，第三十七段文字有38個(gè)字，第三十八段文字有29個(gè)字，第三十九段文字有89個(gè)字，第四十段文字有7個(gè)字。根據(jù)誤差值計(jì)算公式得到D=70/1277. 2-5/40/10=0. 04。此十段總字?jǐn)?shù)為6386個(gè)字。由于要分成5份，平均每份算出來(lái)即為1277. 2個(gè)字。需要滿足的條件為每一份字?jǐn)?shù)大于或等于 1277. 2-1277. 2*4%=1220. 2 個(gè)字。接著我們開(kāi)始進(jìn)行拆分第一份，先看第一段文字有20個(gè)字，不滿足字?jǐn)?shù)條件，需要繼續(xù)。則將第一、二段總字?jǐn)?shù)算出來(lái)為296個(gè)字，還是不滿足字?jǐn)?shù)條件，需要繼續(xù)。再將第一、二、三段總字?jǐn)?shù)算出來(lái)為395，還是不滿足字?jǐn)?shù)條件，需要繼續(xù)。再將第一、二、三、四段總字?jǐn)?shù)算出來(lái)為413，還是不滿足字?jǐn)?shù)條件，需要繼續(xù)。再將第一、二、三、四、五段總字?jǐn)?shù)算出來(lái)為473，還是不滿足字?jǐn)?shù)條件，需要繼續(xù)。再將第一、二、三、四、五、六段總字?jǐn)?shù)算出來(lái)為876，還是不滿足字?jǐn)?shù)條件，需要繼續(xù)。再將第一、二、三、四、五、六、七段總字?jǐn)?shù)算出來(lái)為988，還是不滿足字?jǐn)?shù)條件，需要繼續(xù)。再將第一、二、三、四、五、六、七、八段總字?jǐn)?shù)算出來(lái)為1027，還是不滿足字?jǐn)?shù)條件，需要繼續(xù)。再將第一、二、三、四、五、六、七、八、九段總字?jǐn)?shù)算出來(lái)為1225，滿足了字?jǐn)?shù)條件，將第一至九段作為第一份拆分出來(lái)。
拆分第二份，第十段文字有298個(gè)字，不滿足字?jǐn)?shù)條件，需要繼續(xù)。將十、十一段總字?jǐn)?shù)算出來(lái)為418個(gè)字，還是不滿足字?jǐn)?shù)條件，再將第十、十一、十二段總字?jǐn)?shù)算出來(lái)為518個(gè)字，還是不滿足字?jǐn)?shù)條件，再將第十、十一、十二、十三段總字?jǐn)?shù)算出來(lái)為793個(gè)字，還是不滿足字?jǐn)?shù)條件，再將第十、十一、十二、十三、十四段總字?jǐn)?shù)算出來(lái)為1048個(gè)字，還是不滿足字?jǐn)?shù)條件，再將第十、十一、十二、十三、十四、十五段總字?jǐn)?shù)算出來(lái)為1135個(gè)字，還是不滿足字?jǐn)?shù)條件，再將第十、十一、十二、十三、十四、十五、十六段總字?jǐn)?shù)算出來(lái)為1189個(gè)字，還是不滿足字?jǐn)?shù)條件，再將第十、十一、十二、十三、十四、十五、十六、十七段總字?jǐn)?shù)算出來(lái)為1256個(gè)字，滿足了字?jǐn)?shù)條件，馬上將第十至十七段作為第二份拆分出來(lái)。
按照同樣方法，就會(huì)將第十八至二十三段作為第三份拆分出來(lái)，第二十四至第二十九段作為第四份拆分出來(lái)。第三十至四十段作為第五份拆分出來(lái)。第三份、第四份、第五份的字?jǐn)?shù)分別為1440個(gè)字、1333個(gè)字和1132個(gè)字。
權(quán)利要求
1.一種翻譯文件的拆分和分配方法，其特征在于包括以下步驟步驟1，開(kāi)始；步驟2，導(dǎo)入文件；步驟3，進(jìn)行處理前需要的參數(shù)設(shè)置或采用默認(rèn)設(shè)置，包括設(shè)置誤差值D ；步驟4，預(yù)處理，得到導(dǎo)入文件格式，打開(kāi)文件，檢測(cè)里面的內(nèi)容，分析出可分成的份數(shù)最大值；步驟5，判斷用戶是否需要隱藏相同段落，如果是進(jìn)入步驟6，如果不是直接進(jìn)入步驟7 ；步驟6 :遍歷文件找出相同段落，去除相同段落；步驟7 :根據(jù)步驟4或步驟6的處理后得到的可拆分份數(shù)進(jìn)行選擇，確定需要拆分成的份數(shù)N ；步驟8 :導(dǎo)出拆分文件選擇路徑；步驟9 :根據(jù)用戶所選的需要拆分成的份數(shù)N和用戶自定義參數(shù)設(shè)置或默認(rèn)參數(shù)設(shè)置進(jìn)行拆分，根據(jù)誤差值D進(jìn)行以段為主，字?jǐn)?shù)為輔的拆分法，具體包括步驟9-1，算出總字?jǐn)?shù)M和找出總段數(shù)G，用總字?jǐn)?shù)除以份數(shù)得到平均字?jǐn)?shù)A ; 步驟9-2，拆分出第一份依次遍歷第一至第G段，從第一段開(kāi)始，若第一段的字?jǐn)?shù)大于或等于A-A*D，則將第一段作為第一份拆分出來(lái)，若第一段的字?jǐn)?shù)小于A-A*D，則計(jì)算第一段和第二段的總字?jǐn)?shù)，若總字?jǐn)?shù)次大于或等于A-A*D，則將第一、二段作為第一份拆分出來(lái)，若不是，則再計(jì)算第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D，就可以將第一份拆分出來(lái)；步驟9-3，拆分出第二份依次遍歷步驟9-2拆分之后余下的段落，從余下的第一段開(kāi)始，若余下第一段的字?jǐn)?shù)大于或等于A-A*D，則將余下的第一段作為第一份拆分出來(lái)，若余下的第一段的字?jǐn)?shù)小于A-A*D，則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù)，若總字?jǐn)?shù)大于或等于A-A*D，則將余下的第一、二段作為第一份拆分出來(lái)，若不是，則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D，就可以將第二份拆分出來(lái)；步驟9-4，拆分出第三份依次遍歷步驟9-3拆分之后余下的段落，從余下的第一段開(kāi)始，若余下第一段的字?jǐn)?shù)大于或等于A-A*D，則將余下的第一段作為第一份拆分出來(lái)，若余下的第一段的字?jǐn)?shù)小于A-A*D，則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù)，若總字?jǐn)?shù)大于或等于A-A*D，則將余下的第一、二段作為第一份拆分出來(lái)，若不是，則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D，就可以將第三份拆分出來(lái)；以此類推直至步驟9-N，拆分出第N-I份依次遍歷步驟9-N-2拆分之后余下的段落，從余下的第一段開(kāi)始，若余下第一段的字?jǐn)?shù)大于或等于A-A*D，則將余下的第一段作為第一份拆分出來(lái)，若余下的第一段的字?jǐn)?shù)小于A-A*D，則計(jì)算余下的第一段和余下的第二段的總字?jǐn)?shù)，若總字?jǐn)?shù)大于或等于A-A*D，則將余下的第一、二段作為第一份拆分出來(lái)，若不是，則再計(jì)算余下的第一、第二、第三段的總字?jǐn)?shù)……直到各段總字?jǐn)?shù)滿足大于或等于A-A*D，就可以將第N-I份拆分出來(lái)；步驟9-N+1，如果余下段落數(shù)目大于零，則將余下的段落拆分成第N份并進(jìn)入步驟10 ；如果當(dāng)進(jìn)行完步驟9-N后，余下段落數(shù)目為零時(shí)，則提示客戶由于總字?jǐn)?shù)和總段數(shù)過(guò)少，需要回到步驟3將調(diào)整誤差值D調(diào)大，之后再回到步驟9-1重新開(kāi)始至步驟9-N+1，直至滿足拆成N份為止再進(jìn)入步驟10; 步驟10，將拆分好的文件保存到用戶指定的路徑。
2.根據(jù)權(quán)利要求I所述的翻譯文件的拆分和分配方法，其特征在于所述的誤差值D的選擇范圍為4%-40%,當(dāng)文件字?jǐn)?shù)越多時(shí),誤差值就越小,而當(dāng)文件字?jǐn)?shù)越少時(shí),誤差值D應(yīng)越大。
3.根據(jù)權(quán)利要求I所述的翻譯文件的拆分和分配方法，其特征在于所述的步驟9-N+1中，若余下段落的總字?jǐn)?shù)低于平均字?jǐn)?shù)的4%時(shí)，則提示客戶拆分?jǐn)?shù)量過(guò)分不均，需要將調(diào)整誤差值D調(diào)大，之后再回到步驟9-1重新開(kāi)始步驟9-1至步驟9-N+1，直至滿足拆成的第N份大于或等于平均字?jǐn)?shù)的4%為止。
4.根據(jù)權(quán)利要求I所述的翻譯文件的拆分和分配方法，其特征在于所述的總字?jǐn)?shù)包括標(biāo)點(diǎn)和文字。
5.根據(jù)權(quán)利要求I所述的翻譯文件的拆分和分配方法，其特征在于所述的總字?jǐn)?shù)僅包括文字，不包括標(biāo)點(diǎn)。
6.根據(jù)權(quán)利要求2所述的翻譯文件的拆分和分配方法，其特征在于所述的誤差值D=70/A-N/G/10，若算出來(lái)的D小于4%，則將D設(shè)置為4%，若算出來(lái)的D大于40%，則將D設(shè)置為40%。
全文摘要
本發(fā)明公開(kāi)了一種翻譯文件的拆分和分配方法，包括以下步驟開(kāi)始；導(dǎo)入文件；進(jìn)行處理前需要的參數(shù)設(shè)置或采用默認(rèn)設(shè)置，包括設(shè)置誤差值D；預(yù)處理，得到導(dǎo)入文件格式，打開(kāi)文件，檢測(cè)里面的內(nèi)容，分析出可分成的份數(shù)最大值；判斷用戶是否需要隱藏相同段落，遍歷文件找出相同段落，去除相同段落；確定需要拆分成的份數(shù)N；導(dǎo)出拆分文件選擇路徑；根據(jù)用戶所選的需要拆分成的份數(shù)N和用戶自定義參數(shù)設(shè)置或默認(rèn)參數(shù)設(shè)置進(jìn)行拆分，根據(jù)誤差值D進(jìn)行以段為主，字?jǐn)?shù)為輔的拆分法。本發(fā)明設(shè)置了滿足字?jǐn)?shù)拆分的合理拆分，既解決了以往由于斷句不完整無(wú)法翻譯的問(wèn)題，同時(shí)也滿足了拆分精度的要求。解決了人為拆分耗時(shí)過(guò)大，加大項(xiàng)目成本的問(wèn)題。
文檔編號(hào)G06F17/27GK102622340SQ201210085140
公開(kāi)日2012年8月1日申請(qǐng)日期2012年3月28日優(yōu)先權(quán)日2012年3月28日
發(fā)明者伍華, 張馬成, 楊明, 王興強(qiáng), 王小龍申請(qǐng)人:成都優(yōu)譯信息技術(shù)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張馬成;王興強(qiáng);伍華;楊明;王小龍
技術(shù)所有人：成都優(yōu)譯信息技術(shù)有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

pdf文件拆分相關(guān)技術(shù)

文件拆分工具相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

翻譯文件的拆分和分配方法