欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

中文文字內(nèi)碼規(guī)范化智能轉(zhuǎn)換方法

文檔序號:6412321閱讀:615來源:國知局
專利名稱:中文文字內(nèi)碼規(guī)范化智能轉(zhuǎn)換方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種中文文字內(nèi)碼規(guī)范化智能轉(zhuǎn)換方法,更具體地說,涉及一種中文國標(biāo)碼簡化字與大五碼繁體字之間的規(guī)范化智能轉(zhuǎn)換方法。
目前中國大陸、新加坡等地使用中文簡化字(主要為國標(biāo)碼,即GB2312-80,以下同),有6千多字;中國臺灣、香港和海外華人社會使用中文繁體字(主要為大五碼,即BIG5),有1萬3千多字。因一種中文內(nèi)碼的一個字有時對應(yīng)另一種中文內(nèi)碼的多個字(一對多),這是不同內(nèi)碼間轉(zhuǎn)換中一個最大的難題。原有的中文文字內(nèi)碼轉(zhuǎn)換方法,在處理這個問題時,通常采用轉(zhuǎn)換為其中一個字的方法。因而在涉及到中文的計算機(jī)軟件等領(lǐng)域中,國標(biāo)碼與大五碼之間難以進(jìn)行規(guī)范化的轉(zhuǎn)換,并導(dǎo)致同一中文計算機(jī)軟件有時出現(xiàn)簡化字和繁體字兩個版本?,F(xiàn)階段這種情況的存在造成許多人力、物力、財力的浪費(fèi)。
本發(fā)明的目的是提供一種較為簡便可行的辦法,實(shí)現(xiàn)中文國標(biāo)碼簡化字和大五碼繁體字之間的規(guī)范化智能轉(zhuǎn)換。
根據(jù)本發(fā)明的第1個方面,當(dāng)一種內(nèi)碼的一個字對應(yīng)另一種內(nèi)碼的多個字時,首先將其轉(zhuǎn)換為另一內(nèi)碼中較常用的一個字;在另一內(nèi)碼環(huán)境中,再利用“轉(zhuǎn)換詞典”中詞的搭配轉(zhuǎn)換為另一內(nèi)碼中對應(yīng)的其它次常用字。
根據(jù)本發(fā)明的第2個方面,首先將一種內(nèi)碼中能對應(yīng)本發(fā)明的一個“轉(zhuǎn)換詞典”中次常用字詞組的詞,轉(zhuǎn)為另一內(nèi)碼中“轉(zhuǎn)換詞典”所提供的規(guī)范化詞組形式;在同一內(nèi)碼環(huán)境中將其余的字同時轉(zhuǎn)為較常用字?!稗D(zhuǎn)換詞典”中已提供的單字按此詞典轉(zhuǎn)換,其余的單字則按原中文內(nèi)碼轉(zhuǎn)換方式轉(zhuǎn)換。
根據(jù)本發(fā)明的第3個方面,在間接轉(zhuǎn)換時,將一種中文內(nèi)碼按照與CJK碼一一對應(yīng)的關(guān)系全部轉(zhuǎn)換為CJK碼,以CJK碼顯示;在CJK碼環(huán)境中按上述第2個方面的方案轉(zhuǎn)為另一中文內(nèi)碼,轉(zhuǎn)換后另一中文內(nèi)碼也以CJK碼顯示;然后按一一對應(yīng)的關(guān)系將CJK碼轉(zhuǎn)換為另一中文內(nèi)碼儲存。
本發(fā)明可使只懂一種中文內(nèi)碼的使用者,輕易就能制作出另一種中文內(nèi)碼的規(guī)范化文本??墒怪皇煜ひ环N中文內(nèi)碼及其相應(yīng)輸入法的打字員“打簡出繁”或“打繁出簡”。如一位只熟悉國標(biāo)碼的打字員,可用其熟悉的某一種國標(biāo)碼輸入法打字,提示行可顯示簡化字,而正式的錄入結(jié)果可為規(guī)范的繁體字文本。
下面結(jié)合附圖對本發(fā)明的三個實(shí)施例進(jìn)行詳細(xì)描述。附圖中

圖1為本發(fā)明直接—異步轉(zhuǎn)換法之流程圖;圖2為本發(fā)明直接—同步轉(zhuǎn)換法之流程圖;圖3為本發(fā)明間接—同步轉(zhuǎn)換法之流程圖。
在轉(zhuǎn)換方案的制定過程中,本發(fā)明既考慮到中文簡化字和繁體字的規(guī)范,也考慮到其使用現(xiàn)狀。當(dāng)一種內(nèi)碼中的一個字對應(yīng)另一內(nèi)碼中的多個字時,在轉(zhuǎn)換詞典中均給出明確的指引,以避免無所適從的情況出現(xiàn)。如簡化字“周”對應(yīng)繁體字“周、週”,“布”對應(yīng)“布、佈”,但根據(jù)目前繁體字的使用現(xiàn)狀,大部分報刊、圖書等(包括臺灣的出版物)已不再使用“週、佈”,故只使用“周、布”。如簡化字“證”可對應(yīng)繁體字“証”也可對應(yīng)“證”,“證”使用較廣泛,故取此字。有些字本來是一一對應(yīng)的關(guān)系,如“閑”,考慮到目前繁體字的使用習(xí)慣,用“閒”而不用“閑”。在1936年商務(wù)印書館出版的《國語詞典》(由汪一庵先生主持編纂)中,繁體字的“鋪”字作“商店”解釋時可與“舖”通用。但現(xiàn)今的繁體字作以上解釋時大多用“舖”而不用“鋪”。又如用“關(guān)係”不用“關(guān)繫”,用“聯(lián)繋”不用“聯(lián)係”。
對于繁體字,本發(fā)明綜合考慮到各地的使用現(xiàn)狀和習(xí)慣。如簡化字的“沉默、污染、大炮”,繁體字有用作“沉默、污染、大炮”,也有用作“沈默、汙染、大砲”。對于這種情況本發(fā)明基本上采取從眾的做法,力求轉(zhuǎn)換結(jié)果既符合規(guī)范,又能為使用中文繁體字的各方接受。
由于中文文字的豐富性和復(fù)雜性(如中文姓名和外文的中文譯名在使用中的隨意性),及簡化字與繁體字使用習(xí)慣的差異(如簡化字的“計算機(jī)、英尺、英寸、報道、計劃、指責(zé)”與繁體字的“電腦、呎、時、報導(dǎo)、計畫、指摘”)等原因,為了使轉(zhuǎn)換盡量作到完美,本發(fā)明在轉(zhuǎn)換詞典的后面為用戶留一個開放式的環(huán)境,方便用戶自行將轉(zhuǎn)換詞典中未包括的極少數(shù)詞組加入。
下面描述本發(fā)明的中文文字內(nèi)碼規(guī)范化智能轉(zhuǎn)換方法的三個實(shí)施例。
一、直接—異步轉(zhuǎn)換法二、直接—同步轉(zhuǎn)換法三、間接—同步轉(zhuǎn)換法實(shí)施例1直接—異步轉(zhuǎn)換法當(dāng)來源內(nèi)碼的一個字對應(yīng)目的內(nèi)碼的多個字時,如圖1所示,首先將其轉(zhuǎn)換為目的內(nèi)碼中較常用的一個字;在目的內(nèi)碼環(huán)境中,再利用“轉(zhuǎn)換詞典”中詞的搭配轉(zhuǎn)換為目的內(nèi)碼中對應(yīng)的其它字。其中第一步轉(zhuǎn)換需要將來源內(nèi)碼中的全部字符“一對一”轉(zhuǎn)換為目的內(nèi)碼的字符?!稗D(zhuǎn)換詞典”中已提供的單字按此詞典轉(zhuǎn)換,其余的單字則按原有中文內(nèi)碼轉(zhuǎn)換方式轉(zhuǎn)換。然后用自動搜索替換功能將符合轉(zhuǎn)換詞典的詞組全部轉(zhuǎn)換為符合轉(zhuǎn)換詞典的規(guī)范形式。
如簡化字的“愿”字,對應(yīng)的繁體字有“愿、願”兩個字,轉(zhuǎn)換詞典中有“謹(jǐn)愿、鄉(xiāng)愿”等詞。簡轉(zhuǎn)繁異步轉(zhuǎn)換時,先“一對一”將國標(biāo)碼的“愿”轉(zhuǎn)為繁體字中較常用的“願”;然后在大五碼的環(huán)境中,將符合轉(zhuǎn)換詞典的詞組轉(zhuǎn)換為詞典中提供的規(guī)范形式,“謹(jǐn)願、鄉(xiāng)願”等詞中的“願”即自動轉(zhuǎn)換為大五碼的“愿”。
由于不同內(nèi)碼的中文字轉(zhuǎn)換時通常會面臨三種情況一對一,多對一,一對多。其中“一對一”和“多對一”都不會有問題,習(xí)用的中文轉(zhuǎn)換軟件大部分都有繁簡轉(zhuǎn)換的功能,都能很容易的完成此“一對一”和“多對一”的轉(zhuǎn)換。但轉(zhuǎn)換中遇到一對多時,亦即來源內(nèi)碼文字對應(yīng)目的內(nèi)碼的多個字時,原有的中文轉(zhuǎn)換軟件便無法正確的轉(zhuǎn)換。
本發(fā)明之直接一異步轉(zhuǎn)換法則依下列步驟完成轉(zhuǎn)換第一步乃依照“轉(zhuǎn)換詞典”先轉(zhuǎn)為較常用的一個字。所謂該較常用字是依據(jù)另一內(nèi)碼中文字在報刊和圖書等出現(xiàn)的頻度(即使用頻度),以及多個字各自分別的組詞能力,進(jìn)行比較后所得出的結(jié)果。
如簡化字的“愿”,對應(yīng)繁體字的“愿、願”二字,在繁體字中“願”的使用頻度和組詞能力都比“愿”高,所以第一步先將簡化字的“愿”全部轉(zhuǎn)換成繁體字的“願”,這樣做可以減少轉(zhuǎn)換詞典的詞匯量,使轉(zhuǎn)換變得簡單快速。
所以轉(zhuǎn)換的第一步可簡單地歸納為“單字轉(zhuǎn)換轉(zhuǎn)多不轉(zhuǎn)少”。
這一步實(shí)際上是把整篇或整部中文文稿全部轉(zhuǎn)換為另一內(nèi)碼,涉及到“一對多”的單字按轉(zhuǎn)換詞典的指引,其它單字按原有中文文字內(nèi)碼轉(zhuǎn)換方式轉(zhuǎn)換。
第二步是在另一內(nèi)碼環(huán)境中依照轉(zhuǎn)換詞典中次常用字的“詞”進(jìn)行自動搜索替換,因?yàn)檫@時已不能再用“單字”轉(zhuǎn)換,不然全都替換成了次常用字。在轉(zhuǎn)換詞典“愿”的詞條下只有“謹(jǐn)愿、鄉(xiāng)愿”兩個詞,所以接上例第二步在大五碼的環(huán)境中搜索時,只要文章中有“謹(jǐn)願、鄉(xiāng)願”都替換成“謹(jǐn)愿、鄉(xiāng)愿”。
第二步可歸納為“詞的轉(zhuǎn)換轉(zhuǎn)少不轉(zhuǎn)多”。
轉(zhuǎn)換完成后,除了在大五碼環(huán)境中“謹(jǐn)願、鄉(xiāng)願”兩詞(假如文稿中有這些詞)中的次常用字轉(zhuǎn)成了“愿”,其它的該字已直接從國標(biāo)碼的環(huán)境轉(zhuǎn)換成了大五碼的“願”,這樣也就達(dá)到了規(guī)范化的目的。即較常用字以“單字”方式轉(zhuǎn)換,次常用字以“詞組”(與前后其它字的搭配)方式加以“區(qū)別”(識別)轉(zhuǎn)換。這種“詞”并不完全等同于中文語法意義的詞,乃是為方便轉(zhuǎn)換時識別次常用字而設(shè)立的,在能識別、與其它字詞不矛盾的情況下,盡量做到簡化和包容面廣。例如“齣戲”就不是語法意義的詞。如果設(shè)定為“一齣”,那么在轉(zhuǎn)換時“太陽一出閃金光”中的“出”字就會出現(xiàn)轉(zhuǎn)換錯誤。
上述轉(zhuǎn)換如果反過來(即采用違反轉(zhuǎn)換詞典設(shè)定原則的方式),單字轉(zhuǎn)換為大五碼不常用的“愿”,而常用的“願”以詞組搭配的方式轉(zhuǎn)換,轉(zhuǎn)換詞典中就會增加許多詞條。并且由于繁體字的“願”字組詞搭配時的隨意性很強(qiáng),如“愿生命之樹常青”、“愿社會昌明”之類的句子比比皆是,所以會導(dǎo)致轉(zhuǎn)換時的難度和差錯率增大。
以上當(dāng)然是一個較簡單的例子,因?yàn)樵诜斌w字的規(guī)范化文本里“愿”字出現(xiàn)的幾率極小。有時也有不容易處理的情況,尤其是中文姓名和外文譯名的用字。如在繁體字中“裡、餘”使用特別廣泛;但外文譯名用“里”,中文姓氏用“余”,組詞搭配時隨意性強(qiáng)。綜合考量在單字轉(zhuǎn)換時用前者。還有些相同搭配的情況,如“編制、編製,老薑、老姜”等,只能轉(zhuǎn)換為使用較廣的一種。
實(shí)施例2直接一同步轉(zhuǎn)換法如圖2所示,首先將一種內(nèi)碼中能對應(yīng)“轉(zhuǎn)換詞典”中次常用字詞組的詞,轉(zhuǎn)為另一內(nèi)碼中“轉(zhuǎn)換詞典”所提供的規(guī)范化詞組形式;在同一內(nèi)碼環(huán)境中將其余的字同時轉(zhuǎn)為較常用字?!稗D(zhuǎn)換詞典”中已提供的單字按此詞典轉(zhuǎn)換,其余的單字則按原有的中文內(nèi)碼轉(zhuǎn)換方式轉(zhuǎn)換。
例如,在國標(biāo)碼環(huán)境中將“謹(jǐn)愿、鄉(xiāng)愿”等詞中的“愿”字轉(zhuǎn)為大五碼的“愿”,其余的則在國標(biāo)碼環(huán)境中轉(zhuǎn)為繁體字中較常用的“願”。
直接一同步轉(zhuǎn)換法可用于計算機(jī)網(wǎng)絡(luò)和各種計算機(jī)軟件的線上轉(zhuǎn)換。
實(shí)施例3間接—同步轉(zhuǎn)換法CJK碼(即中日韓統(tǒng)一碼,East Asian Character Codes)由聯(lián)合國教科文組織制定,包括了中文簡化字、中文繁體字、日文和韓文的全部字符。以CJK為中介,可做到中文簡化字和繁體字共存,并且能對照顯示于計算機(jī)屏幕上。
間接一同步轉(zhuǎn)換時,如圖3所示,將一種中文內(nèi)碼按照與CJK碼一一對應(yīng)的關(guān)系全部轉(zhuǎn)換為CJK碼,以CJK碼顯示。在CJK碼環(huán)境中按上述直接一同步轉(zhuǎn)換法的方案轉(zhuǎn)為另一中文內(nèi)碼,轉(zhuǎn)換后另一中文內(nèi)碼也以CJK碼顯示。然后按一一對應(yīng)的關(guān)系將CJK碼轉(zhuǎn)換為另一中文內(nèi)碼儲存。
上述的三種轉(zhuǎn)換方案均利用轉(zhuǎn)換詞典為轉(zhuǎn)換媒介,而詞典中收錄了;1.“字”的對照;2.“詞”的對照。
其中收錄原則乃轉(zhuǎn)換時有“一個來源內(nèi)碼對應(yīng)多個目的內(nèi)碼”的字才列入“字”的對照中,且該多個目的內(nèi)碼的字系取其中一個出現(xiàn)頻率最大的字作為對照;又若干次常用字,則以詞的型態(tài)(配合前后其他字)收錄在“詞”的對照中。同時轉(zhuǎn)換詞典中亦提供一“用戶開放區(qū)”,可供使用者隨時增加“字”的對照與“詞”的對照。
借助上述轉(zhuǎn)換詞典的特性,當(dāng)間接轉(zhuǎn)換前,用戶可把極少數(shù)的必要特殊用詞輸入用戶開放區(qū),可在文稿校對前轉(zhuǎn)換;而直接轉(zhuǎn)換時通過轉(zhuǎn)換詞典的增補(bǔ)和調(diào)整把轉(zhuǎn)換差錯率降至最低。
轉(zhuǎn)換詞典里列入的字和詞需盡量不重復(fù),不矛盾,并且只考慮字形不管其發(fā)音。如“鞦韆”在“秋”字條下出現(xiàn),就不在“千”字條下出現(xiàn)。為節(jié)省篇幅,“一對一”和“多對一”的單字都未列入轉(zhuǎn)換詞典,仍按原有中文文字內(nèi)碼轉(zhuǎn)換方式轉(zhuǎn)換。
茲舉若干實(shí)例,比較說明原有的中文文字內(nèi)碼轉(zhuǎn)換方法與本發(fā)明智能轉(zhuǎn)換方法間的差異。
如以下簡化字例句1.游客們有的在游泳。
2.除了余先生,其余的人都到了。
3.古人云學(xué)海無涯,云程有路。
4.博物館里陳列了一尊萬里長城的雕塑品。
5.盡管條件有限,他們還是力爭做到人盡其才。
6.只要有一只小船,我們就可以渡河。
7.幾名職員把寫字樓收拾得窗明幾凈。
8.這項(xiàng)計劃從經(jīng)濟(jì)上考量是否劃算還是個未知數(shù),因而該計劃中產(chǎn)品的制造受到了限制。
9.皇后公園的后面有一家美容發(fā)型學(xué)院,我發(fā)現(xiàn)范小姐正在為學(xué)生作示范表演。
10.學(xué)生們正為期末考試作準(zhǔn)備。復(fù)習(xí)中有時遇上復(fù)雜的問題,老師準(zhǔn)許他們在課堂上討論。
利用原有的中文文字內(nèi)碼轉(zhuǎn)換方法通常只能轉(zhuǎn)換為以下結(jié)果的繁體字例句1.游客們有的在游泳。
2.除了余先生,其余的人都到了。
3.古人雲(yún)學(xué)海無涯,雲(yún)程有路。
4.博物館裡陳列了一尊萬裡長城的雕塑品。
5.盍管條件有限,他們還是力爭做到人盍其才。
6.只要有一只小船,我們就可以渡河。
7.幾名職員把寫字樓收拾得窗明幾淨(jìng)。
8.這項(xiàng)計劃從經(jīng)濟(jì)上考量是否劃算還是個未知數(shù),因而該計劃中產(chǎn)品的制造受到了限制。
9.皇后公園的后面有一家美容發(fā)型學(xué)院,我發(fā)現(xiàn)範(fàn)小姐正在焉學(xué)生作示範(fàn)表演。
1O.學(xué)生們正為期末考試作準(zhǔn)俻。復(fù)習(xí)中有時遇上復(fù)雜的問題,老師準(zhǔn)許他們在課堂上討論。
應(yīng)用本發(fā)明中文文字內(nèi)碼規(guī)范化智能轉(zhuǎn)換方法,可以轉(zhuǎn)換為以下規(guī)范的繁體字1.遊客們有的在游泳。
2.除了余先生,其餘的人都到了。
3.古人云黌海無涯,雲(yún)程有路。
4.博物館裡陳列了一尊萬里長城的雕塑品。
5.儘管條件有限,他們還是力爭做到人盡其才。
6.只要有一隻小船,我們就可以渡河。
7.幾名職員把寫字樓收拾得窗明幾淨(jìng)。
8.這項(xiàng)計劃從經(jīng)濟(jì)上考量是否劃算還是個未知數(shù),因而該計劃中產(chǎn)品的製造受到了限制。
9.皇后公園的後面有一家美容鬟型黌院,我發(fā)現(xiàn)范小姐正在為學(xué)生作示範(fàn)表演。
10.學(xué)生們正為期末考試作準(zhǔn)備。復(fù)習(xí)中有時遇上複雜的問題,老師準(zhǔn)許他們在課堂上討論。
再如以下的大五碼繁體字例句1.清朝乾隆年間發(fā)生遇乾旱。
2.將軍下令出征前並未徵求參謀部意見。
3.想去借錢卻找不到藉口。
4.謮著這部著作她深有感觸。
利用原有的中文文字內(nèi)碼轉(zhuǎn)換方法通常只能轉(zhuǎn)換為以下結(jié)果的簡化字例句1.清朝乾隆年間發(fā)生過乾旱。
2.將軍下令出征前并未徵求參謀部意見。
3.想去借錢卻找不到藉口。
4.讀著這部著作她深有感觸。
應(yīng)用本發(fā)明中文文字內(nèi)碼規(guī)范化智能轉(zhuǎn)換方法,可以轉(zhuǎn)換為以下規(guī)范的簡化字1.清朝乾隆年間發(fā)生過干旱。
2.將軍下令出征前并未徵求參謀部意見。
3.想去借錢卻找不到借口。
4.讀著這部著作她深有感觸。
本發(fā)明可應(yīng)用于涉及到中文的計算機(jī)軟件、文字識別軟件(OCR)、翻譯軟件、校對軟件、電子字典、國際計算機(jī)網(wǎng)絡(luò)等領(lǐng)域中的中文文字內(nèi)碼規(guī)范化智能轉(zhuǎn)換,可促使同一中文計算機(jī)軟件的簡化字和繁體字兩個版本合二為一,亦可應(yīng)用于中文簡、繁體字與中國方言(如廣東話)文字、少數(shù)民族語言文字,及與日文、韓文等其它亞洲語言文字之間的轉(zhuǎn)換。
另,轉(zhuǎn)換詞典是本發(fā)明重要的一部分,既包括較常用字的“字”,也包括次常用字的“詞”。詞典中“—”前為來源碼中文之單字, “—”后為目的碼中文較常用字之單字,單字條目下如有詞組,即為次常用字的詞組。有些單字條目下沒有詞組,即表示全部轉(zhuǎn)換成對應(yīng)的其中一個較常用字,不轉(zhuǎn)換成其它次常用字。
以上概略地對本發(fā)明作了描述。本技術(shù)領(lǐng)域內(nèi)的熟練人員可以不經(jīng)創(chuàng)造性勞動就能對本發(fā)明作出各種各樣的修改和改進(jìn)。發(fā)明人認(rèn)為這種修改和改進(jìn)都屬于后面的權(quán)利要求書所定義的范圍之內(nèi)。
附中文文字內(nèi)碼規(guī)范化智能轉(zhuǎn)換詞典中文文字內(nèi)碼規(guī)范化智能轉(zhuǎn)換詞典一、國標(biāo)碼轉(zhuǎn)大五碼說明1.“—”前的單字為國標(biāo)碼,其后的單字為大五碼較常用字。為節(jié)省篇幅,“—”下的次常用字詞組均為大五碼,所對應(yīng)的國標(biāo)碼詞組從略。2.凡未列出的字仍按原中文文字內(nèi)碼轉(zhuǎn)換方式轉(zhuǎn)換。3.“里、隻”等字前的“#”號表示阿拉伯?dāng)?shù)字0~9和中文數(shù)字○~九,十、百、千、萬、億等。4.中文的姓氏,用“范、樸、涂、咸、游、余、占、鍾、黨”等字,不用“範(fàn)、樸、塗、鹹、遊、餘、佔(zhàn)、鐘、黨”等字。5.外文的中文譯名,用“里、于、松、托、斗、采、舍”等字,不用“裡、於、鬆、託、鬥、採、捨”等字。
暗—暗 并—並庵—庵 合併,併案,併命,併發(fā)癥,併糧,鰲—鰲 併合,併發(fā),併力,併吞,裁併,歸擺—擺 併,火併,兼併,吞併,一併,兼容衣襬,下襬,底襬併包,兼收併蓄板—板 駁—駁老闆 卜—卜抱—抱籮蔔范小雞,范窩 布—布杯—杯 擦—擦世界盃,國際盃,亞洲盃,城運(yùn)盃,農(nóng)運(yùn) 才—才盃,海華盃 采—採背—背 風(fēng)采,神采,興高采烈,無精打采,揹帶,揹起,揹包,揹囊,揹子,揹負(fù),采地,采邑?fù)d債,揹黑鍋,揹榜 彩—彩辟—闢 剪綵,結(jié)綵,扎綵復(fù)辟,大辟,徵辟,辟引,辟邪 草—草箄—箄 騲雞,騲驢辮—辮 叉—叉表—表 扠腰,扠魚錶鍊,錶盤,錶針,掛錶,懷錶,坤錶, 鏟—剷馬錶,秒錶,跑錶,手錶,停錶,鐘錶, 嘗—嘗名錶嚐新,嚐膽,嚐藥,嚐草,嚐嚐,品嚐憋—彆 沉—沉澄—澄 雕—雕吃—吃老鵰,坐山鵰,一箭雙鵰,鵰悍,鵰扇,沖—衝鵰鶚,射鵰,神鵰沖默,沖昧,沖犯,沖服,沖淡,沖天, 吊—吊沖退,沖年,沖齡,沖和,沖襟,沖喜, 弔喪,弔古,弔客,弔文,弔孝,弔唁,沖銷,沖霄,沖虛,沖沖,沖人,沖弱, 弔民伐罪,哀弔,開弔,陪弔,憑弔,形沖操,沖退,氣沖霄漢,怒髪沖冠,沖影相弔茶,沖劑,沖賬,沖田,折沖,山?jīng)_, 丁—丁脈沖 冬—冬丑—醜鼕鼕小丑,丑時,丑角,文丑,武丑 斗—鬥出—出斗車,斗笠,斗蓬,斗子,笆斗,漏斗,齣戲,齣劇,齣電影濾斗,煙斗,北斗,泰斗,斗膽,市斗,躕—躕斗轉(zhuǎn),斗門,斗室,木斗,車斗,斗量,棰—棰南斗,星斗,斗箕,斗酒,斗方,斗拱,錘—鎚斗渠,阿斗,掛斗,殼斗,觔斗捶—捶 豆—豆村—村 瀆—瀆唇—唇 杜—杜擔(dān)—擔(dān) 端—端撣—撢 燉—燉啖—啖 訛—訛當(dāng)—當(dāng) 惡—惡叮噹,啷噹噁心黨—黨 厄—厄黨參 險阨,阻阨,阨窮,阨塞姓黨,黨先生,黨小姐,黨女士,黨太 兒—兒蕩—盪 發(fā)—發(fā)放蕩,淫蕩,浪蕩,水蕩,蘆花蕩,蘆葦 頭髪,髪夾,髮妻,髪蠟,髪型,髪油,蕩,黃天蕩,坦蕩 白髪,理髪,脫髪,燙髪,金髪,毛髪,呆—呆蓄髪,結(jié)髪,落髪,毫髪,鶴髪,散髪,搗—搗駁髪,剪髮堤—堤 翻—翻抵—抵 范—範(fàn)牴觸,牴牾姓范,范先生,范生,范小姐,范女士,坻—坻范太,老范,小范淀—澱 泛—泛白洋淀氾濫,黃氾區(qū)仿—仿 構(gòu)—構(gòu)彷彿谷—谷扉—扉 轂子,轂物,五轂,百轂,包轂,稻轂,豐—豐 轂草,轂倉豐采,豐滿,豐潤,豐盈,豐腴,豐韻,雇—雇豐姿,豐神 刮—刮夫—夫 颳風(fēng),颳倒桴—桴 掛—掛俯—俯 拐—拐斧—斧 柺棍,柺杖復(fù)—復(fù) 圭—圭複本,複比,複壁,複方,複根,複合,管—管複句,複利,複式,複數(shù),複線,複姓,柜—櫃複鹽,複眼,複葉,複音,複雜,複述,果—果複寫,複選,複意,複韻,複印,複製,哈—哈複種,複分?jǐn)?shù),周而複始 捍—捍覆命,覆信,覆文,覆照,賜覆,答覆,焊—銲回覆,敬覆,批覆,覆盆子呵—呵干—乾 核—核幹活,幹勁,白幹,大幹,單幹,公幹,合—合苦幹,蠻幹,巧幹,傻幹,實(shí)幹,死幹, 闔家,闔府,闔城,闔村,闔戶,闔口幹流,幹道,幹路,幹渠,幹線,詞幹,恒—恆骨幹,基幹,軀幹,樹幹,枝幹,主幹,哄—哄能幹,幹將,幹才,幹練,才幹,精幹,轟—轟強(qiáng)幹,幹部,幹校,幹群,幹事,幹麼,后—後幹著 后妃,皇后,太后,王后,后王,后土干礙,干連,干涉,干系,何干,無干,呼—呼相干,—干,干犯,干擾,干預(yù),干進(jìn),胡—胡干祿,干城,干戈,河干,江于,干支, 鬍鬚,鬍子,鬍匪,腮鬍,鬢鬍若干糊—糊趕—趧 冱—冱杠—槓 嘩—譁槁—槁 花—花睪—睪 劃—劃格—格 劃船,劃槳,劃子,劃算,劃不來,劃個—個 得來,劃拳箇中滋味,箇中辛酸,箇中秘密,箇化—化中原委 懷—懷壞—壞 姜—姜徊—徊薑湯,薑液,閩薑,生薑,鮮薑,紫薑,歡—?dú)g薑黃,薑芋,洋薑,薑末,薑片洹—洹 僵—?dú)欇x—輝閙僵,僵持,僵局回—回 犟—強(qiáng)迴避,迴腸,迴盪,迴環(huán),迴廊,迴剿—剿翔,迴旋,迴形針,低迴,旋迴,巡揭—揭迴,縈迴,迂迴 桔—桔毀—?dú)? 借—借焚燬,燒燬,銷燬 藉以,藉重,藉助,藉刀殺人,背城藉譭謗,譭譽(yù),詆譭 一,藉端,藉故,藉口,藉喻,假藉,匯—匯藉古,藉題彙編,詞彙,語彙,字彙,總彙筋—筋伙—夥 盡—盡伙房,伙夫,包伙,搭伙,開伙,起伙, 儘夠,儘管,儘快,儘力,儘量,儘讓,入伙,退伙儘先,儘自,儘北邊,儘底下,儘前頭獲—獲 徑—逕收穫 半徑,孔徑,口徑,圓徑,直徑幾—幾 驚—驚茶幾,條幾,窗明幾淨(jìng)局—局饑—飢侷促,侷限饑饉,饑飽,饑溺,饑歡 巨—巨機(jī)—機(jī) 據(jù)—據(jù)蟣—蟣 卷—卷跡—跡捲進(jìn),捲入,捲起,捲逃,捲揚(yáng),捲土,急—急漫捲,蓆捲,風(fēng)捲,龍捲風(fēng),煙捲,行李績—績捲,紙捲極—極 眷—眷家—家 撅—撅傢具,傢伙 濬—濬夾—夾 咯—咯價—價 慨—慨奸—奸 考—考姦夫,姦婦,姦情,姦污,姦淫,雞姦, 克—克強(qiáng)姦,通姦,誘姦,捉姦,輪姦,姦殺 坑—坑繭—繭 扣—扣鑒—鑑 釦襻,摁釦,紐釦,衣釦,子母釦,釦兒夸—誇瞭解,瞭然,瞭如指掌,明瞭夸毗,夸誕,夸容 磷—磷饋—饋 淋—淋昆—昆 菱—菱崑崙 欞—櫺捆—捆 嶺—嶺困—困 溜—溜睏了,睏覺 籠—籠拉—拉 朧—朧蠟—蠟 樓—樓臘—臘 爐—爐瑯—瑯 鹵—鹵累—累 櫓—櫓纍纍 羅—羅厘—釐 麻—麻里—裡 么—麼#里,里程,方里,公里,海里,華里, 霉—黴市里,英里,里弄,鄰里,閭里,統(tǒng)里, 蒙—蒙新德里,斯里蘭卡,阿里,里根,華里沙 濛濛,濛氾,濛鴻,濛鬆貍—貍 矇騙,矇住,矇事歷—?dú)v 瞇—瞇曆本,曆法,曆書,公曆,黃曆,回曆, 彌—彌舊曆,年曆,農(nóng)曆,日曆,臺曆,西曆, 瀰漫夏曆,陽曆,陰曆,月曆,藏曆,天文曆 獼—獼痢—痢 秘—秘栗—栗 面—面慄然,戰(zhàn)慄,顫慄,不寒而慄 麵包,麵粉,麵茶,麵食,麵糰,麵坊,漓—漓 麵糊,麵肥,麵人,麵條,麵湯,麵粥,籬—籬 米麵,洋麵,磨麵,豆麵,拉麵,壽麵,璃—璃 雜麵,炒麵,湯麵,掛麵,切麵,陽春簾—簾 麵,刀削麵,玉米麵,甜麵煉—煉 渺—渺梁—梁 蔑—蔑房樑,樑上,大樑,棟樑,橫樑,跳樑, 謬—謬屋樑,懸樑,正樑,主樑,頂樑柱,雕 愍—愍樑,偷樑,鼻樑,脊樑,山樑,提樑 莫—莫聊—聊?!A恕? 乃—乃奶—奶 棋—棋你—你 旗—旗暱—暱 啟—啟捻—撚 氣—?dú)饽睢?千—千唸白,唸叨,唸書,唸大學(xué),唸中學(xué),唸 簽—簽小學(xué),唸佛,唸經(jīng),唸咒,唸珠籤註,標(biāo)籤,浮籤,路籤,瑞籤,書籤,娘—娘 題籤,籤筒,掣籤,抽籤,求籤,中籤,舞孃籤子,牙籤,竹籤釀—釀 鉗—鉗裊—裊 槍—槍寧—寧 強(qiáng)—強(qiáng)嚙—齧 襁—襁暖—暖 鍬—鍬盤—盤 勤—勤刨—刨 丘—丘炮—炮 秋—秋佩—佩 鞦韆玉珮 球—球碰—碰 曲—曲匹—匹 麴黴,大麴,紅麴,酒麴辟—闢 榷—榷大辟,復(fù)辟 蜷—蜷剽—剽 確—確慓悍 繞—繞樸—樸 篛—篛樸刀,樸樹,樸硝,厚樸 灑—灑姓樸,樸先生,樸生,樸小姐,樸女上, 叁—參樸太,老樸,小樸 傘—傘仆—僕 喪—喪前仆後繼 鞝—鞝撲—撲 膻—羶鋪—鋪 扇—扇舖子,店舖,舖戶,當(dāng)舖,舖家,飯舖, 訕—訕肉舖,藥舖,床舖,臥舖,通舖,舖位, 劭—劭地舖,舖板,吊舖,十里舖,窩舖 曬—曬凄—淒 舍—舍戚—戚 捨得,捨命,捨棄,捨身,捨本逐末,捨己,捨近求遠(yuǎn),捨生,割捨,取捨,四捨 沓—沓五入,用捨行藏,不捨,施捨 壇—壇參—參 嘆—嘆什—什 趟—趟甚麼,傢俬 糖—糖沈—沈 醣原,單醣,多醣,二醣,肝醣,果醣,瀋陽 核醣,醛醣,乳醣,雙醣,血醣,葡萄醣升—升 藤—藤圣—聖 體—體?!?眺—眺尸—屍 偷—偷尸位 涂—塗濕—濕 姓涂,涂先生,涂生,涂小姐,涂女士,虱—虱 涂太,老涂,小涂適—適 團(tuán)—圑疏—疏 糰子,躄糰,麵糰,湯糰,飯糰薯—薯 脫—脫摔—摔 砣—砣松—鬆 秤鉈松貂,松果,松虎,松雞,松林,松明, 托—託松木,松球,松鼠,松仁,松樹,松濤,托盤,托葉,茶托,花托,槍托,襯松香,松針,松脂,松子,赤松,紅松,托,烘托,烘雲(yún)托月,托馬斯,托羅,托海松,青松,油松,倉松,白皮松,馬尾爾斯泰松,松茂,尼克松,松下 洼—窪搜—搜 崴—崴蘇—蘇 玩—玩甦醒,復(fù)甦 挽—挽囉囌,嚕囌 輓詞,輓歌,輓聯(lián),輓幛,敬輓嗉—嗉 萬—萬術(shù)—術(shù) 萬—俟白術(shù) 網(wǎng)—網(wǎng)穗—穗 唯—惟蓑—蓑 唯心,唯物,唯是,唯親,唯賢,唯唯臺—臺 諾諾檯布,櫃檯,企檯,寫字檯,檯球,檯 喂—喂子,鏡檯,檯球,梳洗檯 餵奶,餵小孩,餵孩子,餵飬,餵牲口颳風(fēng) 甕—甕它—它 嗚—嗚污—污 修—修杌—杌 銹—鏽嘻—嘻 須—須溪—溪鬚根,鬚子,觸鬚,花鬚,鯨鬚,卷鬚,席—席蝦鬚,龍鬚,鬚瘡,鬚髪,鬚眉,蓆箔,蓆篾,蓆棚,蓆子,篾蓆,割蓆, 鬚生,虯鬚,蓄鬚,溜鬚炕蓆,涼蓆,蘆蓆,衽蓆,葦蓆,擇蓆, 恤—卹枕蓆,竹蓆 勖—勗系—系 薛—薛係詞,干係,關(guān)係,所係,確係 暄—暄繋馬,繋鈴,繋上,繋獄,拘繋,繋奱, 炫—炫繋念 旋—旋瀉—潟鏇床,鏇工,鏇子轄—轄 璇—璇纖—纖 勛—勳拉縴,縴繩 塤—壎閑—閒 熏—熏嫻—嫻 丫—椏鷴—鷳丫把,丫頭,丫環(huán),丫子弦—弦 煙—煙咸—鹹 淹—淹咸受,咸宜,咸寧,咸陽,咸豊 腌—醃姓咸,咸先生,咸生,咸小姐,咸女士, 巖—巖咸太,老咸,小咸 檐—簷銜—銜 演—演鑲—鑲 宴—宴向—向 咽—嚥嚮明,嚮導(dǎo),嚮晦,嚮晨,嚮邇 艷—豔筱—篠 焰—燄效—效 揚(yáng)—掦仿傚,傚法,傚仿,傚顰,傚尢,下傚 癢—癢邪—邪 肴—餚泄—洩 藥—藥欣—欣 耀—耀幸—幸 迤—迆兇—兇 喑—喑兇服,兇事,兇信,兇宅,兇兆,兇多吉 殷—殷少,吉兇,兇年 慇懃淫—淫云—雲(yún)蔭—蔭 云云,詩云,子云,云乎,云爾,人云,傭—傭 亦云,所云傭金,經(jīng)紀(jì)傭,傭錢蕓—蕓墉—墉贊—讚踴—踴 贊成,贊禮,贊同,贊助,參贊涌—湧臟—臟優(yōu)—優(yōu) 髒土,髒像,髒字,骯髒游—遊災(zāi)—災(zāi)游禽,游水,游泳,游魚,暢游,浮游, 咱—咱回游,洄游,臥游,魚游,上游,下游, 噪—噪中游 扎—扎姓游,游先生,游生,游小姐,游女士, 札—札游太 榨—榨佑—佑占—佔(zhàn)于—於 占卜,占卦,占課,占蘿,占星姓于,于先生,于生,于小姐,于女士, 姓占,占先生,占生,占小姐,占女士,于太,老于,小于 占太,老占,小占余—餘沾—沾姓余,余先生,余生,余小姐,余女土, 帳—賬余太,老余,小余 帳頂,帳鉤,青紗帳,帳幕,帳篷,帳與—與 子,虎帳,幔帳,升帳,蚊帳,管帳欲—欲照—照慾念,慾壑,禁慾,情慾,肉慾,食慾, 著—著嗜欲,獸慾,私慾,性慾,縱慾,利慾, 棹—棹慾望,求知慾 折—折郁—鬰 摺尺,摺疊,摺扇,摺紙,摺子,存摺,愈—愈 奏摺痊癒,病癒,癒合,治癒仄—仄逾—逾鴆—鴆御—禦征—徵吁—籲 征麈,征程,征帆,征夫,征途,征衣,長吁,吁吁 長征,遠(yuǎn)征,征伐,征服,征討,征戰(zhàn),愿—願 出征,從征,親征,東征,西征,南征,謹(jǐn)愿,鄉(xiāng)愿 北征岳—岳癥—癥山嶽,五嶽證—證鑰—鑰只—只#隻,單隻,隻隻,隻身,隻眼,隻字, 咨—諮形單影隻,船隻 咨文,咨議,咨嗟致—致 鬃—鬃緻密,工緻,精緻,密緻,細(xì)緻 “—「制—制 ”—」製版,製備,製表,製革,製劑,製件,‘ —『製冷,製品,製糖,製圖,製藥,製造, ’—』製作,採製,仿製,縫製,複製,繪製,機(jī)製,監(jiān)製,精製,拉製,煉製,炮製, ◇用戶輸入?yún)^(qū)◇配製,攝製,試製,特製,提製,熏製,研製,預(yù)製,軋製,粗製志—志碑誌,方誌,府誌,日誌,省誌,縣誌,雜誌,地方誌,誌哀,誌喜,永誌不忘,標(biāo)誌跖—蹠鐘—鐘鍾愛,鍾情,鍾靈,鍾酒姓鍾,鍾先生,鍾生,鍾小姐,鍾女士,鍾太,老鍾,小鍾種—種姓種,種先生,種生,種小姐,種女土,種太,老種,小種冡—塚周—周胄—胄朱—朱殊紅,殊砂,殊墨注—注註解,註腳,註釋,註疏,備註,附註,集註,夾註,批註,小註,註明,註音,評註,簽註,轉(zhuǎn)註,註冊,註失,註銷筑—築莊—莊妝—妝準(zhǔn)—準(zhǔn)準(zhǔn)許,準(zhǔn)予,核準(zhǔn),獲準(zhǔn),批準(zhǔn),邀準(zhǔn),允準(zhǔn),照準(zhǔn),準(zhǔn)將,準(zhǔn)尉,準(zhǔn)平原二、大五碼轉(zhuǎn)國標(biāo)碼說明1.“—”前的單字為大五碼,其后的單字為國標(biāo)碼較常用字。為節(jié)省篇幅,“—”下的次常用字詞組均為國標(biāo)碼,所對應(yīng)的大五碼詞組從略。2.凡未列出的字仍按原中文文字內(nèi)碼轉(zhuǎn)換方式轉(zhuǎn)換。
斑—斑 獲—獲癍病 劐地,劐開扁—扁 藉—借鳊魚 枕藉,蘊(yùn)藉,慰藉,狼藉檗—檗 姓藉,藉先生,藉小姐,藉女士,藉太,萌蘗,分蘗 老藉,小藉怵—怵 鉅—巨憷場,憷頭,發(fā)憷褲—褲吊—吊 紈绔釕铞樑—梁夫—夫 溜—溜呋喃 熘肉片乾—干 眉—眉乾道,乾圖,乾網(wǎng),乾坤,乾象,乾宅,麼—么乾造,乾曜,乾元,乾隆,乾縣 幺麼橋—橋 你—你鞍鞒劈—劈甘—甘 噼啪,噼里啪啦糖苷平—平槁—槁 鲆魚,斑鲆,牙鲆藁城譙—譙呱—呱 噍類,倒噍哌嗪佘—佘滾—滾 畬族石磙,磙子,磙地沈—沈後—后 墨瀋呼—呼 嘶—嘶唿扇,唿哨 咝咝糊—糊 退—退烤煳,燒煳,煳了 煺豬,煺雞,煺毛夥—伙 沱—沱淡沲惟—唯啞—啞於—于餘—余皂—皂番枧著—著著稱,著名,較著,顯著,昭著,卓著,知著,著錄,著書,著述,著文,著者,著作,編著,合著,撰著,巨著,論著,名著,遺著,原著,專著,拙著摺—折徵—征角徵羽鍾—鐘諮—咨「—“」—”『—‘』—’◇用戶輸入?yún)^(qū)◇
權(quán)利要求
1.一種中文文字內(nèi)碼規(guī)范化智能轉(zhuǎn)換方法,其特征在于當(dāng)進(jìn)行不同內(nèi)碼間的文字轉(zhuǎn)換時,如一種內(nèi)碼的一個字對應(yīng)另一種內(nèi)碼的多個字時,首先將其轉(zhuǎn)換為另一內(nèi)碼中較常用的一個字,在另一內(nèi)碼環(huán)境中,再利用“轉(zhuǎn)換詞典”中已預(yù)設(shè)或自訂詞的搭配轉(zhuǎn)換為另一內(nèi)碼中對應(yīng)的其它字;其中第一步轉(zhuǎn)換需要將一種內(nèi)碼中的全部字符“一對一”轉(zhuǎn)換為另一種內(nèi)碼的字符,“轉(zhuǎn)換詞典”中已提供的單字按此詞典轉(zhuǎn)換,其余的單字則按原有的中文內(nèi)碼轉(zhuǎn)換方式轉(zhuǎn)換,然后用自動搜索替換功能,將符合轉(zhuǎn)換詞典的詞組全部轉(zhuǎn)換為符合轉(zhuǎn)換詞典的規(guī)范形式。
2.一種中文文字內(nèi)碼規(guī)范化智能轉(zhuǎn)換方法,其特征在于當(dāng)進(jìn)行不同內(nèi)碼間的文字轉(zhuǎn)換時,將一種內(nèi)碼中能對應(yīng)“轉(zhuǎn)換詞典”次常用字詞組的詞,轉(zhuǎn)為另一內(nèi)碼中“轉(zhuǎn)換詞典”所提供的規(guī)范化詞組形式;在同一內(nèi)碼環(huán)境中將其余的字同時轉(zhuǎn)為較常用字,“轉(zhuǎn)換詞典”中已提供的單字按此詞典轉(zhuǎn)換,其余的單字則按原有的中文內(nèi)碼轉(zhuǎn)換方式轉(zhuǎn)換。
3.一種中文文字內(nèi)碼規(guī)范化智能轉(zhuǎn)換方法,其特征在于當(dāng)進(jìn)行不同內(nèi)碼間的文字轉(zhuǎn)換時,將一種中文內(nèi)碼按照與CJK碼一一對應(yīng)的關(guān)系全部轉(zhuǎn)換為CJK碼,以CJK碼顯示;在CJK碼環(huán)境中按上述權(quán)利要求2中的轉(zhuǎn)換。方案轉(zhuǎn)為另一中文內(nèi)碼,轉(zhuǎn)換后另一中文內(nèi)碼也以CJK碼顯示,然后按一一對應(yīng)的關(guān)系將CJK碼轉(zhuǎn)換為另一中文內(nèi)碼儲存。
4.如權(quán)利要求1、2或3中所述之中文文字內(nèi)碼規(guī)范化智能轉(zhuǎn)換方法,其中轉(zhuǎn)換詞典中預(yù)設(shè)有不同內(nèi)碼間之來源碼單字與目的碼較常用字單字對照及目的碼之次常用字詞組,且所述來源碼單字與目的碼較常用字單字對照及目的碼之次常用字詞組可以隨時增刪。
全文摘要
本發(fā)明為一種中文文字內(nèi)碼規(guī)范化智能轉(zhuǎn)換方法,用于在中文文字內(nèi)碼轉(zhuǎn)換過程中,當(dāng)一種內(nèi)碼的一個字對應(yīng)另一種內(nèi)碼的多個字時,將其轉(zhuǎn)換為另一內(nèi)碼中較常用的一個字;利用詞的搭配加以識別,轉(zhuǎn)換為另一內(nèi)碼中其它的字。這種轉(zhuǎn)換可為同步轉(zhuǎn)換,也可為異步轉(zhuǎn)換。轉(zhuǎn)換同時兼顧不同內(nèi)碼中文文字的規(guī)范和使用現(xiàn)狀。本發(fā)明可有效地用于涉及到中文的計算機(jī)軟件、文字識別軟件(OCR)、翻譯軟件、校對軟件、電子字典、國際計算機(jī)網(wǎng)絡(luò)等領(lǐng)域中。
文檔編號G06F1/00GK1177760SQ9711767
公開日1998年4月1日 申請日期1997年8月26日 優(yōu)先權(quán)日1997年8月26日
發(fā)明者龔學(xué)勝 申請人:龔學(xué)勝
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
马鞍山市| 宣汉县| 股票| 杭州市| 枣庄市| 文安县| 犍为县| 栾川县| 郓城县| 德兴市| 集贤县| 德庆县| 恭城| 吉木萨尔县| 沾益县| 德安县| 云林县| 叶城县| 长子县| 庆云县| 福州市| 赣州市| 晋中市| 西畴县| 蒲城县| 鄂伦春自治旗| 屯昌县| 靖西县| 临洮县| 潢川县| 长子县| 安吉县| 榆社县| 唐海县| 汝南县| 青浦区| 江北区| 应用必备| 泰顺县| 莱西市| 朝阳市|