專利名稱:計(jì)算機(jī)漢字輸入-新華編碼方案的制作方法
電子計(jì)算機(jī)是當(dāng)今新技術(shù)革命的先導(dǎo)技術(shù)。在我國,要實(shí)現(xiàn)電子計(jì)算機(jī)的普及以及應(yīng)用,必須解決計(jì)算機(jī)漢字輸入輸出的漢字化問題,只有這樣,才便于使計(jì)算機(jī)技術(shù)被我國大眾熟悉和掌握。
對(duì)于漢字編碼輸入方法,粗略分為二大類,一類稱為整字編碼法。采用整字鍵盤,漢字按某種規(guī)則排定先后次序作為漢字代碼,優(yōu)點(diǎn)是直觀、操作容易學(xué)習(xí)、無重碼問題,但體積大,造價(jià)高,輸入速率低。另一類是組合編碼,其中又可分為許多種,按照字形特征編碼的稱為形碼。按照漢字發(fā)音特征編碼的稱為音碼。也有采用形音結(jié)合的音形碼或形音碼等等,種類繁多。
雖然可以用多種方法實(shí)現(xiàn)漢字編碼,但要得到一種功能上最佳并且適用面很廣的漢字編碼方法卻并非易事,特別是適用一般人員使用中文計(jì)算機(jī)是一個(gè)十分迫切的問題,國內(nèi)外漢字輸入方法達(dá)500多種,但是怎樣才能滿足普通工作人員的要求,既有速度,又要簡(jiǎn)單、易學(xué)易用、很容易掌握呢?根據(jù)這個(gè)要求,設(shè)計(jì)了“新華”編碼漢字輸入方案。
新華編碼方案是漢字拼形輸入方案,是在綜合國內(nèi)外多種編碼方案,結(jié)合新華社實(shí)際工作情況的基礎(chǔ)上制定的。以漢字字根為主要特征信息,采用通用小鍵盤26鍵輸入。從兩類用戶使用計(jì)算機(jī)著想(專職操作員與非專職操作員),側(cè)重機(jī)關(guān)干部、編輯記者、科技工作者、企業(yè)管理人員等非專職操作人員使用中文計(jì)算機(jī)而進(jìn)行設(shè)計(jì)的。規(guī)則嚴(yán)謹(jǐn)、簡(jiǎn)單明確,取碼符合漢字的特點(diǎn)和人們書寫漢字的習(xí)慣,字根安排便于記憶和查找,需要死記的東西很少,容錯(cuò)能力強(qiáng)?!爸卮a”較少并由計(jì)算機(jī)去處理,錯(cuò)碼率低,容易學(xué)習(xí)和掌握。已經(jīng)在新華社國內(nèi)報(bào)務(wù)處等部門以及部分編輯記者中正式使用。
設(shè)計(jì)思想一 鍵盤選擇根據(jù)現(xiàn)有設(shè)備及日常工作情況采用國標(biāo)準(zhǔn)小鍵盤,具有經(jīng)濟(jì),易推廣,適合盲打等好處。
二 字根選擇字根數(shù)量過多則增加記憶量和操作人員的負(fù)擔(dān),過少又會(huì)使“重碼”增加,我們結(jié)合字根的使用頻度以及安排鍵位和取碼的需要選取基本字根92個(gè),擴(kuò)展聯(lián)想字根30個(gè)。
三 字根安排1)一個(gè)鍵位對(duì)應(yīng)一組字根,為使一般人員使用、記憶、查找方便,每組字根盡可能地按音組合在一起。如M鍵上放木、馬,N鍵上放女、牛等等,減少死記硬背。表中的字根不要求死記,初學(xué)者只要會(huì)查找,稍加練習(xí),很容易記住。
2)類同的(擴(kuò)展)字根放在同一鍵上,如
=D等等,只要記憶其中之一即可聯(lián)想,使該方案字根更容易記憶。并且避免了形體相近引起的誤碼。
四 規(guī)則簡(jiǎn)單 1)按書寫筆順取字根,好記,即使記不住,人們也會(huì)不自覺地遵守它。對(duì)于許多容易引起筆順錯(cuò)的字由計(jì)算機(jī)去處理,使用者只需遵循一般原則,按自己的習(xí)慣做就行了。
2)字形的拆分比較簡(jiǎn)單,除獨(dú)體字外均分成二部分,按這二部分分別取碼即可,不用去判別究竟是何結(jié)構(gòu),分開就行。也不考慮輔助編碼。同樣,對(duì)于容易分錯(cuò)的字,加有容錯(cuò)碼,使用者只需按照自己的習(xí)慣去做。
3)規(guī)則嚴(yán)謹(jǐn)、對(duì)將近八千漢字一貫到底。
五 由于鍵位表的特殊排列和人們對(duì)漢字特點(diǎn)的習(xí)慣意識(shí),可以做到邊用、邊學(xué)、邊記,很快就能熟悉掌握,并且長(zhǎng)時(shí)間不用后再用時(shí)容易恢復(fù),基本上保持原有的速度。
六 對(duì)“重碼”,計(jì)算機(jī)可以自動(dòng)查找選擇(保留人工選擇)。詞組處理簡(jiǎn)便,有一般的詞組輸入方法,也有聯(lián)想式詞組輸入方法,并有自定義詞組輸入的功能,輸入簡(jiǎn)單,使用方便。
七 常用標(biāo)點(diǎn)符號(hào)輸入簡(jiǎn)便,在漢字狀態(tài)下不需切換。
八 根據(jù)不同人員,在不改變字根的情況下,可減少某條規(guī)則,使學(xué)習(xí)和掌握更加容易。
規(guī)則和使用舉例規(guī)則簡(jiǎn)化為七個(gè)字雙排、雙分、按筆順。
一、按筆順按書寫筆順取表中最大字根。如“審”取“宀、申”,不取“宀、日、丨”,“慶”取“廣、大”,不取“廣、一、人”,也不取“丶、廠、一、人”,“分”取“八、刀”。即只要鍵位表中有此字根,如上述字中的廣、大、申等則按下該相應(yīng)鍵,不再拆分。如沒有所取字根才拆成筆劃輸入。
二、雙分相交難以分隔的字如“里、果、重……”等獨(dú)體字取一二三四末五碼,不足五碼取完為止。其余均為合體字,按書寫習(xí)慣分成二部分(左右、上下、包圍),每一個(gè)部分限取三碼,全碼限取五碼。取三碼方法是該部分首、次、末,二碼取法為該部分首末。
例1“照”分成“昭、灬”二個(gè)部分(上下),第一部分取“日、刀、口”,第二部分只能取二碼了(因一個(gè)漢字限取五碼),故只取首末的二個(gè)點(diǎn),中間二個(gè)點(diǎn)省略。
2“戇”分成“贛、心”二個(gè)部分(上下)第一部分取“
、一、貝”,即該部分的首次末,其余略。第二部分取“心”就可以了,全碼為“
、一、貝、心”四碼。
3“避”分成“辟、辶”二個(gè)部分(包圍),第一部分取“尸、口、十”,其余略,第二部分也只有“辶”一碼,全碼為“尸、口、十、辶”四碼。
4“鍵”分成“金、建”二個(gè)部分(左右)第一部分取“金”第二部分取“乛、一、辶”因?yàn)椤绊病痹诒碇袩o此字根,故拆成筆劃取該部分第一、第二碼“乛、一、”后再取該部分末碼“辶”,全碼為“金、乛、一、辶”四碼。
三、雙排每個(gè)鍵上字根分上、下二排,如拆分后某個(gè)部分只有一碼,并且該字根又在下排位置則該碼加后綴“V”。當(dāng)然本條規(guī)則可以取消不用,但重碼要相應(yīng)增加一些。
例1“則”分成“貝、刂”二部分,“貝”在B鍵下排,“刂”在D鍵下排,每個(gè)部分都只有一碼,故都需加“V”。全碼為BVDV。
2“側(cè)”分成“亻、則”二部分,第一部分“亻”在R鍵上排,不用考慮,第二部分的“貝、刂”雖然都是下排字根,但該“貝、刂”均不是單獨(dú)出現(xiàn)(該部分有二碼),故“貝、刂”都不加V,全碼為RBD,這條規(guī)則就是說,下排的字根只有在一個(gè)漢字的首碼或末碼且作為偏旁單獨(dú)出時(shí)才加“V”。即“上排不用下排用,首尾僅有一碼加”。
即使在使用第三條規(guī)則時(shí)98%以上的字在忘了加V時(shí)仍能顯示正確漢字,因?yàn)榧佑腥蒎e(cuò)碼,等于未使用該規(guī)則一樣。
本規(guī)則對(duì)應(yīng)國標(biāo)GB2312-80基本集以及新明碼本中的全部漢字,無其它特殊要求、特定規(guī)則及輔助編碼,取碼順序與書寫習(xí)慣保持一致,這樣利用人們現(xiàn)有的知識(shí)和習(xí)慣比接受一個(gè)新的次序要容易得多,人們會(huì)不自覺地遵守它。在字形的拆分上也從簡(jiǎn)考慮,漢字多數(shù)是形聲結(jié)構(gòu),但漢字的形和讀音規(guī)律牲不強(qiáng),并無必定的內(nèi)存聯(lián)系。音有它的特點(diǎn)也有存在的問題,如許多罕見字一般人不認(rèn)識(shí),現(xiàn)階段即使常用字也有人常常讀不準(zhǔn)。形雖無此問題,但拆分中對(duì)形的結(jié)構(gòu)、筆順等方面存在著不同看法。對(duì)這些問題,著重從一般人員使用簡(jiǎn)便出發(fā),在“易”字上下功夫,盡可能簡(jiǎn)化取碼規(guī)則,最大限度地減少死記和思維,對(duì)字形拆分和筆順中易錯(cuò)的地方采取容錯(cuò)碼來解決,為使用者提供方便。因此新華編碼方案簡(jiǎn)單、易學(xué)、實(shí)用方便。
權(quán)利要求
1.字根安排a.一個(gè)鍵位對(duì)應(yīng)一組字根,字根大部分按聲母音所在的鍵位排列,如M鍵上放“木、馬”,N鍵上放“女、?!钡?。b.類同字根放在同一鍵上,如“艸廾
廿井”在U鍵上,“凵冂冂匚
”在D鍵上,“丶丷
”在Y鍵上等。c.鍵位上字根分上下兩排,使每個(gè)鍵可容納較多的字根。
2.容錯(cuò)能力強(qiáng),針對(duì)不同人員對(duì)筆順和字形拆分的不一致,加有大量的容錯(cuò)編碼,某些字有10多個(gè)不同輸入碼均可正確輸出漢字。
3.對(duì)編碼中產(chǎn)生的重碼,計(jì)算機(jī)在稿件輸入過程中有自行查找、選擇的功能(保留了人工選擇)。
專利摘要
新華編碼方案是計(jì)算機(jī)漢字輸入拼形方案,側(cè)重機(jī)關(guān)干部、編輯記者等非專職操作人員使用計(jì)算機(jī)輸入漢字而設(shè)計(jì)的,規(guī)則嚴(yán)謹(jǐn)、簡(jiǎn)單明確,取碼符合漢字的特點(diǎn)和人們書寫漢字的習(xí)慣。鍵位的字根安排便于聯(lián)想記憶和查找,容錯(cuò)能力強(qiáng),錯(cuò)碼率低。詞組和標(biāo)點(diǎn)符號(hào)使用方便。全部規(guī)則為七個(gè)字雙排、雙分、按筆順。對(duì)應(yīng)國標(biāo)GB2312—80基本集及新電報(bào)碼本中的全部漢字。該方案現(xiàn)已經(jīng)在新華社國內(nèi)新聞?dòng)?jì)算機(jī)處理系統(tǒng)中正式使用。
文檔編號(hào)G06F3/023GK87104351SQ87104351
公開日1988年1月13日 申請(qǐng)日期1987年6月24日
發(fā)明者蔣順炳 申請(qǐng)人:新華通訊社技術(shù)研究所導(dǎo)出引文BiBTeX, EndNote, RefMan