專利名稱:新五筆編碼及鍵盤的制作方法
計算機的漢字處理問題,被稱為中文信息處理的瓶頸。目前,漢字編碼的方法有許多種。他們的處理方法一般是直接或間接的拼音法或拼形法。由于,漢字是一種非拼音文字,所以借助拼音碼或音形結合的編碼,不能徹底解決,漢字不可盡識,讀音難于規(guī)范的問題?;蛟S,可以確切地說,拼音文字的錄入,也是依靠26個字母的形碼。對于漢語來說,研制一套科學的表形碼,去撿索漢字,是關系著全民族文化的問題。從《說文》540部到"五筆字型"200字根,歷盡了人們的努力。當前,計算機等級考試列入了"五筆字型",這充分的說明了,漢字錄入的重要性和人們撐握"五筆字型"的難度。這是因為,漢字起源于一種象形文字,"五筆字型"這種用字根拼接的拼形文字,必然遇到字形折分不易規(guī)范,字根過多難于記憶的困難。按人們的希望說人們需要的是一種,少學就會,象拼音那樣易于記憶的方法。
"新五筆編碼及其鍵盤"是綜合了歷代漢字的字形變化,漢字的語音變遷,漢字的型體特點,漢字的撿索方法及人們視別象形文字的感覺特點以后,結合計算機特點,在電子技術領域內(nèi),漢字應用領域內(nèi),形成的一套漢字編碼方案。它可以象寫字一樣編出一級庫,二級庫,的標準漢字和現(xiàn)行的楷化漢字,形成無數(shù)詞條。進行文字處理。
本發(fā)明涉及的是一種由66個形碼完成的,對漢字特定位置編碼的筆形編碼法,和依據(jù)這種方法設計出的中文輸入鍵盤。其特點是,形碼數(shù)量少,便于記憶;定位編碼,不用字形拆分,編譯準確;完全依據(jù)漢字字形信息,直觀易學。
發(fā)明技術方案,單字錄入最多四碼,形成二套基本編碼方法一套是全用形碼,每字四碼。另一套是根據(jù)人們思維先聲后形的基本規(guī)律,先用聲碼,再用形碼,聲一形三,每字四碼,(或聲一形二)專為直接書寫服務的"寫碼"。發(fā)明技術方案可以形成,全碼,簡碼,反體字碼,詞匯碼等實用技術和編碼碼本。
漢字的撿索有兩個特性一是它們的間接性,它們都是依據(jù)漢字的不同的特點去撿索漢字的,如拼音是依據(jù)漢字的讀音特點。二。是多樣性這是因為每種撿索方法都有自己的長處。所以文字處理機或電子計算機都具有幾種輸入方法,通過[CTRL+F]去轉換。本發(fā)明依據(jù)數(shù)千個語音卡片的分類,實現(xiàn)了"漢語拼音雙拼方案"與筆形編碼技術在一鍵盤的資源共享。無需CTRL+f鍵的轉換。使人們處理漢字更方便。
本發(fā)明適用于一切大,中,小,微型中文信息處理電腦系統(tǒng),漢字電傳機,漢字電腦打字機,漢字終端機,漢字電腦學習機,及漢字通訊系統(tǒng)。供廣大老,中.青專職或業(yè)余的文字工作者使用。而且是應用電子技術形成電子詞典的必要撿索工具。
"新五筆編碼"是依據(jù)形碼進行編碼的。但其實質(zhì)是一種編碼文字。它編入的不是字形而是一漢字具有的字形特征。"新五筆"包含有三部分,即系統(tǒng)形碼,字型和編碼法則。
新五筆系統(tǒng)形碼分為筆形碼,字根碼,整字碼三大類。"發(fā)明"發(fā)展了傳統(tǒng)五筆,點(丶),橫(一),豎(丨),撇(丿),折(乙)五種筆劃,成為八種筆劃。即",","一","丨", ,"丿","フ","", 。并總結了漢字使用中形變特點,建立了四個本系統(tǒng)的形碼。即"末", ,"二"。其中" 是根據(jù)漢字的結構,以"十"和"ナ"為骨架,并連及與它相交或相含的筆形,構成的結構整體。如"豐""隸"等。
"二"是根據(jù)漢字的結構,以"二"為疆界,并包含它內(nèi)含的筆形,構成的結構整體。如"王","正"等。
是參照漢字形變,歸并字根,形成的形碼。例如 ,是"", 幾種字根概括而成。
同時發(fā)明把系統(tǒng)內(nèi)一些形似字根歸納在一起,用一個形碼表示。
如 ,是將 幾種字根概括為一個形碼。其字根間的相容關系。表示如圖1.
發(fā)明又根據(jù)本系統(tǒng)形碼的相容關系,根據(jù)方便記憶,方便使用的原則,將66碼排例在計算機標準鍵盤上,形成中文輸入鍵盤。如圖2.
注"阝"只用于右側。
關于字型,新五筆認為漢字起源于一種象形文字,它的繁衍就是象形文字的發(fā)展,例,"馬"發(fā)展為"嗎","篤"等??梢哉J為,其中"嗎"是"馬"向左的擴展;"篤"是"馬"向上的擴展。
"新五筆"為了建立一種直觀的,純字型的分類。它依據(jù)漢字內(nèi),字間豎向割線及字間橫豎交連割線,將字分成四型。如"眾"被字間橫豎交連割線,分成三塊,為合并型;"人"字間無豎向分割線,為獨體型。"從"字間有豎向分割線,為擴展型;"似"字間有兩條以上豎向割線,為超擴展型。又依據(jù)特定的偏旁筆劃,如"亠","丿","尸"......等。將獨體型,分成標準體,上擴展體,外擴展體,側擴展體。并將合并體字,標準體字定為基礎字,如"芭",依據(jù)"艸"定為上擴展體,擴展字。其它各體漢字均定為擴展字。確定了漢的兩大類。并認定,擴展型,超擴展型都是從它的最右側向左進行擴展的。
如"像"是左擴展型,擴展字,"象"為基礎字。又將"Q","X","Z"為它們的字體代號。明確了漢字的。四型,八體,二類和每種字體的代號,即圖3.
"新五筆"認為漢字的筆劃是復雜的,但人們識別時,不是一筆,一筆的去分辯。如,草字"明"中,"月"字只是寫作 ,象這樣的例子甲骨文中屢見不鮮,它反映出象形文字,重在輪廓的特點。"新五筆"根據(jù)這一特點,對漢字的每一字根,進行了試驗。認定了可以從略表達的字根,如"習","月","匕"等。為虛實形字根。見圖4.
"新五筆"以標準體為基礎,規(guī)定擴展體字去掉一個擴展符后所占的全部區(qū)域。為虛實區(qū)。
例"寸"是標準體字,它所在的全部區(qū)域為虛實區(qū)。
"萌"中,是上擴展字,它去掉擴展符"サ",以后,"明"所在的全部區(qū)域為虛實區(qū)。
"新五筆"規(guī)定虛實形字根的編碼方法為當虛實形字根或含有虛實形字根的基礎字,不單獨占有虛實區(qū)時,基礎字中的虛實形字根,按編碼順序,只編一碼。
例"有"中,"月"是虛實形字根,且不單獨占有虛實區(qū)。"有"中,"月"編一碼編為"匚"。而標準字"月",單獨占有虛實區(qū)。所以,"月"字編為"匚""二"。
"狩"中,"寸"單獨占有一個擴展符號(宀)的所轄區(qū),所以"寸。編為"十","丶"編成了兩碼。
新五筆"把由兩種以上形碼構成的聯(lián)合體或包合體。稱為組合形。其情況如下(1)兩形相連如"弗","自","電","出"形成組合形。
(2)形碼為 ,"二","匚","囗"。構成的形體。為組合形。如"田"字(3)形碼"", 內(nèi)含其它筆形時,稱為組合形。如"皿"。
(4)字間含有點時,認定點與鄰筆劃相連形成組合形。如,"叉"為,"フ""、"相連。"新五筆"系統(tǒng)規(guī)定(1)."甲""由""申""田""力""匕",組合形的表示方法。如圖5.
(2).基礎字中的,組合形編二碼。例"鼻"中,“自”編為 "二"(3).組合形字編碼順序是先外后內(nèi)。先上后下。先左后右。
例"內(nèi)"為,"匚" "甫"為, ",""匚"。"正"為,"二""丨""一"。
"新五筆"將字首第一碼分為兩類,將自上通到底的形碼稱為通碼,例"佰"中"亻"為通碼;將不能通到底的形碼稱為半碼。例"得"中首筆"丿";"此"中首筆"丨",均為半碼。并規(guī)定左擴展中,擴展碼為通碼,虛實區(qū)中的字從字首開始編碼;左擴展中,擴展碼為半碼時虛實區(qū)中的字,從字尾開始編碼。
例"傳"為,"亻" "丶"フ"。"轉"為, "フ"。
"新五筆"是一種編碼文字,圖3.已把漢字已分成,四型,八體,兩類。"發(fā)明"在此基礎上,將字體圖,進一步分區(qū),并用數(shù)字0--6標明序號,提示出編碼的位置和順序,形成"編碼位置順序圖"規(guī)定0為擴展區(qū);1.2是首區(qū) 或尾區(qū);其它為補充區(qū),即圖6.可以讓人們,用形碼,按提示順序,和提示位置的筆形對漢字進行編碼。前三碼不足補"Z";缺第四碼補字體代號。標準字第四碼均補"X"。超擴展字最右側為基礎字,缺第四碼補首區(qū)形碼。
如,"罷"與"交"為標準字按圖,分成四區(qū)"1",為首位區(qū),"2"為尾位區(qū)"3","4",補充區(qū),按"1","2","3","4"四個對應區(qū)號順序,編入三個對應形碼。
"罷"首區(qū)(目)尾區(qū)(厶)(3)區(qū)空,(4)區(qū)(土)第四碼為"X;符號為"E""D""Q""X"。
"交"首區(qū)(六)尾區(qū)(X)(3)(4)區(qū)空;不足三碼補"Z"四碼為"X";符號為"M""V""Z""X"。
注下擴展字,先編基礎字,后補"\"。
"新五筆"關于編碼法則規(guī)定如下(1).先左后右。先上后下,先整字碼,后字根碼,再筆劃碼。筆劃碼按"一","丨","フ","丿"為順序依次編碼。"折筆"與"一","丨","丿"相交不視為相連。
例"票"為"西",而不是"一"。"角"為"ク",而不是 "九"為""レ"("折"與"丿"不視為相連)。
(2).編碼過程中尾區(qū)碼,必須用一次。
(3).本發(fā)明的 均分布在,字母鍵"F"P""C"上,參看圖1,可直接歸納為上點"F",下點"P",右邊"F",左邊"C"。字間也有"F""C",兩點"F",一點"C"。
"新五筆"依據(jù)數(shù)千個語音卡片的分類,確定了ZH,CH,SH,Z,C,S,組中任一聲母與J,Q,X,組任聲母,可以組合成相容關系,改變鍵盤分布,實現(xiàn)漢語拼音雙拼方案,形成雙拼輸入與筆形輸入或音形碼與筆形碼,對漢語輸入鍵盤的資源共享發(fā)明把聲母"Z"歸入"X"鍵使雙拼鍵盤與"新五筆"的鍵盤兼容。在同一鍵盤不用[CTRL+F]轉換,即可任意進行雙拼或"新五筆"操作。其雙拼鍵盤見圖7.
"新五筆"不僅可以應用于簡化字,同時用"言"代"讠",用 代"貝",用"門"代"門",用 代"烏"用 代"頁"用 代 可以形成反體字輸入鍵盤。讓人們方便的輸入反體字。
"新五筆"詞組用四碼編入法兩字詞為,首1,首2,尾2,尾1.三字詞為,首1,首2,首3,尾3.四字以上詞為,首1,首2,首3,加尾字首碼.
圖1.形碼字根相容關系圖2.中文輸入鍵盤圖3.漢字四型,八體,兩類。
圖4.虛實形字根圖5.特殊定義字圖6.新五筆編碼位置順序圖7新五筆雙拼鍵盤
權利要求
1.一種新五筆編碼及法其鍵盤,其編碼特征是將傳統(tǒng)五種筆劃發(fā)展為八種筆劃,設制了四個新筆形代碼,通過對漢字字根的優(yōu)選形成66個形碼,并根據(jù)它們的相容關系形成能與雙拼方案同時操作的漢字輸入鍵盤,依據(jù)系統(tǒng)"編碼位置順序圖"及虛實概念,通,半碼概念的應用法則,形成簡單準確的筆形編碼體系。同時依據(jù)思維先聲后形的原則,用聲母和形碼編成"寫碼"。
2.一種新五筆編碼法使用的,有八種筆劃,即",""一""丨" "丿""フ""" 和四個筆形碼,即 "二"組成的形碼體系。在這個體系中,形碼與字根關系表現(xiàn)如,"字根兼容圖",即圖1.字間兩點和字右側點表示為字母"F",字間單點表示為字母"C"。
3.一種新五筆編碼法使用的,中文輸入鍵盤,即圖2,它是依據(jù)漢字字根間的相容關系,根據(jù)便于記憶,便于使用的原則排列在標準鍵盤字母鍵上。
4.一種新五筆編碼法使用的,根據(jù)漢字繁衍特點,及偏傍,筆劃確定的字型,字體,字類和與字體相關的字體代碼。即圖3,它是一種直觀的純型式的分類方法。它是系統(tǒng)編碼的基礎。
5.一種新五筆編碼法使用的,根據(jù)漢字的象形特點,提出的虛實形概念,并通過近萬次的試驗確定的漢字虛實形字根,即圖4.形成了虛實形字根有詳有略的兩種編碼方法。即編碼過程中,當直接虛實形字根或含有虛實形字根的基礎字不是單獨占有虛實區(qū)或不單獨占有一個擴展符號的所轄區(qū)時,基礎字中的,虛實形字根,只按編碼順序,編一碼。如"有"中"月"為基礎字中的虛實形字根,"月"不單獨占有虛實區(qū),且"月"又不單獨占有一個擴展符號的所轄區(qū),所以"月"只編一碼"匚"。
6.一種新五筆編碼法使用的,根據(jù)漢字的特點,結合直觀的視覺反應,提出的通,半碼概念。即新五筆將字首第一碼分為兩類,將自上通到底的形碼稱為通碼。例"佰"中"亻"為通碼;將不能通到底的形碼稱為半碼。例"得"中首筆"丿"為半碼。其應用法則,是左擴展字中,擴展碼為通碼,虛實區(qū)中的字,從字首開始編碼;左擴展中,擴展碼為半碼,虛實區(qū)的字從字尾開始編碼。例"稈"首碼為半碼,"干"從字尾編碼,編為"十""一"。從而使?jié)h字的編碼順序多樣化。
7.根據(jù)權利要求1.新五筆編碼法,結合漢字的特點,確定了組合形概念和組合形編碼方法。具體表現(xiàn)為(1).應用組合形原理規(guī)定"甲""由""申""田""力""匕",組合型的表示方法。圖5(2).虛實區(qū)內(nèi)編組合形用二碼,編獨立形用一碼。例"鼻"中,“自”為 ."二".(3).組合形字編碼順序是先外后內(nèi)。先上后下。先左后右。
8.一種新五筆編碼法使用的,根據(jù)權利要求1.4和6.形成的系統(tǒng)"編碼位置順序圖",即圖6.它是漢字的定位編碼的依據(jù)。它可以形成兩套編碼。一套全用形碼;一套先用漢語拼音聲母,然后依據(jù)圖6.編入三個或二個形碼。形成"寫碼"。
9.一種新五筆編碼法使用的,能實現(xiàn)筆形碼與雙拼方案同時操作的漢字輸入鍵盤。它是依據(jù)數(shù)千個語音卡片的分類,確定了ZH,CH,SH,Z,C,S,組中任一聲母可以與J,Q,X,組中任一聲母,組合成相容關系,改變鍵盤分布,實現(xiàn)漢語拼音雙拼方案。使?jié)h語拼音鍵盤多樣化的方法。應用這一方法可以形成,雙拼輸入與筆形輸入或音形碼與筆形碼,在不用[ATRL+F]轉換的方式下,可以任意進行雙拼和筆形碼的操作,達到對漢語輸入鍵盤的資源共享。圖5.是系統(tǒng)資源共享的一種具體形式。
10.按照前述權利要求1—9中的任何一條,對漢字和中文詞組的編碼方法,可以用在一切大,中,小,微型中文信息處理電腦系統(tǒng),漢字電傳機,漢字電腦打字機,漢字終端機,漢字學習機,電子漢語字典及通訊系統(tǒng)中,并可形成各種含有漢字一級庫,二級庫及現(xiàn)存反體字,簡化字的單字或詞組的新五筆編碼碼本。和漢字撿索碼表。
全文摘要
“新五筆編碼及其鍵盤”在文字學,語音學,電子技術方面提出了一些新的認識,用形碼編寫一級庫,二級庫,標準漢字和現(xiàn)行楷化漢字,其特點是形碼數(shù)量少,不用字形拆分,編譯準確;完全依據(jù)字形信息,直觀易學,單字錄入最多四碼,有二套編碼,一套全用形碼,另一套根據(jù)思維先聲后形,編成“寫碼”,可以形成,全碼,簡碼,反體字碼,詞匯碼等實用技術,可實現(xiàn)“雙拼方案”與筆形編碼對鍵盤資源共享,適用于老,中,青文字工作者。
文檔編號G06F3/023GK1126335SQ9510496
公開日1996年7月10日 申請日期1995年5月17日 優(yōu)先權日1995年5月17日
發(fā)明者潘鑫國 申請人:潘鑫國