專利名稱:電腦中文象形輸入的原形碼的制作方法
技術領域:
本發(fā)明涉及一種漢字拆分成能和英文字母一、一對應的電腦編碼方法,可用于文字研究和電腦漢字輸入打字、文字轉(zhuǎn)換等方面,對電腦的普及,國內(nèi)外傳真有一定的先進作用。拆分后的漢字塊和英文、數(shù)字(微機標準鍵盤上的字符)象形,就是不懂漢文地外國人也很容易學會,打出中國字來。本發(fā)明同樣適用于朝文、日文的輸入打字方法。
常規(guī)的電腦漢字輸入方法有“五筆字型”、“漢語拼音”“金角”等。近年來我國有上百種漢字輸入方法問世,對我國的微機發(fā)展起了很大作用。較先進的方法本發(fā)明了解大致有幾種?!皾h字檢索碼”將10個筆型區(qū)編成26個代碼,將同類碼歸類設計,是目前較好的字根方案,它在鍵盤上字根數(shù)是126個。而“五筆字型”字根總數(shù)為192個。但該方法沒有象型性,仍需在記憶上費功夫?!岸P碼漢字輸入”提出“字五類基本筆劃的二筆畫排列具有不可易性”,這是一個重要的規(guī)律性。它為本發(fā)明提供了有益的啟迪。“字塊碼漢字輸入法”,提出了“子字塊”與“母字塊”的關系,拆分字塊在字典上常用,且經(jīng)常被人忽略的事?!叭S天然碼”有些象形性,使記憶容易多了。但也存在象形不明顯,分離不清楚的弱點,且字根碼達266個,也會增加一定記憶負擔?!耙稽c通”等用漢語拼音快速打字方法,對于熟悉漢語拼音,普通話較準的人來說,無疑是個高速度。但僅就我國地方方言較多,發(fā)音不普遍一致的情況下,推廣就受到一定的限制。常規(guī)的電腦漢字輸入方法中,用4碼以內(nèi)鍵字重碼率均較高。
本發(fā)明的目的是提供一種能基本上和英文字母,或標準電腦打字鍵盤上的字符一、一對應的漢字基本筆型,字塊所組成的字根碼,即原形碼,或稱象形碼,和適用于其它電腦編碼輸入,防止重碼的電腦輸入或打字的方法。也適用于朝文、日文的象形電腦編碼輸入、打字。
本發(fā)明的目的是這樣完成的本發(fā)明電腦漢字輸入原形碼或象形碼包括“說明書附
圖1”,“說明書附圖2”“說明書附圖3” “說明書附圖4”,“說明書附圖5”,和本發(fā)明的電腦輸入、打字拆分方法“拆分象形整理,區(qū)別編碼,設主碼、數(shù)字碼、方向碼”其特征是1.全部漢字是可以合理或拆分后和英文和阿拉伯數(shù)字(即電腦標準鍵盤上所標字符的大小寫)象形的。2.編碼可不重碼。
本發(fā)明電腦漢字輸入原形碼,1、首先將漢字和英文字母象形對應整理,將無法直接對應的漢字拆成子字塊,將子字塊和最簡筆劃分類對應,在不影響漢字本身結(jié)構(gòu)的情況下對子字塊有拆有合,然后按電腦鍵盤上的字符象形分類整理,設計出“說明書附圖1”。左經(jīng)過編碼驗證,進一步研究后,對其優(yōu)缺點有了一定認識,在此基礎上精簡、調(diào)整、設計出更具代表性的原形碼,即和標準電腦鍵盤字符基本符合的代表符號,這個代表符號又必須符合漢字的結(jié)構(gòu)性和鍵盤字符的一致性,在這個代表符號下又經(jīng)多次編碼實驗調(diào)整,設計出“說明書附圖 2”和電腦輸入,打字拆分方法。可有效地減少重碼難題。又設計出“說明書附圖4”“說明書附圖5”可不重碼。2、在“說明書附圖”,中數(shù)字碼 “× 2、×3、×4、×5”,使得同向多筆,或同形子字塊在同一字中只打1碼即可完成。3、“說明書附圖”中“U、E、>、
”為方向標志,可有效防止打字中漢字相似不相同的現(xiàn)象發(fā)生。4.重碼字可放在主碼字中只打1碼即可完成。失去重碼的可能。5.同字根偏旁部首分別編碼,降底重碼率。6、偏旁部首(通常的首碼)打2碼(第一碼打主型,第二碼打區(qū)別),可防重碼。7,本發(fā)明做了象形分析發(fā)現(xiàn)漢字字根和英文的字母、數(shù)字相義象形。8.本發(fā)明也曾和朝文、日文做了可象形分拆,認為是可行的。
采用上述技術方案后本發(fā)明的原形碼和英文,和阿拉伯數(shù)字(即電腦標準鍵盤上所標字符的大小寫)是象形的。用于電腦輸入也可不重碼。
附圖是本發(fā)明電腦中文象形輸入的原形碼的原理圖。其中,附圖1是原形碼字根表;附圖2是縮減的原形了碼字根表;附圖3是“五筆字型字根”原形碼表;附圖4是原形碼4碼鍵字字根表;附圖5是原形碼4鍵碼偏旁部首字碼表。
下面參照附圖對本發(fā)明進一步說明。
本發(fā)明的附圖是按電腦打字的鍵盤面格式設計的,所標的英文字符和阿拉伯數(shù)字的位置和順序是鍵盤上固定的,附圖鍵碼中每一碼格內(nèi)左上方均是原鍵盤碼號。其下屬第一行左起第一個符號是原形碼在本碼健的標準代碼,以此下推,均屬本碼鍵的標準代碼。一碼鍵上標準代碼(即字根),可以有幾個,用作同類漢字塊和碼鍵對照象形的。有的碼鍵右上方有
(上)、(中)”是為考慮到漢字的復雜性,為加快打字速度、解決在打字中出難題設置的方向標,即漢字“相似不相同”、“相同不相向”的現(xiàn)象,在原鍵碼上無法解決而設。例如“由、申、”二字,按本發(fā)明打“日”鍵,再打“I”鍵,若要取“由”字,則再打
的鍵碼即可。在鍵碼的左下方標注的漢字是一鍵碼打的字,其字型選定有叁個意義1、常用。2、防重碼。3、是本鍵碼的漢字象型體。
代表中間筆向上伸長,U代表兩邊筆向上伸長、E代表三筆向右伸
是向左右伸長,它們另一個表示是在伸長的方向上不封口。在“2、3、4、5”鍵碼上標有“×2、×3、×4、×5”是用作同方向筆順的筆數(shù)或同形子字塊在同一字中1碼即成的。例如“品”字先打“O”然后打“ 3”即可出字?!麈I是用來查閱字碼根或同形字的,放在“O”數(shù)鍵上。鍵碼右下方是主碼字可一鍵碼鍵字。
本發(fā)明有兩種附圖形式,下面分別予以說明。
第一種形式見“附圖1”本發(fā)明將漢字和所拆分的子字塊象形體,和象形體所能代表或組成的偏旁部首按象形化逐各落實在相應的字符鍵碼上,設計出“附圖1”。應該說明的是漢字的筆劃組合立體的復雜性;決定某些子字根和簡單字可以同時和兩個字母相似,例如“丐”左邊象”q”,右邊又象“E”;“七”即象漢字的七,又象字母的“t”“日”字又象“B”,也象“ 8”。還有稍如交化,即便在原字結(jié)構(gòu)中多連一點就會又象一個字母。例如“立”字去掉左邊一點和上一點“
”就象字母“Z”了,若去掉下“一”,又象漢字大寫的“六”又如
子塊象字母“S,而去掉上邊“1”,變成
又好象字母“Z”了。附圖1就是將雙象型的拆分體字塊,凡是在象形的字符下都有安量。這樣做優(yōu)點上象什么符號就不必太思索的打什么碼。最終都會打出這個字來。打字也方便,附圖1是漢字象形字根和典型關聯(lián)字全部在所在象型的位置上,對兒童的微機學習是最適宜的?!案綀D1”全部字根以35個代碼,以3碼或4碼的形式將大字符集20902個漢字及所成型的漢字字庫納入編碼范疇,并設有方向指示符,且方向指示符也與電腦打字鍵盤字符象形。
第二種形式見“附圖2”是在“附圖1”的基礎上進一步系統(tǒng)規(guī)化的簡化表,字根縮減到168個;可1、2、3碼;最多4碼鍵入成字,更有效的縮減了重碼率經(jīng)多次試編碼,未發(fā)現(xiàn)重碼,可見重碼率可降到1%以下的先進程度,其簡化的方法重點突出了象形化特點,抽出了符合鍵盤字符的大小寫象型的一個或幾個典型舉一反三,予以代表整個碼下的全部漢字集合。例如,在“P”碼內(nèi)原有字根27個,經(jīng)化簡后僅剩4個,只要細心分拆一下,只用一個“P”就可以了,但考慮大眾化應用需再具體一些,加了4個,就基本上概括了“P”象型的字形了。其次對在原鍵碼內(nèi)的重碼字根根據(jù)象形和漢字的規(guī)則做了修改和調(diào)整。例如“走”字可拆成“土”和
或拆成“十”和“
”,在“附圖1”中“
”和
分別放在“E”和“U”兩個不同字符中,根據(jù)上述的抽象縮減字根和防止重碼的原則,“走”的下部分留在E中增加混亂,且影響重碼,為此將在“E”中的底部撤出,僅留下在“U”中的底部“
”了。經(jīng)過調(diào)整確定的“附圖2”,是科學的、簡化的,概括性強,易記,輸入和打字的速度會更快。
“附圖1”、“附圖2”的象形方面因有附圖全面對照,在此不詳細說明了。
本發(fā)明的“說明書附圖3”是用“五筆字型字根”做的原形碼表?!罢f明書附圖4”中主字和標準字根是經(jīng)盡可能的簡化設計,每一個字根代表一類字根的集合。所以,在實際字的組合編碼上以主體象形為主,可以用補打區(qū)別碼的方法。“說明書附圖5”中每豎行左側(cè)為部首或字根,右側(cè)為其編碼。由于都是偏旁部首,盡管較大部分均可獨立成字,但和其它字根組合成字是必然的。因此,本發(fā)明在“說明書附圖5“上實行”偏旁部首最多編2碼的原則”?!罢f明書附圖5”是按“說明書附圖4”編碼的,其中匯聚了全部漢字偏旁部首,編碼后無一重碼。“說明書附圖5”試將“非字偏旁部首”盡可能的拆分編碼,總編碼仍無重碼(可參照附圖)。
本發(fā)明和電腦編碼輸入打字的方法,主要特點是采用偏旁部首主象形,打第一碼,再拆分主象形打區(qū)別第二碼的方法。使得匯聚在一鍵碼內(nèi)本來重碼率不多的偏旁部首,更失去了重碼的可能。本發(fā)明在研究了漢字構(gòu)成的基礎上發(fā)現(xiàn)漢字個各有別,因而才能個各獨立。而電腦輸入打字上僅有36個字符,就是200多個偏旁部首平均分配,每個字符碼鍵上只少得有6個偏旁部首,這是形成重碼的主要原因。本發(fā)明將象形字符進行科學的拆分和組合,第一是象形、第二是防重碼,后者比前者更費時,更重要。因而在每個字符上分配象形字根時就已經(jīng)把重碼設計到最底限度,針對偏旁重碼的第一關,讓每個鍵符上的全部字根(第一碼代表了這個鍵符)再經(jīng)一碼的分類拆分,這樣就會使得重碼在根子上再一次被分離,而第三碼打的正是余下部分的主象形。在每個偏旁部首下的字形中,除偏旁部首以外的部分同在一個象形碼下的幾率本來就不多,進一步的分碼使重碼的可能變得更小了。(失去了重碼的可能性)。例如“碼”字第一碼打偏旁“石”字所在的“6”碼鍵,第二碼打偏旁上
所在的碼鍵“ T”,第三碼打“馬”字所在碼鍵“9 ”,總合碼為“6T9”即可。而在“6”碼鍵上的全部字根按此法,第二碼沒有打“T”的,顯然“石”字的總碼和“6”碼鍵的全部字根不會重碼,和其它碼鍵上的字根由于第一碼不同,就更不會出現(xiàn)重碼了。附圖4、5、按序打碼也是可行的。
本發(fā)明應該重點指出的是防重碼的其它措施一、可采用本發(fā)明方向符號來做。例如“叻”打“OH”,而“另”則打“OIH”(
為立字符號)。二、也可采用區(qū)別設碼的方法。例如將含有“日”的純豎字(上下結(jié)構(gòu))中“日”改,放在“Δ”鍵上。“旰”打“BF”,而“旱”打“ΔF”。三、對各別的重碼字可單放在鍵符主碼字上,一鍵出字加以區(qū)別。例如“旮”打“9B”,而“旭”只打“”即可。
本發(fā)明應該重點指出的是也可實現(xiàn)最多3碼鍵字不重碼。其方法是將上述方法中非4碼鍵字不可的字的偏旁部首,或折分字塊整體放入某一不會出現(xiàn)重碼的鍵符中,重新調(diào)整而實現(xiàn)3碼鍵字。例如“碼”字,“石”放在“6”鍵符中,“馬”放在“5”鍵符中,“碼”編碼就定為“65”了。這樣做缺點是會影響一定的象型性。所以在此方法偏碼中應注意不重碼原則和盡可能的象形性。本發(fā)明已實踐證實可行。
本發(fā)明應該重點指出的是本發(fā)明的方法拆分的字塊,經(jīng)排列分折后可證明郭沫若先生的預言世界上的文字是“同源不同轍”。例如英文的“J”,相當中文的“丿”和“”,有收和拿的意思。而“L”相當“”和
有失和失而復得的意思?!皫住币馕兜玫胶褪?,以及最后是多少?!帮L”又是有進而且又出去了,且“×”狀態(tài)。又如“扌”意味不僅要拿,而且要拿過來。而“手”又是拿的工具,是
4指加上1個“”共用的大姆指,將物握住。又如“S”表示“彎”形,
是象形,“魚”實際也是頭彎尾平,而
正是彎身去將物拿給自已。又如“
”表示一個物體,
地上或某物上的物,帶有頭的意思,“”就更表示“頭”,“
”是頭上頭,有“山”的威言,是上層,
就是學問,或為王了,“王”應該是“
”和“山”的變形,英文的“W”就很像漢字“
”和“山”,而歷史上各國的王冠,素以“W”形為普通。還可以舉很多例子。當然這是用現(xiàn)實來推斷過去。這里僅證明本發(fā)明可用于文字研究。
方向標志和山“×”的方法因前面有敘,在此省略。
本發(fā)明與現(xiàn)有技術相比1、將漢字和漢字拆分后的子字塊,漢字比劃全部和英文字母,電腦鍵盤字符建立了象形的對應關系。這是前所未有的。2、將漢字(字典)利用偏旁部首查字的原理用到電腦輸入打字上,打完偏旁部首一碼再回打偏旁部首區(qū)分碼的作法前所未有。3、可有效的克服重碼率,使電腦輸入、打字、通迅加快速度。
4、由于直觀易學、易記,有利于電腦的普及,不僅適合一般人學習,對少年兒童也同樣適用。5、外國人不懂漢字也能學會打字。有利于國際上的交流與合作。6、同樣適用朝文、日文和英文、漢文之間的象形電腦編碼、輸入、打字。 7、可編入全部簡繁漢字。
本發(fā)明認為采用“附圖1”編碼,有利于初學者、外國人、幾乎無需專門記憶,很快就能掌握。例如“日”字,一看便知即象“B”,又象“8”采用一字多編碼的形式,那么想打“日”,打“B”也行,打“8”也行。但會增加重碼率,影響一定的打字速度??勺鑫淖盅芯渴褂?。
采用“附圖2”編碼,字根少、規(guī)律強,所允許編碼字數(shù)并不少,由于象形性,又加上規(guī)律性,記憶并不難,簡單明了、重碼少,輸入打字速度快。例如“P”鍵只記住“P”右上方有口很象P就行了。
本發(fā)明認為在編碼輸入、打字上采用附圖“4”,“5”和本發(fā)明的方法是本發(fā)明的最好方式。
權(quán)利要求
1、一種電腦中文象形輸入的原形碼,它包括附圖1,附圖2,附圖3,附圖4,附圖5和拆分象形整理,區(qū)別編碼,設主碼、數(shù)字碼、方向碼,其特征是(1)漢字整理、拆分后和英文字母、數(shù)字(電腦鍵盤上的字符)是象形的。(2)編碼可不重碼。
2、根據(jù)權(quán)力要求1的原形碼,其特征是象形碼標注在附圖1的36個字符中。
3、根據(jù)權(quán)力要求1的原形碼,其特征是縮減的象形碼代表標注在附圖2,附圖3,附圖4中。
4、根據(jù)權(quán)力要求1的厚形碼,其特征是偏旁部首可打2碼(第一碼打主型,第二碼打區(qū)別),可防重碼。
5、根據(jù)權(quán)力要求1的原形碼,英特征是在碼中設(U、E′>、
)方向標志符號,可解決漢字中“相似不相同”和“ 形同方向不同”的難題。
6、根據(jù)權(quán)力要求1的原形碼,其特征是增加“同向多筆”、“同形字塊”在同一字中只打一碼,即可完成的標注(×2、×3、×4、×5)。
7、根據(jù)權(quán)力要求1的原形碼,其特征是同字偏旁部首分別編碼,降底重碼率。
8、根據(jù)權(quán)力要求1的原形碼,其特征是重碼字可放在主碼字中只打1碼即可完成。
9、根據(jù)權(quán)力要求1的原形碼,其特征是適用于其它的電腦中文輸入方法。
10、根據(jù)權(quán)力要求1的原形碼,其特征是也適用于日文、朝文的電腦編碼。
全文摘要
本發(fā)明公開一種漢字能和英文字母、數(shù)字(電腦鍵盤上的字符)對應的電腦編碼輸入方法??捎糜谖淖盅芯亢碗娔X漢字輸入、打字、文字轉(zhuǎn)換等方面。其獨特的編碼方法適用其它的電腦中文輸入方法。同樣適用于日文、朝文的編碼。具有速度快、準確、不重碼、少記憶等優(yōu)點。本發(fā)明是將簡單字直接象形,復雜字拆分象形,拆分后的漢字能和電腦鍵盤上字符相對應;對通常1碼完成的字塊,采用2碼的打法。
文檔編號G06F3/023GK1181531SQ9711562
公開日1998年5月13日 申請日期1997年8月9日 優(yōu)先權(quán)日1996年10月23日
發(fā)明者原京林, 原明哲, 原明宇, 原曉宇 申請人:原京林