欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

漢字詞匯的漢字拼音首字母編碼法的制作方法

文檔序號(hào):6600443閱讀:571來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):漢字詞匯的漢字拼音首字母編碼法的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種漢字編碼方法,可用于出版行業(yè)中漢字詞匯詞典的排序、編輯、檢索。
目前我國(guó)漢字編碼大多數(shù)是以單個(gè)漢字為基本碼的,也有部分以詞匯或詞組方式組成詞匯碼,但只解決漢字詞匯輸入,僅反映出漢字詞匯本身的漢字,都不能方便地用“碼”來(lái)表達(dá)漢字詞匯的序列。目前漢字詞匯的排序方法主要有三種第一種,使用部首加筆劃數(shù),再加筆形的方法。至今尚無(wú)對(duì)漢字部首、筆劃數(shù)及筆形進(jìn)行排序的計(jì)算機(jī)及軟件。第二種,用詞匯第一個(gè)漢字的全拼音的方法?,F(xiàn)代漢語(yǔ)普通話中有410多個(gè)音節(jié)(未計(jì)兒化音節(jié)和聲調(diào)),用這410多種編碼編排數(shù)以萬(wàn)計(jì)的詞匯序列,重碼數(shù)量之多,給使用者帶來(lái)許多不便。第三種,使用整個(gè)詞匯的全部漢語(yǔ)拼音字母的方法。此方法重碼雖少,但人們不愿意廣泛使用,一則熟悉并準(zhǔn)確拼寫(xiě)的人不多,二則要依次列出和檢索的字母太多,平均至少是漢字個(gè)數(shù)的3.45倍。如果由計(jì)算機(jī)排序后,不列出詞匯的全拼音作為檢索碼,僅列出用全拼音排序的漢字詞匯,人們也難以見(jiàn)字聯(lián)想到字和詞匯序列,因?yàn)闈h字是表意的象形文字,在檢索時(shí),只有靠人心中默念著全拼音的順序,掃描大量似是而非的漢字詞匯去鑒別定位。因此也不能提供給一般人解決漢字詞匯的排序、編輯和檢索工作。
本發(fā)明的目的是提供一種把漢字詞匯(包括單音成詞)及專(zhuān)業(yè)技術(shù)短語(yǔ)變成人-計(jì)算機(jī)都可以識(shí)別和利用的代碼,進(jìn)行排序、編輯和檢索,并可以按序列檢索到詞匯編撰人賦于該詞匯的各種信息。
本發(fā)明的特點(diǎn)是把漢字詞匯(包括單音成詞)的每個(gè)漢字拼音的第一個(gè)字母,按原漢字詞匯順序組成字母列,作為詞匯的編碼,大量的詞匯編碼可選用多種計(jì)算機(jī)語(yǔ)言按ASCII碼從小到大進(jìn)行一級(jí)排序,在同碼序中用國(guó)家規(guī)定的區(qū)位碼對(duì)組成詞匯的漢字進(jìn)行二級(jí)排序,原詞匯以此順序?qū)?yīng)列出。在漢字詞匯的前、中、后部出現(xiàn)的任何非漢字符號(hào)均不產(chǎn)生編碼,而在本編碼的尾部綴上一個(gè)非字母符號(hào)“*”,以表示與純漢字詞匯的區(qū)別。對(duì)已按編碼排序的漢字詞匯,可連接賦于該詞匯的其他信息。本發(fā)明的另一特點(diǎn)是可以事先在計(jì)算機(jī)內(nèi)建立一張漢字與拼音首字母對(duì)照表,由計(jì)算機(jī)的專(zhuān)用程序自動(dòng)地把每個(gè)詞匯的漢字漢語(yǔ)拼音的第一個(gè)字母按原漢字順序組成字母列,填在預(yù)定的對(duì)應(yīng)的位置,即完成了對(duì)詞匯的編碼。在漢字與拼音首字母對(duì)照表中,一級(jí)字庫(kù)是按拼音排列的,只要?jiǎng)澐殖?3個(gè)字母區(qū),即可產(chǎn)生23種首字母;二級(jí)字庫(kù)是按照偏傍部首排列的,則一字對(duì)應(yīng)一個(gè)首字母;對(duì)于多音字用區(qū)位碼中安排的常用讀音,并在漢字詞匯代碼的第一個(gè)字母前加一個(gè)問(wèn)號(hào)“?”以示區(qū)別,鑒別后由人工刪去。
本發(fā)明簡(jiǎn)單,查閱方便,快速簡(jiǎn)捷,不需要對(duì)使用者進(jìn)行專(zhuān)門(mén)訓(xùn)練,也不需要使用者對(duì)拼音完全熟悉,只要略知漢語(yǔ)拼音的人,一分鐘就可學(xué)會(huì)。本發(fā)明在排序及檢索時(shí),可省去全拼音70%左右的字母,而且人-計(jì)算機(jī)都可以識(shí)別和利用。減少了計(jì)算機(jī)的存儲(chǔ)量,加快了處理速度,并且可以選用多種計(jì)算機(jī)語(yǔ)言進(jìn)行自動(dòng)排序,自動(dòng)生成索引頁(yè)碼,排序、編輯完全實(shí)現(xiàn)計(jì)算機(jī)化,對(duì)各行各業(yè)尤其對(duì)出版業(yè)將產(chǎn)生積極的效果。
表1是采用本發(fā)明編碼進(jìn)行排序、編輯的《英漢-漢英農(nóng)田水利學(xué)詞典》中重碼多的詞匯與全拼音編碼排序結(jié)果的比較。
表2是采用本發(fā)明編碼進(jìn)行排序、編輯的《英漢-漢英農(nóng)田水利學(xué)詞典》中的漢-英索引中的一頁(yè)。
采用本發(fā)明編碼進(jìn)行排序、編輯的《英漢-漢英農(nóng)田水利學(xué)詞典》一書(shū)共有8000條詞匯,三個(gè)字組成的詞匯重碼已很少,四、五個(gè)字以上的詞匯幾乎無(wú)重碼。表1中是重碼多的詞匯,其中C有7條重碼,CC有6條重碼,CS有18條重碼,D有11條重碼。對(duì)于有重碼的詞匯,列出漢字以區(qū)別。這42條詞匯編碼用了66個(gè)字母,而采用全拼音字母編碼排序的,重碼雖少,但用了228個(gè)字母,后者是前者的3.45倍,前者是后者的28.9%。本詞典用計(jì)算機(jī)處理過(guò)程中,僅僅在出現(xiàn)重碼時(shí),才對(duì)應(yīng)列出原漢字。雖然有重碼,但檢索的字母數(shù)只是全拼音的28.9%,仍是很方便的。
在表2中“地下徑流”出現(xiàn)兩次,“地下水位”出現(xiàn)6次,但這不是重碼,而是分別對(duì)應(yīng)了2條及6條英語(yǔ)同意詞。因?yàn)?個(gè)以上漢字組成的詞匯幾乎無(wú)重碼,本詞典限于篇幅,對(duì)5個(gè)及多于5個(gè)漢字的詞匯僅列出編碼,沒(méi)列出漢字。
如用該詞典,漢-英索引要查“地下水出水量”一詞,根據(jù)漢語(yǔ)拼音“DI XIA SHUI CHU SHUI LIANG”寫(xiě)出每個(gè)漢字拼音的第一個(gè)字母“DXSCSL”在該頁(yè)索引中查到“DXSCSL”后所附的頁(yè)數(shù)226,便可在該頁(yè)中查到英語(yǔ)詞組“Yield of ground water”,查閱方便。
本發(fā)明是這樣實(shí)現(xiàn)的用任何計(jì)算機(jī)語(yǔ)言(如C、BASIC、各種數(shù)據(jù)庫(kù)等)無(wú)論用何種方式(如五筆字形、首尾碼等)向計(jì)算機(jī)輸入漢字詞匯或短語(yǔ),同時(shí)在預(yù)定的對(duì)應(yīng)位置,由人工填入每個(gè)詞匯(包括單音成詞)的漢字漢語(yǔ)拼音的第一個(gè)字母,或者事先在計(jì)算機(jī)內(nèi)建立一張漢字與拼音首字母對(duì)照表,由計(jì)算機(jī)的專(zhuān)用程序自動(dòng)地把每個(gè)詞匯的漢字拼音的首字母,按原漢字順序組成字母列,填在預(yù)定的對(duì)應(yīng)的位置,即完成了對(duì)詞匯的編碼,再由計(jì)算機(jī)用任何一種計(jì)算機(jī)語(yǔ)言,對(duì)編碼按ASCII碼從小到大進(jìn)行一級(jí)排序;在同碼序中用國(guó)家規(guī)定的區(qū)位碼進(jìn)行二級(jí)排序,原詞匯以此順序?qū)?yīng)列出,即完成了詞匯的排序。二級(jí)排序后,個(gè)別的詞匯會(huì)出現(xiàn)音序在前,而區(qū)位碼序在后的情況,因代碼相同的漢字排列位置已相近,不影響檢索查閱。組成詞匯的漢字越多,重碼越少。
本發(fā)明規(guī)定只對(duì)漢字產(chǎn)生編碼,而對(duì)漢字詞匯的前、中、后部出現(xiàn)的任何非漢字符號(hào)(如漢字偏傍、+、-、/、()、字母等)均不產(chǎn)生代碼,只是在編碼的尾部綴上一個(gè)非字母符號(hào)“*”,以表示與純漢字詞匯的區(qū)別。在建立的漢字與拼音首字母對(duì)照表中,一級(jí)漢字庫(kù)從1601至5589(十進(jìn)制)共3755個(gè)字,是按拼音排列的,只要?jiǎng)澐殖?3個(gè)字母區(qū),就可以產(chǎn)生23種首字母。二級(jí)字庫(kù)從5601到8794不計(jì)偏傍部首近3000個(gè)字,因?yàn)槭前凑掌渴着帕械?,則應(yīng)一字對(duì)應(yīng)一個(gè)首字母。對(duì)于多音字用區(qū)位碼中安排的常用讀音,并在這個(gè)詞匯代碼的第一個(gè)字母前加一個(gè)問(wèn)號(hào)“?”以示區(qū)別,鑒別后由人工刪去。



權(quán)利要求
1.一種漢字詞匯的漢字拼音首字母編碼法,其特征在于把漢字詞匯(包括單音成詞)的每個(gè)漢字漢語(yǔ)拼音的第一個(gè)字母,按原漢字詞匯順序組成字母列,作為詞匯的編碼。
2.根據(jù)權(quán)利要求1所述的編碼法,其特征在于把大量的詞匯編碼可選用多種計(jì)算機(jī)語(yǔ)言按ASCII碼從小到大進(jìn)行一級(jí)排序;在同碼序中用國(guó)家規(guī)定的區(qū)位碼對(duì)組成詞匯的漢字進(jìn)行二級(jí)排序,原詞匯以此順序?qū)?yīng)列出。
3.根據(jù)權(quán)利要求1所述的編碼法,其特征在于漢字詞匯的前、中、后部出現(xiàn)的任何非漢字符號(hào),均不產(chǎn)生編碼,而在編碼的尾部綴上一個(gè)非字母符號(hào)“*”,以表示與純漢字詞匯的區(qū)別。
4.根據(jù)權(quán)利要求1所述的編碼法,其特征在于對(duì)已排序的編碼及漢字詞匯,可連接賦于該詞匯的其他信息。
5.一種漢字詞匯的拼音首字母編碼法,其特征在于可以事先在計(jì)算機(jī)內(nèi)建立一張漢字與拼音首字母對(duì)照表,由計(jì)算機(jī)的專(zhuān)用程序自動(dòng)地把每個(gè)漢字詞匯的漢字拼音的第一個(gè)字母,按原漢字順序組成字母列,填在預(yù)定的對(duì)應(yīng)的位置,即完成了對(duì)詞匯的編碼。
6.根據(jù)權(quán)利要求5所述的編碼法,其特征在于在漢字與拼音首字母對(duì)照表中,一級(jí)字庫(kù)是按拼音排列的,只要?jiǎng)澐殖?3個(gè)字母區(qū),即可產(chǎn)生23種首字母;二級(jí)字庫(kù)是按照偏傍部首排列的,則一字對(duì)應(yīng)一個(gè)首字母;對(duì)于多音字用區(qū)位碼中安排的常用讀音,并在漢字詞匯代碼的第一個(gè)字母前加一個(gè)問(wèn)號(hào)“?”以示區(qū)別,鑒別后由人工刪去。
全文摘要
一種漢字詞匯的漢字拼音首字母編碼法是一種漢字編碼方法,可用于漢字詞匯詞典的排序、編輯、檢索。其特點(diǎn)是用漢字詞匯(包括單音成詞)的每個(gè)漢字拼音的第一個(gè)字母組成的字母列作為詞匯的編碼;或者由計(jì)算機(jī)的專(zhuān)用程序自動(dòng)地把每條漢字詞匯譯成本編碼,填在預(yù)定的位置。計(jì)算機(jī)對(duì)編碼進(jìn)行排序后,詞匯的有關(guān)信息隨編碼對(duì)應(yīng)列出。本發(fā)明簡(jiǎn)單,查閱方便、快捷,人—計(jì)算機(jī)都可以識(shí)別和利用,使?jié)h字詞匯的排序、編輯完全實(shí)現(xiàn)計(jì)算機(jī)化。
文檔編號(hào)G06F3/023GK1110807SQ94104719
公開(kāi)日1995年10月25日 申請(qǐng)日期1994年4月30日 優(yōu)先權(quán)日1994年4月30日
發(fā)明者周保鑫, 周保范, 劉升元, 張自泰 申請(qǐng)人:周保鑫
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
财经| 秭归县| 澄迈县| 德令哈市| 龙陵县| 桂东县| 平昌县| 内黄县| 霍城县| 射洪县| 修水县| 腾冲县| 新宁县| 黄大仙区| 巴林左旗| 双江| 苏尼特右旗| 民权县| 常山县| 平凉市| 巴林右旗| 新蔡县| 原平市| 嵊泗县| 青岛市| 南乐县| 怀宁县| 连江县| 逊克县| 凤台县| 红原县| 资溪县| 武平县| 永宁县| 凌云县| 德化县| 寿宁县| 瑞丽市| 赣榆县| 黎城县| 奈曼旗|