欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

意群輸入、編輯和字詞語碼的制作方法

文檔序號:6407997閱讀:310來源:國知局
專利名稱:意群輸入、編輯和字詞語碼的制作方法
技術(shù)領(lǐng)域
本發(fā)明是一種以意群為單元的漢字輸入、顯示和記錄的方法;它屬于電子計算機漢字處理領(lǐng)域。
迄今為止的漢字輸入,其編碼方法有數(shù)百種之多,但它們之來由僅是對漢字所取音、形之編碼信息不同,如何拆字的不同。其它都一樣,一樣以字為基本輸入單位,一樣以字為基礎(chǔ)兼輸有限詞組,一樣以高頻先見設(shè)置簡碼等方法提高輸入速度。例如CN-85100837A,CN-87105289,CN-88202931等等。它們都是從句子上依次地取下一個漢字,拆分后編碼輸入;僅當記得取下的某個漢字是機內(nèi)已經(jīng)備有的一條詞組之詞首時,才將它們按詞組編碼輸入,要不就得一個字,一個字地輸下去。如果用戶想增加詞條,不但要中止當前工作,去做專為加詞之操作,而且操作麻煩,加入數(shù)量非常有限,還得等到重新啟動系統(tǒng)后才能調(diào)用。輸入之后的屏幕顯示,文件校改也是一個字一個字地進行;最后完成的文本文件,也是以字為單位,以高位置1的雙字節(jié)漢字內(nèi)碼作記錄,形成磁盤文件。如果要將這個磁盤文件打印輸出,還需要在文件中人工地一個一個地插入排版控制命令,一但要將這個文件利用另一個排版系統(tǒng)打印輸出,還得重復(fù)這個工作。這就是現(xiàn)有技術(shù)各種輸入方法、漢字編輯、排版系統(tǒng)的一個通式。這個通式直至1991年才受到?jīng)_擊,91年3月公開了一項《思維模式詞語處理系統(tǒng),CN-1049728A》,它完全改變了上述的傳統(tǒng)做法,利用漢語分詞技術(shù)使閱讀理解中的意群停頓明確化規(guī)范化,把句子分成一串串的單詞或復(fù)詞,以單詞、復(fù)詞為單元編碼輸入。這一條條的單詞、復(fù)詞就是一個個意群,這樣一來,漢字輸入就變成與人類思維一致的,(詞組化)意群輸入了。這是漢字輸入的一個重大突破。在這當中,如何保證和實現(xiàn)詞組化意群輸入的進行,如何從漢字輸入開始到文本編輯、磁盤文件形成,即在運算、傳輸、貯存等中文信息處理的全過程中都實現(xiàn)以意群為單元進行等方面還有待完善與發(fā)展。
本發(fā)明的目的是在上述方法與設(shè)備專利(CN-1049728A)的基礎(chǔ)上,提供自動組詞、校改組詞、選重刪詞、正文選重、單詞分庫、字詞語碼、意群顯示與編輯、多向款式自動排版等方法,用以實現(xiàn)(詞組化)意群輸入,并在中文信息處理的全過程中,運算、傳輸、貯存都以意群為元素進行的一套新型漢字處理系統(tǒng)。
本發(fā)明的目的可以通過以下措施來達到人類的思維是以意群為單元進行的,可是①始于古國,來到現(xiàn)代,漢字已經(jīng)不再與意群相匹配,與意群相匹配的是詞、語。②漢語之詞與詞之間,詞語之間在形式上都沒有明顯的分界,并且詞、語之概念抽象,缺乏字數(shù)特征,不易被人們掌握應(yīng)用。連帶專利(CN-1049728A)提出了根碼漢語分詞法,它引出詞語的字數(shù)特征,把含2~4個字,語義明確,可以單用的一個基本語義塊定義為單詞,二條或二條以上的單詞組成更大的語義塊定義為復(fù)詞,單詞、復(fù)詞都與意群相匹配。然而,利用人們閱讀理解時的意群停頓,加上一條簡單易行,以3、2、4、1為序的優(yōu)先分詞規(guī)則,把語句流切分成一串串的單詞或復(fù)詞,以它們?yōu)閱挝痪幋a輸入。這就為意群輸入奠定了堅實的基礎(chǔ),在這個堅實基礎(chǔ)之上,本發(fā)明提供如下與之配套的一些方法①自組單詞,如果系統(tǒng)缺少某單詞,勢必使人們以字為單位輸入,這時系統(tǒng)可以自動地以字組詞,自動地加入詞庫,立即讓用戶調(diào)用。
②自組復(fù)詞,如果用戶以復(fù)詞的編碼方法,想輸入一條復(fù)詞而撲空時,系統(tǒng)自動地根據(jù)后隨輸入的單詞組合成這條復(fù)詞,將其有關(guān)信息納入復(fù)詞合成管理部。系統(tǒng)就等于加入了這條復(fù)詞。
③校改組詞,不管是寫作還是錄入,人們都要對文本進行校閱,并且人們都是以意群為單元進行閱讀理解的。這時讓人們隨手加入一些復(fù)詞或單詞,非常方便融合。
④選重刪詞,當用戶認為某條單詞或復(fù)詞他用不上,可以象重碼選取一樣,隨手將它刪除而不影響當前的輸入或編輯工作。
⑤正文選重,傳統(tǒng)的做法重碼都在系統(tǒng)提示行等待用戶選重。本系統(tǒng)讓單復(fù)詞之重碼全部進入文件正文,在寫作和漢字錄入之時進行詞組化意群輸入好似無重,可實現(xiàn)詞組化意群章節(jié)輸入之盲打,非常有利于行文寫作。然而重碼可以留待校改時給以多種形式的處理。
⑥單詞分庫,中文單詞有多少,據(jù)不完全統(tǒng)計,少則有百萬之多。將這么一個大的單詞庫提供給用戶;完全沒有必要。因為人們都是在一定的行業(yè)環(huán)境內(nèi)工作、學(xué)習(xí)和生活,它們的詞匯也就局限在某個范圍之內(nèi),通常有4~10萬,他就可以進行詞組化意群輸入了。然而,據(jù)此將中文單詞庫劃分為若干單詞分庫,以這些單詞分庫做成各種行業(yè)版本,提供給各界用戶。
⑦字詞語碼,中文的字詞語概念比較含糊,我們把它落實到漢字、單詞和復(fù)詞,并加上字數(shù)特征,不但概念明確,而且易于掌握應(yīng)用。正如上述,漢字輸入做到了意群輸入,意群變成漢字輸入的基本單位,這是非??少F之舉,切不可又使用以字為單位的漢字機內(nèi)碼形成文本,又將這種寶貴的詞間間隔信息丟掉。然而本發(fā)明提供字詞語碼,把漢字、單詞、復(fù)詞、ASCⅡ碼以及其它控制代碼都利用2字節(jié)數(shù)字空間進行編碼,這樣,一個意群對應(yīng)一個字詞語碼,在機內(nèi)運算,傳輸和存貯的全過程中都能以意群為單位進行了。
⑧意群顯示與編輯,人們閱讀任何文件,都是眼睛一個字、一個字地掃描,而思維祛把它們按意群分開,分完了一句、一段,就是懂了、理解了;要不就得重復(fù)這個過程,直至理解。所以,既是意群輸入,屏幕顯示也應(yīng)與之相應(yīng)。系統(tǒng)自動在單詞、復(fù)詞之間加顯一個空格,組成復(fù)詞的單詞之間以“-”相聯(lián)。這樣的文本顯示就省去了人們閱讀理解中的上述切分過程,能使閱讀理解變得簡單、快捷。編輯文本時,移動光標、插入、刪除、塊操作都以意群為單元進行,不但附合人類思維,而且使文本編輯事半功倍。
⑨多向自動款式排版,系統(tǒng)提供各種文件款式,也可讓用戶自作新款式,系統(tǒng)通過學(xué)習(xí),加入款式庫。這些款式規(guī)定了各種文件格式下有關(guān)版面、標題和正文排版方法與規(guī)格。同時讓計算機對文件標題,段落等有關(guān)部分進行識別,再按款式中的有關(guān)信息和要求在文件中適當位置插入排版控制命令。如果日后用戶又想通過另一種排版系統(tǒng)排版打印,用戶只要換一個排版系統(tǒng)的參數(shù),計算機據(jù)此自動進行多向轉(zhuǎn)換,用戶通過極簡單的操作便可達到目的。


圖1.自組單詞框2.自組復(fù)詞框圖下面結(jié)合實施例和附圖將本發(fā)明的技術(shù)內(nèi)容詳述如下人類的思維是以意群為單元進行的,從方塊漢字形成開始,到近代的文言文時代,漢字大致上與意群是相匹配的,白話文開始,這種不匹配現(xiàn)象越來越嚴重?,F(xiàn)在,一到各種專業(yè)上去,一個字代表一個意群,表示一個事物、概念的情況太少了。不但意群與漢字的不匹配,就是現(xiàn)有的語法書也分詞過細,一字詞、二字詞占比例過大,也出現(xiàn)與人們實際使用時的意群不相匹配的情況。顯然,漢字已經(jīng)不再與意群相匹配,而詞組,一般都能與意群相匹配,可是,中文詞與詞之間,詞與語之間在形式上沒有明顯的分界,這給中文信息處理造成了巨大的障礙。然而,要做到意群輸入,首先要解決的是漢語分詞,接下來就是以意群為單元編碼輸入,顯示,校改,并且以意群為元素記錄,形成具有詞間間隔的文本文件。連帶專利(CN-1049728A)提出了根碼漢語分詞技術(shù),它利用人們閱讀理解時的意群停頓,加上一條簡單易行,以3、2、4、1為序的優(yōu)先分詞規(guī)則,把語句流切分成一串串的單詞或復(fù)詞;以它們?yōu)閱卧幋a輸入。已經(jīng)為意群輸入奠定了基礎(chǔ)。在這個基礎(chǔ)之上,本發(fā)明在提供如下配套技術(shù)。
意群輸入,不但要有足夠多的詞匯,而且還要具備自動組詞能力,才能適應(yīng)各種用戶,千變?nèi)f化的用戶情況,才能實現(xiàn)和保證意群輸入的順利進行。自動組詞包括兩部分,一是自動以字組成單詞;一是以單詞組成復(fù)詞,下文稱它們?yōu)樽越M單詞和自組復(fù)詞,并分別給以闡述。
(一)自組單詞,系統(tǒng)含有自組單詞部,當用戶以漢字為單位,連續(xù)輸入2~4個字時即開始工作,它把這2~4個字串成若干條單詞,生成它們的輸入編碼,將它們置于環(huán)形緩存區(qū),立即響應(yīng)用戶的編碼輸入,并可追隨用戶意志,有選擇地將它們保留或復(fù)蓋。
自組單詞之根據(jù)是①系統(tǒng)(見連帶專利CN-1049728A)發(fā)明并應(yīng)用漢語分詞方法于漢字輸入,把單詞定義為含2~4個字,語義明確,可以單用的基本語義塊。由于單詞的字數(shù)特征,然而反過來我們可以把連續(xù)輸入的2~4個字組成單詞。②由于本系統(tǒng)是詞組化意群輸入,僅當缺少某詞條時,才出現(xiàn)連續(xù)以字為單位進行輸入的情況(這是意群輸入與現(xiàn)有漢字輸入技術(shù)根本性的區(qū)別)。
設(shè)置自組單詞部來承擔和完成自組單詞工作。自組單詞部設(shè)有自組單詞緩存區(qū),自動組成的單詞緩存于此。緩存于此的單詞至少含有輸入碼,詞條和頻度3個部分。緩存區(qū)呈環(huán)形設(shè)置,并設(shè)有當前記錄指針。剛組成的單詞,置于當前指針所指向之處,然后指針后移一記錄長度。當某單詞存入緩存區(qū)最后一記錄空間時,指針移到緩存區(qū)之首。此后新組成之詞則根據(jù)頻度,將未經(jīng)使用之單詞復(fù)蓋。緩存區(qū)的容量僅受內(nèi)存所限,但以不大于1000詞條為宜。
當系統(tǒng)和裝置(見連帶專利CN-1049728A)響應(yīng)用戶輸入編碼擊鍵,需查找并給出單詞時,在系統(tǒng)內(nèi)查找各字數(shù)單詞庫的同時查找該緩存區(qū),將查到的單詞給出,并將其頻度加一。所以,自動所組之詞,用戶是當即能夠調(diào)用的。如果在緩存區(qū)查到的單詞與系統(tǒng)原各字數(shù)單詞庫查出的單詞相重,說明用戶為初學(xué)者之操作,系統(tǒng)給以提示信息,并刪除緩存區(qū)內(nèi)相重的單詞。
當緩存區(qū)沒有空間不能存入新詞時,系統(tǒng)給出提示,或者用戶認為需要,可讓用戶利用功能鍵(例如定義為Alt+F8)查看緩存區(qū)內(nèi)的單詞,將單詞分批顯示于屏幕提示行,可讓用戶利用數(shù)字鍵進行選刪。當用戶認為需要存盤時,讓其再擊功能鍵,這時系統(tǒng)將緩存區(qū)內(nèi)所有經(jīng)用戶使用認可的單詞,分別納入系統(tǒng)原2~4字數(shù)單詞庫,緩存區(qū)清零,有關(guān)數(shù)據(jù)存盤,永久保存。
緩存區(qū)內(nèi)自動所組成的單詞,也可以不必用戶干預(yù),自動納入2~4字數(shù)單詞庫,并且自動存盤。這些可以這樣實現(xiàn),把緩存區(qū)沒有空間存入新詞作為啟動條件,這時讓系統(tǒng)將緩存區(qū)單詞分別納入2~4字數(shù)單詞庫,緩存區(qū)清零。當用戶做過文本編輯,啟動文本編輯的文件存盤功能時,一并將自動組詞、加詞以及有關(guān)的數(shù)據(jù)存盤,永久保存。
自組單詞部是這樣進行工作的當用戶連續(xù)以字為單元輸入時,它記憶字次(字數(shù)計數(shù)器)以及字的輸入編碼。并根據(jù)字次以排列的方式進行串詞。如圖1所示,當用戶輸入第二個漢字時,把字1+字2組成單詞1,把單詞1的輸入編碼(根據(jù)編碼規(guī)則由字碼組成),詞條送緩存區(qū),并把緩存區(qū)該單詞的頻度置1(初始態(tài)),同時查找緩存區(qū),如果發(fā)現(xiàn)已有相同單詞,將剛存入者作刪除標志,等于沒有加入。當用戶輸入第三個漢字時,自組單詞部把字2+字3組成單詞2,把字1+字2+字3組成單詞3,生成它們的輸入編碼,依次把單詞2、單詞3及輸入碼送緩存區(qū),判重否,作相應(yīng)處理。當用戶輸入第四個漢字時,自組單詞部把字3+字4組成單詞4,字2+字3+字4組成單詞5,字1+字2+字3+字4組成單詞6,依次生成它們的輸入編碼,將它們送緩存區(qū),判重否,作相應(yīng)處理,同時將字數(shù)計數(shù)器清零。在自組單詞的過程中,如果發(fā)現(xiàn)自動所組之單詞在緩存區(qū)內(nèi)有重,或者用戶輸入第五個漢字,都說明用戶為初學(xué)者之操作,系統(tǒng)給以提示信息,例如“根碼能詞組化意群輸入,僅當無詞時輸字”。
生成它們的輸入編碼如此動作,當用戶以字為單位編碼輸入時,系統(tǒng)記下它們的輸入編碼,將2~4個連續(xù)輸入的漢字以排列的方式串成數(shù)條單詞的同時,也根據(jù)編碼規(guī)則(參連帶專利CN-1049728A),根據(jù)字的編碼自動生成單詞的輸入編碼,例如曾對一條3字單詞,依次取三個字的第一碼,加上第三個字的第二碼便生成了這條單詞的輸入編碼。
自組單詞部按字次之排列進行組詞,難免會組出一些非詞之詞,這些非詞之詞一般不會影響用戶操作,因為我們使用的是詞組化意群輸入,非詞之詞不是意群,所以用戶是不會對非詞之詞進行編碼輸入的,這些非詞之詞很快會被新詞自動復(fù)蓋。另一方面,系統(tǒng)將緩存區(qū)內(nèi)單詞納入原系統(tǒng)2~4字數(shù)單詞庫時,是以經(jīng)過用戶使用,亦即是得到用戶認可的詞才納入。這樣,自組單詞部就能追隨用戶意志,有選擇地將一部分自動所組之詞保留,將另一部分自動所組之詞復(fù)蓋或屏棄。
非詞之詞,僅當一種情況,它有機可剩,那就是用戶所需之詞沒有,并且這條沒有的詞之編碼正好與非詞之詞相同,這條非詞之詞可以進入屏幕正文。這時用戶往往使用回退鍵將該詞從屏幕刪去,系統(tǒng)再賦給回退鍵一個功能,將該詞從緩存區(qū)內(nèi)刪除。
(二)自組復(fù)詞,系統(tǒng)含有自組復(fù)詞部,當輸入某條復(fù)詞而撲空時,自動把后繼單詞組成這條復(fù)詞,有關(guān)信息納入系統(tǒng)的復(fù)詞合成管理部(詳見連帶專利CN-1049728A),立即響應(yīng)用戶編碼輸入。
當人們對一個意群以復(fù)詞的形式編碼輸入時,如果系統(tǒng)還不具備這條復(fù)詞時,用戶的操作就撲空了。撲空之后只好改用單詞的形式編碼輸入。我們就利用這個現(xiàn)象來啟動自組復(fù)詞。為敘述方便,這現(xiàn)象稱復(fù)詞撲空,設(shè)FPK=1來表示。FPK=1自組復(fù)詞部開始工作。如圖2所示,它首先記憶這條撲空復(fù)詞之編碼,下文簡稱撲空碼。然后對后隨輸入的單詞進行考測①當后隨輸入第一條單詞時,記憶這條單詞以及它的輸入編碼。
②當后隨輸入第二條單詞時,記憶這條單詞以及它的輸入編碼;分別取這兩條單詞的前2個音碼生成一條考測碼(為考測它是不是要組復(fù)詞之輸入碼而稱之,后同),跳下述⑤條。
③當后隨輸入第三條單詞時,記憶這條單詞以及它的輸入編碼;分別取這三條單詞的第1個音碼和最后單詞的第2個音碼,生成一條考測碼,跳下述⑤條。
④當后隨輸入第四條單詞,或者大于第四條單詞時,記憶這條單詞以及它的輸入編碼;分別取前3條單詞的第1個音碼和最后那條單詞的第1個音碼生成一個考測碼,跳下述⑤條。
⑤續(xù)上面②③④條所述,先判一下,如果后隨輸入的單詞條數(shù)已經(jīng)達到最大數(shù)(定為7為宜)時。放棄本次工作,將復(fù)詞撲空標志清零,F(xiàn)PK=0;釋放前述對各后隨輸入單詞的記憶,返回上層。如果后隨輸入的單詞條數(shù)小于最大數(shù)續(xù)下。
⑥將撲空碼與考測碼進行比較,如果不等,返回上層,繼續(xù)運行。如果相等,說明用戶撲空時就是為了輸入這條復(fù)詞,續(xù)下。
⑦把撲空碼作為這條新復(fù)詞的輸入編碼,將這條輸入編碼以及這條復(fù)詞的各成員,各單詞所處相應(yīng)單詞庫的位置信息納入復(fù)詞合成管理部。如果某成員單詞還處于自組單詞的環(huán)形緩存區(qū)時,將它納入單詞庫,以它在單詞庫的位置信息參加這條新復(fù)詞納入復(fù)詞合成管理部。
⑧然后將撲空標志清零,釋放對后隨輸入單詞的記憶,完成這條復(fù)詞的自動組詞工作,返回上層,繼續(xù)運行。
自組單詞首先要將組成的單詞置于自組單詞環(huán)形緩存區(qū);當被用戶使用認可后才納入系統(tǒng)單詞庫。自組復(fù)詞不必置環(huán)形緩存區(qū),而直接納入系統(tǒng)的復(fù)詞合成管理部,立即響應(yīng)用戶的編碼輸入。這是因為自組復(fù)詞啟動于用戶撲空之后,然而當考測碼等于撲空碼時,證明所組成的復(fù)詞是符合用戶意愿的,所以可以直接納入系統(tǒng)。
如果用戶撲空是因為編錯碼,這時,系統(tǒng)不會組出符合錯碼之詞。因為后隨輸入的單詞正好符合這個出錯編碼之概率是可以忽略不計的。
如果后隨輸入之單詞既沒有達到最大條數(shù)之限又不符合撲空碼時,用戶便輸入另一條復(fù)詞,或是ASCⅡ碼字符等等,也說明用戶編錯碼,這時都將撲空標志清零,釋放對后隨輸入單詞的記憶。
(三)校改組詞,系統(tǒng)含有校改組詞部,在文本編輯的校改狀態(tài),當用戶把光標移到某詞首,響應(yīng)用戶敲擊組詞功能鍵(例如Alt+Z),然后將光標后的兩條詞(包括字)組合成一條新詞;也響應(yīng)連續(xù)敲擊組詞功能鍵,將光標后若干詞條組合成一條新詞;這些新詞和系統(tǒng)原有詞條一樣,可以即刻被用戶編碼輸入。
本系統(tǒng)已經(jīng)做到了詞組化意群輸入,意群顯示。人們不管是寫作還是錄入,都要對文本進行校閱,在校閱過程中,人們都是以意群為單元進行閱讀理解的。雖然我們做到了意群顯示,但是用戶這時或許會覺得某些單詞還可組成復(fù)詞,有些單詞應(yīng)把其前面或后面的那個字也包括進去。校改組詞功能,就是應(yīng)用戶這種需要而設(shè)計的。
校改組詞功能由校改組詞部實現(xiàn)。當用戶把光標移到某詞條之首,按下一個功能鍵(例如Alt+Z),這就啟動了校改組詞部的工作,它把光標后的兩條詞匯組成一條詞匯,當用戶連按功能鍵,校改組詞部就把后隨的若干詞條組成一條詞匯。
校改組詞部被啟動后,按下列步驟工作1.判別光標后是兩條什么詞匯,根據(jù)漢語分詞規(guī)則(參連帶專利CN-1049728A),有如下數(shù)種情況①兩條都是單詞,那么兩條單詞相加,肯定組成一條復(fù)詞。②一條單詞加一條復(fù)詞或者一條復(fù)詞加一條單詞,它們的結(jié)果是組成一條更大的復(fù)詞。③兩條都是復(fù)詞,它們的結(jié)果也是組成一條更大的復(fù)詞。④一條單詞和一個字,其結(jié)果是組成多一個字的單詞。
2.在屏幕上首先將它們按組后的新詞形式排列,例如兩條單詞相加,組成一條復(fù)詞,那么就把它們之間的空格換成連詞符。
3.當用戶移走光標時,用戶想組成一條什么詞匯才可以確定(例如屬上述數(shù)種校改組詞的某一種情況),校改組詞部開始下一步工作。
4.根據(jù)上述校改組詞的數(shù)種情況,首先確定由幾個成員組成一條新詞,再根據(jù)編碼規(guī)則(參連帶專利CN-1049728A),自動生成這條新詞的輸入編碼。
自動生成輸入編碼有如下三種方法①根據(jù)屏幕顯示,按編碼規(guī)則取參加編碼那幾個字,查出這幾個字的編碼,然后根據(jù)這幾個字的編碼合成新詞的編碼。例如對兩條單詞合成一條復(fù)詞的編碼,只要將它們各自前面二個字的音碼取出,即等于所合成復(fù)詞的4個編碼。本法容易實現(xiàn),但是,如果遇上多音字,就需要用戶干預(yù)才行。②本法實現(xiàn)比較麻煩,但無需用戶干預(yù),它采用中斷方式,利用字詞語碼查出其輸入編碼,然后組合成新詞編碼。③利用第一種方法,如果遇上多音字,取屏幕這個多音字所在的單詞,以多音字與其它字合成的這條單詞可能的數(shù)種輸入編碼,以這數(shù)種編碼查找,取查找到這條單詞的那個編碼去合成新詞的編碼。
5.將所組新詞的輸入編碼,詞條分別納入原系統(tǒng)2~4字數(shù)單詞庫,如果是復(fù)詞,還得將有關(guān)信息納入復(fù)詞合成管理部。
(四)選重刪詞,系統(tǒng)含有選重刪詞部,它把單詞或復(fù)詞重碼顯示于系統(tǒng)提示行,能響應(yīng)用戶敲擊刪詞功能鍵(如Alt+1~0鍵)將某詞庫的詞條刪除。
重碼是不受人們歡迎的,尤其在重碼之中,有些詞,對某具體用戶,可能根本不用,這位用戶巴不得立即將它抹去。在無重碼的詞匯里,也會有某具體用戶根本不用之詞,但是它不那么使人討厭。因為某用戶既然不用,它就不會出來。僅當某用戶對另一條所需而沒有之詞條編碼輸入,編碼碰巧相同時,它才可能剩機跑出來。但是,用戶所需而沒有的那條詞匯馬上就有了,這條不受歡迎的詞也是以重碼身份出現(xiàn)。這就是我們把刪除詞條設(shè)計成如同選取重碼那樣之機理。
選重刪詞工作由選重刪詞部承擔。當重碼出現(xiàn)在系統(tǒng)提示行,等待用戶選取時,我們?nèi)匀皇抢脭?shù)字鍵選取某重碼詞條;另一方面,我們可以利用Alt+某個數(shù)字鍵來刪除相應(yīng)的詞條(我們事先把選重刪詞功能鍵定義成Alt+1~0數(shù)字鍵作為刪除相應(yīng)詞條的功能鍵)。
當用戶按下了選重刪詞功能鍵后,選重刪詞部將該詞條相應(yīng)刪除記憶區(qū)作上標志,當下次系統(tǒng)查找詞匯時將這條作有刪除標志的詞棄去。不管是單詞、復(fù)詞,還是在自組單詞緩存區(qū)內(nèi)的詞條,都可以這樣做。
自組單詞、自組復(fù)詞、校改組詞所組的新詞以及選重刪詞的有關(guān)信息,都緩存于內(nèi)存并且與原有詞匯一道被系統(tǒng)訪問,可立即響應(yīng)用戶的擊鍵操作,也可自動或半自動地存盤;下次又在這個基礎(chǔ)上更新,用戶越用越適合自我。
(五)正文選重,系統(tǒng)含有正文選重部,它工作時,所有單復(fù)詞重碼當作不重,全部進入文件正文;它利用字詞語碼記憶和辨識重碼,不管文件有多長,并在當前屏幕上,將重碼反向顯示;當用戶要處理重碼時,響應(yīng)用戶即時選重,批選重碼,校改選重,隱含自動選重等多種選重操作。
漢字輸入之重碼在所難免,傳統(tǒng)的做法都把重碼放在系統(tǒng)提示行等待用戶擊數(shù)字鍵選重。本系統(tǒng)讓單復(fù)詞之重碼全部進入文件正文,在寫作和漢字錄入之時進行詞組化意群輸入好似無重,可實現(xiàn)詞組化意群章節(jié)輸入之盲打,非常有利于行文寫作。人們的思想閃光,靈感來到,非常寶貴,同步地祥盡無遺地把思維變成文字,這是人們夢寐以求的的事。正文選重正是為此而作,它把重碼留待校改時給以多種形式的處理;使輸入和寫作時不由重碼干擾思維,校改時順便處理重碼,輕松快捷。正文選重部包括兩部分1.重碼控制部,系統(tǒng)至少具有錄入和校改兩種狀態(tài),這兩種狀態(tài)系統(tǒng)自動切換,當輸入工作是在文件尾部使文件不斷加長時為錄入態(tài);當光標移入文件,那怕只一個字,就自動切換成校改態(tài);當系統(tǒng)處于校改狀態(tài)時,本部控制所有重碼,全部進入文件正文,同時做好重碼標志(參字詞語碼下的重碼標),在當前屏幕上,把重碼作反向顯示,以示區(qū)別。在錄入和校改這兩種狀態(tài)下,用戶都可以處理重碼,但方法不同,這部分工作由選重管理部完成。
2.選重管理部,當用戶認為需要,可以隨時處理重碼,至少有如下數(shù)種形式①即時選重,當系統(tǒng)處于錄入態(tài)時,如果剛輸入的是一條重碼,響應(yīng)用戶用數(shù)字鍵選取,如果敲擊的數(shù)字大于重碼詞條數(shù),則將本重碼所有詞條刪除。
②批選重碼,當用戶想對當前屏幕或者整個文件的重碼進行處理,響應(yīng)用戶敲擊相應(yīng)功能鍵成批地處理重碼。功能鍵1,如定義為F4,它從文件尾部開始自動找出重碼,光標依次落在一條條重碼上,等待用戶利用數(shù)字鍵選取。功能鍵2,如定義為F3,它從文首開始,找到第一條重碼,并從這里開始顯示,光標依次落在一條條重碼上,等待用戶選取。可以一口氣處理完整個文件的所有重碼,也響應(yīng)用戶半途中止(重按F3或F4鍵),去做其它工作。批選重碼時,如果用戶敲擊的數(shù)字大于重碼條數(shù),也將本重碼全部刪除。
③校改選重,校改選重簡單方便,當進入校改態(tài)時,重碼和單復(fù)詞一樣,也是一個元素,當光標落在其首時,響應(yīng)用戶利用數(shù)字鍵選重,不選同樣可以移走,也可利用大于重碼之數(shù)字將重碼全部刪除。
④隱含自動選重,隱含保留第一條重碼,將后面重碼全部刪除,本工作讓正文選重部自動完成。本功能與校改選重配合使用,非常方便。例如先作校改選重,僅對非第一條的進行處理,是第一條的不作處理,留待正文選重部自動作隱含自動處理。
(六)單詞分庫,系統(tǒng)內(nèi)含2~4字數(shù)的單詞分庫,復(fù)詞由復(fù)詞管理合成部利用單詞合成;單復(fù)詞各有公有和私有兩部分,公有部分由廠家提供,來源于收集某行業(yè)、環(huán)境內(nèi)工作、學(xué)習(xí)和生活著的人們之大眾化用詞,私有部分借助于自動組詞,校改組詞等技術(shù)在用戶應(yīng)用中隨機納入;單詞分庫以6~10萬為度,它是整個中文單詞庫的一個子集,使用不同的子集就產(chǎn)生不同的行業(yè)版本。
向不同的人們以不同的行業(yè)版本形式提供不同的單詞分庫,其機理是中文單詞數(shù)量很大,據(jù)不完全統(tǒng)計,至少有百萬之多。將這么一個大的單詞庫提供給用戶,①當代普通的計算機,時間和空間都難以勝任,還有碼元、碼長很難做到實用。②也完全沒有必要,因為人們都是在一定的行業(yè)環(huán)境內(nèi)工作、學(xué)習(xí)和生活,它們的詞匯也就局限在某個范圍之內(nèi),通常是6~10萬,換句話說,達到這個數(shù)字就可以實現(xiàn)詞組化意群輸入了,并且當代普通計算機都可實現(xiàn)。
向不同的人們以不同的行業(yè)版本形式提供不同的單詞分庫。復(fù)詞不用庫,由復(fù)詞管理合成部利用單詞合成。這些單復(fù)詞又分公有、私有兩部分。公有部分由廠家提供,來源于收集某行業(yè)、環(huán)境內(nèi)工作、學(xué)習(xí)、生活著的人們之用詞,其中數(shù)量,以56000左右為宜(參字詞語碼)。私有部分可納入0~50000,但通常在0~1萬左右,換句話說,私有部分大了,說明相應(yīng)行業(yè)范圍太大,應(yīng)當再它們再分成兩個子集。
單詞分庫公有部分,來源于收集某行業(yè)、環(huán)境內(nèi)工作、學(xué)習(xí)、生活著的人們之大眾化用詞。具體方法是①實施本發(fā)明初期,在這個范圍內(nèi),取一批有代表性的文字資料,進行漢語分詞處理,然后統(tǒng)計它們的使用頻度,從頻度高的一端開始,取56000左右條單詞建成這個單詞分庫。②在人們使用本發(fā)明所產(chǎn)生的漢字輸入系統(tǒng)的過程中,回收人們各種文件附本,進行統(tǒng)計學(xué)處理,找出該行業(yè)人們的實用詞頻,從而產(chǎn)生高質(zhì)量的單詞分庫,并通過多次反復(fù),使其達到最佳適應(yīng)的程度。
上述單詞分庫的私有部分,通過自動組詞、校改組詞充實;自動組詞、校改組詞都是在用戶編碼輸入的同時進行,所組的新詞以及選重刪詞的有關(guān)信息,都緩存于內(nèi)存并且與原有詞匯一道被系統(tǒng)查詢,可立即響應(yīng)用戶的擊鍵操作,也可自動或半自動地存盤;下次又在這個基礎(chǔ)上更新,用戶越用越適合自我。
(七)字詞語碼,系統(tǒng)含有字詞語碼管理部,它響應(yīng)用戶編碼擊鍵,在系統(tǒng)給出相應(yīng)單詞、復(fù)詞、字、ASCⅡ字符等之后,生成它們的字詞語碼,以字詞語碼的形式進行運算、傳輸和貯存;當直接傳輸輸出或讀貯存文件輸出時,字詞語碼管理部又將它們轉(zhuǎn)換成相應(yīng)的輸出信息,送各種輸出設(shè)備。
字詞語碼與單詞分庫配套,面向某行業(yè)環(huán)境內(nèi)的人們,將ASCⅡ碼、漢字、單詞、復(fù)詞以及其它代碼等五部分共用一個字的數(shù)據(jù)空間對它們進行編碼;它們之間的段界可因行業(yè)版本的不同而挪動;在存貯器內(nèi)可以把字的首字節(jié)置于奇地址,次字節(jié)置于偶地址來加強判讀的準確性。
字詞語碼和單詞分庫的不同就產(chǎn)生了不同的行業(yè)版本,不同行業(yè)版本所生產(chǎn)的各種磁盤文件利用統(tǒng)一格式標示是那個行業(yè)版本的文件。例如文本文件,可以帶一個文件頭,將有關(guān)版本信息記錄于文件頭。
用一個字(16進制2字節(jié))的數(shù)據(jù)空間對ASCⅡ碼、字、單詞、復(fù)詞以及其它代碼編碼,實施例之一是①把0~OFFH分配給ASCⅡ碼(包括各種ASCⅡ碼),它們的高位字節(jié)=0,低位字節(jié)等于原ASCⅡ碼值;②把100H~2383H分配給漢字,和區(qū)位碼一樣,1~16區(qū)分配給各種符號和多種外文字符,16~87區(qū)分配給GB 2312-80字庫,88~94區(qū)分配給該行業(yè)GB 2312-80外的高頻字;③把2384H~OE6D3H分配給單詞,其中再按2字單詞、3字單詞、4字單詞分成三段,或者按詞義分若干段;④把OE6D4H~OFFDCH分配給復(fù)詞;⑤把OFFDDH~OFFFEH分配給其它代碼,其它代碼中,把OFFDDH定義為重碼標,OFFDEH定義為2字單詞標,OFFDFH定義為3字單詞標,OFFE0H定義為4字單詞標,OFFE1H定義為復(fù)詞標,0FFE2H定義為排版標識符,OFFE3H定義為表格標等等。
上述五個部分之中,如果有相應(yīng)庫的,它們的編碼與在具體庫中序數(shù)位置相對應(yīng)。例如“啊”字,它的字詞語碼=255+94X15+1,相應(yīng)處點陳字庫第94X15+1個位置。
其它代碼段的重碼標、復(fù)詞標、表格標配對使用,分別用于將它們各自的成員括起來;例如前后兩個重碼標把重碼括在里面,這就使得正文選重部對重碼具有記憶和識別能力。排版標識符和2~4字單詞標單用,表示后隨的是它們的成員,其中排版標識符后隨一字為排版命令碼。其它空碼留待后擴。上述2~4單詞標,復(fù)詞標用于標識私有部分單復(fù)詞。
對于主要因單詞分庫不同配以相應(yīng)字詞語碼,從而產(chǎn)生不同的行業(yè)版本。對于不同行業(yè)之行業(yè)版本,它的兩部分單復(fù)詞使用字詞語碼表示;作記錄的形式有所不同。單復(fù)詞的公有部分直接使用字詞語碼表示,作記錄;而私有部分不能直接使用字詞語碼作記錄,而是使用2~4字的單詞標,后隨它的漢字的字詞語碼。例如用3字單詞標OFFDFH,后隨這3個漢字的字詞語碼。復(fù)詞則使用2個復(fù)詞標OFFE1H,一前一后地將它的成員包括在里面,里面可以是直接以字詞語碼標注的單詞,也可以是某字數(shù)單詞標后隨漢字的字詞語碼串,或者是兩者的混合形式。
據(jù)詞組化意群輸入測算,占文章總字數(shù)94%的字都能以單詞、復(fù)詞的形式進入計算機,所以字詞語碼所含信息量很大,文本文件比現(xiàn)有技術(shù)使用機內(nèi)碼要縮短2~5倍;利用字詞語碼進行運算、傳輸和貯存其效率比使用現(xiàn)有技術(shù)要提高2~5倍。除在計算機系統(tǒng)內(nèi)利用字詞語碼進行傳輸外,還可用于通訊設(shè)備與系統(tǒng)。字詞語碼特別適合于中文和以中文為主的混合文種文書。
字詞語碼除了在運算、傳輸、貯存方面的高效率以外,更大的意義是與意群相匹配,也就是實現(xiàn)了以意群為單位進行運算、傳輸和貯存,在自然語言理解、機器翻譯等方面,將產(chǎn)生積極的作用。
字詞語碼可完全代替機內(nèi)碼使用;也可和機內(nèi)碼配合使用,如顯示或輸出,仍用機內(nèi)碼以便與非在本系統(tǒng)下開發(fā)的軟件兼容。對于漢字,字詞語碼、機內(nèi)碼、區(qū)位碼、國標碼相互關(guān)系如下機內(nèi)碼=字詞語碼-OFFH+OAOAOH,字詞語碼=機內(nèi)碼-OAOAOH+OFFH字詞語碼-OFFH=區(qū)位碼,區(qū)位碼+OFFH=字詞語碼字詞語碼-OFFH=區(qū)位碼,區(qū)位碼+OFFH=字詞語碼字詞語碼-OFFH+2020H=國標碼,字詞語碼=國標碼+OFFH-2020H以多種版本的形式,面向工作、學(xué)習(xí)、生活在各種不同行業(yè)、環(huán)境內(nèi)的人們,這是意群輸入的必然結(jié)果,也是本發(fā)明區(qū)別于現(xiàn)有技術(shù)特點之一。收集某行業(yè)、環(huán)境內(nèi)工作、學(xué)習(xí)和生活著的人們之用詞而產(chǎn)生單詞分庫,作相應(yīng)的字詞語碼編碼,產(chǎn)生該行業(yè)版本,面向這一行業(yè)環(huán)境內(nèi)的人們;用相同方法可產(chǎn)生多種行業(yè)版本,面向各行各業(yè)的人們;各行業(yè)版本單復(fù)詞數(shù)量可以不一,字詞語碼當中成員的次序、段界也可以不一。
(八)意群顯示與編輯,系統(tǒng)含有意群顯示編輯部,它的工作使屏幕顯示,文本編輯過程中的移動光標、插入、刪除和塊操作都能以意群為單元進行;在意群之間(如單詞,復(fù)詞,以及單用字、數(shù)字串、外文串等)自動加顯空格,復(fù)詞中各構(gòu)成成份之間加顯聯(lián)詞符(例如“-”);它使光標只能從一個意群移到另一個意群,并都落在某意群之首;它把單詞、復(fù)詞,或單用字都作為一個不可分割的元素來響應(yīng)用戶插入、刪除和塊操作等鍵盤操作。
意群顯示與編輯的機理是,人們不管閱讀什么文件,都是眼睛一個字、一個字地掃描,而思維祛把它們按意群分開,分完了一句、一段,就是懂了、理解了;要不就得重復(fù)這個過程,直至理解。屏幕顯示時也以意群分開,就省去了人們閱讀理解中的切分過程。在文本編輯過程中,讓移動光標、插入和刪除也以意群為單元進行,不但文本編輯可以事半功倍;而且能使閱讀理解變得簡單、快捷。
已如上述,我們已經(jīng)能夠響應(yīng)人們與思維一致的意群輸入,然而屏幕顯示也以意群為單元進行,形成具有詞間間隔,復(fù)詞中有聯(lián)詞符將各構(gòu)成成份相聯(lián)的意群顯示形式,并且讓文本編輯過程中的移動光標、插入、刪除、塊操作等都以意群為單元進行。意群顯示與編輯的實現(xiàn),是通過機內(nèi)意群顯示編輯部來實現(xiàn)1.意群之量的單位主要是單詞與復(fù)詞。因而當系統(tǒng)響應(yīng)用戶之編碼擊鍵后,并在系統(tǒng)庫內(nèi)找出相應(yīng)單詞和復(fù)詞時,也以單詞、復(fù)詞為單位提交給意群顯示編輯部。意群顯示編輯部在接收到這些信息后,不但將它們轉(zhuǎn)換成屏幕顯示的有關(guān)信息,并在它們(包括少數(shù)單用字、標點符號等)之間自動加顯一個空格,在組成復(fù)詞的單詞之間加顯一個聯(lián)詞符(如“-”)。
2.在讀入文本文件進行顯示時,由于文本文件也是以意群為單元記錄的(參閱字詞語碼部分),然而也以意群為單元送往意群顯示部進行意群顯示。
3.在整個系統(tǒng)中,意群就是輸入、顯示、插入和刪除的一個元素,它在這些操作當中是不可分的。所以編輯過程中的移動光標,也只是在意群之間移動,光標由一個意群跳到另一個意群,每次都落在某個意群之首字節(jié)(包括漢字、符號以及數(shù)字串及外文串)。
4.在文本編輯的過程中,使光標移動、插入、刪除、塊操作等都以意群為單元進行。實現(xiàn)的技術(shù)關(guān)鍵有二。一是如何判別一個意群單位,我們可以從3個方面入手。①系統(tǒng)本身的輸出是以單詞、復(fù)詞(以及ASCⅡ碼)為單元的,這是一個可以利用的判別點。②在機內(nèi)形成機內(nèi)文本是利用字詞語碼(見后),字詞語碼本身就代表一個意群。③屏幕已以意群為單元顯示,然而它們之間的空格也是一個判別標志。關(guān)鍵技術(shù)之二是使屏幕光標和機內(nèi)文本某點相應(yīng),每當移動光標、插入、刪除、塊操作時,都使它們處在一個相對應(yīng)的點上。
(九)多向自動款式排版,系統(tǒng)含有自動排版控制部,它首先對文章標題、各標題之間的層次隸屬關(guān)系,自然段的起止,是否插有圖表,特征串等等進行判別。然后根據(jù)款式庫的有關(guān)信息,在文章的適當?shù)胤阶詣硬迦肽撤N排版系統(tǒng)的排版控制命令。款式之款是針對文書種類,式是在某文書種類下的若干規(guī)格要求??钍綆觳坏鞣N款式,還貯存①各種款式的版面控制、字形、字號、字體等信息;和②按相同功能邏列的多種排版系統(tǒng)的排版打印控制命令。根據(jù)上述之逆原理,自動排版控制部還可閱讀用戶文件,自動學(xué)習(xí)新款式,并納入款式庫。
自動排版控制部對文章標題以及標題間的層次隸屬關(guān)系進行判斷,其依據(jù)有①回車后,不滿一行文字又見回車的可能是標題。②正文如是頂格,標題必右縮,可見標題與回車間還有大于4字節(jié)的空格;如果標題頂格,正文必是右縮。③標題與正文相交替出現(xiàn),標題不超過一行,正文都大于2行。④標題大都冠以數(shù)字或表示數(shù)字概念的詞語。⑤標題間的層次與隸屬關(guān)系,可以根據(jù)標題前的數(shù)字或表示數(shù)字概念的詞語來確定。⑥回車后有4字節(jié)空格的是自然段的起點,標題或下一個自然段的開始是本自然段的結(jié)束。⑦兩個表格標之間的內(nèi)容是表格。⑧除上述判別外,還可以對一些特征串進行自動判別,例如用X??將X后的1~2個數(shù)字作為上標處理等等。
在判別時,如果有兩可情況,給出提示,讓用戶干預(yù)。判別的同時一屏屏地顯示,把標題、特征串以不同顏色顯示或僅作反向顯示,在題后加顯一個數(shù)字,用以表示標題的級別,便于用戶校閱,用戶可以利用相應(yīng)的鍵盤命令進行干預(yù),也可以在需要特殊處理處手工加上排版控制命令,例如要對某個字進行修裝釋。
判別完成之后,就可以自動地在相應(yīng)適當處加入排版控制命令,排版控制命令是根據(jù)用戶選定用什么系統(tǒng)排版打印,在取相應(yīng)系統(tǒng)的相應(yīng)命令內(nèi)碼加上(不一定在本系統(tǒng)下能顯示)。如果用戶日后改變注意,要用另一種排版系統(tǒng)打印時,只要重新點一下用什么系統(tǒng)打印輸出就可以了。
用戶要設(shè)定一個新款式,只要用手工的方法對某文件加入排版控制命令,完事后,敲擊自動學(xué)習(xí)命令,讓系統(tǒng)進行自動學(xué)習(xí)。這項工作道理很簡單,也容易實現(xiàn)。只是上述的逆過程,判別后將有關(guān)控制命令,連同標題等信息納入款式庫。
根據(jù)本發(fā)明的構(gòu)思,上述意群顯示與編輯、自動組詞、校改組詞、選重刪詞、正文選重、單詞分庫、字詞語碼、多向款式自動排版除用于連帶專利(CN-1049728A)所公開的專用輸入裝置外,還可用于大、中、小、微型電子計算機,電傳機,電腦打字機,終端及通訊系統(tǒng)上。
根據(jù)本發(fā)明的構(gòu)思,字詞語碼還可用于自然語言理解,機器翻譯等方面。
本發(fā)明對比現(xiàn)有技術(shù)有如下優(yōu)點1.自動組詞和校改組詞,自動組詞無需用戶顧問,自動地以字組單詞,或者以單詞組復(fù)詞,將用戶缺少之單詞、復(fù)詞加入系統(tǒng);校改組詞將單詞組成復(fù)詞,或者把短復(fù)詞串成更長的復(fù)詞,并且是在校改狀態(tài)時通過極簡單的操作就能實現(xiàn)。它們所組之詞,范圍廣,數(shù)量大,是詞組化意群輸入的重要一環(huán)?,F(xiàn)有技術(shù)沒有達到詞組化意群輸入的這個高層次;僅處以字為主,兼輸少數(shù)高頻詞組的低級階段。它們的詞組加入①操作麻煩,往往要用戶停下輸入,去做復(fù)雜的專門加詞工作。②加入的詞匯往往要重新啟動系統(tǒng)后才能輸入。③多數(shù)系統(tǒng)還得用戶定義輸入編碼。④用戶能加入的詞匯數(shù)量非常有限,有的甚至只能加入數(shù)百條詞匯。
2.選重刪詞,現(xiàn)有技術(shù)不能刪除系統(tǒng)提供的詞匯。少數(shù)現(xiàn)有技術(shù)僅可以刪除用戶加入的那個小小范圍內(nèi)的詞條。本發(fā)明如同選重操作那樣簡單的操作就可以刪除系統(tǒng)詞庫內(nèi)的詞條,非常簡捷,效率高。這是現(xiàn)有技術(shù)所不可比擬的。
3.正文選重,現(xiàn)有技術(shù)出現(xiàn)重碼,都在系統(tǒng)提示行顯示,等待用戶選重,這種操作嚴重地干擾思維,并使輸入速度減慢。本發(fā)明的正文選重,在輸入時不必處理重碼,不但輸入速度快,而且不干擾思維。把重碼留待校改閱讀正文時處理,符合人們校改是為校正改錯之習(xí)慣;并且隨校閱而順手操作,自然方便。
4.單詞分庫,現(xiàn)有技術(shù)都是一個版本酬天下,大家都可以使用,但是大家都不稱心,大家都得不到高效率。本發(fā)明將中文單詞庫,面向不同行業(yè)、環(huán)境里工作、學(xué)習(xí)、生活著的人們,分成許多單詞分庫,提供各種行業(yè)版本,可使人們進行詞組化意群輸入,獲得高效率。
5.字詞語碼,利用字詞語碼進行運算、傳輸和貯存其效率比使用現(xiàn)有技術(shù)漢字機內(nèi)碼要提高2~5倍。此外,更具重大意義的是字詞語碼與意群相匹配,可以實現(xiàn)以意群為單位進行運算、傳輸和貯存,在自然語言理解、機器翻譯等領(lǐng)域,將產(chǎn)生積極的作用。
6.意群顯示與編輯,現(xiàn)有技術(shù)的文本顯示,意群之間是沒有間隔的,人們閱讀理解時,必須通過眼睛一個字一個字地掃描,思維再將它們按意群一條一條地分開,直至理解。①本發(fā)明以意群為單元顯示,節(jié)省了人們閱讀理解時的這個過程,從而使閱讀理解變得簡單快捷。②意群顯示使文意表達更加準確,不會出現(xiàn)二義性語句。③意群顯示,使文本編輯也可以以意群為單元進行,然而也使文本編輯適應(yīng)思維,變得簡單快捷。
7.多向款式自動排版,本項技術(shù)與現(xiàn)有技術(shù)相比,優(yōu)點有①簡化了人們在文件里加入控制命令的操作,提高了工作效率。②當人們須要改用另一種排版打印系統(tǒng)輸出時,不必重新手工排版文件,通過改變一個打印參數(shù)就可實現(xiàn)。③現(xiàn)有技術(shù)排版系統(tǒng)很多,各自為政,各用各的控制命令,用戶如果想使用另一套系統(tǒng),必須重新學(xué)習(xí)。這個麻煩也可免除了。
上述第五部分,結(jié)合實施例和附圖詳細闡述本發(fā)明技術(shù)內(nèi)容時,已將本發(fā)明實施的最好方式給以闡述。這里僅對字詞語碼做些補充說明。
字詞語碼當中五個成員排列次序,自然可以改變成其它任何排列次序。漢字、單詞、復(fù)詞之數(shù)量亦可以適當增減,所以它們之間的段界也可以隨之改變。這樣就可以產(chǎn)生多種實施例。多種實施例當中,還是以第五部分所述實施例為最佳實施例。
深信,本發(fā)明實施后,將產(chǎn)生很大的社會和經(jīng)濟效益。
權(quán)利要求
1.一種用于計算機或電腦打字機等設(shè)備基于漢語分詞以意群為單元進行輸入、運算、傳輸、貯存的漢字處理系統(tǒng),其特征在于a.系統(tǒng)設(shè)有當用戶以漢字為單位,連續(xù)輸入2~4個字時即開始工作,自動把這2~4個字按排列的方式串成若干條單詞,生成它們的輸入編碼,將它們置于環(huán)形緩存區(qū),立即響應(yīng)用戶的編碼輸入,并將經(jīng)用戶使用認可的保留、納入原詞庫,將未經(jīng)用戶使用認可的復(fù)蓋的自組單詞部;b.系統(tǒng)設(shè)有當輸入某條復(fù)詞而撲空時,自動把后繼單詞組成這條復(fù)詞,有關(guān)信息納入系統(tǒng)的復(fù)詞合成管理部,立即響應(yīng)用戶編碼輸入的自組復(fù)詞部;c.系統(tǒng)設(shè)有在文本編輯的校改狀態(tài),當用戶把光標移到某詞首,響應(yīng)用戶敲擊組詞功能鍵,自動將光標后的兩條詞(包括字)組合成一條新詞,也響應(yīng)連續(xù)敲擊組詞功能鍵,自動將光標后若干詞條組合成一條新詞,這些新詞能立即響應(yīng)用戶編碼輸入的校改組詞部;d.系統(tǒng)設(shè)有使所有單復(fù)詞重碼全部進入文件正文,借助于字詞語碼記憶和辯識重碼,并在當前屏幕上,將重碼反向顯示,響應(yīng)用戶敲擊鍵盤的多種選重操作的正文選重部;e.系統(tǒng)設(shè)有把單詞或復(fù)詞重碼顯示于系統(tǒng)提示行,響應(yīng)用戶敲擊刪詞功能鍵將某詞庫的詞條刪除的選重刪詞部;f.系統(tǒng)設(shè)有含4~10萬單詞,并用它拼合復(fù)詞的單詞分庫;這個單詞分庫的單詞以及由它所拼合的復(fù)詞由公有和私有兩部分組成,公有部分來源于收集某行業(yè)、環(huán)境內(nèi)工作、學(xué)習(xí)和生活著的人們之大眾化用詞,私有部分借助于自動組詞,校改組詞技術(shù)在用戶使用中納入;g.系統(tǒng)設(shè)有把ASCⅡ碼、漢字、單詞、復(fù)詞以及其它代碼等五部分歸納到一個字的數(shù)據(jù)空間并與單詞分庫配套,面向某行業(yè)環(huán)境內(nèi)的人們的字詞語碼;這一個字的數(shù)據(jù)空間是把0~0FFH分配給ASCⅡ碼,把100H~2383H分配給漢字,把2384H~0E6D3H分配給單詞,把0E6D4H~0FFDCH分配給復(fù)詞,把0FFDDH~0FFFEH分配給其它代碼,這五個部分,如果有相應(yīng)庫的,它們的編碼與在具體庫中序數(shù)位置相對應(yīng);h.系統(tǒng)設(shè)有在意群之間自動加顯空格,復(fù)詞中各構(gòu)成成份之間加顯聯(lián)詞符,使光標只能從一個意群移到另一個意群,并都落在某意群之首,它把單詞、復(fù)詞、或單用字都作為一個不可分割的元素來響應(yīng)用戶插入、刪除和塊操作等鍵盤操作的意群顯示編輯部;i.系統(tǒng)設(shè)有能對文章標題、各標題之間的層次隸屬關(guān)系、自然段的起止、是否插有圖表、特征串等等進行判別,然后根據(jù)款式庫的有關(guān)信息,在文章的適當?shù)胤阶詣硬迦胗脩糁付ǖ呐虐嫦到y(tǒng)的排版控制命令,它還可閱讀用戶文件,自動學(xué)習(xí)新款式,將有關(guān)信息納入款式庫的自動排版控制部。
2.根據(jù)權(quán)利要求1所述系統(tǒng),其特征在于自動組詞、校改組詞所組的新詞以及選重刪詞的有關(guān)信息,都緩存于內(nèi)存并且與原有詞匯一道被系統(tǒng)訪問,可立即響應(yīng)用戶的擊鍵操作,也可自動或半自動地存盤;下次又在這個基礎(chǔ)上更新,用戶越用越適合自我。
3.根據(jù)權(quán)利要求1所述系統(tǒng)的正文選重,其特征在于響應(yīng)用戶敲擊鍵盤的選重操作,至少有如下四種型式①即時選重,當剛剛輸入的是一條重碼,響應(yīng)用戶立即用數(shù)字鍵選重;②批選重碼,響應(yīng)用戶敲擊相應(yīng)功能鍵,成批地處理重碼,它可以從文件尾部開始,也可以從文件頭部開始,它自動找出重碼,光標依次落在一條條重碼上,響應(yīng)用戶利用數(shù)字鍵選重,可以一口氣處理完整個文件的重碼,也可半途停止;③校改選重,校改時,當光標移到重碼首,響應(yīng)用戶利用數(shù)字鍵選重,也可不選而移走光標;④隱含自動選重,隱含保留第一條重碼,自動將后面重碼全部刪除;在這四種型式中,如果用戶敲擊的數(shù)字大于重碼詞條數(shù),便將本重碼全部刪除;
4.根碼權(quán)利要求1所述系統(tǒng)的字詞語碼,其特征在于系統(tǒng)還設(shè)有字詞語碼管理部,它響應(yīng)用戶編碼擊鍵,在系統(tǒng)給出相應(yīng)單詞、復(fù)詞、字、ASCⅡ字符等之后,生成它們的字詞語碼,以字詞語碼的形式進行運算、傳輸和貯存,當直接傳輸輸出或讀貯存文件輸出時,字詞語碼管理部又將它們轉(zhuǎn)換成相應(yīng)的輸出信息,送各種輸出設(shè)備。
5.根據(jù)權(quán)利要求1、4所述系統(tǒng)的單詞分庫與字詞語碼,其特征在于收集某行業(yè)、環(huán)境內(nèi)工作、學(xué)習(xí)和生活著的人們之用詞而產(chǎn)生單詞分庫,作相應(yīng)的字詞語碼編碼,產(chǎn)生該行業(yè)版本,面向這一行業(yè)環(huán)境內(nèi)的人們;用相同方法可產(chǎn)生多種行業(yè)版本,面向各行各業(yè)的人們;各行業(yè)版本單復(fù)詞數(shù)量可以不一,字詞語碼當中成員的次序、段界也可以不一。
6.根據(jù)權(quán)利要求1、4~5所述系統(tǒng),其特征是字詞語碼還可用于自然語言理解、機器翻譯等方面。
7.根據(jù)權(quán)利要求1所述系統(tǒng)自動排版控制的款式庫,其特征是款式庫貯存多種款式,款針對文書種類、式針對某文書種類下的數(shù)種規(guī)格、要求,各種款式下至少含有版面控制、字形、字號、字體和按相同功能邏列的多種排版系統(tǒng)的排版打印控制命令等信息。
8.根據(jù)權(quán)利要求1~7所述系統(tǒng),其特征是本系統(tǒng)可用在電子計算機、電腦打字機、電傳機、終端和通訊設(shè)備上。
全文摘要
意群輸入、編輯和字詞語碼屬于電子計算機漢字處理的技術(shù)領(lǐng)域。本發(fā)明提供了一套與人類思維相一致,能進行意群輸入,并以意群為單元顯示、運算、傳輸、記錄的方法。主要特征是以漢語分詞為基礎(chǔ),有自動組詞、校改組詞、選重刪詞、正文選重、單詞分庫、意群顯示編輯等功能部件用以實現(xiàn)和保證詞組化意群輸入的進行;同時具有把ASCII碼、漢字、單詞、復(fù)詞和其它代碼五個部分共置一個字的數(shù)據(jù)空間的字詞語碼,從而使顯示、運算、傳輸、形成文本文件等都能以意群為單元進行。
文檔編號G06F3/023GK1114066SQ94112998
公開日1995年12月27日 申請日期1994年12月13日 優(yōu)先權(quán)日1994年5月8日
發(fā)明者劉樹根 申請人:劉樹根
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
南漳县| 丰城市| 甘洛县| 青海省| 亚东县| 齐齐哈尔市| 竹溪县| 福安市| 工布江达县| 黔西县| 桐乡市| 哈尔滨市| 蓝山县| 太仓市| 万盛区| 乌恰县| 固原市| 客服| 阿坝县| 开封县| 中牟县| 乐都县| 宝应县| 怀化市| 石首市| 咸丰县| 马关县| 宜章县| 南昌县| 洮南市| 宿松县| 湟中县| 南通市| 天峻县| 兴国县| 湘潭县| 岳西县| 珠海市| 玉田县| 上思县| 威远县|