專利名稱:用0和1兩個信號編碼和計算自然語言的機械方法
技術(shù)領(lǐng)域:
本發(fā)明屬于高性能電子計算技術(shù)領(lǐng)域。
2.
背景技術(shù):
本發(fā)明的背景技術(shù)來自以下三個方面
(1) 計算機程序設(shè)計語言及其實現(xiàn)技術(shù)。電子數(shù)字計算機能夠通過各種高級程序設(shè)計語 言,來實現(xiàn)人的思想過程。這種高級程序設(shè)計語言能夠通過編譯程序而在只能機械地識別0 和1這兩個數(shù)字信號的各種目標(biāo)機中得以實現(xiàn)的事實說明,人的思想過程是可以通過0和1 的機械組合形式而得以實現(xiàn)的。自然語言是表達人類思想過程的的基本形式,因而我們可以 考慮只用0和1這個邏輯字符來編碼和計算自然語言;
(2) 形式化的邏輯技術(shù)。自然語言能夠通過形式化的邏輯技術(shù),進行各種邏輯關(guān)系的演 算或證明。命題邏輯系統(tǒng)已實現(xiàn)了判定任一命題公式的機械計算方法——真值表方法。因而 我們可以根據(jù)本體論的惟一性思想,來考慮這種機械方法的拓展和簡化;
(3) 本人關(guān)于基因語義性質(zhì)和自然語言研究的哲學(xué)理論與邏輯技術(shù)。我在己發(fā)表的《基因 語義性質(zhì)的哲學(xué)和實證考察》(載《自然辯證法研究》2006年第二期)和《邏輯的純粹形式 和普通語言》(載《堅持科學(xué)發(fā)展觀,構(gòu)建和諧社會》第二巻(下)第663頁至673頁,紅旗出 版社2006年出版)兩篇論文中,系統(tǒng)地討論了基因語義和自然語言的哲學(xué)本體性和邏輯普通 性,并提出了只用0和1這兩個字符來表達自然語言的邏輯思想和形式方法(原文見附件)。 這個重大發(fā)現(xiàn)的核心,是它證明了邏輯隱變量的唯一性質(zhì)。這種邏輯語義系統(tǒng)的本體唯一性, 使得其任一變量的邏輯值都只有是與非(1和0)的兩種基本形式,而這兩種類型的邏輯組合 必然地只有四種可能的形式——11.10、 01.00。于是,我們可以考慮運用0和1的數(shù)碼形式去 封裝對象的邏輯方法,來實現(xiàn)自然語言的數(shù)字化表示及其機械計算。
3.
發(fā)明內(nèi)容
本發(fā)明的內(nèi)容是一種能夠被計算機硬件所理解的數(shù)字模型。運用這種模型,能夠精確地 表示和計算自然語言,并且,由于模型中只有0和1這兩個信息元素,所以,這種信息模型, 能夠直接進入硬件的指令系統(tǒng)實現(xiàn)運行,也能夠在任何目標(biāo)機的存儲系統(tǒng)中分配寄存或內(nèi)存 空間。下面介紹這種信息模型的理論原理和邏輯算法。
3.1理論原理
自然語言的數(shù)字模型系統(tǒng),是一種基于哲學(xué)本體論的信息模型系統(tǒng)。這種信息模型系統(tǒng)中只有惟一的一個本體對象,這個本體的抽象存在,是隱藏在0和1這兩個數(shù)字信號中的惟一 變量x,這種隱藏的本體變量,在邏輯上等價于數(shù)字計算機中的開關(guān)變量x,它只有"是" 與"非"的兩種語義形式。
為了實現(xiàn)自然語言的機械編碼,我們把惟一本體的這種"是"與"非"的機械語義形式 對應(yīng)于自然語言中任一概念和命題的正(肯定)負(fù)(否定)語義性質(zhì)。同時用邏輯類型的真假性質(zhì) 來對應(yīng)這種概念和命題的正負(fù)性質(zhì)——邏輯真對應(yīng)于概念或命題的肯定(正)性質(zhì)——邏輯假 對應(yīng)于概念或命題的否定(負(fù))性質(zhì),并且只用這種正負(fù)形式的邏輯真值來封裝和隱藏它所在 的概念或命題。
根據(jù)這種本體性的二元語義性質(zhì),我們對自然語言系統(tǒng)中的各個層次進行二元關(guān)系的邏輯 切分——把一個原子命題切分成主、謂概念的二元組合(不考慮謂項的屬性和關(guān)系,也不考慮 主項的命題態(tài)度)——把一個復(fù)合命題切分成兩個原子命題的二元組合——把一個推埋切分 成前件和后件的二元組合,并且都只用它是正或是負(fù)——0或1的真值形式對其實行封裝。
根據(jù)這種二元關(guān)系的邏輯切分和類型封裝方法,如果用邏輯1封裝正概念和正命題,用 邏輯0封裝負(fù)概念和負(fù)命題,那么所有的主、謂概念、原子命題、復(fù)合命題的二元真值組合 形式,就只有(211)2=4— 00—01—10—11(11=1)的四種可能模型。因此,在這種邏輯變量x-『1 的本體條件下,通過語義正負(fù)性質(zhì)的二元組合形式和各種邏輯聯(lián)結(jié)詞的運算功能以及經(jīng)驗知 識庫和語義關(guān)系真實相匹配的邏輯規(guī)則,就能實現(xiàn)自然語言的數(shù)字化表示和機械性計算。而 且本體變量5^n^的四個邏輯模型,就成為在結(jié)構(gòu)上編碼自然語言的四個信息模型。
3.2自然語言編碼和計算方法
為了清楚地說明編碼和計算自然語言的模型方法,我們把自然語言在物理意義上看作是 一個信號系統(tǒng)的控制流,自然語言系統(tǒng)中的語法概念即主、謂詞項是控制流中的邏輯結(jié)點,主 謂詞項的正(肯定)負(fù)(否定)類型是定義在這個結(jié)點上的信號接口,概念聯(lián)結(jié)符和命題聯(lián)結(jié)符是 連接這些邏輯結(jié)點的鏈條,各個結(jié)點上的信息接口通過不同聯(lián)結(jié)詞所對應(yīng)的聯(lián)結(jié)符號實行系 統(tǒng)的邏輯運算。下面介紹實現(xiàn)上述模型即編碼和計算自然語言的具體方法。
(1) 給出概念聯(lián)結(jié)符號及其賦值規(guī)則。因為現(xiàn)代數(shù)理邏輯系統(tǒng)中沒有概念聯(lián)結(jié)符號,并且 在自然語言的主謂概念之間,也沒有明確的邏輯聯(lián)結(jié)詞,所以如果我們要表示和計算主謂概 念之間的邏輯關(guān)系,就要定義標(biāo)識聯(lián)結(jié)主謂概念的邏輯聯(lián)結(jié)形式。為了方便連接,我們用下劃 線—作為語法概念之間的邏輯聯(lián)結(jié)符,并且,把在概念中出現(xiàn)的"不'、"沒有"、"并非"等否定 詞定義為識別概念為邏輯0的關(guān)鍵詞。
概念聯(lián)結(jié)詞的邏輯賦值規(guī)是當(dāng)主謂概念同時為肯定或同時為否定時,原子語句的邏輯 值為肯定,否則為否定——0—0=1, 0—1=0, 1—0=0, 1—1=1;
(2) 給出命題聯(lián)結(jié)的關(guān)鍵詞及其賦值規(guī)則現(xiàn)代數(shù)理邏輯系統(tǒng)巳定義了各種命題聯(lián)結(jié)形
式和它的真值賦值規(guī)則,但是,這些已定義的命題聯(lián)結(jié)形式及其賦值規(guī)則,并不能滿足要實現(xiàn) 自然語言數(shù)字化的設(shè)計要求,要滿足這種數(shù)字化的邏輯條件, 一是要把各種命題聯(lián)結(jié)詞定義
為關(guān)鏈詞并與其運算符號相對應(yīng);二是要重新定義各種邏輯運算符號的賦值規(guī)則。
因為現(xiàn)代數(shù)理邏輯是以命題的真假類型來定義邏輯運算符的真值賦值規(guī)則的,而我們這種基于哲學(xué)本體論的數(shù)字邏輯則要以概念和命題的正負(fù)類型來定義運算符號的真值賦值規(guī) 則,否則,就不能實現(xiàn)用0和1的信號來封裝邏輯詞項和命題。下面分別給出各種命題聯(lián)結(jié) 詞的關(guān)鍵詞及其它的真值賦值規(guī)則;
① 邏輯與&。表示邏輯與的關(guān)鍵詞是并且,又,還,但是,而且等。 邏輯與的賦值規(guī)則是當(dāng)一個聯(lián)言復(fù)合命題中的兩個支命題同時為肯定命題時,邏輯
與關(guān)系的賦值才是肯定的,否則就都是否定的——0&0=0, 0&1=0,1&0=0, 1&1=1;
② 邏輯或I 。表示邏輯或的關(guān)鍵詞是或者,可能等。
邏輯或的賦值規(guī)是當(dāng)一個選擇復(fù)合命題中的兩個支命題同時為否定命題時,邏輯或關(guān) 系的賦值才是否定的,否則就都是肯定的——0 I 0=0,0 I 1 = 1,1 I 0=1,1 I 1=1;
③ 邏輯異或②。表示邏輯異或的關(guān)鍵詞是;要么等。
邏輯異或的賦值規(guī)則是當(dāng)一個不相容選擇命題中的兩個支命題同時為否定或同時為肯 定命題時,邏輯異或關(guān)系的賦值是否定的,否則就都是肯定的~~0 0=0, 0 1=1, 1 0=1, 1 1=0;
③邏輯充分蘊涵一。表示邏輯充分蘊涵的關(guān)鍵詞是;那么,因此,于是,所以,必然等。 邏輯充分蘊涵的賦值規(guī)則是當(dāng)一個充分條件命題中的前件為肯定而后件為否定時,邏
輯充分蘊涵關(guān)系的賦值才是否定的,否則就都是肯定的——0—0=1, 0—1=1, 1—0=0, 1
—1=1;
邏輯必要蘊涵一。表示邏輯必要蘊涵的關(guān)鍵詞是;才能等。
邏輯必要蘊涵的賦值規(guī)則是當(dāng)一個必要條件命題中的前件為否定而后件為肯定時,邏 輯必要蘊涵關(guān)系的賦值才是否定的,否則就都是肯定的——0 — 0=1, 0—1=0, 1—0=1, 1 —1=1;
⑤邏輯等值一一。表示邏輯等值的關(guān)鍵詞是當(dāng)且僅當(dāng),等于等。
邏輯等值的賦值規(guī)則是當(dāng)一個充分必要條件命題中的前件和后件同時為肯定或否定時, 邏輯等值關(guān)系的賦值才是肯定的,否則就是否定的——0——0=1, 0 ——1=0, 1——0=0, 1 —1=1。
上述邏輯聯(lián)結(jié)關(guān)系,遍歷了自然語言中所有概念和命題之間的聯(lián)結(jié)形式,因為所有概念
和命題的字符串?dāng)?shù)據(jù)都是被0和1這兩個數(shù)字信號所封裝的,所以,依據(jù)這種數(shù)字形式的邏輯
聯(lián)結(jié)和賦值運算,我們就能系統(tǒng)地得到編碼和計算自然語言的數(shù)字形式和機械方法。在邏輯
變量\=11=1的本體條件下,封裝自然語言的整個數(shù)字形式系統(tǒng)和它所有可能的的數(shù)字模型是
(1) 結(jié)構(gòu)模型(2n)2==4—00 01 10 11
(2) 賦值模型(2n)3=8—000 001 010 Oil 100 101 110 111
(3) 復(fù)合結(jié)構(gòu)和推理模型[(2n)3]2==[(2n)2]3==64 —000000 000001 000010 000011 000100 000101 000110 000111 001000 001001 001010 001011 001100 001101 001110 001111 010000 010001 010010 010011 010100 010101 010110 010111 011000 011001 011010 011011 011100 011101 011110 011111 100000 100001 100010 100011100100 100101100110 100111101000 101001 101010 101011101100 101101 101110 101111 110000 110001 110010 110011 100100 100101 110110 110111 111000 111001 111010 111011 111100 111101 111110 111111
上述模型,窮盡了一切語法概念、命題和推理的所有可能的真值組合形式。也就是說對 于任意的原子命題、復(fù)合命題和邏輯推理而言,無論它們具有怎樣不同的邏輯聯(lián)結(jié)形式,但 表示它們結(jié)構(gòu)和賦值的數(shù)字形式,必然只有上述所列的可能模型。
4具體實現(xiàn)方式 4.1數(shù)字化的實現(xiàn)方式
(1) 通過生成目標(biāo)代碼實現(xiàn)語法詞項概念為字符串?dāng)?shù)據(jù)——操作數(shù)
(2) 通過識別定義邏輯非的關(guān)鍵詞——非、不、沒有,實現(xiàn)語法詞項概念為帶符號的操
作數(shù)。概念中有"非、不、沒有"等關(guān)鍵詞的,默認(rèn)為負(fù)概念——在目標(biāo)代碼前加0或1;概
念中沒有關(guān)鍵詞的,默認(rèn)為正概念——在目標(biāo)代碼前加1或o。 4.2分隔概念和命題的實現(xiàn)方式
(1) 在主、謂概念之間用下劃線分隔,下劃線不允許嵌套;
(2) 在原子命題之間用逗號分隔,逗號不允許嵌套
(3) 在復(fù)合命題之間用點號分隔,點號允許嵌套;
(4) 在推理的前、后之間用分號分隔,分號不允許嵌套
(5) 在推理或段落之間用句號分隔。句號是一個推理或段落的終結(jié)符號。 4.3連接概念和命題的實現(xiàn)方式
(1) 在主、謂概念之間編入概念連接符號—,實現(xiàn)概念數(shù)據(jù)的連接;
(2) 識別不同命題聯(lián)結(jié)詞的關(guān)鍵詞,并通過相對應(yīng)的運算符號接接命題。命題之間沒有聯(lián) 結(jié)詞的默認(rèn)為運算符&。
4.4算法的實現(xiàn)方式
(l)通過概念運算符的操作,實現(xiàn)原子命題內(nèi)部的主、謂概念運算。概念運算符的優(yōu)先級 高于命題運算符;
(2)通過命題運算符、分隔符、嵌套規(guī)則和各種優(yōu)先級的分別操作,實現(xiàn)命題之間的序列 運算。
4.5具體實現(xiàn)步驟-
(1) 編碼步驟①用下劃線編碼主、謂概念;②用逗號編碼原子命題;③用點號編碼復(fù)合 命題;④用分號編碼推理的前、后件;⑤用句號編碼推理和段落;
(2) 計算步驟①輸入自然語言形式的源代碼;②識別主、謂概念中的關(guān)鍵詞;③識別 命題之間的關(guān)鍵詞;④計算原子命題的值——消除下劃線和逗號;⑤計算復(fù)合命題的值—— 消除點號——點號有嵌套的先消除第1重點號;⑥計算推理前、后件的值——消除分號;⑦ 計算推理的值;⑧給出計算結(jié)果。
3.4測試結(jié)果和實例本發(fā)明通過以.net Framework 1.0為開發(fā)環(huán)境,以Cft語言為工具,進行了程序測試。運 行結(jié)果證明,它與非機械的常規(guī)算法精確相符合(測試演示系統(tǒng)見光盤)。下面是一個以自然語 言為源代碼的演算實例。
實例1如果所有的思想都是清楚的,那么,沒有思想需要解釋,如果所有的思想不是清 楚的,那么沒有思想能被解釋。因此,如果有的思想既需要解釋而又能被解釋清楚,那么, 這說明有的思想清楚,也有的思想不清楚。 (1)測試步驟 第一步,按規(guī)則進行編碼
如果所有的思想—都是清楚的,那么沒有思想—需要解釋.如果所有的思想—不是清楚 的,那么沒有思想_能被解釋.;因此如果有的思想_既需要解釋,而又能被解釋清楚,那么 這說明有的思想—清楚,也有的思想不清楚。
第二步,輸入源代碼。
第三步,識別主謂概念中的關(guān)鍵詞,并確定其正、負(fù)類型,同時進行自加1或0的邏輯運 算,使每個概念都成為帶符號的操作數(shù);
第四步,識別表示命題聯(lián)結(jié)詞的關(guān)鍵詞,得到與源代碼相等價的目標(biāo)代碼(括號中的點表 示與源代碼相對應(yīng)的目標(biāo)代碼);
— 0(誦隱--)一1(國一).& 1(…-)—0(-國-),一o(----)_1(—-);— 1(—)—1(—), — 1(—)_1(—), &1(—)J(陽陽-),。
第五步,計算原子命題的值,消除逗號;
==1(—)—()(—). &0(—)—0(…-).;—1(—)&1(陽—).—1(國—)&()(—) o
第六步,計算復(fù)合命題的值,消除第一重點號; ==。(一)&1(—-); )—。(一)。 第七步,計算推理前后件的值,消除分號; ==。(-—)—。(——)。
第八步,計算推理的值,并給出計算結(jié)果; ==1(---)。
上述實例證明,這種用0和1兩個字符表示和計算自然語言的機械方法,是簡單直觀而
又精確可靠的。它的可靠性是通過語法概念或命題的正、負(fù)類型而得到保障的。因為每一個 概念或命題都必然地具有語義上的正、負(fù)性質(zhì),所以通過這種類型的整體封裝和邏輯運算所 得到的結(jié)果,必然是精確可靠的。
權(quán)利要求
1. 本發(fā)明是一種高性能的數(shù)字計算技術(shù)。其特征在于它只用0和1兩個數(shù)字信號實現(xiàn)了自然語言的數(shù)字化表示和機械性運算。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于它把自然語言中的每一個以主項和謂項為單 元的語法概念都表示為一個帶符號的操作數(shù),語法概念自身是肯定(正)或是否定(負(fù))的語義性 質(zhì)就是這個概念所帶的符號類型,這種符號類型被表示為1或0的信號形式,這個信號形式就 是該語法概念在語言信息流中的信號接口 。
3. 根據(jù)權(quán)利要求1和2所述的方法,其特征在于每個語法概念之間的聯(lián)結(jié)和計算都是通 過概念聯(lián)結(jié)符號(用下劃線一表示)的邏輯算法而得以實現(xiàn)的。這種概念運算符的算法規(guī)則是 1-1=1, 1-0=0, 0-1=0, 0-0=1 。
4. 根據(jù)權(quán)利要求l, 2, 3,所述的方法,其特征在于自然語言系統(tǒng)的數(shù)字化表示和計算, 是通過把概念和命題的肯定和否定性質(zhì)與邏輯的真假性質(zhì)相對應(yīng)——邏輯真對應(yīng)于概念和命 題的肯定形式——邏輯假對應(yīng)于概念和命題的否定形式而得以實現(xiàn)的。
全文摘要
用0和1兩個信號編碼和計算自然語言的機械方法,是一種高性能的數(shù)字計算技術(shù)。這種數(shù)字技術(shù),只用0和1兩個數(shù)字形式表示和計算自然語言。它在物理意義上,把自然語言看作是一個信號系統(tǒng)的控制流;把每個語句中的主、謂概念作為信息控制流中的結(jié)點;并且,把每一個語法概念即主謂詞項是肯定(正或1)還是否定(負(fù)或0)的語義性質(zhì)作為定義在這個概念結(jié)點上的信號接口;然后通過連接各個信號接口的邏輯聯(lián)結(jié)符的不同算法和語義關(guān)系真實相匹配的邏輯規(guī)則,實現(xiàn)了自然語言的數(shù)字化表示和機械性計算。
文檔編號G06F17/28GK101377771SQ20071003563
公開日2009年3月4日 申請日期2007年8月28日 優(yōu)先權(quán)日2007年8月28日
發(fā)明者萬繼華 申請人:萬繼華