漢語語法自動(dòng)分析及處理方法

文檔序號(hào)：6412324閱讀：3049來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：漢語語法自動(dòng)分析及處理方法
技術(shù)領(lǐng)域：
本發(fā)明涉及語言的分析與處理方法，更具體地，涉及漢語語法自動(dòng)分析與處理方法。
漢語(即中文)在中國(guó)社會(huì)中作為一種自然語言供人們使用時(shí)，一般人應(yīng)均可非常靈活地加以運(yùn)用，然而，若將漢語應(yīng)用于電腦中，且欲使電腦(包括電子字典及電子記事簿等電子產(chǎn)品)使用者(尤其是非漢語系用戶)能針對(duì)漢語(中文)語法進(jìn)行自動(dòng)分析時(shí)，如針對(duì)中文信息進(jìn)行語意辨識(shí)、語法檢查或電腦翻譯等時(shí)，該電腦即必須具備語法自動(dòng)分析能力，而能造成這種一功能的漢語電腦程序(如電子字典等)，由于其復(fù)雜的漢語語法規(guī)則，故在程序設(shè)計(jì)及實(shí)際應(yīng)用上，必須通過建立龐大的語法規(guī)則庫及復(fù)雜的語法分析法，再藉由高速的中央處理器，歷經(jīng)冗長(zhǎng)的運(yùn)算處理時(shí)間，方可能完成。
此處，一般漢語電腦程序無法具備語法自動(dòng)分析能力的另一原因，在于漢語的語法規(guī)則不同于電腦上所使用的程序語言的語法規(guī)則，前者是根據(jù)大量的語言習(xí)慣總結(jié)而得到的自然語法，其中存在較多的語法例外和特殊情況，并且經(jīng)常具有多種意義特性；而后者則是人們根據(jù)一定的邏輯規(guī)則所發(fā)明的，故從設(shè)計(jì)上可輕易避免多種意義特性及例外情況的存在。
因此，欲使電腦能針對(duì)自然語言作出精確的語法分析，并劃分出語句的語法單位，確實(shí)是一種相當(dāng)困難的技術(shù)，不僅須建立龐大且完整的語法規(guī)則庫、使用復(fù)雜的語法分析運(yùn)算法，還需要具備速度極高的微處理器，并耗費(fèi)足夠長(zhǎng)的運(yùn)算時(shí)間，方有可能具體實(shí)現(xiàn)。但是，在某些對(duì)于實(shí)時(shí)性(Real Time)要求較準(zhǔn)確性更高的語言系統(tǒng)(如中文語言系統(tǒng)、袖珍中文翻譯系統(tǒng))中，由于其語法的分析過程要求能快速完成，而所分析的結(jié)果僅要求基本上準(zhǔn)確即可，因此如何據(jù)此而設(shè)計(jì)出一種可利用電腦快速且正確地分析出漢語語法結(jié)構(gòu)的方法，是當(dāng)今發(fā)展電腦漢語語言系統(tǒng)領(lǐng)域共同面臨且亟待解決的重要課題。
本發(fā)明人即針對(duì)前述對(duì)于實(shí)時(shí)性要求較準(zhǔn)確性為高的漢語語言系統(tǒng)而設(shè)計(jì)出本發(fā)明，希望用電腦微處理器所具備的運(yùn)算處理能力，以較小的數(shù)據(jù)庫為基礎(chǔ)，在使用者所接受的極短時(shí)間內(nèi)，對(duì)輸入電腦的漢語文字串，進(jìn)行快速地語法分析與運(yùn)算，并獲得基本上準(zhǔn)確的語法成分。
本發(fā)明模擬人們?cè)谧R(shí)別語法單位和劃分句子語法成分時(shí)的行為模式，并將其程序予以邏輯化，再通過建立數(shù)據(jù)庫，且以該數(shù)據(jù)庫為依據(jù)，利用電腦，對(duì)輸入的中文句子進(jìn)行語法分析。
本發(fā)明的漢語語法自動(dòng)分析及處理方法主要是先根據(jù)數(shù)據(jù)庫中的漢語語詞庫，對(duì)輸入的句子進(jìn)行語詞劃分，再根據(jù)數(shù)據(jù)庫中的詞性標(biāo)記規(guī)則，依次標(biāo)定句子中各語詞的詞性，獲得與輸入句子順序相同的詞性標(biāo)記符號(hào)串，再依據(jù)數(shù)據(jù)庫中的語法規(guī)則，對(duì)有意義的標(biāo)記符號(hào)組合進(jìn)行合并操作，以簡(jiǎn)化句子的語法結(jié)構(gòu)，重復(fù)執(zhí)行上述步驟直到不能合并為止，即可獲得該句子最簡(jiǎn)化的語法結(jié)構(gòu)。

圖1是本發(fā)明的系統(tǒng)示意圖；圖2是本發(fā)明的流程示意圖；圖3是本發(fā)明中根據(jù)句子中各語詞的詞性，依次標(biāo)注詞性標(biāo)記的流程示意圖；圖4是本發(fā)明中根據(jù)語法規(guī)則對(duì)句子中的詞性標(biāo)記組合逐一進(jìn)行合并的流程圖。
如圖1所示，本發(fā)明先于其系統(tǒng)框架建立一漢語語詞庫、一漢語語詞性庫及一漢語語法規(guī)則庫等數(shù)據(jù)庫，并以這些數(shù)據(jù)庫為基礎(chǔ)，利用本發(fā)明的漢語語法自動(dòng)分析及處理方法，通過電腦微處理器予以實(shí)現(xiàn)。
如表1、表2、表3分別為本發(fā)明的漢語語詞庫、漢語詞性庫和漢語語法規(guī)則庫的實(shí)例。
表1漢語語詞庫
表2漢語詞性庫
本發(fā)明的漢語語法自動(dòng)分析及處理方法，如圖2所示，主要借助于模擬人們?cè)诒孀R(shí)語法單位和劃分句子語法成分時(shí)的行為模式，并以所建立的數(shù)據(jù)庫為依據(jù)，通過電腦對(duì)輸入電腦的句子進(jìn)行語法分析，現(xiàn)簡(jiǎn)述該自動(dòng)分析及處理方法的程序如下1)根據(jù)電腦中該漢語語詞庫的語詞，對(duì)輸入的句子進(jìn)行語詞劃分；2)再根據(jù)該漢語詞性庫中的詞性標(biāo)記規(guī)則，依次標(biāo)定句子中各語詞的詞性，以獲得與輸入句子順序相同的詞性標(biāo)記符號(hào)串；3)然后再根據(jù)該漢語語法規(guī)則庫中的語法規(guī)則，對(duì)所獲得的該詞性標(biāo)記符號(hào)串中的各標(biāo)記符號(hào)組合逐一進(jìn)行合并，以簡(jiǎn)化句子的語法結(jié)構(gòu)；4)重復(fù)執(zhí)行步驟3)，直到不能合并為止；5)這樣，即可得到句子合并后的最簡(jiǎn)化的符號(hào)串，并產(chǎn)生句子的語法結(jié)構(gòu)。
為使本發(fā)明借助電腦對(duì)漢語語法進(jìn)行分析及處理的方法能更清楚明了，現(xiàn)列舉一最佳實(shí)施例說明該方法的詳細(xì)流程如下，再如圖2所示1)首先，本發(fā)明需將所預(yù)先規(guī)則整理的漢語語詞庫(如表1所示)、漢語詞性庫(如表2所示)及漢語語法規(guī)則庫(如表3所示)等資料，以數(shù)字形式儲(chǔ)存在電腦的存儲(chǔ)器內(nèi)所建立的數(shù)據(jù)庫中，其中該漢語詞性庫中各語詞的詞性則依下表所對(duì)應(yīng)的標(biāo)記予以設(shè)定
2)電腦依據(jù)存儲(chǔ)器中的漢語語詞庫，對(duì)輸入電腦的漢語句子進(jìn)行語詞劃分，然后再將經(jīng)語詞劃分后的語詞串儲(chǔ)存在電腦的存儲(chǔ)器中；3)電腦再根據(jù)儲(chǔ)存在存儲(chǔ)器中的漢語詞存性庫，將語詞劃分后儲(chǔ)存在存儲(chǔ)器中的這些漢語語詞串的各個(gè)語詞存依次標(biāo)記詞性標(biāo)記，獲得與輸入句子中各文字串順序相同的詞性標(biāo)記符號(hào)串，并將其儲(chǔ)存在電腦存儲(chǔ)器中；4)電腦自動(dòng)查詢儲(chǔ)存在電腦存儲(chǔ)器中的這些詞存性標(biāo)記符號(hào)串，并依據(jù)儲(chǔ)存在存儲(chǔ)器中的漢語語法規(guī)則庫，尋找符合表3所示的該規(guī)則庫中語法規(guī)則的詞性標(biāo)記組合，如圖3所示，如果尋找不到符合語法規(guī)則的詞性標(biāo)記組合，電腦即進(jìn)行最后面的步驟(6)，否則，繼續(xù)以下步驟；5)電腦根據(jù)由第(4)得到的符合附表3所示的詞性標(biāo)記組合逐一進(jìn)行合并，如圖4所示，并將合并的新的詞性標(biāo)記組合儲(chǔ)存至存儲(chǔ)器中，然后，電腦再針對(duì)該新的詞性標(biāo)記組合返回步驟(4)，反復(fù)進(jìn)行合并，直到合并后的新的詞性標(biāo)記不能合并為止；如下面對(duì)例句1和例句2執(zhí)行上述步驟可得例句1我們及時(shí)地發(fā)現(xiàn)了工作中的缺點(diǎn)和錯(cuò)誤
例句2雖然她努力地去討好他，但仍然得不到他的諒解，她覺得真痛苦啊!
6)這樣，電腦即可獲得合并后最簡(jiǎn)單的詞性標(biāo)記串，并據(jù)以分析出輸入電腦的漢語句子的語法結(jié)構(gòu)及類型。
本發(fā)明方法可利用現(xiàn)有電腦的技術(shù)條件，對(duì)漢語(中文)句子進(jìn)行迅速的語法分析，且該方法經(jīng)具體實(shí)施后，亦證明其在語法分析方法確具成效，無須建立龐大且全面的語法規(guī)則庫、使用復(fù)雜的語法分析運(yùn)算法、藉助高速的中央處理器及耗費(fèi)冗長(zhǎng)的運(yùn)算時(shí)間，即可對(duì)任意有意義中文句子完成快速又正確的語法分析。
以上所述，僅系本發(fā)明的較佳實(shí)施例，但是，本發(fā)明所主張的權(quán)利范圍，并不局限于此，本領(lǐng)域技術(shù)人員，依據(jù)本發(fā)明所揭露的技術(shù)內(nèi)容，可輕易將其等效變化，而這些變化均應(yīng)屬不脫離本發(fā)明的保護(hù)范疇。
權(quán)利要求
1．一種漢語語法自動(dòng)分析及處理方法，該方法先在電腦中建立一數(shù)據(jù)庫，該數(shù)據(jù)庫包含一漢語語詞庫、一漢語詞性庫及一漢語語法規(guī)則庫等數(shù)據(jù)庫，電腦即以該數(shù)據(jù)庫為依據(jù)，對(duì)輸入電腦的句子進(jìn)行語法分析，該方法主要包括下列步驟(1)首先，根據(jù)電腦存儲(chǔ)器中的該漢語語詞庫的語詞，對(duì)輸入的句子進(jìn)行語詞劃分；(2)再根據(jù)該漢語詞性庫中的詞性標(biāo)記規(guī)則，依次標(biāo)定該句子中各語詞的詞性，以獲得與該句子文字串順序相同的詞性標(biāo)記符號(hào)串；(3)然后再根據(jù)該漢語語法規(guī)則庫中的語法規(guī)則，對(duì)所獲得的該詞性標(biāo)記符號(hào)串中的各詞性標(biāo)記組合逐一進(jìn)行合并，以簡(jiǎn)化該句子的語法結(jié)構(gòu)；(4)重復(fù)執(zhí)行步驟3)，直到不能合并為止；(5)這樣，即獲得該句子合并后的最簡(jiǎn)化的符號(hào)串，據(jù)以分析出句子的語法結(jié)構(gòu)。
2．如權(quán)利要求1所述的漢語語法自動(dòng)分析及處理方法，其特征在于，在電腦依據(jù)存儲(chǔ)器中的漢語語詞庫對(duì)輸入電腦的漢語句子進(jìn)行語詞劃分后，這些劃分后的語詞串儲(chǔ)存在電腦的存儲(chǔ)器中。
3．如權(quán)利要求1所述的漢語語法自動(dòng)分析及處理方法，其特征在于，電腦在獲得與輸入句子中各文字串順序相同的詞性標(biāo)記符號(hào)串后，將其儲(chǔ)存在電腦存儲(chǔ)器中。
4．如權(quán)利要求1所述的漢語語法自動(dòng)分析及處理方法，其特征在于，電腦根據(jù)該漢語語法規(guī)則庫對(duì)符合其語法規(guī)則的詞性標(biāo)記組合逐一進(jìn)行合并后，將合并后的新的詞性標(biāo)記組合儲(chǔ)存至存儲(chǔ)器中，然后，電腦再針對(duì)該新的詞性標(biāo)記組合，反復(fù)進(jìn)行合并，直到合并后的新的詞性標(biāo)記不能合并為止。
5．如權(quán)利要求1所述的漢語語法自動(dòng)分析及處理方法，特征在于，當(dāng)電腦無法由漢語語法規(guī)則庫對(duì)該詞性標(biāo)記符號(hào)串中的各詞性標(biāo)記尋找到符合語法規(guī)則的組合時(shí)，即以該句子合并后的最簡(jiǎn)化的符號(hào)串分析出句子的語法結(jié)構(gòu)。
全文摘要
本發(fā)明是一種漢語語法自動(dòng)分析及處理方法,利用電腦先根據(jù)漢語語詞庫對(duì)輸入的漢語文字串(句子)進(jìn)入語詞劃分,再根據(jù)詞性標(biāo)記規(guī)則依次標(biāo)定各語詞的詞性,得到與句子順序相同的詞性標(biāo)記符號(hào)串,然后根據(jù)語法規(guī)則,對(duì)標(biāo)記符號(hào)組合進(jìn)行合并,重復(fù)執(zhí)行至不能合并為止以簡(jiǎn)化句子的語法結(jié)構(gòu),這樣,針對(duì)任意有意義的中文句子,無須通過龐大的語法規(guī)則庫、復(fù)雜的語法分析法、高速的中央處理器及冗長(zhǎng)的運(yùn)算處理時(shí)間,即可快速且正確地分析出其語法結(jié)構(gòu)。
文檔編號(hào)G06F3/023GK1209599SQ97117729
公開日1999年3月3日申請(qǐng)日期1997年8月25日優(yōu)先權(quán)日1997年8月25日
發(fā)明者張景嵩, 楊徽, 賈麗紅, 錢力強(qiáng) 申請(qǐng)人:英業(yè)達(dá)股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張景嵩;楊徽;賈麗紅;錢力強(qiáng)
技術(shù)所有人：英業(yè)達(dá)股份有限公司
我是此專利的發(fā)明人

上一篇：可分離式硬盤驅(qū)動(dòng)器連接裝置的制作方法
上一篇：電腦外圍處理裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

漢語語法自動(dòng)分析及處理方法