漢語語義活性識(shí)別法
【專利摘要】一種漢語語義識(shí)別方法,屬于計(jì)算機(jī)科學(xué)與自然語言處理(NLP)【技術(shù)領(lǐng)域】,包括活性識(shí)別系統(tǒng)和語義分析識(shí)別步驟。根據(jù)語言活性特征,首先,識(shí)別語句的活字(塊)和非活字(塊)。其次,識(shí)別標(biāo)注字(塊)活性形態(tài),初步識(shí)別動(dòng)態(tài)、靜態(tài)、情態(tài)、聯(lián)態(tài)或生態(tài)活字(塊)。從而,運(yùn)用活性算法比較分析相鄰活字(塊)的活性字級(jí),轉(zhuǎn)態(tài)匹配消歧,識(shí)別謂活字(塊)及子謂活字(塊)。然后,進(jìn)行字塊聯(lián)結(jié)語義分析,識(shí)別語義活性模式。最后,識(shí)別非活字(塊)輔助語義,精確識(shí)別相鄰或相含語句語義。本發(fā)明以識(shí)別活字為手段,以語言活性為特征,線性分析處理語言,實(shí)現(xiàn)計(jì)算機(jī)識(shí)別語義,與現(xiàn)有技術(shù)相比,可以改善計(jì)算機(jī)處理歧義消除(WSD),提高語義識(shí)別信息處理效果。
【專利說明】漢語語義活性識(shí)別法
1.【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計(jì)算機(jī)科學(xué)應(yīng)用及自然語言處理NLP (Natural Languge Processing)【技術(shù)領(lǐng)域】,涉及下一代數(shù)據(jù)信息處理技術(shù)。
2.【背景技術(shù)】
[0002]2.1漢語自然語言信息處理現(xiàn)狀
[0003]自然語言處理是一門新興的計(jì)算機(jī)科學(xué)應(yīng)用技術(shù),其應(yīng)用領(lǐng)域越來越廣。自然語言處理有二條技術(shù)途徑:概率統(tǒng)計(jì)處理方法和語義分析處理方法。前者為數(shù)據(jù)技術(shù),目前曰臻完善;后者為字據(jù)技術(shù),目前進(jìn)展緩慢。統(tǒng)計(jì)的方法,基于語料進(jìn)行概率計(jì)算推測語義,能夠算出語言符號(hào)的表達(dá),但難以算出語言表達(dá)的意義,概率計(jì)算只能是有限語料語言的"數(shù)據(jù)”運(yùn)算,統(tǒng)計(jì)方法理解語義具有自身固有的缺陷。語義分析方法,按照語言的規(guī)律及特征分析語義,在理論方法上是“字據(jù)”的運(yùn)算,能夠在技術(shù)上識(shí)別理解語義。
[0004]漢語自然語言處理的語義分析方法,大致有兩類:一類是詞匯語義分析法,包括語義場、義素分析法、配價(jià)法、語義框架法、構(gòu)式語法論、概念整合法等。另一類是句法語義分析法,包括格語法、論旨法、概念依存法、語義網(wǎng)格法、蒙太格法等。這些語義分析方法目前還在初步探索階段,在漢語自然語言理解的語義處理中解決了部分技術(shù)問題,但都不同程度地存在缺陷,而語義分析對(duì)于高性能的漢語自然語言處理又是必不可少的技術(shù),這制約著漢語自然語言信息處理的科學(xué)應(yīng)用發(fā)展。
[0005]2.2.漢語自然語言處理存在的技術(shù)問題
[0006]2.2.1.目前詞匯語義分析法存在的問題
[0007]詞性(Part of Speech)是詞匯基本的語法屬性,通常也稱為詞類。詞性標(biāo)注就是在給定句子中判定每個(gè)詞的語法范疇,確定其詞性并加以標(biāo)注的過程。詞性標(biāo)注是自然語言處理中一項(xiàng)非常重要的基礎(chǔ)性工作。漢語詞性標(biāo)注同樣面臨許多棘手的問題,其主要難點(diǎn)可以歸納為如下三個(gè)方面(劉開瑛,2000):
[0008]2.2.1.1漢語是一種缺乏詞形態(tài)變化的語言,詞的類別不能像印歐語那樣,直接從詞的形態(tài)變化上來判別。
[0009]2.2.1.2常用詞兼類現(xiàn)象嚴(yán)重,由于兼類使用的程度高,兼類現(xiàn)象紛繁,覆蓋面廣,涉及漢語中大部分詞類,因而造成在漢語文本中詞類歧義排除的任務(wù)量大,而且面廣,復(fù)雜多樣。
[0010]2.2.1.3.研究者主觀原因造成的困難。語言學(xué)家在詞性劃分的目的、標(biāo)準(zhǔn)等問題上,還存在分歧。與漢語分詞規(guī)范類似,到目前為止,還沒有一個(gè)統(tǒng)一的,被廣泛認(rèn)可的漢語詞類劃分標(biāo)準(zhǔn),詞類劃分的粒度和標(biāo)記符號(hào)都不統(tǒng)一。詞類劃分標(biāo)準(zhǔn)和標(biāo)記符號(hào)集的差異,以及分詞規(guī)范的含糊性,給自動(dòng)分詞等中文信息處理帶來了極大的困難。一方面,各研究單位各執(zhí)己見,重復(fù)進(jìn)行大量的低水平勞動(dòng),另一方面,大量的標(biāo)注語料得不到充分利用和共享,從而造成了極大的人力、物力和資源的浪費(fèi)。(宗成慶《統(tǒng)計(jì)自然語言處理》第2版164頁)[0011]一些自然語言機(jī)器翻譯專家干脆認(rèn)為不需要漢語詞類的劃分。(董振東2009)
[0012]總之,漢語詞匯語義分析存在形態(tài)性、兼類性、標(biāo)準(zhǔn)性等缺陷。
[0013]2.2.2目前句法語義分析規(guī)則分析方法也存在一些缺陷
[0014]2.2.2.1.對(duì)于一個(gè)中等長度的輸入句子來說,要利用大覆蓋度的語法規(guī)則分析出所有可能的句子結(jié)構(gòu)是非常困難的,分析過程的復(fù)雜性,往往使程序無法實(shí)現(xiàn);
[0015]2.2.2.2.即使能夠分析出句子所有可能的結(jié)構(gòu),也難以在巨大的句法分析結(jié)果集合中實(shí)現(xiàn)有效的消歧,并選擇出最有可能的分析結(jié)果;
[0016]2.2.2.3.手工編寫的規(guī)則一般帶有一定的主觀性,對(duì)于實(shí)際應(yīng)用系統(tǒng)來說,往往難以覆蓋大領(lǐng)域的所有復(fù)雜語言;
[0017]2.2.2.4.手工編寫規(guī)則本身是一件大工作量的復(fù)雜勞動(dòng),而且編寫的規(guī)則對(duì)特定的領(lǐng)域有密切的相關(guān)性,不利于句法分析系統(tǒng)向其他領(lǐng)域移植。(宗成慶《統(tǒng)計(jì)自然語言處理》第2版181頁)
[0018]總之,漢語的句法分析存在復(fù)雜性、歧義性、主觀性、移植性等缺陷。
[0019]一般來說,一個(gè)自然語言處理系統(tǒng),如果完全沒有語義分析的參與,能夠獲得很好的系統(tǒng)性能是不可想象的。然而,自然語言的語義計(jì)算問題十分困難,如何模擬人腦思維的過程,建立語言、知識(shí)與客觀世界之間可計(jì)算的邏輯關(guān)系,并實(shí)現(xiàn)具有高區(qū)分能力的語義計(jì)算模型,至今仍是個(gè)未能解決的難題。(宗成慶《統(tǒng)計(jì)自然語言處理》第2版244頁)
[0020]2.3.語義分析自然語言處理的技術(shù)困難[0021 ] 2.3.1漢語規(guī)則的語法體系有爭議不健全
[0022]漢語規(guī)則一般有三種結(jié)構(gòu):詞組類型結(jié)構(gòu)PT (Phrase Type)、句法功能結(jié)構(gòu)SF(Syntax Function)和邏輯語義結(jié)構(gòu) LS(Logical Semantics)。
[0023]盡管一些有遠(yuǎn)見卓識(shí)的前輩學(xué)者,已初步涉及這三種結(jié)構(gòu)之間的某些復(fù)雜關(guān)系,擺出了許多有趣的語言事實(shí),但是,不少人往往把這種極為復(fù)雜的關(guān)系簡單化,在"漢語詞類問題"的討論中,就有人把語言成分的PT-結(jié)構(gòu)與SF-結(jié)構(gòu)混為一談,不知道同一 PT-結(jié)構(gòu)中的成分,可以在SF-結(jié)構(gòu)中具有不同的句法功能,結(jié)果,得出”漢語無詞類”的結(jié)論。在”漢語主賓語問題”的討論中,又有人則把語言成分的SF-結(jié)構(gòu)與LS-結(jié)構(gòu)混為一談,不知道同一個(gè)SF-結(jié)構(gòu)中的成分,在LS-結(jié)構(gòu)中可以具有不同的邏輯語義關(guān)系,結(jié)果,他們根據(jù)邏輯語義關(guān)系來確定主語、賓語等句法功能成分,把"施事者"一律定為"主語",把"受事者"一律定為"賓語",不惜削足適履,因果倒置,弄得漢語語法體系猶如一團(tuán)亂麻,令人望而生畏。這種語法所研究得出的種種"語法規(guī)律",尤其不適合于在漢語的信息處理工作中使用。(馮志偉2012《自然語言處理簡明教程》324頁)
[0024]2.3.2語義格語法描寫漢語的局限性,格框架描述漢語有困難
[0025]漢語詞與詞之間的語義關(guān)系(格關(guān)系),有多少種語義關(guān)系以及名稱,是個(gè)不確定的無限集,給自然語言的線性處理帶來巨大困難。語義關(guān)系的名稱,目前漢語語法學(xué)界還沒有統(tǒng)一的說法,少的十幾種,多的達(dá)到六七十種,有的還有分層格。各家經(jīng)常提到的語義關(guān)系有施事、受事、與事等。
[0026]2.3.3概念依存理論⑶(Conceptual Dependency Theory)有動(dòng)作基元、劇本、計(jì)劃三部分組成,該方法進(jìn)行漢語語義分析有缺陷,忽略了語言的細(xì)節(jié)一些不可描述的東西,用有限的集合來表示無限的動(dòng)作,本身就是缺陷。[0027]2.3.4自然語言句子中存在大量的歧義,涉及指代、同義/多義、量詞的轄域、隱語等,另外,語義計(jì)算的理論和方法很不成熟,從某種角度來講還沒有,根本就沒有建立這樣一種理論。(宗成慶2010)
[0028]關(guān)于語義計(jì)算分析的技術(shù)困難,中國科學(xué)院專家指出:語義是否可以計(jì)算,也沒有人可以說得清楚。我還是希望能夠找到一種方法,或者大家摸索出一種方法而來做這樣一件事,那怕是現(xiàn)在所有的一些數(shù)學(xué)工具都不能運(yùn)算。專家提出來,二個(gè)不同的語義,有可能是完全相反的,可能存在邏輯上的是與非的關(guān)系,在大多數(shù)情況下,可能不是那種簡單的是與非、零與一的關(guān)系,也不能用簡單的邏輯“與”和“或”作處理,需要構(gòu)造一種新的數(shù)學(xué)操作語言去做這樣一種計(jì)算??偸菓?yīng)該能夠發(fā)現(xiàn)這樣一種方法來解決這個(gè)問題。所以,我把這個(gè)問題一直留在這個(gè)地方,我自己也知道有很多問題,也不知道應(yīng)該怎么來解決這個(gè)問
題。......我認(rèn)為,總而言之,語義分析到目前為止還沒有好辦法,可以說剛剛開始。但是,
我認(rèn)為真正要解決自然語言理解的問題,必須要解決語義的問題,再難也要去做。如果這個(gè)問題解決不了的話,不存在真正高性能的自然語言理解。(宗成慶2010《自然語言理解》第三十講)
[0029]3.發(fā)明任務(wù)
[0030]漢語自然語言處理的語義分析方法目前存在的詞匯分析和句法語義分析等方面的缺陷和問題,主要原因是缺少一個(gè)符合語言規(guī)律可以統(tǒng)一處理漢語語義的分析系統(tǒng)/模型,導(dǎo)致了十多年來自然語言處理的漢語語義分析技術(shù)處于瞎子摸象徘徊不前的狀態(tài),迫切需要一個(gè)解決漢語的字、詞、句語義分析的新系統(tǒng)技術(shù)方案,突破以前的語義分析方法的零碎敲打、個(gè)別設(shè)計(jì)、局部處理的技術(shù)障礙,這就是本發(fā)明的任務(wù)。
4.
【發(fā)明內(nèi)容】
[0031]本發(fā)明漢語語義活性識(shí)別法的內(nèi)容主要包括本發(fā)明的目的、本發(fā)明的具體技術(shù)方案和本發(fā)明的有益效果。
[0032]4.1本發(fā)明的目的:用一個(gè)漢語語義統(tǒng)一識(shí)別處理系統(tǒng)和分析方法,不同程度地解決漢語詞匯語義分析在形態(tài)性、兼類性、標(biāo)準(zhǔn)性等方面的缺陷和漢語句法語義分析在復(fù)雜性、歧義性、主觀性、移植性等方面的缺陷,發(fā)明一個(gè)計(jì)算機(jī)識(shí)別漢語語義的新方法。
[0033]4.2本發(fā)明的具體技術(shù)方案由一個(gè)漢語活性分析識(shí)別系統(tǒng)及運(yùn)用活性算法的語義識(shí)別分析步驟組成。
[0034]4.2.1.建立漢語語義活性分析系統(tǒng)
[0035]語言方法和哲學(xué)方法是認(rèn)識(shí)世界的二種方法。哲學(xué)的方法是宏觀地解釋世界,語言的方法是微觀地描述世界。世界是運(yùn)動(dòng)的,人類是活動(dòng)的,語言記錄描述著人類的各種活動(dòng),自然活動(dòng)、社會(huì)活動(dòng)和認(rèn)知活動(dòng)。反映人類活動(dòng)的語言所包含的活動(dòng)性是人類生活的鮮活寫照,表達(dá)了人類活動(dòng)的基本涵意,這種活動(dòng)性即語言的活性(Activity),是語言的一個(gè)基本屬性或特征,反映了語言文字自身固有的客觀語言規(guī)律,據(jù)此,建立了一個(gè)漢語活性識(shí)別處理系統(tǒng)。
[0036]4.2.1.1.在這個(gè)活性系統(tǒng)中,語義按照其特征活性表現(xiàn),識(shí)別為慨念與形式。內(nèi)慨念識(shí)別為語義的內(nèi)涵,外概念識(shí)別為語義的外延;內(nèi)形式識(shí)別為語義的模式;外形式識(shí)別為語義的構(gòu)態(tài)。SP,[0037]識(shí)別語義:S =[概念(內(nèi)涵,外延),形式(模式,構(gòu)態(tài))],其中:
[0038]內(nèi)概念的意義,按其活性特征識(shí)別為:動(dòng)態(tài)義vd、靜態(tài)義vs、情態(tài)義vm、聯(lián)態(tài)義cc、生態(tài)義I1、非態(tài)義k,表現(xiàn)在三大科學(xué)領(lǐng)域,即自然義、社會(huì)義、認(rèn)知義,語義是這三個(gè)有限子集的合集,即,Sk =[自然義kn,社會(huì)義ks,認(rèn)知義kr]。
[0039]外概念的意義,識(shí)別為概念形式化的意義,包括事物義Sm、事態(tài)義Sa、事件義Se。
[0040]Bp, Ss =[事物義Sm,事態(tài)義Sa,事件義Se]
[0041 ] 外形式的意義,識(shí)別為匹配形式的活性構(gòu)態(tài),包括:無聯(lián)Non,字聯(lián)Word,短語Phrase,子句Clause。即,Sf =[無聯(lián)No,字聯(lián)Wo,短語Pr,子句Cl]。
[0042]內(nèi)形式的意義,識(shí)別為實(shí)現(xiàn)形式的活性模式,包括:主活式Ms、被活式Mp、賓活式Mo、形活式Ma、系活式Mr、在活式Me、使活式Mm、非活式Mn。
[0043]即,Sm= [Ms, Mp, Mo, Ma, Mr, Me, Mm, Mn]
[0044]4.2.1.2.在這個(gè)活性系統(tǒng)中,漢字(Word)按照其特征活性表現(xiàn),識(shí)別為活字和非活字。
[0045]活字Wa(Word active)是具有活動(dòng)意義的性質(zhì)或形態(tài)特征的活性字?;钭值膬?nèi)涵是活性:即語言具有表達(dá)人類、社會(huì)和自然等活動(dòng)意義的性質(zhì)和形態(tài)的屬性或特征,這個(gè)屬性由慨念和形式來表示,即語義。例如,人:是具有活動(dòng)的概念特征的活字;吃:是具有活動(dòng)的形式特征的活字。識(shí)別活動(dòng)的固態(tài)概念為生態(tài)活字;活動(dòng)的表現(xiàn)形式按其活動(dòng)的復(fù)雜程度和聯(lián)結(jié)方式,識(shí)別為動(dòng)態(tài)活字、靜態(tài)活字、情態(tài)活字、聯(lián)態(tài)活字等,即,
[0046]活字Wa =[動(dòng)態(tài)字Vd,靜態(tài)字Vs,情態(tài)字Vm,聯(lián)態(tài)字C,生態(tài)字N]
[0047]非活字Wn (Word nonActive):不具有活動(dòng)意義的性質(zhì)或形態(tài)特征的字,輔助說明活字意義的字。例如:椅、木等。
[0048]4.2.1.3在這個(gè)活性系統(tǒng)中,由字組成的字塊按照其活性表現(xiàn),識(shí)別為活字塊和非活字塊。字塊WC(Word chunk):是字與字絕對(duì)聯(lián)系而具有固定語義的通用字串。字塊包括:詞、成語、習(xí)語。識(shí)別具有活動(dòng)意義或慨念特征的字塊為活字塊Wca (Wc Active),活字塊一般含有活字;識(shí)別不具有活動(dòng)意義或慨念特征的字塊為非活字塊Wcn(Wc nonactive),非活字塊一般不含有活字。在活性轉(zhuǎn)態(tài)情況下,一些活字塊可能不含有活字,一些非活字塊可能含有活字。
[0049]活字(塊)按照其活性表現(xiàn),識(shí)別為動(dòng)態(tài)活字(塊)、靜態(tài)活字(塊)、情態(tài)活字(塊)、聯(lián)態(tài)活字(塊)、生態(tài)活字(塊)。非活字(塊)為非態(tài)字(塊)。
[0050]動(dòng)態(tài)活字(塊)Wd(Word Dynamic):具有較強(qiáng)活動(dòng)意義特征的活字(塊),識(shí)別為思維活字(塊)Vn、復(fù)合活字(塊)Vc、行為活字(塊)Vb ; S卩,Wd = [Vn, Vc, Vb];
[0051]靜態(tài)活字(塊)WS(Word Static):具有較弱活動(dòng)意義特征的活字(塊),識(shí)別為關(guān)系活字(塊)Vr、形容活字(塊)Va,即,Ws = [Vr,Va];
[0052]情態(tài)活字(塊)Wm(Word Model):具有輔助活動(dòng)意義特征的活字(塊),識(shí)別為能愿活字(塊)Vm、助動(dòng)活字(塊)Vh,BP, Wm = [Vm, Vh];
[0053]聯(lián)態(tài)活字Wc (Word Conjunction):具有聯(lián)結(jié)活動(dòng)概念或形式特征的活字(塊),識(shí)別為聯(lián)詞活字(塊)Cp (phrase)、聯(lián)句活字(塊)Ce (Clause),即,Wc = [Cp, Ce]
[0054]生態(tài)活字(塊)Wb (Word Biology):具有活動(dòng)意義概念特征的活字(塊),識(shí)別為生物活字(塊)Nb、機(jī)動(dòng)活字(塊)Nm、自然活字(塊)Nn、動(dòng)名活字(塊)Nv,S卩,Wb= [Nb,Nm, Nn, Nv]
[0055]4.2.1.4.在這個(gè)活性系統(tǒng)中,活字(塊)按照其活性表現(xiàn)的差異,進(jìn)一步識(shí)別為若干字(塊)集Set。思維字(塊)識(shí)別為理性活字(塊)Vnr、感性活字(塊)Vne復(fù)合字(塊)識(shí)別為:智力活字(塊)Vc1、腦體活字(塊)Vcb;行為字(塊)識(shí)別為:進(jìn)行活字(塊)Vbc、時(shí)點(diǎn)活字(塊)Vbp,即,Wd = [Vd(Vnr, Vne), Vc (Vci, Vcb), Vb (Vbc, Vbp)]
[0056]關(guān)系字(塊)識(shí)別為:變化活字(塊)Vrc、存在活字(塊)Vre ;形容活字(塊)識(shí)別為:形動(dòng)活字(塊)Vaa、形靜活字(塊)Vas ;S卩,Ws = [Vr (Vrc, Vre),Va (Vaa, Vas)]
[0057]能愿字(塊)Vm識(shí)別為愿望活字Vmw(將、愿、愿意、會(huì)等)、能力活字Vma(能、能夠、會(huì)等);助動(dòng)字(塊)Vh識(shí)別為:情助字Vhe (要、應(yīng)、肯、敢等),時(shí)助字Vht,包括:前助字Vhtf (將、已經(jīng)、正在)、后助字Vhtb (過、著、了 ),形助字Vhf (上、下、去、來等),
[0058]即,Wm= [Vm (Vmw, Vma), Vh (Vhe, Vht, Vhf)]
[0059]4.2.1.5.在這個(gè)活性系統(tǒng)中,聯(lián)態(tài)字(塊)識(shí)別為聯(lián)詞活字和聯(lián)句活字。聯(lián)詞活字Cp識(shí)別為
[0060]1.直聯(lián)活字Cpd,包括(I)聯(lián)結(jié)字Cpdj (的、地、得);
[0061](2)聯(lián)接字 Cpdc:和(+)、即( = )、或(/)、與(>=)(及、同)、跟 <=;
[0062]2.間聯(lián)活字Cpi⑴客體活Cpio:把(將)n+V:把他打了⑵主體活Cpis:讓n+V,讓他打了。
[0063]3介聯(lián)活字Cpp:識(shí)別為動(dòng)前介Cppf、前后介Cppb。
[0064]聯(lián)句活字Ce識(shí)別為1.單句聯(lián)字Ccs包括⑴疑問字Ccsq:普通CcsQ:嗎、呢、否;
[0065]特珠CcSq:誰、哪、何、什么、怎么;
[0066]選擇CcSQ:是否、要不、是...還是(呢)、或者;
[0067](2)祈使字 Ccso (order):V+ 吧;(3)感嘆字 Ccse:多么;
[0068](4)比較字Ccsc:比;(5)強(qiáng)調(diào)字Ccss:是...的:(6)反詰字Ccsa:難道。
[0069]2.復(fù)句聯(lián)字Ccc包括(I)定同字Ccco (of):的
[0070](2)并列字Cccp:和、又、還、并且。
[0071](3)選轉(zhuǎn)字Ccct:或者、但是、可是、然而、因?yàn)?、所以、不僅...而且
[0072](4)從屬字Cccs:SP、也就是。
[0073](5)假設(shè)字Cccc:如果、只要、只有、除非等。
[0074]即,Wcc= [Cp [Cpd (Cpdj , Cpdc) , Cpi (Cpis, Cpio) , Cpp (Cppf, Cppb)],Ce[Ccs(Ccsq, Ccso, Ccse, Ccsc, Cess), Ccc(Ccco, Cccp,Ccct,Cccs, Cccc)]]
[0075]4.2.1.6.在這個(gè)活性系統(tǒng)中,生態(tài)字(塊)N識(shí)別為1.生物活字(塊)Nb包括(I)人物Nbh、(2)機(jī)團(tuán)Nbg、(3)腦動(dòng)物Nbb、(4)野動(dòng)物Nbw, (5)動(dòng)物Nba, (6)小動(dòng)物Nbs, (7)微生物 Nbm> (8)植物 Nbp0 即,Nb = [Nbh, Nbg, Nbb, Nbw, Nba, Nbs, Nbm, Nbp]
[0076]2.機(jī)動(dòng)活字(塊)Nm包括:⑴互動(dòng)機(jī)Nm1、⑵自動(dòng)機(jī)Nma、(3)操動(dòng)機(jī)Nmo。
[0077]即,Nm=[Nmi, Nma, Nmo]
[0078]3.自然活字(塊)Nn包括:(I)自然物Nnm⑵自然態(tài)Nns云、空氣、水,S卩,Nn =[Nnm, Nns]
[0079]4.動(dòng)名活字(塊)Nv包括:⑴活動(dòng)名Nva、⑵靜動(dòng)名Nvs,S卩,Nv = [Nva, Nvs]
[0080]4.2.1.7.在這個(gè)活性系統(tǒng)中,按輔助有性質(zhì)字(塊)的特征方式,識(shí)別無性質(zhì)/特征字(塊)非活字(塊)的語義歸集。非活字(塊)F識(shí)別為輔助活字(塊)語義表達(dá)的字(塊),包括能靜字(塊)Fs、指代字Fp、數(shù)量字Fn、狀態(tài)字Ad(形狀A(yù)dx、副狀A(yù)dv)、標(biāo)符字Fm。
[0081]1.能靜字(塊)識(shí)別為:靜物體Fsn、抽象體Fss
[0082]靜物體識(shí)別為:天然物Fsnn、合成物Fsnc、制成物Fsnm、工具Fsnt、用具Fsnu、玩具 Fsnp、食物 Fsnf、即,F(xiàn)sn= [Fsnn, Fsnc, Fsnm, Fsnt, Fsnu, Fsnp, Fsnf]
[0083]抽象體分識(shí)別為:抽象物Fsso、抽象態(tài)Fssf、想象物Fssi即,F(xiàn)ss = [Fsso, Fssf,Fssi]
[0084]2.指代字(塊)識(shí)別為:(I)物稱代Fpo:事物A確定Fpod(代η):它、它們;Β不定Fpoi (代a):誰、什么、怎樣、一些、任何(2)特稱代Fps:近稱Fpsn這、這個(gè);遠(yuǎn)稱Fpsf那個(gè)、那、那里(3)疑問代Fpw:什么、哪、怎樣(4)不定代Fp1:A肯定Fpip:每個(gè)、一些、全部B否定Fpin。
[0085]BP, Fp =[即 ο (Fpod, Fpoi),F(xiàn)ps, Fpw, Fpi (Fpip, Fpin)]
[0086]3.數(shù)量字(塊)Fn識(shí)別為:(I)數(shù)字(塊)Fnn、(2)量字(塊)Fnm,Α.名量字Fnmn(單位量:個(gè)、只,度量字:尺、米),B.動(dòng)量字Fnmv(次、回、局)。BP, Fn = [Fnn,Fnm(Fnmn, Fnmv)]
[0087]4.狀態(tài)字(塊)Ad識(shí)別為:(1)形狀字Adx,⑵副狀字Adv:時(shí)間Adt、空間Ads、方式Adm (勤奮、認(rèn)真)、頻率Adf,程度Add (相對(duì)程度Addr、絕對(duì)程度Adda) / (高度Addh、中度 Addm、低度 Addl),即,Ad = [Adx, Adv (Adt, Ads, Adm, Adf, Add)]。
[0088]5.標(biāo)符字Fm識(shí)別為:(I)標(biāo)點(diǎn)Fmp (逗號(hào)Fmpc,句號(hào)Fmpd,分號(hào)Fmps,冒號(hào)Fmpm,問號(hào)Fmpq,感嘆號(hào)Fmpe,破折號(hào)Fmpd,撇號(hào)Fmpa,等),(2)計(jì)算號(hào)Fmc (加號(hào)Fmcp,減號(hào)Fmcm,乘號(hào)Fmct,除號(hào)Fmcd,等號(hào)Fmce,大于號(hào)Fmcb,小于號(hào)Fmcs,等),(3)符號(hào)Fms (斜號(hào)Fmsv,平行號(hào)Fmsp,連字符Fmsh,省略符Fmse,前括號(hào)Fmsf,后括號(hào)Fmsb,前引號(hào)Fmsq,后引號(hào) Fmsw,星號(hào) Fmss,等)等。即,F(xiàn)m = (Fmp, Fmc, Fms)。
[0089]4.2.1.8.在這個(gè)活性系統(tǒng)中,識(shí)別語義的內(nèi)概念自然義kn,具有反映理化活性特征的意義,識(shí)別為:
[0090]1.本義knp:活性特征為狹義客觀事物或事態(tài)。如:樹n/v,吃V,吃蘋果
[0091]2.實(shí)義kno:活性特征為廣義客觀事態(tài)。如:樹林n,樹立V,吃酒席、吃食堂社會(huì)義ks,具有反映人文活性特征的意義,識(shí)別為:
[0092]3.引義ksb:活性特征為狹義抽象概念或形態(tài),如:英雄樹,V樹敵,吃大鍋飯
[0093]4.虛義ksc:活性特征為廣義抽象概念或形態(tài)。如:搖錢樹V.樹新風(fēng);吃香、吃虧、吃得開認(rèn)知義kr,具有反映思維活性特征的意義,識(shí)別為:
[0094]5.理義krr:活性特征為狹義主觀理念。如:決策樹,樹形圖,樹慨念,吃歪
[0095]6.情義kre:活性特征為廣義主觀情態(tài)。如:常青樹,樹障礙,吃醋。
[0096]BP, Sk = [kn (knp, kno), ks (ksb, ksc), kr (krr, kre)]
[0097]識(shí)別語義的外概念:事物義Sm,事態(tài)義Sa,事件義Se,有以下型態(tài):
[0098](I)整事件Sew型態(tài):SV0 (2)部事件S印型態(tài):SV/V0/0V/VaS型紅了你。
[0099](3)復(fù)事態(tài)Sac型態(tài):(事件E+的)+n/V (4)簡事態(tài)Sas型態(tài):n+nl (含有Nd),η十V (ns)。(5)合事物Smc:合能動(dòng)事物Smca型態(tài):事態(tài)A的+η勞動(dòng)的群眾,n+nl勞動(dòng)人民,a+n困難戶;合能靜事物Smcs型態(tài):ns+nsl房里的書。
[0100](6)單事物Sms:單能動(dòng)事物Smsa ;單能靜事物Smsm。
[0101]即,Ss= [Se (Sew, Sep),Sa (Sac, Sas),Sm(Smc,Sms)]。
[0102]4.2.1.9.在這個(gè)活性系統(tǒng)中,識(shí)別語義的外形式活性特征:無聯(lián)式No、字聯(lián)式Wo、短語式 Ph、子句式 Cl ;即,Sf = [Ph, Cl, Wo, No]
[0103]識(shí)別語義的內(nèi)形式活性特征模式:
[0104](I)主活式 Ms:標(biāo)式 Ms = SVO 他吃飯。Msl = SV 他睡了 ;Msll = VO 開門;Msl2=V走開。變式M2 = SVOo她叫他老公。
[0105](S = Nb 生態(tài)字,V = Vd 動(dòng)態(tài)字,O = N, ο = NI)
[0106](2)被活式Mp:標(biāo)式Mp = SPvN Vt她被他打了。簡式Mpl = SPvVt她被打了。
[0107][S = NI, Pv =(被 / 讓 / 挨 / 招 / 遭)]
[0108](3)賓活式Mo:標(biāo)式Mo = OSVt,這孩子我喜歡。簡式Mol = OVb,飯吃了。
[0109]變式M02 = SOVb,他飯吃了。(S = Nb,O = N)
[0110](4)形活式Ma:標(biāo)式Ma = SVa他高興。
[0111]變式Ma2 = VaR(了)S,美了你,高興死了(S = N)
[0112](5)系活式Mr:標(biāo)式Mr = SVrO他是學(xué)生。簡式Mrl = SVr他是。Mrll = VrO是北京。
[0113]變式Mr2 = OVr 汽車是。(S = N,O = NI)
[0114](6)在活式Me:標(biāo)式Me = SE(在…里)N,他在店里。簡式Mel = SEl:他在。
[0115]變式Me2 = E(在…里)NS:在房里他[S = NI,E =(在…里)]
[0116](7)使活式Mm:標(biāo)式Mm = SMv (使)NV,他使她生氣。
[0117]簡式Mml = Mv2 (讓)NV,讓他知道;Mv3 (把)NVi把他罵了。
[0118][S = N,Mv= (Mvl 使、Mv2 讓、Mv3 把)]
[0119](8)非活式Mn:標(biāo)式Mn = NI, N(且NI e N),魯迅,紹興人。這臺(tái)子,木家俱。
[0120]gp, Sm = [Ms (SVO, SV, V0),Mp (SPvVt, SPvNVt),Mo (OVb, SOVb, OSVt),Ma (SVa,VaS),Mr(SVrO, SVr, VrO, OVr),Me(SEvNL, EvNLS),Mm(MrNVt, LvNVt, GvNVi, MvNVNl),Mb (NlN)]
[0121]4.2.2.活性分析技術(shù)操作方法及活性算法
[0122]自然語言語義識(shí)別是自然語言理解和處理的基礎(chǔ)。語義識(shí)別的基本操作是語句的切分,按照活性將語句切分為不同的活字(塊)與非活字(塊);語義理解的基本操作是字塊的聯(lián)結(jié), 根據(jù)活性將不同的字(塊)聯(lián)結(jié)成語義確定的語義塊。
[0123]切分是字義的組合的技術(shù)方法,聯(lián)結(jié)是語義的組合的技術(shù)方法。語句的切分和聯(lián)結(jié)在活性系統(tǒng)中進(jìn)行線性分析處理,有切、分、聯(lián)、結(jié)四個(gè)基本操作方法。
[0124]4.2.2.1語句的切分:根據(jù)活性強(qiáng)弱,用切和分的方法將語句識(shí)別成為有意義的字和字塊(詞),即分詞,從而消除歧義WSD(Word Semantics Ambiguation)。一般來說,語句的切分有二種:交叉切分J (Segment J)和組合切分Z (Segment Z),交叉切分簡稱為切Cut,被切的交叉字稱為切字Wc ;被切的點(diǎn)稱為切點(diǎn)Pc,切點(diǎn)在切字前或切字后;組合切分簡稱為分Divide,分點(diǎn)Dp在字塊中間。
[0125]切(Cut):處理交叉歧義,在二個(gè)交叉連接的字塊中排除一個(gè)字塊。例如:”人群眾”,”群”就是一個(gè)交叉切字;
[0126]分(Divide):處理組合歧義,將二個(gè)組合連接的字塊分開。例如:”工人/群眾”。
[0127]4.2.2.2.字塊的聯(lián)結(jié):根據(jù)活性,用聯(lián)和結(jié)的方法將字和字塊(詞)識(shí)別成含有確定語義的語塊Chunk。聯(lián)(Link):處理相鄰二個(gè)字塊活性的一般語義關(guān)聯(lián)。例如:”咬死/獵人”,在聯(lián)處理中涉及一個(gè)聯(lián)結(jié)點(diǎn)D(Dot)。
[0128]結(jié)(Joint):處理相連二個(gè)以上字(字塊)活性的綜合語義關(guān)聯(lián)。例如:”咬死獵人/的/狼狗”。在結(jié)處理中涉及二個(gè)聯(lián)結(jié)點(diǎn)。
[0129]字塊的聯(lián)結(jié)處理,一般有聯(lián)處埋操作和結(jié)處理操作?;钭?塊)的聯(lián)和結(jié)的處理,主要是字(塊)的前聯(lián)結(jié)和后聯(lián)結(jié)的匹配,涉及三個(gè)方面:外延聯(lián)結(jié)(側(cè)重形式)、內(nèi)涵聯(lián)結(jié)(側(cè)重概念)、狀態(tài)聯(lián)結(jié)。
[0130]外延聯(lián)結(jié)指聯(lián)結(jié)的語法形式:是關(guān)于字詞、短語、子句的聯(lián)結(jié);內(nèi)涵聯(lián)結(jié)是指語義關(guān)聯(lián):是關(guān)于事物、事態(tài)、事件的語義的邏輯關(guān)聯(lián);狀態(tài)聯(lián)結(jié)是指聯(lián)結(jié)的語用狀況,是關(guān)于語句構(gòu)式:肯定否定、疑問反詰、感嘆強(qiáng)調(diào)、祈使虛擬、單句復(fù)句等的表達(dá)效用。
[0131]前聯(lián)結(jié)、后聯(lián)結(jié)分別處理在活字塊的前面、后面能夠聯(lián)結(jié)什么性質(zhì)和形態(tài)的字塊,活性聯(lián)結(jié)方法(算法)是字(塊)的語義匹配的形式處理方法,主要處理形態(tài)不同的字塊聯(lián)結(jié),既要符合外延聯(lián)結(jié),又要遵與內(nèi)涵聯(lián)結(jié),還要兼顧語言效用。
[0132]4.2.2.3.字塊的聯(lián)結(jié)值
[0133]活性是語言的特征核心,是活字(塊)內(nèi)涵活躍的程度與外延聯(lián)系的強(qiáng)度。活性主要反映在活字(塊)上,活字(塊)的聯(lián)結(jié)是活性的主要表現(xiàn)形式。聯(lián)結(jié)用活字(塊)的聯(lián)結(jié)值L來表示?;钭?塊)的聯(lián)結(jié)值表示活字活性的強(qiáng)弱差異等級(jí),是語義分析的活性識(shí)別值,聯(lián)結(jié)值由前聯(lián)值Lf與后聯(lián)值Lb組成。
[0134]語義的基本表達(dá)方式為慨念與形式?;钭?塊)的前、后聯(lián)值由內(nèi)外概念值與形式值來識(shí)別表示。語義的內(nèi)概念值是指在同類概念N、V中字(塊)的活性等級(jí)值,簡稱字級(jí)X,由0-9表示;
[0135]外概念值是指慨念形態(tài)的活性等級(jí)值(非事、事物、事態(tài)、事件),簡稱事級(jí)I,由0-6表不;
[0136]外形式值是指能否連接單字、短語、子句,表現(xiàn)語義形式的活性等級(jí)值,簡稱形級(jí)P,由0、1、2、3表示,其中O表示無形式值。N0、W1、P2、C3
[0137]內(nèi)形式值是指語義模式的活性形式值,簡稱模級(jí)q,由1-8表示。
[0138]使活式8、系活式7、在活式6、被活式5、賓活式4、主活式3、形活式2、非活式I
[0139]字塊的聯(lián)結(jié)值活性算法結(jié)構(gòu)如下:
[0140][形級(jí)/模級(jí)+N+字級(jí)/事級(jí)]十[字級(jí)/事級(jí)+V+形級(jí)/模級(jí)]十[形級(jí)/模級(jí)+N+字級(jí)/事級(jí)]
[0141]其中,動(dòng)態(tài)字(塊)V,有二個(gè)前聯(lián)值Lf =字級(jí)X、事級(jí)y,有二個(gè)后聯(lián)值Lb =形級(jí)P、模級(jí)q
[0142]即,聯(lián)結(jié)值Lv = xy:V:pq,記為:Vxypq
[0143]生態(tài)字(塊)N,Ln = pq:N:xy,記為:Npqxy
[0144]聯(lián)態(tài)字(塊)C, Lc = xy:C:xy,記為:Cxy。例如:的、和
[0145]識(shí)別動(dòng)態(tài)字中思維字、復(fù)合字、行為字的所屬字集的活性強(qiáng)弱表現(xiàn)等級(jí)(字級(jí))標(biāo)注:
[0146]6理性活字(塊)Vnr、5感性活字(塊)Vne、4智力活字(塊)Vc1、3腦體活字(塊)Vcb、2進(jìn)行活字(塊)Vbc、I時(shí)點(diǎn)活字(塊)Vbp ;
[0147]識(shí)別靜態(tài)字中關(guān)系字、形動(dòng)字的所屬字集活性強(qiáng)弱表現(xiàn)等級(jí)(字級(jí))標(biāo)注:
[0148]4變化活字(塊)Vrc、3存在活字(塊)Vre、;2形動(dòng)活字(塊)Vaa、I形靜活字(塊)Vas ;
[0149]識(shí)別情態(tài)字中能愿字、助動(dòng)字的所屬字集活性強(qiáng)弱表現(xiàn)等級(jí)(字級(jí))標(biāo)注:
[0150]6愿望活字Vmw、5能力活字Vma、4.情助字Vhe、3時(shí)助字Vht、2后時(shí)助字Vhtb、I形助字Vhf。
[0151]識(shí)別生態(tài)字中生物體、機(jī)動(dòng)體、植物、動(dòng)名體的所屬字集活性強(qiáng)弱表現(xiàn)等級(jí)(字級(jí))標(biāo)注:
[0152]人物9,社團(tuán)8,腦動(dòng)物7,野動(dòng)物6,動(dòng)物5,互動(dòng)機(jī)4,自動(dòng)機(jī)3,操動(dòng)機(jī)2,植物I,自然物O在字級(jí)中,還可識(shí)別若干義級(jí)(Ws)
[0153]在”人物”字(塊)表中,識(shí)別義級(jí)歷時(shí)概念:
[0154]老年8,中年7,壯年6,青年5,少年4,兒童3,幼兒2,嬰兒I義級(jí)共時(shí)慨念:如,稱謂(輩份)I爺爺2奶奶3叔叔4姑姑5爸爸6媽媽7兒子8女兒稱代(單數(shù))你、我、他、她、它、誰。(復(fù)數(shù))你們、我們、他們、它們,咱們,誰。
[0155]義級(jí)歷時(shí)形式,如,吃:1張口、2進(jìn)食、3咀嚼、4下咽。
[0156]義級(jí)共時(shí)形式,如,吃:喝、玩、樂、聽、看、思。
[0157]在字級(jí)的義級(jí)(Ws)中,還可識(shí)別若干子義級(jí)(Wss)
[0158]子義級(jí)的慨念和形式,識(shí)別自然義,社會(huì)義,認(rèn)知義的子義。
[0159]識(shí)別同域慨念,如:北京,燕京,北平;異域慨念,如,桔,橘,柑桔。
[0160]同域形式,如,(歷時(shí))進(jìn)食:伸手,接食,送食、咬食、閉嘴。
[0161](共時(shí))唱歌:音樂,人聲,音響,燈光,歡笑。
[0162]異域形式,如,婚禮:A中式禮,B西式禮
[0163]識(shí)別聯(lián)態(tài)字中聯(lián)詞字的所屬字集活性強(qiáng)弱表現(xiàn)等級(jí)(字級(jí))標(biāo)注(略)
[0164]動(dòng)態(tài)字(塊)、生態(tài)字(塊)的聯(lián)結(jié)
[0165]事級(jí)vy、ny:整事件6,部事件5,復(fù)事態(tài)4,簡事態(tài)3,合事物2,單事物1,非事物O。
[0166]形級(jí)ρ:C13,Ph2,Wol,NoO。
[0167]模級(jí)q:使活式8、系活式7、在活式6、賓活式5、被活式4、主活式3、形活式2、非活式I O
[0168]例如Vn,...動(dòng)態(tài)V的聯(lián)結(jié)值Lv為:xyVpq = Vxypq
[0169]...理性Vnr (希望6245)、感性Vne (感到5244)、智力Vci (管理4125)、腦體Vcb (經(jīng)營3115)、進(jìn)行Vbc (練習(xí)2113)、(勞動(dòng)2103)、時(shí)點(diǎn)Vbp (完成1116)。
[0170]例如Nb,...生態(tài)N的聯(lián)結(jié)值Ln = Npqxy
[0171]...人物1492,社團(tuán)1482,腦動(dòng)物1472,野動(dòng)物1462,動(dòng)物1452,互動(dòng)機(jī)1341,自動(dòng)機(jī)1331,操動(dòng)機(jī)1221,植物1211,自然物1201
[0172]聯(lián)詞Cp字級(jí):聯(lián)結(jié)5 (的),聯(lián)接4 (和),主體3 (把),客體2 (讓),介聯(lián)I (為、和)[0173]聯(lián)句Ce字級(jí):強(qiáng)調(diào)6(是),疑問5(嗎、什么、是否),反詰4(難道),祈使3(吧),比較2 (比),感嘆I (吧)。
[0174]復(fù)句Ccc字級(jí):定同6,假設(shè)5,從屬4,聯(lián)合3,轉(zhuǎn)折2,并列I。
[0175]靜態(tài)Vs的字級(jí):是Vu5,在Ve4,成為Vc3,Va2(形動(dòng)式:高興),Vasl (形靜式:好)
[0176]4.2.2.4活字(塊)的聯(lián)結(jié)處理分析計(jì)算,主要基于聯(lián)結(jié)度Ld,即字(塊)之間活性綜合匹配程度,是識(shí)別字(塊)前聯(lián)或后聯(lián)的基本依據(jù)。聯(lián)結(jié)度用L值來表示,有活字的前聯(lián)結(jié)值Lf、后聯(lián)結(jié)值Lb,有單一計(jì)算識(shí)別和復(fù)合計(jì)算識(shí)別二種活性算法。
[0177]單一計(jì)算識(shí)別:主要按字級(jí)來比較活性的簡單計(jì)算識(shí)別L值的大小,涉及動(dòng)態(tài)、生態(tài)的同態(tài)活字(塊)間的匹配;
[0178]復(fù)合計(jì)算識(shí)別 :采用按字級(jí)、事級(jí)、形級(jí)、模級(jí)來比較活性的復(fù)合計(jì)算識(shí)別L值的大小,涉及異態(tài)(不同態(tài))活字(塊)間的匹配。
[0179]同態(tài)單一識(shí)別
[0180]1.動(dòng)態(tài)V的單一計(jì)算V1+V2,例1:張進(jìn)希望眼欲穿。
[0181]算法⑴Seg:張η進(jìn)Vl希望ν2眼欲穿J。其中,希望眼欲穿J,為交叉歧義,”望”為切字。
[0182](2)...進(jìn)vb〈希望Vn =望眼欲穿vn,希望vnWo〈望眼欲穿vnPh (詞〈成語)
[0183]望”為后聯(lián)結(jié)J =希/望+眼欲穿
[0184](3)望眼欲穿Vn =謂活字V (謂語活字)
[0185](4)...希! =Vm! = ad,...希:前聯(lián),進(jìn):轉(zhuǎn)態(tài),進(jìn)+希=η =名,...張+進(jìn)希=姓+ 名=Nb
[0186](5)...Nb = S(主活字),主活式簡式:SV,張進(jìn)希S望眼欲穿V。
[0187]2.生態(tài)N的單一計(jì)算N1+N2,例2:王豺狼子野心。
[0188]算法(I) Seg:王nbh豺狼nba子野心J。豺狼子野心J,為交叉歧義,”狼"為切字。
[0189](2)...王nbh >財(cái)狼nba,...財(cái)狼必須轉(zhuǎn)態(tài)...拆分;
[0190](3)...(豺+狼)nba〈(狼+子野心)va,.’."狼"為后聯(lián)結(jié),J =豺/狼+子野心
[0191](4)狼子野心=V謂活字
[0192](5)又...豺! =Vm! = ad...王 + 豺=Nbh 為主活字 S
[0193](6)...主活式簡式:SVa,王豺S狼子野心Va。
[0194]動(dòng)態(tài)、生態(tài)混合單一計(jì)算
[0195]例3,王豺狼子野心想當(dāng)領(lǐng)導(dǎo)。
[0196]算法⑴Seg:王nbh財(cái)狼nba子野心Jl想J2當(dāng)vr領(lǐng)導(dǎo)η。
[0197]其中,豺狼nba子野心J1,為交叉歧義,”狼"為切字;心想J2,為交叉歧義,心為切字。
[0198](2) Jl...王nbh >財(cái)狼nba,...財(cái)狼必須轉(zhuǎn)態(tài)(拆分);
[0199]...(豺+狼)nba〈(狼+子野心)va,..."狼"為后聯(lián),J =豺/狼+子野心Va
[0200](3) J2 V心、想拆分,J2 =心/想...想vn >狼子野心va,...想=謂活字Vn,
[0201]...Vn前的"狼子野心"Va轉(zhuǎn)態(tài)為adv ;
[0202](4)又...!#! =Vm! = ad...王 + 財(cái)=Nbh =主活字 S,當(dāng) Vv =子謂字 + 領(lǐng)導(dǎo)=O
[0203](5)...主活式,SVO:王財(cái)S狼子野心adv想Vn (當(dāng)vr領(lǐng)導(dǎo)nn) O。
[0204]3.情態(tài)Vm的計(jì)算Vml+Vm2,例4:將能量化
[0205]算法(I) SegJfvml能量化J。其中,能量化J =交叉歧義,量為切字,
[0206](2)...量化vc >化vc >量va >能vm >能量η,...量化Vc =謂活字,量為后聯(lián)J=能/量+化
[0207](3)又...將Vmw >能Vma(能愿>能力)將+能+V匹配成立,
[0208](4)...主活簡式,(vm) V:將 Vmw 能 Vma 量化 Vc。
[0209]4.聯(lián)態(tài) C 計(jì)算同態(tài) N1+C+N2、V1+C+V2
[0210]C (和)字的計(jì)算例5,完成和尚未完成任務(wù)的
[0211]算法⑴Seg,完成vc和c尚未J完成vci任務(wù)η的cl (定同字)。
[0212]和尚未J,為交叉歧義,尚為切字;n+的 [0213](2)...完成 vc =完成 vci,且,和 c >和尚 nb > 尚未 ad > 尚 ad =未 ad...和 cpdc=c,尚為后聯(lián),J =和/尚+未
[0214](3)...V+C+V1:完成vc和c尚未ad完成vc任務(wù)η的C。
[0215]例6完成和平等任務(wù)。
[0216]算法(I) Seg,完成vc和c平等J任務(wù)η。其中,和平等J為交叉歧義,平為切字。
[0217](2)...等vb >和平va >平等va >平va >和va,...平為前聯(lián):J =和+平/等
[0218](3)...完成vc !=任務(wù)η,...vc+和+η不成立...和c轉(zhuǎn)態(tài):和平=η
[0219](4)...完成vc >等va,...等必須va轉(zhuǎn)態(tài)成c,
[0220](5)...完成=Vc =謂活字,任務(wù)η = 0,主活簡式V0:完成Vc和平η等c任務(wù)O。C(的)字的計(jì)算
[0221]例7,咬死獵人的狗
[0222]算法⑴Seg分詞:咬死:vb獵人nbh的c狗nba。
[0223](2)標(biāo)注 L 值、結(jié)點(diǎn) d:咬死 vblll6+dl 獵人 nbhl492+d2 的 c41+d3 狗 nbal462
[0224](3) Lx 值計(jì)算 Ld2 = 9-4 = 5, Ld3 = 6-4 = 2,
[0225](4)比較Lx值...Ld2 > Ld3,"的"c前聯(lián)>后聯(lián)...識(shí)別:的C為前聯(lián)
[0226]...獵人的adj/狗,!=獵人/的狗。
[0227](5)...咬死=Vb =謂活字,狗nba = O,主活簡式VO:咬死Vb獵人的adj狗Nba
[0228]例8,咬死老鼠的狗
[0229]算法
[0230](I)Seg 分詞標(biāo)注咬死 vblll6+dl 老鼠 nal452+d2 的 c41+d3 狗 nal462
[0231](2)Lx 值計(jì)算 Ld2 = 5-4 = I, Ld3 = 6-4 = 2,
[0232](3)比較 L 值...Ld2〈Ld3,"的"c 前聯(lián)〈后聯(lián)
[0233]...識(shí)別c為后聯(lián)...老鼠/的狗,!=老鼠的/狗。
[0234](4)...咬死=vb =子活字Vv:(咬死Vv老鼠na)的attr狗N。
[0235]4.3活性分析語義識(shí)別步驟
[0236]本發(fā)明的活性分析語義識(shí)別步驟,基于活性語義分析線性識(shí)別系統(tǒng)。
[0237]4.3.1.步驟一,活字特征標(biāo)注。識(shí)別活字(塊)及活性形態(tài)、非活字(塊)形態(tài)(含標(biāo)符字),語句切分,識(shí)別歧義字塊,J表示交叉歧義,Z表示組合歧義,區(qū)分語句與語塊。
[0238]4.3.2.步驟二,試算轉(zhuǎn)態(tài)消歧。用活性算法轉(zhuǎn)態(tài)處理活字(塊)、非活字塊的字級(jí)、形態(tài),消除歧義。識(shí)別轉(zhuǎn)態(tài)字(塊),活性增強(qiáng)的轉(zhuǎn)態(tài)為上轉(zhuǎn)態(tài),活性降低的轉(zhuǎn)態(tài)為下轉(zhuǎn)態(tài)。處理字塊拆分。
[0239]4.3.3.步驟三,活性比較分析。進(jìn)行字塊活性比較分析,按照字級(jí)、事級(jí)、形級(jí)、模級(jí)的活性特征匹配計(jì)算,初步識(shí)別字(塊)語義關(guān)系。采用默認(rèn)活性識(shí)別法Hx或生態(tài)識(shí)別法Hn、多態(tài)識(shí)別法Hm等活性算法識(shí)別語義特征。
[0240]4.3.4.步驟四,謂主活字識(shí)別。
[0241]4.3.4.1.根據(jù)活性特征算法識(shí)別謂活字(塊)V、子謂活字(塊)Vv。
[0242]4.3.4.2.進(jìn)行謂活字、子謂活字的前聯(lián)結(jié)計(jì)算,初步識(shí)別N:為主體S或客體O ;
[0243]4.3.4.3.后聯(lián)結(jié)計(jì)算,初步識(shí)別N1:為客體O或主體S。
[0244]4.3.5.步驟五,模式匹配識(shí)別,進(jìn)行語義模式匹配計(jì)算,識(shí)別各活字(塊)的語義模式:主活式、被活式、賓活式、形活式、系活式、在活式、使活式、非活式等,楕確識(shí)別標(biāo)式、簡式、變式等模式的語義。
[0245]4.3.6.步驟六,語義結(jié)構(gòu)識(shí)別,進(jìn)行語義結(jié)構(gòu)表達(dá)識(shí)別。包括識(shí)別語句的語用:時(shí)間、空間、狀態(tài)、 方式(肯定否定、陳述疑問、主動(dòng)被動(dòng)、真實(shí)虛擬、簡單復(fù)合主從等)及標(biāo)點(diǎn)符號(hào)等意義表達(dá)。
[0246]5.本發(fā)明有益效果
[0247]5.1建立了一個(gè)漢語活性分析語義識(shí)別系統(tǒng),漢字的語句處理有了基本的語義識(shí)別和理解的系統(tǒng)平臺(tái)、操作步驟和方法,完善或改變了零散敲打、局部處理的規(guī)則分析方法。
[0248]5.2.能夠處理一些語句歧義問題
[0249]例9,"學(xué)生會(huì)主動(dòng)完成任務(wù)"。
[0250]算法(I) Seg,學(xué)生會(huì)Z主動(dòng)ad完成vbp任務(wù)η。學(xué)生會(huì)Z為組合歧義;
[0251](2)版,會(huì)糟>學(xué)生汕 > 學(xué)生會(huì),初步識(shí)別Z =學(xué)生/會(huì)vm;
[0252](3)...會(huì)vm+完成V匹配,且! +" 了"識(shí)別成立,完成vbp =謂活字V,
[0253](4)...學(xué)生=S,任務(wù)=0,主活式SV0:學(xué)生S會(huì)vm主動(dòng)ad完成V任務(wù)O
[0254]例10,"小王說故事很有趣〃
[0255]算法⑴Seg,小王nb說vn故事nn很ad有趣va
[0256](2)說vb >有趣va...初步識(shí)別,說=V謂活字,有趣va =子謂字Vv
[0257](3)...說=V,...小王 nb = S,故事很有趣 Sva = O
[0258](4)...主活式SVO小王S說V(故事很有趣O)。
[0259]例11,”這篇文章你給我看看”
[0260]算法(I) Seg這fpsn篇fmmn文章fsso你nb給vb我nbl看看vn
[0261](2)...看看vn >給vb,...初步識(shí)別vn = V謂字,給,轉(zhuǎn)態(tài)為cp,
[0262](3)這fpsn+給cp匹配;給Cp+我nbl成立,
[0263](4)又...nb > = nbl > fsso,初步識(shí)別 nb = S,
[0264](5)初步識(shí)別fsso = O,貝丨』,這fpsn+篇+文章fsso = η = O,
[0265](6)賓活式OSV:這篇文章O你S給我cp看看Vn[0266]5.3能夠解決處理一些詞匯語義分析形態(tài)性、兼類性、標(biāo)準(zhǔn)性等的問題。
[0267]例12,”這樣的人才能出眾”
[0268]北大計(jì)算語言學(xué)家指出:反映客觀世界的語義系統(tǒng)即使能建立起來,也會(huì)十分龐雜,語境分析更是沒有邊界,很難形式化...象“這樣的人才能出眾”這樣一串漢字可以有如下不同的組合(俞士汶,2011)
[0269]這樣/的/人/才能/出眾(a)
[0270]這樣/的/人才/能/出眾(b)
[0271]這樣/的/人/才/能/出眾(C)
[0272]用本發(fā)明的活性語義分析系統(tǒng)進(jìn)行處理,(a)、(b)、(C)三式,分別符合生態(tài)識(shí)別(自然義)、活性識(shí)別(社會(huì)義)、多態(tài)識(shí)別(認(rèn)知義)三種識(shí)別法處理結(jié)果。
[0273]1.活性識(shí)別法(Hx)計(jì)算分詞絕對(duì)活性處理:
[0274]算法
[0275](I)這樣fpsn的c人才能J出眾va。其中,”人才能” J為交叉歧義,”才”為切字;(2)...能=vmh >人nb >人才fsso >才能fssf >才ad 才為前聯(lián),J =人才/能;
[0276](3)...能vmh+出眾va匹配...出眾=Va謂活字,
[0277](4)人才 fsso = S,形活式 SVa,
[0278](5)即:這樣/的/人才S/能vm/出眾Va
[0279]可見,(5) = (b),為社會(huì)義側(cè)重分詞結(jié)果。
[0280]2.生態(tài)識(shí)別法(Hn)計(jì)算分詞相對(duì)活性處理:
[0281]算法
[0282](6) Seg:這樣fpsn的c人才能J出眾va。其中,”人才能” J為交叉歧義,”才”為切字;
[0283](7)雖然,能 vm >人=nb >人才 fsso >才能 fssf >才 ad,但...Hn 法
[0284]...人nb>能vm,"能"下轉(zhuǎn)態(tài),(才+能)fssf "才"字后聯(lián),J=人/才能
[0285](8)...才能 fsso = S,人 nb = attr,出眾 Va =謂活字,形活式 SVa,
[0286](9)即:(這樣/的/人)attr/才能S/出眾Va
[0287]可見,(9) = (a),為自然義側(cè)重分詞結(jié)果。
[0288]3.多態(tài)識(shí)別法(Hm)計(jì)算分詞活性:
[0289]算法
[0290](10) Seg這樣的c人nb才能J出眾va。其中,人才能J為交叉歧義,”才”為切字;
[0291](11)...Hm 法,人=nb,才=adv,能=vm,且 adv+vm 與 va 匹配,...人 /才 / 能,排
除切字。
[0292](12)...出眾Va =謂活字,人nb = S,形活式SVa,
[0293](13)即:這樣的c人S/才adv/能vm/出眾Va。
[0294]可見,(13) = (C),為認(rèn)知義側(cè)重分詞結(jié)果。
[0295]5.4.能夠進(jìn)行漢語句法語義分析,綜合計(jì)算比較語義
[0296]利用聯(lián)結(jié)的處理方法,能夠識(shí)別處理多態(tài)語句分析。
[0297]例13,”他拋下工作和妹妹出去玩。”
[0298]算法[0299](I) Seg,他 nb+dl 拋下 vbp+d2 工作 vbc+d3 和 c+d4 妹妹 nb+d5 出去 vbl+d6 玩 vb2。d為結(jié)點(diǎn),工作和妹妹Z為組合歧義
[0300](2)...拋下vbp+工作vbc形態(tài)不匹配,又,"拋下"無轉(zhuǎn)態(tài),..."工作"轉(zhuǎn)態(tài)=nv, pq = 01
[0301](3)Z 處理:聯(lián)結(jié)值 d2(v+n), Lpq = (1-0)/ (3-1) = 1/2,
[0302]聯(lián)結(jié)度d2 = (1+2)/2 = 3/2
[0303]d3 (n+c), Lxy = (2-4) / (4-1) = -2/3, d3 = (-2+3)/2 = 1/2
[0304]d4 (c+n), Lxy = (9-4) / (1-1) = 5/0, d4 = (5+0)/2 = 5/2
[0305](4)...d2 > d3..."工作"為前聯(lián) Lf ;又...d4 > d3..."和”為后聯(lián) Lb,...d3 為分點(diǎn)Dp,"和”下轉(zhuǎn)態(tài)為cpp,Z =工作/和+妹妹;
[0306](5)...他Nb = S,拋下=Vb謂活字,工作=0,vbl =子謂字Vv,vb2下轉(zhuǎn)態(tài)=ad ;
[0307](6)主活標(biāo)式SV0+C: S卩,他S拋下V工作O (和C妹妹nb出去V玩ad)。
[0308]標(biāo)符字的語義識(shí)別計(jì)算:
[0309]例14.完成和尚未完成的任務(wù),(C逗號(hào));完成和尚未完成的任務(wù)。(D句號(hào))
[0310](C逗號(hào))的算法:
[0311](l)Seg,完成vc和c尚未ad完成vci的cl任務(wù)n,和尚未J,為交叉歧義,尚為切字;v+的,逗號(hào)Fmpc ;
[0312](2)...和c >和尚nb >尚未ad >尚ad =未ad 和C,尚為后聯(lián),J =和/尚+未;
[0313](3)...完成 vc =完成 vci,...v+c+v 匹配,且 ad+vcl 成立:尚未 ad 完成 vci,
[0314](4)...逗號(hào)...完成 vc+c+vcl = Vv 子謂字,任務(wù)=N ;
[0315](5)子主活簡式Vv十c十N:
[0316]BP,(完成和c尚未完成)的attr任務(wù)N,
[0317](D句號(hào))的算法
[0318](l)Seg,完成vc和c尚未J完成vci的cl任務(wù)η。
[0319]和尚未J,為交叉歧義,尚為切字;ν+的,句號(hào)Fmpd。
[0320](2)...句號(hào)V優(yōu)先...試定vc/vcl = V,且,完成vc =完成vci
[0321]...初步識(shí)別 vc = V, vci = Vv
[0322](3)...V+的,和 c >和尚 nb > 尚未 ad >尚 ad =未 ad
[0323]...和c轉(zhuǎn)態(tài),(和+尚)=nb,尚為前聯(lián),J =和+尚/未;
[0324](4)...nb+ad+v匹配...完成vc = V謂活字,vci = V子謂字,和尚nb = s,任務(wù)=
O
[0325](5)主活簡式VO:S卩,完成V(和尚s未ad完成V的c任務(wù)O)。
[0326]上述例子或字例,并非用于限定本發(fā)明的保護(hù)范圍,僅為本發(fā)明的示意例實(shí)施例,其計(jì)算或步驟并非準(zhǔn)確唯一,還有其它的算法或步驟。凡在本發(fā)明的系統(tǒng)、方法和步驟的精神和原則內(nèi),所作的任何修改、等同替換、改進(jìn)擴(kuò)展、壓縮提煉等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
[0327]在本發(fā)明活性語義分析識(shí)別處理系統(tǒng)中,活字(塊)的識(shí)別標(biāo)注可以利用開放平臺(tái)等資源,借助漢語信息詞典,包括成語等,補(bǔ)充轉(zhuǎn)換標(biāo)注,整合利用語言資源。[0328]本發(fā)明漢語語義活性識(shí)別法,有一定的通用性,兼顧了詞匯語句處理的兼類性、歧義性、主觀性、移植性等問題;其語義分析識(shí)別方法在原則上系統(tǒng)一致,有基本分析步驟,運(yùn)用計(jì)算機(jī)活性算法分析,是一個(gè)可以實(shí)際操作的漢語語義識(shí)別信息處理新方法。
[0329]綜上發(fā)明所述,語言是有活性的;活性是有差異的;活性的差異是可以分析計(jì)算
的;計(jì)算的系統(tǒng)就是語義活性識(shí)別系統(tǒng)。這就是本發(fā)明技術(shù)方案的內(nèi)容總結(jié)---漢語語
義活 性識(shí)別法。
【權(quán)利要求】
1.一種漢語語義識(shí)別方法,其特征在于,以識(shí)別反映語言性質(zhì)的特征字(活字塊)為手段,以語言活性為量標(biāo)特征,運(yùn)用活性算法,對(duì)語言客體統(tǒng)一進(jìn)行線性系統(tǒng)分析信息處理,識(shí)別語義。即,識(shí)別活字(塊)=W,W = [ffn, Wn+1,...ffn+m],且 Wn > Wn+1 ;
Wn = [Wnp, Wnp+1,...ffnp+q],且 Wnp > Wnp+1 ;
Wnp = [ffnpx, ffnpx+1,...ffnpx+y],且 Wnpx > ffnpx+1 ; Wnpx =......這個(gè)識(shí)別系統(tǒng)包括:將漢字(Word)識(shí)別為二類,有該性質(zhì)/特征類(活字)與無該性質(zhì)/特征類(非活字),即,有性質(zhì)/特征類>無性質(zhì)/特征類;將含有二類字的字串識(shí)別為有性質(zhì)字塊(活字塊)與無性質(zhì)字塊(非活字塊)。(" >"為大于號(hào)) 識(shí)別有性質(zhì)字(塊)按該語義性質(zhì)表現(xiàn)的強(qiáng)弱差異,識(shí)別為若干不同的性質(zhì)形態(tài),使性質(zhì)相似的字(塊)在相同的形態(tài)內(nèi),且,強(qiáng)形態(tài)字(塊)>弱形態(tài)字(塊),即,動(dòng)態(tài)活字(塊)>靜態(tài)活字(塊)>情態(tài)活字(塊)>聯(lián)態(tài)活字(塊)>生態(tài)活字(塊)>非態(tài)字(塊)。 識(shí)別字(塊)在各形態(tài)內(nèi)語義性質(zhì)的一般差異,識(shí)別為若干等級(jí)的字(塊)集。即, 動(dòng)態(tài)字(塊)Vd識(shí)別為思維活字(塊)Vn、復(fù)合活字(塊)Vc、行為活字(塊)Vb ; 靜態(tài)字(塊)Vs識(shí)別為關(guān)系活字(塊)Vr、形容活字(塊)Va; 情態(tài)字(塊)Vm識(shí)別為能愿活字(塊)Vw、助動(dòng)活字(塊)Vh ; 聯(lián)態(tài)字(塊)C識(shí)別為聯(lián)詞活字(塊)Cp、聯(lián)句活字Ce (塊); 生態(tài)字(塊)N識(shí)別為生物體活字(塊)Nb、機(jī)動(dòng)體活字(塊)Nm、自然體活字(塊)Nn、動(dòng)名體活字(塊)Nv ; 識(shí)別字(塊)集內(nèi)語義性質(zhì)的微量差異,識(shí)別為若干子字集。即,思維字(塊)集識(shí)別為理性活字(塊)Vnr、感性活字(塊)Vne ;復(fù)合字(塊)集識(shí)別為:智力活字(塊)Vc1、腦體活字(塊)Vcb ;行為字(塊)集識(shí)別為:進(jìn)行活字(塊)Vbc、時(shí)點(diǎn)活字(塊)Vbp ; 關(guān)系字(塊)集識(shí)別為:變化活字(塊)Vrc、存在活字(塊)Vre ;形容字(塊)集識(shí)別為:形動(dòng)活字(塊)Vaa、形靜活字(塊)Vas ; 能愿字(塊)集識(shí)別為:愿望活字(塊)Vmw、能力活字(塊)Vma ; 助動(dòng)字(塊)集識(shí)別為:情助活字(塊)Vhe、時(shí)助活字(塊)Vht ;形助活字(塊)Vhh ; 聯(lián)詞字(塊)集識(shí)別為:直聯(lián)活字(塊)Cpd、間聯(lián)活字(塊)Cp1、介聯(lián)活字(塊)Cpp ; 聯(lián)句字(塊)集識(shí)別為:單句聯(lián)字(塊)Ccs、復(fù)句聯(lián)字(塊)Ccc; 生物字(塊)集識(shí)別為:⑴人物Nbh、⑵機(jī)團(tuán)Nbg、(3)腦動(dòng)物Nbb、(4)野動(dòng)物Nbw、(5)動(dòng)物Nba, (6)小動(dòng)物Nbs、(7)微生物Nbm, (8)植物Nbp ; 機(jī)動(dòng)字(塊)集識(shí)別為:(1)互動(dòng)機(jī)Nm1、⑵自動(dòng)機(jī)Nma、(3)操動(dòng)機(jī)Nmo ; 自然字(塊)集識(shí)別為:(I)自然物Nnm⑵自然態(tài)Nns; 動(dòng)名字(塊)集識(shí)別為:⑴活動(dòng)名Nva、⑵靜動(dòng)名Nvs ; 按照輔助有性質(zhì)字(塊)的語義特征方式,識(shí)別無性質(zhì)/特征字(塊)的語義歸集。即,非態(tài)字(塊)F識(shí)別為能靜字(塊)Fs、指代字Fp、數(shù)量字Fn、狀態(tài)字Ad(形狀A(yù)dx^iJWAdv)、標(biāo)符字Fm(標(biāo)點(diǎn)Fmp,算號(hào)Fmc,符號(hào)Fms)等。 能靜字(塊)識(shí)別為:靜物體Fsn、抽象體Fss 靜物體識(shí)別為:天然物Fsnn、合成物Fsnc、制成物Fsnm、工具Fsnt、用具Fsnu、玩具Fsnp、食物Fsnf ;抽象體識(shí)別為:抽象物Fsso、抽象態(tài)Fssf、想象物Fssi ; 指代字(塊)識(shí)別為:物稱代Fpo (確定Fpod、不定Fpoi)、特稱代Fps、疑問代Fpw、不定代Fpi (肯定Fpip,否定Fpin)。 數(shù)量字(塊)Fn識(shí)別為:數(shù)字(塊)Fnn、量字(塊)Fnm (名量字Fnmn、動(dòng)量字Fnmv。 狀態(tài)字(塊)Ad識(shí)別為:形狀A(yù)dx、副狀A(yù)dv (時(shí)間Adt、空間Ads、方式Adm、頻率Adf,程度Add)等。 標(biāo)符字Fm:識(shí)別為:標(biāo)點(diǎn)Fmp、算號(hào)Fmc、符號(hào)Fms等。
2.根據(jù)權(quán)利要求1所述的漢語語義活性識(shí)別法,其特征在于,所述方法的語義活性識(shí)別系統(tǒng),其有性質(zhì)特征字(塊)集的屬性強(qiáng)弱,在結(jié)構(gòu)上,符合自上而下、從左到右逐漸減弱的活性分布排列。BPW= [Wa, Wb]
Wa = [Waa, Wab,...Wan], Wb = [Wba, Wbb,...Wbn]
Waa = [ffaaa,ffaab,...ffaan],Wab = [ffaba,ffabb,...ffabn],...ff, an =[ffana, Wanb,...Wann]。
3.根據(jù)權(quán)利要求1.所述的漢語語義活性識(shí)別法,其特征在于,所述方法的活性語義識(shí)別為內(nèi)外慨念與形式。內(nèi)慨念識(shí)別為語義的特征內(nèi)涵,外概念識(shí)別為語義的特征外延;內(nèi)形式識(shí)別為語義的特征模式;外形式識(shí)別為語義的特征構(gòu)態(tài)。即, 識(shí)別活性語義:S =[概念(內(nèi)涵,外延),形式(模式,構(gòu)態(tài))],其中: 內(nèi)概念的意義,識(shí)別為字(塊)的活性形態(tài)義,表現(xiàn)為自然義(本義,實(shí)義)、社會(huì)義(引義,虛義)、認(rèn)知義(理義,情義),即 Sk =[自然義kn (本義,實(shí)義),社會(huì)義ks (引義,虛義),認(rèn)知義kr (理義,情義)] 外概念的意義,識(shí)別為概念形式化的活性意義,包括事物義Sm、事態(tài)義Sa、事件義Se。 即,Ss =[事物義Sm (單事物,合事物),事態(tài)義Sa (簡事態(tài),復(fù)事態(tài)),事件義Se (整事件,部事件)]外形式的意義,識(shí)別為匹配形式的特征構(gòu)態(tài),包括:無聯(lián)No,字聯(lián)Wo,短語Ph,子句Cl。 SP,Sf=[無聯(lián)No,字聯(lián)Wo,短語Pr,子句Cl] 內(nèi)形式的意義,識(shí)別為實(shí)現(xiàn)形式的特征模式,包括:主活式Ms、被活式Mp、賓活式Mo、形活式Ma、系活式Mr、在活式Me、使活式Mm、非活式Mn的活性識(shí)別。
BP, Sm = [Ms, Mp, Mo, Ma, Mr, Me, Mm, Mn]。
4.根據(jù)權(quán)利要求1所述的漢語語義活性識(shí)別法,其特征在于,所述方法包括(并不限于)以下識(shí)別步驟: 步驟一,活字特征標(biāo)注。識(shí)別活字(塊)及活性形態(tài)、非活字(塊),語句切分,查找歧義字塊。 步驟二,試算轉(zhuǎn)態(tài)消歧。用活性算法轉(zhuǎn)態(tài)處理活字(塊)、非活字塊的字級(jí)、形態(tài)、性質(zhì),消除歧義。 步驟三,活性比較分析。進(jìn)行字塊活性比較分析,按照字級(jí)、事級(jí)、形級(jí)、模級(jí)的活性特征匹配計(jì)算,初步識(shí)別字(塊)語義關(guān)系。 步驟四,謂主活字識(shí)別。根據(jù)活性特征算法識(shí)別謂活字(塊)V、子謂活字(塊)W。分別進(jìn)行謂活字、子謂活字的前聯(lián)結(jié)計(jì)算,處理N:初步識(shí)別為主體S或客體O ; 后聯(lián)結(jié)計(jì)算,處理N1:初步識(shí)別為客體O或主體S。步驟五, 模式匹配識(shí)別,進(jìn)行語義模式匹配計(jì)算,識(shí)別各活字(塊)的語義模式。 步驟六,語義結(jié)構(gòu)識(shí)別,進(jìn)行語義結(jié)構(gòu)表達(dá)識(shí)別,包括識(shí)別語句的語用:時(shí)間、空間、狀態(tài)、方式(肯定否定、陳述疑問、主動(dòng)被動(dòng)、真實(shí)虛擬、簡單復(fù)合主從等)及標(biāo)點(diǎn)符號(hào)等意義表達(dá)。
5.根據(jù)權(quán)利要求1所述的漢語語義活性識(shí)別法,其特征在于,所述方法包括識(shí)別漢語語義活性模式
(1)主活式Ms:標(biāo)式 Ms = SVO、簡式 Msl = SV, Msll = V0、Msl2 = V,
變式 Ms2 = SVOo。 (2)被活式Mp:標(biāo)式 Mp = SPvN Vt、簡式 Mpl = SPvVt0 (3)賓活式Mo:標(biāo)式 Mo = OSVt、簡式 Mol = OVb、變式 M02 = SOVb。
(4)形活式Ma:標(biāo)式 Ma = SVa、變式 Ma2 = VaR( 了 ) S。
(5)系活式Mr:標(biāo)式 Mr = SVrO、簡式 Mrl = SVr> Mrll = VrO、變式 Mr2 = OVr (6)在活式Me:標(biāo)式Me = SE (在…里)、簡式Mel = SEU 變式Me2 = E (在…里)NS。 (7)使活式Mm:標(biāo)式 Mm = SMv (使)NV、簡式 Mml = MV2 (讓)NV,
Mv3 (把)NVi。 (8)非活式Mn:標(biāo)式 Mn = NI, N(且 NI e N)。
6.根據(jù)權(quán)利要求1.1所述的漢語語義活性識(shí)別法,其特征在于識(shí)別語義的活性事級(jí)。(I)整事件(Sew)結(jié)構(gòu),SVO0 (2)部事件(Sep)結(jié)構(gòu),SV/VO/OV/VaS 型。 (3)復(fù)事態(tài)(Sac)結(jié)構(gòu),E+的N/V。(4)簡事態(tài)(Sas)結(jié)構(gòu),N+的+NI (含一個(gè)Nb)/N+V。(5)合事物(Smc)結(jié)構(gòu),A+ 的 N, N+Nl, adj+N。(6)單事物(Sms)結(jié)構(gòu),N。
7.根據(jù)權(quán)利要求1.所述的漢語語義活性識(shí)別法,其特征在于,識(shí)別語義特征活性字級(jí)。在字級(jí)中,識(shí)別若干義級(jí):義級(jí)歷時(shí)概念、義級(jí)共時(shí)慨念、義級(jí)歷時(shí)形式、義級(jí)共時(shí)形式。在字級(jí)的義級(jí)(Ws)中,識(shí)別為若干子義級(jí)。
8.根據(jù)權(quán)利要求1.所述的漢語語義活性識(shí)別法,其特征在于,識(shí)別的客體文字(塊)W統(tǒng)一用語言特征活性方法,即字級(jí)X、事級(jí)y、形級(jí)P、模級(jí)q的值來表示:Wxypq,或Wpqxy,或Wxy,或Wpq,或Wx,或Wy,識(shí)別其語義。
【文檔編號(hào)】G06F17/27GK103970731SQ201410208511
【公開日】2014年8月6日 申請(qǐng)日期:2014年5月19日 優(yōu)先權(quán)日:2014年5月19日
【發(fā)明者】吳林東, 吳星寧 申請(qǐng)人:無錫國澳實(shí)業(yè)有限公司