欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于組合理論的文本信息處理系統(tǒng)及方法

文檔序號:6620873閱讀:149來源:國知局
一種基于組合理論的文本信息處理系統(tǒng)及方法
【專利摘要】本發(fā)明提出了一種基于組合理論的文本信息處理系統(tǒng)及方法,解決了文本數(shù)據(jù)分析問題,可充分釋放文本信息的價值,其包括:基本元素層,用于定義最底層的基本元素和執(zhí)行基本元素的匹配邏輯;組合邏輯層,連接基本元素層,用于定義一種或多種組合邏輯,組合邏輯用于將基本元素粘合成組合性表達元素;編程接口定義層,連接組合邏輯層,定義一個或多個可通過編程實現(xiàn)的規(guī)則表達接口;抽取支持層,連接編程接口定義層,用于根據(jù)匹配規(guī)則抽取文本信息,并將文本信息以規(guī)則表達;類自然語言描述層,連接抽取支持層,以類自然語言的格式來描述規(guī)則;類自然語言描述解析及優(yōu)化組件,連接類自然語言描述層;支持組件,連接類自然語言描述解析及優(yōu)化組件。
【專利說明】一種基于組合理論的文本信息處理系統(tǒng)及方法

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及文本分析【技術(shù)領(lǐng)域】,尤其涉及一種基于組合理論的文本信息處理系統(tǒng)及方法。

【背景技術(shù)】
[0002]信息抽取就是從文本中抽取特定的實時信息。在大多數(shù)的信息抽取中,都是通過識別文本中的實體,對實體進行語義分析來確定文本語義信息的,但是該類方法局限性大,在語義分析過程中,語義信息的描述過于機械化,容易遺漏,特征項的選取較片面,語義表達不完整甚至錯誤,總而言之,現(xiàn)有的語義抽取技術(shù),不能準確并充分的釋放文本信息,從而難以對文本信息進行有效利用。
[0003]因此,現(xiàn)有技術(shù)中,在進行文本語義處理的過程中,如何做到對文本信息進行充分釋放,是十分關(guān)鍵的問題。


【發(fā)明內(nèi)容】

[0004]基于【背景技術(shù)】存在的問題,本發(fā)明提出了一種基于組合理論的文本信息處理系統(tǒng)及方法,解決了文本數(shù)據(jù)分析問題,可充分釋放文本信息的價值。
[0005]本發(fā)明提出的一種基于組合理論的文本信息處理系統(tǒng),包括:
[0006]基本元素層,用于定義最底層的基本元素和執(zhí)行基本元素的匹配邏輯;
[0007]組合邏輯層,連接基本元素層,用于定義一種或多種組合邏輯,組合邏輯用于將基本元素粘合成組合性表達元素;
[0008]編程接口定義層,連接組合邏輯層,用于定義一個或多個可通過編程實現(xiàn)的規(guī)則表達接口 ;
[0009]抽取支持層,連接編程接口定義層,用于根據(jù)匹配規(guī)則抽取文本信息,并將文本信息以規(guī)則表達;
[0010]類自然語言描述層,連接抽取支持層,用于以類自然語言的格式來描述規(guī)則;
[0011]類自然語言描述解析及優(yōu)化組件,連接類自然語言描述層,將以類自然語言描述的規(guī)則解析為以基本元素和邏輯組合形式構(gòu)成的內(nèi)部表達式;
[0012]支持組件,連接類自然語言描述解析及優(yōu)化組件,用于提供邏輯組合形式。
[0013]優(yōu)選地,基本元素層包括:基本表達元素模塊,用于定義表達元素;基本數(shù)量元素模塊,用于定義數(shù)量元素;表達執(zhí)行器,用于執(zhí)行基本元素的表達方式。
[0014]優(yōu)選地,組合邏輯包括布爾表達邏輯、類正則表達邏輯、連接表達邏輯和/或位置表達邏輯。
[0015]優(yōu)選地,編程接口定義層中的每一個規(guī)則表達接口均可通過編程實現(xiàn)特定特性。
[0016]優(yōu)選地,抽取支持層抽取的文本信息的表達方式為短語構(gòu)詞、短句構(gòu)詞或句式結(jié)構(gòu)。
[0017]優(yōu)選地,邏輯組合形式內(nèi)置并具有工具性。
[0018]優(yōu)選地,邏輯組合形式包括通用的組合形式。
[0019]優(yōu)選地,邏輯組合形式包括常用的組合形式。
[0020]優(yōu)選地,邏輯組合形式包括詞匯性組合形式,常用詞組合形式,數(shù)量、順序及時間組合形式和句式級連接詞組合形式。
[0021 ] 一種基于組合理論的文本信息處理方法,包括步驟:
[0022]S1、定義最底層的基本元素和執(zhí)行基本元素的匹配邏輯;
[0023]S2、根據(jù)組合邏輯粘合基本元素,獲取組合性表達元素做為匹配規(guī)則;
[0024]S3、根據(jù)編程實現(xiàn)規(guī)則表達接口并接入匹配規(guī)則;
[0025]S4、根據(jù)匹配規(guī)則抽取文本信息,并將文本信息以規(guī)則表達;
[0026]S5、將規(guī)則以類自然語言的格式來描述;
[0027]S6、對類自然語言描述的規(guī)則進行解析,并以基本元素和連邏輯組合形式來表示,形成內(nèi)部表達式。
[0028]本發(fā)明利用組合規(guī)則表達文本信息,既保證了文本信息的有效提取,又避免了相同信息的重復表達,有效的解決了文本數(shù)據(jù)分析問題,不但精準度高、提供語義信息豐富,而且極具實用性和可產(chǎn)業(yè)化等特點,以其作為數(shù)據(jù)挖掘等技術(shù)的輸入數(shù)據(jù),可充分釋放文本信息的價值。

【專利附圖】

【附圖說明】
[0029]圖1為本發(fā)明提出的一種基于組合理論的文本信息處理系統(tǒng)的結(jié)構(gòu)圖;
[0030]圖2為圖1所示系統(tǒng)的工作流程圖。

【具體實施方式】
[0031]參照圖1,本發(fā)明提出的一種基于組合理論的文本信息處理系統(tǒng),包括基本元素層、組合邏輯層、編程接口定義層、抽取支持層、類自然語言描述層、類自然語言描述解析及優(yōu)化組件和支持組件。
[0032]基本元素層,用于定義最底層的基本元素和執(zhí)行基本元素的匹配邏輯,其包括基本表達元素模塊、基本數(shù)量元素模塊和表達執(zhí)行器。其中,基本表達元素模塊,用于定義表達元素;基本數(shù)量元素模塊,用于定義數(shù)量元素;表達執(zhí)行器,用于執(zhí)行基本元素的表達方式。
[0033]組合邏輯層,連接基本元素層,用于定義一種或多種組合邏輯,組合邏輯用于將基本元素粘合成組合性表達元素。組合邏輯包括布爾表達邏輯、類正則表達邏輯、連接表達邏輯和/或位置表達邏輯的任意組合。本實施方式中,組合邏輯包括布爾表達邏輯、類正則表達邏輯、連接表達邏輯和位置表達邏輯。
[0034]編程接口定義層,連接組合邏輯層,用于定義一個或多個可通過編程實現(xiàn)的規(guī)則表達接口。編程接口定義層中的每一個規(guī)則表達接口均可通過編程實現(xiàn)特定特性。
[0035]抽取支持層,連接編程接口定義層,用于根據(jù)匹配規(guī)則抽取文本信息,并將文本信息以規(guī)則表達。抽取支持層抽取的文本信息的表達方式為短語構(gòu)詞、短句構(gòu)詞或句式結(jié)構(gòu)。
[0036]類自然語言描述層,連接抽取支持層,用于以類自然語言的格式來描述規(guī)則。類自然語言的格式適配自然語言的書寫習慣和語法特征,使得規(guī)則的表達形式更加貼近自然語言,人員易于上手。
[0037]類自然語言描述解析及優(yōu)化組件,連接類自然語言描述層,將以類自然語言描述的規(guī)則解析為以基本元素和邏輯組合形式構(gòu)成的內(nèi)部表達式,一方面優(yōu)化執(zhí)行效能,另一方面將上層的規(guī)則解析為底層的基本邏輯,表達方式更加清晰,避免信息描述的重復。
[0038]支持組件,連接類自然語言描述解析及優(yōu)化組件,用于提供內(nèi)置的、工具性的邏輯組合形式。同時,為了更加方便的工作,邏輯組合形式還可以具有通用性或常用性。本實施方式中,邏輯組合形式為核心人員開發(fā)的內(nèi)置的、常用的或者通用的、工具性的組合形式,具體包括詞匯性組合形式;常用詞組合形式,例如姓名、地域、名詞等;數(shù)量、順序及時間組合形式和句式級連接詞組合形式。
[0039]參照圖2,圖1所示系統(tǒng)的工作方式包括以下步驟:
[0040]S1、定義最底層的基本元素和執(zhí)行基本元素的匹配邏輯;
[0041]S2、根據(jù)組合邏輯粘合基本元素,獲取組合性表達元素做為匹配規(guī)則;
[0042]S3、根據(jù)編程實現(xiàn)規(guī)則表達接口并接入匹配規(guī)則;
[0043]S4、根據(jù)匹配規(guī)則抽取文本信息,并將文本信息以規(guī)則表達;
[0044]S5、將規(guī)則以類自然語言的格式來描述;
[0045]S6、對類自然語言描述的規(guī)則進行解析,并以基本元素和連邏輯組合形式來表示,形成內(nèi)部表達式。
[0046]以上方法中,利用組合規(guī)則表達文本信息,既保證了文本信息的有效提取,又避免了相同信息的重復表達,有效的解決了文本數(shù)據(jù)分析問題,不但精準度高、提供語義信息豐富,而且極具實用性和可產(chǎn)業(yè)化等特點,以其作為數(shù)據(jù)挖掘等技術(shù)的輸入數(shù)據(jù),可充分釋放文本信息的價值。
[0047]以上所述,僅為本發(fā)明較佳的【具體實施方式】,但本發(fā)明的保護范圍并不局限于此,任何熟悉本【技術(shù)領(lǐng)域】的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應涵蓋在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種基于組合理論的文本信息處理系統(tǒng),其特征在于,包括: 基本元素層,用于定義最底層的基本元素和執(zhí)行基本元素的匹配邏輯; 組合邏輯層,連接基本元素層,用于定義一種或多種組合邏輯,組合邏輯用于將基本元素粘合成組合性表達元素; 編程接口定義層,連接組合邏輯層,用于定義一個或多個可通過編程實現(xiàn)的規(guī)則表達接口 ; 抽取支持層,連接編程接口定義層,用于根據(jù)匹配規(guī)則抽取文本信息,并將文本信息以規(guī)則表達; 類自然語言描述層,連接抽取支持層,用于以類自然語言的格式來描述規(guī)則; 類自然語言描述解析及優(yōu)化組件,連接類自然語言描述層,將以類自然語言描述的規(guī)則解析為以基本元素和邏輯組合形式構(gòu)成的內(nèi)部表達式; 支持組件,連接類自然語言描述解析及優(yōu)化組件,用于提供邏輯組合形式。
2.如權(quán)利要求1所述的基于組合理論的文本信息處理系統(tǒng),其特征在于,基本元素層包括:基本表達元素模塊,用于定義表達元素;基本數(shù)量元素模塊,用于定義數(shù)量元素;表達執(zhí)行器,用于執(zhí)行基本元素的表達方式。
3.如權(quán)利要求1所述的基于組合理論的文本信息處理系統(tǒng),其特征在于,組合邏輯包括布爾表達邏輯、類正則表達邏輯、連接表達邏輯和/或位置表達邏輯。
4.如權(quán)利要求1所述的基于組合理論的文本信息處理系統(tǒng),其特征在于,編程接口定義層中的每一個規(guī)則表達接口均可通過編程實現(xiàn)特定特性。
5.如權(quán)利要求1所述的基于組合理論的文本信息處理系統(tǒng),其特征在于,抽取支持層抽取的文本信息的表達方式為短語構(gòu)詞、短句構(gòu)詞或句式結(jié)構(gòu)。
6.如權(quán)利要求1所述的基于組合理論的文本信息處理系統(tǒng),其特征在于,邏輯組合形式內(nèi)置并具有工具性。
7.如權(quán)利要求1或6所述的基于組合理論的文本信息處理系統(tǒng),其特征在于,邏輯組合形式包括通用的組合形式。
8.如權(quán)利要求1或6所述的基于組合理論的文本信息處理系統(tǒng),其特征在于,邏輯組合形式包括常用的組合形式。
9.如權(quán)利要求1或6所述的基于組合理論的文本信息處理系統(tǒng),其特征在于,邏輯組合形式包括詞匯性組合形式,常用詞組合形式,數(shù)量、順序及時間組合形式和句式級連接詞組合形式。
10.一種基于組合理論的文本信息處理方法,其特征在于,包括步驟: S1、定義最底層的基本元素和執(zhí)行基本元素的匹配邏輯; S2、根據(jù)組合邏輯粘合基本元素,獲取組合性表達元素做為匹配規(guī)則; S3、根據(jù)編程實現(xiàn)規(guī)則表達接口并接入匹配規(guī)則; S4、根據(jù)匹配規(guī)則抽取文本信息,并將文本信息以規(guī)則表達; S5、將規(guī)則以類自然語言的格式來描述; S6、對類自然語言描述的規(guī)則進行解析,并以基本元素和連邏輯組合形式來表示,形成內(nèi)部表達式。
【文檔編號】G06F17/21GK104199803SQ201410348404
【公開日】2014年12月10日 申請日期:2014年7月21日 優(yōu)先權(quán)日:2014年7月21日
【發(fā)明者】賈巖 申請人:安徽華貞信息科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
炎陵县| 陇南市| 葫芦岛市| 南汇区| 长武县| 嘉义县| 伊川县| 渝中区| 噶尔县| 登封市| 澄城县| 固原市| 平泉县| 上杭县| 文化| 成安县| 方正县| 金沙县| 双江| 治县。| 宁阳县| 望江县| 剑川县| 延边| 九江市| 绿春县| 连江县| 建湖县| 许昌市| 大悟县| 铜陵市| 成安县| 宁城县| 休宁县| 井冈山市| 连云港市| 宁阳县| 宣化县| 兴宁市| 怀柔区| 罗平县|