ims為第二相似度,e為自然常數(shù)。另外,將第一相似度和第二相似度之和除W 兩個相似度的差是為了平衡兩個相似度的值,采用相似度差值的指數(shù)形式是為了確保分母 的值不為0。
[0109] 由此,分別通過測試前置向量與待測前置向量的第一相似度,及測試后置向量和 待測后置向量的第二相似度,綜合確定測試向量對與待測向量對的相似度,使得獲得的結(jié) 果更加準確可信。
[0110] 其中,步驟S52可W包括:
[0111] 計算每個測試句子的測試前置向量與待測前置向量的向量余弦值,并將該向量余 弦值確定為第一相似度;
[0112] 計算每個測試句子的測試后置向量與待測后置向量的向量余弦值,并將該向量余 弦值確定為第二相似度。
[0113] 實驗證明,利用向量余弦值確定相似度不僅計算過程簡單,且計算獲得的準確度 也更加準確。
[0114] 與上述方法實施例相對應,本發(fā)明實施例還提供了一種事件關(guān)系檢測系統(tǒng),如圖6 所述,可W包括:
[0115] 獲取模塊61,用于獲取預設(shè)數(shù)量已提供邏輯關(guān)系的測試句子,每個測試句子均包 括一個與該測試句子的邏輯關(guān)系對應的測試連接詞;
[0116] 第一確定模塊62,用于確定每個測試句子中位于測試連接詞之前的文本為測試前 置文本,位于測試連接詞之后的文本為測試后置文本;
[0117] 向量構(gòu)建模塊63,用于分析進行分詞處理后的測試前置文本的框架語義,W構(gòu)建 分別與每個測試句子對應的測試前置向量,分析進行分詞處理后的測試后置文本的框架語 義,W構(gòu)建分別與每個測試句子對應的測試后置向量;
[0118] 第二確定模塊64,用于確定每個測試句子對應的測試前置向量與測試后置向量組 成該測試句子的測試向量對;
[0119] 第=確定模塊65,用于獲取待測向量對,從全部測試句子的測試向量對中確定出 與待測向量對相似度最高的測試向量對,確定該測試向量對對應的測試句子的邏輯關(guān)系為 待測向量對對應的待測句子的邏輯關(guān)系。
[0120] 由此,通過上述實施例提供的一種事件關(guān)系檢測系統(tǒng),獲取已提供邏輯關(guān)系、且包 括有與邏輯關(guān)系相對應的連接詞的預設(shè)數(shù)量測試句子,建立與每個測試句子對應的測試向 量對,并確定出與待測向量對相似度最高的測試向量對,該測試向量對對應的測試句子的 邏輯關(guān)系即為待測向量對對應的待測句子的邏輯關(guān)系。目P,確定相似度最高的兩個向量對 所對應的句子具有相同的邏輯關(guān)系。本申請?zhí)峁┑囊环N事件關(guān)系檢測方法及系統(tǒng),不僅僅 能檢測出某一特定邏輯關(guān)系,而是可W根據(jù)需要獲取與任意邏輯關(guān)系對應的測試句子及測 試向量對,進而確定待測向量的邏輯關(guān)系,具有通用性;且實驗證明,本發(fā)明提供的一種事 件關(guān)系檢測方法及系統(tǒng)獲得的檢測結(jié)果具有較高的準確度。
[0121] 對所公開的實施例的上述說明,使本領(lǐng)域技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對該 些實施例的多種修改對本領(lǐng)域技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可 W在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限 制于本文所示的該些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的 范圍。
【主權(quán)項】
1. 一種事件關(guān)系檢測方法,其特征在于,包括: 獲取預設(shè)數(shù)量已提供邏輯關(guān)系的測試句子,每個測試句子均包括一個與該測試句子的 邏輯關(guān)系對應的測試連接詞; 確定每個測試句子中位于測試連接詞之前的文本為測試前置文本,位于測試連接詞之 后的文本為測試后置文本; 分析進行分詞處理后的測試前置文本的框架語義,以構(gòu)建分別與每個測試句子對應的 測試前置向量,分析進行分詞處理后的測試后置文本的框架語義,以構(gòu)建分別與每個測試 句子對應的測試后置向量; 確定每個測試句子對應的測試前置向量與測試后置向量組成該測試句子的測試向量 對; 獲取待測向量對,從全部測試句子的測試向量對中確定出與所述待測向量對相似度最 高的測試向量對,確定該測試向量對對應的測試句子的邏輯關(guān)系為所述待測向量對對應的 待測句子的邏輯關(guān)系。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述分析進行分詞處理后的測試前置文 本的框架語義,以構(gòu)建分別與每個測試句子對應的測試前置向量,分析進行分詞處理后的 測試后置文本的框架語義,以構(gòu)建分別與每個測試句子對應的測試后置向量,包括: 對所述測試前置文本進行分詞處理,得到分別與每個測試句子對應的測試前置詞組; 對所述測試后置文本進行分詞處理,得到分別與每個測試句子對應的測試后置詞組; 分析所述測試前置詞組中的詞語的框架語義,得到每個測試句子的前置框架語義集 合; 分析所述測試后置詞組中的詞語的框架語義,得到每個測試句子的后置框架語義集 合; 利用所述前置框架語義集合構(gòu)建每個測試句子的測試前置向量,利用所述后置框架語 義集合構(gòu)建每個測試句子的測試后置向量。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲取預設(shè)數(shù)量已提供邏輯關(guān)系的測 試句子,每個測試句子均包括一個與該測試句子的邏輯關(guān)系對應的測試連接詞,包括: 獲取指定文本?目息; 將所述文本信息進行分句處理,得到第一句子; 確定所述第一句子中已提供邏輯關(guān)系的句子為第二句子; 獲取每個第二句子所包含的連接詞; 確定所述第二句子中其連接詞指向該第二句子的邏輯關(guān)系的概率大于預設(shè)閾值的預 設(shè)數(shù)量句子為測試句子。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取待測向量對,包括: 獲取待測句子; 確定該待測句子中的一個連接詞為待測連接詞; 確定所述待測句子中位于所述待測連接詞之前的文本為待測前置文本,位于所述待測 連接詞之后的文本為待測后置文本; 分析進行分詞處理后的待測前置文本的框架語義,以構(gòu)建待測前置向量,分析進行分 詞處理后的待測后置文本的框架語義,以構(gòu)建待測后置向量; 確定所述待測前置向量和所述待測后置向量組成待測向量對。5. 根據(jù)權(quán)利要求1至4任一項所述的方法,其特征在于,所述從全部測試句子的測試向 量對中確定出與所述待測向量對相似度最高的測試向量對,包括: 確定所述待測向量對的待測前置向量和待測后置向量; 計算每個測試句子的測試前置向量與所述待測前置向量的第一相似度,以及該測試句 子的測試后置向量與所述待測后置向量的第二相似度; 利用所述第一相似度和所述第二相似度確定所述待測向量對與每個測試句子的測試 向量對的相似度; 確定出所述相似度中最高的相似度對應的測試向量對。6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述計算每個測試句子的測試前置向量 與所述待測前置向量的第一相似度,以及該測試句子的測試后置向量與所述待測后置向量 的第二相似度,包括: 計算每個測試句子的測試前置向量與所述待測前置向量的向量余弦值,并將該向量余 弦值確定為第一相似度; 計算每個測試句子的測試后置向量與所述待測后置向量的向量余弦值,并將該向量余 弦值確定為第二相似度。7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述利用所述第一相似度和所述第二相 似度確定所述待測向量對與每個測試句子的測試向量對的相似度,包括: 按照下列公式計算所述相似度:其中,Sim為所述待測向量對與每個測試句子的測試向量對的相似度,EveSim1所述為 第一相似度,EveSim2為所述第二相似度,e為自然常數(shù)。8. -種事件關(guān)系檢測系統(tǒng),其特征在于,包括: 獲取模塊,用于獲取預設(shè)數(shù)量已提供邏輯關(guān)系的測試句子,每個測試句子均包括一個 與該測試句子的邏輯關(guān)系對應的測試連接詞; 第一確定模塊,用于確定每個測試句子中位于測試連接詞之前的文本為測試前置文 本,位于測試連接詞之后的文本為測試后置文本; 向量構(gòu)建模塊,用于分析進行分詞處理后的測試前置文本的框架語義,以構(gòu)建分別與 每個測試句子對應的測試前置向量,分析進行分詞處理后的測試后置文本的框架語義,以 構(gòu)建分別與每個測試句子對應的測試后置向量; 第二確定模塊,用于確定每個測試句子對應的測試前置向量與測試后置向量組成該測 試句子的測試向量對; 第三確定模塊,用于獲取待測向量對,從全部測試句子的測試向量對中確定出與所述 待測向量對相似度最高的測試向量對,確定該測試向量對對應的測試句子的邏輯關(guān)系為所 述待測向量對對應的待測句子的邏輯關(guān)系。
【專利摘要】本發(fā)明公開了一種事件關(guān)系檢測方法和系統(tǒng),包括:獲取預設(shè)數(shù)量已提供邏輯關(guān)系的測試句子,每個測試句子均包括一個與其邏輯關(guān)系對應的測試連接詞;確定每個測試句子中位于測試連接詞之前的文本為測試前置文本,位于測試連接詞之后的文本為測試后置文本;通過分析進行分詞處理后的測試前置文本和測試后置文本的框架語義,構(gòu)建測試前置向量及測試后置向量;確定每個測試句子的測試前置向量與測試后置向量組成其測試向量對;獲取待測向量對,從全部測試向量對中確定出與待測向量對相似度最高的測試向量對,確定該測試向量對對應的測試句子的邏輯關(guān)系為待測向量對對應的待測句子的邏輯關(guān)系。由此,不僅實現(xiàn)了通用性,獲取的檢測結(jié)果還具有較高準確度。
【IPC分類】G06F17/27
【公開號】CN104881404
【申請?zhí)枴緾N201510346311
【發(fā)明人】楊雪蓉, 洪宇, 姚建民, 朱巧明
【申請人】蘇州大學張家港工業(yè)技術(shù)研究院
【公開日】2015年9月2日
【申請日】2015年6月19日