本發(fā)明涉及自然語(yǔ)言處理領(lǐng)域,具體而言,涉及一種基于人工智能的板材產(chǎn)品知識(shí)圖譜構(gòu)建方法及系統(tǒng)。
背景技術(shù):
1、隨著板材產(chǎn)品的種類(lèi)不斷增多、應(yīng)用場(chǎng)景日益廣泛以及相關(guān)技術(shù)不斷發(fā)展,大量的板材產(chǎn)品知識(shí)信息需要被有效地組織和管理。知識(shí)圖譜作為一種有效的知識(shí)組織和表示形式,在各個(gè)領(lǐng)域的知識(shí)管理中發(fā)揮著重要作用。然而,在構(gòu)建板材產(chǎn)品知識(shí)圖譜時(shí),存在著諸多技術(shù)難題。傳統(tǒng)的知識(shí)圖譜構(gòu)建方法往往難以精確地識(shí)別和表示實(shí)體之間的關(guān)聯(lián)信息。在板材產(chǎn)品知識(shí)領(lǐng)域,實(shí)體之間的關(guān)系復(fù)雜多樣,例如板材的材質(zhì)與性能之間的關(guān)系、板材的用途與適用環(huán)境之間的關(guān)系等。這些關(guān)系不僅取決于實(shí)體本身的定義,還受到知識(shí)文本結(jié)構(gòu)和語(yǔ)義等多方面因素的影響。由于知識(shí)文本的復(fù)雜性和多樣性,實(shí)體之間的關(guān)聯(lián)信息存在著較大的隨機(jī)性。傳統(tǒng)方法在處理這種隨機(jī)性時(shí)缺乏有效的約束機(jī)制,無(wú)法準(zhǔn)確地衡量不同實(shí)體之間關(guān)聯(lián)信息的可能性,這使得在構(gòu)建知識(shí)圖譜時(shí)容易引入錯(cuò)誤的實(shí)體關(guān)系或者遺漏重要的關(guān)系,從而影響知識(shí)圖譜對(duì)板材產(chǎn)品知識(shí)體系的準(zhǔn)確反映。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于人工智能的板材產(chǎn)品知識(shí)圖譜構(gòu)建方法及系統(tǒng)。本發(fā)明是這樣實(shí)現(xiàn)的:
2、第一方面,本發(fā)明提供了一種基于人工智能的板材產(chǎn)品知識(shí)圖譜構(gòu)建方法,包括:確定板材產(chǎn)品知識(shí)文本中包括多個(gè)實(shí)體的融合文本窗口;挖掘所述融合文本窗口的文本結(jié)構(gòu)表征信息,將所述文本結(jié)構(gòu)表征信息映射成與多個(gè)實(shí)體關(guān)系先驗(yàn)標(biāo)記一一關(guān)聯(lián)的多個(gè)文本結(jié)構(gòu)表征信息概率分布;挖掘每一所述實(shí)體關(guān)系先驗(yàn)標(biāo)記的文本語(yǔ)義表征信息,將所述文本語(yǔ)義表征信息映射成對(duì)應(yīng)所述實(shí)體關(guān)系先驗(yàn)標(biāo)記的文本語(yǔ)義表征信息概率分布;在與所述多個(gè)實(shí)體關(guān)系先驗(yàn)標(biāo)記一一關(guān)聯(lián)的多個(gè)文本語(yǔ)義表征信息概率分布中,確定和所述文本結(jié)構(gòu)表征信息概率分布對(duì)應(yīng)的文本語(yǔ)義表征信息概率分布;將所述對(duì)應(yīng)的文本語(yǔ)義表征信息概率分布對(duì)應(yīng)的實(shí)體關(guān)系先驗(yàn)標(biāo)記所對(duì)應(yīng)的實(shí)體關(guān)聯(lián)信息作為所述多個(gè)實(shí)體之間的實(shí)體關(guān)聯(lián)信息;依據(jù)多個(gè)實(shí)體和對(duì)應(yīng)的所述實(shí)體關(guān)聯(lián)信息,構(gòu)建板材產(chǎn)品知識(shí)圖譜;
3、第二方面,本發(fā)明提供一種計(jì)算機(jī)系統(tǒng),包括:一個(gè)或多個(gè)處理器;存儲(chǔ)器;一個(gè)或多個(gè)計(jì)算機(jī)程序;其中所述一個(gè)或多個(gè)計(jì)算機(jī)程序被存儲(chǔ)在所述存儲(chǔ)器中并被配置為由所述一個(gè)或多個(gè)處理器執(zhí)行,所述一個(gè)或多個(gè)計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí),實(shí)現(xiàn)如上所述的方法。
4、本發(fā)明的有益效果:本發(fā)明的方案基于構(gòu)建滿足概率分布的文本結(jié)構(gòu)表征信息以及滿足概率分布的實(shí)體關(guān)系先驗(yàn)標(biāo)記的文本語(yǔ)義表征信息,將知識(shí)文本中實(shí)體之間的實(shí)體關(guān)聯(lián)信息的隨機(jī)性限制在概率分布,以將文本結(jié)構(gòu)表征信息和文本語(yǔ)義表征信息之間的實(shí)體關(guān)聯(lián)信息的匹配進(jìn)行度量,如此可以依據(jù)匹配結(jié)果提高實(shí)體關(guān)聯(lián)信息識(shí)別的精度,基于此構(gòu)建得到更加準(zhǔn)確的知識(shí)圖譜。
1.一種基于人工智能的板材產(chǎn)品知識(shí)圖譜構(gòu)建方法,其特征在于,包括:確定板材產(chǎn)品知識(shí)文本中包括多個(gè)實(shí)體的融合文本窗口;挖掘所述融合文本窗口的文本結(jié)構(gòu)表征信息,將所述文本結(jié)構(gòu)表征信息映射成與多個(gè)實(shí)體關(guān)系先驗(yàn)標(biāo)記一一關(guān)聯(lián)的多個(gè)文本結(jié)構(gòu)表征信息概率分布;挖掘每一所述實(shí)體關(guān)系先驗(yàn)標(biāo)記的文本語(yǔ)義表征信息,將所述文本語(yǔ)義表征信息映射成對(duì)應(yīng)所述實(shí)體關(guān)系先驗(yàn)標(biāo)記的文本語(yǔ)義表征信息概率分布;在與所述多個(gè)實(shí)體關(guān)系先驗(yàn)標(biāo)記一一關(guān)聯(lián)的多個(gè)文本語(yǔ)義表征信息概率分布中,確定和所述文本結(jié)構(gòu)表征信息概率分布對(duì)應(yīng)的文本語(yǔ)義表征信息概率分布;將所述對(duì)應(yīng)的文本語(yǔ)義表征信息概率分布對(duì)應(yīng)的實(shí)體關(guān)系先驗(yàn)標(biāo)記所對(duì)應(yīng)的實(shí)體關(guān)聯(lián)信息作為所述多個(gè)實(shí)體之間的實(shí)體關(guān)聯(lián)信息;依據(jù)多個(gè)實(shí)體和對(duì)應(yīng)的所述實(shí)體關(guān)聯(lián)信息,構(gòu)建板材產(chǎn)品知識(shí)圖譜。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定板材產(chǎn)品知識(shí)文本中包括多個(gè)實(shí)體的融合文本窗口,包括:對(duì)所述板材產(chǎn)品知識(shí)文本進(jìn)行命名實(shí)體識(shí)別,獲得所述板材產(chǎn)品知識(shí)文本中每個(gè)實(shí)體的文本窗口;將所述板材產(chǎn)品知識(shí)文本中位于同一文本句或臨近文本句的多個(gè)實(shí)體的文本窗口進(jìn)行融合操作,獲得包括所述多個(gè)實(shí)體的融合文本窗口。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述挖掘所述融合文本窗口的文本結(jié)構(gòu)表征信息,包括:對(duì)所述融合文本窗口進(jìn)行詞向量特征提取操作,獲得所述融合文本窗口中文本的提取詞向量;對(duì)所述提取詞向量進(jìn)行聚合,獲得所述融合文本窗口的文本結(jié)構(gòu)表征信息;所述多個(gè)實(shí)體關(guān)系先驗(yàn)標(biāo)記與多個(gè)密集網(wǎng)絡(luò)組件一一關(guān)聯(lián);所述將所述文本結(jié)構(gòu)表征信息映射成與多個(gè)實(shí)體關(guān)系先驗(yàn)標(biāo)記一一關(guān)聯(lián)的多個(gè)文本結(jié)構(gòu)表征信息概率分布,包括:對(duì)于每一所述實(shí)體關(guān)系先驗(yàn)標(biāo)記進(jìn)行如下操作:基于與所述實(shí)體關(guān)系先驗(yàn)標(biāo)記對(duì)應(yīng)的密集網(wǎng)絡(luò)組件對(duì)所述文本結(jié)構(gòu)表征信息進(jìn)行線性變換操作,獲得與所述實(shí)體關(guān)系先驗(yàn)標(biāo)記對(duì)應(yīng)的文本結(jié)構(gòu)表征信息的期望、以及文本結(jié)構(gòu)表征信息的獨(dú)立方差向量;依據(jù)與每一所述實(shí)體關(guān)系先驗(yàn)標(biāo)記對(duì)應(yīng)的文本結(jié)構(gòu)表征信息的期望、以及文本結(jié)構(gòu)表征信息的獨(dú)立方差向量,生成和每一所述實(shí)體關(guān)系先驗(yàn)標(biāo)記對(duì)應(yīng)的文本結(jié)構(gòu)表征信息概率分布。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述挖掘每一所述實(shí)體關(guān)系先驗(yàn)標(biāo)記的文本語(yǔ)義表征信息,包括:基于文本語(yǔ)義推理組件的文本加載模塊將每一所述實(shí)體關(guān)系先驗(yàn)標(biāo)記嵌入成一位有效編碼;將所述文本語(yǔ)義推理組件的中間網(wǎng)絡(luò)模塊的參數(shù)數(shù)組與每一所述實(shí)體關(guān)系先驗(yàn)標(biāo)記對(duì)應(yīng)的一位有效編碼進(jìn)行求積,獲得每一所述實(shí)體關(guān)系先驗(yàn)標(biāo)記的文本語(yǔ)義表征信息;所述將所述文本語(yǔ)義表征信息映射成對(duì)應(yīng)所述實(shí)體關(guān)系先驗(yàn)標(biāo)記的文本語(yǔ)義表征信息概率分布,包括:對(duì)所述實(shí)體關(guān)系先驗(yàn)標(biāo)記的文本語(yǔ)義表征信息進(jìn)行線性變換操作,獲得所述文本語(yǔ)義表征信息的期望、以及所述文本語(yǔ)義表征信息的獨(dú)立方差向量;依據(jù)所述期望以及所述獨(dú)立方差向量,生成對(duì)應(yīng)所述實(shí)體關(guān)系先驗(yàn)標(biāo)記的文本語(yǔ)義表征信息概率分布。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定和所述文本結(jié)構(gòu)表征信息概率分布對(duì)應(yīng)的文本語(yǔ)義表征信息概率分布,包括:對(duì)于多個(gè)實(shí)體關(guān)系先驗(yàn)標(biāo)記中的每個(gè)實(shí)體關(guān)系先驗(yàn)標(biāo)記進(jìn)行如下操作:確定對(duì)應(yīng)所述實(shí)體關(guān)系先驗(yàn)標(biāo)記的文本語(yǔ)義表征信息概率分布與對(duì)應(yīng)所述實(shí)體關(guān)系先驗(yàn)標(biāo)記的文本結(jié)構(gòu)表征信息概率分布之間的共性度量結(jié)果;將共性度量結(jié)果最大的實(shí)體關(guān)系先驗(yàn)標(biāo)記對(duì)應(yīng)的文本語(yǔ)義表征信息概率分布,確定為與所述文本結(jié)構(gòu)表征信息概率分布對(duì)應(yīng)的文本語(yǔ)義表征信息概率分布。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述確定對(duì)應(yīng)所述實(shí)體關(guān)系先驗(yàn)標(biāo)記的文本語(yǔ)義表征信息概率分布與對(duì)應(yīng)所述實(shí)體關(guān)系先驗(yàn)標(biāo)記的文本結(jié)構(gòu)表征信息概率分布之間的共性度量結(jié)果,包括:對(duì)所述文本語(yǔ)義表征信息概率分布進(jìn)行多次蒙特卡洛抽樣,獲得通過(guò)多個(gè)抽樣文本語(yǔ)義表征信息構(gòu)成的抽樣文本語(yǔ)義表征信息集合;對(duì)所述文本結(jié)構(gòu)表征信息概率分布進(jìn)行多次蒙特卡洛抽樣,獲得通過(guò)多個(gè)抽樣文本結(jié)構(gòu)表征信息構(gòu)成的抽樣文本結(jié)構(gòu)表征信息集合;將所述抽樣文本語(yǔ)義表征信息集合與所述抽樣文本結(jié)構(gòu)表征信息集合之間的共性度量結(jié)果確定為所述文本語(yǔ)義表征信息概率分布與所述文本結(jié)構(gòu)表征信息概率分布之間的共性度量結(jié)果。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,在將所述抽樣文本語(yǔ)義表征信息集合與所述抽樣文本結(jié)構(gòu)表征信息集合之間的共性度量結(jié)果確定為所述文本語(yǔ)義表征信息概率分布與所述文本結(jié)構(gòu)表征信息概率分布之間的共性度量結(jié)果之前,所述方法還包括:將所述抽樣文本語(yǔ)義表征信息集合中的任一個(gè)抽樣文本語(yǔ)義表征信息與所述抽樣文本結(jié)構(gòu)表征信息集合中的任一個(gè)抽樣文本結(jié)構(gòu)表征信息進(jìn)行融合操作,獲得多個(gè)抽樣表征信息二元組;確定每一所述抽樣表征信息二元組中抽樣文本語(yǔ)義表征信息與抽樣文本結(jié)構(gòu)表征信息之間的特征差異;確定和多個(gè)所述抽樣表征信息二元組的特征差異的和反向關(guān)聯(lián)的共性度量結(jié)果,確定為所述抽樣文本語(yǔ)義表征信息集合與所述抽樣文本結(jié)構(gòu)表征信息集合之間的共性度量結(jié)果。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,在將所述對(duì)應(yīng)的文本語(yǔ)義表征信息概率分布對(duì)應(yīng)的實(shí)體關(guān)系先驗(yàn)標(biāo)記所對(duì)應(yīng)的實(shí)體關(guān)聯(lián)信息作為所述多個(gè)實(shí)體之間的實(shí)體關(guān)聯(lián)信息之后,所述方法還包括:獲取所述板材產(chǎn)品知識(shí)文本中每個(gè)融合文本窗口的覆蓋字符數(shù),以及對(duì)每一所述融合文本窗口進(jìn)行依據(jù)覆蓋字符數(shù)的遞減順序排列,得到排列序列;將排列序列中位于前面的多個(gè)融合文本窗口進(jìn)行依據(jù)共性度量結(jié)果的遞減順序排列;其中,所述共性度量結(jié)果用于確定所述融合文本窗口中多個(gè)實(shí)體之間的實(shí)體關(guān)聯(lián)信息;將位于前面的融合文本窗口中的所述多個(gè)實(shí)體之間的實(shí)體關(guān)聯(lián)信息,作為所述板材產(chǎn)品知識(shí)文本的屬性信息。
9.根據(jù)權(quán)利要求1~8任一項(xiàng)所述的方法,其特征在于,確定所述融合文本窗口中多個(gè)實(shí)體之間的實(shí)體關(guān)聯(lián)信息的實(shí)體關(guān)聯(lián)信息推理組件包括文本結(jié)構(gòu)推理組件、文本語(yǔ)義推理組件以及樣例比較組件;確定板材產(chǎn)品知識(shí)文本中包括多個(gè)實(shí)體的融合文本窗口之后,所述方法還包括:獲取調(diào)校所述實(shí)體關(guān)聯(lián)信息推理組件的第一學(xué)習(xí)樣例以及第二學(xué)習(xí)樣例;其中,所述第一學(xué)習(xí)樣例包括融合文本窗口樣例以及所述融合文本窗口樣例的實(shí)際實(shí)體關(guān)系先驗(yàn)標(biāo)記,所述第二學(xué)習(xí)樣例包括所述融合文本窗口樣例以及所述融合文本窗口樣例的不相關(guān)實(shí)體關(guān)系先驗(yàn)標(biāo)記,所述實(shí)際實(shí)體關(guān)系先驗(yàn)標(biāo)記以及所述不相關(guān)實(shí)體關(guān)系先驗(yàn)標(biāo)記構(gòu)成實(shí)體關(guān)系先驗(yàn)標(biāo)記集合;將所述融合文本窗口樣例在所述文本結(jié)構(gòu)推理組件中進(jìn)行第一前饋計(jì)算,以及將所述第一學(xué)習(xí)樣例中的實(shí)際實(shí)體關(guān)系先驗(yàn)標(biāo)記在所述文本語(yǔ)義推理組件中進(jìn)行第二前饋計(jì)算;將所述第一前饋計(jì)算的計(jì)算值與所述第二前饋計(jì)算的計(jì)算值在所述樣例比較組件中進(jìn)行前饋計(jì)算,得到所述融合文本窗口樣例與所述實(shí)際實(shí)體關(guān)系先驗(yàn)標(biāo)記的第一共性度量結(jié)果;將所述融合文本窗口樣例在所述文本結(jié)構(gòu)推理組件中進(jìn)行第三前饋計(jì)算,以及將所述第二學(xué)習(xí)樣例中的不相關(guān)實(shí)體關(guān)系先驗(yàn)標(biāo)記在所述文本語(yǔ)義推理組件中進(jìn)行第四前饋計(jì)算;將所述第三前饋計(jì)算的計(jì)算值與所述第四前饋計(jì)算的計(jì)算值在所述樣例比較組件中進(jìn)行前饋計(jì)算,得到所述融合文本窗口樣例與所述不相關(guān)實(shí)體關(guān)系先驗(yàn)標(biāo)記的第二共性度量結(jié)果;將所述第一共性度量結(jié)果、以及所述第二共性度量結(jié)果在所述實(shí)體關(guān)聯(lián)信息推理組件中梯度下降更新,以確定調(diào)校誤差值最低時(shí)所述實(shí)體關(guān)聯(lián)信息推理組件的參數(shù)更新量,以及依據(jù)所述參數(shù)更新量對(duì)所述實(shí)體關(guān)聯(lián)信息推理組件的參數(shù)進(jìn)行迭代;其中,所述將所述第一共性度量結(jié)果、以及所述第二共性度量結(jié)果在所述實(shí)體關(guān)聯(lián)信息推理組件中梯度下降更新,包括:確定所述第一前饋計(jì)算的計(jì)算值與參考概率分布之間的第一度量值;確定所述第二前饋計(jì)算的計(jì)算值與所述參考概率分布之間的第二度量值;確定和所述第一共性度量結(jié)果具有反向關(guān)聯(lián)關(guān)系,同時(shí)和所述第一度量值、所述第二度量值、以及所述第二共性度量結(jié)果具有正向關(guān)聯(lián)關(guān)系的調(diào)校誤差值,以在所述實(shí)體關(guān)聯(lián)信息推理組件中進(jìn)行梯度下降更新。
10.一種計(jì)算機(jī)系統(tǒng),其特征在于,包括:?一個(gè)或多個(gè)處理器;存儲(chǔ)器;一個(gè)或多個(gè)計(jì)算機(jī)程序;其中所述一個(gè)或多個(gè)計(jì)算機(jī)程序被存儲(chǔ)在所述存儲(chǔ)器中并被配置為由所述一個(gè)或多個(gè)處理器執(zhí)行,所述一個(gè)或多個(gè)計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1~9任一項(xiàng)所述的方法。