本發(fā)明涉及自然語(yǔ)言處理,更具體的說(shuō)是涉及基于跨粒度特征交叉融合的國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)估方法。
背景技術(shù):
1、在全球化的背景下,隨著全球經(jīng)濟(jì)一體化進(jìn)程的加快,不同國(guó)家和地區(qū)之間的貿(mào)易往來(lái)日益頻繁,需要有一套共同認(rèn)可的標(biāo)準(zhǔn)來(lái)保證產(chǎn)品的互換性和兼容性,國(guó)際標(biāo)準(zhǔn)的引入和轉(zhuǎn)化也成為推動(dòng)科技進(jìn)步和經(jīng)濟(jì)發(fā)展的重要手段,成為確保產(chǎn)品和服務(wù)的質(zhì)量、安全以及促進(jìn)國(guó)際貿(mào)易的重要抓手。近年來(lái),隨著技術(shù)的發(fā)展和國(guó)際合作的加深,國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化為國(guó)內(nèi)標(biāo)準(zhǔn)的趨勢(shì)日益顯著,許多國(guó)家和地區(qū)通過(guò)引進(jìn)先進(jìn)的國(guó)際標(biāo)準(zhǔn),來(lái)提升了自身的技術(shù)水平和競(jìng)爭(zhēng)力。然而,由于各國(guó)法律、文化和市場(chǎng)環(huán)境的差異,國(guó)際標(biāo)準(zhǔn)在轉(zhuǎn)化為國(guó)內(nèi)標(biāo)準(zhǔn)時(shí)常面臨諸多挑戰(zhàn),如技術(shù)需求的不一致、知識(shí)產(chǎn)權(quán)保護(hù)機(jī)制的差異、以及本地化適應(yīng)性等問(wèn)題。因此,對(duì)國(guó)際標(biāo)準(zhǔn)進(jìn)行合理的評(píng)估和轉(zhuǎn)化,制定符合國(guó)內(nèi)市場(chǎng)需求的技術(shù)標(biāo)準(zhǔn),已成為各國(guó)在國(guó)際標(biāo)準(zhǔn)引進(jìn)過(guò)程中必須面對(duì)的重要課題,這不僅有助于減少技術(shù)轉(zhuǎn)化中的摩擦和障礙,也有助于促進(jìn)科技創(chuàng)新和產(chǎn)業(yè)升級(jí),從而增強(qiáng)國(guó)家的科技實(shí)力和國(guó)際競(jìng)爭(zhēng)力。
2、目前國(guó)際標(biāo)準(zhǔn)進(jìn)行轉(zhuǎn)化的評(píng)估工作主要依靠專家商討評(píng)估,存在轉(zhuǎn)化周期較長(zhǎng)、評(píng)估復(fù)雜度較高等問(wèn)題,隨著近年來(lái)人工智能及機(jī)器學(xué)習(xí)領(lǐng)域技術(shù)的快速發(fā)展,如何使用機(jī)器學(xué)習(xí)算法對(duì)國(guó)外標(biāo)準(zhǔn)進(jìn)行自動(dòng)評(píng)估成為研究的熱點(diǎn)難點(diǎn)問(wèn)題。
3、因此,如何提高國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)估的效率是本領(lǐng)域技術(shù)人員亟需解決的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明提供了一種基于跨粒度特征交叉融合的國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)估方法,使用深度學(xué)習(xí)算法有效提高國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)估效率、合理性和準(zhǔn)確性。
2、為了實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
3、基于跨粒度特征交叉融合的國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)估方法,包括以下步驟:
4、步驟1:采集規(guī)范類國(guó)際標(biāo)準(zhǔn)文本,構(gòu)建國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)價(jià)指標(biāo)體系;
5、步驟2:根據(jù)規(guī)范類國(guó)際標(biāo)準(zhǔn)文本,構(gòu)建國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)估數(shù)據(jù)集;
6、步驟3:根據(jù)cnn網(wǎng)絡(luò)、bert網(wǎng)絡(luò)和雙向長(zhǎng)短期記憶網(wǎng)絡(luò)構(gòu)建跨粒度特征交叉融合指標(biāo)分類模型;
7、步驟4:利用國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)估數(shù)據(jù)集訓(xùn)練跨粒度特征交叉融合指標(biāo)分類模型;
8、步驟5:構(gòu)建指標(biāo)賦分規(guī)則;
9、步驟6:將待評(píng)估國(guó)際標(biāo)準(zhǔn)文本輸入訓(xùn)練后的跨粒度特征交叉融合指標(biāo)分類模型,獲得文本預(yù)測(cè)分類,結(jié)合指標(biāo)賦分規(guī)則計(jì)算評(píng)估結(jié)果。
10、優(yōu)選的,步驟1的具體實(shí)現(xiàn)過(guò)程為:
11、步驟11:采集規(guī)范類國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化文本并進(jìn)行拆解分析,選定一級(jí)指標(biāo)和二級(jí)指標(biāo);
12、步驟12:對(duì)一級(jí)指標(biāo)和二級(jí)指標(biāo)進(jìn)行映射,構(gòu)建國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)價(jià)指標(biāo)體系。
13、優(yōu)選的,選定4個(gè)一級(jí)指標(biāo)和14個(gè)二級(jí)指標(biāo);一級(jí)指標(biāo)包括:否決項(xiàng)、綜合環(huán)境、技術(shù)內(nèi)容和預(yù)期效益;二級(jí)指標(biāo)包括不符合法規(guī)和制度、不符合基本自然條件、不符合產(chǎn)業(yè)需求和環(huán)境、技術(shù)內(nèi)容不適應(yīng)、政策環(huán)境、自然條件、人文因素、產(chǎn)業(yè)結(jié)構(gòu)匹配度、先進(jìn)性、適應(yīng)性、協(xié)調(diào)性、經(jīng)濟(jì)效益、社會(huì)效益和生態(tài)環(huán)境效益;其中否決項(xiàng)映射不符合法規(guī)和制度、不符合基本自然條件、不符合產(chǎn)業(yè)需求和環(huán)境、技術(shù)內(nèi)容不適應(yīng),綜合環(huán)境映射政策環(huán)境、自然條件、人文因素和產(chǎn)業(yè)結(jié)構(gòu)匹配度,技術(shù)內(nèi)容映射先進(jìn)性、適應(yīng)性和協(xié)調(diào)性,預(yù)期效益映射經(jīng)濟(jì)效益、社會(huì)效益和生態(tài)環(huán)境效益。
14、優(yōu)選的,步驟2的具體實(shí)現(xiàn)過(guò)程為:
15、步驟21:將國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)價(jià)指標(biāo)體系中的一級(jí)指標(biāo)映射為標(biāo)簽一,二級(jí)指標(biāo)映射為標(biāo)簽二,并對(duì)標(biāo)簽一和標(biāo)簽二進(jìn)行標(biāo)注;
16、步驟22:對(duì)規(guī)范類國(guó)際標(biāo)準(zhǔn)文本進(jìn)行語(yǔ)句拆解,獲得若干標(biāo)準(zhǔn)文本語(yǔ)句,根據(jù)所有標(biāo)準(zhǔn)文本語(yǔ)句及其對(duì)應(yīng)的標(biāo)簽一和標(biāo)簽二的標(biāo)注構(gòu)建國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)估數(shù)據(jù)集。
17、優(yōu)選的,將4個(gè)一級(jí)指標(biāo)的標(biāo)簽一分別標(biāo)注為0、1、2、3,將14個(gè)二級(jí)指標(biāo)的標(biāo)簽二分別標(biāo)注為a、b、c、d、e、f、g、h、i、j、k、l、m、n;國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)估數(shù)據(jù)集的形式為[標(biāo)簽一標(biāo)注,標(biāo)簽二標(biāo)注,標(biāo)準(zhǔn)文本語(yǔ)句]。
18、優(yōu)選的,步驟3中構(gòu)建的跨粒度特征交叉融合指標(biāo)分類模型包括詞嵌入與特征抽取網(wǎng)絡(luò)、跨粒度注意力模塊、字符特征矩陣維度映射網(wǎng)絡(luò)a、字符特征矩陣維度映射網(wǎng)絡(luò)b、多層次字符信息抽取模塊、跨域信息交叉模塊和指標(biāo)映射網(wǎng)絡(luò);國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)估數(shù)據(jù)集輸入詞嵌入于特征抽取網(wǎng)絡(luò),輸出特征;特征輸入字符特征矩陣維度映射網(wǎng)絡(luò)a,輸出特征;特征輸入跨粒度注意力模塊,輸出特征;特征輸入多層次字符信息抽取模塊中,輸出特征;特征輸入字符特征矩陣維度映射網(wǎng)絡(luò)b,輸出特征;特征和特征輸入跨域信息交叉模塊,輸出得到特征和特征;特征和特征輸入指標(biāo)映射網(wǎng)絡(luò),得到特征和特征作為文本預(yù)測(cè)分類。
19、優(yōu)選的,詞嵌入與特征抽取網(wǎng)絡(luò)包括填充模塊和bert預(yù)訓(xùn)練模型;國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)估數(shù)據(jù)集輸入至填充模塊,對(duì)每條數(shù)據(jù)填0補(bǔ)位至設(shè)定字符數(shù),獲得增強(qiáng)數(shù)據(jù);將增強(qiáng)數(shù)據(jù)輸入至bert預(yù)訓(xùn)練模型,對(duì)字符進(jìn)行詞嵌入與特征初步抽取,獲得特征,,表示特征的維度。
20、優(yōu)選的,字符特征矩陣維度映射網(wǎng)絡(luò)a和字符特征矩陣維度映射網(wǎng)絡(luò)b均包括第一卷積模塊、第二卷積模塊、第三卷積模塊、拼接模塊和維度映射模塊;在字符特征矩陣維度映射網(wǎng)絡(luò)a中,特征輸入第一卷積模塊,輸出得到特征,特征分別輸入第二卷積模塊和第三卷積模塊,分別輸出特征和特征,特征和特征均輸入拼接模塊,輸出特征,特征輸入維度映射模塊,輸出;在字符特征矩陣維度映射網(wǎng)絡(luò)b中,特征輸入第一卷積模塊,依次經(jīng)過(guò)第二卷積模塊、第三卷積模塊、拼接模塊和維度映射模塊,輸出特征。
21、優(yōu)選的,跨粒度注意力模塊包括拆分模塊、若干雙向長(zhǎng)短期記憶模塊、拼接模塊、層歸一化模塊、全連接層一、全連接層二、全連接層三、若干形狀重塑模塊和若干矩陣相乘模塊;特征輸入到拆分模塊,輸出特征,特征輸入到第i個(gè)雙向長(zhǎng)短期記憶模塊中,輸出特征,特征輸入到拼接模塊中,輸出特征,特征輸入到層歸一化模塊中,輸出特征,特征分別輸入全連接層一、全連接層二和全連接層三,分別輸出特征、特征和特征,特征輸入第一個(gè)形狀重塑模塊中,輸出特征,特征輸入第二個(gè)形狀重塑模塊中,輸出特征,特征和特征同時(shí)輸入到第一個(gè)矩陣相乘模塊中,輸出特征,特征輸入第三個(gè)形狀重塑模塊中,輸出特征,將特征和特征同時(shí)輸入到第二個(gè)矩陣相乘模塊中,輸出特征,將特征輸入第四個(gè)形狀重塑模塊中,輸出重塑后的特征。
22、優(yōu)選的,多層次字符信息抽取模塊包括層歸一化模塊、第一部分卷積模塊、第二部分卷積模塊、第三部分卷積模塊、第一深度卷積模塊、第二深度卷積模塊、gelu激活模塊、若干矩陣相加模塊、第一反卷積模塊、第二反卷積模塊、平均池化模塊、若干矩陣相乘模塊、拼接模塊和卷積模塊;特征輸入層歸一化模塊中,輸出特征,特征輸入第一部分卷積模塊中,輸出特征,特征輸入第一深度卷積模塊中,輸出特征,特征輸入第二部分卷積模塊中,輸出特征,特征輸入第二深度卷積模塊中,輸出特征,特征輸入gelu激活模塊中,輸出特征,特征和特征同時(shí)輸入第一個(gè)矩陣相加模塊中,輸出特征,特征輸入第三部分卷積模塊中,輸出特征,特征輸入第一反卷積模塊中,輸出特征,特征輸入平均池化模塊中,輸出特征,特征輸入第二反卷積模塊中,輸出特征,特征和特征同時(shí)輸入第一個(gè)矩陣相乘模塊中,輸出特征,特征和特征同時(shí)輸入第二個(gè)矩陣相乘模塊中,輸出特征,特征和特征同時(shí)輸入拼接模塊中,輸出特征,將特征輸入卷積模塊中,輸出特征,特征和特征同時(shí)輸入第二個(gè)矩陣相加模塊中,輸出特征。
23、優(yōu)選的,跨域信息交叉模塊包括第一卷積模塊、第二卷積模塊、第三卷積模塊、第四卷積模塊、第五卷積模塊、第六卷積模塊、第七卷積模塊、第八卷積模塊、第一歸一化層、第二歸一化層、全連接層一、全連接層二、若干矩陣相乘模塊、sigmoid激活模塊和若干矩陣相加模塊;特征輸入第一卷積模塊中,輸出特征,將特征輸入第二卷積模塊中,輸出特征,將特征輸入第三卷積模塊中,輸出特征,將特征輸入第四卷積模塊中,輸出特征,將特征輸入第一歸一化層中,輸出特征,將特征輸入全連接層一中,輸出特征,將特征輸入第五卷積模塊中,輸出特征,將特征輸入第六卷積模塊中,輸出特征,將特征輸入第七卷積模塊中,輸出特征,將特征輸入第八卷積模塊中,輸出特征,將特征輸入第二歸一化層中,輸出特征,將特征輸入全連接層二中,輸出特征,將特征和特征同時(shí)輸入第一個(gè)矩陣相乘模塊中,輸出特征,將特征輸入sigmoid激活模塊中,輸出特征,將特征和特征同時(shí)輸入第二個(gè)矩陣相乘模塊中,輸出特征,將特征和特征同時(shí)輸入第三個(gè)矩陣相乘模塊中,輸出特征,將特征和特征同時(shí)輸入第一個(gè)矩陣相加模塊中,輸出特征,將特征和特征同時(shí)輸入第二個(gè)矩陣相加模塊中,輸出特征;其中,特征,特征。
24、優(yōu)選的,指標(biāo)映射網(wǎng)絡(luò)包括第一卷積模塊、第二卷積模塊、第三卷積模塊、第四卷積模塊、若干形狀重塑模塊、第一全連接模塊、第二全連接模塊、第三全連接模塊、第四全連接模塊、第五全連接模塊、第六全連接模塊、第七全連接模塊、第一softmax激活模塊和第二softmax激活模塊;將特征輸入第一卷積模塊中,輸出特征,將特征輸入第二卷積模塊中,輸出特征,將特征輸入第三卷積模塊中,輸出特征,將特征輸入第四卷積模塊中,輸出特征,將特征輸入第一個(gè)形狀重塑模塊中,輸出特征,將特征輸入第二個(gè)形狀重塑模塊中,輸出特征,將特征輸入第一全連接模塊中,輸出特征,將特征輸入第二全連接模塊中,輸出特征,將特征輸入第三全連接模塊中,輸出特征,將特征輸入第四全連接模塊中,輸出特征,將特征輸入第一softmax激活模塊中,輸出特征,將特征輸入第五全連接模塊中,輸出特征,將特征輸入第六全連接模塊中,輸出特征,將特征輸入第七全連接模塊中,輸出特征,將特征輸入第二softmax激活模塊中,輸出特征;其中,特征,特征。
25、優(yōu)選的,步驟4在訓(xùn)練過(guò)程中采用交叉熵?fù)p失函數(shù)分別計(jì)算標(biāo)簽一分類損失和標(biāo)簽二分類損失,標(biāo)簽一分類損失和標(biāo)簽二分類損失加和計(jì)算模型損失函數(shù),并采用sgd優(yōu)化器進(jìn)行梯度優(yōu)化。
26、優(yōu)選的,步驟5中為每一個(gè)二級(jí)指標(biāo)賦予分值,構(gòu)建指標(biāo)賦分規(guī)則。
27、優(yōu)選的,步驟6的具體實(shí)現(xiàn)過(guò)程為:
28、步驟61:將待評(píng)估國(guó)際標(biāo)準(zhǔn)文本拆分成若干組標(biāo)準(zhǔn)文本語(yǔ)句,將所有標(biāo)準(zhǔn)文本語(yǔ)句輸入訓(xùn)練后的跨粒度特征交叉融合指標(biāo)分類模型,每組標(biāo)準(zhǔn)文本語(yǔ)句對(duì)應(yīng)獲得一組特征和特征;
29、步驟62:根據(jù)每組標(biāo)準(zhǔn)文本語(yǔ)句的特征匹配對(duì)應(yīng)的一級(jí)指標(biāo),根據(jù)匹配結(jié)果設(shè)置掩碼矩陣,將掩碼矩陣與特征相乘,獲得丟棄向量a;
30、步驟63:將指標(biāo)賦分規(guī)則轉(zhuǎn)換成分值矩陣g;
31、步驟64:計(jì)算每個(gè)標(biāo)準(zhǔn)文本語(yǔ)句的丟棄向量a和分值矩陣g相乘的乘積結(jié)果;
32、步驟65:根據(jù)所有標(biāo)準(zhǔn)文本語(yǔ)句的乘積結(jié)果的平均值計(jì)算評(píng)估分?jǐn)?shù),結(jié)合設(shè)定評(píng)估閾值,獲得評(píng)估結(jié)果。
33、優(yōu)選的,步驟62中特征為一個(gè)由4個(gè)值組成的一維向量,表示標(biāo)簽一的預(yù)測(cè)分類結(jié)果,特征為一個(gè)由14個(gè)值組成的一維向量,表示標(biāo)簽二的預(yù)測(cè)分類結(jié)果;當(dāng)特征中最大值為第一個(gè)值時(shí),設(shè)置掩碼矩陣為全零向量,當(dāng)特征中最大值不是第一個(gè)值時(shí),將最大值匹配的一級(jí)指標(biāo)映射的二級(jí)指標(biāo)對(duì)應(yīng)的標(biāo)簽二全部設(shè)置為1,其他二級(jí)指標(biāo)對(duì)應(yīng)的標(biāo)簽二全部設(shè)置為0,構(gòu)建掩碼矩陣。
34、優(yōu)選的,計(jì)算評(píng)估分?jǐn)?shù)score的表達(dá)式為:
35、
36、其中,a表示丟棄向量;g表示分值矩陣;n表示標(biāo)準(zhǔn)文本語(yǔ)句的數(shù)量。
37、經(jīng)由上述的技術(shù)方案可知,與現(xiàn)有技術(shù)相比,本發(fā)明公開提供了一種基于跨粒度特征交叉融合的國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)估方法,構(gòu)建國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)估體系,并將國(guó)際標(biāo)準(zhǔn)轉(zhuǎn)化評(píng)估體系映射為數(shù)據(jù)標(biāo)簽,并將評(píng)估任務(wù)轉(zhuǎn)換為指標(biāo)分類問(wèn)題,進(jìn)而使用深度學(xué)習(xí)模型對(duì)指標(biāo)進(jìn)行訓(xùn)練學(xué)習(xí),通過(guò)模型輸出指標(biāo)分類結(jié)果再根據(jù)指標(biāo)分類結(jié)果對(duì)國(guó)際標(biāo)準(zhǔn)文本進(jìn)行評(píng)估打分,依據(jù)分?jǐn)?shù)判斷國(guó)際標(biāo)準(zhǔn)文本是否可被轉(zhuǎn)化為國(guó)家標(biāo)準(zhǔn)。本發(fā)明中的深度學(xué)習(xí)模型結(jié)合使用跨層次、跨粒度特征抽取算法對(duì)特征進(jìn)行處理,同時(shí)使用包含時(shí)間步的雙向長(zhǎng)短期記憶模塊對(duì)上下文特征進(jìn)行學(xué)習(xí),使最終分類特征更精準(zhǔn),從而令評(píng)估結(jié)果更合理,可以有效提高國(guó)際標(biāo)準(zhǔn)文本轉(zhuǎn)化評(píng)估過(guò)程的效率,在相同時(shí)間內(nèi)實(shí)現(xiàn)對(duì)大量國(guó)際標(biāo)準(zhǔn)文本轉(zhuǎn)化的準(zhǔn)確評(píng)估。