本發(fā)明涉及數(shù)字樣機(jī)計(jì)算機(jī)程序,特別是涉及一種基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取方法、裝置、介質(zhì)及設(shè)備。
背景技術(shù):
1、現(xiàn)有技術(shù)中,針對(duì)數(shù)字樣機(jī)的數(shù)據(jù)抽取常常使用基于查詢的數(shù)據(jù)抽取、基于日志的數(shù)據(jù)抽取、基于變更數(shù)據(jù)捕獲(change?data?capture,cdc)的數(shù)據(jù)抽取、文件抽取、基于應(yīng)用程序接口的數(shù)據(jù)抽取、和基于服務(wù)總線的數(shù)據(jù)抽取等,這些數(shù)據(jù)抽取方法可以實(shí)現(xiàn)針對(duì)不同數(shù)據(jù)源,從結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中進(jìn)行數(shù)據(jù)抽取其存在的缺點(diǎn)包括:技術(shù)更新迭代提高了運(yùn)維成本;數(shù)據(jù)格式多樣;技術(shù)標(biāo)準(zhǔn)不統(tǒng)一;系統(tǒng)與服務(wù)的界限模糊,不利于開(kāi)發(fā)及維護(hù);服務(wù)的接口協(xié)議不固定,種類繁多,不利于系統(tǒng)維護(hù);抽取的服務(wù)粒度過(guò)大,系統(tǒng)與服務(wù)之間耦合性高;系統(tǒng)集成難度大等。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明提供了一種基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取方法、裝置、介質(zhì)及設(shè)備,其繼承了深度學(xué)習(xí)方法的優(yōu)勢(shì),無(wú)需特征工程,使用詞向量以及字符向量就可以達(dá)到很好的效果,如果有高質(zhì)量的詞典特征,能夠進(jìn)一步獲得提高,從而更加適于實(shí)用。
2、為了達(dá)到上述第一個(gè)目的,本發(fā)明提供的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取方法的技術(shù)方案如下:
3、本發(fā)明提供的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取方法包括以下步驟:
4、構(gòu)建基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)的領(lǐng)域模型;
5、針對(duì)所述基于領(lǐng)域模型的數(shù)字樣機(jī)的特征進(jìn)行識(shí)別,得到經(jīng)過(guò)特征識(shí)別的基于領(lǐng)域模型的數(shù)字樣機(jī);
6、對(duì)所述經(jīng)過(guò)特征識(shí)別的基于領(lǐng)域模型的數(shù)字樣機(jī)進(jìn)行參數(shù)提取,得到基于領(lǐng)域模型的數(shù)字樣機(jī)參數(shù);
7、針對(duì)所述基于領(lǐng)域模型的數(shù)字樣機(jī)參數(shù)進(jìn)行數(shù)據(jù)處理,得到經(jīng)過(guò)處理的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù);
8、針對(duì)所述經(jīng)過(guò)處理的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)進(jìn)行數(shù)據(jù)質(zhì)量檢查,得到具有設(shè)定質(zhì)量的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù);
9、加載所述具有設(shè)定質(zhì)量的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù),得到抽取所得的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)。
10、本發(fā)明提供的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取方法還可采用以下技術(shù)措施進(jìn)一步實(shí)現(xiàn)。
11、作為優(yōu)選,所述構(gòu)建基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)的領(lǐng)域模型的關(guān)鍵要點(diǎn)包括領(lǐng)域業(yè)務(wù)需求、領(lǐng)域知識(shí)收集、實(shí)體識(shí)別與值對(duì)象識(shí)別、領(lǐng)域模型構(gòu)建、模型的迭代與進(jìn)化中的一種或者多種。
12、作為優(yōu)選,所述針對(duì)所述基于領(lǐng)域模型的數(shù)字樣機(jī)的特征進(jìn)行識(shí)別,得到經(jīng)過(guò)特征識(shí)別的基于領(lǐng)域模型的數(shù)字樣機(jī)的步驟過(guò)程中,待識(shí)別的特征包括幾何特征、功能特征、性能特征、多領(lǐng)域綜合分析、全生命周期涵蓋數(shù)字樣機(jī)的仿真能力評(píng)估中的一種或者多種。
13、作為優(yōu)選,對(duì)所述經(jīng)過(guò)特征識(shí)別的基于領(lǐng)域模型的數(shù)字樣機(jī)進(jìn)行參數(shù)提取,得到基于領(lǐng)域模型的數(shù)字樣機(jī)參數(shù)依次包括:確定待提取目標(biāo)、選擇與所述待提取目標(biāo)相適配的領(lǐng)域模型、建立提取方法、準(zhǔn)確性和完整性檢查。
14、作為優(yōu)選,針對(duì)所述基于領(lǐng)域模型的數(shù)字樣機(jī)參數(shù)進(jìn)行數(shù)據(jù)處理,得到經(jīng)過(guò)處理的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)依次包括數(shù)據(jù)識(shí)別與范圍、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換。
15、作為優(yōu)選,針對(duì)所述經(jīng)過(guò)處理的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)進(jìn)行數(shù)據(jù)質(zhì)量檢查,得到具有設(shè)定質(zhì)量的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)具體為,通過(guò)建立數(shù)據(jù)質(zhì)量監(jiān)控體系,對(duì)具有設(shè)定質(zhì)量的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)進(jìn)行持續(xù)監(jiān)控和評(píng)估,發(fā)現(xiàn)并及時(shí)處理存在質(zhì)量問(wèn)題的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù),確保所述基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)持續(xù)處于設(shè)定質(zhì)量。
16、作為優(yōu)選,加載所述具有設(shè)定質(zhì)量的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù),得到抽取所得的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)包括設(shè)計(jì)元素的加載、構(gòu)型管理和空間屬性的加載、性能模擬與仿真工具的集成,以及,數(shù)字樣機(jī)的應(yīng)用加載中第一種或者多種。
17、為了達(dá)到上述第二個(gè)目的,本發(fā)明提供的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取裝置的技術(shù)方案如下:
18、本發(fā)明提供的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取裝置包括:
19、領(lǐng)域模型構(gòu)建模塊,用于構(gòu)建基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)的領(lǐng)域模型;
20、特征識(shí)別模塊,用于針對(duì)所述基于領(lǐng)域模型的數(shù)字樣機(jī)的特征進(jìn)行識(shí)別,得到經(jīng)過(guò)特征識(shí)別的基于領(lǐng)域模型的數(shù)字樣機(jī);
21、參數(shù)提取模塊,用于對(duì)所述經(jīng)過(guò)特征識(shí)別的基于領(lǐng)域模型的數(shù)字樣機(jī)進(jìn)行參數(shù)提取,得到基于領(lǐng)域模型的數(shù)字樣機(jī)參數(shù);
22、數(shù)據(jù)處理模塊,用于針對(duì)所述基于領(lǐng)域模型的數(shù)字樣機(jī)參數(shù)進(jìn)行數(shù)據(jù)處理,得到經(jīng)過(guò)處理的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù);
23、質(zhì)量檢查模塊,用于針對(duì)所述經(jīng)過(guò)處理的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)進(jìn)行數(shù)據(jù)質(zhì)量檢查,得到具有設(shè)定質(zhì)量的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù);
24、數(shù)字樣機(jī)數(shù)據(jù)加載模塊,用于加載所述具有設(shè)定質(zhì)量的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù),得到抽取所得的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)。
25、為了達(dá)到上述第三個(gè)目的,本發(fā)明提供的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的技術(shù)方案如下:
26、本發(fā)明提供的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取程序,所述基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)本發(fā)明提供的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取方法的步驟。
27、為了達(dá)到上述第四個(gè)目的,本發(fā)明提供的電子設(shè)備的技術(shù)方案如下:
28、本發(fā)明提供的電子設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器上存儲(chǔ)有基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取程序,所述基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取程序被所述處理器執(zhí)行時(shí),實(shí)現(xiàn)本發(fā)明提供的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取方法的步驟。
29、與現(xiàn)有技術(shù)相比,本發(fā)明提供的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取方法、裝置、介質(zhì)及設(shè)備具有明顯的優(yōu)勢(shì):
30、數(shù)據(jù)一致性和準(zhǔn)確性:通過(guò)領(lǐng)域模型對(duì)數(shù)字樣機(jī)數(shù)據(jù)進(jìn)行抽取,可以確保數(shù)據(jù)的一致性和準(zhǔn)確性。領(lǐng)域模型定義了數(shù)據(jù)的結(jié)構(gòu)和關(guān)系,使得數(shù)據(jù)抽取過(guò)程更加規(guī)范和可控。
31、提高數(shù)據(jù)利用效率:基于領(lǐng)域模型的數(shù)據(jù)抽取能夠針對(duì)特定需求提取有用信息,減少不必要的數(shù)據(jù)冗余,從而提高數(shù)據(jù)的利用效率。
32、支持復(fù)雜數(shù)據(jù)分析:領(lǐng)域模型為數(shù)據(jù)分析提供了清晰的框架,使得對(duì)數(shù)字樣機(jī)中復(fù)雜數(shù)據(jù)的分析變得更加容易和高效。這有助于發(fā)現(xiàn)數(shù)據(jù)中的隱藏模式和關(guān)聯(lián),為產(chǎn)品設(shè)計(jì)、制造等提供有力支持。
33、可重用性和可移植性:一旦建立了領(lǐng)域模型,就可以在不同的項(xiàng)目或場(chǎng)景中重用該模型進(jìn)行數(shù)據(jù)抽取。這降低了重復(fù)勞動(dòng)的成本,并提高了數(shù)據(jù)抽取技術(shù)的可移植性。
34、快速響應(yīng)變化:領(lǐng)域模型具有一定的靈活性和可擴(kuò)展性,可以根據(jù)需求的變化進(jìn)行調(diào)整和優(yōu)化。這使得基于領(lǐng)域模型的數(shù)據(jù)抽取技術(shù)能夠快速響應(yīng)市場(chǎng)和技術(shù)的發(fā)展變化。
35、本發(fā)明提供的基于領(lǐng)域模型的數(shù)字樣機(jī)數(shù)據(jù)抽取方法、裝置、介質(zhì)及設(shè)備通過(guò)構(gòu)建的統(tǒng)一領(lǐng)域模型,具有很好的靈活性和可擴(kuò)展性,可以根據(jù)需求的變化進(jìn)行調(diào)整和優(yōu)化。這使得基于領(lǐng)域模型的數(shù)據(jù)抽取技術(shù)能夠快速響應(yīng)市場(chǎng)和技術(shù)的發(fā)展變化。模型繼承了深度學(xué)習(xí)方法的優(yōu)勢(shì),無(wú)需特征工程,使用詞向量以及字符向量就可以達(dá)到很好的效果,如果有高質(zhì)量的詞典特征,能夠進(jìn)一步獲得提高。