本發(fā)明涉及檔案管理,具體為一種多模態(tài)數(shù)據(jù)融合歸檔后獨(dú)立應(yīng)用的方法及系統(tǒng)。
背景技術(shù):
1、隨著社會(huì)經(jīng)濟(jì)的發(fā)展,社會(huì)化生產(chǎn)方式已經(jīng)開始向數(shù)字化、智能化發(fā)展,廣泛使用在各行各業(yè)的數(shù)字化應(yīng)用系統(tǒng)中,通常會(huì)使用電子檔案對(duì)其進(jìn)行管理,在業(yè)務(wù)系統(tǒng)中,會(huì)出現(xiàn)不同類型的模態(tài)數(shù)據(jù)(例如:文本、圖像、音頻等);
2、但是,當(dāng)多模態(tài)數(shù)據(jù)歸檔后進(jìn)行獨(dú)立使用時(shí),通常無法充分利用融合后的數(shù)據(jù)優(yōu)勢(shì),導(dǎo)致部分模態(tài)數(shù)據(jù)的功能和價(jià)值未被有效發(fā)揮;當(dāng)多模態(tài)數(shù)據(jù)融合后,某些模態(tài)數(shù)據(jù)可能會(huì)形成“孤島”,無法與其他數(shù)據(jù)集進(jìn)行有效互動(dòng)和分析,維護(hù)多模態(tài)融合系統(tǒng)的權(quán)限管理和數(shù)據(jù)獨(dú)立應(yīng)用功能可能需要較高的技術(shù)支持和成本,例如:用戶在獨(dú)立應(yīng)用時(shí)可能需要多次認(rèn)證或不同的訪問路徑,導(dǎo)致管理的復(fù)雜性增加。
技術(shù)實(shí)現(xiàn)思路
1、(一)解決的技術(shù)問題
2、針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種多模態(tài)數(shù)據(jù)融合歸檔后獨(dú)立應(yīng)用的方法及系統(tǒng),系統(tǒng)包括:業(yè)務(wù)管理平臺(tái)、數(shù)據(jù)獲取及融合單元、歸檔管理單元、檢索分析單元以及存儲(chǔ)調(diào)用單元,通過將檔案定義為一個(gè)節(jié)點(diǎn),采用鏈?zhǔn)骄W(wǎng)絡(luò)結(jié)構(gòu),將多模態(tài)數(shù)據(jù)處理成歸檔包,實(shí)現(xiàn)了數(shù)據(jù)之間有效互動(dòng),通過目標(biāo)決策網(wǎng)絡(luò)對(duì)歸檔包的狀態(tài)數(shù)據(jù)進(jìn)行處理,計(jì)算出歸檔得分,并按照歸檔得分匹配對(duì)應(yīng)歸檔區(qū)間,同時(shí),設(shè)置出不同的調(diào)用層級(jí)對(duì)用戶進(jìn)行管理,在一定程度上,提升了管理的效率,通過設(shè)計(jì)評(píng)價(jià)因子判定管理的優(yōu)劣,解決了背景技術(shù)中提出的問題。
3、(二)技術(shù)方案
4、為實(shí)現(xiàn)以上目的,本發(fā)明通過以下技術(shù)方案予以實(shí)現(xiàn):
5、第一方面,本技術(shù)提出了一種多模態(tài)數(shù)據(jù)融合歸檔后獨(dú)立應(yīng)用的方法,該方法包括以下步驟:
6、s1,獲取輸入的多模態(tài)數(shù)據(jù),并將多模態(tài)數(shù)據(jù)進(jìn)行融合,生成目標(biāo)數(shù)據(jù)集;其中,輸入的多模態(tài)數(shù)據(jù)類型包括結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及物聯(lián)網(wǎng)數(shù)據(jù);
7、s2,將目標(biāo)數(shù)據(jù)集傳輸?shù)綐I(yè)務(wù)管理平臺(tái),設(shè)計(jì)鏈?zhǔn)骄W(wǎng)絡(luò)結(jié)構(gòu)開啟歸檔管理,生成歸檔包,并基于深度學(xué)習(xí)網(wǎng)絡(luò)搭建目標(biāo)決策網(wǎng)絡(luò),計(jì)算歸檔分值,根據(jù)歸檔分值匹配歸檔分區(qū)并進(jìn)行業(yè)務(wù)管理服務(wù);其中,業(yè)務(wù)管理平臺(tái)包括檔案組和用戶組,目標(biāo)決策網(wǎng)絡(luò)是對(duì)樣本環(huán)境進(jìn)行強(qiáng)化學(xué)習(xí)探索獲得,樣本環(huán)境是至少有兩個(gè)歷史歸檔包中對(duì)應(yīng)的信息構(gòu)成;
8、s3,進(jìn)入業(yè)務(wù)管理平臺(tái)進(jìn)行檢索與服務(wù)分析,在業(yè)務(wù)鏈條上進(jìn)行數(shù)據(jù)查詢,生成業(yè)務(wù)鏈條集合,并根據(jù)業(yè)務(wù)鏈條集合生成評(píng)價(jià)因子,對(duì)業(yè)務(wù)管理服務(wù)作出評(píng)價(jià);根據(jù)業(yè)務(wù)鏈條的節(jié)點(diǎn)信息,生成統(tǒng)計(jì)報(bào)表;其中,服務(wù)分析包括統(tǒng)計(jì)分析、查看詳情以及生成報(bào)表;
9、s4,檔案更新、修改以及存儲(chǔ)。
10、進(jìn)一步地,對(duì)多模態(tài)數(shù)據(jù)進(jìn)行融合的過程包括:
11、數(shù)據(jù)準(zhǔn)備:收集輸入的多模態(tài)數(shù)據(jù);
12、數(shù)據(jù)處理:對(duì)多模態(tài)數(shù)據(jù)進(jìn)行處理,處理包括:清洗、轉(zhuǎn)換、加載以及統(tǒng)一;
13、特征提取:對(duì)處理后的多模態(tài)數(shù)據(jù)進(jìn)行特征提取,提取的信息包括目標(biāo)要求、保存年限、文件機(jī)密、開放形式以及環(huán)境;
14、拼接特征:將多模態(tài)數(shù)據(jù)在不同特征層面進(jìn)行合并,并對(duì)特征進(jìn)行拼接;
15、數(shù)據(jù)標(biāo)準(zhǔn)化:將拼接的特征轉(zhuǎn)換為一維張量形式,生成目標(biāo)數(shù)據(jù)集。
16、進(jìn)一步地,歸檔管理的步驟包括:
17、將每一個(gè)檔案定義為一個(gè)節(jié)點(diǎn),采用鏈?zhǔn)骄W(wǎng)絡(luò)結(jié)構(gòu),通過鏈表遍歷檔案,并將檔案以及對(duì)應(yīng)的目標(biāo)數(shù)據(jù)集整合為歸檔包,根據(jù)若干歸檔包組成檔案組,并根據(jù)若干節(jié)點(diǎn)生成鏈?zhǔn)骄W(wǎng)絡(luò)結(jié)構(gòu)信息集合;其中,歸檔包至少包括:檔案id、檔案名稱、檔案列表、檔案內(nèi)容、存儲(chǔ)要求、存儲(chǔ)路徑以及創(chuàng)建日期;獲得歸檔包中對(duì)應(yīng)信息的歸檔分值,且歸檔分值是通過目標(biāo)決策網(wǎng)絡(luò)對(duì)歸檔包的狀態(tài)數(shù)據(jù)進(jìn)行處理得到的,狀態(tài)數(shù)據(jù)包括信息級(jí)數(shù)據(jù)和整體性數(shù)據(jù);
18、信息級(jí)數(shù)據(jù):對(duì)應(yīng)的信息的標(biāo)識(shí)、對(duì)應(yīng)的信息的數(shù)據(jù)類型、對(duì)應(yīng)的信息的歸檔狀態(tài)以及對(duì)應(yīng)的信息歸檔要求;其中,歸檔狀態(tài)包括未歸檔狀態(tài)和已歸檔狀態(tài);
19、整體級(jí)數(shù)據(jù):對(duì)應(yīng)的信息的重要程度、對(duì)應(yīng)的信息的敏感程度。
20、進(jìn)一步地,獲取歸檔分值的具體過程為:
21、從提取的特征信息中抽取目標(biāo)要求、保存年限、文件機(jī)密以及開放形式,并定義為關(guān)鍵因素,并賦予每個(gè)關(guān)鍵因素對(duì)應(yīng)的權(quán)重和分值,且權(quán)重和分值保持同步;
22、目標(biāo)要求:核心檔案,賦予權(quán)重ε3>重要檔案,賦予權(quán)重ε2>普通檔案,賦予權(quán)重ε1;
23、保存年限:長(zhǎng)期,賦予權(quán)重ε3>中期,賦予權(quán)重ε2>短期,賦予權(quán)重ε1;
24、基于目標(biāo)要求和保存年限,將對(duì)應(yīng)的每個(gè)因素的分值乘以其權(quán)重,再將所有結(jié)果相加,即可得到重要程度;
25、文件機(jī)密:商業(yè)秘密,賦予權(quán)重ε3>個(gè)人隱私,賦予權(quán)重ε2>其他敏感信息,賦予權(quán)重ε1;
26、開放形式:秘密審批,賦予權(quán)重ε3>內(nèi)部公開,賦予權(quán)重ε2>公開,賦予權(quán)重ε1;
27、基于文件機(jī)密和開放形式,將對(duì)應(yīng)的每個(gè)因素的分值乘以其權(quán)重,再將所有結(jié)果相加,即可得到敏感程度;
28、則生成歸檔分值,并根據(jù)歸檔分值匹配歸檔分區(qū),所依據(jù)的公式為:
29、;
30、式中,de表示歸檔分值,zy表示重要程度得分,mg表示敏感程度得分,β1和β2均為權(quán)重系數(shù),且β1和β2均>0。
31、進(jìn)一步地,歸檔區(qū)間的設(shè)置步驟包括:
32、將數(shù)據(jù)庫劃分為m個(gè)網(wǎng)格區(qū)間,并定義為歸檔區(qū)間,將數(shù)據(jù)庫中的存儲(chǔ)信息按照歸檔分值依次分配到m個(gè)歸檔區(qū)間內(nèi),對(duì)于任意一個(gè)歸檔區(qū)間設(shè)置相應(yīng)的調(diào)用權(quán)限;設(shè)置有n個(gè)調(diào)用層級(jí),且任意一個(gè)調(diào)用層級(jí)ni下有n個(gè)調(diào)用端口,根據(jù)層級(jí)設(shè)置不同的權(quán)限范圍。
33、進(jìn)一步地,進(jìn)行業(yè)務(wù)管理服務(wù)的步驟包括:
34、用戶進(jìn)行注冊(cè)或登錄,且用戶具有唯一用戶標(biāo)識(shí)id;
35、用戶登錄或注冊(cè)成功后,根據(jù)用戶加載對(duì)應(yīng)的主體屬性,包括員工、崗位以及職責(zé);根據(jù)主體屬性配置權(quán)限描述,且用戶標(biāo)識(shí)id被添加到用戶的權(quán)限描述中,根據(jù)權(quán)限描述進(jìn)行角色權(quán)限配置,對(duì)檔案組的檔案進(jìn)行管理,若不存在檔案組,通過業(yè)務(wù)管理平臺(tái)進(jìn)行檔案新增,并將用戶組的管理員設(shè)置為當(dāng)前權(quán)限描述中的用戶標(biāo)識(shí)id。
36、進(jìn)一步地,s3的步驟包括:
37、對(duì)用戶組進(jìn)行身份和權(quán)限驗(yàn)證,并基于rabc權(quán)限過濾;
38、根據(jù)用戶的權(quán)限信息進(jìn)行界面的菜單顯示;用戶組在對(duì)應(yīng)的界面使用檔案檢索和分析服務(wù),對(duì)檔案組進(jìn)行全局檢索、高級(jí)檢索以及查看;
39、通過數(shù)據(jù)庫查詢符合條件的鏈?zhǔn)骄W(wǎng)絡(luò)結(jié)構(gòu)信息集合,對(duì)符合要求的鏈?zhǔn)骄W(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行數(shù)據(jù)查詢,得到業(yè)務(wù)鏈條集合,業(yè)務(wù)鏈條集合包括查詢向量、鍵向量和值向量;通過構(gòu)建三維坐標(biāo)系,并分別以查詢向量為x軸,以鍵向量為y軸,以值向量為z軸,建立向量特征空間,在向量特征空間上繪制三維輪廓圖,還將三維輪廓圖與預(yù)設(shè)標(biāo)準(zhǔn)三維輪廓圖進(jìn)行疊合,獲取其橫向截圖和縱向截圖并對(duì)比生成重合總面積和非重合總面積,其中非重合總面積為檢索響應(yīng)時(shí)的偏移量;根據(jù)重合總面積和非重合總面積得到檢索過程中的評(píng)價(jià)因子,判定業(yè)務(wù)管理服務(wù)的優(yōu)劣;
40、評(píng)價(jià)因子所依據(jù)的公式為:
41、;
42、式中,bp表示評(píng)價(jià)因子,k0表示修正權(quán)重系數(shù),cmj表示重合面積,fmj表示非重合面積;
43、獲取業(yè)務(wù)鏈條的節(jié)點(diǎn)信息,節(jié)點(diǎn)信息包括操作日志、歸檔狀態(tài)以及相關(guān)的歸檔包,識(shí)別并收集操作節(jié)點(diǎn)信息對(duì)應(yīng)的用戶標(biāo)識(shí)id,統(tǒng)計(jì)該用戶的操作行為,生成統(tǒng)計(jì)報(bào)告。
44、第二方面,本技術(shù)提出了一種多模態(tài)數(shù)據(jù)融合歸檔后獨(dú)立應(yīng)用的系統(tǒng),包括:業(yè)務(wù)管理平臺(tái)、數(shù)據(jù)獲取及融合單元、歸檔管理單元、檢索分析單元以及存儲(chǔ)調(diào)用單元;
45、數(shù)據(jù)獲取及融合單元,獲取輸入的多模態(tài)數(shù)據(jù),并將多模態(tài)數(shù)據(jù)進(jìn)行融合,生成目標(biāo)數(shù)據(jù)集;其中,輸入的多模態(tài)數(shù)據(jù)類型包括結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及物聯(lián)網(wǎng)數(shù)據(jù);
46、歸檔管理單元,將目標(biāo)數(shù)據(jù)集傳輸?shù)綐I(yè)務(wù)管理平臺(tái),設(shè)計(jì)鏈?zhǔn)骄W(wǎng)絡(luò)結(jié)構(gòu)開啟歸檔管理,生成歸檔包,并基于深度學(xué)習(xí)網(wǎng)絡(luò)搭建目標(biāo)決策網(wǎng)絡(luò),計(jì)算歸檔分值,根據(jù)歸檔分值匹配歸檔分區(qū)并進(jìn)行業(yè)務(wù)管理服務(wù);其中,目標(biāo)決策網(wǎng)絡(luò)是對(duì)樣本環(huán)境進(jìn)行強(qiáng)化學(xué)習(xí)探索獲得,樣本環(huán)境是至少有兩個(gè)歷史歸檔包中對(duì)應(yīng)的信息構(gòu)成;
47、檢索分析單元,進(jìn)入業(yè)務(wù)管理平臺(tái)進(jìn)行檢索與服務(wù)分析,在業(yè)務(wù)鏈條上進(jìn)行數(shù)據(jù)查詢,生成業(yè)務(wù)鏈條集合,并根據(jù)業(yè)務(wù)鏈條集合生成評(píng)價(jià)因子,對(duì)業(yè)務(wù)管理服務(wù)作出評(píng)價(jià);根據(jù)業(yè)務(wù)鏈條的節(jié)點(diǎn)信息,生成統(tǒng)計(jì)報(bào)表;其中,服務(wù)分析包括統(tǒng)計(jì)分析、查看詳情以及生成報(bào)表;
48、存儲(chǔ)調(diào)用單元,用于管理和控制用戶對(duì)檔案存儲(chǔ)和檔案的訪問權(quán)限,基于用戶身份和角色,定義了不同的權(quán)限級(jí)別和訪問控制策略,以確保只有授權(quán)用戶能夠訪問和操作檔案;
49、業(yè)務(wù)管理平臺(tái),包括檔案組和用戶組,用于對(duì)檔案組和用戶組的各種操作和活動(dòng)進(jìn)行管理。
50、第三方面,本技術(shù)提出了一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)第一方面提出的方法的步驟。
51、第四方面,本技術(shù)提出了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面提出的方法的步驟。
52、(三)有益效果
53、本發(fā)明提供一種多模態(tài)數(shù)據(jù)融合歸檔后獨(dú)立應(yīng)用的方法及系統(tǒng),具備以下有益效果:
54、本發(fā)明通過搭建業(yè)務(wù)管理平臺(tái),設(shè)置出檔案組和用戶組,對(duì)檔案組和用戶組進(jìn)行分布式管理,并以檔案為節(jié)點(diǎn)設(shè)計(jì)鏈?zhǔn)骄W(wǎng)絡(luò)結(jié)構(gòu),各個(gè)節(jié)點(diǎn)可以獨(dú)立處理數(shù)據(jù),看作獨(dú)立的模塊,不依賴于中心服務(wù)器,同時(shí),鏈?zhǔn)浇Y(jié)構(gòu)允許輕松地添加新節(jié)點(diǎn),支持網(wǎng)絡(luò)的擴(kuò)展,便于用戶對(duì)檔案進(jìn)行快速檢索與定位,更加靈活地實(shí)現(xiàn)信息存儲(chǔ)與管理;通過檔案之間的依賴關(guān)系可以更加精確地表示,減少不必要的耦合;
55、本發(fā)明通過基于深度學(xué)習(xí)網(wǎng)絡(luò)搭建目標(biāo)決策網(wǎng)絡(luò),聚焦于歸檔包的狀態(tài)數(shù)據(jù),尤其專注整體級(jí)數(shù)據(jù),并基于敏感程度得分和重要程度得分計(jì)算出歸檔分值,并按照歸檔分值的大小劃分歸檔區(qū)間;通過使用強(qiáng)化學(xué)習(xí)的方式訓(xùn)練網(wǎng)絡(luò),提高了該網(wǎng)絡(luò)的資源利用率;
56、本發(fā)明通過用戶組對(duì)檔案組進(jìn)行檢索,得到業(yè)務(wù)鏈條集合,包括查詢向量、鍵向量和值向量,通過向量化表示,系統(tǒng)能夠更準(zhǔn)確地理解用戶的檢索意圖,減少無關(guān)結(jié)果,提高檢索的精準(zhǔn)度,通過建造特征空間計(jì)算出檢索過程的評(píng)價(jià)因子,合理配置資源,提升工作效率,進(jìn)一步提高響應(yīng)速度。