本技術涉及計算機信息處理,尤其涉及一種數(shù)據(jù)導出方法、裝置、電子設備及計算機存儲介質。
背景技術:
1、prosemirror是一款富文本編輯器,產(chǎn)生結構化的、語義化的、有意義的文檔的同時還要能夠讓用戶能夠容易的理解與使用。同時,內容的導出在任何知識管理產(chǎn)品都是必須具備的產(chǎn)品能力和需求,但是prosemirror目前還無法導出文檔形式的內容,比如word和pdf。
技術實現(xiàn)思路
1、本技術實施例提供了一種數(shù)據(jù)導出方法、裝置、電子設備及計算機存儲介質,實現(xiàn)對富文本編輯器導出文檔的需求,并確保數(shù)據(jù)導出效果。上述技術方案如下:
2、第一方面,本技術實施例提供了一種數(shù)據(jù)導出方法,上述方法包括:
3、獲取富文本編輯器中待導出數(shù)據(jù)對應的第一超文本標記語言文本;
4、對上述第一超文本標記語言文本進行格式處理,得到第二超文本標記語言文本;
5、將上述第二超文本標記語言文本輸入目標插件中,輸出上述第二超文本標記語言文本對應的目標文檔。
6、在一種可能的實現(xiàn)方式中,上述獲取富文本編輯器中待導出數(shù)據(jù)對應的第一超文本標記語言文本,包括:
7、基于待導出數(shù)據(jù)對應的數(shù)據(jù)結構對象以及富文本編輯器對應的骨架結構將上述待導出數(shù)據(jù)中各元素轉化為對應的超文本標記語言;
8、將上述待導出數(shù)據(jù)中各元素對應的超文本標記語言進行組合,得到上述待導出數(shù)據(jù)對應的第一超文本標記語言文本。
9、在一種可能的實現(xiàn)方式中,上述對上述第一超文本標記語言文本進行格式處理,得到第二超文本標記語言文本,包括:
10、對上述第一超文本標記語言文本進行解析,獲取上述第一超文本標記語言文本中的待處理超文本標記語言子文本;
11、按照預設規(guī)則將上述第一超文本標記語言文本中的待處理超文本標記語言子文本進行格式處理,得到第二超文本標記語言文本。
12、在一種可能的實現(xiàn)方式中,上述待處理超文本標記語言子文本包括上述第一超文本標記語言文本中帶有圖片標簽的第一待處理子文本;
13、上述按照預設規(guī)則將上述第一超文本標記語言文本中的待處理超文本標記語言子文本進行格式處理,得到第二超文本標記語言文本,包括:
14、判斷上述圖片標簽的寬度是否大于預設寬度;
15、若是,則基于上述預設寬度重新設置上述第一待處理子文本中圖片標簽的寬度,以及等比例調整上述圖片標簽的高度,得到第二超文本標記語言文本。
16、在一種可能的實現(xiàn)方式中,上述待處理超文本標記語言子文本包括上述第一超文本標記語言文本中帶有圖片標簽的第一待處理子文本;
17、上述按照預設規(guī)則將上述第一超文本標記語言文本中的待處理超文本標記語言子文本進行格式處理,得到第二超文本標記語言文本,包括:
18、判斷上述圖片標簽的高度是否大于預設高度;
19、若是,則基于上述預設高度重新設置上述第一待處理子文本中圖片標簽的高度,以及等比例調整上述圖片標簽的寬度,得到第二超文本標記語言文本。
20、在一種可能的實現(xiàn)方式中,上述待處理超文本標記語言子文本包括上述第一超文本標記語言文本中帶有附件標簽的第二待處理子文本;
21、上述按照預設規(guī)則將上述第一超文本標記語言文本中的待處理超文本標記語言子文本進行格式處理,得到第二超文本標記語言文本,包括:
22、將上述第一超文本標記語言文本中的第二待處理子文本轉成超鏈接附件或文檔附件,得到第二超文本標記語言文本。
23、在一種可能的實現(xiàn)方式中,上述將上述第二超文本標記語言文本輸入目標插件中,輸出上述第二超文本標記語言文本對應的目標文檔,包括:
24、將上述第二超文本標記語言文本輸入目標插件中,上述目標插件調用轉換模型,將上述第二超文本標記語言文本輸入上述轉換模型中,輸出上述第二超文本標記語言文本對應的目標文檔;上述轉換模型基于已知對應文檔的多個樣本超文本標記語言文本進行訓練得到。
25、在一種可能的實現(xiàn)方式中,上述目標文檔為word文檔或pdf文檔。
26、第二方面,本技術實施例提供了一種數(shù)據(jù)導出裝置,其特征在于,上述數(shù)據(jù)導出裝置包括:
27、獲取模塊,用于獲取富文本編輯器中待導出數(shù)據(jù)對應的第一超文本標記語言文本;
28、格式處理模塊,用于對上述第一超文本標記語言文本進行格式處理,得到第二超文本標記語言文本;
29、轉換模塊,用于將上述第二超文本標記語言文本輸入目標插件中,輸出上述第二超文本標記語言文本對應的目標文檔。
30、在一種可能的實現(xiàn)方式中,上述獲取模塊包括:
31、轉化單元,用于基于待導出數(shù)據(jù)對應的數(shù)據(jù)結構對象以及富文本編輯器對應的骨架結構將上述待導出數(shù)據(jù)中各元素轉化為對應的超文本標記語言;
32、組合單元,用于將上述待導出數(shù)據(jù)中各元素對應的超文本標記語言進行組合,得到上述待導出數(shù)據(jù)對應的第一超文本標記語言文本。
33、在一種可能的實現(xiàn)方式中,上述格式處理模塊包括:
34、解析單元,用于對上述第一超文本標記語言文本進行解析,獲取上述第一超文本標記語言文本中的待處理超文本標記語言子文本;
35、格式處理單元,用于按照預設規(guī)則將上述第一超文本標記語言文本中的待處理超文本標記語言子文本進行格式處理,得到第二超文本標記語言文本。
36、在一種可能的實現(xiàn)方式中,上述待處理超文本標記語言子文本包括上述第一超文本標記語言文本中帶有圖片標簽的第一待處理子文本;
37、上述格式處理模塊包括:
38、第一判斷單元,用于判斷上述圖片標簽的寬度是否大于預設寬度;
39、第一調整單元,用于若是,則基于上述預設寬度重新設置上述第一待處理子文本中圖片標簽的寬度,以及等比例調整上述圖片標簽的高度,得到第二超文本標記語言文本。
40、在一種可能的實現(xiàn)方式中,上述待處理超文本標記語言子文本包括上述第一超文本標記語言文本中帶有圖片標簽的第一待處理子文本;
41、上述格式處理模塊包括:
42、第二判斷單元,用于判斷上述圖片標簽的高度是否大于預設高度;
43、第二調整單元,用于若是,則基于上述預設高度重新設置上述第一待處理子文本中圖片標簽的高度,以及等比例調整上述圖片標簽的寬度,得到第二超文本標記語言文本。
44、在一種可能的實現(xiàn)方式中,上述待處理超文本標記語言子文本包括上述第一超文本標記語言文本中帶有附件標簽的第二待處理子文本;
45、上述格式處理模塊具體用于:
46、將上述第一超文本標記語言文本中的第二待處理子文本轉成超鏈接附件或文檔附件,得到第二超文本標記語言文本。
47、在一種可能的實現(xiàn)方式中,上述轉換模塊具體用于:
48、將上述第二超文本標記語言文本輸入目標插件中,上述目標插件調用轉換模型,將上述第二超文本標記語言文本輸入上述轉換模型中,輸出上述第二超文本標記語言文本對應的目標文檔;上述轉換模型基于已知對應文檔的多個樣本超文本標記語言文本進行訓練得到。
49、在一種可能的實現(xiàn)方式中,上述目標文檔為word文檔或pdf文檔。
50、第三方面,本技術實施例提供了一種電子設備,包括:處理器以及存儲器;
51、上述處理器與上述存儲器相連;
52、上述存儲器,用于存儲可執(zhí)行程序代碼;
53、上述處理器通過讀取上述存儲器中存儲的可執(zhí)行程序代碼來運行與上述可執(zhí)行程序代碼對應的程序,以用于執(zhí)行本說明書實施例第一方面或第一方面的任意一種可能的實現(xiàn)方式提供的方法。
54、第四方面,本說明書實施例提供了一種計算機存儲介質,上述計算機存儲介質存儲有多條指令,上述指令適于由處理器加載并執(zhí)行本說明書實施例第一方面或第一方面的任意一種可能的實現(xiàn)方式提供的方法。
55、本技術一些實施例提供的技術方案帶來的有益效果至少包括:
56、在本技術一個或多個實施例中,通過獲取富文本編輯器中待導出數(shù)據(jù)對應的第一超文本標記語言文本,并對上述第一超文本標記語言文本進行格式處理,得到第二超文本標記語言文本,最后將上述第二超文本標記語言文本輸入目標插件中,輸出上述第二超文本標記語言文本對應的目標文檔,實現(xiàn)對富文本編輯器導出文檔的需求,并確保數(shù)據(jù)導出效果。
57、上述說明僅是本技術技術方案的概述,為了能夠更清楚了解本技術的技術手段而可依照說明書的內容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式。