欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種字體數(shù)據(jù)的處理方法及裝置的制作方法

文檔序號(hào):6335319閱讀:390來(lái)源:國(guó)知局
專利名稱:一種字體數(shù)據(jù)的處理方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及字體技術(shù)領(lǐng)域,具體地,涉及一種字體數(shù)據(jù)的處理方法及裝置。
背景技術(shù)
電子文檔在存儲(chǔ)和展示的時(shí)候,包含圖形、圖片、表格、公式、多種語(yǔ)言文字的字符等,而文字字符通常是電子文檔內(nèi)容最主要的元素,在電子文檔中占的比重也最大,字符的字體數(shù)據(jù)作為一種資源,存儲(chǔ)了電子文檔的字符集中各個(gè)字符的字體描述信息,在展示電子文檔的時(shí)候,根據(jù)電子文檔中的字符集及其對(duì)應(yīng)字體數(shù)據(jù)中的字體描述信息渲染出字符集的圖像,然后顯示到計(jì)算機(jī)屏幕或者輸出到打印機(jī)上。要真正原版原式的展示電子文檔中字符集的內(nèi)容,必須存儲(chǔ)用戶設(shè)置的字符集顏色、字體、字號(hào)大小等屬性信息,并將字符集與字體數(shù)據(jù)整合為一個(gè)整體,以保證同一電子文檔在任何顯示終端輸出同樣的結(jié)果?,F(xiàn)有技術(shù)中的處理方式為將字體數(shù)據(jù)進(jìn)行處理,以去掉部分冗余的信息,例如去掉OpenType字體規(guī)范格式中的glyf中對(duì)字形的描述,但是由于對(duì)字體數(shù)據(jù)中的其它信息沒(méi)有做處理,所以去掉部分冗余的信息的字體與完整字體的使用方式?jīng)]有區(qū)別。目前,電子文檔使用頻率越來(lái)越多,一個(gè)電子文檔中往往會(huì)存儲(chǔ)幾十甚至成百上千種的字體描述信息,過(guò)多的字體數(shù)據(jù)導(dǎo)致電子文檔很大,同時(shí)會(huì)使解析電子文檔時(shí)的IO 操作過(guò)多,從而使電子文檔的解析速度很慢。

發(fā)明內(nèi)容
為解決上述問(wèn)題,本發(fā)明的實(shí)施例提供一種字體數(shù)據(jù)的處理方法及裝置,用于解決現(xiàn)有技術(shù)中過(guò)多的字體數(shù)據(jù)導(dǎo)致電子文檔的大小很大,解析電子文檔時(shí)的IO操作過(guò)多的問(wèn)題。為此,本發(fā)明提供一種字體數(shù)據(jù)的處理方法,其中,包括獲取字符集的字體數(shù)據(jù);判斷所述字符集的字體數(shù)據(jù)中是否存在相同的字體描述信息;將所述字符集的字體數(shù)據(jù)中相同的字體描述信息合并;根據(jù)所述字符集合并后的字體數(shù)據(jù)合并所述字符集的字符映射表。其中,在所述獲取字符集的字體數(shù)據(jù)之前還包括獲取所述字符集的編碼信息以得到所述字符集。其中,所述獲取字符集的字體數(shù)據(jù)還包括獲取所述字符集的字符映射表,所述字符映射表包括字符編碼和字體數(shù)據(jù)索引。其中,所述根據(jù)所述字符集合并后的字體數(shù)據(jù)合并所述字符集的字符映射表之后包括將所述字符集合并后的字體數(shù)據(jù)和字符映射表更新存儲(chǔ)到所述字符集的電子文檔中。
其中,還包括將所述字符集合并后的字體數(shù)據(jù)存儲(chǔ)在一個(gè)字體數(shù)據(jù)文件中。本發(fā)明還提供了一種字體數(shù)據(jù)的處理裝置,其中,包括獲取單元,用于獲取字符集的字體數(shù)據(jù);判斷單元,用于判斷所述字符集中各字符的字體描述信息是否相同;合并單元,用于將所述字符集的字體數(shù)據(jù)中相同的字體描述信息合并,以及根據(jù)所述字符集合并后的字體數(shù)據(jù)合并所述字符集的字符映射表。其中,所述獲取單元還用于獲取所述字符集的編碼信息以得到所述字符集。其中,所述獲取單元還用于獲取所述字符集的字體數(shù)據(jù)的字符映射表,所述字符映射表包括字符編碼和字體數(shù)據(jù)索引。其中,還包括更新單元;所述更新單元用于將所述字符集合并后的字體數(shù)據(jù)和字符映射表更新存儲(chǔ)到所述字符集的電子文檔中。其中,所述合并單元還用于將所述字符集合并后的字體數(shù)據(jù)存儲(chǔ)在一個(gè)字體數(shù)據(jù)文件中。本發(fā)明具有下述有益效果本發(fā)明提供的字體數(shù)據(jù)的處理方法,本實(shí)施例中,通過(guò)將字符集的相同字體描述信息合并,減少了電子文檔中字體描述信息和字體名稱的種類和數(shù)量,相應(yīng)減少了字符映射表的數(shù)量和復(fù)雜度,同時(shí)降低了電子文檔的大小,從而減少了解析電子文檔時(shí)發(fā)生的IO 操作次數(shù),提高了電子文檔的解析速度。本發(fā)明提供的字體數(shù)據(jù)的處理裝置,通過(guò)獲取單元獲取電子文檔中字符集的字體數(shù)據(jù),再通過(guò)合并單元將字符集的字體數(shù)據(jù)中相同的字體描述信息合并為一項(xiàng),從而減少了電子文檔中字體描述信息以及字體名稱的種類和數(shù)量,并根據(jù)字符集合并后的字體數(shù)據(jù)合并字符集的字符映射表,減少了字符映射表的數(shù)量,降低了電子文檔的大小,并減少了解析電子文檔時(shí)發(fā)生的IO操作次數(shù),提高了電子文檔的解析速度。


圖1為本發(fā)明提供的字體數(shù)據(jù)的處理方法第一實(shí)施例的流程圖;圖2為本發(fā)明提供的字體數(shù)據(jù)的處理方法第二實(shí)施例的流程圖;圖3為本發(fā)明提供的字體數(shù)據(jù)的處理方法第二實(shí)施例中電子文檔字符集;圖4為圖3中電子文檔字符集的字體數(shù)據(jù);圖5為本發(fā)明提供的字體數(shù)據(jù)的處理裝置第一實(shí)施例的結(jié)構(gòu)示意圖;圖6為本發(fā)明提供的字體數(shù)據(jù)的處理裝置第二實(shí)施例的結(jié)構(gòu)示意圖。
具體實(shí)施例方式為使本領(lǐng)域的技術(shù)人員更好地理解本發(fā)明的技術(shù)方案,下面結(jié)合附圖對(duì)本發(fā)明提供的字體數(shù)據(jù)的處理方法及裝置進(jìn)行詳細(xì)描述。圖1為本發(fā)明提供的字體數(shù)據(jù)的處理方法第一實(shí)施例的流程圖。如圖1所示,本實(shí)施例字體數(shù)據(jù)的處理方法的具體流程包括如下步驟步驟101、獲取字符集的字體數(shù)據(jù)。
在利用計(jì)算機(jī)終端等智能終端打開一份電子文檔時(shí),首先獲取計(jì)算機(jī)終端上的字體數(shù)據(jù)、該電子文檔上字符集的編碼信息以及描述該字符集的字體數(shù)據(jù),描述該字符集的字體數(shù)據(jù)包括描述電子文檔字符集中每個(gè)字符的字體描述信息等,字體數(shù)據(jù)包括字符的字號(hào)、字體和顏色等信息,字號(hào)例如小四或13號(hào)等,字體例如楷體(Type2)、隸書(TrueType) 和行楷(OpenType)等,其中,Type2、TrueType和OpenType為字體格式規(guī)范,描述該字符集的字體數(shù)據(jù)通常按照一定的標(biāo)準(zhǔn)存儲(chǔ)在不同的字體數(shù)據(jù)文件中,在本實(shí)施例中,可以按照字體格式規(guī)范的標(biāo)準(zhǔn)將同一種字體格式規(guī)范的字體數(shù)據(jù)存儲(chǔ)在同一個(gè)字體數(shù)據(jù)文件中;獲取字符集的字體數(shù)據(jù)后,進(jìn)入步驟102。步驟102、判斷字符集的字體數(shù)據(jù)中是否存在相同的字體描述信息。字體數(shù)據(jù)包括各字符的字體描述信息,判斷字符集的字體數(shù)據(jù)中是否存在相同的字體描述信息,本實(shí)施例中,字體數(shù)據(jù)可以包括分別關(guān)于字號(hào)、字體、顏色等的字體描述信息,例如對(duì)于字符“中”和“國(guó)”,如果判斷出“中”和“國(guó)”的字號(hào)都為12號(hào)則說(shuō)明關(guān)于“中” 和“國(guó)”的字號(hào)的字體描述信息相同,如果判斷出“中”和“國(guó)”的字號(hào)的顏色都為藍(lán)色,則說(shuō)明關(guān)于“中”和“國(guó)”的顏色的字體描述信息相同,如果字符“中”的字體描述信息中的字體為楷體(Type2)、字符“國(guó)”的字體描述信息中的字體為楷體(TrueType),由于字符“中”和 “國(guó)”得字體的名稱都是楷體,同樣也表明關(guān)于“中”和“國(guó)”的字體描述信息是相同。判斷字符集的字體數(shù)據(jù)中存在相同的字體描述信息之后,進(jìn)入步驟103。步驟103、將字符集的相同的字體描述信息合并。在本實(shí)施例中,可以將字符“中”的楷體(Type2)的字體描述信息和“國(guó)”的楷體 (TrueType)的字體描述信息合并為一項(xiàng)字體描述信息,“中”和“國(guó)”合并后的字體為楷體, 同時(shí),將“中”和“國(guó)”的關(guān)于字號(hào)的字體描述信息合并為一項(xiàng),合并后的字號(hào)為12號(hào),將 “中”和“國(guó)”的關(guān)于顏色的字體描述信息合并為一項(xiàng),合并后的字號(hào)為藍(lán)色。得到描述該電子文檔字符集的合并后的字體描述信息之后,進(jìn)入步驟104。步驟104、根據(jù)字符集合并后的字體數(shù)據(jù)合并字符集的字符映射表。各項(xiàng)相同的字體描述信息合并后,得到描述該電子文檔字符集合并后的字體數(shù)據(jù),優(yōu)選地,將合并后的字體數(shù)據(jù)存儲(chǔ)在一個(gè)字體數(shù)據(jù)文件中,然后根據(jù)合并后的字體數(shù)據(jù)文件相應(yīng)修改字符集的字符映射表,字符映射表用于表示各字符對(duì)應(yīng)的字體描述信息在字體數(shù)據(jù)文件中的位置信息,字體數(shù)據(jù)合并后,字符集的字體描述信息的數(shù)量和種類明顯減少,使字符集對(duì)應(yīng)的字符映射表的數(shù)量明顯減少,結(jié)構(gòu)也更簡(jiǎn)單明了。本實(shí)施例中,通過(guò)將字符集的相同字體描述信息合并,減少了電子文檔中字體描述信息和字體名稱的種類和數(shù)量,相應(yīng)減少了字符映射表的數(shù)量和復(fù)雜度,同時(shí)降低了電子文檔的大小,從而減少了解析電子文檔時(shí)發(fā)生的IO操作次數(shù),提高了電子文檔的解析速度。圖2為本發(fā)明提供的字體數(shù)據(jù)的處理方法第二實(shí)施例的流程圖。如圖2所示,本實(shí)施例字體數(shù)據(jù)的處理方法的具體流程包括如下步驟步驟201、讀取字符集的編碼信息以得到字符集。在需要查閱電子文檔上存儲(chǔ)的字符集時(shí),首先要獲取關(guān)于該電子文檔的所有字符的編碼信息,其中,字符的編碼方式例如Unicode、GBK等,Unicode或GBK等編碼為每種語(yǔ)言中的每個(gè)字符設(shè)定了統(tǒng)一的二進(jìn)制編碼,智能終端是通過(guò)讀取電子文檔中字符集的Unicode或GBK等編碼來(lái)得到字符集。得到電子文檔中的字符集之后,進(jìn)入步驟202。步驟202、獲取字符集的字體數(shù)據(jù)。字符集的字體數(shù)據(jù)中包括該電子文檔中所有字符的字體描述信息。本實(shí)施例以 PDF文檔轉(zhuǎn)化為CEBX文檔時(shí)為例來(lái)介紹技術(shù)方案,圖3為本發(fā)明提供的字體數(shù)據(jù)的處理方法第二實(shí)施例中電子文檔字符集,圖4為圖3中電子文檔字符集的字體數(shù)據(jù)。獲取圖3所示的PDF文檔中的字符集的字體數(shù)據(jù)包括圖4所示的6種字體描述信息,字符集的6種字體描述信息包括數(shù)學(xué)公式字符集和文字字符集,其中,數(shù)學(xué)公式字符集的兩種字體分別為 Cambria Math和Calibri,文字字符集的四種字體分別為楷體(Type2)、楷體(TrueType)、 微軟雅黑(Typd)和微軟雅黑(TrueType),在本實(shí)施例中,微軟雅黑(Typd)對(duì)應(yīng)的字體數(shù)據(jù)存儲(chǔ)在第一字體數(shù)據(jù)文件中,微軟雅黑(TrueType)對(duì)應(yīng)的字體數(shù)據(jù)存儲(chǔ)在第二字體數(shù)據(jù)文件中,字體數(shù)據(jù)文件嵌入存儲(chǔ)在電子文檔中。步驟203、獲取字符集中各個(gè)字符的字符映射表。以圖3所示的“勾股定理”為例,其中,“勾”和“股”的字體為微軟雅黑(Type2)字體,其字體數(shù)據(jù)存儲(chǔ)在第一字體數(shù)據(jù)文件中,字符編碼與字體數(shù)據(jù)索引之間關(guān)系的字符映射表如表1所示,其中,字體數(shù)據(jù)索引中0001和0002用于表示字符對(duì)應(yīng)的字體描述信息在第一字體數(shù)據(jù)文件中的位置。
字符的編碼信息(十六進(jìn)制) 字體數(shù)據(jù)索引
52FE__0001_
80A10002表1“定”和“理”的字體為微軟雅黑(TrueType)字體,其字體數(shù)據(jù)存儲(chǔ)在第二字體數(shù)據(jù)文件中,其字符映射表如表2所示,其中,字體數(shù)據(jù)索引中0001和0002用于表示字符對(duì)應(yīng)的字體描述信息在第二字體數(shù)據(jù)文件中的位置。
字符的編碼信息(十六進(jìn)制) 字體數(shù)據(jù)索引
5B9A__0001_
74060002表 2在獲取字符集中的各種字體數(shù)據(jù)的字體數(shù)據(jù)文件以及字符映射表之后,進(jìn)入步驟 204。步驟204、判斷字符集的字體數(shù)據(jù)中是否存在相同的字體描述信息。根據(jù)字符集中各字符的字體描述信息,判斷描述字符字號(hào)的各字體描述信息是否相同、判斷描述字符顏色的字體描述信息是否相同。本實(shí)施例中是將PDF文檔轉(zhuǎn)換為CEBX 文檔,在CEBX文檔中,數(shù)學(xué)公式字符集的字體Cambria Math和Calibri具有相同的字體描述信息,楷體(Typd)和楷體(TrueType)具有相同的字體描述信息,微軟雅黑(Type2)和微軟雅黑(TrueType)具有相同的字體描述信息。在字符集的字體數(shù)據(jù)中存在相同的字體描述信息時(shí),進(jìn)入步驟205。步驟205、將字符集的相同字體描述信息合并,以得到字符集合并后的字體數(shù)據(jù)。按照TrueType和Type2這兩種字體格式規(guī)范,將圖3字符集的相同字體描述信息合并,合并前后的字體如表3所示。
權(quán)利要求
1.一種字體數(shù)據(jù)的處理方法,其特征在于,包括 獲取字符集的字體數(shù)據(jù);判斷所述字符集的字體數(shù)據(jù)中是否存在相同的字體描述信息; 將所述字符集的字體數(shù)據(jù)中相同的字體描述信息合并; 根據(jù)所述字符集合并后的字體數(shù)據(jù)合并所述字符集的字符映射表。
2.根據(jù)權(quán)利要求1所述的字體數(shù)據(jù)的處理方法,其特征在于,在所述獲取字符集的字體數(shù)據(jù)之前還包括獲取所述字符集的編碼信息以得到所述字符集。
3.根據(jù)權(quán)利要求1所述的字體數(shù)據(jù)的處理方法,其特征在于,所述獲取字符集的字體數(shù)據(jù)還包括獲取所述字符集的字符映射表,所述字符映射表包括字符編碼和字體數(shù)據(jù)索引。
4.根據(jù)權(quán)利要求1所述的字體數(shù)據(jù)的處理方法,其特征在于,所述根據(jù)所述字符集合并后的字體數(shù)據(jù)合并所述字符集的字符映射表之后包括將所述字符集合并后的字體數(shù)據(jù)和字符映射表更新存儲(chǔ)到所述字符集的電子文檔中。
5.根據(jù)權(quán)利要求1所述的字體數(shù)據(jù)的處理方法,其特征在于,還包括 將所述字符集合并后的字體數(shù)據(jù)存儲(chǔ)在一個(gè)字體數(shù)據(jù)文件中。
6.一種字體數(shù)據(jù)的處理裝置,其特征在于,包括 獲取單元,用于獲取字符集的字體數(shù)據(jù);判斷單元,用于判斷所述字符集中各字符的字體描述信息是否相同; 合并單元,用于將所述字符集的字體數(shù)據(jù)中相同的字體描述信息合并,以及根據(jù)所述字符集合并后的字體數(shù)據(jù)合并所述字符集的字符映射表。
7.根據(jù)權(quán)利要求6所述的字體數(shù)據(jù)的處理裝置,其特征在于 所述獲取單元還用于獲取所述字符集的編碼信息以得到所述字符集。
8.根據(jù)權(quán)利要求6所述的字體數(shù)據(jù)的處理裝置,其特征在于所述獲取單元還用于獲取所述字符集的字體數(shù)據(jù)的字符映射表,所述字符映射表包括字符編碼和字體數(shù)據(jù)索引。
9.根據(jù)權(quán)利要求6所述的字體數(shù)據(jù)的處理裝置,其特征在于,還包括更新單元; 所述更新單元用于將所述字符集合并后的字體數(shù)據(jù)和字符映射表更新存儲(chǔ)到所述字符集的電子文檔中。
10.根據(jù)權(quán)利要求6所述的字體數(shù)據(jù)的處理裝置,其特征在于所述合并單元還用于將所述字符集合并后的字體數(shù)據(jù)存儲(chǔ)在一個(gè)字體數(shù)據(jù)文件中。
全文摘要
本發(fā)明提供一種字體數(shù)據(jù)的處理方法及裝置,其中,所述方法包括獲取字符集的字體數(shù)據(jù);判斷所述字符集的字體數(shù)據(jù)中是否存在相同的字體描述信息;將所述字符集的字體數(shù)據(jù)中相同的字體描述信息合并;根據(jù)所述字符集合并后的字體數(shù)據(jù)合并所述字符集的字符映射表。本實(shí)施例中,通過(guò)將字符集的相同字體描述信息合并,減少了電子文檔中字體描述信息和字體名稱的種類和數(shù)量,相應(yīng)減少了字符映射表的數(shù)量和復(fù)雜度,同時(shí)降低了電子文檔的大小,從而減少了解析電子文檔時(shí)發(fā)生的IO操作次數(shù),提高了電子文檔的解析速度。
文檔編號(hào)G06F17/22GK102467490SQ201010533928
公開日2012年5月23日 申請(qǐng)日期2010年11月1日 優(yōu)先權(quán)日2010年11月1日
發(fā)明者丁力, 張磊, 曹佳胤 申請(qǐng)人:北京北大方正技術(shù)研究院有限公司, 北大方正集團(tuán)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
广昌县| 托克逊县| 白沙| 衡东县| 长泰县| 红安县| 乾安县| 滕州市| 伊通| 论坛| 额敏县| 日土县| 成都市| 花垣县| 阿尔山市| 太仓市| 紫云| 镇坪县| 恩平市| 丹巴县| 开原市| 玉山县| 开江县| 灵台县| 河西区| 宾川县| 阿克苏市| 台中县| 丘北县| 库尔勒市| 乡城县| 柳林县| 兰州市| 博白县| 昌乐县| 乳山市| 定陶县| 南康市| 宁波市| 徐水县| 民勤县|