盲文點(diǎn)位漢字編碼及其與盲文之間的機(jī)器翻譯方法
【專利摘要】本發(fā)明提出了一種盲文點(diǎn)位漢字編碼,用六個(gè)方位符、第一結(jié)束符、第二結(jié)束符、“空”、“缺”、“滿”組成的漢字序列來(lái)表示盲文,還提出了盲文點(diǎn)位漢字編碼與盲文之間的機(jī)器翻譯方法:每方盲文作為獨(dú)立的符號(hào),且上下文無(wú)關(guān),直接將盲文替換成對(duì)應(yīng)的盲文點(diǎn)位漢字編碼;盲文點(diǎn)位漢字編碼到盲文的機(jī)器翻譯方法為,將盲文點(diǎn)位漢字編碼到盲文的轉(zhuǎn)換用不確定有窮自動(dòng)機(jī)描述,然后用逆序拆分子集法對(duì)其進(jìn)行確定化,最后編程實(shí)現(xiàn)。本發(fā)明將盲文轉(zhuǎn)換為漢字序列,設(shè)計(jì)了盲文與點(diǎn)位漢字編碼之間的機(jī)器翻譯,實(shí)現(xiàn)了盲文在安裝盲文字庫(kù)和沒(méi)有安裝盲文字庫(kù)的計(jì)算機(jī)之間自由遷移,使得盲文存儲(chǔ)方式更加簡(jiǎn)便,也為盲文的語(yǔ)音識(shí)別與文語(yǔ)轉(zhuǎn)換奠定基礎(chǔ)。
【專利說(shuō)明】
盲文點(diǎn)位漢字編碼及其與盲文么間的機(jī)器翻譚方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及一種盲文點(diǎn)位漢字編碼W及盲文點(diǎn)位漢字編碼與盲文之間的機(jī)器翻 譯方法,屬于計(jì)算機(jī)文字處理技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 據(jù)統(tǒng)計(jì),截止2010年末,我國(guó)約有視力殘疾者1263萬(wàn)人,世界衛(wèi)生組織估計(jì)全世界 有盲人4000萬(wàn)到4500萬(wàn),而低視力人數(shù)是盲人的3倍,約1.4億人。日益增長(zhǎng)的殘疾人人口和 他們對(duì)信息迫切的需求是目前信息無(wú)障礙建設(shè)面臨的嚴(yán)峻挑戰(zhàn)。使用計(jì)算機(jī)進(jìn)行信息處理 是現(xiàn)代人的基本能力,但是目前普通計(jì)算機(jī)的人機(jī)交互設(shè)計(jì)較少考慮到視覺(jué)障礙人±的需 求,計(jì)算機(jī)中沒(méi)有安裝統(tǒng)一的盲文字庫(kù),盲文文檔在安裝了盲文字庫(kù)的計(jì)算機(jī)和沒(méi)有安裝 盲文字庫(kù)(或者安裝了不同版本的盲文字庫(kù))的計(jì)算機(jī)之間不能自由遷移,造成盲人在計(jì)算 機(jī)上使用盲文非常不方便。
[0003] 計(jì)算機(jī)的人機(jī)交互技術(shù)包含輸入與輸出兩個(gè)方面。盲人使用計(jì)算機(jī)時(shí),輸入階段 可用鍵盤(pán)、麥克風(fēng)(語(yǔ)音識(shí)別)等輸入設(shè)備將文字或命令輸入計(jì)算機(jī);輸出階段則是指將文 字或其它信息通過(guò)語(yǔ)音等方式輸出。日趨成熟的語(yǔ)音識(shí)別技術(shù)與文語(yǔ)轉(zhuǎn)換技術(shù),在智能手 機(jī)、平板電腦上也廣泛使用。
[0004] 為了解決盲人使用計(jì)算機(jī)的人機(jī)交互問(wèn)題,國(guó)內(nèi)外研究者進(jìn)行了大量研究,開(kāi)發(fā) 了大量的系統(tǒng)或者專業(yè)軟件。輸入設(shè)備或系統(tǒng)有鍵盤(pán)(針對(duì)盲人的輸入法)、麥克風(fēng)(語(yǔ)音識(shí) 別技術(shù):語(yǔ)音到文字的輸入技術(shù))和掃描儀(OCR技術(shù):紙質(zhì)文字轉(zhuǎn)換為電子文檔技術(shù));輸出 設(shè)備或系統(tǒng)有點(diǎn)顯器(文字到盲文輸出設(shè)備)、盲文刻印機(jī)(文字到紙質(zhì)盲文輸出設(shè)備)和讀 屏軟件(文語(yǔ)轉(zhuǎn)換技術(shù),文字到語(yǔ)音的輸出技術(shù))等。專口針對(duì)盲人設(shè)計(jì)的系統(tǒng)有:盲文字符 OCR是將紙質(zhì)盲文圖片識(shí)別成盲文符號(hào),再轉(zhuǎn)換成漢字;使用鍵盤(pán)可W輸入漢字,再把漢字 轉(zhuǎn)換為盲文;也可W使用鍵盤(pán)輸入直接盲文,用點(diǎn)顯器輸出盲文,或者將盲文轉(zhuǎn)換成漢字輸 出;點(diǎn)顯器是能夠?qū)⒂?jì)算機(jī)中的文字(漢字和盲文)轉(zhuǎn)換為盲文輸出。目前國(guó)內(nèi)相對(duì)較成熟 的系統(tǒng)是陽(yáng)光軟件,具有輸入與顯示漢字和盲文、盲文與漢字互轉(zhuǎn)等功能。
[0005] 盲人與計(jì)算機(jī)的交互技術(shù)是一項(xiàng)有重要意義的研究。除去普通人±也能用的語(yǔ)音 識(shí)別、文語(yǔ)轉(zhuǎn)換等交互技術(shù),其他技術(shù)均要設(shè)及一個(gè)基礎(chǔ)工作一一盲文字庫(kù)。有了盲文字庫(kù) 的計(jì)算機(jī)才能輸入、存儲(chǔ)、顯示盲文?,F(xiàn)有的技術(shù)或應(yīng)用中存在W下不足:
[0006] (1)盲文字庫(kù)專用,非專用軟件不能使用盲文字庫(kù)。
[0007] 盲文是盲人進(jìn)行學(xué)習(xí)的一種文字工具,常規(guī)的計(jì)算機(jī)系統(tǒng)一般沒(méi)有安裝盲文字 庫(kù)。上述技術(shù)要么沒(méi)有用到盲文字庫(kù),要么立足于自家專用盲文字庫(kù)。出于知識(shí)產(chǎn)權(quán)考慮, 目前國(guó)內(nèi)盲文字庫(kù)與軟件是配套使用,脫離了相應(yīng)軟件,盲文無(wú)法輸入、顯示與使用,也不 能兼容別家的盲文字庫(kù)。
[000引(2)沒(méi)有安裝盲文字庫(kù)的計(jì)算機(jī)無(wú)法顯示盲文。
[0009]要使用點(diǎn)顯器、刻印機(jī)等設(shè)備時(shí),其計(jì)算機(jī)必須安裝有盲文字庫(kù),運(yùn)點(diǎn)是毋庸置疑 的。但當(dāng)盲文文檔編輯好后,依然不能在沒(méi)有安裝盲文字庫(kù)的計(jì)算機(jī)顯示盲文的點(diǎn)位,運(yùn)樣 不便于盲文的文檔存儲(chǔ)、傳輸。
[0010] (3)盲文與中文的翻譯應(yīng)用效果不盡如人意。
[0011] 盲文與漢字之間轉(zhuǎn)換正確率無(wú)法得到100%。目前我國(guó)采用是現(xiàn)行盲文,每個(gè)漢字 用兩方盲文表示,一方表示聲母,一方表示韻母。如聲母m用盲文表示,韻母ei用盲文表 示,所W漢字"美",拼音為mei,盲文表示為r;:,發(fā)音相同的漢字"沒(méi)"、"每"也都是運(yùn)樣盲文 表示。現(xiàn)行盲文表示漢字時(shí)固有缺陷,使得盲漢或漢盲的轉(zhuǎn)換正確率無(wú)法得到100%,效果 比較好的也只能達(dá)到97%。而盲文閱讀是摸讀,也就是盲人依次摸一個(gè)個(gè)盲文點(diǎn)字,識(shí)別成 聲母韻母后轉(zhuǎn)為漢字或詞組,不能像普通人閱讀語(yǔ)句能夠依據(jù)上下文理解,就是盲人對(duì)盲 文的容錯(cuò)率低。雖然轉(zhuǎn)換正確率已經(jīng)令人很滿意,但是盲文閱讀習(xí)慣與漢字不同,就算是個(gè) 別盲文點(diǎn)字的錯(cuò)誤也無(wú)法準(zhǔn)確理解語(yǔ)義。擁有97%的準(zhǔn)確率的盲漢轉(zhuǎn)換系統(tǒng)沒(méi)有實(shí)際應(yīng)用 就是運(yùn)個(gè)原因。
[0012] (4)無(wú)法實(shí)現(xiàn)盲文與漢字、各種符號(hào)的混排與轉(zhuǎn)換。
[0013] 盲文表示的信息除了文字W外,還能表示數(shù)學(xué)、物理、化學(xué)、音樂(lè)等其他學(xué)科的符 號(hào)或者表達(dá)式。前面的研究實(shí)現(xiàn)了盲文與漢字的轉(zhuǎn)換(翻譯)、數(shù)學(xué)符號(hào)與盲文的翻譯轉(zhuǎn)換, 但未能實(shí)現(xiàn)其他學(xué)科符號(hào)的混排、存儲(chǔ)、轉(zhuǎn)換。
【發(fā)明內(nèi)容】
[0014] 本發(fā)明的目的在于克服現(xiàn)有技術(shù)的缺陷,提供一種盲文點(diǎn)位漢字編碼及其與盲文 之間的機(jī)器翻譯方法,將盲文轉(zhuǎn)換為漢字序列,實(shí)現(xiàn)了盲文在安裝盲文字庫(kù)的計(jì)算機(jī)和沒(méi) 有安裝盲文字庫(kù)(或者不同版本的盲文字庫(kù))的計(jì)算機(jī)之間自由遷移,實(shí)現(xiàn)了盲文與盲文點(diǎn) 位漢字編碼之間的機(jī)器翻譯,使得盲文存儲(chǔ)方式更加簡(jiǎn)便,具有更強(qiáng)的兼容性。
[0015] 為了達(dá)到上述目的,本發(fā)明所采用的技術(shù)方案是:
[0016] -種盲文點(diǎn)位漢字編碼,其特征在于,用六個(gè)方位符、第一結(jié)束符、第二結(jié)束符、 "空"、"缺"、"滿"組成的漢字序列來(lái)表示盲文,包括:
[0017] 對(duì)盲文的六個(gè)點(diǎn)依次標(biāo)號(hào):六個(gè)點(diǎn)分別用數(shù)字1-6進(jìn)行標(biāo)號(hào);
[0018] 依次讀取盲文并將其轉(zhuǎn)換成漢字序列:如果盲文凸點(diǎn)數(shù)量為0個(gè),則對(duì)應(yīng)的漢字序 列為"空"加第二結(jié)束符;如果盲文凸點(diǎn)數(shù)量為1-4個(gè),則依次取盲文凸點(diǎn)的標(biāo)號(hào),將每個(gè)數(shù) 字標(biāo)號(hào)轉(zhuǎn)為對(duì)應(yīng)的方位符,然后在最后一個(gè)方位符后面加上第一結(jié)束符;如果盲文凸點(diǎn)數(shù) 量為5個(gè),則對(duì)應(yīng)的漢字序列為"缺*",其中,*為盲文的非凸點(diǎn)的數(shù)字標(biāo)號(hào)對(duì)應(yīng)的方位符,并 在*的漢字后面加上第二結(jié)束符;如果盲文凸點(diǎn)數(shù)量為6個(gè),則對(duì)應(yīng)的漢字序列為"滿"加第 二結(jié)束符。
[0019] 前述的一種盲文點(diǎn)位漢字編碼,其特征在于,用數(shù)字1-6對(duì)盲文進(jìn)行按序標(biāo)號(hào)時(shí), 盲文的左邊一列從上到下,依次記為1、2、3;右邊一列從上到下,依次記為4、5、6。
[0020] 前述的一種盲文點(diǎn)位漢字編碼,其特征在于,所述六個(gè)方位符為漢字"一"、"二"、 "三V'四"、"置V'六",分別對(duì)應(yīng)數(shù)字標(biāo)號(hào)1、2、3、4、5、6;所述第一結(jié)束符為漢字"點(diǎn)';所述 第二結(jié)束符為漢字"方"。
[0021] 前述的一種盲文點(diǎn)位漢字編碼,其特征在于,盲文凸點(diǎn)數(shù)量為1-4個(gè)時(shí),讀取盲文 凸點(diǎn)標(biāo)號(hào)的順序?yàn)椋凑諛?biāo)號(hào)從小到大的順序讀取。
[0022] 基于權(quán)利前述的盲文點(diǎn)位漢字編碼的一種盲文點(diǎn)位漢字編碼與盲文之間的機(jī)器 翻譯方法,其特征在于,包括:
[0023] 盲文到盲文點(diǎn)位漢字編碼的機(jī)器翻譯方法:每方盲文作為上下文無(wú)關(guān)的符號(hào),直 接將盲文替換成對(duì)應(yīng)的盲文點(diǎn)位漢字編碼;
[0024] 盲文點(diǎn)位漢字編碼到盲文的機(jī)器翻譯方法為:將盲文點(diǎn)位漢字編碼到盲文的轉(zhuǎn)換 用不確定有窮自動(dòng)機(jī)描述,然后用逆序拆分子集法(ROSS)對(duì)其進(jìn)行確定化,最后編程實(shí)現(xiàn) 盲文點(diǎn)位漢字編碼到盲文的翻譯,具體包括如下步驟:
[0025] A,構(gòu)建第一不確定有窮自動(dòng)機(jī)描述盲文點(diǎn)位漢字編碼到盲文的轉(zhuǎn)換過(guò)程;
[0026] B,定義逆序拆分子集法(ROSS)的3個(gè)原則:最大逆匹配原則、次序唯一性原則和終 態(tài)不等價(jià)原則,所述最大逆匹配原則為:第一結(jié)束符和第二結(jié)束符前面的方位符,如果從后 向前對(duì)應(yīng)的數(shù)字標(biāo)號(hào)滿足從大到小的排列,則運(yùn)些方位符均屬于同一方盲文;所述次序唯 一性原則為:第一結(jié)束符和第二結(jié)束符前面的方位符次序不可顛倒;所述終態(tài)不等價(jià)原則 為:每個(gè)盲文點(diǎn)位漢字編碼有只有一個(gè)結(jié)束符,且結(jié)束符只能為第一結(jié)束符或第二結(jié)束符;
[0027] C,利用上述的3個(gè)原則,對(duì)步驟A構(gòu)建的第一不確定有窮自動(dòng)機(jī)先進(jìn)行逆序再進(jìn)行 拆分操作,得到兩個(gè)子不確定有窮自動(dòng)機(jī):第二不確定有窮自動(dòng)機(jī)和第=不確定有窮自動(dòng) 機(jī),用子集法分別對(duì)第二不確定有窮自動(dòng)機(jī)和第=不確定有窮自動(dòng)機(jī)進(jìn)行確定化,得到兩 個(gè)確定有窮自動(dòng)機(jī):第二確定有窮自動(dòng)機(jī)和第=確定有窮自動(dòng)機(jī),描述盲文點(diǎn)位漢字編碼 到盲文的轉(zhuǎn)換過(guò)程;
[0028] D,最后用程序?qū)崿F(xiàn)第二確定有窮自動(dòng)機(jī)和第=確定有窮自動(dòng)機(jī),完成對(duì)盲文點(diǎn)位 漢字編碼到盲文的翻譯。
[0029] 前述的一種盲文點(diǎn)位漢字編碼與盲文之間的機(jī)器翻譯方法,其特征在于,所述步 驟C中對(duì)步驟A構(gòu)建的第一不確定有窮自動(dòng)機(jī)先進(jìn)行逆序再進(jìn)行拆分操作,簡(jiǎn)化成兩個(gè)子不 確定有窮自動(dòng)機(jī):第二不確定有窮自動(dòng)機(jī)和第=不確定有窮自動(dòng)機(jī),用子集法分別對(duì)第二 不確定有窮自動(dòng)機(jī)和第=不確定有窮自動(dòng)機(jī)進(jìn)行確定化,得到兩個(gè)確定有窮自動(dòng)機(jī):第二 確定有窮自動(dòng)機(jī)和第=確定有窮自動(dòng)機(jī),具體包括如下步驟:
[0030] Cl,將第一不確定有窮自動(dòng)機(jī)的所有箭頭方向逆序,輸入狀態(tài)保持不變,終結(jié)狀態(tài) 變成初始狀態(tài),即第一結(jié)束符和第二結(jié)束符轉(zhuǎn)為初始狀態(tài);
[0031 ] C2,用第一結(jié)束符和第二結(jié)束符為初始狀態(tài),拆分成兩個(gè)分別W第一結(jié)束符和第 二結(jié)束符為初始狀態(tài)的子不確定有窮自動(dòng)機(jī):第二不確定有窮自動(dòng)機(jī)和第=不確定有窮自 動(dòng)機(jī);
[0032] C3,用子集法分別對(duì)第二不確定有窮自動(dòng)機(jī)和第=不確定有窮自動(dòng)機(jī)確定化并化 簡(jiǎn),得到:第二確定有窮自動(dòng)機(jī)和第=確定有窮自動(dòng)機(jī)。
[0033] 與現(xiàn)有技術(shù)相比,本發(fā)明具有W下的有益效果:
[0034] (1)提出用點(diǎn)位漢字編碼存儲(chǔ)盲文,解決字庫(kù)兼容性問(wèn)題:
[0035] 點(diǎn)位漢字編碼使用漢字字庫(kù)(GB18030),其兼容性與通用性都強(qiáng)于專用盲文字庫(kù), 甚至在手機(jī)等智能電子設(shè)備都能使用。點(diǎn)位漢字編碼還能夠作為不同盲文字庫(kù)的中間碼, 解決不同盲文字庫(kù)的兼容性沖突問(wèn)題。盲文轉(zhuǎn)換成點(diǎn)位漢字編碼后在沒(méi)有安裝盲文字庫(kù)的 電子設(shè)備上存儲(chǔ)與使用,上述電子設(shè)備是安裝有漢字字庫(kù)的電子設(shè)備,包括但不限于計(jì)算 機(jī)、智能手機(jī)、平板電腦。
[0036] (2)直接處理盲文文檔,不用機(jī)器翻譯:
[0037] 現(xiàn)有技術(shù)中,盲文與漢字的機(jī)器翻譯錯(cuò)誤很難被發(fā)現(xiàn),用本發(fā)明的點(diǎn)位漢字編碼 直接編輯處理盲文,可W采用專用盲文輸入法直接輸入盲文,再轉(zhuǎn)為點(diǎn)位漢字編碼存儲(chǔ)傳 輸,也可W漢字輸入法輸入點(diǎn)位漢字編碼,再轉(zhuǎn)換為盲文使用。本發(fā)明提出的點(diǎn)位漢字編碼 序列到盲文的機(jī)器翻譯方法,盲文與點(diǎn)位漢字編碼之間轉(zhuǎn)換的準(zhǔn)確率為100%。
[0038] (3)實(shí)現(xiàn)盲文與漢字、各種符號(hào)的混排與轉(zhuǎn)換:
[0039] 將盲文轉(zhuǎn)換為點(diǎn)位漢字編碼,就能將二維信息轉(zhuǎn)為線性的漢字序列,就適用漢字 的處理方式。在現(xiàn)有的技術(shù)中,能處理漢字就能處理盲文,在沒(méi)有安裝盲文字庫(kù)計(jì)算機(jī)上顯 示為點(diǎn)位漢字編碼,便于文檔保存、傳輸;文檔轉(zhuǎn)移到有裝有盲文字庫(kù)的計(jì)算機(jī)能夠?qū)崿F(xiàn)點(diǎn) 位漢字編碼再轉(zhuǎn)換成盲文。
[0040] 同時(shí),本發(fā)明還提出了盲文的注音概念,用點(diǎn)位漢字編碼的語(yǔ)音序列作為盲文注 音,使得原先僅具有符號(hào)特征的盲文也具有了讀音特征,為盲文的語(yǔ)音輸入與輸出提供了 基礎(chǔ),豐富了盲人與計(jì)算機(jī)的人機(jī)交互技術(shù),拓寬了人機(jī)交互的途徑與應(yīng)用領(lǐng)域,也為盲文 的語(yǔ)音識(shí)別與文語(yǔ)轉(zhuǎn)換奠定基礎(chǔ)。
【附圖說(shuō)明】
[0041] 圖1是本發(fā)明的盲文點(diǎn)位標(biāo)號(hào)示意圖。
[0042] 圖2是本發(fā)明的盲文與盲文點(diǎn)位漢字編碼對(duì)照表。
[0043] 圖3是本發(fā)明的描述盲文點(diǎn)位漢字編碼到盲文的轉(zhuǎn)換的不確定有窮自動(dòng)機(jī)M。
[0044] 圖4是Ml進(jìn)行確定化后得到的確定有窮自動(dòng)機(jī)DFAl。
[0045] 圖5是M2進(jìn)行確定化后得到的確定有窮自動(dòng)機(jī)DFA2。
【具體實(shí)施方式】
[0046] 下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步描述。W下實(shí)施例僅用于更加清楚地說(shuō)明本發(fā)明 的技術(shù)方案,而不能W此來(lái)限制本發(fā)明的保護(hù)范圍。
[0047] -種盲文點(diǎn)位漢字編碼:用漢字"一"、"二四"、"五""六"、"點(diǎn)方"、 "空"、"缺"、"滿"組成的漢字序列來(lái)表示盲文,如圖1所示,根據(jù)盲文的基本特征,將盲文中6 個(gè)點(diǎn)分別用數(shù)字1-6標(biāo)記,順序?yàn)閺纳系较聫淖蟮接?。獲取盲文凸點(diǎn)的點(diǎn)位信息,轉(zhuǎn)為用漢 字表示。依次讀取盲文并將其轉(zhuǎn)換成漢字序列:如果盲文凸點(diǎn)數(shù)量為0個(gè),則對(duì)應(yīng)的漢字序 列為"空方";如果盲文凸點(diǎn)數(shù)量為1-4個(gè),則依次取盲文凸點(diǎn)的標(biāo)號(hào),將每個(gè)數(shù)字標(biāo)號(hào)轉(zhuǎn)為 對(duì)應(yīng)的數(shù)字漢字,然后在最后一個(gè)凸點(diǎn)標(biāo)號(hào)的漢字后面加上"點(diǎn)"字;如果盲文凸點(diǎn)數(shù)量為5 個(gè),則對(duì)應(yīng)的漢字序列為"缺*方",其中,*為盲文的非凸點(diǎn)的數(shù)字標(biāo)號(hào)對(duì)應(yīng)的數(shù)字漢字;如 果盲文凸點(diǎn)數(shù)量為6個(gè),則對(duì)應(yīng)的漢字序列為"滿方"。
[004引如凸點(diǎn)的數(shù)字標(biāo)號(hào)分別1,3,5,則漢字序列"一S五點(diǎn)"為該盲文的點(diǎn)位漢字編 碼。
[0049]使用盲文時(shí),可^用盲文的點(diǎn)位表示。例如1,;'表示拼音"扣11肖",實(shí)際使用過(guò)程 中也可W按照其點(diǎn)位,讀作"一二點(diǎn)立四五六點(diǎn)一點(diǎn)"。iKi難數(shù)學(xué)領(lǐng)域表示為'T',讀作S 四五六點(diǎn)一點(diǎn)"。
[0化0] 如圖2所示,列出64個(gè)盲文與漢字編碼的對(duì)照表,其中五個(gè)點(diǎn)用缺方表示,如H表 示為"缺六方",不表示為"一二立四五點(diǎn)'。運(yùn)樣目的是減少盲文對(duì)應(yīng)的漢字?jǐn)?shù),使得編碼更 加簡(jiǎn)潔。
[0051] -種盲文點(diǎn)位漢字編碼與盲文之間的機(jī)器翻譯方法,包括:
[0052] 盲文到盲文點(diǎn)位漢字編碼的機(jī)器翻譯方法:因?yàn)槊糠矫の臑楠?dú)立的符號(hào),且上下 文無(wú)關(guān),直接將盲文替換成對(duì)應(yīng)的盲文點(diǎn)位漢字編碼。
[0053] 盲文點(diǎn)位漢字編碼到盲文的機(jī)器翻譯方法為:將盲文點(diǎn)位漢字編碼到盲文的轉(zhuǎn)換 用不確定有窮自動(dòng)機(jī)描述,然后用逆序拆分子集法(ROSS)完成對(duì)其進(jìn)行確定化,最后編程 實(shí)現(xiàn)盲文點(diǎn)位漢字編碼到盲文的翻譯,具體包括如下步驟:
[0054] A,如圖3所示,構(gòu)建一個(gè)不確定有窮自動(dòng)機(jī)M描述盲文點(diǎn)位漢字編碼到盲文的轉(zhuǎn)換 過(guò)程,M是一個(gè)五元組:M=( X , W ,f ,S,Z),
[0055] 其中 X是一個(gè)有窮狀態(tài)集,X = {xi,XiGW},W={0,l,2,3,4,5,6,7,10,ll,12,13, 14,15,16};
[0056] W是一個(gè)輸人有窮漢字表,W = {: -,二,立,四,五,六,點(diǎn),方,滿,缺,空},為簡(jiǎn)化 表達(dá),用字母依次替代,D= {a,b,c,d,e,f,p,q,m,n,k},即 W = {如,如£〇},其中 Di = a,D2 = b,D3 = c,D4 = d,D5 = e,D6 = f,D7 = p,D8 = q,D9=m,Dio = n,Dii = k;
[0057] f 為轉(zhuǎn)換函數(shù),f(Xi,ih)=Xj,其中(Xi,XjG X,如£ W);
[0化引S為初始狀態(tài)集,S={0};
[0化9] Z為終結(jié)狀態(tài),Z= {6,7}。
[0060] 其實(shí)f是一個(gè)從X X W*到X的子集的映射,如語(yǔ)義表達(dá)"一S點(diǎn)"和-點(diǎn)"可W 是等價(jià)的,運(yùn)樣f: X X W *一2X,2X表示X的幕集。
[0061] B,定義逆序拆分子集法(ROSS)的3個(gè)原則:最大逆匹配原則、次序唯一性原則和終 態(tài)不等價(jià)原則。
[0062] 最大逆匹配原則為:第一結(jié)束符和第二結(jié)束符前面的方位符,如果從后向前對(duì)應(yīng) 的數(shù)字標(biāo)號(hào)滿足從大到小的排列,則運(yùn)些方位符均屬于同一方盲文,例如:漢字點(diǎn)位編碼 "一二=四點(diǎn)"依據(jù)最大逆匹配原則轉(zhuǎn)換為盲文《 ,,,而不轉(zhuǎn)換為"一揮'或者其他形式;
[0063] 次序唯一性原則為:第一結(jié)束符和第二結(jié)束符前面的方位符次序不可顛倒;例如: 漢字點(diǎn)位編碼"一四五點(diǎn)"聲"四一五點(diǎn)"聲"五一四點(diǎn)"聲……;盲文的唯一編碼"一四 五點(diǎn)","四一五點(diǎn)"根據(jù)最大逆匹配原則,轉(zhuǎn)換為"四終'。
[0064] 終態(tài)不等價(jià)原則為:每個(gè)點(diǎn)位漢字編碼尤其只有一個(gè)結(jié)束符,且結(jié)束符只能為 "點(diǎn)'或"方'。例如:"四方'盧咽點(diǎn)',即"缺四方'盧'缺關(guān)"。;
[0065] C,利用上述的3個(gè)原則,對(duì)步驟A構(gòu)建的M逆序拆分子集法操作,具體步驟如下:
[0066] Cl,將M的所有箭頭方向逆序,輸入狀態(tài)保持不變,終結(jié)狀態(tài)6和7變成初始狀態(tài)。
[0067] C2,用6和7為初始狀態(tài),拆分成兩個(gè)分別W6和7為初始狀態(tài)的子不確定有窮自動(dòng) 機(jī):M巧PM2。
[006引 Ml是一個(gè)五元組:M1 = ( X ',W ',f ',S',Z'),其中
[0069] X'是一個(gè)有窮狀態(tài)集,X' = {1,2,3,4,5,6};
[0070] W'是一個(gè)輸入有窮字母表,W' = {a,b,c,d,e,f,q,m,n,k};
[0071] f '為轉(zhuǎn)換函數(shù),f '(Xj,ih)=Xi(Xi,XjG X ',如£ W ');
[0072] S'為初始狀態(tài)集,S'= {6};
[0073] Z'是終結(jié)狀態(tài),Z' = {1,2,3}。
[0074] M2是一個(gè)五元組:M2 = (X",礦',r,S",之'),
[00對(duì)其中 X"是一個(gè)有窮狀態(tài)集,X" = {7,10,11,12,13,14,15,16};
[0076] W"是一個(gè)輸入有窮字母表,W" = {a,b,c,d,e,f,p};
[0077] f"為轉(zhuǎn)換函數(shù),f" (Xj,如)=Xi(Xi,Xj G X",如£ 礦');
[007引S"為初始狀態(tài)集,S" = {7};
[00巧]Z"是終結(jié)狀態(tài),Z" = {10}。
[0080] C3,用子集法分別對(duì)Ml和M2確定化并化簡(jiǎn),得到兩個(gè)確定有窮自動(dòng)機(jī):DFA巧郵FA2 (如圖4和圖5所示)。用子集法對(duì)Ml和M2確定化過(guò)程在此不作描述
[0081 ] D,最后用程序?qū)崿F(xiàn)第二確定有窮自動(dòng)機(jī)和第=確定有窮自動(dòng)機(jī),完成對(duì)盲文點(diǎn)位 漢字編碼到盲文的翻譯。
[0082] W上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人 員來(lái)說(shuō),在不脫離本發(fā)明技術(shù)原理的前提下,還可W做出若干改進(jìn)和變形,運(yùn)些改進(jìn)和變形 也應(yīng)視為本發(fā)明的保護(hù)范圍。
【主權(quán)項(xiàng)】
1. 一種盲文點(diǎn)位漢字編碼,其特征在于,用六個(gè)方位符、第一結(jié)束符、第二結(jié)束符、 "空"、"缺"、"滿"組成的漢字序列來(lái)表示盲文,包括: 對(duì)盲文的六個(gè)點(diǎn)依次標(biāo)號(hào):六個(gè)點(diǎn)分別用數(shù)字1-6進(jìn)行標(biāo)號(hào); 依次讀取盲文并將其轉(zhuǎn)換成漢字序列:如果盲文凸點(diǎn)數(shù)量為〇個(gè),則對(duì)應(yīng)的漢字序列為 "空"加第二結(jié)束符;如果盲文凸點(diǎn)數(shù)量為1-4個(gè),則依次取盲文凸點(diǎn)的標(biāo)號(hào),將每個(gè)數(shù)字標(biāo) 號(hào)轉(zhuǎn)為對(duì)應(yīng)的方位符,然后在最后一個(gè)方位符后面加上第一結(jié)束符;如果盲文凸點(diǎn)數(shù)量為5 個(gè),則對(duì)應(yīng)的漢字序列為"缺*",其中,*為盲文的非凸點(diǎn)的數(shù)字標(biāo)號(hào)對(duì)應(yīng)的方位符,并在*的 漢字后面加上第二結(jié)束符;如果盲文凸點(diǎn)數(shù)量為6個(gè),則對(duì)應(yīng)的漢字序列為"滿"加第二結(jié)束 符。2. 根據(jù)權(quán)利要求1所述的一種盲文點(diǎn)位漢字編碼,其特征在于,用數(shù)字1-6對(duì)盲文進(jìn)行 按序標(biāo)號(hào)時(shí),盲文的左邊一列從上到下,依次記為1、2、3;右邊一列從上到下,依次記為4、5、 6〇3. 根據(jù)權(quán)利要求2所述的一種盲文點(diǎn)位漢字編碼,其特征在于,所述六個(gè)方位符為漢字 "一"、"二"、"三"、"四"、"五"、"六",分別對(duì)應(yīng)數(shù)字標(biāo)號(hào)1、2、3、4、5、6;所述第一結(jié)束符為漢 字"點(diǎn)";所述第二結(jié)束符為漢字"方"。4. 根據(jù)權(quán)利要求3所述的一種盲文點(diǎn)位漢字編碼,其特征在于,盲文凸點(diǎn)數(shù)量為1-4個(gè) 時(shí),讀取盲文凸點(diǎn)標(biāo)號(hào)的順序?yàn)?,按照?biāo)號(hào)從小到大的順序讀取。5. 基于權(quán)利要求1-4任意一項(xiàng)所述的盲文點(diǎn)位漢字編碼的一種盲文點(diǎn)位漢字編碼與盲 文之間的機(jī)器翻譯方法,其特征在于,包括: 盲文到盲文點(diǎn)位漢字編碼的機(jī)器翻譯方法:每方盲文作為上下文無(wú)關(guān)的符號(hào),直接將 盲文替換成對(duì)應(yīng)的盲文點(diǎn)位漢字編碼; 盲文點(diǎn)位漢字編碼到盲文的機(jī)器翻譯方法為:將盲文點(diǎn)位漢字編碼到盲文的轉(zhuǎn)換用不 確定有窮自動(dòng)機(jī)描述,然后用逆序拆分子集法(ROSS)對(duì)其進(jìn)行確定化,最后編程實(shí)現(xiàn)盲文 點(diǎn)位漢字編碼到盲文的翻譯,具體包括如下步驟: A,構(gòu)建第一不確定有窮自動(dòng)機(jī)描述盲文點(diǎn)位漢字編碼到盲文的轉(zhuǎn)換過(guò)程; B,定義逆序拆分子集法(ROSS)的3個(gè)原則:最大逆匹配原則、次序唯一性原則和終態(tài)不 等價(jià)原則,所述最大逆匹配原則為:第一結(jié)束符和第二結(jié)束符前面的方位符,如果從后向前 對(duì)應(yīng)的數(shù)字標(biāo)號(hào)滿足從大到小的排列,則這些方位符均屬于同一方盲文;所述次序唯一性 原則為:第一結(jié)束符和第二結(jié)束符前面的方位符次序不可顛倒;所述終態(tài)不等價(jià)原則為:每 個(gè)盲文點(diǎn)位漢字編碼有只有一個(gè)結(jié)束符,且結(jié)束符只能為第一結(jié)束符或第二結(jié)束符; C,利用上述的3個(gè)原則,對(duì)步驟A構(gòu)建的第一不確定有窮自動(dòng)機(jī)先進(jìn)行逆序再進(jìn)行拆分 操作,得到兩個(gè)子不確定有窮自動(dòng)機(jī):第二不確定有窮自動(dòng)機(jī)和第三不確定有窮自動(dòng)機(jī),用 子集法分別對(duì)第二不確定有窮自動(dòng)機(jī)和第三不確定有窮自動(dòng)機(jī)進(jìn)行確定化,得到兩個(gè)確定 有窮自動(dòng)機(jī):第二確定有窮自動(dòng)機(jī)和第三確定有窮自動(dòng)機(jī),描述盲文點(diǎn)位漢字編碼到盲文 的轉(zhuǎn)換過(guò)程; D,最后用程序?qū)崿F(xiàn)第二確定有窮自動(dòng)機(jī)和第三確定有窮自動(dòng)機(jī),完成對(duì)盲文點(diǎn)位漢字 編碼到盲文的翻譯。6. 基于權(quán)利要求5所述的一種盲文點(diǎn)位漢字編碼與盲文之間的機(jī)器翻譯方法,其特征 在于,所述步驟C中對(duì)步驟A構(gòu)建的第一不確定有窮自動(dòng)機(jī)先進(jìn)行逆序再進(jìn)行拆分操作,簡(jiǎn) 化成兩個(gè)子不確定有窮自動(dòng)機(jī):第二不確定有窮自動(dòng)機(jī)和第三不確定有窮自動(dòng)機(jī),用子集 法分別對(duì)第二不確定有窮自動(dòng)機(jī)和第三不確定有窮自動(dòng)機(jī)進(jìn)行確定化,得到兩個(gè)確定有窮 自動(dòng)機(jī):第二確定有窮自動(dòng)機(jī)和第三確定有窮自動(dòng)機(jī),具體包括如下步驟: C1,將第一不確定有窮自動(dòng)機(jī)的所有箭頭方向逆序,輸入狀態(tài)保持不變,終結(jié)狀態(tài)變成 初始狀態(tài),即第一結(jié)束符和第二結(jié)束符轉(zhuǎn)為初始狀態(tài); C2,用第一結(jié)束符和第二結(jié)束符為初始狀態(tài),拆分成兩個(gè)分別以第一結(jié)束符和第二結(jié) 束符為初始狀態(tài)的子不確定有窮自動(dòng)機(jī):第二不確定有窮自動(dòng)機(jī)和第三不確定有窮自動(dòng) 機(jī); C3,用子集法分別對(duì)第二不確定有窮自動(dòng)機(jī)和第三不確定有窮自動(dòng)機(jī)確定化并化簡(jiǎn), 得到:第二確定有窮自動(dòng)機(jī)和第三確定有窮自動(dòng)機(jī)。
【文檔編號(hào)】G06F17/28GK106021241SQ201610302219
【公開(kāi)日】2016年10月12日
【申請(qǐng)日】2016年5月9日
【發(fā)明人】張居曉, 曾曉勤
【申請(qǐng)人】河海大學(xué)