欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于藏文字符構(gòu)件識(shí)別技術(shù)的藏文字符字典排序的方法與流程

文檔序號(hào):12470033閱讀:413來(lái)源:國(guó)知局
基于藏文字符構(gòu)件識(shí)別技術(shù)的藏文字符字典排序的方法與流程
本發(fā)明涉及藏文信息處理
技術(shù)領(lǐng)域
,具體涉及一種基于藏文字符構(gòu)件識(shí)別技術(shù)的藏文字符字典排序的方法。
背景技術(shù)
:縮略語(yǔ)和關(guān)鍵術(shù)語(yǔ)定義藏字:表示一個(gè)藏文音節(jié)的藏文字符簡(jiǎn)稱為藏字。藏字的位長(zhǎng):構(gòu)成藏字的字符個(gè)數(shù),一個(gè)藏字可能由一到七個(gè)字符構(gòu)成,最多七位,最少一位?;郑簶?gòu)成藏字的必備構(gòu)件,以基字為核心,將其和前加字、上加字、后加字、下加字、元音、再后加字、(再下加字)進(jìn)行組合構(gòu)成藏字。前加字:這五個(gè)字母可以放在基字的前面作為前加字構(gòu)成字母組合。上加字:這三個(gè)字母可以放在上方構(gòu)成組合。下加字:這三個(gè)字母可以放在下方構(gòu)成組合。后加字:這九個(gè)字母可以放在基字的后面構(gòu)成組合。再后加字:可以放在再后加字的后面構(gòu)成組合。元音:這四個(gè)字母作為音節(jié)字母,放在基字的上方或下方。再下加字:可以放在下加字的下面?,F(xiàn)代藏字:藏字是由藏文的圖形字符拼寫構(gòu)成的,這些字符包括了現(xiàn)代藏文字符、梵音藏文字符、古藏文字符以及藏文特殊字符。所謂的現(xiàn)代藏字是指符合現(xiàn)代藏文文法規(guī)則的藏字,不包括撰寫梵音的藏文字符、不符合現(xiàn)代文法的古藏文字符。1.現(xiàn)代藏字的一般結(jié)構(gòu)藏字字形結(jié)構(gòu)均以一個(gè)輔音字母為核心,其余字母均以此為基礎(chǔ)前后附加和上下疊加,組合成一個(gè)完整的字表結(jié)構(gòu)。通常現(xiàn)代藏字字形結(jié)構(gòu)最少為一個(gè)輔音字母,即單獨(dú)由一個(gè)基字構(gòu)成;最多由6個(gè)輔音字母和一個(gè)元音符號(hào)構(gòu)成。元音不能獨(dú)立書寫,只能加在輔音字母的上部或下部。核心字母叫“基字”,30個(gè)輔音字母均可作基字,其余字母的稱謂均根據(jù)加在基字的部位而得名。即加在基字前的字母叫“前加字”,加在基字上的字母叫“上加字”,加在基字下面的字母叫“下加字”,加在基字后面的字母叫“后加字”,后加字之后再加字母叫“再后加字”或“重后加字”。藏字由三十個(gè)輔音字母和四個(gè)元音符號(hào)(簡(jiǎn)稱為元音)拼寫組合而成,藏文的縱向疊加只是在基字的上下,而前加字、后加字、再后加字均為無(wú)疊加的單一輔音字母。在現(xiàn)代藏文文法中,對(duì)藏文字符構(gòu)成藏字有很嚴(yán)格的約束,一個(gè)藏字可有一到七個(gè)字符構(gòu)成,其中基字是構(gòu)成藏字必不可少的構(gòu)件,其它位置上構(gòu)件的有無(wú)因字而不同。藏文的音節(jié)最多由七字符構(gòu)成(如圖1所示),一個(gè)藏字一般只有一個(gè)元音符號(hào)。四個(gè)元音中第二元音疊加在輔音字符(塊)的下面(圖1中下面的圓圈表示元音),而第一、第三和第四元音疊加在輔音字符(塊)的上面(圖1中上面的圓圈表示的元音)。圖2是7個(gè)構(gòu)件的藏字實(shí)例。2、文字的排序文字的排序是指依據(jù)一定的規(guī)則將文字按照不同優(yōu)先順序排放。將文字進(jìn)行排序是建立字典,進(jìn)行查找等工作的重要前提。目前漢字的排序主要分為按照音序排序和按照筆畫排序兩種方式,而英文單詞排序時(shí)是從左到右依次比較兩個(gè)單詞中同一位置上的字母的排放優(yōu)先級(jí),在計(jì)算機(jī)中是直接比較單詞字符串碼值的大小,由此確定單詞的排列次序。目前中文和英文的排序技術(shù)已經(jīng)相當(dāng)成熟,并且在實(shí)際應(yīng)用中都有比較統(tǒng)一和完善的標(biāo)準(zhǔn)。3、藏文的字典序列的排序藏字的排序是藏文信息處理技術(shù)的一項(xiàng)基礎(chǔ)研究,由于藏文的拼寫不同于英文和漢字,它是橫向拼寫和縱向拼寫的非線性組合,不能采用漢字的音序法和筆畫法,也不能直接借鑒英文直接按照編碼從左向右比較的方法。因此,藏文音節(jié)的排序具有一定的難度。藏文字典序是給藏文排序的一種較為科學(xué)的辦法。它的實(shí)現(xiàn)是通過(guò)比較藏字各個(gè)位置上的字符來(lái)確定藏字的序列,最終由藏字序來(lái)決定藏文文本序。藏文字典序也是人為規(guī)定的一種序列,但經(jīng)過(guò)長(zhǎng)期的使用,也是人們接受的、人們已經(jīng)習(xí)慣的一種藏文排序的序列。現(xiàn)有技術(shù)一:1999年,扎西次仁在《藏文的排序規(guī)則及其計(jì)算機(jī)自動(dòng)排序的實(shí)現(xiàn)》一文中初步提出了藏文的排序思想,他提出,在比較藏文音節(jié)的優(yōu)先次序時(shí),按基字->上加字->前加字->下加字->元音符號(hào)->后加字->再后加字的順序依次一一對(duì)應(yīng)地比較這七類構(gòu)件的排序優(yōu)先級(jí)。該文僅闡述了大致的排序思想,卻沒(méi)有涉及到具體過(guò)程的實(shí)現(xiàn),比如如何識(shí)別音節(jié)的各個(gè)構(gòu)件、針對(duì)缺失的構(gòu)件如何處理等。并且,最重要的一點(diǎn),雖然幾乎所有的藏字都是由一到七個(gè)構(gòu)件組成,但構(gòu)件的種類其實(shí)應(yīng)該有八種,這個(gè)方法沒(méi)有考慮到藏字中包含“再下加字”這一構(gòu)件的情況?,F(xiàn)有技術(shù)二,2004年,江狄提出了書面藏語(yǔ)排序的數(shù)學(xué)模型及算法,將藏文音節(jié)區(qū)分為六個(gè)構(gòu)件位置,分別為:基字、前加字、上加字、下加字、后加字、元音,排序的思想為:將藏字的每一個(gè)具體字符都賦予一個(gè)數(shù)值,排序時(shí),通過(guò)查不同的表先將音節(jié)都轉(zhuǎn)換為一串?dāng)?shù)值序列,再對(duì)這些數(shù)值序列進(jìn)行排序。和技術(shù)方案一類似,該方案缺乏對(duì)藏文音節(jié)構(gòu)件拆分方法的描述。通過(guò)將音節(jié)轉(zhuǎn)換為數(shù)值序列,雖然方便了最終數(shù)值的排序,但是在轉(zhuǎn)換為數(shù)值序列的過(guò)程中需要不停的查表,增加了程序運(yùn)行的負(fù)荷。并且,unicode編碼中對(duì)藏文字符的順序有標(biāo)準(zhǔn)的規(guī)定,完全不需要自定義這些查詢表?,F(xiàn)有技術(shù)三,2009年,邊巴旺堆等提出了基于ISO/IEC10646藏文編碼字符集標(biāo)準(zhǔn)的藏文排序的方案。將藏文的一個(gè)音節(jié)優(yōu)化為6個(gè)構(gòu)件組成,并且整理了六個(gè)規(guī)則函數(shù)用來(lái)識(shí)別藏字的構(gòu)件。排序時(shí),根據(jù)“基字-上加字-前加字-下加字-元音-后加字”的順序判斷優(yōu)先級(jí)。文中將后加字、再后加字、再下加字三種構(gòu)件優(yōu)化為一種構(gòu)件,而在排序時(shí)又默認(rèn)“同一種構(gòu)件在同一個(gè)音節(jié)中只能出現(xiàn)一次”,這兩種規(guī)則具有一定的矛盾性,并不能準(zhǔn)確的識(shí)別所有的藏字,從而影響排序的結(jié)果。以上這些僅有一些論文、文檔的說(shuō)明,僅從理論上研究,沒(méi)有看見(jiàn)實(shí)現(xiàn)的具體軟件。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于克服現(xiàn)有技術(shù)的缺點(diǎn),提出一種基于藏文字符構(gòu)件識(shí)別技術(shù)的藏文字符字典排序的方法,識(shí)別藏文構(gòu)件的正確率為100%,在識(shí)別藏文字符構(gòu)件的基礎(chǔ)上,定義了藏文字符排序的優(yōu)先級(jí),按照該方法能夠正確地將藏文字符進(jìn)行排序,完成藏文字符字典序列的排序。本發(fā)明通過(guò)如下技術(shù)方案實(shí)現(xiàn):一種基于藏文字符構(gòu)件識(shí)別技術(shù)的藏文字符字典排序的方法,包括以下步驟:S1.按照藏文文法對(duì)現(xiàn)代藏字的構(gòu)字結(jié)構(gòu)進(jìn)行分析,得出藏文有48種基本結(jié)構(gòu);S2.優(yōu)先處理特殊結(jié)構(gòu),首先判斷該字符中是否含有特殊構(gòu)件音節(jié),如果有特殊構(gòu)件,再按照該結(jié)構(gòu)中的字符個(gè)數(shù)和有無(wú)元音判斷該特殊構(gòu)件的結(jié)構(gòu);S3.把藏文縱向固定疊加的組合塊作為一個(gè)整體處理,按照藏文的結(jié)構(gòu),把“上加字+基字”、“基字+下加字”、“上加字+基字+下加字”作為固定的結(jié)構(gòu)識(shí)別藏文字符構(gòu)件,把要判斷的當(dāng)前音節(jié)在這些結(jié)構(gòu)中查找,如果在該結(jié)構(gòu)中找到就能很好、很快地判斷該音節(jié)的結(jié)構(gòu),則建立3個(gè)表,用于處理固定結(jié)構(gòu)和識(shí)別特殊字符;S4.S4.對(duì)不帶元音、沒(méi)有疊加的三個(gè)構(gòu)件的藏字有一些具有二義性,再建立1個(gè)表對(duì)二義性的14個(gè)字符進(jìn)行特殊處理;S5.從藏文字符有無(wú)元音和元音的位置來(lái)判斷構(gòu)件,進(jìn)行構(gòu)件拆分,將識(shí)別的藏文字符的構(gòu)件按照“前加字-上加字-基字-下加字-再下加字-元音-后加字-再后加字”八個(gè)部分放置;S6.確定藏文字符字典序的排序模型,最核心的層次即第一層是基字層,而從第二層到第七層分別是上加字、前加字、下加字、元音、后加字和再后加字;S7.定義一個(gè)TibetWord結(jié)構(gòu)體,把讀取的音節(jié)和識(shí)別的構(gòu)件存入一個(gè)結(jié)構(gòu)體中,存儲(chǔ)空間主要用來(lái)存放音節(jié)及構(gòu)件,選擇一種排序方法進(jìn)行排序。作為優(yōu)選,S5具體如下:當(dāng)藏字是1個(gè)字符就一定是“基字”,表示為“空空字符”。作為優(yōu)選,S5具體如下:當(dāng)藏文是2個(gè)字符,則識(shí)別構(gòu)件的方法為:首先判斷第2位是否是元音,是則表示為“空空1字符空空2字符”,如果沒(méi)有元音,則查表1,如果有,判斷為“上+基”的結(jié)構(gòu),如果表1中沒(méi)有則查表2,判斷為“基+下”。作為優(yōu)選,S5具體如下,當(dāng)構(gòu)件為3個(gè)字符,則識(shí)別構(gòu)件的方法如下:1)首先,判斷第2位是否是元音,如果“是”則表示為“空空1字符空空2字符3字符”,如果“否”,則轉(zhuǎn)到2);2)查表3,如果表中有,則判斷為“上+基+下”的結(jié)構(gòu),如果沒(méi)有在表3中,則轉(zhuǎn)到3);3)查表1,判斷前2位是否在表1中,如果有則判斷第3位是否是元音,如果是則表示為“空1字符2字符空空字符3”,如果第3位不是元音,則表示為“空1字符2字符空空空3字符”;如果前2位不在表1中,則轉(zhuǎn)到4)步;4)后兩位查表1,判斷是否在,如果是則結(jié)構(gòu)為“1字符2字符3字符”,如果后2位不在表1中,則轉(zhuǎn)到5)步;5)用藏字的前2位查表2,如果在表2中,再判斷第3位是否為元音,從而得到“空空1字符2字符空3字符”和“空空1字符2字符空空3字符”;如果不在表2中,則轉(zhuǎn)到6)步;6)用藏字的后2位查表2,如果在表2中,則為“1字符空2字符3字符”,如果沒(méi)在表2中,則轉(zhuǎn)到7)步;7)判讀第3位是否是元音,如果是元音,則表示為“1字符空2字符空空3字符”,如果不是元音,則轉(zhuǎn)到8)步;8)通過(guò)判讀該三個(gè)字符是否是表4中特殊的17種字符判讀結(jié)構(gòu)。作為優(yōu)選,S5具體如下,當(dāng)構(gòu)件為4個(gè)字符,則識(shí)別構(gòu)的方法如下:1)首先判斷第2位是否是元音,如果是元音,則結(jié)構(gòu)為“空空1字符空空2字符3字符4字符”;如果不是元音,則轉(zhuǎn)2);2)查表3,判斷字符的前3位是否是“上+基+下”的結(jié)構(gòu),如果是則判斷第4位是否是元音,如果是元音,則結(jié)構(gòu)為“空1字符2字符空3字符”,如果不是元音,則是“空1字符2字符3字符空空4字符”;如果前3位不在表3中,則轉(zhuǎn)3);3)查表1,判斷字符的前2位是否是“上+基”的結(jié)構(gòu),如果是,則判斷第3位是否是元音,如果是元音,則結(jié)構(gòu)為“空1字符2字符空空3字符4字符”,如果第3位不是元音,則結(jié)構(gòu)為“空1字符2字符空空空3字符4字符”,如果藏字的前2位不在表1中,則轉(zhuǎn)4);4)用藏字的前2位查表2,如果在表2中,再判斷第3位是否是元音,如果是,則結(jié)構(gòu)為“空空1字符2字符空3字符4字符”,如果第3位不是元音,則結(jié)構(gòu)為“空空1字符2字符空空3字符4字符”表示;如果前2位不在表2中,則轉(zhuǎn)5)步;5)用藏字的后3位表3,如果在表3中,則結(jié)構(gòu)為“1字符2字符3字符4字符”,如果沒(méi)有則轉(zhuǎn)6);6)藏文的中間2位查表2,如果有則判斷第4位是否是元音,如果是則結(jié)構(gòu)為“1字符空2字符3字符空4字符”,如果第4位不是元音,則結(jié)構(gòu)為“1字符空2字符3字符空空4字符”;如果中間2位不在表2中,則轉(zhuǎn)7)步;7)通過(guò)判斷第3位是否是元音來(lái)判斷結(jié)構(gòu)。作為優(yōu)選,S5具體如下,當(dāng)構(gòu)件為5個(gè)字符,則識(shí)別構(gòu)的方法如下:1)判斷藏文字符的第5位是否是元音,如果是,則結(jié)構(gòu)為“1字符2字符3字符4字符空5字符”,如果第5不是元音,則轉(zhuǎn)2);2)判斷藏文字符的第4位是否是元音,如果是元音,藏文字符的前3位查表3,如果在表3中,結(jié)構(gòu)為“空1字符2字符3字符空4字符5字符”;如果藏文字符的前3位不在表3中,則用藏文字符的2、3位查表1,如果在表1中,則結(jié)構(gòu)為“1字符2字符3字符空空4字符5字符”;如果不在表1中,則結(jié)構(gòu)為“1字符空2字符3字符空4字符5字符”;如果藏文字符的第4位不是元音,則轉(zhuǎn)3);3)藏文字符的第3位是否是元音,如果是,則用前2位查表1,如果在表1中,則結(jié)構(gòu)為“空1字符2字符空空3字符4字符5字符”;如果不在表1中,則查表2,如果在表2中,則結(jié)構(gòu)為“空空1字符2字符空3字符4字符5字符”;如果也不在表2中,則結(jié)構(gòu)為“1字符空2字符空空3字符4字符5字符”;如果第3字符不是元音,則轉(zhuǎn)4);4)用藏文字符的前3位查表3,如果有則結(jié)構(gòu)為“空1字符2字符3字符空空4字符5字符”;否則轉(zhuǎn)5);5)用藏文字符的中間3位查表3,如果有則結(jié)構(gòu)為“1字符2字符3字符4字符空空5字符”,否則轉(zhuǎn)6);6)用藏文字符的2、3位查表1,如果在表中,則結(jié)構(gòu)為“1字符2字符3字符空空空4字符5字符”,否則結(jié)構(gòu)為“1字符空2字符3字符空空4字符5字符”。作為優(yōu)選,S5具體如下,當(dāng)構(gòu)件為6個(gè)字符,則識(shí)別構(gòu)的方法如下:1)判斷藏文字符的第5位是否為元音,如果是,則結(jié)構(gòu)為“1字符2字符3字符4字符空5字符6字符”,如果否則轉(zhuǎn)2);2)判斷藏文字符的第4位是否為元音,如果是,則用藏文字符的前3位查表3,如果在表中,則結(jié)構(gòu)為“空1字符2字符3字符空4字符5字符6字符”;如果沒(méi)在表3中,用2、3位查表1,如果在表中,則結(jié)構(gòu)為“1字符2字符3字符空空4字符5字符6字符”;如果否則結(jié)構(gòu)為“1字符空2字符3字符空4字符5字符6字符”;否則結(jié)構(gòu)為“1字符2字符3字符4字符空空5字符6字符”。作為優(yōu)選,S5具體如下,當(dāng)構(gòu)件為7個(gè)字符,則結(jié)構(gòu)為“1字符2字符3字符4字符空5字符6字符7字符”。與現(xiàn)有技術(shù)相比,本發(fā)明具有如下有益效果:1、藏文字符結(jié)構(gòu)的正確識(shí)別。由于所有的現(xiàn)代藏字都包含在48種結(jié)構(gòu)中,按照本發(fā)明提出的方法識(shí)別藏文字符的結(jié)構(gòu),識(shí)別結(jié)果可以達(dá)到100%的準(zhǔn)確率。2、藏文字符的字典序的排序方法。在識(shí)別藏文字符構(gòu)件的基礎(chǔ)上,按照本發(fā)明提出的排序方法能夠?qū)Σ匚淖址M(jìn)行排序,排序的結(jié)果符合藏文字典序列。可以廣泛用于計(jì)算機(jī)藏文數(shù)據(jù)的排序、藏文字典的編排等。附圖說(shuō)明圖1為藏字結(jié)構(gòu)圖;圖2為7個(gè)構(gòu)件的藏字實(shí)例;圖3為一個(gè)構(gòu)件的音節(jié)識(shí)別流程;圖4為兩個(gè)構(gòu)件的音節(jié)識(shí)別流程;圖5為三個(gè)構(gòu)件的音節(jié)識(shí)別流程;圖6為四個(gè)構(gòu)件的音節(jié)識(shí)別流程;圖7為五個(gè)構(gòu)件的音節(jié)識(shí)別流程;圖8為六個(gè)構(gòu)件的音節(jié)識(shí)別流程;圖9為藏字字典序的層次圖;圖10為主函數(shù)流程圖。具體實(shí)施方式以下結(jié)合附圖對(duì)本
發(fā)明內(nèi)容做進(jìn)一步說(shuō)明。本發(fā)明方案由藏文字符構(gòu)件識(shí)別和藏文字符排序兩個(gè)步驟及兩部分組成。藏文字符構(gòu)件識(shí)別是藏文字符排序的先決條件,只有正確識(shí)別了藏文字符的構(gòu)件后,才能進(jìn)行藏文字符的排序。一、藏文字符構(gòu)件識(shí)別按照現(xiàn)代藏文字符的結(jié)構(gòu)、構(gòu)成一個(gè)藏文字符的字符數(shù)來(lái)識(shí)別藏文字符構(gòu)件,具體方法如下:1、本發(fā)明按照藏文文法對(duì)現(xiàn)代藏字的構(gòu)字結(jié)構(gòu)進(jìn)行分析,得出藏文有48種基本結(jié)構(gòu),如表1所示。表1現(xiàn)代藏字的48種結(jié)構(gòu)2、優(yōu)先處理“特殊結(jié)構(gòu)”實(shí)現(xiàn)中首先判斷該字符中是否含有“特殊構(gòu)件”音節(jié),所謂的“特殊構(gòu)件”就是在“下加字”下面還有一個(gè)“再下加字”構(gòu)件,雖符合現(xiàn)在藏文文法的規(guī)范,但這種結(jié)構(gòu)主要只有和2個(gè)字符及包含該兩個(gè)字符的字符集合。如果有“特殊構(gòu)件”,再按照該結(jié)構(gòu)中的字符個(gè)數(shù)和有無(wú)元音判斷該“特殊構(gòu)件”的結(jié)構(gòu)3、本發(fā)明把藏文縱向固定疊加的組合塊作為一個(gè)整體處理。研究藏文音節(jié)字的結(jié)構(gòu)發(fā)現(xiàn)文法對(duì)“上加字+基字”、“基字+下加字”和“上加字+基字+下加字”疊加的限制非常嚴(yán)格,并且其數(shù)量也很有限,也沒(méi)有任何規(guī)律,故選擇該三個(gè)結(jié)構(gòu)作為一個(gè)固定的結(jié)構(gòu),把要判斷的當(dāng)前音節(jié)在這些結(jié)構(gòu)中查找,如果在該結(jié)構(gòu)中找到就能很好、很快地判斷該音節(jié)的結(jié)構(gòu)。建立4個(gè)表,用于處理固定結(jié)構(gòu)和識(shí)別特殊字符。表名描述表1shang_ji[33]上加字+基字表2ji_xia[36]基字+下加字表3shang_ji_xia[15]上加字+基字+下加字4、14個(gè)字符“二義性”進(jìn)行特殊處理3個(gè)構(gòu)件的藏字有一些具有“二義性”,如既可以識(shí)別為“前加字+基字+后加字”,也可以識(shí)別為“基字+后加字+再后加字”,針對(duì)這類音節(jié),算法中需要做特殊處理。經(jīng)過(guò)人工整理,共找到14個(gè)具有二義性的特殊音節(jié),如表所示,在算法中約定這14個(gè)音節(jié)都按照“基字+后加字+再后加字”的結(jié)構(gòu)進(jìn)行處理。5、利用元音的特殊性識(shí)別藏文字符的構(gòu)件本發(fā)明又充分利用藏文字符的特殊構(gòu)件——4個(gè)元音,從藏文字符有無(wú)元音和元音的位置來(lái)判斷構(gòu)件。進(jìn)行構(gòu)件拆分,將識(shí)別的藏文字符的構(gòu)件按照“前加字-上加字-基字-下加字-再下加字-元音-后加字-再后加字”八個(gè)部分放置,(一般藏文字符都是7個(gè)構(gòu)件,如前所述只有“特殊構(gòu)件”才會(huì)有“再下加字”構(gòu)件),缺少的構(gòu)件用“空”、“0”或“NULL”補(bǔ)齊。具體而言,詳細(xì)的處理過(guò)程如下:本發(fā)明按照現(xiàn)代藏文字符的結(jié)構(gòu)和一個(gè)藏文字符的字符數(shù)來(lái)識(shí)別藏文字符的構(gòu)件。流程圖如下圖3。本發(fā)明除去“特殊構(gòu)件”后,按照字符的多少把藏文字符處理分為7個(gè)種不同的情況分別處理,7中情況對(duì)應(yīng)于構(gòu)成藏文字符的1-7個(gè)構(gòu)件數(shù)。按照七種情況識(shí)別構(gòu)件的具體方法如下:1、如果藏字是1個(gè)字符就一定是“基字”,表示為“空空字符”2、如果藏文是2個(gè)字符,則識(shí)別構(gòu)件的方法為:首先判斷第2位是否是元音,是則表示為“空空1字符空空2字符”,如果沒(méi)有元音,則查表1,如果有,判斷為“上+基”的結(jié)構(gòu),如果表1中沒(méi)有則查表2,判斷為“基+下”。見(jiàn)流程圖如圖4。3、如果構(gòu)件為3個(gè)字符,則識(shí)別構(gòu)件的方法如下:1)首先,判斷第2位是否是元音,如果“是”則表示為“空空1字符空空2字符3字符”,如果“否”,則轉(zhuǎn)到2);2)查表3,如果表中有,則判斷為“上+基+下”的結(jié)構(gòu),如果沒(méi)有在表3中,則轉(zhuǎn)到3);3)查表1,判斷前2位是否在表1中,如果有則判斷第3位是否是元音,如果是則表示為“空1字符2字符空空字符3”,如果第3位不是元音,則表示為“空1字符2字符空空空3字符”;如果前2位不在表1中,則轉(zhuǎn)到4)步;4)后兩位查表1,判斷是否在,如果是則結(jié)構(gòu)為“1字符2字符3字符”,如果后2位不在表1中,則轉(zhuǎn)到5)步;5)用藏字的前2位查表2,如果在表2中,再判斷第3位是否為元音,從而得到“空空1字符2字符空3字符”和“空空1字符2字符空空3字符”;如果不在表2中,則轉(zhuǎn)到6)步;6)用藏字的后2位查表2,如果在表2中,則為“1字符空2字符3字符”,如果沒(méi)在表2中,則轉(zhuǎn)到7)步;7)判讀第3位是否是元音,如果是元音,則表示為“1字符空2字符空空3字符”,如果不是元音,則轉(zhuǎn)到8)步;8)通過(guò)判讀該三個(gè)字符是否是表4中特殊的17種字符判讀結(jié)構(gòu)。流程圖如圖5。4、如果構(gòu)件為4個(gè)字符,則識(shí)別構(gòu)的方法如下:1)首先判斷第2位是否是元音,如果是元音,則結(jié)構(gòu)為“空空1字符空空2字符3字符4字符”;如果不是元音,則轉(zhuǎn)2);2)查表3,判斷字符的前3位是否是“上+基+下”的結(jié)構(gòu),如果是則判斷第4位是否是元音,如果是元音,則結(jié)構(gòu)為“空1字符2字符空3字符”,如果不是元音,則是“空1字符2字符3字符空空4字符”;如果前3位不在表3中,則轉(zhuǎn)3);3)查表1,判斷字符的前2位是否是“上+基”的結(jié)構(gòu),如果是,則判斷第3位是否是元音,如果是元音,則結(jié)構(gòu)為“空1字符2字符空空3字符4字符”,如果第3位不是元音,則結(jié)構(gòu)為“空1字符2字符空空空3字符4字符”,如果藏字的前2位不在表1中,則轉(zhuǎn)4);4)用藏字的前2位查表2,如果在表2中,再判斷第3位是否是元音,如果是,則結(jié)構(gòu)為“空空1字符2字符空3字符4字符”,如果第3位不是元音,則結(jié)構(gòu)為“空空1字符2字符空空3字符4字符”表示;如果前2位不在表2中,則轉(zhuǎn)5)步;5)用藏字的后3位表3,如果在表3中,則結(jié)構(gòu)為“1字符2字符3字符4字符”,如果沒(méi)有則轉(zhuǎn)6);6)藏文的中間2位查表2,如果有則判斷第4位是否是元音,如果是則結(jié)構(gòu)為“1字符空2字符3字符空4字符”,如果第4位不是元音,則結(jié)構(gòu)為“1字符空2字符3字符空空4字符”;如果中間2位不在表2中,則轉(zhuǎn)7)步;7)通過(guò)判斷第3位是否是元音來(lái)判斷結(jié)構(gòu)。具體流程圖如圖6。5、如果構(gòu)件為5個(gè)字符,則識(shí)別構(gòu)的方法如下:1)判斷藏文字符的第5位是否是元音,如果是,則結(jié)構(gòu)為“1字符2字符3字符4字符空5字符”,如果第5不是元音,則轉(zhuǎn)2);2)判斷藏文字符的第4位是否是元音,如果是元音,藏文字符的前3位查表3,如果在表3中,結(jié)構(gòu)為“空1字符2字符3字符空4字符5字符”;如果藏文字符的前3位不在表3中,則用藏文字符的2、3位查表1,如果在表1中,則結(jié)構(gòu)為“1字符2字符3字符空空4字符5字符”;如果不在表1中,則結(jié)構(gòu)為“1字符空2字符3字符空4字符5字符”;如果藏文字符的第4位不是元音,則轉(zhuǎn)3);3)藏文字符的第3位是否是元音,如果是,則用前2位查表1,如果在表1中,則結(jié)構(gòu)為“空1字符2字符空空3字符4字符5字符”;如果不在表1中,則查表2,如果在表2中,則結(jié)構(gòu)為“空空1字符2字符空3字符4字符5字符”;如果也不在表2中,則結(jié)構(gòu)為“1字符空2字符空空3字符4字符5字符”;如果第3字符不是元音,則轉(zhuǎn)4);4)用藏文字符的前3位查表3,如果有則結(jié)構(gòu)為“空1字符2字符3字符空空4字符5字符”;否則轉(zhuǎn)5);5)用藏文字符的中間3位查表3,如果有則結(jié)構(gòu)為“1字符2字符3字符4字符空空5字符”,否則轉(zhuǎn)6);6)用藏文字符的2、3位查表1,如果在表中,則結(jié)構(gòu)為“1字符2字符3字符空空空4字符5字符”,否則結(jié)構(gòu)為“1字符空2字符3字符空空4字符5字符”。具體流程圖如圖7。6、如果構(gòu)件為6個(gè)字符,則識(shí)別構(gòu)的方法如下:1)判斷藏文字符的第5位是否為元音,如果是,則結(jié)構(gòu)為“1字符2字符3字符4字符空5字符6字符”,如果否則轉(zhuǎn)2);2)判斷藏文字符的第4位是否為元音,如果是,則用藏文字符的前3位查表3,如果在表中,則結(jié)構(gòu)為“空1字符2字符3字符空4字符5字符6字符”;如果沒(méi)在表3中,用2、3位查表1,如果在表中,則結(jié)構(gòu)為“1字符2字符3字符空空4字符5字符6字符”;如果否則結(jié)構(gòu)為“1字符空2字符3字符空4字符5字符6字符”;否則結(jié)構(gòu)為“1字符2字符3字符4字符空空5字符6字符”。具體流程圖如圖8。7、如果字符為7個(gè)字符,則結(jié)構(gòu)為“1字符2字符3字符4字符空5字符6字符7字符”。二、藏文字符排序1、本發(fā)明中確定了藏文字符字典序的排序模型經(jīng)研究發(fā)現(xiàn),由于藏文字典序是人為規(guī)定的一種序列,所以不同的字典對(duì)字的序列規(guī)定也有所區(qū)別。通過(guò)《藏漢大詞典》等詞典的排序情況分析后得到藏字的字典序列是分層循環(huán)。如圖9所示,層次上分為:最核心的層次即第一層是基字層,這是構(gòu)成每個(gè)藏字的基礎(chǔ)和必不可缺少的構(gòu)件,而從第二層到第七層分別是上加字、前加字、下加字、元音、后加字和再后加字,第二層到第七層上的字符不是構(gòu)成藏字必不可缺少的成分,即按照藏字的不同,這些成分是可以缺少的,圖中用0表示該缺少的成分?,F(xiàn)代藏字的字典序列是,以基字為核心,與二至七層的字符分層組合,每一層又與其外層的字符依次組合,其中構(gòu)件的輔音序列為藏文字母序。舉例說(shuō)明:字典序中的第一個(gè)字是與其他六個(gè)層的0組合;第二字是與第二至第五層的0,第六層的組合;第七層再后加字必須加在后加字后面,也可以認(rèn)為單一后加字是跟再后加字0組合的結(jié)果。依次類推,字典字符的序列應(yīng)該為:(如果有的話)2、本發(fā)明確定的藏文字符排序的實(shí)現(xiàn)過(guò)程(1)藏文字符在計(jì)算機(jī)中的存儲(chǔ)方式藏文排序要比較藏文音節(jié)字的結(jié)構(gòu),所以從文本中讀取藏字后首先要識(shí)別構(gòu)件,構(gòu)件與藏文音節(jié)字要作為一個(gè)元素,故定義一個(gè)TibetWord結(jié)構(gòu)體,把讀取的音節(jié)和識(shí)別的構(gòu)件存入一個(gè)結(jié)構(gòu)體中。存儲(chǔ)空間主要用來(lái)存放音節(jié)及構(gòu)件,結(jié)構(gòu)體數(shù)組定義如下:(2)藏文字符的排序方法選擇一種排序方法進(jìn)行排序,藏字排序內(nèi)循環(huán)具體過(guò)程如下,①比較基字,即第3位,若基字不相等,則比較結(jié)束,返回基字的比較結(jié)果,否則執(zhí)行第②步;②比較上加字,即第2位,若上加字不相等,則比較結(jié)束,返回上加字的比較結(jié)果,否則執(zhí)行第③步;③比較前加字,即第1位,若前加字不相等,則比較結(jié)束,返回前加字的比較結(jié)果,否則執(zhí)行第④步;④比較下加字,即第4位,若下加字不相等,則比較結(jié)束,返回下加字的比較結(jié)果,否則執(zhí)行第⑤步;⑤比較再下加字,即第5位,若再下加字不相等,則比較結(jié)束,返回再下加字的比較結(jié)果,否則執(zhí)行第⑥步;⑥比較元音,即第6位,若元音不相等,則比較結(jié)束,返回元音的比較結(jié)果,否則執(zhí)行第⑦步;⑦比較后加字,即第7位,若后加字不相等,則比較結(jié)束,返回后加字的比較結(jié)果,否則執(zhí)行第⑧步;⑧比較再后加字,即第8位,返回再后加字的比較結(jié)果,比較結(jié)束。(3)應(yīng)用到具體的一種計(jì)算機(jī)排序方法中選擇的排序算法不同,函數(shù)的流程圖也不同,以“歸并排序”進(jìn)行藏文字符排序的流程圖如圖10所示。當(dāng)前第1頁(yè)1 2 3 
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
峡江县| 铜川市| 临武县| 铁岭市| 公安县| 新建县| 浦东新区| 苏州市| 安新县| 宁都县| 米易县| 东乡| 同仁县| 渭源县| 哈巴河县| 麻阳| 砀山县| 鞍山市| 兴宁市| 明光市| 宣城市| 内黄县| 揭西县| 永德县| 定安县| 喀什市| 皋兰县| 清河县| 南陵县| 大化| 凤城市| 澄城县| 绥滨县| 海阳市| 鲁山县| 门头沟区| 林芝县| 永川市| 巴林左旗| 汉寿县| 灵丘县|