專利名稱:手持設(shè)備上電子辭典中存儲(chǔ)和快速查找語(yǔ)音信息的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及手持設(shè)備領(lǐng)域,特別涉及手持設(shè)備上的電子辭典領(lǐng)域,具體是指一種手持設(shè)備上電子辭典中存儲(chǔ)和快速查找語(yǔ)音信息的方法。
背景技術(shù):
目前,市場(chǎng)上出現(xiàn)形形色色的電子辭典,而且功能和詞匯量都越來(lái)越強(qiáng)大,但是市場(chǎng)的手持設(shè)備特別中還沒(méi)有使用詞匯量大并且百分之百真人發(fā)音的電子辭典。想要在手機(jī)中增加這樣的功能,勢(shì)必造成了要用更多的存儲(chǔ)空間來(lái)存放海量的辭典文本和語(yǔ)音文件,尤其是海量的單詞發(fā)音檔。如果存儲(chǔ)方式和查找方法不好,就容易使導(dǎo)致手機(jī)為辭典大大增加了存儲(chǔ)空間,而且用戶查找單詞的發(fā)音時(shí),速度也會(huì)變得很慢。
同時(shí),在現(xiàn)有技術(shù)中,AMR(Adaptive Multi-Rate)是nokia為WB-AMR格式(AWB)的鈴聲所作的商業(yè)命名,并已經(jīng)被3GPP(3rd Generation Partnership Project,第三代合作伙伴計(jì)劃)選定為GSM和3G WCDMA應(yīng)用的寬帶語(yǔ)言編解標(biāo)準(zhǔn)。AMR由歐洲通信標(biāo)準(zhǔn)化委員會(huì)提出,是在移動(dòng)通信系統(tǒng)中使用最廣泛的語(yǔ)音標(biāo)準(zhǔn),MMS也采用這一格式作為聲音標(biāo)準(zhǔn)。
目前通常使用的電子辭典的語(yǔ)音文件是以一個(gè)單詞或詞組對(duì)應(yīng)一個(gè)語(yǔ)音文件,對(duì)于數(shù)量較少的文件還是可行的,但是如果在手機(jī)中采用高級(jí)雙解詞典,至少要有近五萬(wàn)單詞的語(yǔ)音文件,雖然經(jīng)過(guò)AMR的壓縮,仍然有二十多兆大。辭典的海量詞匯,用戶查詢發(fā)音會(huì)更加耗時(shí)和占用存儲(chǔ)空間,這樣就給手持設(shè)備上電子辭典的普及以及容量的升級(jí)、功能的擴(kuò)展帶來(lái)了很大的不便。
發(fā)明內(nèi)容本發(fā)明的目的是克服了上述現(xiàn)有技術(shù)中的缺點(diǎn),提供一種有效降低語(yǔ)音文件對(duì)手持設(shè)備存儲(chǔ)空間的占用率、提高檢索語(yǔ)音信息速度、用戶等待時(shí)間較短、操作快捷方便、工作性能穩(wěn)定可靠、適用面較為廣泛的手持設(shè)備上電子辭典中存儲(chǔ)和快速查找語(yǔ)音信息的方法。
為了實(shí)現(xiàn)上述的目的,本發(fā)明的手持設(shè)備上電子辭典中存儲(chǔ)和快速查找語(yǔ)音信息的方法如下
該手持設(shè)備上電子辭典中存儲(chǔ)語(yǔ)音信息的方法,其主要特點(diǎn)是,所述的存儲(chǔ)語(yǔ)音信息的方法包括以下步驟(1)將存儲(chǔ)語(yǔ)音信息的語(yǔ)音文件的頭信息刪除;(2)將所有單詞或詞組分為數(shù)個(gè)分組,且每個(gè)分組中的單詞或詞組所對(duì)應(yīng)的語(yǔ)音信息共同組成一個(gè)語(yǔ)音文件檔包;(3)根據(jù)所述的分組建立分組索引表,并根據(jù)每個(gè)分組中的單詞或詞組所對(duì)應(yīng)的語(yǔ)音信息建立各個(gè)分組所對(duì)應(yīng)的語(yǔ)音信息地址表;(4)將每個(gè)單詞或詞組在分組索引表中所對(duì)應(yīng)的索引信息和在語(yǔ)音信息地址表中的地址信息填入該單詞或詞組的語(yǔ)音字段中。
該手持設(shè)備上電子辭典中存儲(chǔ)語(yǔ)音信息的方法的分組索引表的內(nèi)容為各個(gè)分組序號(hào)與該分組的語(yǔ)音信息地址表之間的對(duì)應(yīng)關(guān)系。
該手持設(shè)備上電子辭典中存儲(chǔ)語(yǔ)音信息的方法的語(yǔ)音信息地址表的內(nèi)容包括各個(gè)單詞或詞組所對(duì)應(yīng)的語(yǔ)音信息的存儲(chǔ)位置的起始地址和信息長(zhǎng)度。
該手持設(shè)備上電子辭典中存儲(chǔ)語(yǔ)音信息的方法的語(yǔ)音文件為ARM格式文件,所述的頭信息長(zhǎng)度為7字節(jié),信息內(nèi)容為0x23、0x21、0x41、0x4D、0x52、0x0A、0x3C。
該基于上述的方法在手持設(shè)備上電子辭典中實(shí)現(xiàn)快速查找語(yǔ)音信息的方法,其主要特點(diǎn)是,所述的快速查找語(yǔ)音信息的方法包括以下步驟(1)系統(tǒng)進(jìn)行初始化;(2)系統(tǒng)根據(jù)用戶操作接收所輸入的單詞或詞組;(3)判斷該單詞或詞組是否有對(duì)應(yīng)的語(yǔ)音信息存在;(4)如果不存在,則重復(fù)上述步驟(2);(5)如果存在,則搜索并讀取該單詞或詞組的全部信息;(6)從該單詞或詞組的信息中提取語(yǔ)音字段信息;(7)根據(jù)所述的語(yǔ)音字段信息和所述的分組索引表、語(yǔ)音信息地址表進(jìn)行提取該單詞或詞組對(duì)應(yīng)的語(yǔ)音信息的處理操作;(8)在所得到的語(yǔ)音信息上加載語(yǔ)音文件的頭信息;(9)將形成的完整的語(yǔ)音文件載入內(nèi)存中;(10)對(duì)所述的語(yǔ)音文件進(jìn)行播放處理操作;(11)根據(jù)用戶操作判斷是否需要重復(fù)發(fā)音;(12)如果是,則重復(fù)上述步驟(11);否則,重復(fù)上述步驟(2)。
該手持設(shè)備上電子辭典中快速查找語(yǔ)音信息的方法的分組索引表的內(nèi)容為各個(gè)分組序號(hào)與該分組的語(yǔ)音信息地址表之間的對(duì)應(yīng)關(guān)系。
該手持設(shè)備上電子辭典中快速查找語(yǔ)音信息的方法的語(yǔ)音信息地址表的內(nèi)容包括各個(gè)單詞或詞組所對(duì)應(yīng)的語(yǔ)音信息的存儲(chǔ)位置的起始地址和信息長(zhǎng)度。
該手持設(shè)備上電子辭典中快速查找語(yǔ)音信息的方法的進(jìn)行提取單詞或詞組對(duì)應(yīng)的語(yǔ)音信息的處理操作包括以下步驟(1)根據(jù)語(yǔ)音字段信息中的索引信息,在分組索引表中查到該單詞或詞組所對(duì)應(yīng)的分組;(2)根據(jù)語(yǔ)音字段信息中的地址信息,在相應(yīng)分組所對(duì)應(yīng)的語(yǔ)音信息地址表中得到該單詞或詞組所對(duì)應(yīng)的語(yǔ)音信息的存儲(chǔ)位置的起始地址和信息長(zhǎng)度;(3)根據(jù)上述的語(yǔ)音信息的存儲(chǔ)位置的起始地址和信息長(zhǎng)度在該分組所對(duì)應(yīng)的語(yǔ)音文件檔包中提取出相應(yīng)的語(yǔ)音信息。
該手持設(shè)備上電子辭典中快速查找語(yǔ)音信息的方法的語(yǔ)音文件為ARM格式文件,所述的頭信息長(zhǎng)度為7字節(jié),信息內(nèi)容為0x23、0x21、0x41、0x4D、Ox52、0x0A、0x3C。
該手持設(shè)備上電子辭典中快速查找語(yǔ)音信息的方法的播放處理操作為調(diào)用ARM格式文件播放器播放該ARM格式的語(yǔ)音文件。
采用了該發(fā)明的手持設(shè)備上電子辭典中存儲(chǔ)和快速查找語(yǔ)音信息的方法,由于在存儲(chǔ)過(guò)程中將語(yǔ)音文件的頭信息去除,同時(shí)將語(yǔ)音信息分組合并,而且建立分組索引表、語(yǔ)音信息地址表和單詞與語(yǔ)音文件起始地址的直接對(duì)應(yīng)關(guān)系,使得不僅可以有效節(jié)省手持設(shè)備中有限而且寶貴的存儲(chǔ)空間,而且通過(guò)對(duì)分組索引表和語(yǔ)音信息地址表的檢索能夠有效提高檢索語(yǔ)音信息的速度,從而使得用戶等待的時(shí)間較短,同時(shí)操作快捷方便;不僅如此,本發(fā)明的方法的工作性能穩(wěn)定可靠,適用面較為廣泛,有利于手持設(shè)備上電子辭典的普及應(yīng)用、容量的升級(jí)以及功能的擴(kuò)展。
圖1為本發(fā)明的手持設(shè)備上電子辭典中所存儲(chǔ)的ARM語(yǔ)音壓縮文件格式示意圖。
圖2為本發(fā)明的手持設(shè)備上電子辭典中所存儲(chǔ)的ARM語(yǔ)音壓縮文件多級(jí)檢索示意圖。
圖3為本發(fā)明的手持設(shè)備上電子辭典中快速查找語(yǔ)音信息的方法的工作流程圖。
具體實(shí)施方式為了能夠更清楚地理解本發(fā)明的技術(shù)內(nèi)容,特舉以下實(shí)施例詳細(xì)說(shuō)明。
請(qǐng)參閱圖1至圖3所示,該手持設(shè)備上電子辭典中存儲(chǔ)和快速查找語(yǔ)音信息的方法,包括語(yǔ)音信息的存儲(chǔ)操作和語(yǔ)音信息的快速查找操作,其中,所述的語(yǔ)音信息的存儲(chǔ)操作包括以下步驟(1)將存儲(chǔ)語(yǔ)音信息的語(yǔ)音文件的頭信息刪除,該語(yǔ)音文件為ARM格式文件,所述的頭信息長(zhǎng)度為7字節(jié),信息內(nèi)容為0x23、0x21、0x41、0x4D、0x52、0x0A、0x3C;(2)將所有單詞或詞組分為數(shù)個(gè)分組,且每個(gè)分組中的單詞或詞組所對(duì)應(yīng)的語(yǔ)音信息共同組成一個(gè)語(yǔ)音文件檔包;(3)根據(jù)所述的分組建立分組索引表,并根據(jù)每個(gè)分組中的單詞或詞組所對(duì)應(yīng)的語(yǔ)音信息建立各個(gè)分組所對(duì)應(yīng)的語(yǔ)音信息地址表,該分組索引表的內(nèi)容為各個(gè)分組序號(hào)與該分組的語(yǔ)音信息地址表之間的對(duì)應(yīng)關(guān)系;該語(yǔ)音信息地址表的內(nèi)容包括各個(gè)單詞或詞組所對(duì)應(yīng)的語(yǔ)音信息的存儲(chǔ)位置的起始地址和信息長(zhǎng)度;(4)將每個(gè)單詞或詞組在分組索引表中所對(duì)應(yīng)的索引信息和在語(yǔ)音信息地址表中的地址信息填入該單詞或詞組的語(yǔ)音字段中;所述的語(yǔ)音信息的快速查找操作包括以下步驟(1)系統(tǒng)進(jìn)行初始化;(2)系統(tǒng)根據(jù)用戶操作接收所輸入的單詞或詞組;(3)判斷該單詞或詞組是否有對(duì)應(yīng)的語(yǔ)音信息存在;(4)如果不存在,則重復(fù)上述步驟(2);(5)如果存在,則搜索并讀取該單詞或詞組的全部信息;(6)從該單詞或詞組的信息中提取語(yǔ)音字段信息;(7)根據(jù)所述的語(yǔ)音字段信息和所述的分組索引表、語(yǔ)音信息地址表進(jìn)行提取該單詞或詞組對(duì)應(yīng)的語(yǔ)音信息的處理操作,該提取單詞或詞組對(duì)應(yīng)的語(yǔ)音信息的處理操作包括以下步驟(a)根據(jù)語(yǔ)音字段信息中的索引信息,在分組索引表中查到該單詞或詞組所對(duì)應(yīng)的分組;(b)根據(jù)語(yǔ)音字段信息中的地址信息,在相應(yīng)分組所對(duì)應(yīng)的語(yǔ)音信息地址表中得到該單詞或詞組所對(duì)應(yīng)的語(yǔ)音信息的存儲(chǔ)位置的起始地址和信息長(zhǎng)度;(c)根據(jù)上述的語(yǔ)音信息的存儲(chǔ)位置的起始地址和信息長(zhǎng)度在該分組所對(duì)應(yīng)的語(yǔ)音文件檔包中提取出相應(yīng)的語(yǔ)音信息;(8)在所得到的語(yǔ)音信息上加載ARM語(yǔ)音文件的相應(yīng)的頭信息;
(9)將形成的完整的語(yǔ)音文件載入內(nèi)存中;(10)對(duì)所述的語(yǔ)音文件進(jìn)行播放處理操作,該播放處理操作為調(diào)用ARM格式文件播放器播放該ARM格式的語(yǔ)音文件;(11)根據(jù)用戶操作判斷是否需要重復(fù)發(fā)音;(12)如果是,則重復(fù)上述步驟(11);否則,重復(fù)上述步驟(2)。
在實(shí)際應(yīng)用當(dāng)中,上述方法不僅適用于手機(jī)上的電子辭典,而且適用于快譯通、好譯通等專門(mén)的掌上電子辭典,同時(shí)對(duì)于PDA、掌上電腦等設(shè)備上也能夠適用。
對(duì)于語(yǔ)音信息的存儲(chǔ)過(guò)程,可以采用如下方式(1)刪去每個(gè)語(yǔ)音文件的頭信息用AMR壓縮PCM格式的語(yǔ)音文件,按照8k的采樣率和4.75kbit/s的壓縮比率進(jìn)行壓縮后,AMR文件的前7位均為0x23、0x21、0x41、0x4D、0x52、0x0A、0x3C,故這7byte可以在播放該文件的時(shí)候再加載內(nèi)存,這樣若有50000單詞,便可以節(jié)省7byte*50000=341.8K的存儲(chǔ)空間。
(2)將3125個(gè)單詞語(yǔ)音打成一個(gè)文件包以前50000個(gè)語(yǔ)音文件,即使用最好的兩分法,也需要log50000/log2≈15.6次才可以找到,但是如果做成16個(gè)檔包,只需要4次就可以找到,而且是檢索到語(yǔ)音文件的起始地址和長(zhǎng)度。
(3)建立單詞與語(yǔ)音文件的直接索引表以語(yǔ)音文件的起始地址直接做為單詞或詞組語(yǔ)音字段的標(biāo)記,可以大大減少通過(guò)大型索引表查詢所帶來(lái)的時(shí)間上的花費(fèi)。例如abandon的存儲(chǔ)起始地址是0x00DD11,那么它在字典文本中VIOC字段后的標(biāo)記就是00DD11。而不是通過(guò)全文索引表,根據(jù)單詞的序號(hào)再獲得地址。改進(jìn)后節(jié)省了索引的時(shí)間。
同時(shí),用這種語(yǔ)音存儲(chǔ)和索引機(jī)制,可以減少部分存儲(chǔ)空間,并且有效的提高語(yǔ)音文件的檢索速度,而且本方法通用性強(qiáng),同時(shí)可以用于其它海量電子辭典以及英語(yǔ)考試的聽(tīng)力文件的存取,是一種優(yōu)化語(yǔ)音文件的好方法。
采用了上述的手持設(shè)備上電子辭典中存儲(chǔ)和快速查找語(yǔ)音信息的方法,由于在存儲(chǔ)過(guò)程中將語(yǔ)音文件的頭信息去除,同時(shí)將語(yǔ)音信息分組合并,而且建立分組索引表、語(yǔ)音信息地址表和單詞與語(yǔ)音文件起始地址的直接對(duì)應(yīng)關(guān)系,使得不僅可以有效節(jié)省手持設(shè)備中有限而且寶貴的存儲(chǔ)空間,而且通過(guò)對(duì)分組索引表和語(yǔ)音信息地址表的檢索能夠有效提高檢索語(yǔ)音信息的速度,從而使得用戶等待的時(shí)間較短,同時(shí)操作快捷方便;不僅如此,上述方法的工作性能穩(wěn)定可靠,適用面較為廣泛,有利于手持設(shè)備上電子辭典的普及應(yīng)用、容量的升級(jí)以及功能的擴(kuò)展。
在此說(shuō)明書(shū)中,本發(fā)明已參照其特定的實(shí)施例作了描述。但是,很顯然仍可以作出各種修改和變換而不背離本發(fā)明的精神和范圍。因此,說(shuō)明書(shū)和附圖應(yīng)被認(rèn)為是說(shuō)明性的而非限制性的。
權(quán)利要求
1.一種手持設(shè)備上電子辭典中存儲(chǔ)語(yǔ)音信息的方法,其特征在于,所述的存儲(chǔ)語(yǔ)音信息的方法包括以下步驟(1)將存儲(chǔ)語(yǔ)音信息的語(yǔ)音文件的頭信息刪除;(2)將所有單詞或詞組分為數(shù)個(gè)分組,且每個(gè)分組中的單詞或詞組所對(duì)應(yīng)的語(yǔ)音信息共同組成一個(gè)語(yǔ)音文件檔包;(3)根據(jù)所述的分組建立分組索引表,并根據(jù)每個(gè)分組中的單詞或詞組所對(duì)應(yīng)的語(yǔ)音信息建立各個(gè)分組所對(duì)應(yīng)的語(yǔ)音信息地址表;(4)將每個(gè)單詞或詞組在分組索引表中所對(duì)應(yīng)的索引信息和在語(yǔ)音信息地址表中的地址信息填入該單詞或詞組的語(yǔ)音字段中。
2.根據(jù)權(quán)利要求
1所述的手持設(shè)備上電子辭典中存儲(chǔ)語(yǔ)音信息的方法,其特征在于,所述的分組索引表的內(nèi)容為各個(gè)分組序號(hào)與該分組的語(yǔ)音信息地址表之間的對(duì)應(yīng)關(guān)系。
3.根據(jù)權(quán)利要求
2所述的手持設(shè)備上電子辭典中存儲(chǔ)語(yǔ)音信息的方法,其特征在于,所述的語(yǔ)音信息地址表的內(nèi)容包括各個(gè)單詞或詞組所對(duì)應(yīng)的語(yǔ)音信息的存儲(chǔ)位置的起始地址和信息長(zhǎng)度。
4.根據(jù)權(quán)利要求
1至3中任一項(xiàng)所述的手持設(shè)備上電子辭典中存儲(chǔ)語(yǔ)音信息的方法,其特征在于,所述的語(yǔ)音文件為ARM格式文件,所述的頭信息長(zhǎng)度為7字節(jié),信息內(nèi)容為0x23、0x21、0x41、0x4D、0x52、0x0A、0x3C。
5.一種基于權(quán)利要求
1所述的方法在手持設(shè)備上電子辭典中實(shí)現(xiàn)快速查找語(yǔ)音信息的方法,其特征在于,所述的快速查找語(yǔ)音信息的方法包括以下步驟(1)系統(tǒng)進(jìn)行初始化;(2)系統(tǒng)根據(jù)用戶操作接收所輸入的單詞或詞組;(3)判斷該單詞或詞組是否有對(duì)應(yīng)的語(yǔ)音信息存在;(4)如果不存在,則重復(fù)上述步驟(2);(5)如果存在,則搜索并讀取該單詞或詞組的全部信息;(6)從該單詞或詞組的信息中提取語(yǔ)音字段信息;(7)根據(jù)所述的語(yǔ)音字段信息和所述的分組索引表、語(yǔ)音信息地址表進(jìn)行提取該單詞或詞組對(duì)應(yīng)的語(yǔ)音信息的處理操作;(8)在所得到的語(yǔ)音信息上加載語(yǔ)音文件的頭信息;(9)將形成的完整的語(yǔ)音文件載入內(nèi)存中;(10)對(duì)所述的語(yǔ)音文件進(jìn)行播放處理操作;(11)根據(jù)用戶操作判斷是否需要重復(fù)發(fā)音;(12)如果是,則重復(fù)上述步驟(11);否則,重復(fù)上述步驟(2)。
6.根據(jù)權(quán)利要求
5所述的手持設(shè)備上電子辭典中快速查找語(yǔ)音信息的方法,其特征在于,所述的分組索引表的內(nèi)容為各個(gè)分組序號(hào)與該分組的語(yǔ)音信息地址表之間的對(duì)應(yīng)關(guān)系。
7.根據(jù)權(quán)利要求
6所述的手持設(shè)備上電子辭典中快速查找語(yǔ)音信息的方法,其特征在于,所述的語(yǔ)音信息地址表的內(nèi)容包括各個(gè)單詞或詞組所對(duì)應(yīng)的語(yǔ)音信息的存儲(chǔ)位置的起始地址和信息長(zhǎng)度。
8.根據(jù)權(quán)利要求
7所述的手持設(shè)備上電子辭典中快速查找語(yǔ)音信息的方法,其特征在于,所述的進(jìn)行提取單詞或詞組對(duì)應(yīng)的語(yǔ)音信息的處理操作包括以下步驟(1)根據(jù)語(yǔ)音字段信息中的索引信息,在分組索引表中查到該單詞或詞組所對(duì)應(yīng)的分組;(2)根據(jù)語(yǔ)音字段信息中的地址信息,在相應(yīng)分組所對(duì)應(yīng)的語(yǔ)音信息地址表中得到該單詞或詞組所對(duì)應(yīng)的語(yǔ)音信息的存儲(chǔ)位置的起始地址和信息長(zhǎng)度;(3)根據(jù)上述的語(yǔ)音信息的存儲(chǔ)位置的起始地址和信息長(zhǎng)度在該分組所對(duì)應(yīng)的語(yǔ)音文件檔包中提取出相應(yīng)的語(yǔ)音信息。
9.根據(jù)權(quán)利要求
5至8中任一項(xiàng)所述的手持設(shè)備上電子辭典中快速查找語(yǔ)音信息的方法,其特征在于,所述的語(yǔ)音文件為ARM格式文件,所述的頭信息長(zhǎng)度為7字節(jié),信息內(nèi)容為0x23、0x21、0x41、0x4D、0x52、0x0A、0x3C。
10.根據(jù)權(quán)利要求
9所述的手持設(shè)備上電子辭典中快速查找語(yǔ)音信息的方法,其特征在于,所述的播放處理操作為調(diào)用ARM格式文件播放器播放該ARM格式的語(yǔ)音文件。
專利摘要
本發(fā)明涉及一種手持設(shè)備上電子辭典中存儲(chǔ)和快速查找語(yǔ)音信息的方法,語(yǔ)音信息的存儲(chǔ)操作包括將語(yǔ)音文件的頭信息刪除、將語(yǔ)音信息分組形成多個(gè)語(yǔ)音文件檔包、建立分組索引表和語(yǔ)音信息地址表、將索引信息和地址信息填入該單詞或詞組的語(yǔ)音字段中;語(yǔ)音信息的快速查找操作包括判斷該單詞或詞組是否存在語(yǔ)音信息、若存在則提取該單詞或詞組的語(yǔ)音字段信息、提取對(duì)應(yīng)的語(yǔ)音信息、加載語(yǔ)音文件的頭信息并進(jìn)行播放處理操作。采用該種手持設(shè)備上電子辭典中存儲(chǔ)和快速查找語(yǔ)音信息的方法,有效節(jié)省了手持設(shè)備的存儲(chǔ)空間,而且能夠有效提高檢索語(yǔ)音信息的速度,用戶等待的時(shí)間較短,操作快捷方便,工作性能穩(wěn)定可靠,適用面較為廣泛,利于電子辭典的普及。
文檔編號(hào)H04Q7/32GK1996286SQ200610023148
公開(kāi)日2007年7月11日 申請(qǐng)日期2006年1月6日
發(fā)明者毛應(yīng)龍, 何代水 申請(qǐng)人:英華達(dá)(上海)電子有限公司導(dǎo)出引文BiBTeX, EndNote, RefMan