欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

觸劃式語音輸入方法及觸劃式即時(shí)語音輸入裝置的制作方法

文檔序號:6611120閱讀:195來源:國知局
專利名稱:觸劃式語音輸入方法及觸劃式即時(shí)語音輸入裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于日常生活中進(jìn)行語音通訊的語音輸入方法及語音輸入 裝置,尤其是能夠讓用戶以觸劃方式替代發(fā)聲器官進(jìn)行即時(shí)語音輸入的原創(chuàng)性語 音輸入方法及即時(shí)語音輸入裝置。
背景技術(shù)
語音通訊是現(xiàn)代日常生活中最普通的事情,現(xiàn)有的語音通訊工具種類繁多, 有簡單的對講機(jī)、電話,也有復(fù)雜的手機(jī)和銥星電話,其外觀也是從簡樸到奢華, 應(yīng)有盡有,在通訊網(wǎng)絡(luò)上有獨(dú)立的民用和軍用電話網(wǎng)絡(luò),有基于衛(wèi)星通訊的無線 網(wǎng)絡(luò),也有基于Internet的IP電話網(wǎng)絡(luò),還有基于電力載波的通訊網(wǎng)絡(luò)等,但在 基本工作原理上,其漢字語音輸入則幾乎完全是基于用戶的發(fā)聲器官的通訊方 式,即首先由通訊工具的使用者通過其聲帶發(fā)出具備一定含義的聲音,該聲音在 空氣中以聲波形式作用于通訊工具上的聲音傳感器即話筒并經(jīng)采樣后得到具有 用戶聲紋特征和具備一定意義的語音信號,進(jìn)一步處理后,語音信號可以通過通 訊工具的信號傳輸和發(fā)射模塊及通訊網(wǎng)絡(luò)發(fā)送至遠(yuǎn)處受話者端的通訊工具,從而 使其能夠聽到本地用戶所發(fā)出的聲音,同樣地,遠(yuǎn)地用戶所發(fā)出的聲音也可以經(jīng) 由通訊工具及通訊網(wǎng)絡(luò)由本地用戶所聽到,本地用戶和遠(yuǎn)地用戶連續(xù)的語音交互 就構(gòu)成了即時(shí)的語音通訊。
上述即時(shí)語音通訊模式基本能夠滿足人們?nèi)粘5募磿r(shí)語音通話需求,但是這 種模式并非完全適用于所有的對象和所有的場合。對于聾啞人、后天由于疾病導(dǎo) 致聲帶失聲的患者,吐字發(fā)音不清晰者,以及年老體弱無力發(fā)聲的老年人,我們 日常生活中使用的電話和手機(jī)等通訊工具將難以為他們所使用,此外,在特定的 場合如會議現(xiàn)場、病房、辦公室及教室等許多需要安靜的場合以及公共汽車、商 場、生產(chǎn)車間和工地等喧鬧的場所等,上述即時(shí)語音模式也不能為正常用戶順利 使用。日常生活中我們看到的是這樣的情況,為了不影響會議現(xiàn)場及辦公室等安 靜場所其他人的正常工作,或者出于保護(hù)個(gè)人通話隱私的目的r很多人在電話鈴 聲響起時(shí),總是選擇匆忙離開現(xiàn)場轉(zhuǎn)而到過道或休息室等去接聽電話,而在公共汽車、商場、生產(chǎn)車間和工地等喧鬧的場所,由于異常嘈雜難以進(jìn)行語音交流, 很多人則索性掐掉電話,改用短信進(jìn)行信息交流,而短信交流遠(yuǎn)沒有語音交流那 么快捷和方便自然,此外,在基于Internet的網(wǎng)絡(luò)聊天交流中,網(wǎng)友之間雖然可 以進(jìn)行即時(shí)語音聊天交流,但在辦公室環(huán)境下是很不合適的, 一方面會影響他人 正常工作,同時(shí)也存在泄露個(gè)人聊天隱私的問題,可以說,目前的即時(shí)語音通話 方式已經(jīng)成為特定人群和特定場合所面臨的一大困難。
上述困難目前已經(jīng)引起部分研究人員的關(guān)注和重視,遺憾的是迄今為止尚無 任何有效實(shí)用的技術(shù)手段,雖然國外亦有為聾啞人和失聲患者所開發(fā)的信息交互 裝置,但那只是簡單的符號信息交互,即通過特定的觸覺剌激表達(dá)特定的含義, 不是即時(shí)語音通訊模式,所傳遞的信息量極其有限,遠(yuǎn)不能做到像日常交流那樣 方便地進(jìn)行語音交互,而且在操作上也很不實(shí)用。而面向老年人及特定場合下的 語音即時(shí)通訊,以及會議現(xiàn)場等安靜場所的手機(jī)接聽問題,經(jīng)檢索目前幾乎未見 任何學(xué)術(shù)或新聞報(bào)道。

發(fā)明內(nèi)容
技術(shù)問題:本發(fā)明的目的是克服目前采用人體聲帶器官作為即時(shí)語音通訊工 具的語音輸入方式在實(shí)際使用中存在的不足,提供一種通過通訊工具的觸摸屏以 觸劃方式提供漢字語音信號的語音輸入方法及觸劃式語音輸入工具,該觸劃式語 音輸入方法不僅能夠有效輸入漢字語音信號,而且操作簡單,方便易用,并具有 很高的語音輸入效率,可以實(shí)現(xiàn)與日常語音交流同步的即時(shí)語音輸入。
技術(shù)方案本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案
本發(fā)明技術(shù)方案的背景是
漢語拼音是中華人民共和國的漢字拉丁化方案,漢語拼音方案最早可以追溯 到1906年朱文熊的《江蘇新字母》和1908年劉孟揚(yáng)的《中國音標(biāo)字書》,還有 1926年的國語羅馬字和1931年的拉丁化中國字。所有這些漢字拉丁化方案都為 漢語拼音的制定提供了基礎(chǔ)。現(xiàn)有的漢語拼音方案是1958年第一屆全國人民代 表大會第五次會議正式批準(zhǔn)公布的拉丁字母式的漢語拼音方案。1982年,成為 國際標(biāo)準(zhǔn)IS07098 (中文羅馬字母拼寫法)。該拼音方案主要用于漢語普通話讀 音的標(biāo)注,作為漢字的一種普通話音標(biāo)。漢語拼音采用拉丁字母,分聲母和韻母。 漢語拼音方案是一套表示讀音的符號系統(tǒng),漢語普通話拼音中共有21個(gè)聲母,此外,普通話里還有一種稱之為"零聲母"的聲母,零聲母的音節(jié)開頭不是輔音 而是元音,如"案"(an)。漢語普通話拼音中共有39個(gè)韻母。漢語拼音對普及 識字以及初等教育起了很大的作用。它的規(guī)律比較簡單,系統(tǒng)地體現(xiàn)了普通話發(fā) 音的規(guī)則。漢語拼音是一種只書寫讀音的體系,雖然完全用漢語拼音寫出來的文 章很難懂,但是用拼音組合發(fā)出的聲音卻能夠?yàn)槿硕牰?本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是
漢字的發(fā)音是由三位一體的固定音節(jié)構(gòu)成,每個(gè)音節(jié)由一個(gè)聲母、一個(gè)韻母、 一個(gè)聲調(diào)構(gòu)成,并且按照先聲母后韻母的順序固定。本發(fā)明正是基于這一漢語拼 音組合規(guī)則所提出的觸劃式語音輸入方法。
為實(shí)現(xiàn)漢字語音輸入的目的,本發(fā)明在手持語音輸入裝置上設(shè)置一個(gè)用于語 音輸入的觸摸屏,觸劃式語音輸入方法就是通過觸筆先后點(diǎn)擊或觸劃顯示在觸摸 屏上的聲母、韻母首字母、復(fù)韻母字母、韻母鼻音及聲調(diào)等以輸入所期望的語音 的漢語拼音,并據(jù)此通過標(biāo)準(zhǔn)語音庫和用戶語音庫檢索提取相應(yīng)的語音數(shù)據(jù),然 后送入通話線路或送揚(yáng)聲器進(jìn)行播放。
漢字的聲母多達(dá)二十多個(gè),為有效地輸入聲母,本發(fā)明在手持裝置上設(shè)置五
個(gè)與持機(jī)手掌的五個(gè)手指相對應(yīng)的側(cè)按鍵(圖5),并將漢語拼音的聲母(b、 p、 m、 f、 d、 t、 n、 1、 g、 k、 h、 j、 q、 x、 zh、 ch、 sh、 r、 z、 c、 s,共21個(gè))禾卩
韻母獨(dú)立成音節(jié)的"零聲母"(a/o/e、 y禾nw)分成五個(gè)子區(qū)段"a/o、 b、 c、 ch、 d", "e、 f、 g、 h、 j", "k、 1、 m、 n、 p", "q、 r、 s、 sh、 t,,及"w、 x、 y、 z、
zh" (o由于只有ou—個(gè)發(fā)音,將其和a組合在一起作為一個(gè)選項(xiàng)對待),從大 拇指到小指,每按一個(gè)側(cè)按鍵則在觸摸屏的左側(cè)顯示一列包含5個(gè)聲母字母的子 聲母區(qū)段,亦可只設(shè)置二個(gè)側(cè)按鍵(左上側(cè)和右上側(cè)各一個(gè)[圖2],或者左側(cè)上 方和上方左側(cè)各一個(gè)均可[圖4],亦可以采用滾輪代替?zhèn)劝存I[圖3],以方便使用 為原則),通過增減選擇不同的子聲母區(qū)段。需要特別說明的是,聲母區(qū)段的劃 分并不唯一,可以把零聲母作為單獨(dú)的聲母選項(xiàng)進(jìn)行區(qū)段劃分,也可以打破聲母 字母的自然順序進(jìn)行劃分,聲母子區(qū)段在數(shù)量上可以是5個(gè),也可以是3個(gè)、4 個(gè)、6個(gè)或者更多的子區(qū)段以適應(yīng)不同的需求,在顯示屏足夠大的情況下也可以 只有一個(gè)區(qū),子區(qū)段數(shù)量越少,每個(gè)子區(qū)段中的聲母數(shù)量就越多,操作相對也簡 單一些,但要求屏幕要足夠大,如果子區(qū)段中的聲母數(shù)量很多,而操作的屏幕又 很小,那么進(jìn)行觸劃選擇時(shí)就必須特別小心,否則很容易發(fā)生誤觸劃,從而影響效率。
圖3、圖4是本發(fā)明提供的聲母不做任何區(qū)段劃分(或相當(dāng)于一個(gè)區(qū))的聲 母選擇方案,該方案中,觸摸屏第一列可連續(xù)地順序顯示全部的聲母和零聲母 "a 、 b、 c、 ch、 d、 e、 f、 g、 h、 j、 k、 1、 m、 n、 o、 p、 q、 r、 s、 sh、 t、 w、 x、 y、 z、 zh",但在任一時(shí)刻,觸摸屏的第一列只顯示其中的幾個(gè)(3 6個(gè))供操 作者觸劃選擇。該方案在機(jī)身側(cè)邊設(shè)置有用于控制聲母顯示的滾輪[圖3],滾動 滾輪,觸摸屏第一列顯示的可供觸劃選擇的聲母也會相應(yīng)的按上述聲母順序上移 或下移,直至屏幕上出現(xiàn)所期望的聲母。滾輪也可用兩個(gè)側(cè)按鍵代替[圖4],以 適應(yīng)不同的操作習(xí)慣,側(cè)按鍵的位置可設(shè)置于機(jī)身的左上角,左上側(cè)和上方左側(cè) 各一個(gè)。側(cè)按鍵也可以設(shè)置于其他便于操作的位置以適應(yīng)不同的用戶。
當(dāng)子聲母區(qū)段選定后,操作者可通過觸筆在觸摸屏左側(cè)的第一列觸劃或點(diǎn)擊 選擇所希望的聲母。
在韻母的輸入上,本發(fā)明共有三種不同的單韻母、復(fù)韻母及鼻音字母布局方 案,分別如圖2 (圖3、圖4、圖5)、圖7和圖9 (圖IO)所示。下面分別予以 說明。
在圖2 (圖3、圖4、圖5)的方案中,觸摸屏的第二列顯示的是"a、 e、 i、 o、 u"五個(gè)單韻母,也是韻母首字母,單韻母"U"由于其拼音組合不多,將其 和u放在一個(gè)組,作為u的殘余部分進(jìn)行處理,觸摸屏第三列顯示的是與第一列 聲母和第二列單韻母可以進(jìn)行組合發(fā)音的所有可能的韻母殘余部分,第四列為聲 調(diào)。這種布局方案中,第二列的單韻母和第四列的聲調(diào)選擇區(qū)是靜態(tài)顯示的,從 程序進(jìn)入本操作界面到程序結(jié)束,這部分內(nèi)容始終保持不變,第二列顯示的內(nèi)容 恒為"a、 e、 i、 o、 u",最后一列顯示的恒為漢語拼音的五個(gè)聲調(diào),即第一聲(陰 平,或平調(diào),",、第二聲(陽平,或升調(diào),"'")、第三聲(上聲,或上音, '"")、第四聲(去聲,或去音,"、")和輕聲(亦稱第五聲,不標(biāo)音調(diào))。本方 案中第三列所顯示的內(nèi)容是與操作者所選擇的聲母和韻母首字母相匹配的所有 可能的韻母殘余部分,這部分內(nèi)容是動態(tài)顯示的,隨著所選擇的聲母和韻母首字 母的不同,第三列所顯示的韻母殘余部分的內(nèi)容也有所不同。在本發(fā)明方案中,
當(dāng)操作者希望發(fā)出某個(gè)聲音時(shí),需要首先通過五個(gè)手指中的一個(gè)按下與所要發(fā)出 聲音的聲母所在子區(qū)段相對應(yīng)的按鍵,然后通過觸筆觸劃或點(diǎn)擊選擇與所要發(fā)出
聲音對應(yīng)的聲母,然后是韻母首字母,接著在第三列點(diǎn)擊或觸劃選擇由聲母和韻母首字母確定的韻母殘余部分,最后選擇聲調(diào)即可以唯一地選擇并得到所期望的 漢語拼音。本方案中所有聲母、單韻母、韻母殘余部分和聲調(diào)每列最多只能選擇 一個(gè),多選無效。
圖7的方案與圖2 (圖3、圖4、圖5)方案最大的不同在于第二列的單韻母 可以選擇多個(gè)(聲母和聲調(diào)的選擇仍然只能選擇一個(gè))。由于韻母主要是由單韻 母和鼻音字母所構(gòu)成,所以實(shí)際的韻母字母只有8個(gè),即"a、 e、 i、 o、 u、 U、 n、 g"。本方案在第二列共設(shè)置了5個(gè)單韻母字母,所以第三列設(shè)置"11、 n、 g" 的選擇項(xiàng)即可。由于可以在第二列選擇多個(gè)單韻母,所以操作者通過觸筆點(diǎn)擊或 觸劃第二列即可以輸入全部的單韻母字母,繼續(xù)點(diǎn)擊或觸劃第三列可以輸入韻母 殘余部分"tl、 n、 g",從而完成韻母輸入。本方案與圖2 (圖3、圖4、圖5)方 案相比,其優(yōu)越性在于用于韻母輸入的所有字母選項(xiàng)的空間位置都是確定的,不 需要操作者去査找其空間位置,因而將大大提高點(diǎn)擊和觸劃效率。本方案中,除 第一列的子聲母區(qū)段是動態(tài)顯示之外,韻母字母和聲調(diào)的選擇均為靜態(tài)顯示,漢 字語音的輸入效率將大為提高。在本發(fā)明方案中,當(dāng)操作者希望發(fā)出某個(gè)聲音時(shí), 需要首先通過側(cè)按鍵選擇與所要發(fā)出聲音的聲母相對應(yīng)的子聲母區(qū)段,并通過觸 筆點(diǎn)擊或觸劃選擇與所要發(fā)出聲音對應(yīng)的聲母,然后在第二列依次順序點(diǎn)擊或觸 劃選擇韻母中的單韻母字母,接著在第三列觸劃選擇"li、 n、 g"等韻母殘余部 分,最后選擇聲調(diào)即可以唯一地選擇并得到所期望的語音的漢語拼音。
圖9的方案與圖7方案相似,不同之處在于第二列的單韻母仍然只能選擇一 個(gè),但是在第三列"U、 n、 g"韻母殘余部分選擇區(qū)的上下方各增加了一個(gè)單韻 母選擇區(qū),其中上部的為"a、 e 、 o、 i、 u",下部的為"a、 e、 i、 o、 u"。這樣 做的好處在于操作者輸入復(fù)韻母時(shí)觸筆不需要在第二列繞圈觸劃選擇,觸筆沿著 一個(gè)方向滑動即可完成觸劃選擇,操作將更為順暢。由于存在"iao" (niao)和
"uai" (kuai)兩種由三個(gè)單韻母構(gòu)成的復(fù)韻母的特例,所以上下部單韻母區(qū)的 字母順序不盡相同,上部單韻母區(qū)適合于輸入"iao",下單韻母區(qū)適合于輸入
"uai", "a o"和"a i"中間被"e"隔開,目的是盡量減少輸入只輸入"a"時(shí) 可能導(dǎo)致的誤觸劃,因?yàn)?a"和"e"不是合法的拼音組合,即使在觸劃"a" 后誤觸劃了 "e",系統(tǒng)也會自動丟棄"e",同理,如果觸劃輸入的是"aeo",系 統(tǒng)會自動將該輸入理解為"ao",這樣處理后,操作者觸劃輸入三個(gè)單韻母的復(fù) 韻母時(shí)操作將更為快捷有效方便。由于第三列"ii、 n、 g"韻母殘余部分選擇區(qū)的上下方被占用,所以本方案中,聲調(diào)選擇區(qū)安排在了最后一列,如圖9所示。 本發(fā)明方案中,除第一列的子聲母區(qū)段是動態(tài)顯示之外,韻母字母和聲調(diào)的選擇 均為靜態(tài)顯示,漢語拼音的輸入將能夠達(dá)到很高的效率。本發(fā)明方案中,當(dāng)操作 者希望發(fā)出某個(gè)聲音時(shí),需要首先通過側(cè)按鍵選擇與所要發(fā)出聲音的聲母相對應(yīng) 的子聲母區(qū)段,并通過觸筆點(diǎn)擊或觸劃選擇與所要發(fā)出聲音對應(yīng)的聲母,然后在 第二列點(diǎn)擊或觸劃選擇構(gòu)成韻母首字母的單韻母字母,如果沒有復(fù)韻母可直接觸 劃選擇"11、 n、 g"區(qū)中的韻母殘余部分,如果有復(fù)韻母則在"U、 n、 g"區(qū)的上 下方先觸劃選擇其他單韻母字母,然后再在"U、 n、 g"區(qū)中觸劃選擇韻母殘余 部分,最后選擇聲調(diào)即可以唯一地選擇并得到所期望的漢字語音。本方案中,"U、 n、 g"區(qū)上下方的單韻母選擇區(qū)亦可以只在上方或下方設(shè)置其中一個(gè),雖然沒有 兩個(gè)那樣方便,但也是比較實(shí)用的。
上述三種方案雖然各有不同,但均是可行并具有較高實(shí)際應(yīng)用價(jià)值的語音輸 入方案,尤其是圖7和圖9 (或圖IO)的方案,由于這兩個(gè)方案中韻母字母及聲 調(diào)選擇區(qū)的位置始終固定,用戶操作非常方便,因而也更具應(yīng)用價(jià)值,上述三種 不同的方案可以面向和適應(yīng)不同的用戶,為他們提供多種選擇。
當(dāng)操作者完成漢語拼音的輸入后,系統(tǒng)將據(jù)此從標(biāo)準(zhǔn)語音數(shù)據(jù)庫或用戶語音 數(shù)據(jù)庫中檢索并提取相應(yīng)漢語拼音所對應(yīng)的聲音文件,送至語音信號發(fā)射模塊, 并送聽筒以便具有聽覺能力的操作者確認(rèn)輸入是否正確。觸摸屏的正上方可以即 時(shí)顯示操作者所輸入的聲母和韻母及音調(diào),左上方為"退出"本應(yīng)用程序的操作, 右上方為"發(fā)送"選擇。
本發(fā)明中,語音輸出有兩種模式,即單個(gè)語音即時(shí)輸出和語音串輸出,語音 串輸出是等整句話輸入完成后通過點(diǎn)擊右上方的"發(fā)送"選項(xiàng)將整句話的漢語拼 音以語音串形式輸出語音信號。單個(gè)發(fā)音的即時(shí)輸出具有較好的即時(shí)性,整句的 語音串輸出則可能會存在一定的時(shí)延,實(shí)際應(yīng)用中可由用戶自行選擇。
本發(fā)明的觸劃式語音輸入工具(圖1),其特征在于該工具由MCU微控制器 (1)、標(biāo)準(zhǔn)語音庫(2)、用戶語音庫(3)、 A/D (4)、話筒(5)、 D/A (6)、揚(yáng) 聲器(7)、耳機(jī)(8)、 LCD (9)、觸摸屏(10)、按鍵(11)及(電話/手機(jī)/計(jì)算 ^l)耳機(jī)座孔(12)等組成,其中按鍵和觸摸屏主要用于獲取用戶通過觸筆所輸 入的語音數(shù)據(jù)相關(guān)的漢語拼音信息,微控制器依據(jù)該信息從標(biāo)準(zhǔn)語音庫或用戶語 音庫中提取相關(guān)的語音數(shù)據(jù),并通過(電話/手機(jī)/計(jì)算機(jī))耳機(jī)座孔將提取的語音數(shù)據(jù)送入即時(shí)語音通話線路。系統(tǒng)內(nèi)置有一套標(biāo)準(zhǔn)的語音數(shù)據(jù)庫,供聾啞人、 失聲患者、吐字發(fā)音不清晰者,以及年老體弱無力發(fā)聲的老年人使用,正常用戶 可以選擇標(biāo)準(zhǔn)語音庫,也可以選擇用戶語音庫的數(shù)據(jù)生成即時(shí)語音數(shù)據(jù),語音數(shù) 據(jù)庫中的語音數(shù)據(jù)以完整的帶聲調(diào)的漢字語音作為基本的語音數(shù)據(jù)單元進(jìn)行存 取操作。用戶語音庫的數(shù)據(jù)由用戶通過話筒在MCU微控制器的控制下進(jìn)行語音 數(shù)據(jù)采集生成,LCD用于顯示人機(jī)操作圖文界面,以供用戶輸入相關(guān)數(shù)據(jù)和控 制信息,A/D和D/A用于語音數(shù)據(jù)和語音信號之間的數(shù)模轉(zhuǎn)換,揚(yáng)聲器用于把 用戶輸入的語音數(shù)據(jù)即時(shí)播放出來,以便正常用戶、具有聽覺能力的失聲患者、 吐字發(fā)音不清晰者及年老體弱無力發(fā)聲的老年人能夠確認(rèn)輸入,同時(shí)不會與通話 線路遠(yuǎn)端傳來的語音信號發(fā)生串?dāng)_,正常用戶在安靜場所使用時(shí)可通過按鍵開關(guān) 或人機(jī)操作界面關(guān)閉該揚(yáng)聲器。耳機(jī)用于使用戶能夠聽到遠(yuǎn)地傳來的語音信號, 并可用于正常人錄入自身語音信號以生成用戶語音庫。
本發(fā)明的觸劃式語音輸入方法,其最顯著的特征在于通過觸筆順序觸劃(或 點(diǎn)擊)觸摸屏上的聲母、韻母及聲調(diào)符號來輸入語音數(shù)據(jù),其最明顯的優(yōu)勢在于 所輸入的語音數(shù)據(jù)的漢語拼音具有唯一性,不存在漢字輸入法中多選一的困難, 因而具有很高的輸入效率,語音輸入可以達(dá)到與日常交流同步的速度。
本發(fā)明在技術(shù)實(shí)現(xiàn)方式上有兩種形式。 一種是作為手機(jī)、電話機(jī)和計(jì)算機(jī)等 通訊工具的附屬語音輸入裝置(語音輸入助理),在形態(tài)上是一個(gè)獨(dú)立的硬件裝 置(如圖2),通過手機(jī)的耳機(jī)座孔(圖13)、電話機(jī)的電話手柄插座(圖15) 或計(jì)算機(jī)的耳機(jī)座孔進(jìn)行連接(圖16);另一種技術(shù)實(shí)現(xiàn)方式是在已經(jīng)具備微控 制器單元(MCU)和足夠存儲空間資源的手機(jī)(圖5)、電話機(jī)或計(jì)算機(jī)上,通 過編寫特定的語音輸入軟件程序?qū)崿F(xiàn)這一功能。
有益效果觸劃式語音輸入方法可以很好地克服目前通訊工具難以為聾啞 人、失聲患者、發(fā)音不清及體弱多病的老年人所使用的困難,也可以克服通訊工 具在需要安靜的特定場合、喧鬧的場所或者出于保護(hù)個(gè)人通話隱私的目的而不便 使用的困難,并具有操作簡單,使用方便,具有較好的實(shí)時(shí)性的特點(diǎn)。
本發(fā)明為原創(chuàng)性、具有自主知識產(chǎn)權(quán)的創(chuàng)新產(chǎn)品,具有廣闊的市場前景,目 前國內(nèi)外均無與本發(fā)明相似的基于觸劃(點(diǎn)擊)方式的語音輸入產(chǎn)品及專利成果。


圖1是本發(fā)明的硬件原理框圖。其中有MCU微控制器(1)、標(biāo)準(zhǔn)語音庫(2)、 用戶語音庫(3)、 A/D (4)、話筒(5)、 D/A (6)、揚(yáng)聲器(7)、耳機(jī)(8)、 LCD (9)、觸摸屏(10)、按鍵(11)及(電話/手機(jī)/計(jì)算機(jī))耳機(jī)座孔(12)。
圖2是本發(fā)明第一個(gè)實(shí)施例作為獨(dú)立硬件裝置的人機(jī)操作界面(二鍵模式, 也可以為五鍵模式)。其中有機(jī)身(1)、 LCD液晶觸摸屏(2)、側(cè)按鍵(3)、聲 母選擇區(qū)(4)、韻母首字母及韻母殘余部分選擇區(qū)(5)、聲調(diào)選擇區(qū)(6)、"發(fā) 送"(7)、"退出"(8)、觸劃軌跡(9)、輸入顯示區(qū)(10)、揚(yáng)聲器(11)、用戶 耳機(jī)座孔(12)及語音信號接口 (13)。
圖3是本發(fā)明通過滾輪控制觸摸屏第一列可供選擇的聲母的示意圖。其中有 機(jī)身(1)、 LCD液晶觸摸屏(2)、滾輪(3)、聲母選擇區(qū)(4)、韻母首字母及 韻母殘余部分選擇區(qū)(5)、聲調(diào)選擇區(qū)(6)、"發(fā)送"(7)、"退出"(8)、觸劃軌 跡(9)、輸入顯示區(qū)(10)、揚(yáng)聲器(11)、用戶耳機(jī)座孔(12)及語音信號接口 (13)。
圖4是本發(fā)明通過左上角的兩個(gè)側(cè)按鍵控制觸摸屏第一列可供選擇的聲母 的示意圖。其中有機(jī)身(1)、 LCD液晶觸摸屏(2)、側(cè)按鍵(3)、聲母選擇區(qū) (4)、韻母首字母及韻母殘余部分選擇區(qū)(5)、聲調(diào)選擇區(qū)(6)、"發(fā)送"(7)、 "推出"(8)、觸劃軌跡(9)、輸入顯示區(qū)(10)、揚(yáng)聲器(11)、用戶耳機(jī)座孔 (12)及語音信號接口 (13)。
圖5是本發(fā)明第二個(gè)實(shí)施例基于手機(jī)的人機(jī)操作界面(五鍵模式,也可以為 雙鍵增減方式)。其中有手機(jī)機(jī)身(1)、 LCD液晶觸摸屏(2)、側(cè)按鍵(3)、聲 母選擇區(qū)(4)、韻母首字母及韻母殘余部分選擇區(qū)(5)、聲調(diào)選擇區(qū)(6)、"發(fā) 送"(7)、"退出"(8)、觸劃軌跡(9)、輸入顯示區(qū)(10)、揚(yáng)聲器(11)、用戶 耳機(jī)座孔(12)及手機(jī)天線(13)。
圖6是本發(fā)明第一和第二個(gè)實(shí)施例的軟件流程框圖。
圖7是本發(fā)明第三個(gè)實(shí)施例可在第二列選擇多個(gè)單韻母方案的人機(jī)操作界 面(二鍵模式,也可以為五鍵方式)。其中有手機(jī)機(jī)身(1)、 LCD液晶觸摸屏(2)、 側(cè)按鍵(3)、聲母選擇區(qū)(4)、單韻母字母選擇區(qū)(5)、 "n、 ng/U"選擇區(qū)(6)、 "取消"(7)、"退出"(8)、觸劃軌跡(9)、輸入顯示區(qū)(10)、揚(yáng)聲器(11)、 用尸耳機(jī)座孔(12)、語音信號接口 (13)及聲調(diào)選擇區(qū)(14)。圖7是輸入漢字"帥"的發(fā)音"shuai4"的實(shí)例。
圖8是本發(fā)明第三個(gè)實(shí)施例可在第二列選擇多個(gè)單韻母方案的軟件流程框圖。
圖9是本發(fā)明第四個(gè)實(shí)施例在"tl、 n、 g"韻母殘余部分選擇區(qū)的上下方 設(shè)置有復(fù)韻母選擇區(qū)的人機(jī)操作界面(二鍵模式,也可以為五鍵方式)。其中有 手機(jī)機(jī)身(1)、 LCD液晶觸摸屏(2)、側(cè)按鍵(3)、聲母選擇區(qū)(4)、單韻母 字母選擇區(qū)(5)、 "n、 ng、 U"選擇區(qū)(6)、"發(fā)送"(7)、"退出"(8)、觸劃 軌跡(9)、輸入顯示區(qū)(10)、揚(yáng)聲器(11)、用戶耳機(jī)座孔(12)、語音信號接 口 (13)、聲調(diào)選擇區(qū)(14)及復(fù)韻母選擇區(qū)(15)。圖9是輸入漢字"帥"的發(fā) 音"shuai4"的實(shí)例。
圖IO與圖9相同,是輸入漢字"強(qiáng)"的發(fā)音"qiang2"的實(shí)例。 圖11是本發(fā)明第四個(gè)實(shí)施例在"U、 n、 g"上下方設(shè)置復(fù)韻母選擇區(qū)方案 的軟件流程框圖。
圖12是普通手機(jī)的原理框圖。其中有MCU微控制器(1)、觸摸屏(2)、 按鍵(3)、 LCD (4)、振動器(5)、用戶身份標(biāo)識模塊(6)、調(diào)制(7)、解調(diào)(8)、 話筒(9)、信號處理(10)、信號處理(11)、揚(yáng)聲器(12)及天線(13)。
圖13是本發(fā)明作為獨(dú)立語音輸入裝置與手機(jī)的應(yīng)用連接圖(五鍵模式,也 可以為雙鍵增減方式)。其中有語音輸入裝置(1)、手機(jī)(2)、耳機(jī)(3)及觸筆 (4)。
圖14是普通電話機(jī)電路原理框圖。其中有振鈴電路(1)、極性轉(zhuǎn)換電路(2)、 叉簧(3)、電子開關(guān)(4)、發(fā)號電路(5)、按鍵盤(6)、消側(cè)音電路(7)、受話 電路(8)及送話電路(9)。
圖15是本發(fā)明作為獨(dú)立語音輸入裝置與電話機(jī)的應(yīng)用連接圖(二鍵模式, 也可以為五鍵模式)。其中有語音輸入裝置(1)、電話機(jī)(2)、耳機(jī)(3)及觸筆 (4)。
圖16是本發(fā)明作為獨(dú)立語音輸入裝置與計(jì)算機(jī)的應(yīng)用連接圖(二鍵模式, 也可以為五鍵模式)。其中有語音輸入裝置(1)、計(jì)算機(jī)(2)、耳機(jī)(3)及觸筆 (4)。
具體實(shí)施例方式
下面結(jié)合附圖和實(shí)施例對本發(fā)明的技術(shù)方案進(jìn)一步說明。
圖l是本發(fā)明觸劃式語音輸入裝置的硬件原理圖,其中,虛線框內(nèi)部分為本 發(fā)明的硬件裝置的主要內(nèi)容。本發(fā)明的四個(gè)實(shí)施例均基于該硬件原理架構(gòu),其特 征在于該語音輸入裝置由MCU微控制器(1)、標(biāo)準(zhǔn)語音庫(2)、用戶語音庫(3 )、 A/D (4)、話筒(5)、 D/A (6)、揚(yáng)聲器(7)、耳機(jī)(8)、 LCD (9)、觸摸屏(10)、 按鍵(11)及(電話/手機(jī)/計(jì)算機(jī))耳機(jī)座孔(12)等組成。其中,標(biāo)準(zhǔn)語音庫 (2)、用戶語音庫(3)、 LCD (9)、觸摸屏(10)、按鍵(11)、 D/A (6)分別 與MCU微控制器相連,D/A (6)的輸出連接至揚(yáng)聲器(7)和耳機(jī)座孔(12), 話筒(5)與A/D (4)和耳機(jī)座孔(12)相接,耳機(jī)(8)通過本發(fā)明與耳機(jī)座 孔(12)相連。按鍵(11)和觸摸屏(10)主要用于輸入用戶通過觸筆所輸入的 語音數(shù)據(jù)信息,微控制器(1)依據(jù)該信息從標(biāo)準(zhǔn)語音庫(2)或用戶語音庫(3) 中提取相關(guān)的語音數(shù)據(jù),并通過(電話/手機(jī)/計(jì)算機(jī))耳機(jī)座孔(12)將提取的 語音數(shù)據(jù)送入即時(shí)語音通話線路。系統(tǒng)內(nèi)置有一套標(biāo)準(zhǔn)語音數(shù)據(jù)庫(2),供聾啞 人、失聲患者、吐字發(fā)音不清晰者,以及年老體弱無力發(fā)聲的老年人使用,正常 用戶可以選擇標(biāo)準(zhǔn)語音庫,也可以選擇用戶語音庫(3)作為即時(shí)語音數(shù)據(jù)源, 語音數(shù)據(jù)庫中的語音數(shù)據(jù)以完整的帶聲調(diào)的漢字語音作為基本的語音數(shù)據(jù)單元 進(jìn)行存取操作。用戶語音庫的數(shù)據(jù)由用戶通過話筒(5)在MCU微控制器(1) 的控制下進(jìn)行語音數(shù)據(jù)采集生成,LCD (9)用于顯示人機(jī)操作界面,以便用戶 輸入相關(guān)數(shù)據(jù)和控制信息;A/D (4)和D/A (6)用于語音數(shù)據(jù)和語音信號之間 的數(shù)模轉(zhuǎn)換;揚(yáng)聲器(7)用于把用戶輸入的語音數(shù)據(jù)即時(shí)播放出來,以便正常 用戶、具有聽覺能力的失聲患者、吐字發(fā)音不清晰者及年老體弱無力發(fā)聲的老年 人能夠確認(rèn)輸入,同時(shí)不會與遠(yuǎn)地傳來的語音信號發(fā)生串?dāng)_,正常用戶在安靜場 所使用時(shí)可通過按鍵或人機(jī)操作界面關(guān)閉該揚(yáng)聲器(7);耳機(jī)(8)的功能在于 使用戶能夠聽到遠(yuǎn)地通話者傳來的語音信號。
本發(fā)明可以按圖1所示的硬件原理構(gòu)成一個(gè)獨(dú)立的具備語音輸入功能的硬 件裝置,這種情況下,該裝置是一個(gè)獨(dú)立的觸劃式即時(shí)語音發(fā)聲裝置,可以作為 聾觀人、失聲患者、吐字發(fā)音不清晰者及年老體弱無力發(fā)聲的老年人日常生活中 與他人進(jìn)行語音交流的語音助理,也可以通過與手機(jī)的耳機(jī)座孔(圖13),或電 話機(jī)的電話手柄插座(圖15)或計(jì)算機(jī)的耳機(jī)座孔進(jìn)行連接(圖16),作為正常人或發(fā)聲困難者使用手機(jī)、電話機(jī)和計(jì)算機(jī)等通訊工具的附屬語音輸入裝置,為 他們提供特定場合下的語音輸入助理服務(wù)。
圖2是本發(fā)明第一個(gè)實(shí)施例作為獨(dú)立硬件裝置的人機(jī)操作界面(二個(gè)側(cè)按鍵 模式,也可以為五個(gè)側(cè)按鍵模式),圖中有機(jī)身(1)、 LCD液晶觸摸屏(2)、側(cè) 按鍵(3)、聲母選擇區(qū)(4)、韻母首字母及韻母殘余部分選擇區(qū)(5)、聲調(diào)選彈 區(qū)(6)、"發(fā)送"(7)、"退出"(8)、觸劃軌跡(9)、輸入顯示區(qū)(10)、揚(yáng)聲器
(11)、用戶耳機(jī)座孔(12)及語音信號接口 (13)。其中,側(cè)按鍵(3)位于機(jī) 身(1)側(cè)邊,左上側(cè)和右上側(cè)各一個(gè)側(cè)按鍵分別與操作者的大拇指和食指相對 應(yīng),在五個(gè)側(cè)按鍵的模式下,左側(cè)上方為一個(gè)側(cè)按鍵,與大拇指相對應(yīng),右側(cè)為 均勻分布的四個(gè)側(cè)按鍵,分別與食指、中指、無名指和小指相對應(yīng)。LCD液晶 觸摸屏(2)位于機(jī)身面板上,其上有聲母選擇區(qū)(4)、韻母首字母及韻母殘余 部分選擇區(qū)(5)、聲調(diào)選擇區(qū)(6)、"發(fā)送"(7)、"退出"(8)、觸劃軌跡(9) 和輸入顯示區(qū)(10),其中聲母選擇區(qū)(4)位于LCD液晶觸摸屏(2)的右側(cè)第 一列(邊距可以等于0),韻母首字母及韻母殘余部分選擇區(qū)(5)位于第二和第 三列,聲調(diào)選擇區(qū)(6)位于第四列,"發(fā)送"(7)位于觸摸屏(2)的右上方,
"退出"(8)位于LCD液晶觸摸屏(2)的上方左側(cè),輸入顯示區(qū)(10)位于 LCD液晶觸摸屏(2)的上方右側(cè)。揚(yáng)聲器(11)位于機(jī)身面板的下方,用戶耳 機(jī)座孔(12)和語音信號接口 (13)均位于機(jī)身的側(cè)邊。
在已經(jīng)具備微控制器單元(MCU)和足夠存儲空間資源的手機(jī)、電話機(jī)或 計(jì)算機(jī)上,由于這些裝置已經(jīng)具備本發(fā)明功能實(shí)現(xiàn)所必須的基本硬件條件,所以 通過編寫并加載特定的語音輸入軟件程序也能夠達(dá)到實(shí)現(xiàn)觸劃或點(diǎn)擊式語音輸 入功能的目的。這種情況下,本發(fā)明的存在形式是一個(gè)安裝和駐留在手機(jī)中的軟 件程序,操作者通過運(yùn)行該程序可以進(jìn)入語音輸入界面,并能夠通過觸劃或點(diǎn)擊 語音輸入界面上的符號實(shí)現(xiàn)即時(shí)語音通話的語音輸入功能。
圖3是本發(fā)明第一個(gè)實(shí)施例基礎(chǔ)上的改進(jìn),是只有一個(gè)子聲母區(qū)段的特例。 圖3是通過滾輪(3)控制觸摸屏第一列可供選擇的聲母的示意圖,圖中有機(jī)身
(1)、 LCD液晶觸摸屏(2)、滾輪(3)、聲母選擇區(qū)(4)、韻母首字母及韻母 殘余部分選擇區(qū)(5)、聲調(diào)選擇區(qū)(6)、"發(fā)送"(7)、"退出"(8)、觸劃軌跡(9)、 輸入顯示區(qū)(10)、揚(yáng)聲器(11)、用戶耳機(jī)座孔(12)及語音信號接口 (13)。 滾輪(3)位于機(jī)身左上側(cè),由大拇指控制,滾動滾輪,觸摸屏第一列顯示的可供選擇的聲母也會隨之改變,圖中第一列聲母選擇區(qū)兩頭虛線框中的聲母字母為 假想的與聲母選擇區(qū)相接的聲母字母,滾動滾輪,假想?yún)^(qū)中的聲母字母就會上移 或下移并出現(xiàn)在觸摸屏第一列聲母選擇區(qū)中。在后續(xù)的實(shí)施例中,均可釆用本圖 中的滾輪方式控制觸摸屏上可供選擇的聲母。
圖4是本發(fā)明第一個(gè)實(shí)施例基礎(chǔ)上的改進(jìn),也是只有一個(gè)子聲母區(qū)段的特 例。圖4是通過左上角的兩個(gè)側(cè)按鍵(3)控制觸摸屏第一列可供選擇的聲母的 示意圖,圖中有機(jī)身(1)、 LCD液晶觸摸屏(2)、側(cè)按鍵(3)、聲母選擇區(qū)(4)、 韻母首字母及韻母殘余部分選擇區(qū)(5)、聲調(diào)選擇區(qū)(6)、"發(fā)送"(7)、"退出"
(8)、觸劃軌跡(9)、輸入顯示區(qū)(10)、揚(yáng)聲器(11)、用戶耳機(jī)座孔(12)及 語音信號接口 (13)。按鍵(3)位于機(jī)身左上角, 一個(gè)在左側(cè)上方,按壓的用力 方向是從左向右,另一個(gè)在上方左側(cè),按壓的用力方向是從上向下,兩個(gè)側(cè)按鍵
(3)均由大拇指控制,大拇指按壓的側(cè)鍵不同,觸摸屏第一列顯示的可供選擇 的聲母也會隨之改變,圖中第一列聲母選擇區(qū)兩頭虛線框中的聲母字母為假想的 與聲母選擇區(qū)相接的聲母字母,按壓側(cè)按鍵(3),假想?yún)^(qū)中的聲母字母就會上移 或下移并出現(xiàn)在觸摸屏第一列聲母選擇區(qū)中。在后續(xù)的實(shí)施例中,均可采用本圖 中的左上角側(cè)按鍵方式控制觸摸屏上可供選擇的聲母。
圖5是本發(fā)明第二個(gè)實(shí)施例基于手機(jī)的人機(jī)操作界面(五鍵模式,也可以為 雙鍵增減方式)。圖中有手機(jī)機(jī)身(1)、 LCD液晶觸摸屏(2)、側(cè)按鍵(3)、聲 母選擇區(qū)(4)、韻母首字母及韻母殘余部分選擇區(qū)(5)、聲調(diào)選擇區(qū)(6)、"發(fā) 送"(7)、"退出"(8)、觸劃軌跡(9)、輸入顯示區(qū)(10)、揚(yáng)聲器(11)、用戶 耳機(jī)座孔(12)及手機(jī)天線(13)。其中,側(cè)按鍵(3)位于機(jī)身(1)側(cè)邊,左 側(cè)上方為一個(gè)側(cè)按鍵,與大拇指相對應(yīng),右側(cè)為均勻分布的四個(gè)側(cè)按鍵,分別與 食指、中指、無名指和小指相對應(yīng),在只有二個(gè)側(cè)按鍵的模式下,二個(gè)側(cè)按鍵分 別位于左上側(cè)和右上側(cè),與操作者的大拇指和食指相對應(yīng)。LCD液晶觸摸屏(2) 位于機(jī)身面板上,其上有聲母選擇區(qū)(4)、韻母首字母及韻母殘余部分選擇區(qū)(5)、 聲調(diào)選擇區(qū)(6)、"發(fā)送"(7)、"退出"(8)、觸劃軌跡(9)和輸入顯示區(qū)(10), 其中聲母選擇區(qū)(4)位于LCD液晶觸摸屏(2)的右側(cè)第一列(邊距可以等于 0),韻母首字母及韻母殘余部分選擇區(qū)(5)位于第二和第三列,聲調(diào)選擇區(qū)(6) 位于第四列,"發(fā)送"(7)位于觸摸屏(2)的亭上方,"退出"(8)位于LCD液 晶觸摸屏(2)的上方左側(cè),輸入顯示區(qū)(10)位于LCD液晶觸摸屏(2)的上方右側(cè)。揚(yáng)聲器(11)位于機(jī)身面板的下方,用戶耳機(jī)座孔(12)和語音信號接 口 (13)均位于機(jī)身的側(cè)邊。
圖2的第一個(gè)實(shí)施例和圖5的第二個(gè)實(shí)施例本質(zhì)上是一致的,其操作原理完 全相同。圖6是本發(fā)明第一和第二個(gè)實(shí)施例的軟件流程框圖,也是本發(fā)明通過觸
劃或點(diǎn)擊操作實(shí)現(xiàn)語音輸入的操作流程。
本發(fā)明的觸劃式語音輸入首先由系統(tǒng)顯示圖2或圖5所示的人機(jī)操作界面, 其中第一列顯示第一子聲母區(qū)段的聲母字母"a/o, b, c, ch, d",第二列顯示 "韻母首字母(5)" (a、 e、 i、 o、 u)、第四列顯示"聲調(diào)(6)"(陰平、陽平、 上聲、去聲、輕聲),左上方顯示"退出(8)",正上方的"輸入顯示區(qū)"內(nèi)則為 空白,除第一列的聲母(4)、第三列的韻母殘余部分(5)及輸入顯示區(qū)(10) 的內(nèi)容會隨著操作者的語音輸入選項(xiàng)的不同而實(shí)時(shí)改變外,其他部分顯示的內(nèi)容 在整個(gè)語音輸入操作過程中始終保持不變,為靜態(tài)顯示模式。第一列的聲母(4) 區(qū)所顯示的內(nèi)容與操作者通過側(cè)按鍵(3)所選擇的子聲母區(qū)段有關(guān),子聲母區(qū) 段選擇得不同,第一列所顯示的聲母字母也不相同,第三列的韻母殘余部分(5) 區(qū)顯示的內(nèi)容是選定聲母和韻母首字母后所有可能的韻母殘余部分的組合,如選 定聲母b,韻母首字母a,則第三列顯示的能與ba構(gòu)成合法拼音組合的所有可能 的韻母殘余部分為"i, o, n, ng",分別對應(yīng)于"bai, bao, ban, bang",輸入 顯示區(qū)(10)則是動態(tài)顯示操作者所輸入的漢語拼音字母及聲調(diào),其中l(wèi)表示聲 調(diào)為陰平,2表示聲調(diào)為陽平,3表示聲調(diào)為上聲,4表示聲調(diào)為去聲,5表示聲 調(diào)為輕聲。
進(jìn)入語音輸入的人機(jī)操作界面后,當(dāng)操作者希望輸入某個(gè)漢字語音時(shí),操作 者需要通過圖l中"按鍵(11)"亦即圖2和圖5中的側(cè)按鍵(3)選擇希望輸入 的漢語拼音的聲母所對應(yīng)的聲母區(qū)段。本實(shí)施例共將漢語拼音的聲母(b、 p、 m、 f、 d、 t、 n、 1、 g、 k、 h、 j、 q、 x、 zh、 ch、 sh、 r、 z、 c、 s,共21個(gè))和韻母 獨(dú)立成音節(jié)的"零聲母"(a/o、 e、 y和w)分成五個(gè)子區(qū)段,分別為a/o (o只 有ou—個(gè)發(fā)音組合,與a放在同一個(gè)組)、b、 c、 ch、 d; e、 f、 g、 h、 j; k、 1、 m、 n、 p; q、 r、 s、 sh、 t; w、 x、 y、 z、 zh,并設(shè)置五個(gè)與持機(jī)手掌的五個(gè)手 指相對應(yīng)的側(cè)按鍵,從大拇指到小指,每按下一個(gè)側(cè)按鍵則在觸摸屏右側(cè)第一列 顯示一列聲母子區(qū)段中的五個(gè)聲母,亦可只設(shè)置二個(gè)側(cè)按鍵,由拇指和食指通過 增減來選擇不同的聲母子區(qū)段。操作者通過側(cè)按鍵(3)選擇了與要輸入的漢字語音的聲母相對應(yīng)的子區(qū)段 之后,可以通過觸筆點(diǎn)擊或觸劃該聲母從而完成待輸入語音聲母的輸入。
完成待輸入漢字語音的聲母輸入后,操作者可以通過觸筆繼續(xù)點(diǎn)擊或觸劃操 作界面第二列以選擇與待輸入漢字語音韻母相對應(yīng)的韻母首字母,韻母首字母共 有五個(gè)a、 e、 i、 o、 u。漢語拼音中的單韻母共有a、 e、 i、 0、 u、 ii六個(gè),所 以韻母首字母設(shè)置為五個(gè)或者六個(gè)都是可以的,但由于ti的拼音組合很少,所以 本實(shí)施例中把"ii"作為u的殘余部分進(jìn)行對待處理,即如果需要選擇韻母ii, 應(yīng)先點(diǎn)擊或觸劃第二列的u,然后再點(diǎn)擊或觸劃第三列的ii。這樣處理的目的是 盡量能夠擴(kuò)大單個(gè)韻母首字母的點(diǎn)擊和觸劃空間,使操作更快捷方便準(zhǔn)確,降低 誤點(diǎn)誤觸率。韻母首字母輸入后,系統(tǒng)會檢查該輸入是否唯一,如不唯一則放棄 輸入,同時(shí)還會檢査輸入的韻母首字母是否與聲母相匹配,如不匹配也會放棄當(dāng) 前輸入。
各韻母首字母的韻母殘佘部分在數(shù)量上大多少于5個(gè),但是仍有8種聲母韻 母組合在數(shù)量上超過5個(gè),數(shù)量最多的達(dá)到了9個(gè),達(dá)到8個(gè)的有3種情形,達(dá) 到7個(gè)的1種情形,達(dá)到6個(gè)的有3種情形。如果在第三列上依次從上到小顯示 這些組合,將導(dǎo)致單個(gè)韻母殘余部分觸劃區(qū)域很小,這給觸劃操作帶來很大的不 便。分析研究發(fā)現(xiàn),在上述韻母殘余部分較多的幾種情況中,都存在i和u與a 的組合,且占了較多的數(shù)量,因此對第二列靜態(tài)顯示的韻母首字母中的i和u兩 個(gè)單韻母的圖標(biāo)做了如圖2和圖5所示的處理,即在i和u兩個(gè)單韻母后增加了 各2個(gè)韻母殘余部分有a開頭和無a開頭的觸劃選擇,當(dāng)操作者要輸入的漢字語 音的韻母中存在"ia"或"ua"組合時(shí),操作者可以在觸劃i和u的同時(shí)直接觸 劃"ia"或"ua",如果有i和u而沒有"ia"和"ua"時(shí),則觸劃或"u-", 從而把超過5個(gè)的韻母殘余部分組合分成a開頭的韻母殘余部分和非a開頭的韻 母殘余部分,顯著減少第三列顯示殘余韻母數(shù)量,大大提高輸入效率。當(dāng)要輸入 的漢字語音的聲母和韻母首字母的i和u的組合中不可能出現(xiàn)"ia"和"ua"時(shí), "ia"、 "ua"、 和"u-"的作用被自動屏蔽,系統(tǒng)將不會響應(yīng)這4個(gè)小區(qū)域 的觸劃操作。
當(dāng)聲母和韻母首字母被輸入后,系統(tǒng)會在第三列顯示與該聲母和韻母首字母 對應(yīng)的所有可能的韻母殘余部分組合。操作者可以通過觸筆繼續(xù)點(diǎn)擊或觸劃操作 界面第三列以選擇與待輸入漢字語音聲母和韻母首字母相對應(yīng)的韻母殘余部分,如果沒有殘余韻母要輸入,觸筆可從空白區(qū)域滑過或直接點(diǎn)擊輸入聲調(diào)。當(dāng)聲母 和韻母也被輸入后,操作者可以通過觸筆繼續(xù)點(diǎn)擊或觸劃操作界面第四列的聲調(diào) 選項(xiàng)以選擇與待輸入漢字語音相對應(yīng)的聲調(diào),最終完成漢字語音的全部輸入操 作。如果殘余韻母的個(gè)數(shù)為零,而聲調(diào)有輸入,系統(tǒng)將認(rèn)為要輸入的語音拼音是 由聲母和單韻母構(gòu)成的,并檢查輸入的聲調(diào)是否唯一,如果唯一則完成輸入,否 則等待下一次聲調(diào)輸入。
當(dāng)漢字語音的聲母、韻母和聲調(diào)輸入完成后,系統(tǒng)將依據(jù)該信息從語音數(shù)據(jù) 庫中檢索并調(diào)出相應(yīng)漢字所對應(yīng)的聲音文件,送至語音信號發(fā)送模塊,并送揚(yáng)聲 器使操作者能夠聽到剛輸入的漢字語音,以便正常用戶、具有聽覺能力的失聲患 者、吐字發(fā)音不清晰者及年老體弱無力發(fā)聲的老年人能夠確認(rèn)輸入,正常用戶在 安靜場所使用時(shí)可通過按鍵開關(guān)或人機(jī)操作界面關(guān)閉該揚(yáng)聲器。觸摸屏上方的輸 入顯示區(qū)可以即時(shí)顯示操作者所輸入的聲母和韻母及音調(diào)。觸摸屏的正上方為 "聲母顯示區(qū)",用于顯示操作者所輸入的漢語拼音及聲調(diào)等語音數(shù)據(jù)信息,圖 2和圖5是輸入漢字"帥立國"的語音數(shù)據(jù)"shuai41i4guo2"的操作示例,輸入 拼音"guo2"時(shí),左側(cè)第一列子聲母區(qū)段顯示的聲母字母為"f、 g、 h、 j、 k", 圖中虛線是觸筆進(jìn)行點(diǎn)擊或觸劃操作輸入"guo2"時(shí)的觸劃軌跡(9),觸筆依次 點(diǎn)擊或觸劃"g"、 "u"、 "o"和"陽平"聲調(diào)。觸摸屏左上方的"退出"選項(xiàng)用 于退出語音輸入人機(jī)界面,并結(jié)束當(dāng)前的語音輸入操作,在語音輸入的任一時(shí)刻, 操作者均可將觸筆劃拉到"退出"選項(xiàng)以退出本應(yīng)用程序。觸摸屏右上方的"發(fā) 送"選項(xiàng)用于整句話輸入完成該將整句話的漢語拼音以語音串形式輸出語音信 號。
圖7是本發(fā)明第三個(gè)實(shí)施例可在第二列選擇多個(gè)單韻母方案的人機(jī)操作界 面(二鍵模式,也可以為五鍵方式)。其中有手機(jī)機(jī)身(1)、 LCD液晶觸摸屏(2)、 側(cè)按鍵(3)、聲母選擇區(qū)(4)、單韻母字母選擇區(qū)(5)、 "n、 ng/ti"選擇區(qū)(6)、 "取消"(7)、"退出"(8)、觸劃軌跡(9)、輸入顯示區(qū)(10)、揚(yáng)聲器(11)、 用戶耳機(jī)座孔(12)、語音信號接口 (13)、聲調(diào)選擇區(qū)(14)及"發(fā)送"(15)。 其中,側(cè)按鍵(3)位于機(jī)身(1)側(cè)邊,左上側(cè)和右上側(cè)各有一個(gè)側(cè)按鍵分別與 操作者的大拇指和食指相對應(yīng),在五個(gè)側(cè)按鍵的模式下,左側(cè)上方為一個(gè)側(cè)按鍵, 與大拇指相對應(yīng),右側(cè)為均勻分布的四個(gè)側(cè)按鍵,分別與食指、中指、無名指和 小指相對應(yīng)。LCD液晶觸摸屏(2)位于機(jī)身面板上,其上有聲母選擇區(qū)(4)、單韻母字母選擇區(qū)(5)、 "n、 ng/U"選擇區(qū)(6)、聲調(diào)選擇區(qū)(14)、"取消"(7)、 "退出"(8)、觸劃軌跡(9)和輸入顯示區(qū)(10),其中聲母選擇區(qū)(4)位于 LCD液晶觸摸屏(2)的右側(cè)第一列(邊距可以等于0),單韻母字母選擇區(qū)(5) 位于第二列,"n、 ng/U"選擇區(qū)(6)位于第三列,聲調(diào)選擇區(qū)(14)位于第四 歹U,"取消"(7)位于LCD液晶觸摸屏(2)的下方,"退出"(8)位于LCD液 晶觸摸屏(2)的上方左側(cè),輸入顯示區(qū)(10)位于LCD液晶觸摸屏(2)的上 方右側(cè)。揚(yáng)聲器(11)位于機(jī)身面板的下方,用戶耳機(jī)座孔(12)和語音信號接 口 (13)均位于機(jī)身的側(cè)邊。
圖8是本發(fā)明第三個(gè)實(shí)施例可在第二列選擇多個(gè)單韻母方案的軟件流程框 圖。本實(shí)施例首先由系統(tǒng)顯示圖7所示的人機(jī)操作界面,其中第一列顯示第一子 聲母區(qū)段的聲母字母"a/o, b., c, ch, d",第二列顯示"單韻母字母(5)" (a、 e、 i、 o、 u),第三列顯示韻母殘余部分"n、 ng/U",第三列的上方是"聲調(diào)(6)" 的"陽平2"選擇區(qū),第三列的下方是"聲調(diào)(6)"的"去聲4"選擇區(qū),第四 列顯示"聲調(diào)(6)"的上聲、陰平和輕聲選擇區(qū),在操作界面的最下方顯示"取 消(7)",在左上方顯示"退出(8)",正上方的"輸入顯示區(qū)(10)"內(nèi)容則為 空白,除第一列的聲母(4)及輸入顯示區(qū)(10)的內(nèi)容會隨著操作者的語音輸 入選項(xiàng)的不同而實(shí)時(shí)改變外,其他部分顯示的內(nèi)容在整個(gè)語音輸入操作過程中始 終保持不變,為靜態(tài)顯示模式。第一列的聲母(4)區(qū)所顯示的內(nèi)容與操作者通 過按鍵(3)所選擇的子聲母區(qū)段有關(guān),子聲母區(qū)段選擇镥不同,第一列所顯示 的聲母字母也不相同,輸入顯示區(qū)(10)則是動態(tài)顯示操作者所輸入的漢語拼音 字母及聲調(diào),其中l(wèi)表示聲調(diào)為陰平,2表示聲調(diào)為陽平,3表示聲調(diào)為上聲,4 表示聲調(diào)為去聲,5表示聲調(diào)為輕聲。
進(jìn)入語音輸入的人機(jī)操作界面后,當(dāng)操作者希望輸入某個(gè)漢字語音時(shí),操作 者需要通過圖7中的"側(cè)按鍵(3)"選擇希望輸入的漢語拼音的聲母所對應(yīng)的聲 母區(qū)段。本實(shí)施例中子聲母區(qū)段的劃分與第一和第二實(shí)施例相同,也是分成五個(gè) 子區(qū)段,操作者通過側(cè)按鍵(3)選擇了與要輸入的漢字語音的聲母相對應(yīng)的子 區(qū)段之后,可以通過觸筆點(diǎn)擊或觸劃該聲母從而完成待輸入語音聲母的輸入。
完成待輸入漢字語音的聲母輸入后,操作者可以通過觸筆繼續(xù)點(diǎn)擊或觸劃操 作界面第二列的"單韻母字母(5)"以選擇與待輸入漢字語音韻母相對應(yīng)的韻母 首字母,韻母首字母共有五個(gè)a、 e、 i、 o、 u。漢語拼音中的單韻母共有a、 e、i、 O、 U、 ti六個(gè),所以韻母首字母設(shè)置為五個(gè)或者六個(gè)都是可以的,但由于ii 的拼音組合很少,且只以單韻母的形式出現(xiàn),所以本實(shí)施例中把"ii"作為u 的殘余部分進(jìn)行對待處理,即如果需要選擇韻母ii,應(yīng)先點(diǎn)擊或觸劃第二列的U, 然后再點(diǎn)擊或觸劃第三列的"ngAi",這樣處理的目的是盡量能夠擴(kuò)大單韻母字 母的點(diǎn)擊和觸劃空間,使操作更快捷方便準(zhǔn)確,降低誤點(diǎn)誤觸率。
如果要輸入的漢字的拼音是復(fù)韻母形式,操作者可在選擇韻母首字母后,繼 續(xù)點(diǎn)擊或觸劃第二列單韻母選擇區(qū)選擇下一個(gè)復(fù)韻母字母,直至復(fù)韻母字母全部 輸入完。統(tǒng)計(jì)表明,漢語拼音中的復(fù)韻母大多為兩個(gè)單韻母構(gòu)成,三個(gè)單韻母構(gòu) 成的復(fù)韻母只有"iao" (niao)和"uai" (kuai),而超過三個(gè)單韻母的復(fù)韻母則 沒有,所以操作者在第二列的點(diǎn)擊和觸劃選擇最多只有三次,更多的情況下則只 有一次或二次。
當(dāng)聲母和構(gòu)成韻母的單韻母字母均被輸入后,操作者可在第三列點(diǎn)擊或觸劃 選擇韻母殘余部分即鼻音"n"、長鼻音"ng"和"u",由于"ng"和"11"不可 能同時(shí)出現(xiàn)在單個(gè)漢字的漢語拼音中,即能與"ng"構(gòu)成合法單個(gè)漢字拼音的聲 母和韻母組合一定不能與"U"構(gòu)成合法的單個(gè)漢字的拼音,反之亦然,所以可 以把"ng"和"U"放在一起構(gòu)成一個(gè)復(fù)選區(qū),此外本實(shí)施例中"U"是作為u 的韻母殘余部分組合的一部分出現(xiàn)的,所以要求輸入"U"的前提條件是先輸入 u,以區(qū)別單獨(dú)的"u"音,但這不是必須的,只是本實(shí)施例的一個(gè)約定,例如, 如果輸入"nu"和"nil"兩個(gè)音,前者輸入的是"nu",而后者輸入的則是"nu U"。另外,本實(shí)施例還約定觸筆只要點(diǎn)擊或觸劃了 "ng/tl",則系統(tǒng)默認(rèn)的輸入 是"ng/U"而不管觸筆是否觸劃到了 "n",所以如果希望輸入的是"n",觸筆一 定不能點(diǎn)擊或觸劃"ng/U",而如果希望輸入的是"ng/U",則有沒有碰到"n" 都無所謂,之所以這樣約定,其目的是希望能夠讓操作者的觸劃操作更加隨意, 在大多的情況下不必過于小心的關(guān)注觸劃區(qū)域,且不容易出錯(cuò),但這也只是本實(shí) 施例的一個(gè)約定,如果把"n"和"ng/tl"的觸劃操作嚴(yán)格限定在各自的區(qū)域也 是可行的。
當(dāng)聲母和韻母也被輸入后,操作者可以通過觸筆繼續(xù)點(diǎn)擊或觸劃操作界面第 四列的聲調(diào)選項(xiàng)以選擇與待輸入漢字語音相對應(yīng)的聲調(diào),最終完成漢字語音的全 部輸入操作。
在本實(shí)施例語音輸入的每一個(gè)環(huán)節(jié)中,系統(tǒng)都會檢査新輸入的韻母字母是否與已輸入的聲母或聲母和韻母首字母是否存在匹配的可能,如果不可能匹配,系 統(tǒng)則放棄當(dāng)前輸入。當(dāng)漢字語音的聲母、韻母和聲調(diào)輸入完成后,系統(tǒng)將依據(jù)該 信息從語音數(shù)據(jù)庫中檢索并調(diào)出相應(yīng)漢字所對應(yīng)的聲音文件,送至語音信號發(fā)送 模塊,并送揚(yáng)聲器使操作者能夠聽到剛輸入的漢字語音,以便正常用戶、具有聽 覺能力的失聲患者、吐字發(fā)音不清晰者及年老體弱無力發(fā)聲的老年人能夠確認(rèn)輸 入,正常用戶在安靜場所使用時(shí)可通過按鍵開關(guān)或人機(jī)操作界面關(guān)閉該揚(yáng)聲器。 觸摸屏的最下方一行為"取消",在語音輸入的任一時(shí)刻,如操作者發(fā)現(xiàn)輸入有 誤均可將觸筆劃拉到底部的"取消"觸鍵以取消剛輸入的聲母或韻母。觸摸屏上 方的輸入顯示區(qū)可以即時(shí)顯示操作者所輸入的聲母和韻母及音調(diào)。圖7是輸入漢 字"帥"的語音數(shù)據(jù)"shuai4"的操作示例,此時(shí),左側(cè)第一列子聲母區(qū)段顯示 的聲母字母為"q、 r、 s、 sh、 t",圖中虛線是觸筆進(jìn)行點(diǎn)擊或觸劃操作輸入"shuai4" 時(shí)的觸劃軌跡(9),觸筆依次點(diǎn)擊或觸劃"sh"、 "u"、 "a"、 "i"和"去聲"聲 調(diào)。
圖9是本發(fā)明第四個(gè)實(shí)施例在"11、 n、 g"韻母殘余部分選擇區(qū)的上下方 設(shè)置有復(fù)韻母選擇區(qū)的人機(jī)操作界面(二鍵模式,也可以為五鍵方式)。其中有 手機(jī)機(jī)身(1)、 LCD液晶觸摸屏(2)、側(cè)按鍵(3)、聲母選擇區(qū)(4)、韻母首 字母選擇區(qū)(5)、 "n、 ng、 11"選擇區(qū)(6)、"發(fā)送"(7)、"退出"(8)、觸劃 軌跡(9)、輸入顯示區(qū)(10)、揚(yáng)聲器(11)、用戶耳機(jī)座孔(12)、語音信號接 口 (13)、聲調(diào)選擇區(qū)(14)及復(fù)韻母選擇區(qū)(15)。其中,側(cè)按鍵(3)位于機(jī) 身(1)側(cè)邊,左上側(cè)和右上側(cè)各有一個(gè)側(cè)按鍵分別與操作者的大拇指和食指相 對應(yīng),在五個(gè)側(cè)按鍵的模式下,左側(cè)上方為一個(gè)側(cè)按鍵,與大拇指相對應(yīng),右側(cè) 為均勻分布的四個(gè)側(cè)按鍵,分別與食指、中指、無名指和小指相對應(yīng)。LCD液 晶觸摸屏(2)位于機(jī)身面板上,其上有聲母選擇區(qū)(4)、韻母首字母選擇區(qū)(5)、 "n、 ng/ll"選擇區(qū)(6)、聲調(diào)選擇區(qū)(14)、"發(fā)送"(7)、"退出"(8)、觸劃軌 跡(9)、輸入顯示區(qū)(10)及復(fù)韻母選擇區(qū)(15),其中聲母選擇區(qū)(4)位于 LCD液晶觸摸屏(2)的右側(cè)第一列(邊距可以等于0),韻母首字母選擇區(qū)(5) 位于第二列,"n、 ng/U"選擇區(qū)(6)位于第三列,聲調(diào)選擇區(qū)(14)位于第四 列,復(fù)韻母選擇區(qū)(15)位于第三列"n、 ng/U"選擇區(qū)的上方和下方,"發(fā)送" (7)位于LCD液晶觸摸屏(2)的右上方,"退出"(8)位于LCD液晶觸摸屏 (2)的上方左側(cè),輸入顯示區(qū)(10)位于LCD液晶觸摸屏(2)的上方中部。揚(yáng)聲器(11)位于機(jī)身面板的下方,用戶耳機(jī)座孔(12)和語音信號接口 (13) 均位于機(jī)身的側(cè)邊。
圖9是輸入漢字"帥"的發(fā)音"shuai4"的實(shí)例。
圖10與圖9完全相同,是第三個(gè)實(shí)施例輸入漢字"強(qiáng)"的發(fā)音"qiang2" 的實(shí)例。
圖11是本發(fā)明第四個(gè)實(shí)施例在"U、 n、 g"韻母殘余部分選擇區(qū)的上下方 設(shè)置復(fù)韻母選擇區(qū)方案的軟件流程框圖。本實(shí)施例首先由系統(tǒng)顯示圖9或圖10 所示的人機(jī)操作界面,其中第一列顯示第一子聲母區(qū)段的聲母字母"a/o, b, c, ch, d",第二列顯示"單韻母字母(5)" (a、 e、 i、 o、 u),第三列顯示韻母殘 余部分"ii、 ng/ll",第三列的上方是"復(fù)韻母選擇區(qū)(15)"的"a、 o、 e、 i、 u" 選擇區(qū),第三列的下方是"復(fù)韻母選擇區(qū)(15)"的"a、 i、 e、 o、 u"選擇區(qū), 第四列顯示的是"聲調(diào)(6)"選擇區(qū),在左上方顯示"退出(8)",正上方的"輸 入顯示區(qū)(10)"內(nèi)容則為空白,除第一列的聲母(4)及輸入顯示區(qū)(10)的內(nèi) 容會隨著操作者的語音輸入選項(xiàng)的不同而實(shí)時(shí)改變外,其他部分顯示的內(nèi)容在整 個(gè)語音輸入操作過程中始終保持不變,為靜態(tài)顯示模式。第一列的聲母(4)區(qū) 所顯示的內(nèi)容與操作者通過按鍵(3)所選擇的子聲母區(qū)段有關(guān),子聲母區(qū)段選 擇得不同,第一列所顯示的聲母字母也不相同,輸入顯示區(qū)(10)則是動態(tài)顯示 操作者所輸入的漢語拼音字母及聲調(diào),其中l(wèi)表示聲調(diào)為陰平,2表示聲調(diào)為陽 平,3表示聲調(diào)為上聲,4表示聲調(diào)為去聲,5—表示聲調(diào)為輕聲。
進(jìn)入語音輸入的人機(jī)操作界面后,當(dāng)操作者希望輸入某個(gè)漢字語音時(shí),操作 者需要通過圖9或圖10中的"側(cè)按鍵(3)"選擇希望輸入的漢語拼音的聲母所 對應(yīng)的聲母區(qū)段。本實(shí)施例中子聲母區(qū)段的劃分與第一、第二和第三實(shí)施例相同, 也是分成五個(gè)子區(qū)段,操作者通過側(cè)按鍵(3)選擇了與要輸入的漢字語音的聲 母相對應(yīng)的子區(qū)段之后,可以通過觸筆點(diǎn)擊或觸劃該聲母從而完成待輸入語音聲 母的輸入。
完成待輸入漢字語音的聲母輸入后,操作者可以通過觸筆繼續(xù)點(diǎn)擊或觸劃操 作界面第二列的"單韻母字母(5)"以選擇與待輸入漢字語音韻母相對應(yīng)的韻母 首字母,韻母首字母共有五個(gè)a、 e、 i、 o、 u。漢語拼音中的單韻母共有a、 e、
i、 o、 u、 ii六個(gè),所以韻母首字母設(shè)置為五個(gè)或者六個(gè)都是可以的,但由于ii 的拼音組合很少,且只以單韻母的形式出現(xiàn),所以本實(shí)施例中把"ii"作為u的殘余部分進(jìn)行對待處理,即如果需要選擇韻母ii,應(yīng)先點(diǎn)擊或觸劃第二列的U, 然后再點(diǎn)擊或觸劃第三列的"ng/ii",這樣處理的目的是盡量能夠擴(kuò)大單韻母字 母的點(diǎn)擊和觸劃空間,使操作更快捷方便準(zhǔn)確,降低誤點(diǎn)誤觸率。
如果要輸入的漢字的拼音是復(fù)韻母形式,操作者可在選擇第二列的韻母首字 母后,繼續(xù)點(diǎn)擊或觸劃第三列上方"復(fù)韻母選擇區(qū)(15)"的"a、 o、 e、 i、 u" 選擇區(qū),或第三列下方"復(fù)韻母選擇區(qū)(15)"的"a、 i、 e、 o、 u"選擇區(qū),直 至復(fù)韻母字母全部輸入完。統(tǒng)計(jì)表明,漢語拼音中的復(fù)韻母大多為兩個(gè)單韻母構(gòu) 成,三個(gè)單韻母構(gòu)成的復(fù)韻母只有"iao" (niao)和"uai" (kuai),而超過三個(gè) 單韻母的復(fù)韻母則沒有,所以本實(shí)施例中,第三列上方和下方"復(fù)韻母選擇區(qū) (15)"的單韻母字母順序并不相同,其中下方為"a、 e、 i、 o、 u",而上方為 "a、 e、 o、 i、 u",之所以作這樣的調(diào)整,是因?yàn)榈诙械膗在下方,與第三列 下方復(fù)韻母選擇區(qū)"a、 e、 i、 o、 u"的頭兩個(gè)單韻母距離最近,很容易通過連 筆觸劃選擇輸入"uai",出于同樣的考慮,對上方復(fù)韻母選擇區(qū)的單韻母字母順 序也做了相應(yīng)調(diào)整,這樣操作者在輸入"uai"和"iao"這兩個(gè)復(fù)韻母時(shí)將更為 方便,可以在最短的時(shí)間內(nèi)完成操作,不僅效率高,而且不易出錯(cuò)。
當(dāng)聲母和構(gòu)成韻母的單韻母字母均被輸入后,操作者可在第三列點(diǎn)擊或觸劃 選擇韻母殘余部分即鼻音"n"、長鼻音"ng"和"ti",由于"ng"和"U"不可 能同時(shí)出現(xiàn)在單個(gè)漢字的漢語拼音中,所以可以把"ng"和"U"放在一起構(gòu)成 一個(gè)復(fù)選區(qū),此外,本實(shí)施例中"U"是作為u的韻母殘余部分組合的一部分出 現(xiàn)的,所以要求輸入"U"的前提條件是先輸入u,以區(qū)別單獨(dú)的"u"音,但這 不是必須的,只是本實(shí)施例的一個(gè)約定。另外,本實(shí)施例還約定觸筆只要點(diǎn)擊或 觸劃了 "ng/u",則系統(tǒng)默認(rèn)的輸入是"ng/li"而不管觸筆是否觸劃到了 "n", 所以如果希望輸入的是"n",觸筆一定不能點(diǎn)擊或觸劃"ng/U",而如果希望輸 入的是"ng/tl",則有沒有碰到"n"都無所謂,這樣規(guī)定后,操作者的觸劃操作
將更加隨意,且不易出錯(cuò)。
當(dāng)聲母和韻母也被輸入后,操作者可以通過觸筆繼續(xù)點(diǎn)擊或觸劃操作界面第
四列的聲調(diào)選項(xiàng)以選擇與待輸入漢字語音相對應(yīng)的聲調(diào),最終完成漢字語音的全 部輸入操作。
在本實(shí)施例語音輸入的每一個(gè)環(huán)節(jié)中,系統(tǒng)都會檢査新輸入的韻母字母是否 與已輸入的聲母或聲母和韻母首字母是否存在匹配的可能,如果不可能匹配,系統(tǒng)則放棄當(dāng)前輸入。當(dāng)漢字語音的聲母、韻母和聲調(diào)輸入完成后,系統(tǒng)將依據(jù)該 信息從語音數(shù)據(jù)庫中檢索并調(diào)出相應(yīng)漢字所對應(yīng)的聲音文件,送至語音信號發(fā)送 模塊,并送揚(yáng)聲器使操作者能夠聽到剛輸入的漢字語音,以便正常用戶、具有聽 覺能力的失聲患者、吐字發(fā)音不清晰者及年老體弱無力發(fā)聲的老年人能夠確認(rèn)輸 入,正常用戶在安靜場所使用時(shí)可通過按鍵開關(guān)或人機(jī)操作界面關(guān)閉該揚(yáng)聲器。 觸摸屏的最下方一行為"取消",在語音輸入的任一時(shí)刻,如操作者發(fā)現(xiàn)輸入有 誤均可將觸筆劃拉到底部的"取消"觸鍵以取消剛輸入的聲母或韻母。觸摸屏上 方的輸入顯示區(qū)可以即時(shí)顯示操作者所輸入的聲母和韻母及音調(diào)。圖9是輸入漢 字"帥"的語音數(shù)據(jù)"shuai4"的操作示例,此時(shí),左側(cè)第一列子聲母區(qū)段顯示 的聲母字母為"q、 r、 s、 Sh、 t",圖中虛線是觸筆進(jìn)行點(diǎn)擊或觸劃操作輸入"shuai4" 時(shí)的觸劃軌跡(9),觸筆依次點(diǎn)擊或觸劃"sh"、 "u"、 "a"、 "e"、 "i"和"去聲" 聲調(diào)。圖10是輸入漢字"強(qiáng)"的語音數(shù)據(jù)"qiang2"的操作示例,此時(shí),左側(cè) 第一列子聲母區(qū)段顯示的聲母字母為"q、 r、 s、 sh、 t",圖中虛線是觸筆進(jìn)行點(diǎn) 擊或觸劃操作輸入"shuai4"時(shí)的觸劃軌跡(9),觸筆依次點(diǎn)擊或觸劃"q"、 "i"、
"a"、 "ng"和"去聲"聲調(diào)。
圖12是普通手機(jī)的原理框圖,其中有MCU微控制器(1)、觸摸屏(2)、 側(cè)按鍵(3)、 LCD (4)、振動器(5)、用戶身份標(biāo)識模塊(6)、調(diào)制(7)、解調(diào)
(8)、話筒(9)、信號處理(10)、信號處理(11)、揚(yáng)聲器(12)及天線(13)。 MCU微控制器(1)是手機(jī)的控制中樞,手機(jī)的各項(xiàng)功能均是在微控制器的控制 下按照不同的優(yōu)先級和先后次序逐一實(shí)現(xiàn)的,用戶身份識別模塊(6)用于標(biāo)識 手機(jī)在通訊網(wǎng)絡(luò)中的身份,以便和不同的手機(jī)用戶建立一對一的語音通訊連接, 振動器(5)用于來電提示和鬧鐘服務(wù)等功能,天線(13)的作用在于發(fā)射和接 受信號。即時(shí)語音通話過程中,操作者從話筒(9)里輸入的語音信號經(jīng)調(diào)制(7) 和增益處理后成為高頻發(fā)射信號,并經(jīng)天線發(fā)射出去。由天線(13)接收下來的 高頻信號經(jīng)解調(diào)(8)和增益放大后,得到接收信號。接收信號進(jìn)一步處理后, 驅(qū)動揚(yáng)聲器(12)發(fā)聲,就可以讓本地操作者聽到遠(yuǎn)地通話者的聲音。
圖13是本發(fā)明作為具有獨(dú)立硬件結(jié)構(gòu)的輔助語音輸入裝置時(shí)與手機(jī)的連接 方式,其中語音輸入裝置(1)有一個(gè)語音信號接口與手機(jī)(2)的耳機(jī)座孔相連, 以便把本發(fā)明的產(chǎn)生的語音信號通過手機(jī)發(fā)送至手機(jī)通訊網(wǎng)絡(luò)另一端的用戶,同 時(shí)還有一個(gè)音頻輸出端口與耳機(jī)(3)相連,以便操作者能夠聽到手機(jī)通話過程中遠(yuǎn)地傳來的語音信號。
圖14是普通電話機(jī)的原理框圖。其中有振鈴電路(1)、極性轉(zhuǎn)換電路(2)、 叉簧(3)、電子開關(guān)(4)、發(fā)號電路(5)、按鍵盤(6)、消側(cè)音電路(7)、受話 電路(8)及送話電路(9)。電話通信是通過聲能與電能相互轉(zhuǎn)換、并利用"電" 這個(gè)媒介來傳輸語音信號的通信技術(shù)。語音通訊時(shí),操作者首先通過發(fā)號電路和 電信局的程控交換機(jī)接續(xù)到被呼用戶電話機(jī),建立語音通話線路后,當(dāng)發(fā)話者對 著送話器講話時(shí),聲帶的振動激勵(lì)空氣振動,形成聲波。聲波作用于送話器上, 使之產(chǎn)生電流,稱為話音電流。話音電流沿著線路傳送到對方電話機(jī)的受話器內(nèi), 受話器把電流轉(zhuǎn)化為聲波,通過空氣傳至人的耳朵中,這樣,就完成了一個(gè)簡單 的通話過程。
圖15是語音輸入裝置(1)有一個(gè)語音信號接口與電話機(jī)(2)的通話手柄 連接座孔相連,以便把本發(fā)明的產(chǎn)生的語音信號通過電話機(jī)發(fā)送至電話通訊網(wǎng)絡(luò) 另一端的用戶,同時(shí)還有一個(gè)音頻輸出端口與耳機(jī)(3)相連,以便操作者能夠 在電話通話過程中聽到遠(yuǎn)地傳來的語音信號。
圖16是本發(fā)明的語音輸入裝置(1)與普通計(jì)算機(jī)(2)的連接方式。圖中 語音輸入裝置(1)有一個(gè)語音信號接口與計(jì)算機(jī)(2)的耳機(jī)座孔相連,以便把 本發(fā)明的產(chǎn)生的語音信號通過計(jì)算機(jī)發(fā)送至internet互聯(lián)網(wǎng)絡(luò)另一端的用戶,并 有一個(gè)音頻輸出端口與耳機(jī)(3)相連,以便操作者能夠聽到來自遠(yuǎn)地的語音信 號。在這種連接方式中,本發(fā)明的語音輸入裝置相當(dāng)于計(jì)算機(jī)的一個(gè)帶有觸劃式 語音輸入能力的功能增強(qiáng)型的耳機(jī)。
本發(fā)明除以獨(dú)立的硬件形式出現(xiàn)外,在已經(jīng)具備微控制器單元(MCU)和 足夠存儲空間資源的手機(jī)、電話機(jī)或計(jì)算機(jī)上,還可以以應(yīng)用軟件的形式通過預(yù) 置或安裝加載特定的語音輸入軟件程序?qū)崿F(xiàn)這一功能,其模式類似于在計(jì)算機(jī)上 安裝漢字輸入法一樣,只不過漢字輸入法向計(jì)算機(jī)輸入的是漢字,而本發(fā)明輸入 的則是語音。為成功實(shí)現(xiàn)觸劃式語音輸入,手機(jī)和電話機(jī)應(yīng)該具有LCD觸摸屏, 在計(jì)算機(jī)上使用這一功能時(shí),由于目前計(jì)算機(jī)大多沒有配備觸摸屏,可以用鼠標(biāo) 點(diǎn)擊代替觸筆點(diǎn)擊,以按下鼠標(biāo)"左鍵"的滑動操作代替觸劃動作,那么操作者 即可以通過對鼠標(biāo)的操作方便地實(shí)現(xiàn)漢語語音的輸入,并實(shí)現(xiàn)即時(shí)語音通訊。
權(quán)利要求
1、一種觸劃式漢字語音輸入方法及漢字語音輸入裝置,其特征在于該裝置包括MCU微控制器(1)、標(biāo)準(zhǔn)語音庫(2)、用戶語音庫(3)、A/D(4)、話筒(5)、D/A(6)、揚(yáng)聲器(7)、耳機(jī)(8)、LCD(9)、觸摸屏(10)、按鍵(11)及(電話/手機(jī)/計(jì)算機(jī))耳機(jī)座孔(12)。其中,標(biāo)準(zhǔn)語音庫(2)、用戶語音庫(3)、LCD(9)、觸摸屏(10)、按鍵(11)、D/A(6)與MCU微控制器相連,D/A(6)的輸出連接至揚(yáng)聲器(7)和耳機(jī)座孔(12),話筒(5)與A/D(4)和耳機(jī)座孔(12)相接,耳機(jī)(8)通過本發(fā)明裝置與耳機(jī)座孔(12)相連。
2、 根據(jù)權(quán)利要求1所述的觸劃式漢字語音輸入方法及漢字語音輸入裝置, 其最顯著的特征在于該裝置把漢語拼音的聲母分成若干個(gè)子聲母區(qū)段,并在觸摸 屏上設(shè)置聲母選擇區(qū)、單韻母選擇區(qū)、韻母選擇區(qū)及聲調(diào)選擇區(qū),同時(shí)在機(jī)身側(cè) 邊設(shè)置有用于選擇不同子聲母區(qū)段的側(cè)按鍵,操作者通過側(cè)按鍵可選擇不同的子 聲母區(qū)段,并通過觸筆順序觸劃或點(diǎn)擊顯示在該裝置觸摸屏上不同選擇區(qū)域內(nèi)的 字符輸入漢語拼音的聲母、韻母和聲調(diào),從而在裝置的標(biāo)準(zhǔn)語音庫或用戶語音庫 中唯一確定與該漢語拼音相對應(yīng)的語音數(shù)據(jù),并最終把語音數(shù)據(jù)轉(zhuǎn)換成語音信號 送揚(yáng)聲器播放或通過通訊網(wǎng)絡(luò)傳送至通訊網(wǎng)絡(luò)的遠(yuǎn)端用戶。
3、 根據(jù)權(quán)利要求1所述的觸劃式漢字語音輸入方法及漢字語音輸入裝置, 其特征在于該裝置設(shè)置有標(biāo)準(zhǔn)語音數(shù)據(jù)庫和用戶語音數(shù)據(jù)庫,其中標(biāo)準(zhǔn)語音數(shù)據(jù) 庫內(nèi)的數(shù)據(jù)是系統(tǒng)自帶的標(biāo)準(zhǔn)普通話語音數(shù)據(jù)庫,主要供喪失或基本喪失語音發(fā) 音能力以及吐字不清晰的用戶使用,也可供正常人在特定條件下使用,而用戶語 音庫則是可以由用戶自行錄入的具備用戶自身語音特征的數(shù)據(jù)庫,操作者可以通 過本發(fā)明裝置的話筒按照漢字字典里的漢字語音順序錄入帶聲調(diào)的全部漢字的 語音數(shù)據(jù)。漢字語音庫中的語音數(shù)據(jù)是以完整的帶聲調(diào)的單個(gè)漢字的語音作為基 本語音數(shù)據(jù)單元進(jìn)行存取操作的。
4、 根據(jù)權(quán)利要求1所述的觸劃式漢字語音輸入方法及漢字語音輸入裝置, 其特征在于在觸摸屏的左上方設(shè)置有"退出"選項(xiàng),在右上方設(shè)置有"發(fā)送"選 項(xiàng),在正上方"退出"和"發(fā)送"的中間位置設(shè)置有"輸入顯示區(qū)","發(fā)送"選 項(xiàng)用于整句話輸入完成該將整句話的漢語拼音以語音串形式輸出語音信號,"退 出"用于退出語音輸入人機(jī)界面,并結(jié)束當(dāng)前的語音輸入操作,而"輸入顯示區(qū)" 則用于顯示操作者通過側(cè)按鍵和觸摸屏輸入的漢語拼音及聲調(diào),其中1表示聲調(diào) 為陰平,2表示聲調(diào)為陽'平,3表示聲調(diào)為上聲,4表示聲調(diào)為去聲,5表示聲調(diào)為輕聲。
5、 根據(jù)權(quán)利要求1所述的觸劃式漢字語音輸入方法及漢字語音輸入裝置, 其特征在于該輸入方法及裝置把漢語拼音的21個(gè)聲母及零聲母劃分為若干個(gè)子聲母區(qū)間,操作者通過機(jī)身側(cè)按鍵可以選擇不同的子聲母區(qū)段,從而在觸摸屏上顯示可供觸劃選擇的聲母字符。全部聲母可以按照"a/o、 b、 c、 ch、 d", "e、 f、 g、 h、 j", "k、 1、 m、 n、 p,,, "q、 r、 s、 sh、 t"及"w、 x、 y、 z、 zh,,戈U分為 5個(gè)子聲母區(qū)段,也可以在此基礎(chǔ)上進(jìn)行調(diào)整劃分為多于或少于5個(gè)的子聲母區(qū) 段以適應(yīng)不同的需求,最少可以只有一個(gè)區(qū)(相當(dāng)于不做區(qū)段劃分),當(dāng)子聲母 區(qū)段只有一個(gè)時(shí),觸摸屏第一列所顯示的聲母字母由機(jī)身側(cè)邊的滾輪或側(cè)按鍵控 制,滾動滾輪或按壓側(cè)鍵可控制觸摸屏第一列所顯示的聲母字母上移或下移,直 至出現(xiàn)可供選擇的聲母選項(xiàng)。
6、 根據(jù)權(quán)利要求1所述的觸劃式漢字語音輸入方法及漢字語音輸入裝置, 其特征在于該輸入方法及裝置把漢語拼音的韻母拆分為韻母首字母"a、 e、 i、 o、 u"和韻母殘余部分兩部分,從而能夠使操作者在觸摸屏的第二和第三列方便地 通過點(diǎn)擊或觸劃少量的字符來輸入所希望的韻母字母。
7、 根據(jù)權(quán)利要求1所述的觸劃式漢字語音輸入方法及漢字語音輸入裝置, 其特征在于該輸入方法及裝置的語音輸入方案之一是把漢語拼音的韻母拆分為 單韻母字母"a、 e、 i、 o、 u"及"n、 ng/u"兩部分,這一拆分使得操作者僅需 對七個(gè)字符區(qū)域進(jìn)行觸劃操作即可輸入任一韻母,從而使用于韻母輸入的觸劃字 符始終處于觸摸屏的固定位置并保持靜態(tài)顯示,操作者易于熟記并形成習(xí)慣,從 而顯著提高觸劃式語音輸入的速度。韻母的拆分可以是"a、 e、 i、 o、 u"及"n、 ng/U",也可以是"a、 e、 i、 o、 u、 U,,及"n、 ng",或者"a、 e、 i、 o、 u,,及"n、 ng、 U,,。
8、 根據(jù)權(quán)利要求1所述的觸劃式漢字語音輸入方法及漢字語音輸入裝置, 其特征在于該輸入方法及裝置的語音輸入方案之一是把漢語拼音的韻母拆分為 單韻母字母"a、 e、 i、 o、 u"及"n、 ng/u"兩部分,并在"n、 ng/U"的上方和 下方各設(shè)置一個(gè)用于輸入復(fù)韻母的單韻母字母選擇區(qū),使操作者能夠以更快的速 度和更高的效率輸入任一韻母。其中,韻母的拆分可以是"a、 e、 i、 o、 u"及"n、 ng/U,,, 也可以是"a、 e、 i、 o、 u、 U,,及"n、 ng,,, 或者"a、 e、 i、 o、 u,, 及"n、 ng、 U"。如果只在上方或只在下方設(shè)置一個(gè)用于輸入復(fù)韻母的單韻母字 母選擇區(qū)也是可行的,但是效率會有所下降。
9、 根據(jù)權(quán)利要求1所述的觸劃式漢字語音輸入方法及漢字語音輸入裝置, 其特征在于該裝置設(shè)置有獨(dú)立的用于播放剛輸入的漢語拼音語音的揚(yáng)聲器。揚(yáng)聲 器使操作者能夠聽到剛輸入的漢字語音,以便正常用戶、具有聽覺能力的失聲患 者、吐字發(fā)音不清晰者及年老體弱無力發(fā)聲的老年人能夠確認(rèn)輸入,或在日常語 音交流中使對方能通過該聲音明白操作者所表達(dá)的意思,正常用戶在安靜場所使 用時(shí)則可通過按鍵開關(guān)或人機(jī)操作界面關(guān)閉該揚(yáng)聲器。
10、 根據(jù)權(quán)利要求1所述的觸劃式漢字語音輸入方法及漢字語音輸入裝置, 其特征在于該裝置可以是一個(gè)獨(dú)立的觸劃式即時(shí)語音發(fā)聲裝置,可以作為聾啞 人、失聲患者、吐字發(fā)音不清晰者及年老體弱無力發(fā)聲的老年人日常生活中與他 人進(jìn)行語音交流的語音助理,也可以通過與手機(jī)的耳機(jī)座孔,或電話機(jī)的電話手 柄連接插座或計(jì)算機(jī)的耳機(jī)座孔進(jìn)行連接,作為正常人使用手機(jī)、電話機(jī)和計(jì)算 機(jī)等通訊工具的附屬語音輸入裝置,為他們提供特定場合下的語音輸入助理服務(wù), 而在已經(jīng)具備微控制器單元(MCU)和足夠存儲空間資源的手機(jī)、電話機(jī)或計(jì) 算機(jī)上,本發(fā)明還可以以應(yīng)用軟件的形式通過預(yù)置或安裝加載特定的語音輸入軟 件程序?qū)崿F(xiàn)這一功能。
全文摘要
一種能夠通過對觸摸屏進(jìn)行觸劃或點(diǎn)擊操作輸入漢字語音的觸劃式語音輸入方法及觸劃式語音輸入裝置。該裝置在機(jī)身上設(shè)置有子聲母區(qū)段選擇側(cè)按鍵或控制觸摸屏顯示的聲母字母的滾輪,在觸摸屏上設(shè)置有子聲母區(qū)段聲母、韻母首字母(或單韻母字母)、韻母殘余部分及聲調(diào)等觸劃或點(diǎn)擊選擇區(qū),操作者通過按鍵(或滾輪)和對觸摸屏特定區(qū)域的觸劃選擇操作能夠快速輸入所期望的漢語拼音及聲調(diào),系統(tǒng)據(jù)此可以在標(biāo)準(zhǔn)語音數(shù)據(jù)庫或用戶語音數(shù)據(jù)庫中唯一確定所期望的漢語拼音的語音數(shù)據(jù),從而實(shí)現(xiàn)漢字語音的觸劃或點(diǎn)擊式快速輸入。該裝置能夠克服目前通訊工具難以為聾啞人、失聲患者、發(fā)音不清及體弱多病的老年人所使用的困難,也可以克服通訊工具在需要安靜的特定場合、喧鬧的場所或者出于保護(hù)個(gè)人通話隱私的目的而不便使用的困難,并具有實(shí)時(shí)性強(qiáng)、操作簡便的特點(diǎn)。
文檔編號G06F3/041GK101414226SQ20071013324
公開日2009年4月22日 申請日期2007年10月15日 優(yōu)先權(quán)日2007年10月15日
發(fā)明者帥立國 申請人:南京國觸科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
普格县| 苏尼特右旗| 栾城县| 黄浦区| 琼结县| 海阳市| 乳山市| 巴东县| 文登市| 普兰县| 礼泉县| 祁东县| 玉环县| 望奎县| 武山县| 观塘区| 洞头县| 宣恩县| 宜昌市| 崇文区| 河北区| 手游| 和顺县| 厦门市| 资源县| 河南省| 南漳县| 崇仁县| 教育| 社旗县| 庆云县| 军事| 河南省| 闽侯县| 茌平县| 抚宁县| 个旧市| 肥西县| 策勒县| 遂昌县| 海南省|