欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于格式化電子字符序列的格式化模塊、系統(tǒng)和方法

文檔序號(hào):8323934閱讀:491來源:國(guó)知局
用于格式化電子字符序列的格式化模塊、系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及對(duì)于電子字符序列中的空格的格式化,尤其涉及用于格式化電子字符 序列中的空格的格式化模塊、系統(tǒng)和方法。
【背景技術(shù)】
[0002] 標(biāo)點(diǎn)符號(hào)是指出書面語(yǔ)的結(jié)構(gòu)、組織以及語(yǔ)調(diào)的符號(hào),并作為大聲朗讀時(shí)需要留 意的停頓。標(biāo)點(diǎn)符號(hào)的外觀及用法在語(yǔ)言及書寫之間是有差異的,但在大多數(shù)情況下,其對(duì) 于消除句子歧義而言是必不可少的。標(biāo)點(diǎn)符號(hào)的使用及解釋可嚴(yán)重依賴于語(yǔ)境。舉例來說, 句號(hào)"可被用作表示句子結(jié)束的標(biāo)點(diǎn)符號(hào)、縮寫的表示符以及小數(shù)點(diǎn)等符號(hào)。標(biāo)點(diǎn)符號(hào) 還可出現(xiàn)在數(shù)學(xué)及科學(xué)公式中。
[0003] 一些標(biāo)點(diǎn)符號(hào)成對(duì)出現(xiàn),且缺一不可。例如,左括弧和右括弧然而,在某 些情況下,單個(gè)字符被用來表示兩個(gè)加標(biāo)點(diǎn)符號(hào)者,產(chǎn)生歧義,例如單引號(hào):'。
[0004] 空格是空白處,通常用來隔開單詞、字母、數(shù)字及標(biāo)點(diǎn)符號(hào)??崭竦母袷皆诙喾N語(yǔ) 言之間存在多種約定。舉例來說,在英語(yǔ)中,問號(hào)"?"周圍的空格的格式為"word ? ",在單 詞與問號(hào)之間沒有空格,而空格是跟隨在問號(hào)之后。但在法語(yǔ)中的約定則為"word ? "即空 格被插入到問號(hào)的任意一側(cè)。
[0005] 當(dāng)前市面上的一些文本輸入系統(tǒng)提出了某種空格格式化的方式。舉例來說,當(dāng)使 用者在輸入下列字符[?!:;,.]中的一個(gè)之后輸入空格時(shí),無論當(dāng)前輸入文本是哪種語(yǔ) 言,安卓系統(tǒng)默認(rèn)鍵盤通過刪除前導(dǎo)空格并添加拖尾空格,將空格規(guī)定在標(biāo)點(diǎn)符號(hào)的任意 一側(cè)。
[0006] 本發(fā)明的目的在于提供一種自動(dòng)格式化電子字符文本中的空格的機(jī)構(gòu),以使使用 者能夠?qū)⒕杏谙?nèi)容而不必?fù)?dān)心電子字符序列中的空格格式是否正確。本發(fā)明的 目的還在于提供一種根據(jù)電子字符序列的書寫語(yǔ)言的習(xí)慣來正確格式化電子字符序列中 的空格的機(jī)構(gòu)。

【發(fā)明內(nèi)容】

[0007] 在本發(fā)明的第一方面中,提供了一種格式化模塊,其支持至少一種語(yǔ)言,并用于格 式化以被支持語(yǔ)言書寫的電子字符序列中的空格,所述格式化模塊包括:
[0008] 語(yǔ)言識(shí)別器,其用于識(shí)別所述電子字符序列是否由被支持的語(yǔ)言所書寫;
[0009] 字符識(shí)別器,其用于識(shí)別所述電子字符序列中的特定字符或特定字符序列;
[0010] 其中,當(dāng)被支持的語(yǔ)言被識(shí)別出時(shí),所述格式化模塊根據(jù)被識(shí)別出的語(yǔ)言和被識(shí) 別出的所述特定字符或特定字符序列來格式化所述電子字符序列中的空格。
[0011] 優(yōu)選地,所述電子字符序列中的空格的格式化處理包括:在所述電子字符序列中 插入和/或刪除空格。
[0012] 在一優(yōu)選實(shí)施例中,所述字符識(shí)別器包括:
[0013] 至少一個(gè)規(guī)則集合,其中的各規(guī)則與所述電子字符序列中的待識(shí)別的特定字符或 特定字符序列相關(guān);以及
[0014] 比較機(jī)構(gòu),其用于將所述至少一個(gè)規(guī)則集合中的每條規(guī)則與所述電子字符序列進(jìn) 行比較,以識(shí)別是否存在適用的規(guī)則;
[0015] 其中,每條規(guī)則與一個(gè)以上的動(dòng)作相關(guān),所述動(dòng)作描述了空格的格式,所述空格的 格式由所述格式化模塊應(yīng)用于被支持的語(yǔ)言的所述電子字符序列以及所述特定字符或特 定字符序列;而且
[0016] 其中,所述格式化模塊通過將所述一個(gè)以上的與適用規(guī)則相關(guān)的動(dòng)作應(yīng)用于所述 電子字符序列,格式化所述電子字符序列中的空格。
[0017] 僅當(dāng)被支持的語(yǔ)言被識(shí)別出時(shí),所述比較機(jī)構(gòu)優(yōu)選將所述至少一個(gè)規(guī)則集合中的 每條規(guī)則與所述電子字符序列進(jìn)行比較。
[0018] 優(yōu)選地,所述格式化模塊支持多種語(yǔ)言,而所述語(yǔ)言識(shí)別器還用于識(shí)別書寫所述 電子字符序列的所述被支持語(yǔ)言中的最可能語(yǔ)言。
[0019] 所述字符識(shí)別器用于識(shí)別標(biāo)點(diǎn)符號(hào),而所述格式化模塊用于根據(jù)所述標(biāo)點(diǎn)符號(hào)將 所述空格格式化在所述標(biāo)點(diǎn)符號(hào)的任意一側(cè)。
[0020] 所述字符識(shí)別器用于識(shí)別所述電子字符序列中的特定語(yǔ)境,而所述格式化模塊用 于根據(jù)所述語(yǔ)境格式化所述電子字符序列中的空格。
[0021] 所述字符識(shí)別器用于識(shí)別所述電子字符序列中的標(biāo)點(diǎn)符號(hào),而所述格式化模塊用 于根據(jù)標(biāo)點(diǎn)符號(hào)的分類將所述空格格式化在所述標(biāo)點(diǎn)符號(hào)的任意一側(cè)。
[0022] 所述一個(gè)以上的動(dòng)作包括動(dòng)作序列,其中當(dāng)找出適用的規(guī)則時(shí),所述比較機(jī)構(gòu)用 于將所述動(dòng)作序列應(yīng)用于所述電子字符序列。
[0023] 當(dāng)所述字符識(shí)別器包括多個(gè)規(guī)則集合,每種被支持的語(yǔ)言對(duì)應(yīng)其中的一個(gè)規(guī)則集 合,而所述比較機(jī)構(gòu)用于將對(duì)應(yīng)于最可能的語(yǔ)言的規(guī)則集合中的每條規(guī)則與所述電子字符 序列進(jìn)行比較。
[0024] 所述格式化模塊包括分別與每種語(yǔ)言、每種語(yǔ)系以及世界上所有語(yǔ)言相對(duì)應(yīng)的多 個(gè)規(guī)則集合,其中所述規(guī)則被應(yīng)用在層次結(jié)構(gòu)中,從而使所述比較機(jī)構(gòu)在被支持的語(yǔ)言被 識(shí)別出時(shí)首先比較特定于那種語(yǔ)言的規(guī)則集合中的每條規(guī)則,隨后比較適用于那種語(yǔ)言所 屬語(yǔ)系的規(guī)則集合中的每條規(guī)則,隨后比較適用于所有語(yǔ)言的規(guī)則集合中的每條規(guī)則,直 至識(shí)別出適用的規(guī)則,或識(shí)別出不存在適用的規(guī)則且所有規(guī)則已窮竭。
[0025] 所述比較機(jī)構(gòu)用于以具體的預(yù)設(shè)順序比較所述規(guī)則。所述規(guī)則集合優(yōu)選包括語(yǔ)境 規(guī)則、字符規(guī)則和分類規(guī)則,而所述比較機(jī)構(gòu)用于以下列順序比較這些規(guī)則:語(yǔ)境規(guī)則、字 符規(guī)則然后是分類規(guī)則,直至識(shí)別出適用的規(guī)則,或識(shí)別出不存在適用的規(guī)則且所有規(guī)則 已窮竭。
[0026] 在本發(fā)明的第二方面中,提供了一種格式化模塊,其支持至少一種語(yǔ)言,并用于格 式化電子字符序列中的空格,所述格式化模塊包括:
[0027] 標(biāo)點(diǎn)符號(hào)識(shí)別器,其用于識(shí)別所述電子字符序列中的標(biāo)點(diǎn)符號(hào);
[0028] 其中,所述格式化模塊用于在識(shí)別出被支持的語(yǔ)言時(shí),根據(jù)所述電子字符序列的 書寫語(yǔ)言、被識(shí)別出的標(biāo)點(diǎn)符號(hào)以及所述標(biāo)點(diǎn)符號(hào)的語(yǔ)境,格式化所述電子字符序列中的 空格。
[0029] 在本發(fā)明的第三方面中,提供了一種用于向電子設(shè)備輸入文本的系統(tǒng),其包括:
[0030] 文本預(yù)測(cè)引擎,其用于接收作為輸入的電子字符序列,并用于生成并輸出修正過 的電子字符序列;以及
[0031] 如前述中任意一項(xiàng)所述的格式化模塊,其中所述格式化模塊用于接收作為輸入的 經(jīng)過修正的電子字符序列,并在被支持的語(yǔ)言被識(shí)別出時(shí),通過格式化經(jīng)過修正的電子字 符序列中的空格,生成經(jīng)過格式化的字符序列。
[0032] 在本發(fā)明的第四面中,提供了一種用于向電子設(shè)備輸入文本的系統(tǒng),其包括:
[0033] 文本預(yù)測(cè)引擎,其用于接收作為輸入的電子字符序列,所述文本預(yù)測(cè)引擎包括:
[0034] 語(yǔ)言識(shí)別器,其用于識(shí)別所述電子字符序列的最有可能的書寫語(yǔ)言,以及根據(jù)被 識(shí)別出的語(yǔ)言修正所述電子字符序列;
[0035] 其中,所述文本預(yù)測(cè)引擎用于生成并輸出經(jīng)過修正的電子字符序列,并輸出被識(shí) 別出的語(yǔ)言;
[0036] 所述系統(tǒng)還包括:格式化模塊,其支持至少一種語(yǔ)言,用于接收被識(shí)別出的語(yǔ)言以 及經(jīng)過修正的電子字符序列,并用于在被識(shí)別出的語(yǔ)言被支持時(shí)格式化所述電子字符序列 中的空格,所述格式化模塊包括:
[0037] 字符識(shí)別器,其用于識(shí)別所述電子字符序列中的特定字符或特定字符序列;
[0038] 其中,所述格式化模塊用于根據(jù)被識(shí)別出的語(yǔ)言以及被識(shí)別出的特定字符或特定 字符序列,格式化所述電子字符序列中的空格。
[0039] 在本發(fā)明的第五方面中,提供了一種使用格式化模塊來格式化電子字符序列中 的空格的方法,其中所述格式化模塊支持至少一種語(yǔ)言且具有一字符識(shí)別器,所述方法包 括:
[0040] 識(shí)別所述電子字符序列是否由被所述格式化模塊支持的語(yǔ)言書寫;
[0041] 使用所述字符識(shí)別器識(shí)別所述電子字符序列中的特定字符或特定字符序列;
[0042] 當(dāng)被支持的語(yǔ)言被識(shí)別出時(shí),使用所述格式化模塊,根據(jù)被識(shí)別出的語(yǔ)言和被識(shí) 別出的特定字符或特定字符序列,格式化所述電子字符序列中的空格。
[0043] 所述格式化模塊包括語(yǔ)言識(shí)別器,以便識(shí)別所述電子字符序列是否由被所述格式 化模塊支持的語(yǔ)言書寫。優(yōu)選地,所述格式戶模塊支持多種語(yǔ)言,而所述方法還包括:使用 所述語(yǔ)言識(shí)別器識(shí)別所述電子字符序列的最可能的語(yǔ)言。
[0044] 通過文本預(yù)測(cè)引擎識(shí)別所述電子字符序列的最可能的語(yǔ)言,而所述方法還包括: 將所述最可能的語(yǔ)言傳遞至所述格式化模塊,其中所述格式化模塊識(shí)別所述最可能語(yǔ)言是 否由所述格式化模塊支持。
[0045] 所述語(yǔ)言識(shí)別器優(yōu)選包括至少一個(gè)規(guī)則集合以及比較機(jī)構(gòu),每條規(guī)則限定了所述 電子字符序列中的空格的格式,其
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
普陀区| 常德市| 兴和县| 丹阳市| 邵东县| 金塔县| 和龙市| 禄丰县| 北宁市| 明溪县| 九台市| 大竹县| 南和县| 桦南县| 栾城县| 余姚市| 清苑县| 翁牛特旗| 科技| 荣昌县| 任丘市| 高雄县| 克东县| 庆元县| 余干县| 潮安县| 平度市| 丰镇市| 平凉市| 永新县| 吉林省| 松潘县| 衡阳市| 尼勒克县| 黄平县| 蓬莱市| 新兴县| 潢川县| 万年县| 白水县| 禹城市|