欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

自動(dòng)語(yǔ)音識(shí)別(asr)片區(qū)化的制作方法

文檔序號(hào):2831818閱讀:333來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):自動(dòng)語(yǔ)音識(shí)別(asr)片區(qū)化的制作方法
自動(dòng)語(yǔ)音識(shí)別(ASR)片區(qū)化(相關(guān)申請(qǐng)) 本正式申請(qǐng)要求在2007年7月11日提交的發(fā)明名稱(chēng)為"AUTOMATED SPEECH RECOGNITION(ASR)TILING"的美國(guó)臨時(shí)申請(qǐng)No. 60/949158的權(quán)益,在此通過(guò)引入并入其全 部?jī)?nèi)容。
背景技術(shù)
諸如全球定位系統(tǒng)(GPS)的定位系統(tǒng)可被各種各樣的裝置采用以向用戶提供各 種不同的功能。例如,可以在便攜式裝置內(nèi)并入位置確定功能,使得可以將其安裝在各種不 同的車(chē)輛中,以提供諸如汽車(chē)或摩托車(chē)中的逐圈(turn-by-turn)驅(qū)動(dòng)指令的導(dǎo)航指令。在 其它的實(shí)例中,位置確定功能可以作為儀表的一部分被并入飛機(jī)內(nèi)以給出飛行數(shù)據(jù),可以 被安裝在船上以獲知在水體上的位置(例如,船所處的位置以及該位置處的水深)、被并入 健身器材內(nèi),等等。 在這些實(shí)例中的至少一些中,可能期望在不需要用戶使用手的情況下使用位置確 定功能與并入了位置確定功能的裝置的其它功能。例如,并入了位置確定功能的裝置可被 配置為用于汽車(chē)中,因此,會(huì)期望使得用戶能夠在不使他們的手脫離方向盤(pán)的情況下與裝 置交互作用。 一種這樣的可被用于提供這種功能的技術(shù)是自動(dòng)語(yǔ)音識(shí)別(ASR)。 ASR—般 被用于將語(yǔ)音翻譯成從語(yǔ)音提取意思的形式(例如,文本和數(shù)值表達(dá)等),該形式然后可被 用于執(zhí)行期望的功能。但是,常規(guī)的用于提供ASR的技術(shù)一般消耗大量的資源(例如,處理 資源),因此實(shí)現(xiàn)起來(lái)會(huì)是昂貴的。另外,當(dāng)遇到諸如會(huì)在具有位置確定功能的裝置中遇到 的數(shù)據(jù)量的大量的數(shù)據(jù)時(shí),這種實(shí)現(xiàn)會(huì)進(jìn)一步復(fù)雜化。

發(fā)明內(nèi)容
描述了創(chuàng)建用于自動(dòng)語(yǔ)音識(shí)別(ASR)中的數(shù)據(jù)的片區(qū)(tile)的技術(shù)。在實(shí)現(xiàn)中, 獲得自動(dòng)語(yǔ)音識(shí)別(ASR)數(shù)據(jù)。ASR數(shù)據(jù)被劃分成多個(gè)片區(qū)。片區(qū)中的每一個(gè)是ASR數(shù)據(jù) 的分割區(qū)(partition)。 在另一實(shí)現(xiàn)中,選擇多個(gè)片區(qū)中的一個(gè)或多個(gè),這些片區(qū)中的每一個(gè)是自動(dòng)語(yǔ)音 識(shí)別(ASR)數(shù)據(jù)。該選擇基于與要通過(guò)使用音頻輸入執(zhí)行的搜索有關(guān)的信息和地理位置。 選擇的一個(gè)或多個(gè)片區(qū)的ASR數(shù)據(jù)被組合和用于翻譯音頻輸入。 本發(fā)明內(nèi)容被提供作為在具體實(shí)施方式
和附圖中完整描述的主題的介紹。因此, 發(fā)明內(nèi)容不應(yīng)被認(rèn)為是描述基本特征,也不應(yīng)被用于確定權(quán)利要求的范圍。


參照附圖進(jìn)行詳細(xì)的描述。在圖中,附圖標(biāo)記的最左側(cè)數(shù)字表示首先出現(xiàn)該附圖 標(biāo)記的圖。在說(shuō)明書(shū)和附圖中的不同實(shí)例中使用相同的附圖標(biāo)記可表示類(lèi)似或相同的項(xiàng) 目。
圖1是可操作以提供位置確定技術(shù)的示例性實(shí)現(xiàn)的環(huán)境的示圖,在圖1中示出其例子作為全球定位系統(tǒng)(GPS)。 圖2是表示可被圖1的環(huán)境100采用的ASR數(shù)據(jù)片區(qū)化(tiling)的示例性實(shí)現(xiàn) 中的系統(tǒng)的示圖。 圖3是示出示例性實(shí)現(xiàn)中的過(guò)程的流程圖,其中,通過(guò)將ASR數(shù)據(jù)劃分成地理分割 區(qū)來(lái)形成片區(qū)而形成片區(qū)。 圖4是示出示例性實(shí)現(xiàn)中的過(guò)程的流程圖,其中,通過(guò)使用定義ASR數(shù)據(jù)的地理分 割區(qū)的一個(gè)或多個(gè)片區(qū)翻譯音頻輸入。 圖5是示出示例性實(shí)現(xiàn)中的過(guò)程的流程圖,其中,通過(guò)使用定義ASR數(shù)據(jù)的地理分 割區(qū)的一個(gè)或多個(gè)片區(qū)和一個(gè)或多個(gè)公共片區(qū)翻譯音頻輸入。
具體實(shí)施例方式
常規(guī)的用于提供自動(dòng)語(yǔ)音識(shí)別(ASR)的技術(shù)一般消耗大量的資源(例如,處理和 存儲(chǔ)資源)。當(dāng)遇到大量的數(shù)據(jù)(諸如會(huì)在具有位置確定功能的裝置中遇到的數(shù)據(jù)量,諸如 包含名勝、地址、電話號(hào)碼等的數(shù)據(jù)庫(kù))時(shí)ASR的實(shí)現(xiàn)也會(huì)復(fù)雜化。 例如,當(dāng)與諸如服務(wù)器或桌上型計(jì)算機(jī)的不被配置為用于便攜式用途的裝置相比 時(shí),個(gè)人全球定位系統(tǒng)(GPS)裝置可被配置為用于便攜式用途,并因此具有相對(duì)有限的資 源(例如,處理資源,大容量存儲(chǔ)能力、隨機(jī)存取存儲(chǔ)器等)。但是,個(gè)人GPS裝置可包含大 量的用于基于確定的地理位置提供功能的數(shù)據(jù)。例如,用戶可說(shuō)出期望的餐館的名稱(chēng)。在響 應(yīng)中,個(gè)人GPS裝置可翻譯所說(shuō)出的名稱(chēng),這會(huì)消耗大量的資源。個(gè)人GPS裝置也可確定當(dāng) 前的地理位置,然后使用該位置來(lái)搜索數(shù)據(jù),以定位具有該名稱(chēng)或類(lèi)似名稱(chēng)的最近的餐館, 這也會(huì)消耗大量的資源。 因此,涉及自動(dòng)語(yǔ)音識(shí)別(ASR)片區(qū)化的技術(shù)被描述,該技術(shù)可被用于改善ASR中 的效率和精度。在實(shí)現(xiàn)中,諸如地址、名勝等的用于實(shí)現(xiàn)ASR的數(shù)據(jù)被稱(chēng)為ASR數(shù)據(jù)。ASR
數(shù)據(jù)被分成多個(gè)片區(qū),這些片區(qū)是數(shù)據(jù)的地理分割區(qū)。然后,可基于地理位置搜索特定片 區(qū)內(nèi)的數(shù)據(jù),諸如與用戶的當(dāng)前位置、期望的目的地、計(jì)算的路線等對(duì)應(yīng)的片區(qū)內(nèi)的ASR數(shù) 據(jù)。以此方式,可以減少被搜索的ASR數(shù)據(jù)的量,由此在裝置的資源的使用中改善精度和提 高效率。可關(guān)于圖3和圖4找到ASR數(shù)據(jù)片區(qū)創(chuàng)建的進(jìn)一步的討論。
在另一實(shí)現(xiàn)中,描述了創(chuàng)建和利用"公共(common)"片區(qū)的技術(shù)。例如,公共片區(qū) 可被用于包含"冗余"ASR數(shù)據(jù),這些"冗余"ASR數(shù)據(jù)原本被包含在多個(gè)片區(qū)中,由此減少數(shù) 據(jù)的出現(xiàn)次數(shù)并減少要被存儲(chǔ)和搜索的數(shù)據(jù)量。在名勝的例子中,在公共片區(qū)內(nèi)包含可能 包含于多個(gè)片區(qū)中的公共連鎖商店(chain brand),以減少、甚至消除該數(shù)據(jù)在多個(gè)片區(qū)內(nèi) 的重復(fù)。公共片區(qū)從而可被用來(lái)改善語(yǔ)音識(shí)別的效率,可關(guān)于圖5找到其進(jìn)一步的討論。
在以下的討論中,首先描述可操作以執(zhí)行ASR片區(qū)化技術(shù)的示例性環(huán)境。然后描 述可在示例性環(huán)境中采用以及在其它環(huán)境中采用而不背離其精神和范圍的示例性過(guò)程。
圖1示出可操作以采用自動(dòng)語(yǔ)音識(shí)別片區(qū)化技術(shù)的示例性環(huán)境100。示出的環(huán)境 100包含具有一個(gè)或多個(gè)處理器104和存儲(chǔ)器106的計(jì)算裝置102。計(jì)算裝置102可另外 包含用于檢測(cè)用戶語(yǔ)音的麥克風(fēng)和/或其它裝置、用于以可視的方式向用戶呈現(xiàn)與語(yǔ)音和 導(dǎo)航相關(guān)的信息的顯示器、和用于以可聽(tīng)的方式與用戶通信的揚(yáng)聲器。處理器不受形成它 們的材料或其中采用的處理機(jī)制限制。例如,處理器可包含半導(dǎo)體和/或晶體管(例如,電
5子集成電路(IC))。在這種情況下,處理器可執(zhí)行的指令可以是電子可執(zhí)行的指令。另外, 雖然示出單一的存儲(chǔ)器106,但是,可以采用諸如隨機(jī)存取存儲(chǔ)器(RAM)、硬盤(pán)存儲(chǔ)器、可移 動(dòng)介質(zhì)存儲(chǔ)器和其它類(lèi)型的計(jì)算機(jī)可讀介質(zhì)的各種各樣的類(lèi)型的存儲(chǔ)器和它們的組合。
計(jì)算裝置被示為在處理器104上執(zhí)行語(yǔ)音識(shí)別模塊108,該語(yǔ)音識(shí)別模塊108也 可被存儲(chǔ)在存儲(chǔ)器106中。語(yǔ)音識(shí)別模塊108代表在自動(dòng)語(yǔ)音識(shí)別(ASR)中涉及的技術(shù)。 例如,語(yǔ)音識(shí)別模塊108可采用語(yǔ)音引擎IIO,該語(yǔ)音引擎IIO代表從由用戶112提供的音 頻輸入提取意思以諸如將音頻輸入轉(zhuǎn)換成理解"用戶什么意思"的文本或其它形式的功能。 由于通過(guò)使用數(shù)字標(biāo)識(shí)符對(duì)意思進(jìn)行編碼可以更有效(因?yàn)樗鼈兪歉泳o湊的并且被更 加有效地計(jì)算處理),因此語(yǔ)音引擎110的輸出未必是文本。也想到了各種其它的例子。
語(yǔ)音識(shí)別模塊108也可代表對(duì)于ASR數(shù)據(jù)114采用片區(qū)化技術(shù)的功能。如前所 述,諸如在導(dǎo)航裝置中遇到的那些的大的數(shù)據(jù)集會(huì)使ASR技術(shù)的執(zhí)行復(fù)雜化。例如,數(shù)據(jù)集 越大,則執(zhí)行ASR耗費(fèi)的時(shí)間會(huì)越長(zhǎng)。另外,數(shù)據(jù)集越大,所說(shuō)的內(nèi)容與數(shù)據(jù)集中的非相關(guān) 項(xiàng)目混淆的危險(xiǎn)性就越高。因此,為了在執(zhí)行ASR時(shí)同時(shí)改善速度和精度,可以將ASR數(shù)據(jù) 114布置為使得可視需要取出ASR數(shù)據(jù)的若干部分??梢砸愿鞣N方式執(zhí)行該布置。
例如,ASR數(shù)據(jù)114可被"垂直"布置成多個(gè)類(lèi)別。因此,可以對(duì)于"餐館"執(zhí)行搜 索而不搜索食品雜貨店數(shù)據(jù)。ASR數(shù)據(jù)114也可被分割成作為ASR數(shù)據(jù)114的地理分割區(qū) 的一個(gè)或多個(gè)片區(qū)116(t)。因此,可通過(guò)從與期望的地理位置(諸如計(jì)算裝置102的當(dāng)前 的位置)相關(guān)的片區(qū)合并數(shù)據(jù),進(jìn)行鄰近(proximity)搜索。 另外,可能從搜索位置獨(dú)立地搜索ASR數(shù)據(jù)114的某些元素。例如,即使這些元素 在ASR數(shù)據(jù)114中的出現(xiàn)是最少的、元素可能在大量的片區(qū)中多次出現(xiàn)等等,用戶112也可 能頻繁地搜索這些元素。因此,為了避免使相同的元素(例如,作為ASR話語(yǔ)(utterance)) 在各片區(qū)116(t)中重復(fù),一個(gè)或多個(gè)公共片區(qū)118(c)可形成為包含該ASR數(shù)據(jù)114(即, "元素")。因此,當(dāng)執(zhí)行搜索時(shí),提供地理分割區(qū)的一個(gè)或多個(gè)公共片區(qū)118(c)和片區(qū) 116 (t)可被組合以包含可能被用戶112說(shuō)出(utter)的可識(shí)別詞匯中的話語(yǔ)。
任選地,計(jì)算裝置102可采用位置確定模塊120來(lái)提供可與ASR技術(shù)結(jié)合使用的 位置確定功能。例如,可以執(zhí)行利用(leverage)計(jì)算裝置102的當(dāng)前位置、輸入目的地、沿 路線的位置等的聲音驅(qū)動(dòng)搜索。 位置確定功能出于以下的討論的目的可涉及各種不同的導(dǎo)航技術(shù)和可通過(guò)"知 道"位置確定裝置104的一個(gè)或多個(gè)位置支撐的其它技術(shù)。例如,可以采用位置確定功能來(lái) 提供位置信息、定時(shí)信息、速度信息和各種其它的與導(dǎo)航有關(guān)的數(shù)據(jù)。可以諸如通過(guò)使用示 出的無(wú)線電定位技術(shù)(例如,L0RAN、 GPS、 GLONASS、 GALILEO等)、慣性定位技術(shù)、蜂窩網(wǎng)絡(luò) 定位技術(shù)、利用現(xiàn)有的原本不是用于定位的信號(hào)的技術(shù)(例如,WiFi)等以各種方式獲得該 信息。因此,可以以各種方式配置位置確定裝置104以執(zhí)行各種各樣的功能。例如,位置確 定裝置104可被配置為用于示出的車(chē)輛導(dǎo)航、航空導(dǎo)航(例如,用于飛機(jī)、直升機(jī))、海洋導(dǎo) 航、個(gè)人用途(例如,作為與健康有關(guān)的設(shè)備的一部分)等。 因此,ASR數(shù)據(jù)114可包含啟用ASR的地理內(nèi)容,該地理內(nèi)容諸如為在完整的地理 空間上水平分割并且在一個(gè)或多個(gè)數(shù)據(jù)類(lèi)別中垂直組織的被命名的(named)地理參照數(shù) 據(jù)的集合,所述數(shù)據(jù)類(lèi)別諸如為名勝、機(jī)場(chǎng)、餐館、食品雜貨店等。完整的地理空間是對(duì)于給 定系統(tǒng)的感興趣的地理區(qū)域,諸如美國(guó)的五十個(gè)州、USA和加拿大、西歐、單一的國(guó)家或較小的國(guó)家群等。因此,片區(qū)116(t)可形成要啟用ASR的此地理內(nèi)容的分割區(qū),其可以以ASR 數(shù)據(jù)形式被存儲(chǔ),并且限于位于該片區(qū)覆蓋區(qū)域內(nèi)并且屬于期望的數(shù)據(jù)類(lèi)別的項(xiàng)目。
公共片區(qū)118(c)定義公共地理空間,該地理空間是諸如由于冗余或使用的可能 性而具有聚集(aggregate)的公共數(shù)據(jù)的地理區(qū)域。例如,在歐洲,由于在法國(guó)常見(jiàn)的品牌 可能不是在德國(guó)常見(jiàn)的品牌,反之亦然,因此,對(duì)于法國(guó)和德國(guó)單獨(dú)地聚集公共數(shù)據(jù)。因此, 對(duì)于歐洲,公共地理分割區(qū)可與國(guó)家對(duì)應(yīng),而在美國(guó)公共地理分割區(qū)可以是州(例如,由于 一些在加利福尼亞流行的食品雜貨店可能在堪薩斯不存在)。公共地理空間還可依賴(lài)于前 面對(duì)于地理分割區(qū)所描述的類(lèi)別。 因此,可以將片區(qū)116(t)的覆蓋面積定義為對(duì)于期望的使用情況確保存儲(chǔ)和ASR 處理效率。片區(qū)116(t)可以在垂直的層(例如,類(lèi)別)中被組織,以允許通過(guò)適當(dāng)?shù)睾喜?來(lái)自一個(gè)或多個(gè)層的片區(qū)而在一個(gè)或多個(gè)類(lèi)別中進(jìn)行搜索。在實(shí)現(xiàn)中,可確定對(duì)于各片區(qū) 的覆蓋面積,以在層內(nèi)保證均勻的片區(qū)存儲(chǔ)尺寸。結(jié)果,片區(qū)覆蓋面積在一個(gè)層中未必是一 致的,并且被數(shù)據(jù)的局部地理密度驅(qū)動(dòng)(料想,與在鄉(xiāng)村區(qū)域中相比,在市區(qū)中覆蓋面積較 小)。并且,由于一些類(lèi)別可能沒(méi)有其它的類(lèi)別致密,因此片區(qū)覆蓋面積在層之間未必是一 致的。例如,料想與快餐店相比,機(jī)場(chǎng)或游樂(lè)園的數(shù)據(jù)密度較低,可關(guān)于以下的圖找到其例 子。在單層內(nèi),一組地理片區(qū)可鑲嵌(mosaic)完整的地理空間而沒(méi)有重疊。
公共片區(qū)118(c)的覆蓋區(qū)域是公共地理空間。公共片區(qū)118(c)也可以在多層 (例如,類(lèi)別)中被組織,以允許通過(guò)適當(dāng)?shù)睾喜?lái)自一個(gè)或多個(gè)層的片區(qū)在一個(gè)或多個(gè) 類(lèi)別中進(jìn)行搜索。當(dāng)完整的地理空間對(duì)于感興趣的數(shù)據(jù)類(lèi)別包含多于一個(gè)的公共地理空 間時(shí),如果搜索中心接近兩個(gè)或更多個(gè)公共地理空間之間的邊界,那么可以合并公共片區(qū) 118(c)。例如,法國(guó)和德國(guó)之間的邊界附近的用戶可通過(guò)臨近地使用來(lái)自法國(guó)公共片區(qū)和 德國(guó)公共片區(qū)的內(nèi)容兩者而搜索ASR數(shù)據(jù)114。 圖2示出可被圖1的環(huán)境100采用的ASR數(shù)據(jù)片區(qū)化的示例性實(shí)現(xiàn)。所示出的實(shí) 現(xiàn)顯示包含被示為堪薩斯、密蘇里、俄克拉荷馬和阿肯色的四個(gè)州的區(qū)域200。還示出代表 作為與區(qū)域200的各部分對(duì)應(yīng)的ASR數(shù)據(jù)的地理分割區(qū)的片區(qū)的虛線框。在實(shí)現(xiàn)中,基于 要在片區(qū)中包含的各數(shù)據(jù)量確定地理分割區(qū)的尺寸。因此,與可包含于片區(qū)中的ASR數(shù)據(jù) 對(duì)應(yīng)的地理區(qū)域的"尺寸"可改變。 例如,片區(qū)202可代表包含描述"機(jī)場(chǎng)"的ASR數(shù)據(jù)的片區(qū)。因此,該片區(qū)202可 對(duì)應(yīng)于覆蓋所示出的區(qū)域的大部分的地理分割區(qū)。但是,片區(qū)204 212可與描述"餐館" 的ASR數(shù)據(jù)對(duì)應(yīng)。因此,可分別對(duì)于堪薩斯市圣路易斯、俄克拉荷馬城和小石城利用各自的 片區(qū)204 210。并且,與較大的地理區(qū)域?qū)?yīng)的片區(qū)212可被用于覆蓋這些主要城市之間 的區(qū)域。因此,與代表數(shù)據(jù)的不同類(lèi)別的片區(qū)對(duì)應(yīng)的地理區(qū)域可能相互不同。并且,與特定 類(lèi)別的片區(qū)對(duì)應(yīng)的地理區(qū)域也可能相互不同。可以使用各種各樣的技術(shù)來(lái)分割A(yù)SR數(shù)據(jù), 可以關(guān)于以下的示例性過(guò)程中找到其進(jìn)一步的討論。 —般地,可通過(guò)使用軟件、固件、硬件(例如,固定邏輯電路)、手動(dòng)處理或這些實(shí) 現(xiàn)的組合實(shí)現(xiàn)這里描述的功能中的任何功能。這里使用的術(shù)語(yǔ)"模塊"和"功能"一般代表 軟件、固件、硬件和它們的組合。在軟件實(shí)現(xiàn)的情況下,例如,模塊代表當(dāng)在諸如圖1的位置 確定裝置104的處理器120的處理器上被執(zhí)行時(shí)執(zhí)行特定任務(wù)的可執(zhí)行指令。程序代碼可 被存儲(chǔ)在一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)中,該計(jì)算機(jī)可讀介質(zhì)的例子是圖1的位置確定裝置104的存儲(chǔ)器118。以下描述的ASR片區(qū)化技術(shù)的特征是與平臺(tái)無(wú)關(guān)的,意味著可以在具有 各種處理器的各種商業(yè)計(jì)算平臺(tái)上實(shí)現(xiàn)這些技術(shù)。 以下的討論描述可通過(guò)利用前面描述的系統(tǒng)和裝置實(shí)現(xiàn)的ASR片區(qū)化技術(shù)??梢?以硬件、固件、軟件或它們的組合實(shí)現(xiàn)這些過(guò)程中的每一個(gè)的各方面。這些過(guò)程被示為規(guī)定 通過(guò)一個(gè)或多個(gè)裝置執(zhí)行的操作的一組框,并且,不必限于由各框顯示的用于執(zhí)行操作的 次序。在以下的討論的各部分中,將參照?qǐng)D1的環(huán)境100和/或圖2的區(qū)域200。
圖3示出ASR數(shù)據(jù)被分成地理分割區(qū)以形成片區(qū)的示例性實(shí)現(xiàn)中的過(guò)程300。獲 得自動(dòng)語(yǔ)音識(shí)別(ASR)數(shù)據(jù)(框302)。如前所述,ASR數(shù)據(jù)涉及可結(jié)合ASR使用的數(shù)據(jù),并 因此可采取(assume)各種各樣的配置。例如,ASR數(shù)據(jù)可包含與位置確定技術(shù)有關(guān)的數(shù)據(jù), 諸如名勝(POI)、地址(例如,城市、州、街道)等。ASR數(shù)據(jù)還可描述諸如電話號(hào)碼等的各 種其它的數(shù)據(jù)。因此,可從諸如網(wǎng)絡(luò)服務(wù)、數(shù)據(jù)收集服務(wù)等的各種不同的來(lái)源獲得該數(shù)據(jù)。
例如,ASR數(shù)據(jù)基于要包含于各片區(qū)中的數(shù)據(jù)的近似量被劃分成多個(gè)片區(qū),其中, 片區(qū)中的每一個(gè)是ASR數(shù)據(jù)的一個(gè)地理分割區(qū)(框304)。例如,可對(duì)于要被包含于單一片 區(qū)中的數(shù)據(jù)量規(guī)定閾值數(shù)據(jù)量。可通過(guò)使用各種技術(shù)(諸如基于與可能被搜索的最小地理 區(qū)域?qū)?yīng)的可用資源的量、基于用戶交互作用的測(cè)試事例、機(jī)器學(xué)習(xí)等)得到該閾值。各片 區(qū)可包含任意數(shù)量的數(shù)據(jù)項(xiàng)或條目,包括單一的項(xiàng)目或條目。 該閾值然后可被用于創(chuàng)建諸如ASR數(shù)據(jù)的特定類(lèi)別中的片區(qū)的片區(qū)。例如,ASR數(shù) 據(jù)可被配置為結(jié)合位置確定技術(shù)使用,并因此可包含地址、名勝、電話號(hào)碼等。然后可為了 后面的搜索將這些類(lèi)別中的每一個(gè)中的數(shù)據(jù)片區(qū)化。也想到了各種其它的例子。
另外,或者,作為替代方案,可以利用非地理準(zhǔn)則、諸如按類(lèi)別、數(shù)據(jù)壓縮特性、地 址類(lèi)型、它們的組合等來(lái)將ASR數(shù)據(jù)分割成多個(gè)片區(qū)。例如,諸如在各片區(qū)與語(yǔ)音數(shù)據(jù)的不 同類(lèi)別(例如,餐館數(shù)據(jù)、城市數(shù)據(jù)、街道數(shù)據(jù)、娛樂(lè)數(shù)據(jù)、貨品和服務(wù)數(shù)據(jù)等)對(duì)應(yīng)的情況 下,可按類(lèi)別將ASR數(shù)據(jù)分割成多個(gè)片區(qū)。也可諸如通過(guò)使可類(lèi)似壓縮的數(shù)據(jù)或數(shù)據(jù)類(lèi)型 與相同的片區(qū)相關(guān)聯(lián),分割A(yù)SR數(shù)據(jù)以使與各片區(qū)關(guān)聯(lián)的數(shù)據(jù)的數(shù)據(jù)壓縮特性最大化,以 限制由壓縮的ASR數(shù)據(jù)片區(qū)占用的存儲(chǔ)器。 也可基于地址類(lèi)型分割A(yù)SR數(shù)據(jù)。例如,街道地址可以給出各種形式,諸如簡(jiǎn)單 的數(shù)字形式(例如,100)、分開(kāi)的數(shù)字形式(例如,10-12)和復(fù)雜的字母數(shù)字形式(例如, B451G)。如下面討論的那樣,可基于地址形式分割片區(qū)以便利于ASR。 從ASR數(shù)據(jù)形成一個(gè)或多個(gè)公共片區(qū)(框306)。如前所述,可以以各種方式使用 公共片區(qū)以改善ASR技術(shù)的效率。例如,可以識(shí)別具有增大的被用戶請(qǐng)求的可能性的ASR 數(shù)據(jù)(框308),這些ASR數(shù)據(jù)諸如為先前被用戶請(qǐng)求過(guò)的數(shù)據(jù)、一般由位置確定裝置的用戶 搜索的數(shù)據(jù)等。 在另一例子中,識(shí)別多次出現(xiàn)的ASR數(shù)據(jù)(框310)。例如,ASR數(shù)據(jù)可被劃分成諸 如包含餐館和商店的名勝的各種類(lèi)別的類(lèi)別。同樣包含餐館的高檔商店由此可在兩種類(lèi)別 中具有條目。因此,不是將該數(shù)據(jù)包含在與特定的地理區(qū)域?qū)?yīng)的多個(gè)片區(qū)中,而是可將其 合并到該區(qū)域的公共片區(qū)中。 在另一個(gè)例子中,識(shí)別與特定的貨品或服務(wù)的品牌對(duì)應(yīng)的ASR數(shù)據(jù)(框312)。 例如,ASR數(shù)據(jù)可包含可包含于公共片區(qū)中的餐館和商店的流行品牌,以易于搜索諸如 MCDONALDS (MCDONALDS是McDonald's Corporation, Oak Brook, Illinois的注冊(cè)商標(biāo))的這些品牌。也想到了各種其它的例子。 根據(jù)片區(qū)存儲(chǔ)ASR數(shù)據(jù)(框314)。例如,根據(jù)地理分割區(qū)被劃分的數(shù)據(jù)然后可被存儲(chǔ)并在后面基于地理位置和與用戶想要的搜索的有關(guān)的信息被檢索。該信息可采取各種形式,可關(guān)于以下的圖找到其進(jìn)一步的討論。另外,被識(shí)別(例如,框308 312)的數(shù)據(jù)可作為公共片區(qū)被存儲(chǔ),可關(guān)于圖5找到其進(jìn)一步的討論。 圖4示出示例性實(shí)施例中的過(guò)程400,其中,通過(guò)使用定義ASR數(shù)據(jù)的地理分割區(qū)的一個(gè)或多個(gè)片區(qū)將音頻輸入翻譯成文本。確定地理位置(框402)。例如,位置確定裝置104可通過(guò)使用GPS、從蜂窩式塔廣播位置數(shù)據(jù)的基于無(wú)線電話的系統(tǒng)、發(fā)射定位信號(hào)(例如,通過(guò)使用范圍測(cè)量和/或三角測(cè)量技術(shù))的無(wú)線網(wǎng)絡(luò)等確定位置。也可通過(guò)使用基于服務(wù)器的結(jié)構(gòu)中的服務(wù)器、從基于地面的基礎(chǔ)結(jié)構(gòu)、通過(guò)一個(gè)或多個(gè)傳感器(例如,陀螺儀、里程表、磁力計(jì))、通過(guò)使用"船位推算法"技術(shù)等實(shí)現(xiàn)位置確定功能。在另一例子中,通過(guò)從用戶接收的手動(dòng)輸入(例如,希望的目的地)確定位置。還設(shè)想了各種其它的例子,諸如沿期望的路 線的地理定位等。 還接收與用戶希望的搜索有關(guān)的信息(框404)。例如,可以使用該信息以向用戶和位置確定裝置之間的交互作用提供語(yǔ)境(context),該語(yǔ)境諸如為搜索的"垂直"范圍(例如,要在信息的層級(jí)(hierarchy)內(nèi)搜索哪個(gè)水平的數(shù)據(jù))、搜索的"水平"范圍(例如,用于搜索的最大的期望的半徑設(shè)置)等。此外,可從諸如由于信息的層級(jí)內(nèi)的當(dāng)前"位置"隱含的裝置設(shè)置(例如,搜索半徑、搜索中心位置)的各種不同的來(lái)源、基于用戶的以前的交互作用等獲得該信息。 在實(shí)現(xiàn)中,該信息的持續(xù)性也可改變。例如,包含于該信息中的裝置設(shè)置可具有"永久的"持續(xù)性,使得變化的值被保存并且再次用于隨后的用途。在另一例子中,裝置設(shè)置可具有臨時(shí)的持續(xù)性,使得改變的值僅用于當(dāng)前的搜索,并且,下一搜索對(duì)于設(shè)置采取缺省值,除非被再次修改作為該新搜索的一部分。 基于信息和/或地理位置選擇多個(gè)片區(qū)中的一個(gè)或多個(gè)(框406)??梢砸愿鞣N方式執(zhí)行該選擇。例如,可基于層級(jí)內(nèi)的當(dāng)前位置和諸如位于"堪薩斯奧拉西"附近的"餐館"的期望的目的地選擇片區(qū)。但是,可以與用戶的當(dāng)前地理位置或用戶行進(jìn)的任何預(yù)期或當(dāng)前路線無(wú)關(guān)地選擇片區(qū),使得用戶可識(shí)別任何地理區(qū)域以導(dǎo)致選擇片區(qū)中的一個(gè)或多個(gè)。
在實(shí)現(xiàn)中,繼續(xù)選擇,直到獲得閾值量的數(shù)據(jù),以諸如在更大的地理區(qū)域中、在數(shù)據(jù)的層級(jí)的不同水平中繼續(xù)搜索等等。在基于地址類(lèi)型分割A(yù)SR數(shù)據(jù)的實(shí)現(xiàn)中,可基于地理位置和與地理位置關(guān)聯(lián)的地址類(lèi)型選擇一個(gè)或多個(gè)片區(qū)。例如,對(duì)于與采用被劃分的數(shù)字地址的紐約對(duì)應(yīng)的地理位置,可以選擇與被劃分的數(shù)字地址對(duì)應(yīng)的ASR片區(qū),而對(duì)于與采用簡(jiǎn)單的數(shù)字地址的堪薩斯對(duì)應(yīng)的地理位置,可以選擇與簡(jiǎn)單的數(shù)字地址對(duì)應(yīng)的ASR片區(qū),以便利于迅速的語(yǔ)音識(shí)別。 來(lái)自片區(qū)的ASR數(shù)據(jù)被組合(框408),然后它被用于翻譯音頻輸入(框410),以得到諸如文本、數(shù)字表示等的輸出的意思??梢圆捎酶鞣N不同的技術(shù)來(lái)執(zhí)行此翻譯,比如,通過(guò)語(yǔ)音引擎進(jìn)行處理以將一個(gè)或多個(gè)建議的錄音(transcription)與組合的ASR數(shù)據(jù)相比較以找到可能的結(jié)果。 在實(shí)現(xiàn)中,可以采用多語(yǔ)言(multilingual)技術(shù)以在語(yǔ)言之間進(jìn)行翻譯。例如,可以使用"音素(phoneme)"映射以允許識(shí)別與當(dāng)前的ASR語(yǔ)言不同的語(yǔ)言中的話語(yǔ)。"音素"映射將第一語(yǔ)言中的發(fā)音映射成第二語(yǔ)言中的最接近的匹配,使得發(fā)音可以在第二語(yǔ)言中是可識(shí)別的。也想到了各種其它的例子。 然后通過(guò)使用翻譯的音頻輸入執(zhí)行操作(框412)。例如,操作可以是位置確定裝置104的控制功能,以諸如對(duì)于輸入地址、查找電話號(hào)碼、播放歌曲、選擇廣播站等提供指示。可通過(guò)使用顯示器或揚(yáng)聲器將操作結(jié)果傳送給用戶,以確認(rèn)音頻輸入的適當(dāng)?shù)姆g。
圖5是示出示例性實(shí)現(xiàn)中的過(guò)程500的流程圖,其中,通過(guò)使用定義ASR數(shù)據(jù)的地理分割區(qū)的一個(gè)或多個(gè)片區(qū)和一個(gè)或多個(gè)公共片區(qū)翻譯音頻輸入。作為接收音頻輸入的響應(yīng),獲得描述與要通過(guò)使用音頻輸入執(zhí)行的搜索有關(guān)的信息和地理位置的數(shù)據(jù)(框502)。例如,當(dāng)位置確定裝置104處于名勝的"餐館"類(lèi)別、因此該信息是向輸入提供語(yǔ)境的"餐館"時(shí),用戶可以說(shuō)命令"去Chotchkie' s"。如前所述,可以以諸如當(dāng)前的位置、期望的目的地、沿路線等的各種方式確定與搜索相關(guān)的地理位置。 然后基于該信息和地理位置確定片區(qū)是否是可用的(判定框504)。繼續(xù)前面的例子,位置確定裝置104可對(duì)于地理位置確定一個(gè)或多個(gè)餐館是否是可用的。如果為是(在判定框504中為"是"),那么基于該確定獲得一個(gè)或多個(gè)片區(qū)(框506)。在實(shí)現(xiàn)中,如果閾值量的數(shù)據(jù)是不可用的,那么可以諸如在由鄰近的片區(qū)定義的鄰近位置中定位附加的片區(qū)。換句話說(shuō),可以獲得與鄰近的地理分割區(qū)對(duì)應(yīng)的片區(qū)和/或處于層級(jí)的不同水平的片區(qū),以諸如在ASR數(shù)據(jù)中包含附加的類(lèi)別。也想到了各種其它的例子。
如果基于地理位置片區(qū)是不可用的(在判定框504中為"否"),或者,在獲得一個(gè)或多個(gè)片區(qū)(框506)之后,基于地理位置而不基于信息確定公共片區(qū)是否是可用的(判定框508)。如前所述,公共片區(qū)可被用于減少ASR數(shù)據(jù)中的數(shù)據(jù)冗余量,可被配置為包含可能與地理位置無(wú)關(guān)地被搜索的ASR數(shù)據(jù),但也想到了每個(gè)垂直的層使用不同的公共片區(qū)。例如,雖然也想到了垂直的合并(integration),但公共片區(qū)可主要用作水平集合體。因此,如果用戶已挑選了垂直層,那么該用戶可仍在該層內(nèi)水平搜索。因此,在與期望的地理區(qū)域?qū)?yīng)的公共片區(qū)可用的實(shí)現(xiàn)中,與信息無(wú)關(guān)地在搜索中包含ASR數(shù)據(jù)。例如,流行的快餐店可包含于公共片區(qū)中,使得"購(gòu)物"語(yǔ)境中的用戶被提供快餐搜索的結(jié)果而無(wú)需該用戶位于"餐館"語(yǔ)境中。因此,當(dāng)一個(gè)或多個(gè)公共片區(qū)對(duì)于地理位置可用時(shí)(在判定框508中為"是"),那么基于該確定獲得一個(gè)或多個(gè)公共片區(qū)(框510)。但是,在另一實(shí)現(xiàn)中,諸如當(dāng)片區(qū)用作水平集合體時(shí),可以與地理位置無(wú)關(guān)地使用公共片區(qū)。 當(dāng)公共片區(qū)不可用時(shí)(在判定框508中為"否"),或者,在已獲得公共片區(qū)(框510)之后,如果有的話,則從獲得的片區(qū)組合ASR數(shù)據(jù)(框512)。然后通過(guò)使用組合的ASR數(shù)據(jù)翻譯音頻輸入(框514),前面關(guān)于圖4描述了其例子。因此,公共片區(qū)可被用于改善自動(dòng)語(yǔ)音識(shí)別的效率和精度。 在一些實(shí)現(xiàn)中,可以在選擇和/或搜索片區(qū)的同時(shí)提供間歇的翻譯結(jié)果。因此,在選擇和/或搜索公共片區(qū)和其它的片區(qū)時(shí),部分匹配可被識(shí)別并被呈現(xiàn)給用戶以供確認(rèn)或選擇。因此,如果在搜索所有有關(guān)的片區(qū)之前首先識(shí)別部分但正確的匹配,那么用戶可以確認(rèn)和選擇部分匹配而不等待到所有有關(guān)的片區(qū)被搜索。 雖然以結(jié)構(gòu)特征和/或方法動(dòng)作特定的語(yǔ)言描述了本發(fā)明,但應(yīng)理解,在所附的權(quán)利要求中限定的本發(fā)明不必限于描述的特定的特征或動(dòng)作。而是,特定的特征和動(dòng)作作為實(shí)現(xiàn)要求保護(hù)的本發(fā)明的示例性形式被公開(kāi)。
權(quán)利要求
一種方法,包括選擇多個(gè)片區(qū)中的一個(gè)或多個(gè),所述多個(gè)片區(qū)中的每一個(gè)是自動(dòng)語(yǔ)音識(shí)別ASR數(shù)據(jù)的分割區(qū),其中,所述選擇基于與用戶想要的搜索有關(guān)的信息;和地理位置;以及通過(guò)使用來(lái)自所選擇的一個(gè)或多個(gè)片區(qū)的ASR數(shù)據(jù)來(lái)翻譯音頻輸入。
2. 如權(quán)利要求1所述的方法,其中,所述ASR片區(qū)被地理分割。
3. 如權(quán)利要求1所述的方法,其中,所述ASR片區(qū)按類(lèi)別被分割。
4. 如權(quán)利要求l所述的方法,其中,所述ASR片區(qū)中的一個(gè)的至少一部分根據(jù)多個(gè)類(lèi)別被布置。
5. 如權(quán)利要求1所述的方法,其中,由位置確定系統(tǒng)提供輸入的地理位置,所述位置確定系統(tǒng)通過(guò)使用從多個(gè)已知的基準(zhǔn)點(diǎn)廣播的信號(hào)來(lái)確定地理位置。
6. 如權(quán)利要求1所述的方法,還包括組合所選擇的一個(gè)或多個(gè)片區(qū)與公共片區(qū)。
7. 如權(quán)利要求6所述的方法,其中,所述公共片區(qū)包含已被識(shí)別為具有增大的被用戶請(qǐng)求的可能性的所述自動(dòng)語(yǔ)音識(shí)別ASR數(shù)據(jù)的一部分。
8. 如權(quán)利要求6所述的方法,其中,所述公共片區(qū)包含已被識(shí)別為在所述ASR數(shù)據(jù)中可能出現(xiàn)多次的所述自動(dòng)語(yǔ)音識(shí)別ASR數(shù)據(jù)的一部分。
9. 如權(quán)利要求6所述的方法,其中,所述公共片區(qū)包含與特定的貨品或服務(wù)對(duì)應(yīng)的所述自動(dòng)語(yǔ)音識(shí)別ASR數(shù)據(jù)的一部分。
10. 如權(quán)利要求l所述的方法,其中,繼續(xù)所述選擇,直到收集到閾值量的自動(dòng)語(yǔ)音識(shí)別ASR數(shù)據(jù)。
11. 如權(quán)利要求1所述的方法,還包括基于所翻譯的音頻輸入執(zhí)行一種或多種功能。
12. —種方法,包括獲得自動(dòng)語(yǔ)音識(shí)別ASR數(shù)據(jù);禾口基于要被包含于各片區(qū)中的數(shù)據(jù)的近似量將ASR數(shù)據(jù)劃分成多個(gè)片區(qū),其中,所述片區(qū)中的每一個(gè)是ASR數(shù)據(jù)的分割區(qū),其中,所述劃分包含形成一個(gè)或多個(gè)公共片區(qū),所述一個(gè)或多個(gè)公共片區(qū)包含與特定的貨品或服務(wù)對(duì)應(yīng)的所述自動(dòng)語(yǔ)音識(shí)別ASR數(shù)據(jù)的一部分。
13. 如權(quán)利要求12所述的方法,其中,所述自動(dòng)語(yǔ)音識(shí)別ASR數(shù)據(jù)被配置為翻譯音頻輸入。
14. 如權(quán)利要求12所述的方法,其中,所述ASR數(shù)據(jù)包含地理編碼的名勝和地址。
15. 如權(quán)利要求12所述的方法,其中,所述劃分包含形成一個(gè)或多個(gè)公共片區(qū),所述一個(gè)或多個(gè)公共片區(qū)包含若不形成公共片區(qū)則可能在多個(gè)片區(qū)中重復(fù)的所述自動(dòng)語(yǔ)音識(shí)別ASR數(shù)據(jù)。
16. 如權(quán)利要求12所述的方法,其中,所述劃分包含形成一個(gè)或多個(gè)公共片區(qū),所述一個(gè)或多個(gè)公共片區(qū)包含已被識(shí)別為具有增大的被用戶請(qǐng)求的可能性、并且與對(duì)應(yīng)于相應(yīng)的所述片區(qū)的特定地理區(qū)域相關(guān)的所述自動(dòng)語(yǔ)音識(shí)別ASR數(shù)據(jù)的一部分。
17. 如權(quán)利要求12所述的方法,其中,所述劃分包含形成一個(gè)或多個(gè)公共片區(qū),所述一個(gè)或多個(gè)公共片區(qū)包含已被識(shí)別為若不形成公共片區(qū)則可能在所述ASR數(shù)據(jù)中出現(xiàn)多次、并且與對(duì)應(yīng)于相應(yīng)的所述片區(qū)的特定地理區(qū)域相關(guān)的所述自動(dòng)語(yǔ)音識(shí)別ASR數(shù)據(jù)的一部分。
18. —種位置確定裝置,包含處理器;和存儲(chǔ)器,該存儲(chǔ)器被配置為保持根據(jù)分割區(qū)被劃分成多個(gè)片區(qū)的自動(dòng)語(yǔ)音識(shí)別ASR數(shù)據(jù);禾口一個(gè)或多個(gè)模塊,該一個(gè)或多個(gè)模塊可在處理器上被執(zhí)行,從而基于與用戶發(fā)起的搜索有關(guān)的信息和地理位置選擇多個(gè)片區(qū)中的一個(gè)或多個(gè);禾口通過(guò)使用所選擇的一個(gè)或多個(gè)片區(qū)翻譯音頻輸入。
19. 如權(quán)利要求18所述的位置確定裝置,其中,所述片區(qū)中的至少一個(gè)被配置為公共片區(qū),并且,一個(gè)或多個(gè)模塊可操作以基于所述信息但不基于地理位置選擇公共片區(qū)。
20. 如權(quán)利要求19所述的位置確定裝置,其中,所述公共片區(qū)中的至少一個(gè)包含與特定的貨品或服務(wù)對(duì)應(yīng)的所述自動(dòng)語(yǔ)音識(shí)別ASR數(shù)據(jù)的一部分。
21. 如權(quán)利要求19所述的位置確定裝置,其中,多個(gè)所述公共片區(qū)被組織成基于所述信息被搜索的相應(yīng)類(lèi)別。
22. 如權(quán)利要求19所述的位置確定裝置,其中,所述公共片區(qū)中的至少一個(gè)包含已被識(shí)別為具有增大的被用戶請(qǐng)求的可能性并與所述地理位置相關(guān)的所述自動(dòng)語(yǔ)音識(shí)別ASR數(shù)據(jù)的一部分。
23. 如權(quán)利要求18所述的位置確定裝置,其中,所述一個(gè)或多個(gè)模塊可進(jìn)一步在處理器上被執(zhí)行以通過(guò)使用所述音頻輸入執(zhí)行一種或多種功能。
24. 如權(quán)利要求18所述的位置確定裝置,其中,所述ASR片區(qū)被地理分割。
25. 如權(quán)利要求18所述的位置確定裝置,其中,所述ASR片區(qū)按類(lèi)別被分割。
全文摘要
本發(fā)明涉及位置確定裝置及相應(yīng)的方法。描述了與自動(dòng)語(yǔ)音識(shí)別數(shù)據(jù)的片區(qū)有關(guān)的技術(shù)。在實(shí)現(xiàn)中,獲得自動(dòng)語(yǔ)音識(shí)別(ASR)數(shù)據(jù)。ASR數(shù)據(jù)基于要被包含于各片區(qū)中的數(shù)據(jù)的近似量被劃分成多個(gè)片區(qū)。片區(qū)中的每一個(gè)是ASR數(shù)據(jù)的分割區(qū)。
文檔編號(hào)G10L15/00GK101796576SQ200880105390
公開(kāi)日2010年8月4日 申請(qǐng)日期2008年6月5日 優(yōu)先權(quán)日2007年7月11日
發(fā)明者C·J·斯特里克林, J·W·凱爾, K·A·博爾頓, P·M·盧茨 申請(qǐng)人:佳明有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
兴义市| 大城县| 元阳县| 崇左市| 奉节县| 阳东县| 浪卡子县| 阿拉善右旗| 渝北区| 高阳县| 阳曲县| 惠安县| 天镇县| 衡东县| 景宁| 县级市| 莲花县| 东安县| 苍溪县| 灵山县| 高碑店市| 盖州市| 邵武市| 留坝县| 瑞丽市| 防城港市| 分宜县| 奈曼旗| 兴义市| 南开区| 临武县| 信阳市| 信阳市| 名山县| 清远市| 沂南县| 遵义市| 汨罗市| 廊坊市| 明星| 四会市|