欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于導(dǎo)航相關(guān)數(shù)據(jù)的語音包的制作方法

文檔序號(hào):6697533閱讀:408來源:國知局
專利名稱:用于導(dǎo)航相關(guān)數(shù)據(jù)的語音包的制作方法
用于導(dǎo)航相關(guān)數(shù)據(jù)的語音包
背景技術(shù)
定位裝置可使得用戶能夠通過一種或多種定位方法確定用戶的地理位置。合適的 定位方法包括利用基于衛(wèi)星的導(dǎo)航系統(tǒng)、利用來自蜂窩電話系統(tǒng)的數(shù)據(jù)等。定位裝置還可 將位置相關(guān)數(shù)據(jù)傳送給用戶,例如,用戶的當(dāng)前位置或者從用戶的當(dāng)前位置到另一個(gè)位置 的方向。例如,如果用戶希望從用戶的工作地點(diǎn)開車到特定的餐館,則用戶可通過定位裝置 請(qǐng)求從用戶的工作地點(diǎn)到餐館的開車方向。然后,該裝置可以以各種形式提供方向,例如在 圖形顯示器上可視地顯示方向。定位裝置還可通過可聽的逐個(gè)轉(zhuǎn)彎(turn-by-turn)指令 將方向提供給用戶。由于用戶不必為了接收開車方向而將用戶的焦點(diǎn)從道路轉(zhuǎn)移到圖形顯 示器上,所以可聽的開車指令是有用的。當(dāng)前的定位裝置在提供可聽的開車指令時(shí)通常使用預(yù)錄語音(PRV)。然而,當(dāng)前的 PRV實(shí)現(xiàn)遇到許多障礙。首先,許多當(dāng)前的PRV實(shí)現(xiàn)中的語法和詞匯知識(shí)都是由定位裝置的 操作軟件定義的,而定位裝置的操作軟件禁止修改現(xiàn)有的PRV和創(chuàng)建新的PRV。第二,在典 型的操作軟件內(nèi)定義的嚴(yán)格的語法和詞匯禁止隨機(jī)選擇特定事件的音頻片段供定位裝置 輸出。第三,典型的操作軟件內(nèi)定義的嚴(yán)格的語法和詞匯禁止在隨機(jī)時(shí)間或以隨機(jī)間隔播 放PRV中的音頻片段和其它音頻數(shù)據(jù)。最后,由于重新使用方向相關(guān)短語,并且即使有任何 用于定制音頻輸出的選項(xiàng),也是非常少,所以當(dāng)前的PRV實(shí)現(xiàn)難以供第三方開發(fā)者使用。

發(fā)明內(nèi)容
描述了能夠靈活地、動(dòng)態(tài)地創(chuàng)建和/或修改用于定位裝置的語音數(shù)據(jù)的技術(shù)。在 一些實(shí)施例中,提供包括語言數(shù)據(jù)庫和多個(gè)音頻文件的語音包。語言數(shù)據(jù)庫指定用于意圖 用于定位裝置的音頻輸出的信息的合適的語法和詞匯。音頻文件包括可被定位裝置訪問以 通過可聽輸出傳達(dá)信息的單詞和/或短語。提供這個(gè)概要僅僅是為了引入在詳細(xì)說明書和附圖中充分描述的主題內(nèi)容。因 此,不應(yīng)該認(rèn)為該概要是描述必要特征,也不應(yīng)該將該概要用于確定權(quán)利要求的范圍。


參照附圖對(duì)詳細(xì)說明進(jìn)行描述。在附圖中,標(biāo)號(hào)的最左數(shù)字表示該標(biāo)號(hào)首次出現(xiàn) 的附圖。說明書和附圖中不同實(shí)例中的相同標(biāo)號(hào)的使用可表示類似的或者相同的項(xiàng)目。圖1是其操作為提供導(dǎo)航語音數(shù)據(jù)的靈活創(chuàng)建和修改的示例性定位系統(tǒng)環(huán)境的 圖示。圖2是描繪用于生成語音數(shù)據(jù)包和將數(shù)據(jù)加載在定位裝置上的示例性實(shí)現(xiàn)的過 程的流程圖。圖3是描繪用于檢索和排列音頻數(shù)據(jù)以供定位裝置輸出的具體示例性實(shí)現(xiàn)的過 程的流程圖。圖4是描繪用于更新語音包中的數(shù)據(jù)的具體示例性實(shí)現(xiàn)的過程的流程圖。圖5是描繪用于從多個(gè)可獲得短語中選擇短語以通過音頻輸出來輸出信息的具
4體示例性實(shí)現(xiàn)的過程的流程圖。
具體實(shí)施例方式對(duì)創(chuàng)建和修改導(dǎo)航語音數(shù)據(jù)的技術(shù)和處理進(jìn)行描述。在一些實(shí)施例中,提供包括 語言數(shù)據(jù)庫和多個(gè)音頻文件的語音包。語言數(shù)據(jù)庫指定用于意圖用于定位裝置的音頻輸出 的信息的合適的語法和詞匯。音頻文件包括可被定位裝置訪問以通過可聽輸出傳達(dá)信息的 單詞和/或短語。音頻文件可以是任何合適的格式,例如.漏、.碰a、. mp3、Ogg等等。一些實(shí)施例還利用語音包工具箱來構(gòu)造和/或定制語音包的一個(gè)部分或者多個(gè) 部分。工具箱可包括存在于定位裝置或其它計(jì)算裝置上的一個(gè)或多個(gè)軟件模塊和/或應(yīng) 用。工具箱還可包括測(cè)試模塊,開發(fā)者和/或終端用戶可使用該測(cè)試模塊來監(jiān)聽根據(jù)語音 包中的語法和/或詞匯信息而生成的音頻文件的各種組合。測(cè)試包使得開發(fā)者和/或終端 用戶能夠在受控環(huán)境下和在沒有實(shí)際的定位裝置的一些實(shí)施例(比如,測(cè)試包可存在于與 定位裝置分離的計(jì)算裝置上)中測(cè)試各種導(dǎo)航場(chǎng)景。在以下論述中,首先對(duì)可操作為利用這里所述的用于創(chuàng)建和修改導(dǎo)航語音詞匯和 語法的技術(shù)和處理的示例性環(huán)境進(jìn)行描述。然后對(duì)可用于示例性環(huán)境中以及在不脫離其精 神和范圍的情況下可用于其它環(huán)境中的示例性處理進(jìn)行描述。然后對(duì)語音包工具箱進(jìn)行論 述,其后為可用于實(shí)現(xiàn)這里所述的各種技術(shù)和處理的腳本的一個(gè)示例。最后,對(duì)指定用于從 多個(gè)可用的短語中選擇一個(gè)或多個(gè)短語的標(biāo)準(zhǔn)的示例性處理進(jìn)行描述,所述一個(gè)或多個(gè)短 語將用于輸出信息。雖然與定位環(huán)境相關(guān)地描述用于創(chuàng)建和修改導(dǎo)航語音數(shù)據(jù)的技術(shù)和處 理,但是應(yīng)該易于明白,這些技術(shù)可用于各種不同的環(huán)境。圖1示出可操作為執(zhí)行這里所述的處理和技術(shù)的示例性定位系統(tǒng)環(huán)境100。環(huán)境 100可包括任意數(shù)量的位置數(shù)據(jù)平臺(tái)和/或位置數(shù)據(jù)發(fā)送器,例如導(dǎo)航衛(wèi)星102。在圖1的 環(huán)境100下,導(dǎo)航衛(wèi)星102示為包括一個(gè)或多個(gè)分開的天線。每個(gè)天線發(fā)送可包括定位信 息和導(dǎo)航信號(hào)的各個(gè)信號(hào)。環(huán)境100還包括蜂窩提供商104和互聯(lián)網(wǎng)提供商106。蜂窩提供商104可為環(huán)境 100的各個(gè)方面提供蜂窩電話和/或數(shù)據(jù)檢索功能,互聯(lián)網(wǎng)提供商106可為環(huán)境100的各個(gè) 方面提供網(wǎng)絡(luò)連接和/或數(shù)據(jù)檢索功能。環(huán)境100還包括定位裝置108,例如任意類型的基于地面的、基于海上的和/或基 于空中的移動(dòng)裝置。在一些實(shí)施例中,定位裝置108包括個(gè)人導(dǎo)航裝置。定位裝置108可 實(shí)現(xiàn)各種類型的定位功能,為了以下論述的目的,這些定位功能可涉及各種不同的導(dǎo)航技 術(shù)和可通過“知道”一個(gè)或多個(gè)位置而被支持的其它技術(shù)。例如,定位功能可用于提供位置 信息、定時(shí)信息、速度信息、逐個(gè)轉(zhuǎn)彎開車指令和各種其它導(dǎo)航相關(guān)數(shù)據(jù)。因此,可以以各種 方式配置定位裝置108來執(zhí)行廣泛種類的功能。例如,定位裝置108可被配置為用于如所 示的車輛導(dǎo)航、空中導(dǎo)航(比如,用于飛機(jī)、直升飛機(jī))、海上導(dǎo)航、個(gè)人使用(比如,作為健 康相關(guān)設(shè)備的一部分)等等。定位裝置108可包括使用前述技術(shù)中的一種或多種來確定位 置的各種裝置。圖1的定位裝置108包括導(dǎo)航信號(hào)接收器110,其被配置為從一個(gè)或多個(gè)導(dǎo)航相關(guān) 裝置(比如,導(dǎo)航衛(wèi)星102)接收導(dǎo)航信號(hào)。導(dǎo)航信號(hào)接收器110可支持各種不同的導(dǎo)航相 關(guān)平臺(tái),例如,全球定位系統(tǒng)(GPS)、GL0NASS、Galileo等。雖然這里沒有明確地示出,但是定位裝置108可包括用于接收各種類型的信號(hào),例如導(dǎo)航信號(hào)的一個(gè)或多個(gè)天線。定位裝置108還包括網(wǎng)絡(luò)接口 112,其可使得該裝置能夠與一個(gè)或多個(gè)網(wǎng)絡(luò)(例 如網(wǎng)絡(luò)114)通信。網(wǎng)絡(luò)114可包括任何合適的網(wǎng)絡(luò),例如局域網(wǎng)、廣域網(wǎng)、互聯(lián)網(wǎng)、衛(wèi)星網(wǎng) 絡(luò)、蜂窩電話網(wǎng)絡(luò)等。在一個(gè)或多個(gè)實(shí)施例中,導(dǎo)航信號(hào)接收器110可從網(wǎng)絡(luò)112接收數(shù)據(jù) 和/或信號(hào)來確定位置(比如,輔助GPS或“AGPS”)。因此,在一個(gè)或多個(gè)實(shí)施例中,接收 器110可被配置為包括一個(gè)或多個(gè)網(wǎng)絡(luò)接口能力。定位裝置108還包括一個(gè)或多個(gè)輸入/輸出(I/O)裝置116(比如,觸摸屏、按鈕、 無線輸入裝置、數(shù)據(jù)輸入、屏幕等)。輸入/輸出裝置116包括一個(gè)或多個(gè)音頻I/O裝置118, 例如麥克風(fēng)、揚(yáng)聲器等。定位裝置108的各種裝置和模塊與處理器120和存儲(chǔ)器122通信 連接。處理器120不受形成它的材料或其中所使用的處理機(jī)制的限制。這樣,可通過半 導(dǎo)體和/或晶體管(比如,集成電路(IC)、可編程邏輯器件)等來實(shí)現(xiàn)處理器120。另外,雖 然顯示了單個(gè)存儲(chǔ)器122,但是可利用多種類型和組合的計(jì)算機(jī)可讀存儲(chǔ)器,例如隨機(jī)存取 存儲(chǔ)器(RAM)、硬盤存儲(chǔ)器、可拆卸介質(zhì)存儲(chǔ)器(比如,可通過容納可拆卸存儲(chǔ)器盒的槽來 實(shí)現(xiàn)存儲(chǔ)器122)和其它類型的計(jì)算機(jī)可讀介質(zhì)。雖然分開示出定位裝置108的部件,但是 應(yīng)該明白,在不脫離其精神和范圍的情況下,還可對(duì)這些部件進(jìn)一步進(jìn)行劃分和/或組合。定位裝置108被配置為接收由一個(gè)或多個(gè)位置數(shù)據(jù)平臺(tái)和/或位置數(shù)據(jù)發(fā)送器 (例如導(dǎo)航衛(wèi)星102)發(fā)送的信號(hào)和/或數(shù)據(jù)。這些信號(hào)被提供給處理器120以供定位模 塊124進(jìn)行處理,定位模塊124可存儲(chǔ)在存儲(chǔ)器122中,并可在處理器120上執(zhí)行。定位模 塊124代表確定地理位置的功能,例如通過對(duì)從各種平臺(tái)/發(fā)送器獲得的信號(hào)和/或數(shù)據(jù) 進(jìn)行處理來提供定位功能,例如確定位置、速度、時(shí)間等。信號(hào)和/或數(shù)據(jù)可包括位置相關(guān) 數(shù)據(jù)(例如測(cè)距信號(hào))、星歷表(印hemeride)、歷書(almanac)等。可執(zhí)行定位模塊124以使用存儲(chǔ)在存儲(chǔ)器122中的地圖數(shù)據(jù)126來生成導(dǎo)航指令 (比如,到達(dá)目的地的逐個(gè)轉(zhuǎn)彎指令)和在地圖上顯示當(dāng)前位置等。還可執(zhí)行定位模塊124 以提供其它定位功能,例如確定當(dāng)前速度、計(jì)算到達(dá)時(shí)間等。還可構(gòu)思多種其它示例。還存儲(chǔ)在存儲(chǔ)器122上的是輸入模式管理器128,其可使得定位裝置108能夠以各 種輸入模式(比如,觸摸輸入模式、自動(dòng)速度識(shí)別模式等)工作。存儲(chǔ)器122還存儲(chǔ)語音模塊130,其被構(gòu)造為對(duì)定位裝置108執(zhí)行各種速度和/ 或語音相關(guān)功能。裝置語音包132存儲(chǔ)在存儲(chǔ)器122內(nèi),包括語言數(shù)據(jù)庫134和音頻數(shù)據(jù) 136。在各種實(shí)施例中,語音包132與定位裝置108所利用的操作軟件是分離的。語言數(shù)據(jù) 庫134包括可被定位裝置108訪問以用于傳達(dá)可聽信息的語法數(shù)據(jù)和詞匯數(shù)據(jù)。語音數(shù)據(jù) 136為可被定位裝置108的各種部件訪問以提供音頻輸出功能的音頻文件貯存庫。存儲(chǔ)器122可選地可存儲(chǔ)語音包工具箱138,語音包工具箱138提供創(chuàng)建和/或定 制裝置語音包132的各個(gè)方面的功能。開發(fā)者、終端用戶或任何其它實(shí)體可利用語音包工 具箱138來添加、刪除和/或改變語音包的數(shù)據(jù)和/或配置。例如,用戶可將音頻文件添加 到將在通過定位裝置108的音頻輸出來輸出導(dǎo)航信息時(shí)使用的音頻數(shù)據(jù)136中。用戶可添 加在可從音頻數(shù)據(jù)136獲得的當(dāng)前分類的音頻文件中沒有表示的某種語言或方言的音頻 文件。用戶還可定制語言數(shù)據(jù)庫134當(dāng)前提供的特定語法和/或詞匯。語音包工具箱138 提供用于裝置語音包132內(nèi)容的接口,并使得各種不同的用戶能夠在不修改定位裝置108的操作軟件的情況下修改裝置語音包132內(nèi)容。用戶界面模塊140存儲(chǔ)在存儲(chǔ)器122上,并被配置為生成各種不同的圖形用戶界 面(GUI),例如被設(shè)計(jì)用于接收用戶與定位裝置108的物理交互的GUI、被設(shè)計(jì)為接收從裝 置用戶輸入的語音的⑶I等。定位裝置108的⑶I還可被配置為通過單個(gè)⑶I接收用戶輸 入模式的任何組合,例如與裝置的觸覺交互和對(duì)裝置的音頻輸入的組合。定位裝置108還可執(zhí)行蜂窩電話功能,例如通過與蜂窩提供商104所提供的蜂窩 網(wǎng)絡(luò)連接來執(zhí)行蜂窩電話功能。還可通過互聯(lián)網(wǎng)提供商106為定位裝置108提供網(wǎng)絡(luò)連接 (比如,互聯(lián)網(wǎng)接入)。通過使用互聯(lián)網(wǎng)提供商106和/或蜂窩提供商104,定位裝置108可 檢索地圖、開車方向、系統(tǒng)更新、語音包132、語音包工具箱138等。定位系統(tǒng)環(huán)境100還包括計(jì)算裝置142。雖然這里將計(jì)算裝置142示為臺(tái)式計(jì)算 機(jī),但是這并不意欲構(gòu)成限制,可利用任何合適的計(jì)算裝置,例如膝上型電腦、數(shù)字媒體播 放器、PDA等。計(jì)算裝置142包括一個(gè)或多個(gè)處理器144和計(jì)算機(jī)可讀介質(zhì)146。與定位 裝置108的存儲(chǔ)器122 —樣,計(jì)算機(jī)可讀介質(zhì)146可包括多種類型和組合的計(jì)算機(jī)可讀存 儲(chǔ)器。存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)146上的是各種模塊,包括遠(yuǎn)程語音包148和語音包工具箱 150。包括在遠(yuǎn)程語音包148中的是語言數(shù)據(jù)庫152和音頻數(shù)據(jù)154。遠(yuǎn)程語音包148和語 音包工具箱150可包括與對(duì)裝置語音包132和語音包工具箱138描述的數(shù)據(jù)和功能類似的 或相同的數(shù)據(jù)和功能。使用遠(yuǎn)程語音包148和語音包工具箱150使得能夠在遠(yuǎn)離定位裝置 的裝置上構(gòu)造和/或定制語音包,然后將語音包加載到定位裝置上。如所示,計(jì)算裝置142 可直接與定位裝置108通信或者通過網(wǎng)絡(luò)114與定位裝置108通信。雖然這里沒有明確地 示出,但是語音包工具箱可被實(shí)現(xiàn)為可被用于創(chuàng)建和/或配置語音包和將語音包下載到定 位裝置的web應(yīng)用。通常,可使用軟件、固件、硬件(比如,固定邏輯電路)、人工處理或這些實(shí)現(xiàn)的組 合來實(shí)現(xiàn)這里所述的任意功能。這里所使用的術(shù)語“模塊”和“功能”通常表示軟件、固件、 硬件或者其組合。例如,在軟件實(shí)現(xiàn)的情況下,模塊表示當(dāng)在處理器(例如圖1的定位裝置 108的處理器120)上被執(zhí)行時(shí)執(zhí)行指定任務(wù)的可執(zhí)行指令。程序代碼可存儲(chǔ)在一個(gè)或多個(gè) 計(jì)算機(jī)可讀介質(zhì)上,計(jì)算機(jī)可讀介質(zhì)的示例為圖ι的定位裝置108的存儲(chǔ)器122。這里所述 的用于創(chuàng)建和修改導(dǎo)航語音詞匯和語法的技術(shù)和處理是不依賴于平臺(tái)的,這表示這些技術(shù) 可在具有各種處理器的各種商業(yè)計(jì)算平臺(tái)上實(shí)現(xiàn)。示例性過程以下論述描述可利用前述系統(tǒng)和裝置實(shí)現(xiàn)的用于創(chuàng)建和修改導(dǎo)航語音數(shù)據(jù)的技 術(shù)和處理。可用硬件、固件、軟件或者其組合來實(shí)現(xiàn)每個(gè)過程的方面。這些過程被顯示為指 定由一個(gè)或多個(gè)裝置執(zhí)行的操作的塊的集合,但是不必限于各個(gè)塊所顯示的執(zhí)行操作的順 序。在以下論述的部分中,將參照?qǐng)D1的環(huán)境100和/或其它示例性實(shí)施例。圖2示出處理200,處理200為向定位裝置提供語法信息、詞匯信息和語音數(shù)據(jù)的 處理的一個(gè)示例。提供用于生成和/或配置語音包的各個(gè)方面的語音包工具箱(塊202)。 生成包括語言語法信息和詞匯信息的語言數(shù)據(jù)庫(塊204)。在一些實(shí)施例中,語法信息包 括指定用于按特定語言排列單詞以構(gòu)成該語言的短語和/或句子的規(guī)則的數(shù)據(jù)。例如,應(yīng) 用于英語的特定語法規(guī)則可指定能夠如何排列英文單詞來傳達(dá)信息。英語僅用于示例性目 的,其它實(shí)施例可利用任何合適的語言和/或方言,而不脫離要求保護(hù)的實(shí)施例的精神和言、多種語言和/或方言的特定單詞和/或短語。語言數(shù)據(jù)庫所提供的語言和語法可與可通過定位裝置108可聽地輸出的多個(gè)完 整話語(utterance)對(duì)應(yīng)。這里所使用的“話語”是指任意短語或者單詞和/或數(shù)字的其 它組合。在一些實(shí)施例中,語言數(shù)據(jù)庫可表示多種表達(dá)(expression)和與每種表達(dá)對(duì)應(yīng) 的一種或多種話語。這里所使用的“表達(dá)”是指期望傳達(dá)給用戶的概念。所述表達(dá)可與可 基于用戶的當(dāng)前位置、用戶的行進(jìn)路徑或起始路徑或者導(dǎo)航裝置基于當(dāng)前位置和其它導(dǎo)航 信息、當(dāng)前位置和其它導(dǎo)航信息的組合等生成的路線而傳達(dá)給用戶的多個(gè)導(dǎo)航相關(guān)表達(dá)對(duì) 應(yīng)。然而,所述表達(dá)可與可以可聽地傳達(dá)給用戶的任意信息對(duì)應(yīng)。例如,一種導(dǎo)航相關(guān)表達(dá)為用戶應(yīng)該在 < 距離(distance)〉右轉(zhuǎn)。語言數(shù)據(jù)庫可 指定用于與此單一表達(dá)對(duì)應(yīng)的多個(gè)話語的語法和詞匯。例如"Turn right in<distance>,,"Turn right, <distance>,,"In<distance>, turn right,,"<distance>, turn right"因此,通過訪問語言數(shù)據(jù)庫,定位裝置108可識(shí)別用于話語和/或相應(yīng)表達(dá)的語法 和詞匯。如在這里更詳細(xì)論述地那樣,可易于在不影響定位裝置108上駐留的操作系統(tǒng)或 其它系統(tǒng)指令的情況下對(duì)語言數(shù)據(jù)庫和所提供的語法和/或詞匯進(jìn)行修改以提供任意期 望的具有任何語法和詞匯的話語。構(gòu)造包括各種音頻數(shù)據(jù)文件的音頻數(shù)據(jù)倉庫(塊206)。如上所述,可以以任何 合適的格式存儲(chǔ)音頻數(shù)據(jù)文件,音頻數(shù)據(jù)文件可包括各種不同語言和方言的單詞和/或短 語。在一些實(shí)施例中,將語言數(shù)據(jù)庫和音頻數(shù)據(jù)倉庫組裝到可下載或者另外輸出到一個(gè)或 多個(gè)裝置的語音包中。將語言數(shù)據(jù)庫和音頻數(shù)據(jù)倉庫加載到裝置上(塊208)。另外或者 可替換地,可將語言數(shù)據(jù)庫和/或音頻數(shù)據(jù)倉庫加載到或者另外存儲(chǔ)在裝置(例如計(jì)算裝 置142)可訪問的遠(yuǎn)程資源上。通常在遠(yuǎn)離定位裝置的裝置(比如,計(jì)算裝置142)上全部 或者部分實(shí)現(xiàn)處理200。可替換地和/或另外,語音包工具箱可駐留在定位裝置上以用于配 置語音包的一個(gè)或多個(gè)方面。圖3示出處理300,處理300為用于提供導(dǎo)航相關(guān)信息的可聽輸出的處理的一個(gè)示 例。確定將通過定位裝置的音頻輸出來輸出的信息(塊302)。在一個(gè)示例中,定位裝置用 戶請(qǐng)求從第一位置到第二位置的行進(jìn)方向(比如,逐個(gè)轉(zhuǎn)彎開車指令)。在這個(gè)示例中,定 位裝置可確定,為了從第一位置到達(dá)第二位置,應(yīng)該指示用戶在主街道上向西行進(jìn)2英里。 定位裝置識(shí)別用于信息的合適的語法和/或詞匯(塊304)。繼續(xù)當(dāng)前示例,定位裝置可訪 問語言數(shù)據(jù)庫,并根據(jù)該數(shù)據(jù)庫確定向用戶傳達(dá)信息的正確的語法和/或詞匯,所述信息 表示為了到達(dá)第二位置,用戶應(yīng)該在主街道上向西行進(jìn)2英里。檢索與所識(shí)別的用于信息的詞匯對(duì)應(yīng)的一個(gè)或多個(gè)音頻文件(塊306)。在當(dāng)前 示例中,詞匯可包括例如“travel,,、“drive for”、“two”、“Main”、“street”等單詞和/或 短語。因此,檢索與這些單詞和/或短語對(duì)應(yīng)的音頻文件(比如,從音頻數(shù)據(jù)倉庫,例如 音頻數(shù)據(jù)136)。在一些實(shí)施例中,可獲得多個(gè)不同的音頻文件,這些音頻文件每個(gè)均與 所述詞匯中的單個(gè)單詞對(duì)應(yīng)。例如,信息“travel”可與幾個(gè)不同的音頻文件相關(guān),例如 “drive”、“walk”、“ride”,并且還可具有可用于每個(gè)單詞的各種不同的重音和/或語音變
8形(inflection)。因此,當(dāng)對(duì)詞匯中的單個(gè)單詞請(qǐng)求音頻文件時(shí),可獲得滿足該請(qǐng)求的各 種不同的音頻文件。根據(jù)所識(shí)別的合適的語法排列音頻數(shù)據(jù)文件(塊308)。在當(dāng)前示例 中,排列音頻文件以形成例如“drive for two miles west on Main Street”或者“travel west on Main Street for two miles”等短語。使得排列的音頻文件可供定位裝置輸出 (塊310)。例如,可將每個(gè)與行進(jìn)指令序列中的離散行進(jìn)指令對(duì)應(yīng)的一個(gè)或多個(gè)句子和/ 或短語存儲(chǔ)在緩沖器中,并且當(dāng)與這些句子和/或短語對(duì)應(yīng)的行進(jìn)指令與用戶的當(dāng)前位置 相關(guān)時(shí),可將這些句子和/或短語(單獨(dú)或成組)提供給音頻輸出裝置。在當(dāng)前示例中,當(dāng) 用戶正靠近用戶應(yīng)該向右轉(zhuǎn)的街道時(shí),可將例如“turn right in lOOmeters”的指令存儲(chǔ) 在緩沖器中,并提供給音頻輸出裝置。定位裝置輸出排列的音頻文件(塊312)。圖4示出處理400,處理400為用于更新語音包的一個(gè)或多個(gè)方面(比如,語言數(shù) 據(jù)庫、音頻數(shù)據(jù)倉庫等)的處理的一個(gè)示例。該處理檢查一個(gè)或多個(gè)更新是否可用于語音 包(塊402)。如果確定一個(gè)或多個(gè)更新可用于語音包(塊404),則將所述一個(gè)或多個(gè)更新 加載到定位裝置上的語音包上(塊406)。如果確定當(dāng)前沒有更新可用于語音包(塊404), 則所述處理返回到塊402。可由軟件和/或硬件開發(fā)者創(chuàng)建用于語音包的更新,還可由終 端用戶創(chuàng)建用于語音包的更新。更新可包括更新的語法和/或詞匯信息,還可包括新的和 /或編輯的音頻文件??赏ㄟ^語音包工具箱來實(shí)現(xiàn)處理400中的一種或多種操作。語音包工具箱如上所述,一些實(shí)施例可利用語音包工具箱來構(gòu)造和/或定制語音包的一部分或 者多個(gè)部分。在一些示例性實(shí)現(xiàn)中,語音包工具箱可包括用于在不影響定位裝置所使用的 操作軟件變化的情況下創(chuàng)建和/或定制語音包的一個(gè)或多個(gè)部分的腳本語言,和/或可利 用該腳本語言。例如,工具箱可對(duì)用該腳本語言編寫的腳本進(jìn)行處理以形成語音包的至少 一部分(比如,語言數(shù)據(jù)庫)。腳本語言和相關(guān)腳本可與語音包分離和/或構(gòu)成語音包的一 部分??稍谌我鈺r(shí)間利用工具箱、其它軟件或者人工方法動(dòng)態(tài)地更新語音包、數(shù)據(jù)庫和/或 相關(guān)音頻數(shù)據(jù)。語音包工具箱還可包括用于處理腳本和建造語音包(包括數(shù)據(jù)庫和相關(guān)音頻數(shù) 據(jù))的命令行工具。還可并入測(cè)試套件以用于在不需要定位裝置的情況下測(cè)試音頻數(shù)據(jù)所 表示的短語。這可使得開發(fā)者或其他用戶可聽到他們所使用的音頻文件的各種組合。在至 少一個(gè)實(shí)施例中,命令行工具可將每個(gè)短語的音頻文件連接到一個(gè)音頻文件中。另外或者 可替換地,⑶I應(yīng)用程序可組裝音頻文件,并為一個(gè)或多個(gè)短語播放它們。示例性腳本以下是在一個(gè)或多個(gè)實(shí)施例中可用于定義用于各種話語的語法和詞匯的腳本的 一個(gè)示例?!磂xpression = VPM_IN_DST_B0ARD_FERRY>〈utterance entry pet = 90> in{distl}board ferry</entry>〈utterance entry pet = 10> board the ferry in{dist2}</entry></expression)〈expression = VPM_TURN_RIGHT_IN_DST>〈utterance entry pet = 60> rurn right in{distl}</entry>〈utterance entry pet = 20> in{distl}turn right</entry>
9
<utteranee entry pet = 10> turn right{distl}</entry>〈utterance entry pet = 10> {distl}turn right</entry></expression)〈expression = VPM_DRIVE_DST_THEN_ENTER_ROUNDABOUT>〈utterance entry>drive{distl}then enter roundabout</entry></expression)〈distance = distl〉〈units = feet><nmbr = 100><entry>one hundred feet</entry></nmbr><nmbr = 200><entry pet = 75>two hundred feet</entry><entry pet = 25>two_hundred feet2</entry></nmbr>similar for rest of numbers</units><units = yards)same as above</units><units = miles>same as above</units><units = meters)same as abave</units><units = kilometers)same as above</units>〈/distance〉〈distance = dist2>same as above〈/distance〉在以上部分中列出的各個(gè)單詞(例如第一條目中的“in”、“b0ard”和“ferry”)是
(任何合適的文件格式的)音頻文件的文件名,〈expression〉是用于定位裝置108識(shí)別的 表達(dá)的標(biāo)簽,以及〈utterance entry〉是用于話語的標(biāo)簽。提供以上腳本僅僅是作為示例, 本發(fā)明的實(shí)施例可利用可替換的腳本和數(shù)據(jù)庫——比如,不將話語與表達(dá)相關(guān)聯(lián)的非層次 結(jié)構(gòu)腳本和數(shù)據(jù)庫。 在一些實(shí)施例中,語音包工具箱可讀取腳本的內(nèi)容和創(chuàng)建語言數(shù)據(jù)庫(例如表格、列表、.vpm文件等),該語言數(shù)據(jù)庫指定對(duì)于任何特定的事件應(yīng)該播放哪些音頻文件和 應(yīng)該播放這些音頻文件的順序。可使用有線或無線連接(包括通過例如互聯(lián)網(wǎng)的網(wǎng)絡(luò)連 接)將語言數(shù)據(jù)庫和相關(guān)的音頻數(shù)據(jù)(例如音頻文件)傳送到定位裝置以供使用。然而, 在一些實(shí)施例中,語音包工具箱和語音包可存在于定位裝置上,以使用戶可改變語音語法 和其它語音包數(shù)據(jù),而無需訪問外部的或分離的計(jì)算裝置。當(dāng)定位裝置所執(zhí)行的操作軟件 需要播放可聽指令或其它話語(比如,短語)時(shí),它訪問語音包以識(shí)別應(yīng)該使用哪些音頻文 件和應(yīng)該播放這些音頻文件的順序。然后可按指定的順序向用戶播放識(shí)別的音頻文件。對(duì)于每個(gè)短語,不同的各個(gè)音頻文件集合可被指定和給予與它們相對(duì)于彼此應(yīng)該 播放的次數(shù)相關(guān)的使用百分比。例如,對(duì)于以上的Board Ferry指令,90%的時(shí)間將播放 第一集合,但是10%的時(shí)間將播放第二集合。對(duì)于定制語音,這允許語音改變所說的內(nèi)容。 這通過使得用戶僅在10%的時(shí)間聽到短語(例如著名演員所說的“I pity the fool who doesn’ t board the ferry”)來防止這些短語變得陳舊。在一些實(shí)施例中,代替上述基于 百分比的功能或者除了上述基于百分比的功能之外,定位裝置還可生成隨機(jī)數(shù)或偽隨機(jī)數(shù) 來選擇用于播放的特定音頻文件。對(duì)于每個(gè)短語,可使用用于距離的占位符({distl},{dist2})。由于用于距離的 單詞可取決于短語中的其它單詞或者使用它的位置(比如,變形的變化),所以這使得數(shù)據(jù) 庫可指定正確的單詞用于每個(gè)短語中的距離。另外或者可替換地,對(duì)于每個(gè)短語,可使用用于可變內(nèi)容的占位符({distl}, {dist2},{ordl})。由于用于這個(gè)可變內(nèi)容的單詞可取決于短語中的其它單詞或者使用它 的位置(比如,變形的變化),所以這使得數(shù)據(jù)庫可指定正確的單詞用于每個(gè)短語中的該可 變內(nèi)容。為了提供使用音頻文件的更多的創(chuàng)造性,語音包和對(duì)應(yīng)的語音數(shù)據(jù)可包括隨機(jī)短 語和非導(dǎo)航短語。這些短語的使用可基于定位裝置的特定實(shí)現(xiàn)或配置而改變。例如,在路線 行程長(zhǎng)時(shí),可講隨機(jī)短語。這些隨機(jī)短語可以是笑話、俏皮話等。"You're doing great ! ” nJc^"" {snoring} Huh ? What ? Sorry, must have dozed off, hopefully I didn' t miss our turn"ο圖5示出處理500,處理500為用于從多個(gè)可獲得短語中選擇短語以通過語音輸出 來輸出信息的處理的一個(gè)示例。確定將被可聽地輸出(比如,通過定位裝置)的信息(塊 502)。構(gòu)造多個(gè)不同的短語,每個(gè)短語可操作為輸出確定的信息(塊504)。例如,如果信 息包括駕駛者應(yīng)該在1千米處在第一街道向左轉(zhuǎn)的事實(shí),則可構(gòu)造幾個(gè)不同的短語來傳遞 這個(gè)信息° 一個(gè)短語可以是"travel 1 kilometer and turn left at First Street,,,而 ^ —^h^a nT UMi " turn left at First Street after traveling lkilometer,,,
個(gè)fei吾可以是"you should continue traveling for one kilometer and then make a left turn onto First Street,,??扇菀酌靼?,可構(gòu)造多種不同的話語(比如,短語)來傳 遞一種或多種表達(dá),并且可偽隨機(jī)地選擇用于可聽播放的話語。然后指定用于選擇多個(gè)不同短語(比如,話語)中的一個(gè)或多個(gè)以傳遞信息的標(biāo) 準(zhǔn)(塊506)。例如,如上所述,可為每個(gè)短語分配一個(gè)百分比值,或者可基于隨機(jī)或者偽隨 機(jī)生成的數(shù)來選擇短語。在當(dāng)前示例中,可為第一短語提供25%的時(shí)間,為第二短語提供 25%的時(shí)間,為第三短語提供50%的時(shí)間。至少部分基于指定標(biāo)準(zhǔn)來選擇多個(gè)短語中的一
11個(gè)或多個(gè)(塊508)。可聽地輸出所選擇的短語(比如,通過定位裝置)(塊510)。
雖然用結(jié)構(gòu)特征和/或方法行為特定的語言描述了本發(fā)明,但是應(yīng)該理解,所附 權(quán)利要求中所限定的本發(fā)明不必限于所述的特定特征或者行為。相反,作為實(shí)現(xiàn)要求保護(hù) 的發(fā)明的示例性形式公開特定的特征和行為。
權(quán)利要求
一種定位裝置,包括導(dǎo)航信號(hào)接收器,可操作為確定所述裝置的當(dāng)前地理位置;處理器,與所述導(dǎo)航信號(hào)接收器連接;音頻輸出裝置,與所述處理器連接;計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),可操作為被所述處理器訪問;語音包,被存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上,所述語音包包括語言數(shù)據(jù)庫,用于提供用于多個(gè)完整話語的語法和詞匯;和音頻數(shù)據(jù)倉庫,包括與所述語言數(shù)據(jù)庫提供的詞匯對(duì)應(yīng)的一個(gè)或多個(gè)音頻文件;和計(jì)算機(jī)可執(zhí)行操作軟件,與所述語音包分離,被存儲(chǔ)在所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上,并可被所述處理器執(zhí)行以在所述語言數(shù)據(jù)庫中識(shí)別用于所述完整話語中的至少一個(gè)的語法和詞匯;從音頻數(shù)據(jù)倉庫檢索所述音頻文件中與識(shí)別的詞匯對(duì)應(yīng)的一個(gè)或多個(gè)音頻文件;使用識(shí)別的語法和檢索的一個(gè)或多個(gè)音頻文件來構(gòu)造短語;和通過音頻輸出來輸出構(gòu)造的短語。
2.根據(jù)權(quán)利要求1所述的裝置,還包括網(wǎng)絡(luò)接口,所述網(wǎng)絡(luò)接口可操作為被所述處理 器用于從外部裝置下載語音包。
3.根據(jù)權(quán)利要求2所述的裝置,其中,所述操作軟件可被處理器執(zhí)行以確定一個(gè)或多 個(gè)更新是否可用于語音包以及在不改變操作軟件的情況下通過網(wǎng)絡(luò)接口更新所述語音包 的至少一部分。
4.根據(jù)權(quán)利要求1所述的裝置,其中,所述操作軟件可被處理器執(zhí)行以 基于所述裝置的當(dāng)前地理位置來選擇話語;和在語言數(shù)據(jù)庫中識(shí)別用于所選擇的話語的語法和詞匯。
5.根據(jù)權(quán)利要求4所述的裝置,其中,所述操作軟件可被處理器執(zhí)行以 基于所述裝置的當(dāng)前地理位置來生成導(dǎo)航路線;基于生成的導(dǎo)航路線來選擇一個(gè)或多個(gè)話語;和在語言數(shù)據(jù)庫中識(shí)別用于所選擇的一個(gè)或多個(gè)話語的語法和詞匯。
6.根據(jù)權(quán)利要求1所述的裝置,其中,可動(dòng)態(tài)地配置語言數(shù)據(jù)庫以包括用于多種語言 的語法信息和詞匯信息。
7.根據(jù)權(quán)利要求1所述的裝置,其中,所述語言數(shù)據(jù)庫包括用于單一表達(dá)的多個(gè)完整 話語,所述操作軟件可被處理器執(zhí)行以偽隨機(jī)地選擇用于單一表達(dá)的所述多個(gè)完整話語中 的一個(gè)話語。
8.根據(jù)權(quán)利要求7所述的裝置,其中,所述語言數(shù)據(jù)庫為與單一表達(dá)對(duì)應(yīng)的所述話語 中的每個(gè)話語指定使用百分比,并至少部分基于指定的使用百分比偽隨機(jī)地選擇話語。
9.一種定位裝置,包括導(dǎo)航信號(hào)接收器,可操作為確定所述裝置的當(dāng)前地理位置; 處理器,與所述導(dǎo)航信號(hào)接收器連接; 音頻輸出裝置,與所述處理器連接; 計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),可操作為被所述處理器訪問;和計(jì)算機(jī)可執(zhí)行指令,被存儲(chǔ)在所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上,并可被所述處理器執(zhí)行以識(shí)別與單一表達(dá)對(duì)應(yīng)的多個(gè)話語; 偽隨機(jī)地選擇識(shí)別的話語中的一個(gè)話語;和 通過音頻輸出來輸出選擇的話語的表示。
10.根據(jù)權(quán)利要求9所述的裝置,其中,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)包括表示多個(gè)單一表 達(dá)和多個(gè)相關(guān)話語的語言數(shù)據(jù)庫,并且所述語言數(shù)據(jù)庫被訪問以識(shí)別與所述單一表達(dá)中的 任何一個(gè)對(duì)應(yīng)的話語。
11.根據(jù)權(quán)利要求9所述的裝置,其中,所述語言數(shù)據(jù)庫為與單一表達(dá)對(duì)應(yīng)的每個(gè)話語 指定使用百分比,并且至少部分基于指定的使用百分比來偽隨機(jī)地選擇話語。
12.根據(jù)權(quán)利要求9所述的裝置,其中,所述計(jì)算機(jī)可讀指令包括隨機(jī)化函數(shù),并且使 用該隨機(jī)化函數(shù)來偽隨機(jī)地選擇話語。
13.根據(jù)權(quán)利要求9所述的裝置,其中,所述計(jì)算機(jī)可讀指令可被所述處理器執(zhí)行以基 于所述裝置的當(dāng)前地理位置來識(shí)別所述單一表達(dá)。
14.根據(jù)權(quán)利要求13所述的裝置,其中,所述計(jì)算機(jī)可讀指令可被處理器執(zhí)行以 基于所述裝置的當(dāng)前地理位置來生成導(dǎo)航路線;和基于所述裝置的當(dāng)前地理位置和生成的導(dǎo)航路線來識(shí)別所述單一表達(dá)。
15.一種選擇供定位裝置輸出的話語的方法,該方法包括在駐留于所述定位裝置上的語言數(shù)據(jù)庫中識(shí)別與單一表達(dá)對(duì)應(yīng)的多個(gè)話語; 偽隨機(jī)地選擇識(shí)別的話語中的一個(gè)話語;和通過與所述定位裝置相關(guān)的音頻輸出可聽地輸出選擇的話語的表示。
16.根據(jù)權(quán)利要求15所述的方法,其中,所述語言數(shù)據(jù)庫為與單一表達(dá)對(duì)應(yīng)的所述話 語中的每個(gè)話語指定使用百分比,并至少部分基于指定的使用百分比來偽隨機(jī)地選擇話語。
17.根據(jù)權(quán)利要求15所述的方法,其中,使用隨機(jī)化函數(shù)來偽隨機(jī)地選擇話語。
18.根據(jù)權(quán)利要求15所述的方法,還包括基于所述定位裝置的當(dāng)前地理位置來識(shí)別單一表達(dá)。
19.根據(jù)權(quán)利要求18所述的方法,還包括生成導(dǎo)航路線以及基于所述裝置的當(dāng)前地理 位置和生成的導(dǎo)航路線來識(shí)別單一表達(dá)。
全文摘要
描述了用于能夠靈活地、動(dòng)態(tài)地創(chuàng)建和/或修改用于定位裝置的語音數(shù)據(jù)的技術(shù)。在一些實(shí)施例中,提供包括語言數(shù)據(jù)庫和多個(gè)音頻文件的語音包。語言數(shù)據(jù)庫指定意圖用于定位裝置的音頻輸出的信息的合適的語法和詞匯。音頻文件包括可被定位裝置訪問以通過可聽輸出傳達(dá)信息的單詞和/或短語。一些實(shí)施例利用語音包工具箱來構(gòu)造和/或定制語音包的一個(gè)部分或者多個(gè)部分。
文檔編號(hào)G08G1/137GK101911145SQ200880122722
公開日2010年12月8日 申請(qǐng)日期2008年12月19日 優(yōu)先權(quán)日2007年12月28日
發(fā)明者D·W·威斯庫爾, J·W·凱爾, M·P·拉塞爾, S·D·海莫施密特, S·J·布倫克 申請(qǐng)人:佳明有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
南川市| 柏乡县| 隆尧县| 通江县| 岑溪市| 进贤县| 呼图壁县| 报价| 旌德县| 汉川市| 安乡县| 龙海市| 甘南县| 正安县| 金堂县| 吉林省| 寿光市| 宁安市| 汾西县| 新乡市| 贵定县| 合川市| 宁河县| 吕梁市| 万盛区| 凤庆县| 江陵县| 秀山| 靖西县| 德化县| 开鲁县| 郴州市| 凤冈县| 花莲市| 穆棱市| 石渠县| 和政县| 章丘市| 晋江市| 峨山| 台湾省|