用于文本源的音頻渲染順序的制作方法
【技術領域】
[0001]本發(fā)明涉及將文本源轉換為音頻,更具體地,涉及使用讀取順序播放文本到音頻輸出。
【發(fā)明內容】
[0002]根據(jù)本發(fā)明的一個方面,一種方法包括:將文本內容加載到至少一個用戶裝置中;將至少一個讀取順序應用于文本內容的至少一個文本部分以改變呈現(xiàn)順序;基于呈現(xiàn)順序,將至少一個文本部分轉換為音頻輸出;以及在至少一個用戶裝置上使用呈現(xiàn)順序播放音頻輸出。
[0003]根據(jù)本發(fā)明的另一個方面,一種計算機系統(tǒng)包括:一個或多個處理器、一個或多個計算機可讀存儲器以及一個或多個計算機可讀的有形存儲裝置;加載模塊,其操作性地耦合到一個或多個存儲裝置中的至少一個以用于由一個或多個處理器中的至少一個通過一個或多個存儲器中的至少一個執(zhí)行,并被配置為將文本內容加載到至少一個用戶裝置中;讀取順序模塊,其操作性地耦合到一個或多個存儲裝置中的至少一個以用于由一個或多個處理器中的至少一個通過一個或多個存儲器中的至少一個執(zhí)行,并被配置為將至少一個讀取順序應用于文本內容的至少一個文本部分以改變呈現(xiàn)順序;轉換模塊,其操作性地耦合到一個或多個存儲裝置中的至少一個以用于由一個或多個處理器中的至少一個通過一個或多個存儲器中的至少一個執(zhí)行,并被配置為基于呈現(xiàn)順序而將所述至少一個文本部分轉換為音頻輸出;以及音頻輸出模塊,其操作性地耦合到一個或多個存儲裝置中的至少一個以用于由一個或多個處理器中的至少一個通過一個或多個存儲器中的至少一個執(zhí)行,并被配置為在至少一個用戶裝置上使用呈現(xiàn)順序播放音頻輸出。
[0004]根據(jù)本發(fā)明的再一個方面,一種計算機程序產品包括:一個或多個計算機可讀的有形存儲介質;存儲在一個或多個存儲介質的至少一個上的將文本內容加載到至少一個用戶裝置中的程序指令;存儲在一個或多個存儲介質的至少一個上的將至少一個讀取順序應用于文本內容的至少一個文本部分以改變呈現(xiàn)順序的程序指令;存儲在一個或多個存儲介質的至少一個上的基于呈現(xiàn)順序而將至少一個文本部分轉換為音頻輸出的程序指令;以及存儲在一個或多個存儲介質的至少一個上的在至少一個用戶裝置上使用呈現(xiàn)順序播放音頻輸出的程序指令。
【附圖說明】
[0005]圖1示出根據(jù)本發(fā)明的實施例的流程圖;
[0006]圖2示出根據(jù)本發(fā)明的實施例的示例性實現(xiàn);
[0007]圖3示出根據(jù)本發(fā)明的實施例的硬件配置。
【具體實施方式】
[0008]在詳細解釋本發(fā)明的至少一個實施例之前,應當理解,本發(fā)明并不在其應用上受限于在以下的描述中說明的或在附圖中示出的結構的細節(jié)和組件的布置。本發(fā)明適用于其它實施例或者能夠以多種方式實踐或實行。此外,應當理解,在此使用的措辭和術語是為了描述的目的,而不應當被認為是限定。本領域技術人員將認識到,本發(fā)明的這些方面可以實現(xiàn)為系統(tǒng)、方法或計算機程序產品。
[0009]現(xiàn)在參考圖1,本發(fā)明的實施例通過利用包含用于讀取網頁的頁面元素的順序的指令(例如,從自頂部開始往下至少1/5并且從側邊越過1/4的最大框開始,最后讀取在右側框中的任何彈出窗口或廣告)的讀取順序文件并將其與音頻指示器鏈接以向用戶傳遞頁面類型和頁面上的特定元素來優(yōu)化網頁上內容的音頻化。用于產生音頻順序渲染的過程開始于將網頁文本內容加載到用戶裝置上(10)。然后,從包含用戶偏好的讀取順序文件集合中選擇讀取順序文件(20)。該偏好可包括關鍵字分析、網頁元數(shù)據(jù)或者諸如網頁標簽或URL域的其它加權因素。軟件模塊的一個示例可以使用如下的選擇方法:
[0010]基于網頁標簽的選擇:
[0011]如果網頁類型=新聞,則選擇類型=新聞的讀取順序文件;
[0012]如果網頁類型=體育,則選擇類型=體育的讀取順序文件;
[0013]如果網頁類型=天氣,則選擇類型=天氣的讀取順序文件。
[0014]基于網頁URL的選擇:
[0015]如果網頁基礎URL =.CNN,則選擇用于在線新聞的讀取順序文件;
[0016]如果網頁基礎URL = Google,則選擇用于google搜索的讀取順序文件;
[0017]如果網頁基礎URL = Gov,則選擇用于政府網站的讀取順序文件。
[0018]用于讀取順序文件的其它選擇方法可包括:
[0019]基于大小選擇網頁元素,其中,對于網頁上的每個框,確定每個框的大小,例如,平方英寸或者像素數(shù)量的計數(shù)或者顯示器的百分比。對于每個網頁框,將框的大小放入列表中。基于在讀取順序文件中規(guī)定的大小順序,創(chuàng)建網頁框的排序列表。
[0020]基于讀取順序文件中的位置坐標選擇網頁元素。對于在讀取順序文件中規(guī)定的每個位置坐標,識別網頁框的順序并將該框放入排序列表的正確位置。
[0021]通過在網頁上應用加權因素來選擇網頁元素。對于網頁文本的每個框,應用在讀取順序文件中定義的用于框的加權因素,并基于這些加權因素創(chuàng)建框的排序列表。
[0022]仍然參考圖1,過程通過創(chuàng)建用戶的音頻指示器定制文件并將其與讀取順序文件鏈接(30)來繼續(xù)。指示器定制文件可以包括但不限于:用于新聞類型的頁面的兩次蜂鳴聲、用于來自.GOV域的頁面的火車鳴笛、用于表格元素的低音或用于段落文本的瀑布聲。在替換的實施例中,指示器定制文件可以使用自然的音頻聲音輸出以用于識別文本段落。然后,該過程使用所選擇的讀取順序文件和所鏈接的音頻指示器定制文件以將所加載的文本內容的文本部分轉換成音頻文件(40)。該過程以在用戶裝置上播放音頻文件而結束
(50)。
[0023]參考圖2,示出了根據(jù)本發(fā)明的實施例的示例性實現(xiàn)。用戶裝置200顯示所加載的網頁210。一旦網頁210被加載,讀取順序文件220就被加載到渲染順序解釋器230中。網頁210數(shù)據(jù)被加載到渲染順序解釋器230和文本到語音組件240兩者中。用戶的音頻指示器定制文件235也被送入文本到語音組件240中。如參考圖1的過程所描述的,文本到語音組件240取出網頁210數(shù)據(jù),并響應于讀取順序文件220和用戶的音頻指示器定制文件235而對文本數(shù)據(jù)重新排序。一旦文本數(shù)據(jù)被重新排序,文本到語音組件240就將文本轉換為語音以供用戶250收聽。用戶裝置200可以包括用于播放音頻輸出的揚聲器或者具有用于通過個人耳機播放音頻的耳機插口。
[0024]所屬技術領域的技術人員知道,本發(fā)明的各個方面可以實現(xiàn)為系統(tǒng)、方法或計算機程序產品。因此,本發(fā)明的各個方面可以具體實現(xiàn)為以下形式,即:完全的硬件實施方式、完全的軟件實施方式(包括固件、駐留軟件、微代碼等),或硬件和軟件方面結合的實施方式,這里可以統(tǒng)稱為“電路”、“模塊”或“系統(tǒng)”。此外,在一些實施例中,本發(fā)明的各個方面還可以實現(xiàn)為在一個或多個計算機可讀介質中的計算機程序產品的形式,該計算機可讀介質中包含計算機可讀的程序代碼。
[0025]可以采用一個或多個計算機可讀介質的任意組合。計算機可讀介質可以是計算機可讀信號介質或者計算機可讀存儲介質。計算機可讀存儲介質例如可以是一一但不限于一一電、磁、光、電磁、紅外線、或半導體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算機可讀存儲介質的更具體的例子(非窮舉的列表)包括:具有一個或多個導線的電連接、便攜式計算機軟盤、硬盤、隨機存取存儲器(RAM)、只讀存儲器(ROM)、可擦式可編程只讀存儲器(EPR0M或閃存)、光纖、便攜式緊湊盤只讀存儲器(CD-ROM)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機可讀存儲介質可以是任何包含或存儲程序的有形介質,該程序用于被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結合使用。
[0026]計算機可讀的信號介質可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計算機可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括一一但不限于一一電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質還可以是計算機可讀存儲介質以外的任何計算機可讀介質,該計算機可讀介質可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結合使用的程序。
[0027]計算機可讀介質上包含的程序代碼可以用任何適當?shù)慕橘|傳輸,包括一一但不限于一一無線、有線、光纜、RF等等,或者上述的任意合適的組合。
[0028]可以以一種或多種程序設計語言的任意組合來編寫用于執(zhí)行本發(fā)明操作的計算機程序代碼,所述程序設計語言包括面向對象的程序設計語言一諸如Java、Smalltalk、C++等,還包括常規(guī)的過程式程序設計語言一諸如“C”語言或類似的