專利名稱:用于呈現(xiàn)信息的裝置及其方法
技術領域:
本發(fā)明涉及信息呈現(xiàn)裝置,尤其涉及一種相結合地顯示畫面并輸出聲音的信息呈現(xiàn)裝置。
背景技術:
近來,具有顯示器的小型便攜式終端(例如,PDA或便攜式電話)變得普遍。這些終端很小以至于僅可以在屏幕上顯示有限量的信息。當試圖顯示超過該限度的信息量時,字符可能太小而不可讀。
如在報紙或目錄的情況下,當信息的版面有助于可讀性時,在保持版面的同時顯示信息是重要的。然而,當試圖在小屏幕中顯示其尺寸范圍為僅可識別版面結構的文章時,所顯示字符的尺寸變得太小而僅可以閱讀標題等。
可以根據(jù)需要來改變顯示比例系數(shù),從而使感興趣部分中的字符的尺寸適于閱讀。然而,由于不能在放大狀態(tài)下識別整個版面結構,所以用于改變比例系數(shù)或顯示位置的操作頻繁出現(xiàn),這對于用戶來說很費力。
另外,當文件最初并不希望顯示在小屏幕上時,如果在屏幕上不進行換行(wrapping),則僅部分地顯示各行文本。因此,使得不能看到完整連續(xù)的文本,并且文本變?yōu)閮H是多個小片斷的集合。這使得理解的容易性降低。
對于樂譜以及文本也會出現(xiàn)類似的問題。
在現(xiàn)有顯示狀態(tài)下不能閱讀內容時可采取的方法是通過語音來聽取內容,而不是閱讀顯示屏上的信息。
根據(jù)在日本未審專利申請公報No.2001-209645中公開的技術,在顯示存儲在文件編排系統(tǒng)中的文件的情況下,當指定了所顯示的原始圖像的坐標時,朗讀與所指定的坐標相關聯(lián)的文本區(qū)域中的文本。假定在由于顯示裝置的分辨率而使得不能識別某些文本時使用該方法,并且可指定任意的文本區(qū)域。
下面將參照圖1和圖2來描述根據(jù)現(xiàn)有技術的信息呈現(xiàn)裝置的問題。
圖1是表示根據(jù)現(xiàn)有技術的信息呈現(xiàn)裝置的結構的示意性框圖。圖2是由根據(jù)現(xiàn)有技術的信息呈現(xiàn)裝置執(zhí)行的操作的流程圖。
文件輸入單元2從包含文本的文件52提取文件信息54(S2),并且版面分析器4提取包括文本塊以及各個文本塊在文件信息中的位置信息的數(shù)據(jù)56(S4)。然后,顯示數(shù)據(jù)提取器6提取用于一個畫面的顯示數(shù)據(jù)58(S6),并且文件顯示單元10顯示對應的信息(S10)。
當朗讀目標指定接受器20指定朗讀目標文本時(即,當步驟S20的結果為“是”時),轉換目標提取器14提取朗讀目標文本數(shù)據(jù)68(S22),并且語音輸出單元16將朗讀目標文本數(shù)據(jù)68轉換為語音并輸出該語音(S16)。
當由顯示位置和顯示比例系數(shù)改變器18指示改變顯示位置或者改變顯示比例系數(shù)時(即,當步驟S18的結果為“是”時),顯示數(shù)據(jù)提取器6根據(jù)該指示來改變顯示位置或顯示比例系數(shù)(S6)。
根據(jù)現(xiàn)有技術,用戶使用朗讀目標指定接受器20從顯示在屏幕上的文件中的文本中指定感興趣的文本,以朗讀該文本。
在日本未審專利申請公報No.2001-209645中,提供了允許直接指定的裝置(例如,鼠標)作為朗讀目標指定接受器。
發(fā)明內容
根據(jù)本發(fā)明,信息呈現(xiàn)裝置估測下述的文本塊,這些文本塊可能被用戶分類為可讀性差,由此用戶希望朗讀這些文本塊,并且提供了允許從這些文本塊中進行選擇的構造。這提高了對于用戶的便利性。
根據(jù)本發(fā)明的基本原理,假設對包含在畫面中并以充分可讀的尺寸顯示的文本塊進行朗讀的需求較小,并且允許通過簡單的操作(例如按下與塊編號相對應的數(shù)字鍵、按下限定用于指示移動到下一個塊并固定對塊的選擇的鍵、或者使用語音命令等而不是按下這些鍵)僅對以較差的可讀性尺寸顯示的文本塊或者部分容納在畫面中的文本塊進行選擇。與其它區(qū)域相區(qū)別地顯示可以選擇的文本塊,并且根據(jù)需要分配塊編號。
為此,根據(jù)本發(fā)明,一種信息呈現(xiàn)裝置包括文件輸入單元,其從文件提取文件信息;版面分析器,其從文件信息提取文本塊;顯示數(shù)據(jù)提取器,其提取用于一個畫面的顯示數(shù)據(jù);差可讀性塊提取器,其從顯示數(shù)據(jù)提取文本塊作為顯示塊,并將其中所顯示字符的尺寸小于或等于預定尺寸的顯示塊,或者其中包含部分文本的顯示塊分類為差可讀性塊;文件顯示單元,其顯示所述顯示數(shù)據(jù),以使各個差可讀性塊的區(qū)域與其它區(qū)域相區(qū)別;塊選擇器,其接受來自用戶的用于選擇朗讀目標塊的指示;轉換目標提取器,其提取與所選擇的塊相對應的朗讀目標文本數(shù)據(jù);以及語音輸出單元,其將朗讀目標文本數(shù)據(jù)轉換為語音并輸出該語音。
根據(jù)本發(fā)明,即使在其中沒有設置能夠使用鼠標、筆、指尖等進行直接指示的裝置的情況下,或者在其中使用小顯示屏(通過該小顯示屏難于使用筆或指尖進行指示)的情況下,可以容易地指定差可讀性的文本,并且可以作為語音聽取其內容。
圖1是表示根據(jù)現(xiàn)有技術的信息呈現(xiàn)裝置的結構的示意性框圖;圖2是由根據(jù)現(xiàn)有技術的信息呈現(xiàn)裝置執(zhí)行的操作的流程圖;圖3是表示根據(jù)本發(fā)明第一實施例的信息呈現(xiàn)裝置的結構的示意性框圖;圖4是由根據(jù)第一實施例的信息呈現(xiàn)裝置執(zhí)行的操作的流程圖;圖5A和5B是表示在根據(jù)第一實施例的信息呈現(xiàn)裝置中使用的數(shù)據(jù)結構的第一示例的視圖;圖6A和6B是表示在根據(jù)第一實施例的信息呈現(xiàn)裝置中使用的數(shù)據(jù)結構的第二示例的視圖;圖7是表示在根據(jù)第一實施例的信息呈現(xiàn)裝置中使用的數(shù)據(jù)結構的第三示例的視圖;圖8是表示輸入根據(jù)第一實施例的信息呈現(xiàn)裝置的文件的示例的視圖;圖9是由根據(jù)第一實施例的信息呈現(xiàn)裝置顯示的畫面的第一示例的視圖;圖10是由根據(jù)第一實施例的信息呈現(xiàn)裝置顯示的畫面的第二示例的視圖;圖11是由根據(jù)第一實施例的信息呈現(xiàn)裝置顯示的畫面的第三示例的視圖;圖12是由根據(jù)第一實施例的信息呈現(xiàn)裝置顯示的畫面的第四示例的視圖;圖13是由根據(jù)第一實施例的信息呈現(xiàn)裝置顯示的畫面的第五示例的視圖;圖14是由根據(jù)第一實施例的信息呈現(xiàn)裝置顯示的畫面的第六示例的視圖;圖15是由根據(jù)第一實施例的信息呈現(xiàn)裝置顯示的畫面的第七示例的視圖;圖16是由根據(jù)第一實施例的信息呈現(xiàn)裝置顯示的畫面的第八示例的視圖;圖17是表示根據(jù)本發(fā)明第二實施例的信息呈現(xiàn)裝置的結構的示意性框圖;圖18是由根據(jù)第二實施例的信息呈現(xiàn)裝置執(zhí)行的操作的流程圖;圖19是由根據(jù)第二實施例的信息呈現(xiàn)裝置顯示的畫面的第一示例的視圖;圖20是由根據(jù)第二實施例的信息呈現(xiàn)裝置顯示的畫面的第二示例的視圖;圖21是表示根據(jù)本發(fā)明第三實施例的信息呈現(xiàn)裝置的結構的示意性框圖;圖22是由根據(jù)第三實施例的信息呈現(xiàn)裝置執(zhí)行的操作的流程圖;圖23是由根據(jù)第三實施例的信息呈現(xiàn)裝置顯示的畫面的示例的視圖;
圖24是表示根據(jù)本發(fā)明第四實施例的信息呈現(xiàn)裝置的結構的示意性框圖;圖25是由根據(jù)第四實施例的信息呈現(xiàn)裝置執(zhí)行的操作的流程圖;圖26是表示根據(jù)本發(fā)明第五實施例的信息呈現(xiàn)裝置的結構的示意性框圖;圖27是由根據(jù)第五實施例的信息呈現(xiàn)裝置執(zhí)行的操作的流程圖;圖28是由根據(jù)第五實施例的信息呈現(xiàn)裝置顯示的畫面的示例的視圖;圖29是表示根據(jù)本發(fā)明第六實施例的信息呈現(xiàn)裝置的結構的示意性框圖;圖30是由根據(jù)第六實施例的信息呈現(xiàn)裝置顯示的畫面的示例的視圖;圖31是表示在根據(jù)第六實施例的信息呈現(xiàn)裝置中使用的數(shù)據(jù)結構的示例的視圖;圖32是表示根據(jù)本發(fā)明第七實施例的信息呈現(xiàn)裝置的結構的示意性框圖;圖33是由根據(jù)第七實施例的信息呈現(xiàn)裝置顯示的畫面的示例的視圖;圖34是表示在根據(jù)第七實施例的信息呈現(xiàn)裝置中使用的數(shù)據(jù)結構的示例的視圖;以及圖35是表示計算機環(huán)境的示例的視圖。
具體實施例方式
當沒有提供允許直接指定的裝置時,例如通過使用十字形鍵等移動光標而從大量文本區(qū)域中指定待朗讀的部分。該操作繁瑣。
另外,即使提供了允許直接指定的裝置,當該裝置基于通過筆或指尖進行的操作時,如果屏幕較小,則也難于精確地指定位置。
例如,在小型便攜式信息裝置(例如,便攜式電話或PDA)的情況下,通常不提供鼠標。另外,由于顯示屏非常小,所以在根據(jù)現(xiàn)有技術的信息呈現(xiàn)裝置中指定待朗讀的部分比較困難且繁瑣。
因此,本發(fā)明的目的是提供一種信息呈現(xiàn)裝置,即使在其中沒有設置能夠使用鼠標、筆、指尖等進行直接指示的裝置的情況下,或者在其中使用小顯示屏(通過該小顯示屏難于使用筆或指尖進行指示)的情況下,該裝置也可以容易地指定差可讀性的文本,并且可以將其內容作為語音進行聽取。
根據(jù)下述實施例的信息呈現(xiàn)裝置尤其用于具有小顯示屏的便攜裝置中,例如便攜式電話或小型便攜式信息裝置。
第一實施例下面將參照圖3至圖16來描述根據(jù)本發(fā)明第一實施例的信息呈現(xiàn)裝置。
圖3是表示根據(jù)第一實施例的信息呈現(xiàn)裝置100的結構的示意性框圖。圖4是由信息呈現(xiàn)裝置100執(zhí)行的操作的流程圖。
在信息呈現(xiàn)裝置100中,將包含在待顯示在屏幕上的文件中的文本分為一些塊,從這些塊中估測可能由于字符的小尺寸而可能可讀性差的塊,并將那些可能可讀性差的塊與其它塊相區(qū)分地顯示,并且分別向可讀性差的塊分配塊編號。當用戶按下與所感興趣的塊的塊編號相對應的數(shù)字鍵時,朗讀對應文本塊的內容。塊編號不僅可以是數(shù)字,而且可以是包括字母、數(shù)字字符或符號的字符串。
文件輸入單元102從包括文本的文件152提取文件信息154,并向版面分析器104輸出文件信息154(S102)。文件輸入單元102例如可以包括用于讀取存儲在記錄介質(例如,CD或MO)上的數(shù)據(jù);用于接收通過有線或無線網(wǎng)絡傳輸?shù)臄?shù)據(jù)的裝置;或者用于從報紙、雜志等的頁面讀取信息的裝置。文件信息154例如可以包括其版面二維固定的信息(例如,位圖數(shù)據(jù))、編碼為一維符號數(shù)組的信息、或者結構化數(shù)據(jù),例如HTML格式的數(shù)據(jù)。
版面分析器104將從文件輸入單元102輸入的文件信息154輸出到顯示數(shù)據(jù)提取器106。另外,版面分析器104從文件信息154提取包括文本塊及其在文件信息中的位置信息的數(shù)據(jù)156,并將數(shù)據(jù)156輸出到差可讀性塊提取器108(S104)。包括文本塊及其在文件信息中的位置信息的數(shù)據(jù)156的數(shù)據(jù)結構是任意的。例如,如圖5A所示,該數(shù)據(jù)結構可以包括多組表示為一維數(shù)組形式的、各個文本塊的內容以及表示該文本塊在文件信息中的位置的起始地址和結束地址。另選地,如圖5B所示,該數(shù)據(jù)結構可以包括多組各個文本塊的內容以及該文本塊待設置在文件信息的二維版面中的位置的左上角坐標和右下角坐標。
顯示數(shù)據(jù)提取器106基于從版面分析器104輸入的文件信息154,提取用于文件顯示單元110的一個畫面的顯示數(shù)據(jù)158,并將顯示數(shù)據(jù)158輸出到文件顯示單元110。另外,顯示數(shù)據(jù)提取器106向差可讀性塊提取器108輸出包括顯示數(shù)據(jù)及其在文件信息中的位置信息的數(shù)據(jù)160。顯示數(shù)據(jù)158的數(shù)據(jù)結構是任意的。例如,如圖6A所示,該數(shù)據(jù)結構可包括多組待顯示在屏幕上的各個組成部分的內容以及該組成部分待設置在屏幕上的位置的左上角坐標和右下角坐標。另外,包括顯示數(shù)據(jù)及其在文件信息中的位置信息的數(shù)據(jù)160的數(shù)據(jù)結構是任意的。例如,如圖6B所示,該數(shù)據(jù)結構可以包括多組表示為一維數(shù)組形式的、各個待顯示在屏幕上的組成部分內容、該組成部分待設置在屏幕上的位置的左上角坐標和右下角坐標、以及表示該組成部分在文件信息中的位置的起始地址和結束地址。
對于首先在屏幕上顯示的文件的顯示位置和顯示比例系數(shù),使用預定的默認值(例如,該顯示位置使得由文件信息限定的左上角與顯示屏的左上角匹配,并且顯示比例系數(shù)為×1)。然后,基于從顯示位置和顯示比例系數(shù)改變器118輸入的數(shù)據(jù)162(其包括顯示位置改變信息或者顯示比例系數(shù)改變信息),并基于當前顯示位置和當前顯示比例系數(shù),來改變顯示位置和顯示比例系數(shù)。
差可讀性塊提取器108將從版面分析器104輸入的數(shù)據(jù)156(其包括文本塊及其在文件信息中的位置信息)輸出到轉換目標提取器114。另外,根據(jù)從顯示數(shù)據(jù)提取器106輸入的數(shù)據(jù)156和數(shù)據(jù)160(其包括顯示數(shù)據(jù)及其在文件信息中的位置信息),差可讀性塊提取器108提取待顯示在屏幕上作為顯示塊的文本的單個文本塊,計算在單個顯示塊中顯示在屏幕上的字符的尺寸,將包括其尺寸小于或等于預定尺寸的字符的顯示塊分類為差可讀性塊,并對各個差可讀性塊分配塊編號。然后,差可讀性塊提取器108向文件顯示單元110和轉換目標提取器114輸出包括各個差可讀性塊的塊編號、其在文件信息中的位置信息以及其在屏幕上的位置信息的數(shù)據(jù)164(S108)。數(shù)據(jù)164(包括各個差可讀性塊的塊編號、其在文件信息中的位置信息,以及其在屏幕上的位置信息)的數(shù)據(jù)結構是任意的。例如,如圖7所示,該數(shù)據(jù)結構可以包括多組表示為一維數(shù)組形式的、各個差可讀性塊的塊編號、該差可讀性塊待設置在屏幕上的位置的左上角坐標和右下角坐標、以及表示該差可讀性塊在文件信息中的位置的起始地址和結束地址。
字符尺寸可以任何方式來限定,例如通過字符的字體大小、字符在屏幕上所占據(jù)的矩形區(qū)域的垂直和水平像素數(shù)、或者字符在屏幕上顯示的實際尺寸。然而,當使用像素數(shù)和實際尺寸時,可以忽略相對較小尺寸的符號或字符,例如標點符號。
文件顯示單元110將從顯示數(shù)據(jù)提取器106輸入的顯示數(shù)據(jù)158轉換為用于輸出到顯示屏的屏幕數(shù)據(jù),并在顯示屏上顯示對應的信息(S110)。此時,基于從差可讀性塊提取器108輸入的數(shù)據(jù)164(其包括各個差可讀性塊的塊編號、其在文件信息中的位置信息、以及其在屏幕上的位置信息),文件顯示單元110生成屏幕數(shù)據(jù),以使得顯示數(shù)據(jù)158中的各個差可讀性塊的區(qū)域被顯示為與其它區(qū)域不同,并且對各個差可讀性塊的區(qū)域分配塊編號。
將各個差可讀性塊的區(qū)域顯示為與其它區(qū)域不同的方法是任意的。例如,所述區(qū)域可以由限定其輪廓的線包圍,所述區(qū)域可以顯示為不同的顏色,所述區(qū)域可以加底線或者加陰影。
用戶101讀取顯示在文件顯示單元110上的文件,并根據(jù)需要使用顯示位置和顯示比例系數(shù)改變器118指示改變所顯示內容的顯示位置或者放大或縮小顯示內容。具體地,當文本太小而不能容易地讀取時,用戶指示放大顯示內容。
當用戶101按下與用戶希望朗讀的塊的塊編號相對應的數(shù)字鍵時(即,當步驟S112的結果為“是”時),塊選擇器112向轉換目標提取器114輸出由數(shù)字鍵表示的塊編號166。
基于從塊選擇器112輸入的塊編號166、包括各個差可讀性塊的塊編號、其在文件信息中的位置信息、其在屏幕上的位置信息的數(shù)據(jù)164、以及從差可讀性塊提取器108輸入的包括文本塊及其在文件信息中的位置信息的數(shù)據(jù)156,轉換目標提取器114提取朗讀目標文本數(shù)據(jù)168并將該朗讀目標文本數(shù)據(jù)168輸出到語音輸出單元116(S114)。
語音輸出單元116使用基于文本至語音程序的語音合成技術,將從轉換目標提取器114輸入的朗讀目標文本數(shù)據(jù)168轉換為語音,并通過揚聲器等輸出該語音(S116)。
當用戶101使用十字形鍵等指示改變顯示位置或者改變顯示比例系數(shù)時(即,當S118的結果為“是”時),顯示位置和顯示比例系數(shù)改變器118向顯示數(shù)據(jù)提取器106輸出包括顯示位置改變信息或者顯示比例系數(shù)改變信息的數(shù)據(jù)162。
圖8是表示輸入到根據(jù)第一實施例的信息呈現(xiàn)裝置的文件的示例的視圖。
圖9至圖16表示由根據(jù)第一實施例的信息呈現(xiàn)裝置顯示的畫面的示例的視圖。
當原樣顯示圖8中所示的輸入文件時,屏幕太小而不能容納該文件,從而沒有顯示其右側部分和下部分,如圖9所示。
在這種狀態(tài)中,所有字符的尺寸超過預定尺寸,從而認為這些字符可讀并以正常顯示模式顯示。
當如圖10所示,縮小圖9中所示的顯示內容時,包括在文本主體中的字符尺寸變得小于或等于預定尺寸,從而對分配有塊編號的各個顯示塊,顯示表示可選擇進行朗讀的候選塊的框架。當用戶按下數(shù)字鍵時,朗讀對應塊中的文本(包括在屏幕上未顯示的部分)。
當如圖11所示,進一步縮小圖10中所示的顯示內容時,標題中的字符的尺寸也變得小于或等于預定尺寸,從而與主體類似,對分配有塊編號的各個顯示塊顯示框架。
當輸入文件是結構化數(shù)據(jù)(例如,HTML格式的數(shù)據(jù)),并且根據(jù)文本顯示區(qū)域的寬度對文本進行編排時,在右端對超出屏幕右側的文本進行換行,如圖12所示。
當如圖13所示,縮小圖12中所示的顯示內容時,包括在文本主體中的字符的尺寸變得小于或等于預定尺寸,從而對分配有塊編號的各個顯示塊顯示框架。
當如圖14所示,進一步縮小圖13中所示的顯示內容時,在標題中的字符的尺寸也變得小于或等于預定尺寸,從而與主體類似,對分配有塊編號的各個顯示塊顯示框架。
根據(jù)上面的描述,在屏幕上顯示分配給各個差可讀性塊的塊編號,并且可以通過按下與塊的塊編號相對應的數(shù)字鍵來對塊進行選擇。然而,本發(fā)明并不限于此,還可以采用其它方案,只要可以容易地選擇所顯示的塊即可。
例如,可以將差可讀性塊之一顯示為暫時選擇的塊,以與其它差可讀性塊相區(qū)分,并且可以根據(jù)使用十字形鍵、箭頭鍵或用于指示下一候選塊而預先定義的鍵的輸入,來改變該暫時選擇的塊,并且可以通過使用預定用于固定選擇的鍵進行的輸入來選擇塊。圖15和圖16表示該方案的示例。
圖15是與圖13相對應的視圖。在圖15中,對第一塊加陰影而不是顯示塊編號。當用戶操作十字形鍵時,例如如圖16所示,陰影項改變。當進一步操作十字形鍵時,陰影項進一步改變。當用戶按下“*”鍵時,朗讀當前加陰影的塊。盡管在該示例中,十字形鍵用于改變暫時選擇的塊并且“*”鍵用于固定選擇,但是本發(fā)明并不限于該示例,還可以另外限定所使用的鍵。
另選地,通過如圖13和圖15所示的顯示屏,可以基于語音識別技術通過語音命令來選擇朗讀目標塊,而不是鍵操作。在這種情況下,使用諸如“一個”或“第一”的語音而不是按下數(shù)字鍵,并且使用例如“下一個”、“下翻”、“這個”、“固定”或“朗讀”的語音。
根據(jù)該第一實施例,可以容易地選擇所示文件中可讀性差的文本,并且可以作為語音聽取其內容。
第二實施例下面將參照圖17至圖20來描述根據(jù)本發(fā)明第二實施例的信息呈現(xiàn)裝置,并且如果需要將參照描述第一實施例所參照的附圖。使用相同的附圖標記來表示與第一實施例中相對應的部分等,并將省略對其的描述。
圖17是表示根據(jù)第二實施例的信息呈現(xiàn)裝置200的結構的示意性框圖。圖18是由信息呈現(xiàn)裝置200執(zhí)行的操作的流程圖。
信息呈現(xiàn)裝置200包括用于單獨地從塊選擇器112指定屏幕上的任意文本并指示要朗讀的文本的單元。因此,當用戶指示待朗讀的文本(其不能由塊選擇器112指定)時,假定該文本包括對于用戶可讀性差的尺寸的字符,為了隨后可以由塊選擇器112選擇該文本,改變用于分類差可讀性塊的預定尺寸。
當由用戶201使用輸入筆等指定朗讀目標文本時(即,當S220的結果為“是”時),朗讀目標指定接受器220向轉換目標提取器214和最小尺寸檢測器222輸出朗讀目標文本的坐標數(shù)據(jù)270。
轉換目標提取器214基于從朗讀目標指定接受器220輸入的朗讀目標文本的坐標數(shù)據(jù)270、從差可讀性塊提取器208輸入的包括文本塊及各個文本塊在文件信息中的位置信息的數(shù)據(jù)156、以及包括顯示數(shù)據(jù)以及顯示數(shù)據(jù)的位置信息的數(shù)據(jù)160,提取朗讀目標文本數(shù)據(jù)268,并將朗讀目標文本數(shù)據(jù)268輸出到語音輸出單元116(S214)。而由轉換目標提取器214執(zhí)行的處理與第一實施例中由轉換目標提取器114執(zhí)行的處理相同。
最小尺寸檢測器222基于從朗讀目標指定接受器220輸入的朗讀目標文本的坐標數(shù)據(jù)270、以及從差可讀性塊提取器208輸入的包括顯示數(shù)據(jù)以及顯示數(shù)據(jù)在文件信息中的位置信息的數(shù)據(jù)160來檢查字符尺寸,并將表示最小字符尺寸的值272輸出給預定尺寸改變器224(S222)。
預定尺寸改變器224將從最小尺寸檢測器222輸入的表示最小字符尺寸的值272與用于分類差可讀性塊的預定尺寸的當前值進行比較。當預定尺寸的當前值較小時(即,當步驟S223的結果為“是”時),預定尺寸改變器224向差可讀性塊提取器208輸出表示最小字符尺寸的值272作為新的預定尺寸274(S224)。
差可讀性塊提取器208將用于分類差可讀性塊的預定尺寸改變?yōu)閺念A定尺寸改變器224輸入的新的預定尺寸274。差可讀性塊提取器208然后再次提取差可讀性塊,向差可讀性塊分配塊編號,并向文件顯示單元110和轉換目標提取器214輸出數(shù)據(jù)264,該數(shù)據(jù)264包括各個塊的塊編號、各個塊在文件信息中的位置信息、以及各個塊在屏幕上的位置信息(S208)。
當從顯示數(shù)據(jù)提取器106輸入包括顯示數(shù)據(jù)和在文件信息中的位置信息的數(shù)據(jù)160時,差可讀性塊提取器208將該信息輸出給轉換目標提取器214和最小尺寸檢測器222。而由差可讀性提取器208執(zhí)行的處理與由第一實施例中的差可讀性塊提取器108執(zhí)行的處理相同。
圖19和圖20表示由根據(jù)第二實施例的信息呈現(xiàn)裝置顯示的畫面的示例。
另外,在第二實施例的描述中,將圖8中所示的文件用作輸入文件的示例。當輸入文件為結構化數(shù)據(jù)(例如,HTML格式的數(shù)據(jù))并通過換行進行顯示時,如圖12所示顯示該文件。
當用戶在圖12所示的顯示狀態(tài)中發(fā)出朗讀指示時,對與該指示相關的段落加陰影,如圖19所示。
朗讀與該段落相對應的文本。此時,由于表示該文本中的最小字符尺寸的值超過用于分類差可讀性塊的預定尺寸的當前值,所以將預定尺寸改變?yōu)楸硎咀钚∽址叽绲闹担瑥亩嬅孀優(yōu)槿鐖D20所示。即,在屏幕上顯示的文本與圖12中所示的相同,但是在圖12中缺少的用于指定可選擇進行朗讀的候選塊的框架顯示在主體區(qū)域中,并對其分配塊編號。
根據(jù)第二實施例,可以根據(jù)用戶的操作狀態(tài)自動地調整用于確定不可讀性的標準。
第三實施例下面將參照圖21至圖23來描述根據(jù)本發(fā)明第三實施例的信息呈現(xiàn)裝置,并且如果需要將參照描述第一和第二實施例所參照的附圖。使用相同的附圖標記來表示與第一實施例中相關的部分等,并將省略對其的描述。
圖21是表示根據(jù)第三實施例的信息呈現(xiàn)裝置300的結構的示意性框圖。圖22是由信息呈現(xiàn)裝置300執(zhí)行的操作的流程圖。
在信息呈現(xiàn)裝置300中,當用戶指示放大顯示在屏幕上的內容時,假定在不能由塊選擇器112選擇的文本中還存在對于用戶可讀性差的尺寸的字符,為了使這些尺寸的文本隨后可以通過塊選擇器112選擇,可以改變用于分類差可讀性塊的預定尺寸。
當用戶101使用十字形鍵等指示改變顯示位置或改變顯示比例系數(shù)時(即,當步驟S318的結果為“是”時),顯示位置和顯示比例系數(shù)改變器318向顯示數(shù)據(jù)提取器106和最小尺寸檢測器322輸出包括顯示位置改變信息或顯示比例系數(shù)改變信息的數(shù)據(jù)162。
當包括顯示位置改變信息或顯示比例系數(shù)改變信息的數(shù)據(jù)162基于在放大前從差可讀性塊提取器208輸入的數(shù)據(jù)160(其包括顯示數(shù)據(jù)及其在文件信息中的位置)指示放大文件時(即,當步驟S321的結果為“是”時),最小尺寸檢測器322提取在放大前并未包含在顯示在屏幕上的文件中的差可讀性塊中的文本,并將表示該文本中的最小字符尺寸的值372輸出給預定尺寸改變器324(S322)。
預定尺寸改變器324將在最小尺寸檢測器322中檢測的表示最小字符尺寸的值372輸出給差可讀性塊提取器308,作為新的預定尺寸374(S324)。
差可讀性塊提取器308將用于分類差可讀性塊的預定尺寸改變?yōu)閺念A定尺寸改變器324輸入的新的預定尺寸374,然后再次提取差可讀性塊。差可讀性塊提取器308向差可讀性塊分配塊編號,并向文件顯示單元110和轉換目標提取器114輸出包括各個差可讀性塊的塊編號、其在文件信息中的位置信息、以及包括其在屏幕上的位置信息的數(shù)據(jù)364(S308)。
當從顯示數(shù)據(jù)提取器106輸入包括顯示數(shù)據(jù)及其在文件信息中的位置信息的數(shù)據(jù)160時,差可讀性塊提取器308向最小尺寸檢測器322輸入數(shù)據(jù)160。而由差可讀性提取器308執(zhí)行的處理與由第一實施例中的差可讀性塊提取器108執(zhí)行的處理相同。
圖23是由信息呈現(xiàn)裝置300顯示的畫面的示例。
另外,在第三實施例的描述中,使用圖8中所示的文件作為輸入文件的示例。當輸入文件為結構化數(shù)據(jù)(例如,HTML格式的數(shù)據(jù))并通過換行進行顯示時,如圖12所示顯示該文件。當縮小所顯示的文件時,如圖13所示顯示該文件。
當用戶在圖13所示的顯示狀態(tài)下指示放大所顯示的內容時,假設該顯示狀態(tài)返回到圖12所示的狀態(tài)。此時,提取表示在圖13中所示的顯示屏上未被框架包圍的文本中的最小字符尺寸的值,并且將用于分類差可讀性塊的預定尺寸改變?yōu)楸硎驹撟钚∽址叽绲闹?。因此,顯示狀態(tài)改變?yōu)閳D20中所示的狀態(tài),而不是圖12中所示的狀態(tài)。即,盡管在屏幕上顯示的文本與圖12中所示的相同,但是在圖12中缺少的表示可被選擇用于朗讀的候選塊的框架顯示在主體區(qū)域中,并且對其分配塊編號。
當用戶指示縮小所顯示的內容時,畫面變?yōu)閳D23中所示的畫面。即,盡管在屏幕上顯示的文本與圖13中所示的相同,但是在圖13中缺少的表示可被選擇用于朗讀的候選塊的框架顯示在標題區(qū)域中,并且對其分配塊編號。
根據(jù)第三實施例,可以根據(jù)用戶的操作狀態(tài)自動地調整用于確定不可讀性的標準。
第四實施例下面將描述根據(jù)本發(fā)明第四實施例的信息呈現(xiàn)裝置。使用相同的附圖標記來表示與對第一實施例相關的部分等,并將省略對其的描述。
圖24是表示根據(jù)第四實施例的信息呈現(xiàn)裝置400的結構的示意性框圖。圖25是由信息呈現(xiàn)裝置400執(zhí)行的操作的流程圖。
在信息呈現(xiàn)裝置400中,可以根據(jù)用戶的指示改變用于分類差可讀性塊的預定尺寸。
當用戶401使用十字形鍵等指示改變用于分類差可讀性塊的預定尺寸時(即,當步驟S426的結果為“是”時),預定尺寸改變接受器426向差可讀性塊提取器408輸出新的預定尺寸474(S424)。
差可讀性塊提取器408將用于分類差可讀性塊的預定尺寸改變?yōu)閺念A定尺寸改變接受器426輸入的新的預定尺寸474,然后再次提取差可讀性塊。差可讀性塊提取器408向差可讀性塊分配塊編號,并且向文件顯示單元110和轉換目標提取器114輸出包括各個差可讀性塊的塊編號、其在文件信息中的位置信息、以及其在屏幕上的位置信息的數(shù)據(jù)464(S408)。由差可讀性提取器408執(zhí)行的處理與由第一實施例中的差可讀性塊提取器108執(zhí)行的處理相同。
根據(jù)第四實施例,當用于分類不可讀文本的標準不適合于用戶時,可以根據(jù)用戶的指示調整用于分類不可讀性的標準。另外,與第二實施例或第三實施例相結合,當根據(jù)第二實施例或第三實施例自動調整的預定尺寸并不適合于用戶時,可以根據(jù)用戶的指示調制用于分類不可讀性的標準。
第五實施例下面將參照圖26至圖28來描述根據(jù)本發(fā)明第五實施例的信息呈現(xiàn)裝置,并且如果需要將參照描述第一實施例所參照的附圖。使用相同的附圖標記來表示與對于第一實施例所描述的部分相對應的部分等,并將省略對其的描述。
圖26是表示根據(jù)第五實施例的信息呈現(xiàn)裝置500的結構的示意性框圖。圖27是由信息呈現(xiàn)裝置500執(zhí)行的操作的流程圖。
在信息呈現(xiàn)裝置500中,部分容納在屏幕上的文本也可以分類為可讀性差并且可由塊選擇器112進行選擇。
基于從版面分析器104輸入的數(shù)據(jù)156(其包括文本塊及其在文件信息中的位置信息),并基于從顯示數(shù)據(jù)提取器106輸入的數(shù)據(jù)160(其包括顯示數(shù)據(jù)及其在文件信息中的位置信息),差可讀性塊提取器508提取待顯示在屏幕上的單個文本塊作為顯示塊,并將其中僅部分地顯示數(shù)據(jù)156中的文本塊的顯示塊分類為差可讀性塊(S508)。當在屏幕的周邊區(qū)域中設定無效區(qū)域,以使顯示塊僅包括無效區(qū)域時,可以從差可讀性塊重排出該顯示塊。即,當僅顯示文本塊的很小部分時,可以從可由塊選擇器112選擇的候選塊中排除相關的顯示塊。這用于限制作為用于選擇的候選塊的數(shù)量,從而改善操作的容易性。由差可讀性提取器508執(zhí)行的處理與由第一實施例中的差可讀性塊提取器108執(zhí)行的處理相同。
圖28表示由信息呈現(xiàn)裝置500顯示的畫面的示例。
另外,在第五實施例的描述中,圖8中所示的文件用作輸入文件的示例。當原樣顯示該文件時,如圖28所示顯示該文件。即,盡管不存在其中字符尺寸小于或等于預定尺寸的顯示塊,但是存在其中文本部分地容納在右側的顯示塊。因此,顯示表示可被選擇用于朗讀的候選塊的框架,并對其分配塊編號。當用戶按下與塊編號相對應的鍵時,朗讀對應塊中的文本(其包括未顯示在屏幕上的部分)。
根據(jù)第五實施例,即使當由于文本并未完全容納在屏幕中(盡管字符尺寸足夠大),所以文本的內容的可讀性差時,也可容易地選擇該文本并可以對其進行朗讀以進行聽取。
第六實施例下面將參照圖29至圖31來描述根據(jù)本發(fā)明第六實施例的信息呈現(xiàn)裝置。使用相同的附圖標記來表示與對第一實施例描述的部分相對應的部分等,并將省略對其的描述。
圖29是表示根據(jù)第六實施例的信息呈現(xiàn)裝置600的結構的示意性框圖。圖30是由信息呈現(xiàn)裝置600執(zhí)行的操作的流程圖。
在信息呈現(xiàn)裝置600中,當在輸入文件中包括與文本數(shù)據(jù)相關聯(lián)的語音數(shù)據(jù)時,輸出該相關聯(lián)的語音數(shù)據(jù),以使得可以朗讀該文本。
包含在由文件輸入單元602輸出的文件信息654(S602)中的文本數(shù)據(jù)可伴隨有相關聯(lián)的語音數(shù)據(jù)。
當該文本數(shù)據(jù)伴隨有語音數(shù)據(jù)時,版面分析器604將包括文本塊、各個文本塊在文件信息中的位置信息以及相關語音信息的數(shù)據(jù)656輸出到差可讀性塊提取器608(S604)。包括文本塊、各個文本塊的位置信息以及相關聯(lián)的語音信息的數(shù)據(jù)656的數(shù)據(jù)結構是任意的。例如,如圖31所示,該數(shù)據(jù)結構可以包括多組表示為一維數(shù)組形式的、各個文本塊的內容及表示文本塊在文件信息中的位置的起始地址和結束地址,以及與文本塊相關聯(lián)的語音數(shù)據(jù)的內容。該語音數(shù)據(jù)的格式是任意的,并且例如可以是WAVE格式或MP3格式。當文本數(shù)據(jù)并未伴隨有語音數(shù)據(jù)時,使用表示缺少語音數(shù)據(jù)的預定數(shù)據(jù)來代替語音數(shù)據(jù)。而由版面分析器604執(zhí)行的處理與由第一實施例中的版面分析器104執(zhí)行的處理相同。
差可讀性塊提取器208將包括文本塊、其在文獻信息中的位置信息以及相關聯(lián)的語音信息的數(shù)據(jù)656輸出到轉換目標提取器614(S608)。由差可讀性提取器608執(zhí)行的處理與由第一實施例中的差可讀性塊提取器108執(zhí)行的處理相同。
當所提取的朗讀目標文本數(shù)據(jù)伴隨有語音數(shù)據(jù)時,轉換目標提取器614將該語音數(shù)據(jù)作為朗讀目標語音數(shù)據(jù)676輸出到語音輸出單元616(S614)。由轉換目標提取器614執(zhí)行的處理與由第一實施例中的轉換目標提取器114執(zhí)行的處理相同。
當從轉換目標提取器614輸入朗讀目標語音數(shù)據(jù)676時,語音輸出單元616將該語音數(shù)據(jù)轉換為語音信號并通過揚聲器等輸出該語音信號(S616)。由語音輸出單元616執(zhí)行的處理與由第一實施例中的語音輸出單元116執(zhí)行的處理相同。
在根據(jù)第六實施例的信息呈現(xiàn)裝置600中,當在輸入文件中,文本數(shù)據(jù)伴隨有語音數(shù)據(jù)時,輸出基于相關聯(lián)的語音數(shù)據(jù)的聲音而不使用語音合成,從而可輸出更適合的聲音。另外,當假設在輸入文件中的所有文本數(shù)據(jù)都伴隨有語音數(shù)據(jù)時,可以省略語音合成功能。
第七實施例下面將參照圖32至圖34來描述根據(jù)本發(fā)明第七實施例的信息呈現(xiàn)裝置。使用相同的附圖標記來表示與對第一實施例描述的部分相對應的部分等,并將省略對其的描述。
圖32是表示根據(jù)第七實施例的信息呈現(xiàn)裝置700的結構的示意性框圖。圖33是由信息呈現(xiàn)裝置700執(zhí)行的操作的流程圖。
在信息呈現(xiàn)裝置700中,與文本的情況相似,將包括在待顯示在屏幕上的文件中的樂譜分為一些塊,從這些塊中估測可讀性可能較差的塊,并將那些可能可讀性差的塊顯示為與其它塊不同,并且分別向可讀性差的塊分配塊編號。當用戶按下與用戶感興趣的樂譜塊的塊編號相對應的數(shù)字鍵時,演奏對應的樂譜塊的內容,以聆聽演奏。
文件輸入單元702從包括文本或樂譜或者包括文本和樂譜的文件752提取文件信息754,并向版面分析器704輸出文件信息754(S702)。這里假設樂譜數(shù)據(jù)伴有相關聯(lián)的演奏數(shù)據(jù)。
版面分析器704從由文件輸入單元702輸入的文件信息754中提取包括樂譜塊、各個樂譜塊的位置信息、以及相關聯(lián)的演奏數(shù)據(jù)的數(shù)據(jù)778,并將數(shù)據(jù)778輸出到差可讀性塊提取器708(S704)。包括樂譜塊、樂譜塊的位置信息、以及相關聯(lián)的演奏數(shù)據(jù)的數(shù)據(jù)778的數(shù)據(jù)結構是任意的。例如,如圖34所示,該數(shù)據(jù)結構可以包括多組各個樂譜塊的內容、樂譜塊待設置在文件信息的二維版面中的位置的左上角坐標和右下角坐標、以及與樂譜塊相關聯(lián)的演奏數(shù)據(jù)的內容。演奏數(shù)據(jù)的格式是任意的,例如可以是MIDI格式、WAVE格式或MP3格式。由版面分析器704執(zhí)行的處理與由第一實施例中的版面分析器104執(zhí)行的處理相同。
差可讀性塊提取器708將從版面分析器704輸入的數(shù)據(jù)778(其包括樂譜塊、各個樂譜塊的位置信息、以及相關聯(lián)的演奏數(shù)據(jù))輸出到轉換目標提取器714。另外,基于包括樂譜塊、各個樂譜塊的位置信息的數(shù)據(jù)778,并基于包括顯示數(shù)據(jù)以及顯示數(shù)據(jù)在文件信息中的位置信息的數(shù)據(jù)160,差可讀性塊提取器708提取與待顯示在屏幕上的樂譜的單個樂譜塊相對應的顯示塊。然后,差可讀性塊提取器708計算顯示在各個顯示塊中的樂譜的譜線間隔,將其中譜線間隔小于或等于預定間隔的顯示塊分類為差可讀性塊,并向差可讀性塊分配塊編號。然后,差可讀性塊提取器708向文件顯示單元110和轉換目標提取器714輸出數(shù)據(jù)164(包括各個差可讀性塊的塊編號、各個差可讀性塊在文件信息中的位置信息、以及各個差可讀性塊在屏幕上的位置信息)(S708)。
可以任何方式限定譜線間隔,例如,根據(jù)顯示在屏幕上的一對譜線之間的像素數(shù)量或實際尺寸。而由差可讀性塊提取器708執(zhí)行的處理與由第一實施例中的差可讀性塊提取器108執(zhí)行的處理相同。
當由塊選擇器112選擇的塊為樂譜塊時(即,當步驟S713的結果為“樂譜”時),轉換目標提取器714基于從塊選擇器112輸入的塊編號、從差可讀性塊提取器708輸入的數(shù)據(jù)164(其包括各個差可讀性塊的塊編號以及各個差可讀性塊在文件信息中的位置信息)、以及數(shù)據(jù)778(其包括樂譜塊、各個樂譜塊在文件信息中的位置信息、以及相關聯(lián)的演奏數(shù)據(jù))提取要演奏的演奏數(shù)據(jù)780,并將演奏數(shù)據(jù)780輸出到音樂輸出單元728(S714)。當所選擇的塊為文本塊時(即,當步驟S713的結果為“文本”時),由轉換目標提取器714執(zhí)行的處理與由第一實施例中的轉換目標提取器114執(zhí)行的處理相同。
音樂輸出單元728將從轉換目標提取器714輸入的待演奏的演奏數(shù)據(jù)780轉換為音樂,并通過揚聲器等輸出該音樂(S728)。
根據(jù)第七實施例,可以容易地選擇所顯示的文件中的可讀性差的樂譜,并且可以演奏樂譜的內容以進行聆聽。
盡管已經(jīng)描述了根據(jù)這些實施例的信息呈現(xiàn)裝置尤其用于具有小顯示屏的便攜式裝置,但并不限于此,該信息呈現(xiàn)裝置可用于固定裝置或具有大顯示屏的裝置。
根據(jù)上述實施例的信息呈現(xiàn)裝置可以硬件的形式或計算機軟件的形式實現(xiàn)。例如,對于第一實施例,生成一程序,以使得可以由計算機來執(zhí)行圖3中所示的版面分析器104、顯示數(shù)據(jù)提取器106、差可讀性塊提取器108、文件顯示單元110、塊選擇器112、轉換目標提取器114、以及語音輸出單元116的功能,并將該程序加載到計算機的存儲器中并執(zhí)行該程序,從而實現(xiàn)圖3中所示的信息呈現(xiàn)裝置100。同樣,可以計算機軟件(程序)的形式實現(xiàn)根據(jù)第二至第七實施例的信息呈現(xiàn)裝置。
如圖35所示,用于實現(xiàn)根據(jù)這些實施例的信息呈現(xiàn)裝置的程序可以存儲在便攜式記錄介質832(例如,CD-ROM、CD-RW、DVD-R、DVD-RAM、DVD-RW或軟盤)中,或者存儲在可以通過通信線路834訪問的存儲裝置836中、或者存儲在存儲裝置或記錄介質838(例如,計算機系統(tǒng)830的硬盤或RAM)中。將這些程序加載到主存儲器中并在其中執(zhí)行這些程序。
權利要求
1.一種用于呈現(xiàn)信息的裝置,所述裝置具有顯示屏,該裝置包括文件輸入單元(102),用于輸入文件,并從所述文件提取文件信息,所述文件包括文本塊,該文本塊包含至少一個字符;版面分析器(104),用于從所述文件信息提取所述文本塊,并提取所述文本塊在所述文件信息中的位置信息;顯示數(shù)據(jù)提取器(106),用于基于當前顯示位置和當前顯示比例系數(shù),從所述文件信息提取顯示數(shù)據(jù);差可讀性塊提取器(108),其包括下述的輔助單元,該輔助單元根據(jù)所述文本塊及其在所述文件信息中的位置信息,以及所述顯示數(shù)據(jù)及其在所述文件信息中的位置信息,從所述顯示數(shù)據(jù)提取所述文本塊作為顯示塊;下述的輔助單元,當所述屏幕上的顯示塊中的所述字符的尺寸小于或等于預定尺寸時,該輔助單元將所述顯示塊分類為差可讀性塊;以及下述的輔助單元,該輔助單元用于向所述差可讀性塊分配塊編號;所述差可讀性塊顯示在所述屏幕上,相區(qū)別地顯示所述差可讀性塊的區(qū)域;文件顯示單元(110),用于在所述屏幕上顯示所述顯示數(shù)據(jù);塊選擇器(112),用于根據(jù)用戶的指示選擇待朗讀的塊;轉換目標提取器(114),其基于所述選擇的塊的所述塊編號、所述差可讀性塊的所述塊編號及其在所述文件信息中的位置信息、以及所述文本塊及其在所述文件信息中的位置信息,提取待朗讀的文本數(shù)據(jù);以及語音輸出單元(116),用于將待朗讀的所述文本數(shù)據(jù)轉換為發(fā)聲的語音輸出。
2.根據(jù)權利要求1所述的裝置,還包括朗讀目標指定接受器(220),用于接受用戶對待朗讀文本的指定,并提取待朗讀文本的坐標數(shù)據(jù);最小尺寸檢測器(222),其基于所述坐標數(shù)據(jù)和所述顯示數(shù)據(jù),檢測在待朗讀的所述文本中的所述字符的最小尺寸值;預定尺寸改變器(224),當所述預定尺寸的當前值小于所述字符的最小尺寸時,其將所述預定尺寸改變?yōu)樗鲎址乃鲎钚〕叽纾凰鲛D換目標提取器(214)還基于所述坐標數(shù)據(jù)、所述文本塊及其在所述文件信息中的位置信息、以及所述顯示數(shù)據(jù)及其在所述文件信息中的位置信息,提取待朗讀的文本數(shù)據(jù);并且所述差可讀性塊提取器(208)還根據(jù)所述改變的預定尺寸再次提取所述差可讀性塊。
3.根據(jù)權利要求1所述的裝置,還包括顯示位置和顯示比例系數(shù)改變器(318),用于根據(jù)用戶的指示改變所述顯示位置或所述顯示比例系數(shù);最小尺寸檢測器(322),當改變所述顯示比例系數(shù)的所述指示表示放大時,基于放大前的顯示數(shù)據(jù)及其在所述文件信息中的位置信息,檢測在所述顯示數(shù)據(jù)中但并不包括在所述差可讀性塊中的所述字符的最小尺寸值;以及預定尺寸改變器(324),用于將所述預定尺寸改變?yōu)樗鲎址乃鲎钚〕叽?;所述顯示數(shù)據(jù)提取器(106)基于所述當前顯示位置和所述當前顯示比例系數(shù)、以及改變所述顯示位置或所述顯示比例系數(shù)的所述指示,從所述文件信息中提取顯示數(shù)據(jù);并且所述差可讀性塊提取器(308)還根據(jù)所述改變的預定尺寸再次提取所述差可讀性塊。
4.根據(jù)權利要求1、2或3所述的裝置,還包括預定尺寸改變接受器(426),用于接受用戶改變所述預定尺寸的指示,并根據(jù)該指示提取新的預定尺寸;所述差可讀性塊提取器(408)還根據(jù)所述新的預定尺寸再次提取所述差可讀性塊。
5.根據(jù)權利要求1所述的裝置,其中所述差可讀性塊提取器(508)還包括下述的輔助單元,該輔助單元用于將僅包括所述文本塊的部分的所述顯示塊分類為差可讀性塊;以及下述的輔助單元,該輔助單元用于向所述差可讀性塊分配塊編號。
6.根據(jù)權利要求1、2、3或5所述的裝置,其中所述文本塊伴隨有語音數(shù)據(jù),所述文本數(shù)據(jù)包括在由所述文件輸入單元(602)提取的所述文件信息中;所述版面分析器(604)還從所述文件信息中提取所述語音數(shù)據(jù);所述轉換目標提取器(614)還提取與待朗讀的所述文本數(shù)據(jù)相關聯(lián)的所述語音數(shù)據(jù);并且所述語音輸出單元(616)還將所述語音數(shù)據(jù)轉換為發(fā)聲的語音輸出。
7.根據(jù)權利要求1所述的裝置,還包括音樂輸出單元(728),用于將演奏數(shù)據(jù)轉換為音樂聲音輸出;所述文件信息包括伴隨有演奏數(shù)據(jù)的樂譜塊;所述版面分析器(704)還提取所述樂譜塊及其在所述文件信息中的位置信息、以及與所述樂譜塊相關聯(lián)的演奏數(shù)據(jù);所述差可讀性塊提取器(708)還包括下述的輔助單元,該輔助單元根據(jù)所述樂譜塊及其在所述文件信息中的位置信息,以及所述顯示數(shù)據(jù)及其在所述文件信息中的位置信息,從所述顯示數(shù)據(jù)提取所述樂譜塊作為顯示塊;下述的輔助單元,當所述屏幕上的顯示塊中的譜線間隔小于或等于預定間隔時,該輔助單元用于將所述顯示塊分類為差可讀性塊;以及下述的輔助單元,該輔助單元用于向所述差可讀性塊分配塊編號;所述轉換目標提取器(714)還基于所述選擇的塊的所述塊編號、所述差可讀性塊的所述塊編號和所述差可讀性塊在所述文件信息中的所述位置信息、以及所述樂譜塊及其在所述文件信息中的位置信息,提取與待演奏的所述樂譜數(shù)據(jù)相關聯(lián)的所述演奏數(shù)據(jù)。
8.一種存儲程序的介質,該程序用于指示計算機執(zhí)行呈現(xiàn)信息的處理,所述計算機具有顯示屏,所述介質對于所述計算機是可讀的,所述處理包括文件輸入步驟(S102),用于輸入文件,并提取所述文件的文件信息,所述文件包括包含至少一個字符的文本塊;版面分析步驟(S104),用于從所述文件信息提取所述文本塊,并提取所述文本塊在所述文件信息中的位置信息;顯示數(shù)據(jù)提取步驟(S106),用于基于當前顯示位置和當前顯示比例系數(shù),從所述文件信息提取顯示數(shù)據(jù);差可讀性塊提取步驟(S108),其包括下述的輔助步驟,該輔助步驟根據(jù)所述文本塊及其在所述文件信息中的位置信息,以及所述顯示數(shù)據(jù)及其在所述文件信息中的位置信息,從所述顯示數(shù)據(jù)提取所述文本塊作為顯示塊;下述的輔助步驟,當所述屏幕上的顯示塊中的所述字符的尺寸小于或等于預定尺寸時,該輔助步驟將所述顯示塊分類為差可讀性塊;以及下述的輔助步驟,該輔助步驟用于向所述差可讀性塊分配塊編號;所述差可讀性塊顯示在所述屏幕上,相區(qū)別地顯示所述差可讀性塊的區(qū)域;文件顯示步驟(S110),用于在所述屏幕上顯示所述顯示數(shù)據(jù);塊選擇步驟(S112),用于根據(jù)用戶的指示選擇待朗讀的塊;轉換目標提取步驟(S114),其基于所述選擇塊的所述塊編號、所述差可讀性塊的所述塊編號及其在所述文件信息中的位置信息、以及所述文本塊及其在所述文件信息中的位置信息,提取待朗讀的文本數(shù)據(jù);以及語音輸出步驟(S116),用于將待朗讀的所述文本數(shù)據(jù)轉換為發(fā)聲的語音輸出。
9.根據(jù)權利要求8所述的介質,所述處理還包括朗讀目標指定接受步驟(S220),用于接受用戶對待朗讀文本的指定,并提取待朗讀文本的坐標數(shù)據(jù);最小尺寸檢測步驟(S222),基于所述坐標數(shù)據(jù)和所述顯示數(shù)據(jù),檢測待朗讀的所述文本中的所述字符的最小尺寸值;預定尺寸改變步驟(S224),當所述預定尺寸的當前值小于所述字符的最小尺寸時,將所述預定尺寸改變?yōu)樗鲎址乃鲎钚〕叽?;所述轉換目標提取步驟(S214)還包括下述的輔助步驟,該輔助步驟基于所述坐標數(shù)據(jù)、所述文本塊及其在所述文件信息中的位置信息、以及所述顯示數(shù)據(jù)及其在所述文件信息中的位置信息,提取待朗讀的文本數(shù)據(jù);并且所述差可讀性塊提取步驟(S208)還包括下述的輔助步驟,該輔助步驟根據(jù)所述改變的預定尺寸再次提取所述差可讀性塊。
10.根據(jù)權利要求8所述的介質,所述處理還包括顯示位置和顯示比例系數(shù)改變步驟(S318),用于根據(jù)用戶的指示改變所述顯示位置或所述顯示比例系數(shù);最小尺寸檢測步驟(S322),當改變所述顯示比例系數(shù)的所述指示表示放大時,基于放大前的顯示數(shù)據(jù)及其在所述文件信息中的位置信息,檢測在所述顯示數(shù)據(jù)中但并不包括在所述差可讀性塊中的所述字符的最小尺寸值;以及預定尺寸改變步驟(S324),用于將所述預定尺寸改變?yōu)樗鲎址乃鲎钚〕叽?;所述顯示數(shù)據(jù)提取步驟(S106)包括下述的步驟,該步驟基于所述當前顯示位置和所述當前顯示比例系數(shù)、以及改變所述顯示位置或所述顯示比例系數(shù)的所述指示,從所述文件信息中提取顯示數(shù)據(jù);并且所述差可讀性塊提取步驟(S308)還包括下述的輔助步驟,該輔助步驟根據(jù)所述改變的預定尺寸再次提取所述差可讀性塊。
11.根據(jù)權利要求8所述的介質,所述處理還包括預定尺寸改變接受步驟(S426),用于接受改變所述預定尺寸的用戶指示,并根據(jù)該指示提取新的預定尺寸;所述差可讀性塊提取步驟(S428)還包括下述的輔助步驟,該輔助步驟根據(jù)所述新的預定尺寸再次提取所述差可讀性塊。
12.根據(jù)權利要求8所述的介質,其中所述差可讀性塊提取步驟(S508)還包括下述的輔助步驟,用于將僅包括所述文本塊的部分的所述顯示塊分類為差可讀性塊;以及下述的輔助步驟,用于向所述差可讀性塊分配塊編號。
13.根據(jù)權利要求8所述的介質,其中所述文本塊伴隨有語音數(shù)據(jù),所述文本數(shù)據(jù)包括在所述文件輸入步驟(S602)提取的所述文件信息中;所述版面分析步驟還包括下述的輔助步驟,該輔助步驟從所述文件信息中提取所述語音數(shù)據(jù);所述轉換目標提取步驟(S614)還包括下述的輔助步驟,該輔助步驟提取與待朗讀的所述文本數(shù)據(jù)相關的所述語音數(shù)據(jù);并且所述語音輸出步驟(S616)還包括下述的輔助步驟,該輔助步驟將所述語音數(shù)據(jù)轉換為發(fā)聲的語音輸出。
14.根據(jù)權利要求8所述的介質,所述處理還包括音樂輸出步驟(S728),用于將演奏數(shù)據(jù)轉換為音樂聲音輸出;所述文件信息包括伴隨有演奏數(shù)據(jù)的樂譜塊;所述版面分析步驟(S704)還包括下述的輔助步驟,該輔助步驟提取所述樂譜塊及其在所述文件信息中的位置信息、以及與所述樂譜塊相關聯(lián)的演奏數(shù)據(jù);所述差可讀性塊提取步驟(S708)還包括下述的輔助步驟,該輔助步驟根據(jù)所述樂譜塊及其在所述文件信息中的位置信息,以及所述顯示數(shù)據(jù)及其在所述文件信息中的位置信息,從所述顯示數(shù)據(jù)提取所述樂譜塊作為顯示塊;下述的輔助步驟,當所述屏幕上的顯示塊中的譜線間隔小于或等于預定間隔時,該輔助步驟將所述顯示塊分類為差可讀性塊;以及下述的輔助步驟,該輔助步驟用于向所述差可讀性塊分配塊編號;所述轉換目標提取步驟(S714)還包括下述的輔助步驟,該輔助步驟基于所述選擇塊的所述塊編號、所述差可讀性塊的所述塊編號和所述差可讀性塊在所述文件信息中的所述位置信息、以及所述樂譜塊及其在所述文件信息中的位置信息,提取與待演奏的所述樂譜數(shù)據(jù)相關聯(lián)的所述演奏數(shù)據(jù)。
15.一種用于呈現(xiàn)信息的裝置,其包括文本塊,該文本塊包含至少一個字符,所述裝置具有顯示屏,該裝置包括差可讀性塊提取器(108),用于提取待顯示在所述屏幕上的所述文本塊作為顯示塊,并且當所述屏幕上的顯示塊中的所述字符的尺寸小于或等于預定尺寸時,其用于將所述顯示塊分類為差可讀性塊,所述差可讀性塊顯示在所述屏幕上,相區(qū)別地顯示所述差可讀性塊的區(qū)域;塊選擇器(112),用于根據(jù)用戶的指示選擇待朗讀的塊;語音輸出單元(116),用于將待朗讀的所述文本數(shù)據(jù)轉換為發(fā)聲的語音輸出。
全文摘要
用于呈現(xiàn)信息的裝置及其方法。一種信息呈現(xiàn)裝置,其基于屏幕上的顯示狀態(tài)估測可能由用戶分類為差可讀性塊而可能希望朗讀的文本塊。提供了一種使得能夠從這些文本塊中進行選擇的簡單裝置。差可讀性塊提取器將待顯示在屏幕上的文本分為與單個文本塊相對應的塊,將包括尺寸小于或等于預定尺寸的字符的塊分類為差可讀性塊,并且向差可讀性塊分配塊編號。文件顯示單元將各個差可讀性塊的區(qū)域顯示為與其它區(qū)域不同,并且向各個差可讀性塊分配塊編號。當用戶按下與塊編號相對應的數(shù)字鍵時,朗讀各個文本塊中的文本。
文檔編號G06F3/16GK1834854SQ20051008859
公開日2006年9月20日 申請日期2005年8月4日 優(yōu)先權日2005年3月16日
發(fā)明者村瀨健太郎, 渡邊一宏 申請人:富士通株式會社