聲音識別處理裝置、聲音識別處理方法以及顯示裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本公開涉及識別用戶發(fā)出的聲音來進(jìn)行動作的聲音識別處理裝置、聲音識別處理方法以及顯示裝置。
【背景技術(shù)】
[0002]專利文獻(xiàn)I公開了具有聲音識別功能的聲音輸入裝置。該聲音輸入裝置構(gòu)成為:接收用戶發(fā)出的聲音,對接收到的聲音進(jìn)行解析,由此對用戶的聲音所表示的命令進(jìn)行識別(聲音識別),并根據(jù)聲音識別出的命令來控制設(shè)備。即,專利文獻(xiàn)I的聲音輸入裝置能夠?qū)τ脩羧我獍l(fā)出的聲音進(jìn)行聲音識別,并根據(jù)作為該聲音識別出的結(jié)果的命令(指令)來控制設(shè)備。
[0003]例如,使用該聲音輸入裝置的用戶在利用電視接收機(jī)(以下記為“電視機(jī)”)、PC(Personal Computer;個人計算機(jī))等對瀏覽器進(jìn)行操作時,能夠利用該聲音輸入裝置的聲音識別功能來進(jìn)行顯示在瀏覽器上的超文本的選擇。此外,用戶也能夠利用該聲音識別功能來進(jìn)行在提供搜索服務(wù)的網(wǎng)站(搜索站點)上的搜索。
[0004]在先技術(shù)文獻(xiàn)
[0005]專利文獻(xiàn)
[0006]專利文獻(xiàn)1:日本專利第4812941號公報
【發(fā)明內(nèi)容】
[0007]本公開提供提升用戶的操作性的聲音識別處理裝置以及聲音識別處理方法。
[0008]本公開中的聲音識別處理裝置具備:聲音獲取部、第I聲音識別部、第2聲音識別部、篩選部、存儲部和處理部。聲音獲取部構(gòu)成為獲取用戶發(fā)出的聲音并輸出聲音信息。第I聲音識別部構(gòu)成為將聲音信息變換為第I信息。第2聲音識別部構(gòu)成為將聲音信息變換為第2信息。篩選部構(gòu)成為從第2信息之中篩選第3信息和第4信息。存儲部構(gòu)成為存儲第I信息、第3信息以及第4信息。處理部構(gòu)成為執(zhí)行基于第I信息、第3信息以及第4信息的處理。并且,處理部構(gòu)成為:若第I信息、第3信息以及第4信息之中有一個或者兩個不足信息,則利用存儲部中存儲的信息補充該不足信息來執(zhí)行處理。
[0009]本公開中的聲音識別處理方法包括:獲取用戶發(fā)出的聲音并變換為聲音信息的步驟;將聲音信息變換為第I信息的步驟;將聲音信息變換為第2信息的步驟;從第2信息之中篩選第3信息和第4信息的步驟;在存儲部中存儲第I信息、第3信息以及第4信息的步驟;執(zhí)行基于第I信息、第3信息以及第4信息的處理的步驟;和若第I信息、第3信息以及第4信息之中有一個或者兩個不足信息,則利用存儲部中存儲的信息來補充的步驟。
[0010]本公開中的顯示裝置具備:聲音獲取部、第I聲音識別部、第2聲音識別部、篩選部、存儲部、處理部和顯示部。聲音獲取部構(gòu)成為獲取用戶發(fā)出的聲音并輸出聲音信息。第I聲音識別部構(gòu)成為將聲音信息變換為第I信息。第2聲音識別部構(gòu)成為將聲音信息變換為第2信息。篩選部構(gòu)成為從第2信息之中篩選第3信息和第4信息。存儲部構(gòu)成為存儲第I信息、第3信息以及第4信息。處理部構(gòu)成為執(zhí)行基于第I信息、第3信息以及第4信息的處理。顯示部構(gòu)成為顯示處理部中的處理結(jié)果。并且,處理部構(gòu)成為:若第I信息、第3信息以及第4信息之中有一個或者兩個不足信息,則利用存儲部中存儲的信息補充該不足信息來執(zhí)行處理。
[0011]本公開中的聲音識別處理裝置能夠提升用戶進(jìn)行聲音操作時的操作性。
【附圖說明】
[0012]圖1是示意性地表示實施方式I中的聲音識別處理系統(tǒng)的圖。
[0013]圖2是表示實施方式I中的聲音識別處理系統(tǒng)的一構(gòu)成例的框圖。
[0014]圖3是表示實施方式I中的聲音識別處理系統(tǒng)所進(jìn)行的聽寫的概要的圖。
[0015]圖4是表示實施方式I中的聲音識別處理裝置所進(jìn)行的關(guān)鍵字單一搜索處理的一動作例的流程圖。
[0016]圖5是表示實施方式I中的聲音識別處理裝置所進(jìn)行的關(guān)鍵字聯(lián)想搜索處理的一動作例的流程圖。
[0017]圖6是表示實施方式I中的聲音識別處理裝置所進(jìn)行的聲音識別解釋處理的一動作例的流程圖。
[0018]圖7是示意性地表示實施方式I中的聲音識別處理裝置的保留字表格的一例的圖。
【具體實施方式】
[0019]以下,適當(dāng)參照附圖來詳細(xì)地說明實施方式。不過,有時也會根據(jù)需要來省略詳細(xì)說明。例如,有時將省略已經(jīng)熟知的事項的詳細(xì)說明、針對實質(zhì)上為相同構(gòu)成的重復(fù)說明。其原因在于,為了避免下面的說明變得不必要的冗長,使本領(lǐng)域技術(shù)人員易于理解。
[0020]另外,為了使本領(lǐng)域技術(shù)人員充分地理解本公開而提供了附圖以及下述說明,并非意圖通過這些內(nèi)容來限定請求保護(hù)的范圍所記載的主題。
[0021](實施方式I)
[0022]以下,利用圖1?圖7來說明實施方式I。另外,在本實施方式中,作為具備聲音識別處理裝置的顯示裝置的一例而列舉了電視接收機(jī)(電視機(jī))10,但顯示裝置絲毫不限定于電視機(jī)1。例如,也可以為PC、平板終端等。
[0023][1-1.構(gòu)成]
[0024]圖1是示意性地表示實施方式I中的聲音識別處理系統(tǒng)11的圖。在本實施方式中,在作為顯示裝置的一例的電視機(jī)10中內(nèi)置有聲音識別處理裝置。
[0025]本實施方式中的聲音識別處理系統(tǒng)11具備電視機(jī)10和聲音識別部50。此外,聲音識別處理系統(tǒng)11也可以具備遙控器(以下也記為“遙控”)20和便攜式終端30的至少一者。
[0026]若電視機(jī)10中啟動了聲音識別處理裝置,則在電視機(jī)10的顯示部140中,與基于輸入影像信號、接收到的廣播信號等的影像一起顯示聲音識別圖標(biāo)201和表示集音到的聲音的音量的指示器202。這是為了向用戶700示出已變?yōu)槟軌驅(qū)崿F(xiàn)基于用戶700的聲音的電視機(jī)10的操作(以下記為“聲音操作”)的狀態(tài),并且促使用戶700發(fā)言。
[0027]若用戶700發(fā)出聲音,則該聲音被用戶700所使用的遙控器20、便攜式終端30中內(nèi)置的話筒集音,并轉(zhuǎn)發(fā)給電視機(jī)10。然后,用戶700發(fā)出的聲音被電視機(jī)10中內(nèi)置的聲音識別處理裝置聲音識別。在電視機(jī)10中,根據(jù)該聲音識別的結(jié)果來進(jìn)行電視機(jī)10的控制。
[0028]電視機(jī)10也可以具備內(nèi)置話筒130。在此情況下,若用戶700朝向電視機(jī)10所具備的內(nèi)置話筒130發(fā)言,則該聲音被內(nèi)置話筒130集音,并被聲音識別處理裝置聲音識別。因此,也能夠?qū)⒙曇糇R別處理系統(tǒng)11設(shè)為不具備遙控器20以及便攜式終端30的構(gòu)成。
[0029]此外,電視機(jī)10經(jīng)由網(wǎng)絡(luò)40而與聲音識別部50連接。并且,能夠在電視機(jī)10與聲音識別部50之間進(jìn)行通信。
[0030]圖2是表示實施方式I中的聲音識別處理系統(tǒng)11的一構(gòu)成例的框圖。
[0031]電視機(jī)10具有:聲音識別處理裝置100、顯示部140、收發(fā)部150、調(diào)諧器160、存儲部171、內(nèi)置話筒130和無線通信部180。
[0032]聲音識別處理裝置100構(gòu)成為獲取用戶700發(fā)出的聲音并對獲取到的聲音進(jìn)行解析。并且,構(gòu)成為識別該聲音所表示的關(guān)鍵字以及指令并根據(jù)識別出的結(jié)果來進(jìn)行電視機(jī)10的控制。聲音識別處理裝置100的具體構(gòu)成將后述。
[0033]內(nèi)置話筒130是構(gòu)成為主要對來自與顯示部140的顯示面對置的方向的聲音進(jìn)行集音的話筒。即,內(nèi)置話筒130將集音方向設(shè)定為能夠?qū)εc電視機(jī)10的顯示部140面對的用戶700發(fā)出的聲音進(jìn)行集音,從而能夠集音用戶700發(fā)出的聲音。內(nèi)置話筒130可以設(shè)置在電視機(jī)1的框體內(nèi),也可以如圖1中示出的一例那樣設(shè)置在電視機(jī)1的框體外。
[0034]遙控器20是用戶700對電視機(jī)10進(jìn)行遠(yuǎn)程操作用的控制器。遙控器20除了電視機(jī)10的遠(yuǎn)程操作所需的一般構(gòu)成之外,還具有話筒21以及輸入部22。話筒21構(gòu)成為集音用戶700發(fā)出的聲音并輸出聲音信號。輸入部22構(gòu)成為受理用戶700手動進(jìn)行的輸入操作并輸出與輸入操作相應(yīng)的輸入信號。輸入部22例如為觸摸板,但也可以為鍵盤、按鈕等。根據(jù)被話筒21集音到的聲音而產(chǎn)生的聲音信號、或者通過用戶700對輸入部22進(jìn)行輸入操作而產(chǎn)生的輸入信號,例如通過紅外線、電波等方式被無線發(fā)送至電視機(jī)10。
[0035]顯示部I 40例如為液晶顯示器,但也可以為等離子顯示器、或者有機(jī)EL(ElectroLuminescence ;電致發(fā)光)顯示器等。顯示部140由顯示控制部108來控制,顯示基于來自外部的輸入影像信號、由調(diào)諧器160接收到的廣播信號等的圖像。
[0036]收發(fā)部150與網(wǎng)絡(luò)40連接,構(gòu)成為通過網(wǎng)絡(luò)40而與網(wǎng)絡(luò)40所連接的外部設(shè)備(例如聲音識別部50)進(jìn)行通信。
[0037]調(diào)諧器160構(gòu)成為經(jīng)由天線(未圖示)來接收地面廣播、衛(wèi)星廣播的電視廣播信號。調(diào)諧器160也可以構(gòu)成為接收經(jīng)由專用線纜而發(fā)送的電視廣播信號。
[0038]存儲部171例如為非易失性的半導(dǎo)體存儲器,但也可以為易失性的半導(dǎo)體存儲器、或者硬盤等。存儲部171存儲電視機(jī)10的各部分的控制中所利用的信息(數(shù)據(jù))、程序等。
[0039]便攜式終端30例如為智能手機(jī),能夠?qū)崿F(xiàn)用于對電視機(jī)10進(jìn)行遠(yuǎn)程操作的軟件的動作。因此,在本實施方式中的聲音識別處理系統(tǒng)11之中,能夠?qū)⒃撥浖幼鞯谋銛y式終端30使用在電視機(jī)10的遠(yuǎn)程操作中。便攜式終端30具有話筒31以及輸入部32。話筒31是便攜式終端30所內(nèi)置的話筒,與遙控器20所配備的話筒21同樣,構(gòu)成為集音用戶700發(fā)出的聲音并輸出聲音信號。輸入部32構(gòu)成為受理用戶700手動進(jìn)行的輸入操作并輸出與輸入操作相應(yīng)的輸入信號。輸入部32例如為觸摸面板,但也可以為鍵盤、按鈕等。該軟件動作的便攜式終端30與遙控器20同樣,將基于被話筒31集音到的聲音的聲音信號、或者通過用戶700對輸入部32進(jìn)行輸入操作而產(chǎn)生的輸入信號,例如通過紅外線、電波等方式無線發(fā)送至電視機(jī)10。
[0040]電視機(jī)10、與遙控器20或者便攜式終端30,例如通過無線LAN(Local AreaNetwork;局域網(wǎng))、Bluetooth(注冊商標(biāo))等無線通信而被連接。
[0041]網(wǎng)絡(luò)40例如為因特網(wǎng),但也可以為其他網(wǎng)絡(luò)。
[0042]聲音識別部50是經(jīng)由網(wǎng)絡(luò)40而與電視機(jī)10連接的服務(wù)器(云上的服務(wù)器)。聲音識別部50接收從電視機(jī)10發(fā)送來的聲音信息,并將接收到的聲音信息變換為字符串。另外,該字符串既可以為多個字符也可以為一個字符。然后,聲音識別部50將表示變換后的字符串的字符串信息作為聲音識別的結(jié)果經(jīng)由網(wǎng)絡(luò)40發(fā)送至電視機(jī)10。
[0043]聲音識別處理裝置100具有:聲音獲取部101、聲音處理部102、識別結(jié)果獲取部103、意圖解釋處理部104、字存儲處理部105、指令處理部106、搜索處理部107、顯示控制部108、操作受理部110和存儲部170。
[0044]存儲部170例如為非易失性的半導(dǎo)體存儲器,但也可以為易失性的半導(dǎo)體存儲器或者