專利名稱:聲控mp3播放器的制作方法
技術領域:
本實用新型涉及一種MP3播放器,尤其涉及一種聲控MP3播放器。
背景技術:
MP3是一種音頻文件格式,通常是指MPEG(運動圖像專家組)的第三代,其利用音頻數(shù)據(jù)編碼技術在不降低現(xiàn)有數(shù)據(jù)音質的情況對音頻數(shù)據(jù)進行壓縮。而MP3播放器由于其結構小巧、操作便捷逐漸取代隨身聽(Walkman)成為人們的新寵。而隨著科技的不斷進步,MP3播放器的功能也在日益增多。目前已經(jīng)出現(xiàn)一種聲控MP3播放器,用戶可以利用語音指令對MP3播放器進行操作。但是,這種MP3播放器用于接收用戶語音指令的受話器(麥克風)以及功能切換鍵設置在播放器主機上。通常用戶都是把播放器主機放在口袋或包內(nèi),然后通過耳機聽歌,那么用戶在進行語音操作時需要將播放器主機拿到面前,按下功能切換鍵并近距離地對著播放器主機輸入語音指令。而在這個過程中,用戶完全可以通過播放器主機的控制鍵來對MP3播放器進行操作,所以目前的聲控MP3播放器并沒有實用價值。
實用新型內(nèi)容為了解決現(xiàn)有技術的聲控MP3播放器的受話器設置在播放器主機上不便使用的技術問題,本實用新型提供一種將受話器設置在耳機上的MP3播放器,以方便用戶實現(xiàn)聲控功能。本實用新型還通過在耳機上設置功能切換鍵解決了現(xiàn)有技術的聲控MP3播放器的聲控功能切換鍵設置在播放器主機上而造成的使用不便。
本實用新型解決現(xiàn)有技術的聲控MP3播放器的受話器設置在播放器主機上不便使用的技術問題所采用的技術方案是提供一種聲控MP3播放器,該MP3播放器包括播放器主機和與播放器主機相連的耳機,播放器主機內(nèi)設置有主控模塊和語音識別模塊,主控模塊根據(jù)語音識別模塊識別出的語音指令對播放器的功能進行控制,該耳機上設置有受話器,以便用戶通過受話器輸入語音指令。
根據(jù)本實用新型的一優(yōu)選結構,耳機上還設置有功能切換鍵。
根據(jù)本實用新型的一優(yōu)選結構,耳機為有線耳機。
根據(jù)本實用新型的一優(yōu)選結構,受話器設置在耳機的耳機線上。
根據(jù)本實用新型的一優(yōu)選結構,功能切換鍵設置在耳機的耳機線上。
根據(jù)本實用新型的一優(yōu)選結構,耳機是無線耳機。
根據(jù)本實用新型的一優(yōu)選結構,耳機是藍牙耳機。
根據(jù)本實用新型的一優(yōu)選結構,主控模塊根據(jù)語音識別模塊識別出的語音指令改變播放器主機正在播放的曲目。
根據(jù)本實用新型的一優(yōu)選結構,語音識別模塊采用針對非特定人的語音識別方法識別語音指令。
上述結構的有益效果是用戶可以直接利用設置在耳機上的功能切換鍵切換到聲控模式并利用設置在耳機上的受話器發(fā)送語音指令,來對MP3進行遠距離操作。
圖1是本實用新型的聲控MP3播放器一實施例的結構示意圖;圖2是圖1所示的聲控MP3播放器的示意框圖。
具體實施方式
以下結合附圖和實施例對本實用新型進一步說明。
參見圖1,圖1是本實用新型的聲控MP3播放器一實施例的結構示意圖。在本實施例中,聲控MP3播放器1包括用于播放MP3格式音頻數(shù)據(jù)的播放器主機10和通過耳機插孔120與播放器主機11連接的有線耳機13。參見圖2,圖2是圖1所示的聲控MP3播放器的示意框圖。播放器主機11內(nèi)部的電路板上設置有主控模塊111、存儲器113、語音D/A轉換模塊115、語音識別模塊117等功能模塊以及USB接口119、耳機插孔120等外部接口。其中,主控模塊111負責MP3文件的解碼、USB接口119傳入數(shù)據(jù)的處理、寫入\讀取存儲器113內(nèi)的數(shù)據(jù)以及控制語音D/A模塊115發(fā)聲等的工作,以便連接播放器主機11內(nèi)的所有主要部件,協(xié)調各部件工作狀態(tài)。存儲器113內(nèi)包括指令存儲模塊和數(shù)據(jù)存儲模塊。語音D/A轉換模塊115由主控模塊111控制,將數(shù)字形式的MP3文件轉換成模擬數(shù)據(jù)。有線耳機13包括插頭131、耳機線133和耳塞135,其中插頭131插入耳機插孔120,語音D/A轉換模塊115產(chǎn)生的模擬信號經(jīng)耳機線133傳輸并由耳塞135產(chǎn)生聲音。此外,在本實施例中,有線耳機13的耳機線133上還設置有受話器137和功能切換鍵139。
使用時,用戶直接利用耳機線133上的功能切換鍵139切換到語音控制模式(例如,點播模式)。當處于點播模式時,用戶通過受話器137輸入歌名、歌星名等語音指令,語音指令輸入到語音識別模塊117,語音識別模塊117提取語音指令的特征量,并根據(jù)存儲模塊113中存儲的信息識別該特征量并輸出識別結果。主控模塊111根據(jù)識別結果播放相應歌名、歌星的MP3文件。
當采用上述接收時,用戶不需將MP3播放器拿出并近距離地對著播放器主機輸入語音指令,可以方便地實現(xiàn)遠距離操作。
本實用新型聲控MP3播放器的語音識別系統(tǒng)可以包括針對特定人的語音識別系統(tǒng)或針對非特定人的語音識別系統(tǒng)。在針對特定人的語音識別系統(tǒng)中,用戶需要事先對每一個語音指令進行訓練。在訓練階段,用戶通過學習模式將每個語音指令依次說數(shù)遍,語音識別模塊提取語音指令的特征量,并將特征量按序列存入存儲模塊中。在識別階段,語音識別模塊將輸入語音指令的特征量依次與存儲模塊中存儲的每一個特征量進行相似度比較,將相似度最高者作為識別結果輸出或者輸出與該特征量相對應的控制指令。這種語音識別系統(tǒng)的識別性能隨著語音指令數(shù)目的增加會有明顯的下降,并且對于不同用戶、在不同的噪聲環(huán)境中,以及不同的時間相同用戶的不同生理、心理狀態(tài)下,系統(tǒng)的性能都會受到明顯的影響,因而并不適用于MP3播放器的大批量生產(chǎn)。當采用針對非特定人的語音識別系統(tǒng)中,采用基于統(tǒng)計模型的算法,系統(tǒng)開發(fā)者事先采集大量的語音數(shù)據(jù)進行訓練,得到聲學模型并存儲在存儲模塊中。在識別階段,語音識別模塊將用戶的輸入語音指令的特征量與通過聲學模型構建的識別網(wǎng)絡進行匹配解碼,輸出該語音指令或與該語音指令相對應的控制指令。主控模塊可根據(jù)語音識別模塊輸出的識別結果對MP3播放器進行控制。非特定人語音識別系統(tǒng)對于用戶而言,不需要引入繁瑣的訓練過程,方便了用戶的使用;同時它可以供不同的人使用,因此大大拓寬了應用范圍。另一方面,由于采用了基于統(tǒng)計模型的算法,其穩(wěn)健性和識別性能都比特定人識別系統(tǒng)大大的提高,識別性能不會隨著識別詞條數(shù)目的增加有明顯的下降,并且具有一定的抗噪能力。
在上述實施例中,僅以有線耳機以及點播形式對本實用新型的聲控MP3播放器進行了示范性描述,但本實用新型的范圍并不局限與此。例如,有線耳機可以由無線耳機(例如,藍牙耳機代替);用戶還可以通過受話器對MP3播放器進行其它操作,例如播放、停止、控制音量等。
上述的詳細描述僅是示范性描述,本領域技術人員在不脫離本實用新型所保護的范圍和精神的情況下,可根據(jù)不同的實際需要設計出各種實施方式。
權利要求1.一種聲控MP3播放器,所述MP3播放器包括播放器主機和與所述播放器主機相連的耳機,所述播放器主機內(nèi)設置有主控模塊和語音識別模塊,所述主控模塊根據(jù)所述語音識別模塊識別出的語音指令對所述播放器的功能進行控制,其特征在于所述耳機上設置有受話器,以便用戶通過所述受話器輸入所述語音指令。
2.根據(jù)權利要求1所述的聲控MP3播放器,其特征在于所述耳機上還設置有功能切換鍵。
3.根據(jù)權利要求2所述的聲控MP3播放器,其特征在于所述耳機為有線耳機。
4.根據(jù)權利要求3所述的聲控MP3播放器,其特征在于所述受話器設置在所述耳機的耳機線上。
5.根據(jù)權利要求3所述的聲控MP3播放器,其特征在于所述功能切換鍵設置在所述耳機的耳機線上。
6.根據(jù)權利要求2所述的聲控MP3播放器,其特征在于所述耳機是無線耳機。
7.根據(jù)權利要求6所述的聲控MP3播放器,其特征在于所述耳機是藍牙耳機。
專利摘要本實用新型涉及一種聲控MP3播放器,該MP3播放器包括播放器主機和與播放器主機相連的耳機,播放器主機內(nèi)設置有主控模塊和語音識別模塊,該主控模塊根據(jù)語音識別模塊識別出的語音指令對播放器的功能進行控制,該耳機上設置有受話器,以便用戶通過該受話器輸入語音指令。此外,該耳機上還設置有功能切換鍵。當采用上述結構時,用戶可以直接利用設置在耳機上的功能切換鍵切換到聲控模式并利用設置在耳機上的受話器發(fā)送語音指令,以便對MP3播放器進行遠距離操作。
文檔編號G06F12/00GK2862265SQ20052006629
公開日2007年1月24日 申請日期2005年10月31日 優(yōu)先權日2005年10月31日
發(fā)明者陳修志 申請人:陳修志