聽寫系統(tǒng)語音到文本轉換用戶性能的測量方法和系統(tǒng)的制作方法

文檔序號：2823143閱讀：263來源：國知局

專利名稱：聽寫系統(tǒng)語音到文本轉換用戶性能的測量方法和系統(tǒng)的制作方法
技術領域：
本申請的技術一般涉及聽寫系統(tǒng)的語音到文本轉換，尤其涉及提供用于測量用戶性能(performance)的基線(base line)和量度(metric)的方法和系統(tǒng)。
背景技術：
許多公司為客戶提供了使用呼叫中心聯(lián)系本公司的能力，以便當場回復客戶的呼叫、糾正客戶的問題，或為客戶指派合理的資源來解決引起呼叫的問題。常規(guī)地，呼叫中心通過將呼叫從客戶指引到可用的代理或代表進行操作。除電話呼叫裝置以外，代理或代表通常還具有公司已授權或專門設計的便于幫助客戶的客戶關系管理屏?，F(xiàn)在參考圖1，示出了在呼叫中心100內的系統(tǒng)的概念性表示。呼叫中心100包括語音技術設備和基于IP的技術設備，其中語音技術設備位于信令和音頻路徑中，并終止于代理的電話(或頭戴式耳麥)，基于IP的技術設備支持CRM(也稱為客戶關系管理)應用程序，CRM應用程序的圖形用戶界面(GUI)在代理的諸如個人計算機或類似裝置這樣的處理器上運行。為支持這點，呼叫中心100包括自動呼叫分配(A⑶)102，其具有與代理的電話 106的音頻連接104。A⑶102還具有與交互語音應答(IVR) 110的音頻連接108。音頻連接 104和108可重疊、完全分離或合并到一起。IVRllO具有與計算機電話界面(CTI)的數(shù)據(jù) 連接112。CTI114典型地為A⑶102提供呼叫控制116，和向代理的計算機120提供數(shù)據(jù)和應用程序控制118。因此，當客戶使用電話122或者類似的裝置通過諸如所示的公共交換電話網(wǎng)(PSTN)之類的常規(guī)網(wǎng)絡IM呼叫該呼叫中心時，向代理提供用來幫助呼叫者所必要的音頻、數(shù)據(jù)和應用程序。盡管圖1標識出如圖所示的通過常規(guī)的PSTN進行的客戶呼叫，但來自客戶的呼叫可從計算機或基于電纜的VoIP網(wǎng)絡發(fā)起。例如當客戶使用常規(guī)的陸上通信線或蜂窩電話時，該網(wǎng)絡IM可以是如圖所示的常規(guī)PSTN網(wǎng)絡?；蛘?，網(wǎng)絡IM可以是計算網(wǎng)絡，例如 LAN、WAN、WLAN、ffffAN、WiFi、因特網(wǎng)、以太網(wǎng)或其它私有區(qū)域網(wǎng)絡。當網(wǎng)絡1 是計算網(wǎng)絡時，來自客戶的呼叫可從例如計算機電話的能夠實現(xiàn)IP語音技術(VoIP)的設備發(fā)起。注意，可使用常規(guī)技術將VoIP電話轉接到常規(guī)PSTN網(wǎng)絡，此外例如，常規(guī)陸上通信線可被連接到使用軟電話(soft phone)或媒體網(wǎng)關的計算機網(wǎng)絡。
一旦與客戶服務代表間的呼叫建立起來，并且CRM應用程序在代表的用戶界面上運行，客戶服務代表將請求客戶的輸入。這種輸入可包括諸如客戶名、地址、問題性質以及類似內容的信息。傳統(tǒng)地，代表通過將信息鍵入各自的輸入信息區(qū)來輸入這種信息。在通話結束時，經(jīng)常是客戶服務代表填寫CRM應用程序中的通常熟知為注釋或通話結束的注釋的信息區(qū)。這種信息區(qū)通常由代表來鍵入確認信息，例如對客戶投訴或類似事件的處理。雖然CRM應用程序和信息生成是有用的工具，但許多客戶服務代表并非是高效率的打字員。而且，即使對于高效率打字員，已經(jīng)被公認的是大多數(shù)人說話速度也大大快于他們的打字速度。因此，近來使用例如Nuance通信公司的Dragon Naturally Speaking聽寫系統(tǒng)進行聽寫，來代替將信息鍵入各種信息區(qū)已經(jīng)成為一種趨勢。然而，使用聽寫系統(tǒng)作為工具來向CRM應用程序中的信息區(qū)添加信息，到目前為止是麻煩而不方便的。此外，很難提供量度，來衡量與基于打字的系統(tǒng)相對比基于聽寫的系統(tǒng)的性能。因此依據(jù)這種背景，需要提供一種聽寫系統(tǒng)的語音到文本轉換的用戶性能的測量方法和系統(tǒng)。

發(fā)明內容
一種測量使用轉錄機的用戶性能的計算機實現(xiàn)的方法被提供。該方法包括接收轉錄文件，該轉錄文件包含由被評估的用戶生成的音頻文件的轉錄文本。該系統(tǒng)基于轉錄文件確定例如每分鐘字數(shù)、每分鐘錯誤數(shù)、每字錯誤、每分鐘有效字數(shù)，或類似量度的至少一個性能量度。該性能量度可指示用戶性能。該性能量度被發(fā)送給能夠評估用戶性能的管理員。依照在此描述的一般原理，任意上述實施例的特征可彼此相結合地來使用。在結合附圖和權利要求書閱讀了下面的詳細描述后，能更完整地理解這些以及其它的實施例、特征和優(yōu)點。在某些配置中，該方法和系統(tǒng)可被提供以相當?shù)?comparative)性能量度。例如，可提供或生成相當?shù)拇蜃中阅芰慷?，以便與更多常規(guī)領域的打字系統(tǒng)相對比地來評估使用聽寫和轉錄系統(tǒng)的用戶的性能。還提供了被配置成獲得關于聽寫系統(tǒng)的使用的性能信息的計算機系統(tǒng)。該系統(tǒng)包括處理器和與該處理器電子通信的存儲器。該處理器被配置為接收由用戶的音頻文件生成的轉錄文件，并基于該轉錄文件確定至少一個聽寫性能量度，該至少一個聽寫性能量度指示了用戶性能。該處理器被配置成將該至少一個聽寫性能量度發(fā)送給管理員，由此該管理員可評估用戶的性能。還提供了用于評估使用聽寫系統(tǒng)的用戶的性能的計算機程序產(chǎn)品，該計算機程序產(chǎn)品包括其上具有指令的計算機可讀媒介。該計算機編程產(chǎn)品由介質攜帶，并可加載到處理器。介質上的代碼被編程為接收用戶的由轉錄機從該用戶的音頻文件產(chǎn)生的轉錄文件。而且，介質上的代碼被編程為從轉錄文件確定至少一個聽寫性能量度，該至少一個聽寫性能量度指示用戶性能。介質上的代碼被編程為將被確定的至少一個聽寫性能量度發(fā)送給管理員。由此該管理員可評估用戶的性能。

圖1是呼叫中心系統(tǒng)的功能框5
圖2是與本申請的技術的示范性實施例一致的評估系統(tǒng)的功能性框圖；圖3是與本申請的技術實施例相關聯(lián)的示范性方法的示范性操作流程圖；圖4是與本申請的技術的示范性實施例相關聯(lián)的評估屏幕的示范性顯示；圖5是與本申請的技術的示范性實施例相關聯(lián)的評估屏幕的示范性顯示；圖6是與本申請的技術的評估相關聯(lián)的表格；圖7是與本申請的技術的實施例相關聯(lián)的選項的示范性表格；圖8是與本申請的技術相關聯(lián)的示范性數(shù)據(jù)表格。
具體實施例方式將參考客戶呼叫中心應用程序來解釋本申請的技術。該技術大體上被描述為將音頻從用戶引導向將音頻轉換為文本并返回轉錄(transcription)文本的遠程服務器。本領域的普通技術人員在閱讀了本公開內容后將能夠認識到本申請的技術在其它環(huán)境中也是有用的。例如，代替由遠程服務器提供轉錄，轉錄可被直接加載到用戶處理器。此外，本申請的技術可用在不同于呼叫中心的環(huán)境中，以提供與聽寫系統(tǒng)有關的基線和公制計量 (metric measurement) 0而且，本申請的技術將參考示范性實施例來描述。在此使用措辭 “示范性”來表示“用作示例、舉例或說明”。此處描述為“示范性”的任意實施例不必被理解為優(yōu)選或優(yōu)于其它實施例。此外，除非明確指出，否則此處描述的所有實施例都應被認為是示范性的。如上面所解釋的，基于聽寫的語音到文本轉換軟件已經(jīng)存在了一段時間。該聽寫可在本地處理器執(zhí)行，以便為用戶提供實時的或接近實時的口述轉錄(transcription)?；?者，可將口述批量加載到中央處理器或服務器，而在稍后返回轉錄文本。聽寫系統(tǒng)可采用自由形式、語法語音識別機或模式匹配語音識別。在其它實施例中，語音到文本的轉換可在實時或接近實時地工作的分布式聽寫系統(tǒng)中提供。一種這樣的分布式聽寫系統(tǒng)在提交于2008 年 12 月 19 日，標題為“distributed dictation/transcription system”的第 12/339，336 號美國待審專利申請中描述，在此結合該專利全部內容作為參考。首先參考圖2，提供了采用本申請的技術的評估系統(tǒng)200的功能框圖。評估系統(tǒng) 200包括例如微處理器、中央處理單元、臺式機、服務器、筆記本電腦、掌上電腦或類似裝置的處理器202。處理器202控制評估系統(tǒng)200的主要功能，該評估系統(tǒng)200包括在下文中描述的功能性操作。處理器202還處理操作評估系統(tǒng)200所需的各種輸入和/或數(shù)據(jù)。存儲器204與處理器202互連。存儲器204可置于遠處，或與處理器202協(xié)同定位。如同本文將要描述的，該存儲器204還可存儲對于評估系統(tǒng)200必需的或適宜的數(shù)據(jù)。如將要說明的，存儲器204可包括生成基線和評估量度信息、關于任意特定文本或評估的結果、時間信息或將被解釋的類似項目。評估系統(tǒng)200還包括可從例如客戶服務代表的用戶接收音頻信息的音頻接收接口 206或端口。評估系統(tǒng)200還包括從用戶接收數(shù)據(jù)或向用戶發(fā)送數(shù)據(jù)的數(shù)據(jù)接口 208或端口。與處理器202互連的是語音到文本機210，其將從用戶接收的音頻信號轉換成文本文件，該文本文件可被返回給用戶，或作為評估部分進一步處理。語音到文本機210通常在本領域中是可理解的，在此不作進一步解釋。語音到文本機210可從遠程提供，可與處理器202集成或協(xié)同定位。
評估系統(tǒng)200還包括輸出裝置212，例如顯示器、打印機、電子郵件生成器或類似的本領域中常規(guī)設備，用來輸出評估系統(tǒng)200的結果?，F(xiàn)今許多企業(yè)和公司，在認識到聽寫提供的快捷和簡單的同時，需要某些測量由聽寫的使用所帶來的生產(chǎn)率的提高的實際器件(real means)。此外，一旦被安裝，聽寫系統(tǒng)的有效性必須被測量出來，以除提供其他信息以外，還提供系統(tǒng)未充分執(zhí)行時的指示?，F(xiàn) 在參考圖3，提供了示范性流程圖300，其示出了生成與基于聽寫的系統(tǒng)的使用有關的量度的示范性操作步驟。一種類型的性能量度與可生成信息的速度有關。如上所述，使用聽寫的一個優(yōu)點是可增加每次登記的速度。然而，理解效率的提高將是有用的。因此，如圖300 所示，用戶將發(fā)起一個測試，步驟302。接下來為該用戶提供樣本文本，步驟304。視情況可提供單個樣本或多個可選樣本。而且，在設計者的選擇方面，可以允許最終用戶提供自生成的或定制的樣本。提供樣本文本可包括從多個樣本文本中選擇一個的步驟。一旦被選中，該樣本文本被顯示給用戶，步驟306。該顯示可在用戶界面、顯示器或紙印本上提供。例如，參考圖4，提供了樣本顯示窗口 400。顯示窗口 400在樣本區(qū)域404內示出了樣本文本402。另一個區(qū)域406為空白。如將聯(lián)系圖3的剩余部分所描述的，當“開始”按鈕408被激活或以類似的方式被激活時，區(qū)域406被啟用來允許用戶將文本鍵入該區(qū)域。本技術可視情況包括打字部分。但是，另一方面，關于每分鐘鍵入的字數(shù)、每分鐘出現(xiàn)的錯誤或類似方面的信息可通過其他應用程序得到。因此，盡管描述了獲得打字相關信息的處理時，在此，可從其它程序或應用程序輸入打字信息，例如來自Mavis Beacon的應用程序可提供對比打字統(tǒng)計數(shù)據(jù)。但是，為了完備性，在此提供樣本打字評估。當準備開始測試打字部分時，用戶點擊開始按鈕來啟用文本區(qū)域406，步驟308，并且開始鍵入樣本文本，步驟310。點擊開始基本同時初始化跟蹤時間的計數(shù)器或時鐘，步驟312。一旦完成鍵入樣本文本，用戶將點擊結束按鈕410，步驟314，或者類似按鈕(可替換地，再次點擊開始按鈕)。這使得向區(qū)域406鍵入的能力被禁止并且停止了計數(shù)器或時鐘，步驟316。確定從開始打字到結束打字的時間，步驟318，并且保存該時間，步驟320。注意，視情況，區(qū)域406的激活可簡單地通過在該區(qū)域打字來完成，并且區(qū)域406的禁用可通過用戶敲擊例如返回、回車或類似鍵來完成。可選擇地，處理器202可對照著樣本文本檢查在區(qū)域406中鍵入的文本以判定差錯，步驟322?？商鎿Q地，步驟308到322可通過分離的應用程序獲得，將結果輸出應用程序或從應用程序輸入結果。用戶開始語音測試。在這種情況下，如圖5所示，事先選出的同樣的樣本文本可在區(qū)域402中被顯示。但是，聽寫文本和打字文本不需要是相同的，但當打字和聽寫樣本相同時可以進行更好的比較。準備好開始時，用戶選擇按下對話按鈕508，步驟324，并且讀出樣本文本，步驟326。選擇按下對話按鈕508基本上同時啟動了計數(shù)器或時鐘，步驟330。一旦該段被讀完，用戶可按下斷連按鈕510，步驟332，聽寫完成。該聽寫系統(tǒng)可被設計成接受宏(macro)來增加每分鐘的有效字數(shù)。例如，聽寫短句“we are unable to make the necessary over the air programming corrections until your phone is back on the AT&T network，可能是一個常用短句。系統(tǒng)可允許將宏編程為使得“phone out of network" 的聽寫導致在聽寫中返回以上子句。因此，代替21個單詞的聽寫，用戶可以聽寫4個單詞，這樣將平均占用較少的時間來聽寫，有效地增加了聽寫的每分鐘字數(shù)。具有宏或者不具有宏的音頻文件，將被發(fā)送給處理器并轉化成文本文件，步驟334，該文本文件被返回填入?yún)^(qū)
7域506，步驟336。用文本占用區(qū)域506將停止計數(shù)器或時鐘，并且處理器202將判定從該段被讀出到返回話語內容(speech)的時間，步驟338。而且，可選地，處理器202可通過將話語內容與樣本文本進行比較來判斷轉錄文本中的錯誤，步驟340。類似于打字信息，該處理器將聽寫統(tǒng)計數(shù)字與打字統(tǒng)計數(shù)字相比較可以從其它應用程序輸入聽寫統(tǒng)計數(shù)字。一旦打字和讀出部分都被完成，和/或從分離的應用程序輸入(即使所示的是鍵入和讀出，該步驟順序可顛倒)，處理器202將評估和提供許多的性能量度。一種樣本的性能量度在圖6中通過表格500示出。表格500標識測試運行的數(shù)量、測試平均長度、每分鐘聽寫字數(shù)和每分鐘打字字數(shù)。如所提到的，如果錯誤率是期望的，可針對錯誤調整每分鐘的字數(shù)，或者錯誤可被提供為示出每字平均錯誤、每分鐘錯誤或類似的獨立量度。聽寫的每分鐘字數(shù)或錯誤數(shù)以及打字的每分鐘字數(shù)或錯誤可以是判定出的每分鐘實際的或有效的字數(shù)或錯誤。此外，也可以期望或求出其它量度。同時測試初始化(initiative)是有用的，如本領域公知的那樣，許多聽寫系統(tǒng)可能需要對用戶進行培訓以便適當?shù)嘏c系統(tǒng)相交互。因此，允許管理員觀看關于性能和培訓的信息是有幫助的。例如，管理員可訪問如圖7所示的指示管理回顧處理，例如培訓報告 602、時間測試604、性能606和統(tǒng)計數(shù)字608的頁面。管理員可具有附加功能，例如，更新樣本或測試文本及類似文件的能力。如果管理員選擇了培訓報告602，如同所示出的，將為該管理員呈現(xiàn)備選的用戶列表。這允許該管理員選出將調查的用戶?；蛘?，可在單個顯示器上提供所有信息。該管理員將能夠識別該用戶是否已經(jīng)執(zhí)行了所要求的培訓的全部、部分、未執(zhí)行培訓或執(zhí)行了培訓的某種組合。此外，培訓文本和音頻可存儲下來，使得管理員能夠對用戶讀出的在培訓練習中呈現(xiàn)的文本進行快速的判定。接下來，例如管理員可選擇時間測試功能，用戶列表或全部信息將再次呈現(xiàn)。管理員將能夠識別，例如，完成了哪個時間測試，(協(xié)同對培訓特征的檢查)時間測試是在具有還是不具有適當?shù)呐嘤柡托阅艿那闆r下執(zhí)行的。各個結果(類似于以上那些結果)可由管理員相對于每個用戶來監(jiān)控。被監(jiān)控的結果可包括如所期望地那樣保存樣本文本、打字文本、轉錄文本和音頻，以便管理員能夠通過音頻、視頻或通過音頻、視頻的某種組合來回顧各用戶的性能。為了迅速做出如顯示器700的表702所示的總結，可提供給管理員例如用戶名、所執(zhí)行樣本測試、每分鐘字數(shù)和每分鐘聽寫的一般信息。表702的一般信息可配備到如顯示器700的表704所示文本的特定結果的鏈接。表704的細節(jié)包括樣本文本706、打字文本708、聽寫文本710以及到管理員在回顧時可聽到的音頻文件712的鏈接。代替?zhèn)€體的用戶，管理員可為所有用戶提供以上的和其它的性能指示，或者為用戶組選擇性能組。如同能夠理解的，以上方法和系統(tǒng)提供了通過將針對個體或一組個體將基于打字的輸入和口述輸入進行對比來基于時間和每分鐘字數(shù)測量性能的系統(tǒng)。該系統(tǒng)進一步通過跟蹤個體用戶輸入和將該個體用戶輸入保存在系統(tǒng)中，建立了基線測量和性能評估量度。在所提供的例子中，用戶最初使用鍵盤、鼠標、觸摸屏、光筆或類似設備的傳統(tǒng)輸入法將信息輸入系統(tǒng)。此外，用戶使用語音到文本轉錄將信息輸入。對技術設想的當前實現(xiàn)使用了基于web的用戶界面，允許各個用戶采用兩種方法執(zhí)行樣本文本的定時輸入。此外，該系統(tǒng)可跟蹤關于性能的其它量度。例如，該系統(tǒng)可跟蹤例如音頻轉錄平均持續(xù)時間、轉錄服務器平均等待時間、轉錄音頻的平均時間、聽寫數(shù)量、取消數(shù)量、錯誤數(shù)量或類似的統(tǒng)計數(shù)據(jù)。頻繁地影響聽寫性能的一個特征是音頻輸出212的質量。在許多不良的執(zhí)行情況下，可能是音頻質量太響而導致了系統(tǒng)飽和或削波(clipping)，和/或音頻質量太輕而導致話音被當作例如噪音而被拋棄。因此，本申請可提供一種添加到音頻文件或鏈接到系統(tǒng) 的音頻質量指示器，使得管理員或用戶可識別音頻質量問題。該音頻質量可以是在用戶講話時提供給用戶的視頻指示器，或是在用戶可能說話太響或太輕時做出補償?shù)哪承┢渌?型指示器。本領域技術人員將能夠理解，信息和信號可使用任意多種不同的技術和方法來表示。例如，在以上描述中所涉及的數(shù)據(jù)、指令、命令、信息、信號、比特、符號和碼片均可通過電壓、電流、電磁波、磁場或粒子、光學場或粒子或者其任意組合來表示。本領域的普通技術人員還應當理解與在此公開的實施方式有關的各種說明性的邏輯功能塊、模塊、電路和算法程序可以作為電子硬件、計算機軟件或者其組合來實現(xiàn)。為了清楚地舉例說明硬件和軟件的這種互換性，通常根據(jù)其功能來描述各種說明性的組件、功能塊、模塊、電路和步驟。這種功能是以硬件還是軟件來實現(xiàn)取決于對整個系統(tǒng)的特殊應用和設計約束。熟練技術人員可為每個特殊應用以變化的方式來實現(xiàn)所描述的功能，但是這種實現(xiàn)不應被解釋成造成對本發(fā)明的范圍的偏離。與在此公開的實施方式有關的各種說明性的邏輯功能塊、模塊和電路可以利用通用處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)或其他可編程邏輯器件、離散門或晶體管邏輯、離散的硬件組件、或者被設計成執(zhí)行在此描述的各功能的任何組合來實現(xiàn)或者執(zhí)行。通用處理器可以是微處理器，但是作為替換，處理器可以是任何傳統(tǒng)的處理器、控制器、微型控制器或者狀態(tài)機。處理器還可以作為計算裝置的組合來實現(xiàn)，例如DSP和微處理器、多個微處理器、一個或多個微處理器同DSP核心、或者任何其他這種結構的組合。與在此公開的實施方式有關的方法、程序或算法的步驟可以直接在硬件中、在由處理器執(zhí)行的軟件模塊中，或者在這二者的組合中實現(xiàn)。軟件模塊可以存在于隨機存取存儲器(RAM)、閃速存儲器、只讀存儲器(ROM)、電氣可編程ROM(EPROM)、電氣可擦除的可編程 ROM(EEPROM)、寄存器、硬盤、移動磁盤、CD-ROM或者任何其他形式本領域所公知的存儲介質中。示例性存儲介質用這樣的方式同處理器相耦合，使得處理器可以從存儲介質中讀取信息，也可以將信息寫入到存儲介質中。在替換方式中，存儲介質可以被集成到處理器中。處理器和存儲介質可以存在于ASIC中。在替換方式中，處理器和存儲介質可以作為用戶終端中的獨立元件。以上對所公開的實施方式的描述被提供來使本領域任何技術人員能夠制造或使用本發(fā)明。對本領域的技術人員來說，對這些實施方式的各種修改是顯而易見的，并且在不脫離本發(fā)明的精神或者范圍的情況下可以將在此定義的原理應用于其他實施方式。因此，本發(fā)明并不受到在此顯示的實施方式的限制，而是應當與符合在此公開的原理和新穎性特征的最寬范圍相一致。
權利要求
1.一種計算機實現(xiàn)的方法，用于測量使用轉錄機的用戶性能，其包括接收由轉錄機從用戶的音頻文件生成的所述用戶的轉錄文件；從所述轉錄文件確定至少一個聽寫性能量度，所述至少一個聽寫性能量度指示所述用戶的性能；并且將確定出的至少一個聽寫性能量度發(fā)送給管理員，由此該管理員能夠評估所述用戶的性能。
2.如權利要求1所述的方法，其中所述聽寫性能量度包括確定每分鐘被轉錄的字數(shù)。
3.如權利要求1所述的方法，其中所述每分鐘被轉錄的字數(shù)包括每分鐘的有效字數(shù)。
4.如權利要求2所述的方法，其中所述聽寫性能量度包括判定聽寫錯誤。
5.如權利要求1所述的方法，進一步包括獲得用戶的至少一個打字性能量度，并且將所述打字性能量度與所述聽寫性能量度作比較。
6.如權利要求2所述的方法，進一步包括獲得所述用戶的每分鐘打字字數(shù)的性能量度，并將所述每分鐘打字字數(shù)的性能量度與所述每分鐘被轉錄字數(shù)的性能量度作比較。
7.如權利要求6所述的方法，其中所述打字性能量度還包括打字錯誤，并且所述聽寫性能量度還包括聽寫錯誤。
8.如權利要求1所述的方法，其中所述用戶包括一組個人。
9.一種計算機實現(xiàn)的方法，用于測量使用轉錄機的用戶性能，其包括接收用戶生成的音頻文件；將所述音頻文件轉錄成包含與所述音頻相對應的文本的轉錄文件；將所述轉錄文件發(fā)送給用戶；基于所述用戶生成所述音頻文件和將所述轉錄文件發(fā)送給所述用戶所需的時間以及所述轉錄文件中的字數(shù)，來確定每分鐘聽寫字數(shù)的性能量度；獲得相應的每分鐘打字字數(shù)的性能量度；和將所述每分鐘聽寫字數(shù)的性能量度和所述每分鐘打字字數(shù)的性能量度發(fā)送給管理員，其中所述管理員可評估聽寫和打字之間的用戶性能。
10.如權利要求9所述的方法，其中所述每分鐘聽寫字數(shù)的性能量度或所述每分鐘打字字數(shù)的性能量度中的至少一個包括每分鐘有效字數(shù)。
11.如權利要求9所述的方法，進一步包括確定聽寫錯誤和打字錯誤的性能量度。
12.如權利要求9所述的方法，其中所述每分鐘打字字數(shù)從遠程應用程序輸入。
13.一種計算機系統(tǒng)，被配置成得出關于聽寫系統(tǒng)的使用的性能信息，其包括處理器；存儲器，與所述處理器進行電子通信；所述處理器被配置成接收由用戶的音頻文件生成的轉錄文件；基于所述轉錄文件確定至少一個聽寫性能量度；所述至少一個聽寫性能量度指示所述用戶的性能；并且將所述至少一個聽寫性能量度發(fā)送給管理員，由此所述管理員可評估所述用戶的性能。
14.如權利要求13所述的計算機系統(tǒng)，其中所述處理器被進一步配置成獲得所述用戶的與所述至少一個聽寫性能量度相對應的至少一個打字性能量度，并且將所述至少一個打字性能量度發(fā)送給所述管理員。
15.如權利要求13所述的計算機系統(tǒng)，其中所述至少一個聽寫性能量度選自于一組聽寫性能量度，該組聽寫性能量度是每分鐘有效字數(shù)、每分鐘實際字數(shù)或錯誤數(shù)。
16.如權利要求15所述的計算機系統(tǒng)，其中所述處理器被進一步配置成獲得所述用戶的與所述至少一個聽寫性能量度相對應的至少一個打字性能量度，并且將所述至少一個打字性能量度發(fā)送給所述管理員。
17.如權利要求14所述的計算機系統(tǒng)，其中所述處理器通過生成與所述至少一個聽寫性能量度相對應的至少一個打字性能量度來獲得所述至少一個打字性能量度。
18.一種計算機系統(tǒng)，被配置成得出關于聽寫系統(tǒng)的使用的性能信息，包括處理器；存儲器，與所述處理器進行電子通信；所述處理器包括用于接收從用戶的音頻文件生成的轉錄文件的裝置；用于基于所述轉錄文件確定至少一個聽寫性能量度的裝置；所述至少一個聽寫性能量度指示所述用戶的性能；以及用于將所述至少一個聽寫性能量度發(fā)送給管理員，由此所述管理員可以評估所述用戶的性能。
19.如權利要求18所述的計算機系統(tǒng)，其中所述處理器還包括用于獲得所述用戶的與所述至少一個聽寫性能量度相對應的至少一個打字性能量度和將所述至少一個打字性能量度發(fā)送給所述管理員的裝置。
20.一種計算機程序產(chǎn)品，用于評估使用聽寫系統(tǒng)的用戶的性能，所述計算機程序產(chǎn)品包括其上具有指令的計算機可讀介質，該指令包括被編程為接收由轉錄機從所述用戶的音頻文件生成的用戶的轉錄文件的代碼；被編程為從所述轉錄文件確定至少一個聽寫性能量度的代碼，所述至少一個聽寫性能量度指示用戶性能；以及被編程為將所確定的至少一個聽寫性能量度發(fā)送給管理員的代碼，由此所述管理員能夠評估所述用戶的性能。
全文摘要
一種計算機實現(xiàn)的系統(tǒng)和方法，用于評估使用聽寫系統(tǒng)的用戶的性能。該系統(tǒng)和方法包括接收由用戶音頻生成的文本或轉錄文件?；谠撧D錄文件生成例如每分鐘字數(shù)或錯誤數(shù)的性能量度。該性能量度被提供給管理員，使得該管理員能夠評估使用該聽寫系統(tǒng)的用戶的性能。
文檔編號G10L15/26GK102067208SQ200980123891
公開日2011年5月18日申請日期2009年4月23日優(yōu)先權日2008年4月23日
發(fā)明者布賴恩·馬奎特, 托德·埃斯皮, 查爾斯·科菲爾德申請人:Nvoq股份有限公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：布賴恩·馬奎特
技術所有人：ＮＶＯＱ股份有限公司
我是此專利的發(fā)明人

上一篇：用于從聲學數(shù)據(jù)生成詞條的方法和設備的制作方法
上一篇：混合吸音板的制作方法

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

語音聽寫相關技術

訊飛語音聽寫相關技術

訊飛語音聽寫使用方法相關技術

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

聽寫系統(tǒng)語音到文本轉換用戶性能的測量方法和系統(tǒng)的制作方法