1.一種計算機實施的語音識別的方法,所述方法包括:
通過加權有限狀態(tài)變換器(WFST)傳播令牌,并且包括將詞序列放置到詞網格中,所述加權有限狀態(tài)變換器(WFST)具有作為WFST的輸出標記的弧和詞或詞標識符;
當在沿著具有輸出符號的所述弧中的一個傳播的令牌處建立詞時,生成用于各個令牌的詞歷史指定,其中所述詞歷史指定指示詞序列;以及
通過至少部分地使用所述詞歷史指定確定是否應當在WFST的狀態(tài)中組合兩個或更多個令牌以形成單個令牌。
2.根據權利要求1所述的方法,所述方法包括當令牌的詞歷史指定相同時,在所述WFST的相同節(jié)點中重新組合兩個或更多個令牌,并且當兩個或更多個令牌的詞歷史指定不相同時避免重新組合。
3.根據權利要求1所述的方法,所述方法包括當所述令牌傳播時,將在具有輸出標記的所述WFST的弧處建立的詞放置到詞網格中。
4.根據權利要求3所述的方法,所述方法包括當多個令牌的詞歷史指定不同時,通過將所述多個令牌重新組合為單個新的活動令牌執(zhí)行所述詞網格的異常更新,并且包括:
當所述多個令牌的詞網格節(jié)點引用對來自所述多個令牌中的其他令牌的其他引用是唯一的時,將所述多個令牌的詞網格節(jié)點引用放置到所述新的活動令牌中,以及
當所述引用在所述多個令牌中的一個以上的令牌中相同時,對于所述新的活動令牌維持具有最佳分數(shù)的引用。
5.根據權利要求1所述的方法,其中所述指定是通過使用遞歸散列函數(shù)形成的散列標簽。
6.根據權利要求1所述的方法,所述方法包括將不同的值分配給將用作所述WFST的輸出符號的可能詞的詞匯表中的各個詞,并且使用對應于多個詞的多個值確定所述詞歷史指定。
7.根據權利要求1所述的方法,其中所述詞歷史指定根據所述詞序列內的所述詞的順序而不同。
8.根據權利要求1所述的方法,所述方法包括將多個最終結束令牌組合成單個話語結束令牌。
9.根據權利要求1所述的方法,所述方法包括
當令牌的詞歷史指定相同時,在所述WFST的所述相同節(jié)點中重新組合兩個或更多個令牌,并且當兩個或更多個令牌的詞歷史指定不相同時避免重新組合;
當所述令牌傳播時將在具有輸出標記的WFST的弧處建立的詞放置到詞網格中;
當多個令牌的詞歷史指定不同時,通過將多個令牌重新組合為單個新的活動令牌執(zhí)行所述詞網格的異常更新,并且包括:
當所述多個令牌的詞網格節(jié)點引用對來自所述多個令牌中的其他令牌的其他引用是唯一的時,將所述多個令牌的詞網格節(jié)點引用放置到所述新的活動令牌中,以及
當所述引用在所述多個令牌中的一個以上的令牌中是相同的時,對于所述新的活動令牌維持具有最佳分數(shù)的引用;
將不同的值分配給將用作所述WFST的輸出符號的可能詞的詞匯表中的各個詞,以及使用對應于多個詞的多個值確定所述詞歷史指定;以及
將多個最終結束令牌組合成單個話語結束令牌;
其中所述指定是通過使用遞歸散列函數(shù)形成的散列標簽;
其中所述詞歷史指定根據所述詞序列內的詞的順序而不同;
其中所述詞歷史指定是十六進制數(shù);其中用添加到所述十六進制數(shù)的令牌的每個詞更新所述十六進制數(shù);并且其中根據所述令牌中的詞的順序而不同地更新所述十六進制數(shù)。
10.一種計算機實施的語音識別的系統(tǒng),所述系統(tǒng)包括:
至少一個聲學信號接收單元;
至少一個處理器,其通信地連接到所述聲學信號接收單元;
至少一個存儲器,其通信地耦合到所述至少一個處理器;以及
加權有限狀態(tài)變換器(WFST)解碼器,其通信地耦合到所述處理器,并且:
通過加權有限狀態(tài)變換器(WFST)傳播令牌,并且包括將詞序列放置到詞網格中,所述加權有限狀態(tài)變換器(WFST)具有作為所述WFST的輸出標記的詞或詞標識符;
當在具有輸出符號的所述WFST的弧處建立詞時,生成用于各個令牌的詞歷史指定,其中所述詞歷史指定指示詞序列;以及
通過至少部分地使用所述詞歷史指定確定是否應當在所述WFST的狀態(tài)中組合兩個或更多個令牌以形成單個令牌。
11.根據權利要求10所述的系統(tǒng),其中所述WFST解碼器在令牌的詞歷史指定相同時在所述WFST的所述相同狀態(tài)中重新組合兩個或更多個令牌,并且當兩個或更多個令牌的詞歷史指定不相同時避免重新組合。
12.根據權利要求10所述的系統(tǒng),其中所述WFST解碼器在令牌傳播時將在具有輸出標記的所述WFST的弧處建立的詞放置到詞網格中。
13.根據權利要求12所述的系統(tǒng),其中在多個令牌的詞歷史指定不同時,所述WFST解碼器通過將多個令牌重新組合為單個新的活動令牌執(zhí)行所述詞網格的異常更新,并且包括:
當所述多個令牌的詞網格節(jié)點引用對來自所述多個令牌中的其他令牌的其他引用是唯一的時,將所述多個令牌的詞網格節(jié)點引用放置到所述新的活動令牌中,以及
當所述引用在所述多個令牌中的一個以上的令牌中相同時,對于新的活動令牌維持具有最佳分數(shù)的引用。
14.根據權利要求10所述的系統(tǒng),其中所述指定是通過使用遞歸散列函數(shù)形成的散列標簽。
15.根據權利要求10所述的系統(tǒng),其中所述WFST解碼器將不同的值分配給將用作所述WFST的輸出符號的可能詞的詞匯表中的各個詞,并且使用對應于多個詞的多個值確定所述詞歷史指定。
16.根據權利要求10所述的系統(tǒng),其中所述詞歷史指定根據所述詞序列內的所述詞的順序而不同。
17.根據權利要求10所述的系統(tǒng),其中所述WFST解碼器將多個最終結束令牌組合成單個話語結束令牌。
18.根據權利要求10所述的系統(tǒng),其中所述WFST解碼器:
當令牌的詞歷史指定相同時,在所述WFST的所述相同狀態(tài)中重新組合兩個或更多個令牌,并且當兩個或更多個令牌的詞歷史指定不相同時避免重新組合;
當令牌傳播時,將在具有輸出標記的所述WFST的弧處建立的所述詞放置在詞網格中;
當多個令牌的詞歷史指定不同時,通過將多個令牌重新組合為單個新的活動令牌執(zhí)行所述詞網格的異常更新,并且包括:
當所述多個令牌的詞網格節(jié)點引用對來自所述多個令牌中的其他令牌的其他引用是唯一的時,將所述多個令牌的詞網格節(jié)點引用放置到所述新的活動令牌中,以及
當所述引用在所述多個令牌中的一個以上的令牌中是相同的時,對于所述新的活動令牌維持具有最佳分數(shù)的引用;
將不同的值分配給將用作所述WFST的輸出符號的可能詞的詞匯表中的各個詞,并使用對應于多個詞的多個值確定所述詞歷史指定;以及
將多個最終結束令牌組合成單個話語結束令牌;
其中所述指定是通過使用遞歸散列函數(shù)形成的散列標簽;
其中所述詞歷史指定根據所述詞序列內的所述詞的順序而不同;
其中所述詞歷史指定是十六進制數(shù);其中用添加到所述十六進制數(shù)的令牌的每個詞更新所述十六進制數(shù);并且其中根據所述令牌中的詞的順序而不同地更新所述十六進制數(shù)。
19.至少一個計算機可讀介質,所述介質包括多個指令,所述多個指令響應于在計算設備上執(zhí)行,使所述計算設備:
通過加權有限狀態(tài)變換器(WFST)傳播令牌,并且包括將詞序列放置到詞網格中,所述加權有限狀態(tài)變換器(WFST)具有作為所述WFST的輸出標記的詞或詞標識符;
當在沿著具有輸出符號的弧傳播的令牌處建立詞時,生成用于各個令牌的詞歷史指定,其中所述詞歷史指定指示詞序列;以及
通過至少部分地使用所述詞歷史指定確定是否應當在所述WFST的狀態(tài)中組合兩個或更多個令牌以形成單個令牌。
20.根據權利要求19所述的介質,其中所述指令使所述計算設備在令牌的詞歷史指定相同時,在所述WFST的所述相同狀態(tài)中重新組合兩個或更多個令牌,并且當兩個或更多個令牌的詞歷史指定不相同時避免重新組合。
21.根據權利要求19所述的介質,其中所述指令使所述計算設備在所述令牌傳播時將在具有輸出標記的所述WFST的弧處建立的詞放置到詞網格中。
22.根據權利要求21所述的介質,其中所述指令使所述計算設備在多個令牌的詞歷史指定不同時,通過將多個令牌重新組合為單個新的活動令牌執(zhí)行所述詞網格的異常更新,并且包括:
當所述多個令牌的詞網格節(jié)點引用對來自所述多個令牌中的其他令牌的其他引用是唯一的時,將所述多個令牌的詞網格節(jié)點引用放置到所述新的活動令牌中,以及
當所述引用在所述多個令牌中的一個以上的令牌中是相同的時,對于新的活動令牌維持具有最佳分數(shù)的引用;
其中所述指定是通過使用遞歸散列函數(shù)形成的散列標簽;并且
其中所述指令使所述計算設備將不同的值分配給將用作所述WFST的輸出符號的可能詞的詞匯表中的各個詞,并且使用對應于多個詞的多個值確定所述詞歷史指定。
23.根據權利要求19所述的介質,其中所述指令使所述計算設備
在令牌的詞歷史指定相同時,在所述WFST的所述相同狀態(tài)中重新組合兩個或更多個令牌,并且當兩個或更多個令牌的詞歷史指定不相同時避免重新組合;
當令牌傳播時將在具有輸出標記的所述WFST的弧處建立的所述詞放置到詞網格中;
當多個令牌的詞歷史指定不同時,通過將多個令牌重新組合為單個新的活動令牌執(zhí)行所述詞網格的異常更新,并且包括:
當所述多個令牌的詞網格節(jié)點引用對來自所述多個令牌中的其他令牌的其他引用是唯一的時,將所述多個令牌的詞網格節(jié)點引用放置到所述新的活動令牌中,以及
當所述引用在所述多個令牌中的一個以上的令牌中是相同的時,對于所述新的活動令牌維持具有最佳分數(shù)的引用;
將不同的值分配給將用作所述WFST的輸出符號的可能詞的詞匯表中的各個詞,并且使用對應于多個詞的多個值確定所述詞歷史指定;以及
將多個最終結束令牌組合成單個話語結束令牌;
其中所述指定是通過使用遞歸散列函數(shù)形成的散列標簽;
其中所述詞歷史指定根據所述詞序列內的所述詞的順序而不同;
其中所述詞歷史指定是十六進制數(shù);其中用添加到所述十六進制數(shù)的令牌的每個詞更新所述十六進制數(shù);并且其中根據所述令牌中的詞的順序而不同地更新所述十六進制數(shù)。
24.至少一個機器可讀介質,所述介質包括多個指令,所述多個指令響應于在計算設備上執(zhí)行,使所述計算設備執(zhí)行根據權利要求1至權利要求9中任一項所述的方法。
25.一種器件,所述器件包括用于執(zhí)行根據權利要求1至權利要求9中任一項所述的方法的裝置。