本發(fā)明涉及音頻編碼技術(shù),具體涉及音頻編碼方法及相關(guān)裝置。
背景技術(shù):
目前已有音頻(如音樂)編碼算法中,在相同的碼率,有的音頻編碼算法限制一定的編碼帶寬,側(cè)重于編碼較小的帶寬,而有的音頻編碼算法則不對編碼帶寬做限制,側(cè)重于編碼更寬的帶寬。當(dāng)然,這兩類音頻編碼算法是各有利弊的。
然而,現(xiàn)有技術(shù)中,在進(jìn)行音頻幀編碼時(shí),直接使用固定的某一種編碼算法對音頻幀編碼,這樣就很可能導(dǎo)致所采用的音頻編碼算法難以獲得較優(yōu)良的編碼質(zhì)量或編碼效率。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供了音頻編碼方法以及相關(guān)裝置,以期提高音頻幀編碼的編碼質(zhì)量或編碼效率。
本發(fā)明實(shí)施例第一方面提供一種音頻編碼方法,包括:
對當(dāng)前音頻幀的時(shí)域信號進(jìn)行時(shí)頻變換處理以得到所述當(dāng)前音頻幀的頻譜系數(shù);
獲取當(dāng)前音頻幀的編碼參考參數(shù);
若獲取的所述當(dāng)前音頻幀的編碼參考參數(shù)符合第一參數(shù)條件,基于變換碼激勵(lì)編碼算法對所述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼;若獲取的所述當(dāng)前音頻幀的編碼參考參數(shù)符合第二參數(shù)條件,基于高質(zhì)量變換編碼算法對所述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
結(jié)合第一方面,在第一方面的第一種可能的實(shí)施方式中,所述編碼參考參數(shù)包括如下參數(shù)中的至少一種:所述當(dāng)前音頻幀的編碼速率,所述當(dāng)前音頻幀的位于子帶z內(nèi)的頻譜系數(shù)的峰均比,所述當(dāng)前音頻幀的位于子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差,所述當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值與位于子帶j的頻譜系數(shù)的能量均值,所述當(dāng)前音頻幀的位于子帶m內(nèi)的頻譜系數(shù)的幅度均值與位于子帶n內(nèi)的頻譜系數(shù)的幅度均值,所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y內(nèi)的頻譜系數(shù)的峰均比,所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差,所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于子帶f內(nèi)的頻譜系數(shù)的包絡(luò),以及所述當(dāng)前音頻幀的位于子帶p內(nèi)的頻譜系數(shù)和位于子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值;
其中,所述子帶z的最高頻點(diǎn)大于臨界頻點(diǎn)F1;所述子帶w的最高頻點(diǎn)大于所述臨界頻點(diǎn)F1;所述子帶j的最高頻點(diǎn)大于臨界頻點(diǎn)F2;所述子帶n的最高頻點(diǎn)大于所述臨界頻點(diǎn)F2;
其中,所述臨界頻點(diǎn)F1的取值范圍為6.4kHz至12kHz;
其中,所述臨界頻點(diǎn)F2的取值范圍為4.8kHz至8kHz;
所述子帶i的最高頻點(diǎn)小于所述子帶j的最高頻點(diǎn);所述子帶m的最高頻點(diǎn)小于所述子帶n的最高頻點(diǎn);所述子帶x的最高頻點(diǎn)小于或等于所述子帶y的最低頻點(diǎn);所述子帶p的最高頻點(diǎn)小于或等于所述子帶q的最低頻點(diǎn);所述子帶r的最高頻點(diǎn)小于或等于所述子帶s的最低頻點(diǎn);所述子帶e的最高頻點(diǎn)小于或等于所述子帶f的最低頻點(diǎn)。
結(jié)合第一方面的第一種可能的實(shí)施方式,在第一方面的第二種可能的實(shí)施方式中,
如下條件中的至少一個(gè)被滿足:所述子帶w的最低頻點(diǎn)大于或者等于臨界頻點(diǎn)F1,所述子帶z的最低頻點(diǎn)大于或等于所述臨界頻點(diǎn)F1,所述子帶i的最高頻點(diǎn)小于或等于所述子帶j的最低頻點(diǎn),所述子帶m的最高頻點(diǎn)小于或等于所述子帶n的最低頻點(diǎn),所述子帶j的最低頻點(diǎn)大于所述臨界頻點(diǎn)F2,以及所述子帶n的最低頻點(diǎn)大于所述臨界頻點(diǎn)F2。
結(jié)合第一方面的第一種可能的實(shí)施方式或第一方面的第二種可能的實(shí)施方式,在第一方面的第三種可能的實(shí)施方式中,所述第一參數(shù)條件包括如下條件中的至少一個(gè):
所述當(dāng)前音頻幀的編碼速率小于閾值T1,
所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T2,
所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T3,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于所述子帶j的頻譜系數(shù)的能量均值得到的商大于或者等于閾值T4,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值減去位于所述子帶j的頻譜系數(shù)的能量均值得到的差值大于或者等于閾值T5,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商大于或者等于閾值T6,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值減去位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值大于或者等于閾值T7,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比的比值落入?yún)^(qū)間R1,
所述當(dāng)前音頻幀的位于所述子帶x內(nèi)的頻譜系數(shù)的峰均比與位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比的差值的絕對值小于或者等于閾值T8,
所述當(dāng)前音頻幀的位于所述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的比值落入?yún)^(qū)間R2,
所述當(dāng)前音頻幀的位于所述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的差值的絕對值小于或者等于閾值T9,
所述當(dāng)前音頻幀的位于所述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的比值落入?yún)^(qū)間R3,
所述當(dāng)前音頻幀的位于所述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的差值的絕對值小于或者等于閾值T10,以及
所述當(dāng)前音頻幀的位于所述子帶p內(nèi)的頻譜系數(shù)和位于所述子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值大于或者等于閾值T11。
結(jié)合第一方面的第一種可能的實(shí)施方式或第一方面的第二種可能的實(shí)施方式或第一方面的第三種可能的實(shí)施方式,在第一方面的第四種可能的實(shí)施方式中,所述第一參數(shù)條件包括如下條件中的其中一個(gè):
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比除以位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的商小于閾值T44,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比小于閾值T45,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比除以位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的商大于閾值T46,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比大于閾值T47,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比減位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的差值小于閾值T48,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比小于閾值T49,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比減位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的差值大于閾值T50,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比大于閾值T51,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差除以位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的商小于閾值T52,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于閾值T53,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差除以位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的商大于閾值T54,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T55,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差減位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的差值小于閾值T56,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于閾值T57,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差減位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的差值大于閾值T58,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T59,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)除以位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的商小于閾值T60,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)小于閾值T61,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)除以位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的商大于閾值T62,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)大于閾值T63,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)減位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的差值小于閾值T64,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)小于閾值T65,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)減位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的差值大于閾值T66,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)大于閾值T67,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于所述子帶j的頻譜系數(shù)的能量均值得到的商小于或等于閾值T68,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T69,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值減位于所述子帶j的頻譜系數(shù)的能量均值得到的差值小于或等于閾值T70,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T71,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于或等于閾值T72,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T73,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值減位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于或等于閾值T74,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T75,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于所述子帶j的頻譜系數(shù)的能量均值得到的商小于或等于閾值T76,且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T77,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值減位于所述子帶j的頻譜系數(shù)的能量均值得到的差值小于或等于閾值T78,且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T79,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于或等于閾值T80且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T81,以及
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值減位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于或等于閾值T82,且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T83。
結(jié)合第一方面的第一種可能的實(shí)施方式或者第一方面的第二種可能的實(shí)施方式或第一方面的第三種可能的實(shí)施方式或者第一方面的第四種可能的實(shí)施方式,在第一方面的第五種可能的實(shí)施方式中,所述第二參數(shù)條件包括如下條件中的至少一個(gè):
所述當(dāng)前音頻幀的編碼速率大于或等于閾值T1,
所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T2,
所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T3,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于所述子帶j的頻譜系數(shù)的能量均值得到的商小于閾值T4,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值減去位于所述子帶j的頻譜系數(shù)的能量均值得到的差值小于閾值T5,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于閾值T6,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值減去位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于閾值T7,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比的比值未落入?yún)^(qū)間R1,
所述當(dāng)前音頻幀的位于所述子帶x內(nèi)的頻譜系數(shù)的峰均比與位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比的差值的絕對值大于閾值T8,
所述當(dāng)前音頻幀的位于所述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的比值未落入?yún)^(qū)間R2,
所述當(dāng)前音頻幀的位于所述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的差值的絕對值大于閾值T9,
所述當(dāng)前音頻幀的位于所述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的比值未落入?yún)^(qū)間R3,
所述當(dāng)前音頻幀的位于所述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的差值的絕對值大于閾值T10,以及
所述當(dāng)前音頻幀的位于所述子帶p內(nèi)的頻譜系數(shù)和位于所述子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值小于閾值T11。
結(jié)合第一方面的第一種可能的實(shí)施方式或者第一方面的第二種可能的實(shí)施方式或第一方面的第三種可能的實(shí)施方式或者第一方面的第四種可能的實(shí)施方式或者第一方面的第五種可能的實(shí)施方式,在第一方面的第六種可能的實(shí)施方式中,所述第二參數(shù)條件包括如下條件中的其中一個(gè):
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比除以位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的商小于閾值T44,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比大于閾值T45,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比除以位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的商大于閾值T46,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比小于閾值T47,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比減位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的差值小于閾值T48,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比大于閾值T49,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比減位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的差值大于閾值T50,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比小于閾值T51,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差除以位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的商小于閾值T52,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T53,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差除以位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的商大于閾值T54,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于閾值T55,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差減位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的差值小于閾值T56,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T57,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差減位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的差值大于閾值T58,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于閾值T59,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)除以位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的商小于閾值T60,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)大于閾值T61,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)除以位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的商大于閾值T62,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)小于閾值T63,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)減位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的差值小于閾值T64,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)大于閾值T65,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)減位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的差值大于閾值T66,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)小于閾值T67,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于所述子帶j的頻譜系數(shù)的能量均值得到的商小于或等于閾值T68,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T69,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值減位于所述子帶j的頻譜系數(shù)的能量均值得到的差值小于或等于閾值T70,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T71,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于或等于閾值T72,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T73,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值減位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于或等于閾值T74,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T75,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于所述子帶j的頻譜系數(shù)的能量均值得到的商小于或等于閾值T76,且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T77,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值減位于所述子帶j的頻譜系數(shù)的能量均值得到的差值小于或等于閾值T78,且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T79,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于或等于閾值T80且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T81,以及
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值減位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于或等于閾值T82,且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T83。
結(jié)合第一方面的第三種可能的實(shí)施方式或者第一方面的第四種可能的實(shí)施方式或者第一方面的第五種可能的實(shí)施方式或者第一方面的第六種可能的實(shí)施方式,在第一方面的第七種可能的實(shí)施方式中,
如下條件中的至少一個(gè)被滿足:
所述閾值T2大于或等于2,
所述閾值T4小于或等于1/1.2,
所述區(qū)間R1為[1/2.25,2.25],
所述閾值T44小于或等于1/2.56,
所述閾值T45大于或等于1.5,
所述閾值T46大于或等于1/2.56,
所述閾值T47小于或等于1.5,
所述閾值T68小于或等于1.25,以及
所述閾值T69大于或等于2。
本發(fā)明第二方面提供一種音頻編碼器,包括:
時(shí)頻變換單元,用于對當(dāng)前音頻幀的時(shí)域信號進(jìn)行時(shí)頻變換處理以得到所述當(dāng)前音頻幀的頻譜系數(shù);
獲取單元,用于獲取當(dāng)前音頻幀的編碼參考參數(shù);
編碼單元,用于若所述獲取單元獲取到的所述當(dāng)前音頻幀的編碼參考參數(shù)符合第一參數(shù)條件,基于變換碼激勵(lì)編碼算法對所述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼;若所述獲取單元獲取到的所述當(dāng)前音頻幀的編碼參考參數(shù)符合第二參數(shù)條件,基于高質(zhì)量變換編碼算法對所述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
結(jié)合第二方面,在第二方面的第一種可能的實(shí)施方式中,所述編碼參考參數(shù)包括如下參數(shù)中的至少一種:所述當(dāng)前音頻幀的編碼速率,所述當(dāng)前音頻幀的位于子帶z內(nèi)的頻譜系數(shù)的峰均比,所述當(dāng)前音頻幀的位于子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差,所述當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值與位于子帶j的頻譜系數(shù)的能量均值,所述當(dāng)前音頻幀的位于子帶m內(nèi)的頻譜系數(shù)的幅度均值與位于子帶n內(nèi)的頻譜系數(shù)的幅度均值,所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y內(nèi)的頻譜系數(shù)的峰均比,所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差,所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于子帶f內(nèi)的頻譜系數(shù)的包絡(luò),以及所述當(dāng)前音頻幀的位于子帶p內(nèi)的頻譜系數(shù)和位于子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值;
其中,所述子帶z的最高頻點(diǎn)大于臨界頻點(diǎn)F1;所述子帶w的最高頻點(diǎn)大于所述臨界頻點(diǎn)F1;所述子帶j的最高頻點(diǎn)大于臨界頻點(diǎn)F2;所述子帶n的最高頻點(diǎn)大于所述臨界頻點(diǎn)F2;其中,所述臨界頻點(diǎn)F1的取值范圍為6.4kHz至12kHz;其中,所述臨界頻點(diǎn)F2的取值范圍為4.8kHz至8kHz;
所述子帶i的最高頻點(diǎn)小于所述子帶j的最高頻點(diǎn);所述子帶m的最高頻點(diǎn)小于所述子帶n的最高頻點(diǎn);所述子帶x的最高頻點(diǎn)小于或等于所述子帶y的最低頻點(diǎn);所述子帶p的最高頻點(diǎn)小于或等于所述子帶q的最低頻點(diǎn);所述子帶r的最高頻點(diǎn)小于或等于所述子帶s的最低頻點(diǎn);所述子帶e的最高頻點(diǎn)小于或等于所述子帶f的最低頻點(diǎn)。
結(jié)合第二方面的第一種可能的實(shí)施方式,在第二方面的第二種可能的實(shí)施方式中,如下條件中的至少一個(gè)被滿足:所述子帶w的最低頻點(diǎn)大于或者等于臨界頻點(diǎn)F1,所述子帶z的最低頻點(diǎn)大于或等于所述臨界頻點(diǎn)F1,所述子帶i的最高頻點(diǎn)小于或等于所述子帶j的最低頻點(diǎn),所述子帶m的最高頻點(diǎn)小于或等于所述子帶n的最低頻點(diǎn),所述子帶j的最低頻點(diǎn)大于所述臨界頻點(diǎn)F2,以及所述子帶n的最低頻點(diǎn)大于所述臨界頻點(diǎn)F2。
結(jié)合第二方面的第一種可能的實(shí)施方式或者第二方面的第二種可能的實(shí)施方式,在第二方面的第三種可能的實(shí)施方式中,所述第一參數(shù)條件包括如下條件中的至少一個(gè):
所述當(dāng)前音頻幀的編碼速率小于閾值T1,
所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T2,
所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T3,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于所述子帶j的頻譜系數(shù)的能量均值得到的商大于或者等于閾值T4,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值減去位于所述子帶j的頻譜系數(shù)的能量均值得到的差值大于或者等于閾值T5,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商大于或者等于閾值T6,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值減去位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值大于或者等于閾值T7,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比的比值落入?yún)^(qū)間R1,
所述當(dāng)前音頻幀的位于所述子帶x內(nèi)的頻譜系數(shù)的峰均比與位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比的差值的絕對值小于或者等于閾值T8,
所述當(dāng)前音頻幀的位于所述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的比值落入?yún)^(qū)間R2,
所述當(dāng)前音頻幀的位于所述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的差值的絕對值小于或者等于閾值T9,
所述當(dāng)前音頻幀的位于所述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的比值落入?yún)^(qū)間R3,
所述當(dāng)前音頻幀的位于所述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的差值的絕對值小于或者等于閾值T10,以及
所述當(dāng)前音頻幀的位于所述子帶p內(nèi)的頻譜系數(shù)和位于所述子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值大于或者等于閾值T11。
結(jié)合第二方面的第一種可能的實(shí)施方式或者第二方面的第二種可能的實(shí)施方式或第二方面的第三種可能的實(shí)施方式,在第二方面的第四種可能的實(shí)施方式中,所述第一參數(shù)條件包括如下條件中的其中一個(gè):
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比除以位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的商小于閾值T44,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比小于閾值T45,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比除以位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的商大于閾值T46,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比大于閾值T47,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比減位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的差值小于閾值T48,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比小于閾值T49,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比減位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的差值大于閾值T50,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比大于閾值T51,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差除以位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的商小于閾值T52,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于閾值T53,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差除以位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的商大于閾值T54,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T55,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差減位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的差值小于閾值T56,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于閾值T57,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差減位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的差值大于閾值T58,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T59,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)除以位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的商小于閾值T60,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)小于閾值T61,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)除以位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的商大于閾值T62,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)大于閾值T63,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)減位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的差值小于閾值T64,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)小于閾值T65,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)減位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的差值大于閾值T66,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)大于閾值T67,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于所述子帶j的頻譜系數(shù)的能量均值得到的商小于或等于閾值T68,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T69,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值減位于所述子帶j的頻譜系數(shù)的能量均值得到的差值小于或等于閾值T70,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T71,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于或等于閾值T72,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T73,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值減位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于或等于閾值T74,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T75,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于所述子帶j的頻譜系數(shù)的能量均值得到的商小于或等于閾值T76,且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T77,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值減位于所述子帶j的頻譜系數(shù)的能量均值得到的差值小于或等于閾值T78,且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T79,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于或等于閾值T80且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T81,以及
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值減位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于或等于閾值T82,且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T83。
結(jié)合第二方面的第一種可能的實(shí)施方式或者第二方面的第二種可能的實(shí)施方式或第二方面的第三種可能的實(shí)施方式或者第二方面的第四種可能的實(shí)施方式,在第二方面的第五種可能的實(shí)施方式中,所述第二參數(shù)條件包括如下條件中的至少一個(gè):
所述當(dāng)前音頻幀的編碼速率大于或等于閾值T1,
所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T2,
所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T3,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于所述子帶j的頻譜系數(shù)的能量均值得到的商小于閾值T4,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值減去位于所述子帶j的頻譜系數(shù)的能量均值得到的差值小于閾值T5,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于閾值T6,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值減去位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于閾值T7,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比的比值未落入?yún)^(qū)間R1,
所述當(dāng)前音頻幀的位于所述子帶x內(nèi)的頻譜系數(shù)的峰均比與位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比的差值的絕對值大于閾值T8,
所述當(dāng)前音頻幀的位于所述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的比值未落入?yún)^(qū)間R2,
所述當(dāng)前音頻幀的位于所述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的差值的絕對值大于閾值T9,
所述當(dāng)前音頻幀的位于所述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的比值未落入?yún)^(qū)間R3,
所述當(dāng)前音頻幀的位于所述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的差值的絕對值大于閾值T10,以及
所述當(dāng)前音頻幀的位于所述子帶p內(nèi)的頻譜系數(shù)和位于所述子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值小于閾值T11。
結(jié)合第二方面的第一種可能的實(shí)施方式或者第二方面的第二種可能的實(shí)施方式或第二方面的第三種可能的實(shí)施方式或者第二方面的第四種可能的實(shí)施方式或者第二方面的第五種可能的實(shí)施方式,在第二方面的第六種可能的實(shí)施方式中,所述第二參數(shù)條件包括如下條件中的其中一個(gè):
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比除以位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的商小于閾值T44,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比大于閾值T45,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比除以位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的商大于閾值T46,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比小于閾值T47,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比減位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的差值小于閾值T48,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比大于閾值T49,
所述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比減位于所述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的差值大于閾值T50,且所述子帶y內(nèi)的頻譜系數(shù)的峰均比小于閾值T51,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差除以位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的商小于閾值T52,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T53,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差除以位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的商大于閾值T54,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于閾值T55,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差減位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的差值小于閾值T56,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T57,
所述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差減位于所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的差值大于閾值T58,且所述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于閾值T59,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)除以位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的商小于閾值T60,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)大于閾值T61,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)除以位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的商大于閾值T62,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)小于閾值T63,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)減位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的差值小于閾值T64,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)大于閾值T65,
所述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)減位于所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的差值大于閾值T66,且所述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)小于閾值T67,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于所述子帶j的頻譜系數(shù)的能量均值得到的商小于或等于閾值T68,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T69,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值減位于所述子帶j的頻譜系數(shù)的能量均值得到的差值小于或等于閾值T70,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T71,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于或等于閾值T72,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T73,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值減位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于或等于閾值T74,且所述當(dāng)前音頻幀的位于所述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T75,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于所述子帶j的頻譜系數(shù)的能量均值得到的商小于或等于閾值T76,且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T77,
所述當(dāng)前音頻幀的位于所述子帶i內(nèi)的頻譜系數(shù)的能量均值減位于所述子帶j的頻譜系數(shù)的能量均值得到的差值小于或等于閾值T78,且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T79,
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于或等于閾值T80且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T81,以及
所述當(dāng)前音頻幀的位于所述子帶m內(nèi)的頻譜系數(shù)的幅度均值減位于所述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于或等于閾值T82,且所述當(dāng)前音頻幀的位于所述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T83。
結(jié)合第二方面的第三種可能的實(shí)施方式或者第二方面的第四種可能的實(shí)施方式或者第二方面的第五種可能的實(shí)施方式或者第二方面的第六種可能的實(shí)施方式,在第二方面的第七種可能的實(shí)施方式中,
如下條件中的至少一個(gè)被滿足:
所述閾值T2大于或等于2,
所述閾值T4小于或等于1/1.2,
所述區(qū)間R1為[1/2.25,2.25],
所述閾值T44小于或等于1/2.56,
所述閾值T45大于或等于1.5,
所述閾值T46大于或等于1/2.56,
所述閾值T47小于或等于1.5,
所述閾值T68小于或等于1.25,以及
所述閾值T69大于或等于2。
可以看出,在本發(fā)明一些實(shí)施例的技術(shù)方案中,獲取當(dāng)前音頻幀的編碼參考參數(shù)后,基于獲取的當(dāng)前音頻幀的編碼參考參數(shù)來選擇TCX算法或HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。由于將當(dāng)前音頻幀的編碼參考參數(shù)與編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法進(jìn)行關(guān)聯(lián),這樣就有利于提高編碼算法和當(dāng)前音頻幀的編碼參考參數(shù)之間的適應(yīng)性和匹配性,進(jìn)而有利于提高上述當(dāng)前音頻幀的編碼質(zhì)量或編碼效率。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1~8為本發(fā)明實(shí)施例提供的幾種音頻編碼方法的流程示意圖;
圖9~10為本發(fā)明實(shí)施例提供的兩種音頻編碼器的示意圖。
具體實(shí)施方式
本發(fā)明實(shí)施例提供了音頻編碼方法以及相關(guān)裝置,以期提高音頻幀編碼的編碼質(zhì)量或編碼效率。
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚,完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。
以下分別進(jìn)行詳細(xì)說明。
本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”,“第二”,“第三”,“第四”等是用于區(qū)別不同的對象,而不是用于描述特定順序。此外,術(shù)語“包括”和“具有”以及它們?nèi)魏巫冃?,意圖在于覆蓋不排他的包含。例如包含了一系列步驟或單元的過程,方法,系統(tǒng),產(chǎn)品或設(shè)備沒有限定于已列出的步驟或單元,而是可選地還包括沒有列出的步驟或單元,或可選地還包括對于這些過程,方法,產(chǎn)品或設(shè)備固有的其它步驟或單元。
下面先介紹本發(fā)明實(shí)施例提供的音頻編碼方法,本發(fā)明實(shí)施例提供的音頻編碼方法的執(zhí)行主體可為音頻編碼器,該音頻編碼器可為任何需要采集,存儲(chǔ)或者向外傳輸音頻信號的裝置,例如手機(jī),平板電腦,個(gè)人電腦,筆記本電腦等等。
本發(fā)明音頻編碼方法的一實(shí)施例,一種音頻編碼方法包括:對當(dāng)前音頻幀的時(shí)域信號進(jìn)行時(shí)頻變換處理以得到上述當(dāng)前音頻幀的頻譜系數(shù);獲取當(dāng)前音頻幀的編碼參考參數(shù);若獲取的上述當(dāng)前音頻幀的編碼參考參數(shù)符合第一參數(shù)條件,基于變換碼激勵(lì)編碼算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼;若獲取的上述當(dāng)前音頻幀的編碼參考參數(shù)符合第二參數(shù)條件,基于高質(zhì)量變換編碼算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
首先請參見圖1,圖1為本發(fā)明的一個(gè)實(shí)施例提供的一種音頻編碼方法的流程示意圖。其中,如圖1所示,本發(fā)明實(shí)施例提供的一種音頻編碼方法可包括以下內(nèi)容:
101,對當(dāng)前音頻幀的時(shí)域信號進(jìn)行時(shí)頻變換處理以得到上述當(dāng)前音頻幀的頻譜系數(shù)。
其中,本發(fā)明各實(shí)施例中提及的音頻幀可以是語音幀或音樂幀。
102,獲取當(dāng)前音頻幀的編碼參考參數(shù)。
103,若獲取的上述當(dāng)前音頻幀的編碼參考參數(shù)符合第一參數(shù)條件,基于變換碼激勵(lì)編碼(英文:transform coded excitation,縮寫,TCX)算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
104,若獲取的上述當(dāng)前音頻幀的編碼參考參數(shù)符合第二參數(shù)條件,基于高質(zhì)量變換編碼(英文:high quality transform coder,縮寫,HQ)算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
可以看出,本實(shí)施例方案中,獲取當(dāng)前音頻幀的編碼參考參數(shù)后,基于獲取的當(dāng)前音頻幀的編碼參考參數(shù)來選擇TCX算法或HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。由于將當(dāng)前音頻幀的編碼參考參數(shù)與編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法進(jìn)行關(guān)聯(lián),這樣就有利于提高編碼算法和當(dāng)前音頻幀的編碼參考參數(shù)之間的適應(yīng)性和匹配性,進(jìn)而有利于提高上述當(dāng)前音頻幀的編碼質(zhì)量或編碼效率。
其中,TCX算法通常會(huì)對當(dāng)前音頻幀的時(shí)域信號進(jìn)行分帶處理(例如使用正交鏡像濾波器對當(dāng)前音頻幀的時(shí)域信號進(jìn)行分帶處理,而HQ算法一般不對當(dāng)前音頻幀的時(shí)域信號進(jìn)行分帶處理。
其中,根據(jù)應(yīng)用場景的需求,步驟102中獲取的當(dāng)前音頻幀的編碼參考參數(shù)可能是多種多樣的。
例如,上述編碼參考參數(shù)例如可包括如下參數(shù)中的至少一種:上述當(dāng)前音頻幀的編碼速率,上述當(dāng)前音頻幀的位于子帶z內(nèi)的頻譜系數(shù)的峰均比,上述當(dāng)前音頻幀的位于子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差,上述當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值與位于子帶j的頻譜系數(shù)的能量均值,上述當(dāng)前音頻幀的位于子帶m內(nèi)的頻譜系數(shù)的幅度均值與位于子帶n內(nèi)的頻譜系數(shù)的幅度均值,上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y內(nèi)的頻譜系數(shù)的峰均比,上述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差,上述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于子帶f內(nèi)的頻譜系數(shù)的包絡(luò),上述當(dāng)前音頻幀的位于子帶p內(nèi)的頻譜系數(shù)和位于子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值。
其中,上述當(dāng)前音頻幀的位于子帶p內(nèi)的頻譜系數(shù)和位于子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值越大,表示位于子帶p內(nèi)的頻譜系數(shù)和位于子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性越強(qiáng),其中,頻譜相關(guān)性參數(shù)值例如可為歸一化互相關(guān)參數(shù)值。
其中,上述各子帶的頻點(diǎn)范圍具體可根據(jù)實(shí)際需要確定。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,上述子帶z的最高頻點(diǎn)可以大于臨界頻點(diǎn)F1。上述子帶w的最高頻點(diǎn)可大于上述臨界頻點(diǎn)F1。其中,上述臨界頻點(diǎn)F1的取值范圍例如可為6.4kHz至12kHz。例如,臨界頻點(diǎn)F1的取值可以為6.4kHz,8kHz,9kHz,10kHz,12kHz等等,當(dāng)然,臨界頻點(diǎn)F1也可為其他取值。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,上述子帶j的最高頻點(diǎn)大于臨界頻點(diǎn)F2。上述子帶n的最高頻點(diǎn)大于上述臨界頻點(diǎn)F2。例如,上述臨界頻點(diǎn)F2的取值范圍可以為4.8kHz至8kHz。具體例如,臨界頻點(diǎn)F2的取值可以為6.4kHz,4.8kHz,6kHz,8kHz,5kHz,7kHz等等,當(dāng)然,臨界頻點(diǎn)F2也可為其他取值。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,上述子帶i的最高頻點(diǎn)可以小于上述子帶j的最高頻點(diǎn)。上述子帶m的最高頻點(diǎn)可以小于上述子帶n的最高頻點(diǎn)。上述子帶x的最高頻點(diǎn)可小于或等于上述子帶y的最低頻點(diǎn)。上述子帶p的最高頻點(diǎn)可小于或等于上述子帶q的最低頻點(diǎn),上述子帶r的最高頻點(diǎn)可小于或等于上述子帶s的最低頻點(diǎn)。上述子帶e的最高頻點(diǎn)可小于或等于上述子帶f的最低頻點(diǎn)。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,如下條件之中的至少一個(gè)可以被滿足:
上述子帶w的最低頻點(diǎn)大于或等于臨界頻點(diǎn)F1,上述子帶z的最低頻點(diǎn)大于或等于上述臨界頻點(diǎn)F1,上述子帶i的最高頻點(diǎn)小于或等于上述子帶j的最低頻點(diǎn),上述子帶m的最高頻點(diǎn)小于或等于上述子帶n的最低頻點(diǎn),上述子帶j的最低頻點(diǎn)大于或等于臨界頻點(diǎn)F2,上述子帶n的最低頻點(diǎn)大于或等于上述臨界頻點(diǎn)F2,上述子帶i的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,上述子帶m的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,子帶j的最低頻點(diǎn)大于或等于臨界頻點(diǎn)F2,上述子帶n的最低頻點(diǎn)大于或等于臨界頻點(diǎn)F2。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,如下條件之中的至少一個(gè)可以被滿足:上述子帶e的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,上述子帶x的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,上述子帶p的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,上述子帶r的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,上述子帶f的最高頻點(diǎn)可小于或者等于臨界頻點(diǎn)F2,當(dāng)然,上述子帶f的最低頻點(diǎn)也可能大于或者等于臨界頻點(diǎn)F2。上述子帶q的最高頻點(diǎn)可小于或者等于臨界頻點(diǎn)F2,當(dāng)然,上述子帶q的最低頻點(diǎn)也可能大于或者等于臨界頻點(diǎn)F2。上述子帶s的最高頻點(diǎn)可小于或者等于臨界頻點(diǎn)F2,當(dāng)然,上述子帶s的最低頻點(diǎn)也可能大于或者等于臨界頻點(diǎn)F2。
舉例來說,上述子帶z的最高頻點(diǎn)的取值范圍可為12kHz至16kHz。子帶z的最低頻點(diǎn)的取值范圍可為8kHz至14kHz。子帶z的帶寬的取值范圍可為1.6kHz~8kHz。具體例如,子帶z的頻點(diǎn)范圍可為8kHz至12kHz,9kHz至11kHz或8kHz至9.6kHz或12kHz至14kHz等。當(dāng)然,子帶z的頻點(diǎn)范圍也并不限于上述舉例。
例如,子帶w的頻點(diǎn)范圍也可根據(jù)實(shí)際需要確定,例如子帶w的最高頻點(diǎn)的取值范圍可為12kHz至16kHz,子帶w的最低頻點(diǎn)的取值范圍可為8kHz至14kHz。具體例如子帶w的頻點(diǎn)范圍為8kHz至12kHz,9kHz至11kHz,8kHz至9.6kHz,12kHz至14kHz,12.2kHz至14.5kHz等。當(dāng)然,子帶w的頻點(diǎn)范圍也并不限于上述舉例。在一些可能的實(shí)施方式中,子帶w的頻點(diǎn)范圍和子帶z的頻點(diǎn)范圍可相同或相近。
例如,上述子帶i的頻點(diǎn)范圍可為3.2kHz至6.4kHz,3.2kHz至4.8kHz,4.8kHz至6.4kHz,0.4kHz至6.4kHz或0.4kHz至3.6kHz,當(dāng)然,子帶i的頻點(diǎn)范圍也不限于上述舉例。
例如,上述子帶j的頻點(diǎn)范圍可為6.4kHz至9.6kHz,6.4kHz至8kHz,8kHz至9.6kHz,4.8kHz至9.6kHz或4.8kHz至8kHz等。當(dāng)然,子帶j的頻點(diǎn)范圍也不限于上述舉例。
例如,上述子帶m的頻點(diǎn)范圍為3.2kHz至6.4kHz,3.2kHz至4.8kHz,4.8kHz至6.4kHz,0.4kHz至6.4kHz或0.4kHz至3.6kHz,當(dāng)然,子帶m的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶m的頻點(diǎn)范圍和子帶i的頻點(diǎn)范圍可相同或相近。
例如,上述子帶n的頻點(diǎn)范圍可為6.4kHz至9.6kHz,6.4kHz至8kHz,8kHz至9.6kHz,4.8kHz至9.6kHz或4.8kHz至8kHz等。當(dāng)然,子帶n的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶n的頻點(diǎn)范圍和子帶j的頻點(diǎn)范圍可相同或相近。
例如,上述子帶x的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz,1.6kHz至3.2kHz,2kHz至3.2kHz或2.5kHz至3.4kHz。當(dāng)然,子帶x的頻點(diǎn)范圍也不限于上述舉例。
例如,上述子帶y的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz,4.8kHz至6.4kHz,4.4kHz至6.4kHz或4.5kHz至6.2kHz。當(dāng)然,子帶y的頻點(diǎn)范圍也不限于上述舉例。
例如,上述子帶p的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz,1.6kHz至3.2kHz,2.1kHz至3.2kHz或2.5kHz至3.5kHz。當(dāng)然,子帶p的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶p的頻點(diǎn)范圍和子帶x的頻點(diǎn)范圍可相同或相近。
例如,上述子帶q的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz,4.8kHz至6.4kHz,4.2kHz至6.4kHz或4.7kHz至6.2kHz。當(dāng)然,子帶q的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶q的頻點(diǎn)范圍和子帶y的頻點(diǎn)范圍可相同或相近。
例如,上述子帶r的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz,1.6kHz至3.2kHz,2.05kHz至3.27kHz或2.59kHz至3.51kHz。當(dāng)然,子帶r的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶r的頻點(diǎn)范圍和子帶x的頻點(diǎn)范圍可相同或相近。
例如,上述子帶s的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz,4.8kHz至6.4kHz,5.4kHz至7.1kHz或4.55kHz至6.29kHz。當(dāng)然,子帶s的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶s的頻點(diǎn)范圍和子帶y的頻點(diǎn)范圍可相同或相近。
例如,上述子帶e的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz,1.6kHz至3.2kHz,0.8kHz至3kHz或1.9kHz至3.8kHz。當(dāng)然,子帶e的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶e的頻點(diǎn)范圍和子帶x的頻點(diǎn)范圍可相同或相近。
例如,上述子帶f的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz,4.8kHz至6.4kHz,5.3kHz至7.15kHz或4.58kHz至6.52kHz。當(dāng)然,子帶f的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶f的頻點(diǎn)范圍和子帶y的頻點(diǎn)范圍可相同或相近。
其中,上述第一參數(shù)條件可能是多種多樣的。
例如,在本發(fā)明一些可能的實(shí)施方式中,上述第一參數(shù)條件例如可包括如下條件中的至少一個(gè):
上述當(dāng)前音頻幀的編碼速率小于閾值T1(其中,閾值T1例如可以大于或等于24.4kbps,32kbps,64kbp或其他速率),
上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T2(其中,閾值T2例如可以大于或等于1,2,3,5或其他值),
上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T3(其中,閾值T3例如可以大于或等于10,20,35或其他值),
上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商大于或者等于閾值T4(其中,閾值T4例如可以大于或等于0.5,1,2,3或其他值),
上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值減去位于上述子帶j的頻譜系數(shù)的能量均值得到的差值大于或者等于閾值T5(其中,閾值T5例如可以大于或等于10,20,51,100或其他值),
上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商大于或者等于閾值T6(其中,閾值T6例如可以大于或等于0.5,1.1,2,3或其他值),
上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值減去位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值大于或者等于閾值T7(其中,閾值T7例如可以大于或等于11,20,50,101或其他值),
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的比值落入?yún)^(qū)間R1(其中,區(qū)間R1例如可以為[0.5,2]或[0.4,2.5]或其范圍),
上述當(dāng)前音頻幀的位于上述子帶x內(nèi)的頻譜系數(shù)的峰均比與位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的差值的絕對值小于或者等于閾值T8(其中,閾值T8例如可以大于或等于1,2,3或其他值),
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的比值落入?yún)^(qū)間R2(其中,區(qū)間R2例如可以為[0.5,2]或[0.4,2.5]或其范圍),
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的差值的絕對值小于或者等于閾值T9(其中,閾值T9例如可以大于或等于10,20,35或其他值),
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的比值落入?yún)^(qū)間R3(其中,區(qū)間R3例如可以為[0.5,2]或[0.4,2.5]或其范圍),
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的差值的絕對值小于或者等于閾值T10(其中,閾值T10例如可以大于或等于11,20,50,101或其他值),
上述當(dāng)前音頻幀的位于上述子帶p內(nèi)的頻譜系數(shù)和位于上述子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值大于或者等于閾值T11(其中,閾值T11例如可以等于0.5,0.8,0.9,1或其他值)。
又例如,在本發(fā)明一些可能的實(shí)施方式中,上述第一參數(shù)條件例如可包括如下條件中的其中一個(gè):
上述當(dāng)前音頻幀的編碼速率大于或等于閾值T1,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商大于或等于閾值T12(閾值T12例如可以大于或等于閾值T4,閾值T12例如可以大于或等于2,3,5或8或其他值),
上述當(dāng)前音頻幀的編碼速率大于或等于閾值T1,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商大于或等于閾值T13(其中,閾值T13例如可以大于或等于閾值T6,閾值T13例如可以大于或等于2,3,9或7或其他值),
上述當(dāng)前音頻幀的編碼速率大于或等于閾值T1,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或等于閾值T14(其中,閾值T14例如可以小于或等于閾值T2,閾值T14例如可以小于或等于0.5,2,3,1.5,4或其他值),
上述當(dāng)前音頻幀的編碼速率大于或等于閾值T1,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或等于閾值T15(其中,閾值T15例如可以小于或等于閾值T3,閾值T15例如可以小于或等于5,8,10,20或其他值),
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的比值未落入?yún)^(qū)間R1,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商大于或等于閾值T16(閾值T16例如可以大于或等于閾值T4,閾值T16例如可以大于或等于2,3,5或8或其他值),
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的比值未落入?yún)^(qū)間R1,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商大于或等于閾值T17(其中,閾值T17例如可以大于或等于閾值T6,閾值T17例如可以大于或等于2,3,9或7或其他值),
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的比值未落入?yún)^(qū)間R1,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或等于閾值T18(其中,閾值T18例如可以小于或等于閾值T2,其中,閾值T18例如可以小于或等于0.5,2,3,1.5,4,5或其他值),
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的比值未落入?yún)^(qū)間R1,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或等于閾值T19(其中,閾值T19例如可以小于或等于閾值T3,閾值T19例如可以小于或等于5,8,10,20或其他值),
上述當(dāng)前音頻幀的位于上述子帶x內(nèi)的頻譜系數(shù)的峰均比與位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的差值的絕對值大于閾值T8,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商大于或等于閾值T20(閾值T20例如可以大于或等于閾值T4,閾值T20例如可以大于或等于2,3,5或8或其他值),
上述當(dāng)前音頻幀的位于上述子帶x內(nèi)的頻譜系數(shù)的峰均比與位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的差值的絕對值大于閾值T8,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商大于或等于閾值T21(其中,閾值T21例如可以大于或等于閾值T6,閾值T21例如可以大于或等于2,3,9或7或其他值),
上述當(dāng)前音頻幀的位于上述子帶x內(nèi)的頻譜系數(shù)的峰均比與位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的差值的絕對值大于閾值T8,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或等于閾值T22(其中,閾值T22例如可以小于或等于閾值T2,其中,閾值T22例如可以小于或等于0.5,2,3,1.5或4,5或其他值),
上述當(dāng)前音頻幀的位于上述子帶x內(nèi)的頻譜系數(shù)的峰均比與位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的差值的絕對值大于閾值T8,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或等于閾值T23(其中,閾值T23例如可以小于或等于閾值T3,閾值T23例如可以小于或等于5,8,10,20或其他值),
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的比值未落入?yún)^(qū)間R2,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商大于或等于閾值T24(閾值T24例如可以大于或等于閾值T4,閾值T24例如可以大于或等于2,3,5或8或其他值),
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的比值未落入?yún)^(qū)間R2,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商大于或等于閾值T25(其中,閾值T25例如可以大于或等于閾值T6,閾值T25例如可以大于或等于2,3,9或7或其他值),
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的比值未落入?yún)^(qū)間R2,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或等于閾值T26(其中,閾值T26例如可以小于或等于閾值T2,其中,閾值T26例如可小于或等于0.5,2,3,1.5,4或5或其他值),
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的比值未落入?yún)^(qū)間R2,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或等于閾值T27(其中,閾值T27例如可以小于或等于閾值T3,其中,閾值T27例如可以小于或等于5,8,10,20或其他值),
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的差值的絕對值大于閾值T9,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商大于或等于閾值T28(其中,閾值T28例如可以大于或等于閾值T4,閾值T28例如可以大于或等于2,3,5或8或其他值),
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的差值的絕對值大于閾值T9,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商大于或等于閾值T29(其中,閾值T29例如可以大于或等于閾值T6,閾值T29例如可以大于或等于2,3,9或7或其他值),
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的差值的絕對值大于閾值T9,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或等于閾值T30(其中,閾值T30例如可以小于或等于閾值T2,其中,閾值T30例如可小于或等于0.5,2,3,1.5或4,5或其他值),
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的差值的絕對值大于閾值T9,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或等于閾值T31(其中,閾值T31例如可以小于或等于閾值T3,其中,閾值T31例如可以小于或等于5,8或10,20或其他值),
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的比值落入?yún)^(qū)間R3,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商大于或等于閾值T32(其中,閾值T32例如可以大于或等于閾值T4,閾值T32例如可以大于或等于2,3,5或8或其他值),
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的比值落入?yún)^(qū)間R3,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商大于或等于閾值T33(其中,閾值T33例如可以大于或等于閾值T6,閾值T33例如可以大于或等于2,3,9或7或其他值),
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的比值落入?yún)^(qū)間R3,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或等于閾值T34(其中,閾值T34例如可以小于或等于閾值T2,其中,閾值T34例如可小于或等于0.5,2,3,1.5或4,5或其他值),
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的比值落入?yún)^(qū)間R3,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或等于閾值T35(其中,閾值T35例如可以小于或等于閾值T3,其中,閾值T35例如可以小于或等于5,8,9.5,10,15,20或其他值),
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的差值的絕對值大于閾值T10,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商大于或等于閾值T36(閾值T36例如可以大于或等于閾值T4,閾值T36例如可以大于或等于2,3,5或8或其他值),
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的差值的絕對值大于閾值T10,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商大于或等于閾值T37(其中,閾值T37例如可以大于或等于閾值T6,閾值T37例如可以大于或等于2,3,9或7或其他值),
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的差值的絕對值大于閾值T10,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或等于閾值T38(其中,閾值T38例如可以小于或等于閾值T2,其中,閾值T38例如可小于或等于0.5,2,3,1.5或4,5或其他值),
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的差值的絕對值大于閾值T10,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或等于閾值T39(其中,閾值T39例如可以小于或等于閾值T3,其中,閾值T39例如可以小于或等于5,8,9.5,10或15,20或其他值),
上述當(dāng)前音頻幀的位于上述子帶p內(nèi)的頻譜系數(shù)和位于上述子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值小于或等于閾值T11,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商大于或等于閾值T40(閾值T40例如可以大于或等于閾值T4,閾值T40例如可以大于或等于2,3,5或8或其他值);
上述當(dāng)前音頻幀的位于上述子帶p內(nèi)的頻譜系數(shù)和位于上述子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值小于或等于閾值T11,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商大于或等于閾值T41(閾值T41例如可以大于或等于閾值T6,閾值T41例如可以大于或等于2,3,9或7或其他值),
上述當(dāng)前音頻幀的位于上述子帶p內(nèi)的頻譜系數(shù)和位于上述子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值小于或等于閾值T11,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或等于閾值T42(其中,閾值T42例如可以小于或等于閾值T2,其中,閾值T42例如可小于或等于0.5,2,3,1.5或4,5或其他值);
上述當(dāng)前音頻幀的位于上述子帶p內(nèi)的頻譜系數(shù)和位于上述子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值小于或等于閾值T11,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或等于閾值T43(其中,閾值T43例如可以小于或等于閾值T3,其中,閾值T43例如可以小于或等于5,8,9.5,10,15或20或其他值);
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比除以位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的商小于閾值T44(其中,閾值T44的取值范圍例如可以為1.5~3),且上述子帶y內(nèi)的頻譜系數(shù)的峰均比小于閾值T45(閾值T45的取值范圍例如可以為1~3),
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比除以位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的商大于閾值T46(其中,閾值T46的取值范圍例如可以為1.5~3),且上述子帶y內(nèi)的頻譜系數(shù)的峰均比大于閾值T47(閾值T47的取值范圍例如可以為1~3),
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比減位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的差值小于閾值T48(其中,閾值T48的取值范圍例如可以為-1~3),且上述子帶y內(nèi)的頻譜系數(shù)的峰均比小于閾值T49(閾值T49的取值范圍例如可以為1~3),
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比減位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的差值大于閾值T50(其中,閾值T50的取值范圍例如可以為-1~3),且上述子帶y內(nèi)的頻譜系數(shù)的峰均比大于閾值T51(閾值T51值范圍例如可以為1~3),
上述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差除以位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的商小于閾值T52(其中,閾值T52取值范圍例如可以為1~3),且上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于閾值T53(其中,閾值T53例如可等于10,20,30或其他值),
上述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差除以位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的商大于閾值T54(其中,閾值T54取值范圍例如可以為1~3),且上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T55(其中,閾值T55例如可等于10,20,30或其他值),
上述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差減位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的差值小于閾值T56(其中,閾值T54取值范圍例如可為-40~40),且上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于閾值T57(閾值T57例如可等于10,20,30或其他值),
上述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差減位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的差值大于閾值T58(其中,閾值T58取值范圍例如可為-40~40),且上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T59(閾值T59例如可等于10,20,30或其他值),
上述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)除以位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的商小于閾值T60(其中,閾值T60取值范圍例如可以為1~3),且上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)小于閾值T61(其中,閾值T61例如可等于10,20,30或其他值),
上述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)除以位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的商大于閾值T62(其中,閾值T62取值范圍例如可以為1~3),且上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)大于閾值T63(其中,閾值T63例如可等于10,20,30或其他值),
上述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)減位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的差值小于閾值T64(其中,閾值T64取值范圍例如可為-40~40),且上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)小于閾值T65(其中,閾值T65例如可等于10,20,30或其他值),
上述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)減位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的差值大于閾值T66(其中,閾值T66取值范圍例如可為-40~40),且上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)大于閾值T67(其中,閾值T67例如可等于10,20,30或其他值);
上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商小于或等于閾值T68(其中,閾值T68例如可以小于或等于0.5,1,2,3或其他值),且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T69(其中,閾值T2例如可以小于或者等于1,2,3,5或其他值),
上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值減位于上述子帶j的頻譜系數(shù)的能量均值得到的差值小于或等于閾值T70(其中,閾值T70例如可以小于或等于10,20,51,100或其他值),且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T71(其中,閾值T71例如可以小于或者等于1,2,3,5或其他值),
上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于或等于閾值T72(其中,閾值T72例如可以大于或等于0.5,1.1,2,3或其他值),且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T73(其中,閾值T73例如可以小于或者等于1,2,3,5或其他值),
上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值減位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于或等于閾值T74(其中,閾值T74例如可以大于或等于11,20,50,101或其他值),且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比小于或者等于閾值T75(其中,閾值T75例如可以小于或者等于1,2,3,5或其他值),
上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商小于或等于閾值T76(其中,閾值T76例如可以小于或等于0.5,1,2,3或其他值),且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T77(其中,閾值T77例如可以大于或等于10,20,35或其他值),
上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值減位于上述子帶j的頻譜系數(shù)的能量均值得到的差值小于或等于閾值T78(其中,閾值T78例如可以小于或等于10,20,51,100或其他值),且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T79(其中,閾值T79例如可以大于或等于10,20,35或其他值),
上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于或等于閾值T80(其中,閾值T80例如可以大于或等于0.5,1.1,2,3或其他值),且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T81(其中,閾值T81例如可以大于或等于10,20,35或其他值),以及
上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值減位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于或等于閾值T82(其中,閾值T82例如可以大于或等于11,20,50,101或其他值),且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于或者等于閾值T83(其中,閾值T83例如可以大于或等于10,20,35或其他值)。
可以理解,第一參數(shù)條件并不限于上述舉例,還可基于上述舉例擴(kuò)展出其他多種可能的實(shí)施方式。
例如,在本發(fā)明一些可能的實(shí)施方式中,上述第二參數(shù)條件包括如下條件中的至少一個(gè):
上述當(dāng)前音頻幀的編碼速率大于或等于閾值T1,
上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T2,
上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T3,
上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商小于閾值T4,
上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值減去位于上述子帶j的頻譜系數(shù)的能量均值得到的差值小于閾值T5,
上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于閾值T6,
上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值減去位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于閾值T7,
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的比值未落入?yún)^(qū)間R1,
上述當(dāng)前音頻幀的位于上述子帶x內(nèi)的頻譜系數(shù)的峰均比與位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的差值的絕對值大于閾值T8,
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的比值未落入?yún)^(qū)間R2,
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的差值的絕對值大于閾值T9,
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的比值未落入?yún)^(qū)間R3,
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的差值的絕對值大于閾值T10,以及
上述當(dāng)前音頻幀的位于上述子帶p內(nèi)的頻譜系數(shù)和位于上述子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值小于閾值T11。
又例如,在本發(fā)明一些可能的實(shí)施方式中,上述第二參數(shù)條件包括如下條件中的其中一個(gè):
上述當(dāng)前音頻幀的編碼速率大于或等于閾值T1,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商小于閾值T12,
上述當(dāng)前音頻幀的編碼速率大于或等于閾值T1,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于閾值T13,
上述當(dāng)前音頻幀的編碼速率大于或等于閾值T1,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T14,
上述當(dāng)前音頻幀的編碼速率大于或等于閾值T1,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T15,
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的比值未落入?yún)^(qū)間R1,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商小于閾值T16,
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的比值未落入?yún)^(qū)間R1,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于閾值T17,
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的比值未落入?yún)^(qū)間R1,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T18,
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的比值未落入?yún)^(qū)間R1,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T19,
上述當(dāng)前音頻幀的位于上述子帶x內(nèi)的頻譜系數(shù)的峰均比與位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的差值的絕對值大于閾值T8,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商小于閾值T20,
上述當(dāng)前音頻幀的位于上述子帶x內(nèi)的頻譜系數(shù)的峰均比與位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的差值的絕對值大于閾值T8,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于閾值T21,
上述當(dāng)前音頻幀的位于上述子帶x內(nèi)的頻譜系數(shù)的峰均比與位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的差值的絕對值大于閾值T8,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T22,
上述當(dāng)前音頻幀的位于上述子帶x內(nèi)的頻譜系數(shù)的峰均比與位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比的差值的絕對值大于閾值T8,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T23,
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的比值未落入?yún)^(qū)間R2,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商小于閾值T24,
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的比值未落入?yún)^(qū)間R2,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于閾值T25,
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的比值未落入?yún)^(qū)間R2,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T26,
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的比值未落入?yún)^(qū)間R2,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T27,
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的差值的絕對值大于閾值T9,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商小于閾值T28,
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的差值的絕對值大于閾值T9,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于閾值T29,
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的差值的絕對值大于閾值T9,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T30,
上述當(dāng)前音頻幀的位于上述子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差的差值的絕對值大于閾值T9,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T31,
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的比值落入?yún)^(qū)間R3,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商小于閾值T32,
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的比值落入?yún)^(qū)間R3,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于閾值T33,
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的比值落入?yún)^(qū)間R3,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T34,
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的比值落入?yún)^(qū)間R3,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T35,
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的差值的絕對值大于閾值T10,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商小于閾值T36,
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的差值的絕對值大于閾值T10,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于閾值T37,
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的差值的絕對值大于閾值T10,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T38,
上述當(dāng)前音頻幀的位于上述子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)的差值的絕對值大于閾值T10,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T39,
上述當(dāng)前音頻幀的位于上述子帶p內(nèi)的頻譜系數(shù)和位于上述子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值小于或等于閾值T11,且上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商小于閾值T40,
上述當(dāng)前音頻幀的位于上述子帶p內(nèi)的頻譜系數(shù)和位于上述子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值小于或等于閾值T11,且上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于閾值T41,
上述當(dāng)前音頻幀的位于上述子帶p內(nèi)的頻譜系數(shù)和位于上述子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值小于或等于閾值T11,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T42,
上述當(dāng)前音頻幀的位于上述子帶p內(nèi)的頻譜系數(shù)和位于上述子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值小于或等于閾值T11,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T43,
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比除以位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的商小于閾值T44,且上述子帶y內(nèi)的頻譜系數(shù)的峰均比大于閾值T45,
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比除以位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的商大于閾值T46,且上述子帶y內(nèi)的頻譜系數(shù)的峰均比小于閾值T47,
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比減位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的差值小于閾值T48,且上述子帶y內(nèi)的頻譜系數(shù)的峰均比大于閾值T49,
上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比減位于上述子帶y內(nèi)的頻譜系數(shù)的峰均比得到的差值大于閾值T50,且上述子帶y內(nèi)的頻譜系數(shù)的峰均比小于閾值T51,
上述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差除以位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的商小于閾值T52,且上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T53,
上述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差除以位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的商大于閾值T54,且上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于閾值T55,
上述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差減位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的差值小于閾值T56,且上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T57,
上述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差減位于上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差得到的差值大于閾值T58,且上述子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差小于閾值T59,
上述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)除以位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的商小于閾值T60,且上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)大于閾值T61,
上述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)除以位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的商大于閾值T62,且上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)小于閾值T63,
上述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)減位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的差值小于閾值T64,且上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)大于閾值T65,
上述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)減位于上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)得到的差值大于閾值T66,且上述子帶f內(nèi)的頻譜系數(shù)的包絡(luò)小于閾值T67,
上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商小于或等于閾值T68,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T69,
上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值減位于上述子帶j的頻譜系數(shù)的能量均值得到的差值小于或等于閾值T70,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T71,
上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于或等于閾值T72,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T73,
上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值減位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于或等于閾值T74,且上述當(dāng)前音頻幀的位于上述子帶z內(nèi)的頻譜系數(shù)的峰均比大于閾值T75,
上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于上述子帶j的頻譜系數(shù)的能量均值得到的商小于或等于閾值T76,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T77,
上述當(dāng)前音頻幀的位于上述子帶i內(nèi)的頻譜系數(shù)的能量均值減位于上述子帶j的頻譜系數(shù)的能量均值得到的差值小于或等于閾值T78,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T79,
上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的商小于或等于閾值T80且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T81,以及
上述當(dāng)前音頻幀的位于上述子帶m內(nèi)的頻譜系數(shù)的幅度均值減位于上述子帶n內(nèi)的頻譜系數(shù)的幅度均值得到的差值小于或等于閾值T82,且上述當(dāng)前音頻幀的位于上述子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差大于閾值T83。
可以理解,第二參數(shù)條件并不限于上述舉例,還可基于上述舉例擴(kuò)展出其他多種可能的實(shí)施方式。
可以理解,上述舉例的第一參數(shù)條件和第一參數(shù)條件并非全部的可能實(shí)施方式,在實(shí)際應(yīng)用中,還可能擴(kuò)展上述舉例,以豐富第一參數(shù)條件和第一參數(shù)條件的可能實(shí)施方式。
為便于更好的理解本發(fā)明實(shí)施例的上述方案,下面結(jié)合一些具體的應(yīng)用場景進(jìn)行舉例說明。
首先請參見圖2,圖2為本發(fā)明的另一個(gè)實(shí)施例提供的另一種音頻編碼方法的流程示意圖。圖2所示舉例中,主要以基于當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值,來確定編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法。
其中,如圖2所示,本發(fā)明的另一個(gè)實(shí)施例提供的另一種音頻編碼方法可包括以下內(nèi)容:
201,對當(dāng)前音頻幀的時(shí)域信號進(jìn)行時(shí)頻變換處理以得到上述當(dāng)前音頻幀的頻譜系數(shù)。
其中,本發(fā)明各實(shí)施例中提及的音頻幀可以是語音幀或音樂幀。
其中,假設(shè)當(dāng)前音頻幀的時(shí)域信號的帶寬為16kHz。
基于采用快速傅里葉變換(英文:fast fourier transform,縮寫:FFT)算法或修正離散余弦變換(英文:modified discrete cosine transform,縮寫:MDCT)算法或其他時(shí)頻變換算法,對當(dāng)前音頻幀的時(shí)域信號進(jìn)行時(shí)頻變換處理以得到上述當(dāng)前音頻幀的頻譜系數(shù)。
202,獲取當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值。
203,判斷當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于子帶j的頻譜系數(shù)的能量均值得到的商是否大于或等于閾值T4。
若是,則執(zhí)行步驟204。若否,則執(zhí)行步驟205。
其中,閾值T4可大于或等于0.5,閾值T4例如等于0.5,1,1.5,2,3或其他值。
例如,上述子帶i的頻點(diǎn)范圍可為3.2kHz至6.4kHz,3.2kHz至4.8kHz,4.8kHz至6.4kHz或0.4kHz至6.4kHz。
例如,上述子帶j的頻點(diǎn)范圍可為6.4kHz至9.6kHz,6.4kHz至8kHz,8kHz至9.6kHz或4.8kHz至9.6kHz等。
204,基于TCX算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
205,基于HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
可以看出,本實(shí)施例方案中,獲取當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值后,基于獲取的當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值來選擇TCX算法或HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。由于將當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值之間的關(guān)系,與編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法進(jìn)行關(guān)聯(lián),這樣就有利于提高編碼算法和當(dāng)前音頻幀的編碼參考參數(shù)之間的適應(yīng)性和匹配性,進(jìn)而有利于提高上述當(dāng)前音頻幀的編碼質(zhì)量或編碼效率。
請參見圖3,圖3為本發(fā)明的另一個(gè)實(shí)施例提供的另一種音頻編碼方法的流程示意圖。圖3所示舉例中,主要是以基于當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值,以及當(dāng)前音頻幀的位于子帶z內(nèi)的頻譜系數(shù)的峰均比,來共同確定編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法。
其中,如圖3所示,本發(fā)明的另一個(gè)實(shí)施例提供的另一種音頻編碼方法可包括以下內(nèi)容:
301,對當(dāng)前音頻幀的時(shí)域信號進(jìn)行時(shí)頻變換處理以得到上述當(dāng)前音頻幀的頻譜系數(shù)。
其中,本發(fā)明各實(shí)施例中提及的音頻幀可以是語音幀或音樂幀。
其中,假設(shè)當(dāng)前音頻幀的時(shí)域信號的帶寬為16kHz。
302,獲取上述當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值。
303,判斷上述當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于子帶j的頻譜系數(shù)的能量均值得到的商是否大于或等于閾值T68。
若否,則執(zhí)行步驟304。若是,則執(zhí)行步驟306。
其中,閾值T68大于或等于閾值T4,例如閾值T68可大于或等于0.6,閾值T68例如等于0.8,0.6,1,1.5,2,3,5或其他值。
例如,上述子帶i的頻點(diǎn)范圍可為3.2kHz至6.4kHz,3.2kHz至4.8kHz,4.8kHz至6.4kHz或0.4kHz至6.4kHz。
例如,上述子帶j的頻點(diǎn)范圍可為6.4kHz至9.6kHz,6.4kHz至8kHz,8kHz至9.6kHz或4.8kHz至9.6kHz等。
304,獲取上述當(dāng)前音頻幀的位于子帶z內(nèi)的頻譜系數(shù)的峰均比。
305,判斷上述當(dāng)前音頻幀的位于子帶z內(nèi)的頻譜系數(shù)的峰均比是否大于閾值T69。
若是,則執(zhí)行步驟307。若否,則執(zhí)行步驟306。
其中,閾值T69可大于或等于1,閾值T69例如等于1,1.1,1.5,2,3.5,5或6或4.6或其他值。
例如上述子帶z的最高頻點(diǎn)的取值范圍可為12kHz至16kHz,子帶z的最低頻點(diǎn)的取值范圍可為8kHz至14kHz,具體例如,子帶z的頻點(diǎn)范圍可為8kHz至12kHz,9kHz至11kHz,8kHz至9.6kHz等。
306,基于TCX算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
307,基于HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
可以看出,本實(shí)施例方案中,基于獲取的當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值,以及當(dāng)前音頻幀的位于子帶z內(nèi)的頻譜系數(shù)的峰均比,來選擇TCX算法或HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。由于將當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值之間的關(guān)系,以及當(dāng)前音頻幀的位于子帶z內(nèi)的頻譜系數(shù)的峰均比,與編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法進(jìn)行關(guān)聯(lián),這樣就有利于提高編碼算法和當(dāng)前音頻幀的編碼參考參數(shù)之間的適應(yīng)性和匹配性,進(jìn)而有利于提高上述當(dāng)前音頻幀的編碼質(zhì)量或編碼效率。
請參見圖4,圖4為本發(fā)明的另一個(gè)實(shí)施例提供的另一種音頻編碼方法的流程示意圖。圖4所示舉例中,主要以基于當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y的頻譜系數(shù)的峰均比,來共同確定編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法。
其中,如圖4所示,本發(fā)明的另一個(gè)實(shí)施例提供的另一種音頻編碼方法可包括以下內(nèi)容:
401,對當(dāng)前音頻幀的時(shí)域信號進(jìn)行時(shí)頻變換處理以得到上述當(dāng)前音頻幀的頻譜系數(shù)。
其中,本發(fā)明各實(shí)施例中提及的音頻幀可以是語音幀或音樂幀。
其中,假設(shè)當(dāng)前音頻幀的時(shí)域信號的帶寬為16kHz。
402,獲取當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y的頻譜系數(shù)的峰均比。
403,判斷當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y的頻譜系數(shù)的峰均比的比值是否落入?yún)^(qū)間R1。
若是,則執(zhí)行步驟404。若否,則執(zhí)行步驟405。
其中,區(qū)間R1例如可為[0.5,2],[0.8,1.25],[0.4,2.5]或其他范圍。
例如,上述子帶x的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz或1.6kHz至3.2kHz。上述子帶y的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz或4.8kHz至6.4kHz。
404,基于TCX算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
405,基于HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
可以看出,本實(shí)施例方案中,主要基于獲取的當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y的頻譜系數(shù)的峰均比,來選擇TCX算法或HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。由于將當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y的頻譜系數(shù)的峰均比,與編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法進(jìn)行關(guān)聯(lián),這樣就有利于提高編碼算法和當(dāng)前音頻幀的編碼參考參數(shù)之間的適應(yīng)性和匹配性,進(jìn)而有利于提高上述當(dāng)前音頻幀的編碼質(zhì)量或編碼效率。
請參見圖5,圖5為本發(fā)明的另一個(gè)實(shí)施例提供的另一種音頻編碼方法的流程示意圖。圖5所示舉例中,主要以基于當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y的頻譜系數(shù)的峰均比,來共同確定編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法。
其中,如圖5所示,本發(fā)明的另一個(gè)實(shí)施例提供的另一種音頻編碼方法可包括以下內(nèi)容:
501,對當(dāng)前音頻幀的時(shí)域信號進(jìn)行時(shí)頻變換處理以得到上述當(dāng)前音頻幀的頻譜系數(shù)。
其中,本發(fā)明各實(shí)施例中提及的音頻幀可以是語音幀或音樂幀。
其中,假設(shè)當(dāng)前音頻幀的時(shí)域信號的帶寬為16kHz。
502,獲取當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y的頻譜系數(shù)的峰均比。
503,判斷當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比除以位于子帶y的頻譜系數(shù)的峰均比得到的商是否大于或等于閾值T46。
若是,則執(zhí)行步驟504。若否,則執(zhí)行步驟505。
其中,閾值T46可大于或等于0.5,閾值T4例如等于0.5,1,1.5,2,3或其他值。
例如,上述子帶x的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz或1.6kHz至3.2kHz。上述子帶y的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz或4.8kHz至6.4kHz。
504,判斷上述當(dāng)前音頻幀的位于子帶y的頻譜系數(shù)的峰均比是否大于或者等于閾值T47。
若是,則執(zhí)行步驟506。若否,則執(zhí)行步驟507。
505,判斷上述當(dāng)前音頻幀的位于子帶y的頻譜系數(shù)的峰均比是否小于閾值T47。
若是,則執(zhí)行步驟506。若否,則執(zhí)行步驟507。
506,基于TCX算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
507,基于HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
可以看出,本實(shí)施例方案中,主要基于獲取的當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y的頻譜系數(shù)的峰均比,來選擇TCX算法或HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。由于將當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y的頻譜系數(shù)的峰均比,與編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法進(jìn)行關(guān)聯(lián),這樣就有利于提高編碼算法和當(dāng)前音頻幀的編碼參考參數(shù)之間的適應(yīng)性和匹配性,進(jìn)而有利于提高上述當(dāng)前音頻幀的編碼質(zhì)量或編碼效率。
參見圖6,圖6為本發(fā)明的另一個(gè)實(shí)施例提供的另一種音頻編碼方法的流程示意圖。圖6所示舉例中,主要以基于當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y的頻譜系數(shù)的峰均比,以及當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值,來共同確定編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法。
其中,如圖6所示,本發(fā)明的另一個(gè)實(shí)施例提供的另一種音頻編碼方法可包括以下內(nèi)容:
601,對當(dāng)前音頻幀的時(shí)域信號進(jìn)行時(shí)頻變換處理以得到上述當(dāng)前音頻幀的頻譜系數(shù)。
其中,本發(fā)明各實(shí)施例中提及的音頻幀可以是語音幀或音樂幀。
其中,假設(shè)當(dāng)前音頻幀的時(shí)域信號的帶寬為16kHz。
602,獲取當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y的頻譜系數(shù)的峰均比。
603,判斷當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y的頻譜系數(shù)的峰均比的比值是否落入?yún)^(qū)間R1。
若否,則執(zhí)行步驟604。若是,則執(zhí)行步驟606。
其中,區(qū)間R1例如可為[0.5,2],[0.8,1.25],[0.4,2.5]或其他范圍。
例如,上述子帶x的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz或1.6kHz至3.2kHz。上述子帶y的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz或4.8kHz至6.4kHz。
604,獲取當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值。
605,判斷當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于子帶j的頻譜系數(shù)的能量均值得到的商是否大于或等于閾值T16。
若是,則執(zhí)行步驟606。若否,則執(zhí)行步驟607。
其中,子帶i的頻點(diǎn)范圍例如可為0kHz至1.6kHz或1kHz至2.6kHz,子帶j的頻點(diǎn)范圍例如可為6.4kHz至8kHz或4.8kHz至6.4kHz或7.4kHz至9kHz。
其中,閾值T16大于閾值T4,例如閾值T16可大于或等于2,閾值T16例如等于2,2.5,3,3.5,5,5.1或其他值。
606,基于TCX算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
607,基于HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
可以看出,本實(shí)施例方案中,主要基于獲取的當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y的頻譜系數(shù)的峰均比,以及當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值,來選擇TCX算法或HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。由于將當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y的頻譜系數(shù)的峰均比,以及當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值,與編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法進(jìn)行關(guān)聯(lián),這樣就有利于提高編碼算法和當(dāng)前音頻幀的編碼參考參數(shù)之間的適應(yīng)性和匹配性,進(jìn)而有利于提高上述當(dāng)前音頻幀的編碼質(zhì)量或編碼效率。
參見圖7,圖7為本發(fā)明的另一個(gè)實(shí)施例提供的另一種音頻編碼方法的流程示意圖。其中,圖7所示舉例當(dāng)中,主要是以當(dāng)前音頻幀的編碼速率,以及當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值,來共同確定編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法。
其中,如圖7所示,本發(fā)明的另一個(gè)實(shí)施例提供的另一種音頻編碼方法可包括以下內(nèi)容:
701,對當(dāng)前音頻幀的時(shí)域信號進(jìn)行時(shí)頻變換處理以得到上述當(dāng)前音頻幀的頻譜系數(shù)。
其中,本發(fā)明各實(shí)施例中提及的音頻幀可以是語音幀或音樂幀。
其中,假設(shè)當(dāng)前音頻幀的時(shí)域信號的帶寬為16kHz。
702,判斷當(dāng)前音頻幀的編碼速率是否大于或等于閾值T1。
若是,則執(zhí)行步驟703。若否,則執(zhí)行步驟705。
其中,閾值T1例如大于或等于24.4kbps。例如閾值T1等于24.4kbps,32kbps或64kbps或其他速率。
703,獲取當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值。
704,判斷當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值除以位于子帶j的頻譜系數(shù)的能量均值得到的商是否大于或等于閾值T12。
若是,則執(zhí)行步驟705。若否,則執(zhí)行步驟706。
其中,子帶i的頻點(diǎn)范圍例如可為0kHz至1.6kHz或1kHz至2.6kHz,子帶j的頻點(diǎn)范圍例如可為6.4kHz至8kHz或4.8kHz至6.4kHz或7.4kHz至9kHz。
其中,閾值T12可大于閾值T4,例如閾值T12可大于或等于2,閾值T12例如等于2,2.5,3,3.5,5,5.2或其他值。
705,基于TCX算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
706,基于HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
可以看出,本實(shí)施例方案中,主要基于當(dāng)前音頻幀的編碼速率,以及當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值,來選擇TCX算法或HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。由于將當(dāng)前音頻幀的編碼速率,以及當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值和位于子帶j的頻譜系數(shù)的能量均值,與編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法進(jìn)行關(guān)聯(lián),這樣就有利于提高編碼算法和當(dāng)前音頻幀的編碼參考參數(shù)之間的適應(yīng)性和匹配性,進(jìn)而有利于提高上述當(dāng)前音頻幀的編碼質(zhì)量或編碼效率。
請參見圖8,圖8為本發(fā)明的另一個(gè)實(shí)施例提供的另一種音頻編碼方法的流程示意圖。圖2所示舉例中,主要以基于當(dāng)前音頻幀的位于子帶m內(nèi)的頻譜系數(shù)的幅度均值和位于子帶n內(nèi)的頻譜系數(shù)的幅度均值,來確定編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法。
其中,如圖8所示,本發(fā)明的另一個(gè)實(shí)施例提供的另一種音頻編碼方法可包括以下內(nèi)容:
801,對當(dāng)前音頻幀的時(shí)域信號進(jìn)行時(shí)頻變換處理以得到上述當(dāng)前音頻幀的頻譜系數(shù)。
其中,本發(fā)明各實(shí)施例中提及的音頻幀可以是語音幀或音樂幀。
其中,假設(shè)當(dāng)前音頻幀的時(shí)域信號的帶寬為16kHz。
802,獲取當(dāng)前音頻幀的位于子帶m內(nèi)的頻譜系數(shù)的幅度均值和位于子帶n內(nèi)的頻譜系數(shù)的幅度均值。
803,判斷當(dāng)前音頻幀的位于子帶m內(nèi)的頻譜系數(shù)的幅度均值除以位于子帶n的頻譜系數(shù)的幅度均值得到的商是否大于或等于閾值T6。
若是,則執(zhí)行步驟804。若否,則執(zhí)行步驟805。
其中,閾值T6可大于或等于0.3,閾值T6例如等于0.5,1,1.5,2,3.2或其他值。
例如,子帶m的頻點(diǎn)范圍可為3.2kHz至6.4kHz,3.2kHz至4.8kHz,4.8kHz至6.4kHz或0.4kHz至6.4kHz。
例如,上述子帶n的頻點(diǎn)范圍可為6.4kHz至9.6kHz,6.4kHz至8kHz,8kHz至9.6kHz或4.8kHz至9.6kHz等。
804,基于TCX算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
805,基于HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
可以看出,本實(shí)施例的方案中,基于獲取的當(dāng)前音頻幀的位于子帶m內(nèi)的頻譜系數(shù)的幅度均值和位于子帶n內(nèi)的頻譜系數(shù)的幅度均值,來選擇TCX算法或HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。由于將當(dāng)前音頻幀的位于子帶m內(nèi)的頻譜系數(shù)的幅度均值和位于子帶n內(nèi)的頻譜系數(shù)的幅度均值之間的關(guān)系,以及當(dāng)前音頻幀的位于子帶z內(nèi)的頻譜系數(shù)的峰均比,與編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法進(jìn)行關(guān)聯(lián),這樣就有利于提高編碼算法和當(dāng)前音頻幀的編碼參考參數(shù)之間的適應(yīng)性和匹配性,進(jìn)而有利于提高上述當(dāng)前音頻幀的編碼質(zhì)量或編碼效率。
可以理解,圖2~圖8所舉例的實(shí)施方式僅為本發(fā)明的部分實(shí)施方式,在實(shí)際應(yīng)用中,還可基于圖1所對應(yīng)的實(shí)施例中的相關(guān)舉例描述,擴(kuò)展出其他多個(gè)可能的實(shí)施方式。
在有些場景下,進(jìn)行子帶選擇時(shí)可以進(jìn)行如下考慮:
計(jì)算位于兩個(gè)子帶內(nèi)的頻譜系數(shù)的特性參數(shù)的相似性時(shí),可以選擇匹配的兩個(gè)子帶,如0kHz~1.6kHz和6.4~8kHz這兩個(gè)子帶,而在一些場景中,0~1kHz范圍內(nèi)的頻譜系數(shù)和1~16kHz范圍內(nèi)的頻譜系數(shù)的特性差別較大,所以在計(jì)算頻譜系數(shù)的特性參數(shù)的相似性時(shí)可不選擇這段頻譜,例如可選擇1kHz~2.6kHz范圍內(nèi)的頻譜系數(shù)來代替0~1.6kHz范圍內(nèi)的頻譜系數(shù),來計(jì)算低頻頻譜系數(shù)的特性參數(shù)。這時(shí)1kHz~2.6kHz范圍內(nèi)的低頻如果拷貝到高頻,對應(yīng)的應(yīng)該是7.4kHz~9kHz范圍內(nèi)的高頻頻譜系數(shù),計(jì)算高頻頻譜系數(shù)的特性參數(shù)時(shí),計(jì)算7.4kHz~9kHz范圍內(nèi)的頻譜特性更合適。但在有些場景下,0kHz~6.4kHz范圍的頻譜系數(shù)的分辨率可能特別高,計(jì)算特性參數(shù)較優(yōu),如果6.4kHz~16kHz范圍的頻譜系數(shù)的分辨率較低,可能不適合計(jì)算頻譜系數(shù)的特性參數(shù)。所以在計(jì)算高頻頻譜系數(shù)的特性參數(shù)時(shí),也可以選擇了4.8kHz~6.4kHz范圍內(nèi)的頻譜系數(shù)來計(jì)算特性參數(shù),此特性參數(shù)作為高頻的特性參數(shù)。
其中,基于變換碼激勵(lì)編碼算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼具體可以包括:將頻譜系數(shù)分成N個(gè)子帶;計(jì)算并量化每個(gè)子帶的包絡(luò);根據(jù)量化后的包絡(luò)值和可用比特?cái)?shù)對每個(gè)子帶進(jìn)行比特分配;根據(jù)每個(gè)子帶分配的比特?cái)?shù),量化每個(gè)子帶的頻譜系數(shù);將量化的頻譜系數(shù)和頻譜包絡(luò)的索引值寫入碼流。
下面還提供用于實(shí)施上述方案的相關(guān)裝置。
參見圖9,本發(fā)明實(shí)施例還提供一種音頻編碼器900,可以包括:時(shí)頻變換單元910,獲取單元920和編碼單元930。
時(shí)頻變換單元910,用于對當(dāng)前音頻幀的時(shí)域信號進(jìn)行時(shí)頻變換處理以得到上述當(dāng)前音頻幀的頻譜系數(shù)。
獲取單元920,用于獲取當(dāng)前音頻幀的編碼參考參數(shù);
編碼單元930,用于若獲取單元920獲取到的上述當(dāng)前音頻幀的編碼參考參數(shù)符合第一參數(shù)條件,基于變換碼激勵(lì)編碼算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼;若上述獲取單元獲取到的上述當(dāng)前音頻幀的編碼參考參數(shù)符合第二參數(shù)條件,基于高質(zhì)量變換編碼算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
其中,根據(jù)應(yīng)用場景的需求,獲取單元920獲取的當(dāng)前音頻幀的編碼參考參數(shù)可能是多種多樣的。
例如,上述編碼參考參數(shù)例如可包括如下參數(shù)中的至少一種:上述當(dāng)前音頻幀的編碼速率,上述當(dāng)前音頻幀的位于子帶z內(nèi)的頻譜系數(shù)的峰均比,上述當(dāng)前音頻幀的位于子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差,上述當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值與位于子帶j的頻譜系數(shù)的能量均值,上述當(dāng)前音頻幀的位于子帶m內(nèi)的頻譜系數(shù)的幅度均值與位于子帶n內(nèi)的頻譜系數(shù)的幅度均值,上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y內(nèi)的頻譜系數(shù)的峰均比,上述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差,上述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于子帶f內(nèi)的頻譜系數(shù)的包絡(luò),上述當(dāng)前音頻幀的位于子帶p內(nèi)的頻譜系數(shù)和位于子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值。
其中,上述當(dāng)前音頻幀的位于子帶p內(nèi)的頻譜系數(shù)和位于子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值越大,表示位于子帶p內(nèi)的頻譜系數(shù)和位于子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性越強(qiáng),其中,頻譜相關(guān)性參數(shù)值例如可為歸一化互相關(guān)參數(shù)值。
其中,上述各子帶的頻點(diǎn)范圍具體可根據(jù)實(shí)際需要確定。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,上述子帶z的最高頻點(diǎn)可以大于臨界頻點(diǎn)F1。上述子帶w的最高頻點(diǎn)可大于上述臨界頻點(diǎn)F1。其中,上述臨界頻點(diǎn)F1的取值范圍例如可為6.4kHz至12kHz。例如,臨界頻點(diǎn)F1的取值可以為6.4kHz,8kHz,9kHz,10kHz,12kHz等等,當(dāng)然,臨界頻點(diǎn)F1也可為其他取值。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,上述子帶j的最高頻點(diǎn)大于臨界頻點(diǎn)F2。上述子帶n的最高頻點(diǎn)大于上述臨界頻點(diǎn)F2。例如,上述臨界頻點(diǎn)F2的取值范圍可以為4.8kHz至8kHz。具體例如,臨界頻點(diǎn)F2的取值可以為6.4kHz,4.8kHz,6kHz,8kHz,5kHz,7kHz等等,當(dāng)然,臨界頻點(diǎn)F2也可為其他取值。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,上述子帶i的最高頻點(diǎn)可以小于上述子帶j的最高頻點(diǎn)。上述子帶m的最高頻點(diǎn)可以小于上述子帶n的最高頻點(diǎn)。上述子帶x的最高頻點(diǎn)可小于或等于上述子帶y的最低頻點(diǎn)。上述子帶p的最高頻點(diǎn)可小于或等于上述子帶q的最低頻點(diǎn),上述子帶r的最高頻點(diǎn)可小于或等于上述子帶s的最低頻點(diǎn)。上述子帶e的最高頻點(diǎn)可小于或等于上述子帶f的最低頻點(diǎn)。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,如下條件之中的至少一個(gè)可以被滿足:
上述子帶w的最低頻點(diǎn)大于或等于臨界頻點(diǎn)F1,上述子帶z的最低頻點(diǎn)大于或等于上述臨界頻點(diǎn)F1,上述子帶i的最高頻點(diǎn)小于或等于上述子帶j的最低頻點(diǎn),上述子帶m的最高頻點(diǎn)小于或等于上述子帶n的最低頻點(diǎn),上述子帶j的最低頻點(diǎn)大于或等于臨界頻點(diǎn)F2,上述子帶n的最低頻點(diǎn)大于或等于上述臨界頻點(diǎn)F2,上述子帶i的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,上述子帶m的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,子帶j的最低頻點(diǎn)大于或等于臨界頻點(diǎn)F2,上述子帶n的最低頻點(diǎn)大于或等于臨界頻點(diǎn)F2。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,如下條件之中的至少一個(gè)可以被滿足:上述子帶e的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,上述子帶x的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,上述子帶p的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,上述子帶r的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,上述子帶f的最高頻點(diǎn)可小于或者等于臨界頻點(diǎn)F2,當(dāng)然,上述子帶f的最低頻點(diǎn)也可能大于或者等于臨界頻點(diǎn)F2。上述子帶q的最高頻點(diǎn)可小于或者等于臨界頻點(diǎn)F2,當(dāng)然,上述子帶q的最低頻點(diǎn)也可能大于或者等于臨界頻點(diǎn)F2。上述子帶s的最高頻點(diǎn)可小于或者等于臨界頻點(diǎn)F2,當(dāng)然,上述子帶s的最低頻點(diǎn)也可能大于或者等于臨界頻點(diǎn)F2。
舉例來說,上述子帶z的最高頻點(diǎn)的取值范圍可為12kHz至16kHz。子帶z的最低頻點(diǎn)的取值范圍可為8kHz至14kHz。子帶z的帶寬的取值范圍可為1.6kHz~8kHz。具體例如,子帶z的頻點(diǎn)范圍可為8kHz至12kHz,9kHz至11kHz或8kHz至9.6kHz或12kHz至14kHz等。當(dāng)然,子帶z的頻點(diǎn)范圍也并不限于上述舉例。
例如,子帶w的頻點(diǎn)范圍也可根據(jù)實(shí)際需要確定,例如子帶w的最高頻點(diǎn)的取值范圍可為12kHz至16kHz,子帶w的最低頻點(diǎn)的取值范圍可為8kHz至14kHz。具體例如子帶w的頻點(diǎn)范圍為8kHz至12kHz,9kHz至11kHz,8kHz至9.6kHz,12kHz至14kHz,12.2kHz至14.5kHz等。當(dāng)然,子帶w的頻點(diǎn)范圍也并不限于上述舉例。在一些可能的實(shí)施方式中,子帶w的頻點(diǎn)范圍和子帶z的頻點(diǎn)范圍可相同或相近。
例如,上述子帶i的頻點(diǎn)范圍可為3.2kHz至6.4kHz,3.2kHz至4.8kHz,4.8kHz至6.4kHz,0.4kHz至6.4kHz或0.4kHz至3.6kHz,當(dāng)然,子帶i的頻點(diǎn)范圍也不限于上述舉例。
例如,上述子帶j的頻點(diǎn)范圍可為6.4kHz至9.6kHz,6.4kHz至8kHz,8kHz至9.6kHz,4.8kHz至9.6kHz或4.8kHz至8kHz等。當(dāng)然,子帶j的頻點(diǎn)范圍也不限于上述舉例。
例如,上述子帶m的頻點(diǎn)范圍為3.2kHz至6.4kHz,3.2kHz至4.8kHz,4.8kHz至6.4kHz,0.4kHz至6.4kHz或0.4kHz至3.6kHz,當(dāng)然,子帶m的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶m的頻點(diǎn)范圍和子帶i的頻點(diǎn)范圍可相同或相近。
例如,上述子帶n的頻點(diǎn)范圍可為6.4kHz至9.6kHz,6.4kHz至8kHz,8kHz至9.6kHz,4.8kHz至9.6kHz或4.8kHz至8kHz等。當(dāng)然,子帶n的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶n的頻點(diǎn)范圍和子帶j的頻點(diǎn)范圍可相同或相近。
例如,上述子帶x的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz,1.6kHz至3.2kHz,2kHz至3.2kHz或2.5kHz至3.4kHz。當(dāng)然,子帶x的頻點(diǎn)范圍也不限于上述舉例。
例如,上述子帶y的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz,4.8kHz至6.4kHz,4.4kHz至6.4kHz或4.5kHz至6.2kHz。當(dāng)然,子帶y的頻點(diǎn)范圍也不限于上述舉例。
例如,上述子帶p的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz,1.6kHz至3.2kHz,2.1kHz至3.2kHz或2.5kHz至3.5kHz。當(dāng)然,子帶p的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶p的頻點(diǎn)范圍和子帶x的頻點(diǎn)范圍可相同或相近。
例如,上述子帶q的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz,4.8kHz至6.4kHz,4.2kHz至6.4kHz或4.7kHz至6.2kHz。當(dāng)然,子帶q的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶q的頻點(diǎn)范圍和子帶y的頻點(diǎn)范圍可相同或相近。
例如,上述子帶r的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz,1.6kHz至3.2kHz,2.05kHz至3.27kHz或2.59kHz至3.51kHz。當(dāng)然,子帶r的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶r的頻點(diǎn)范圍和子帶x的頻點(diǎn)范圍可相同或相近。
例如,上述子帶s的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz,4.8kHz至6.4kHz,5.4kHz至7.1kHz或4.55kHz至6.29kHz。當(dāng)然,子帶s的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶s的頻點(diǎn)范圍和子帶y的頻點(diǎn)范圍可相同或相近。
例如,上述子帶e的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz,1.6kHz至3.2kHz,0.8kHz至3kHz或1.9kHz至3.8kHz。當(dāng)然,子帶e的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶e的頻點(diǎn)范圍和子帶x的頻點(diǎn)范圍可相同或相近。
例如,上述子帶f的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz,4.8kHz至6.4kHz,5.3kHz至7.15kHz或4.58kHz至6.52kHz。當(dāng)然,子帶f的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶f的頻點(diǎn)范圍和子帶y的頻點(diǎn)范圍可相同或相近。
其中,上述第一參數(shù)條件和第二參數(shù)條件可能是多種多樣的。
例如,在本發(fā)明一些可能的實(shí)施方式中,本實(shí)施例中的第一參數(shù)條件例如可為上述方法實(shí)施例中舉例的第一參數(shù)條件。本實(shí)施例中的第二參數(shù)條件例如可為上述方法實(shí)施例中舉例的第二參數(shù)條件,相關(guān)描述請參考上述方法實(shí)施例中的記載。
可以理解的是,本實(shí)施例的音頻編碼器900的各功能模塊的功能可根據(jù)上述方法實(shí)施例中的方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過程可以參照上述方法實(shí)施例的相關(guān)描述,此處不再贅述。
其中,音頻編碼器900音頻編碼器可為任何需要采集,存儲(chǔ)或者向外傳輸音頻信號的裝置,例如手機(jī),平板電腦,個(gè)人電腦,筆記本電腦等等
可以看出,本實(shí)施例方案中,音頻編碼器900獲取當(dāng)前音頻幀的編碼參考參數(shù)后,基于獲取的當(dāng)前音頻幀的編碼參考參數(shù)來選擇TCX算法或HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。由于將當(dāng)前音頻幀的編碼參考參數(shù)與編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法進(jìn)行關(guān)聯(lián),這樣就有利于提高編碼算法和當(dāng)前音頻幀的編碼參考參數(shù)之間的適應(yīng)性和匹配性,進(jìn)而有利于提高上述當(dāng)前音頻幀的編碼質(zhì)量或編碼效率。
參見圖10,圖10是本發(fā)明另一實(shí)施例提供的音頻編碼器的結(jié)構(gòu)框圖。
音頻編碼器1000可包括:至少1個(gè)處理器1001,存儲(chǔ)器1005和至少1個(gè)通信總線1002。通信總線1002用于實(shí)現(xiàn)這些組件之間的連接通信。
可選的,該音頻編碼器1000還可包括:至少1個(gè)網(wǎng)絡(luò)接口1004和用戶接口1003等。其中,可選的,用戶接口1003包括顯示器(如觸摸屏,液晶顯示器或者全息成像(英文:Holographic)或者投影(英文:Projector)等等),點(diǎn)擊設(shè)備(例如鼠標(biāo),軌跡球(英文:trackball)觸感板或觸摸屏等),攝像頭和/或拾音裝置等。
其中,存儲(chǔ)器1005可以包括只讀存儲(chǔ)器和隨機(jī)存取存儲(chǔ)器,并向處理器1001提供指令和數(shù)據(jù)。存儲(chǔ)器1005中的一部分還可以包括非易失性隨機(jī)存取存儲(chǔ)器。
在一些可能的實(shí)施方式中,存儲(chǔ)器1005存儲(chǔ)了如下的元素,可執(zhí)行模塊或者數(shù)據(jù)結(jié)構(gòu),或者他們的子集,或者他們的擴(kuò)展集:時(shí)頻變換單元910,獲取單元920和編碼單元930。
在本發(fā)明實(shí)施例中,處理器1001執(zhí)行存儲(chǔ)器1005中的代碼或指令,以用于對當(dāng)前音頻幀的時(shí)域信號進(jìn)行時(shí)頻變換處理以得到上述當(dāng)前音頻幀的頻譜系數(shù);獲取當(dāng)前音頻幀的編碼參考參數(shù);若獲取的上述當(dāng)前音頻幀的編碼參考參數(shù)符合第一參數(shù)條件,基于變換碼激勵(lì)編碼算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼;若獲取的上述當(dāng)前音頻幀的編碼參考參數(shù)符合第二參數(shù)條件,基于高質(zhì)量變換編碼算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。
其中,根據(jù)應(yīng)用場景的需求,處理器1001中獲取的當(dāng)前音頻幀的編碼參考參數(shù)可能是多種多樣的。
例如,上述編碼參考參數(shù)例如可包括如下參數(shù)中的至少一種:上述當(dāng)前音頻幀的編碼速率,上述當(dāng)前音頻幀的位于子帶z內(nèi)的頻譜系數(shù)的峰均比,上述當(dāng)前音頻幀的位于子帶w內(nèi)的頻譜系數(shù)的包絡(luò)偏差,上述當(dāng)前音頻幀的位于子帶i內(nèi)的頻譜系數(shù)的能量均值與位于子帶j的頻譜系數(shù)的能量均值,上述當(dāng)前音頻幀的位于子帶m內(nèi)的頻譜系數(shù)的幅度均值與位于子帶n內(nèi)的頻譜系數(shù)的幅度均值,上述當(dāng)前音頻幀的位于子帶x內(nèi)的頻譜系數(shù)的峰均比和位于子帶y內(nèi)的頻譜系數(shù)的峰均比,上述當(dāng)前音頻幀的位于子帶r內(nèi)的頻譜系數(shù)的包絡(luò)偏差和位于子帶s內(nèi)的頻譜系數(shù)的包絡(luò)偏差,上述當(dāng)前音頻幀的位于子帶e內(nèi)的頻譜系數(shù)的包絡(luò)和位于子帶f內(nèi)的頻譜系數(shù)的包絡(luò),上述當(dāng)前音頻幀的位于子帶p內(nèi)的頻譜系數(shù)和位于子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值。
其中,上述當(dāng)前音頻幀的位于子帶p內(nèi)的頻譜系數(shù)和位于子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性參數(shù)值越大,表示位于子帶p內(nèi)的頻譜系數(shù)和位于子帶q內(nèi)的頻譜系數(shù)的頻譜相關(guān)性越強(qiáng),其中,頻譜相關(guān)性參數(shù)值例如可為歸一化互相關(guān)參數(shù)值。
其中,上述各子帶的頻點(diǎn)范圍具體可根據(jù)實(shí)際需要確定。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,上述子帶z的最高頻點(diǎn)可以大于臨界頻點(diǎn)F1。上述子帶w的最高頻點(diǎn)可大于上述臨界頻點(diǎn)F1。其中,上述臨界頻點(diǎn)F1的取值范圍例如可為6.4kHz至12kHz。例如,臨界頻點(diǎn)F1的取值可以為6.4kHz,8kHz,9kHz,10kHz,12kHz等等,當(dāng)然,臨界頻點(diǎn)F1也可為其他取值。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,上述子帶j的最高頻點(diǎn)大于臨界頻點(diǎn)F2。上述子帶n的最高頻點(diǎn)大于上述臨界頻點(diǎn)F2。例如,上述臨界頻點(diǎn)F2的取值范圍可以為4.8kHz至8kHz。具體例如,臨界頻點(diǎn)F2的取值可以為6.4kHz,4.8kHz,6kHz,8kHz,5kHz,7kHz等等,當(dāng)然,臨界頻點(diǎn)F2也可為其他取值。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,上述子帶i的最高頻點(diǎn)可以小于上述子帶j的最高頻點(diǎn)。上述子帶m的最高頻點(diǎn)可以小于上述子帶n的最高頻點(diǎn)。上述子帶x的最高頻點(diǎn)可小于或等于上述子帶y的最低頻點(diǎn)。上述子帶p的最高頻點(diǎn)可小于或等于上述子帶q的最低頻點(diǎn),上述子帶r的最高頻點(diǎn)可小于或等于上述子帶s的最低頻點(diǎn)。上述子帶e的最高頻點(diǎn)可小于或等于上述子帶f的最低頻點(diǎn)。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,如下條件之中的至少一個(gè)可以被滿足:
上述子帶w的最低頻點(diǎn)大于或等于臨界頻點(diǎn)F1,上述子帶z的最低頻點(diǎn)大于或等于上述臨界頻點(diǎn)F1,上述子帶i的最高頻點(diǎn)小于或等于上述子帶j的最低頻點(diǎn),上述子帶m的最高頻點(diǎn)小于或等于上述子帶n的最低頻點(diǎn),上述子帶j的最低頻點(diǎn)大于或等于臨界頻點(diǎn)F2,上述子帶n的最低頻點(diǎn)大于或等于上述臨界頻點(diǎn)F2,上述子帶i的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,上述子帶m的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,子帶j的最低頻點(diǎn)大于或等于臨界頻點(diǎn)F2,上述子帶n的最低頻點(diǎn)大于或等于臨界頻點(diǎn)F2。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,如下條件之中的至少一個(gè)可以被滿足:
上述子帶e的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,上述子帶x的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,上述子帶p的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2,上述子帶r的最高頻點(diǎn)小于或等于臨界頻點(diǎn)F2。
可選的,在本發(fā)明的一些可能的實(shí)施方式中,上述子帶f的最高頻點(diǎn)可小于或者等于臨界頻點(diǎn)F2,當(dāng)然,上述子帶f的最低頻點(diǎn)也可能大于或者等于臨界頻點(diǎn)F2。上述子帶q的最高頻點(diǎn)可小于或者等于臨界頻點(diǎn)F2,當(dāng)然,上述子帶q的最低頻點(diǎn)也可能大于或者等于臨界頻點(diǎn)F2。上述子帶s的最高頻點(diǎn)可小于或者等于臨界頻點(diǎn)F2,當(dāng)然,上述子帶s的最低頻點(diǎn)也可能大于或者等于臨界頻點(diǎn)F2。
舉例來說,上述子帶z的最高頻點(diǎn)的取值范圍可為12kHz至16kHz。子帶z的最低頻點(diǎn)的取值范圍可為8kHz至14kHz。子帶z的帶寬的取值范圍可為1.6kHz~8kHz。具體例如,子帶z的頻點(diǎn)范圍可為8kHz至12kHz,9kHz至11kHz或8kHz至9.6kHz或12kHz至14kHz等。當(dāng)然,子帶z的頻點(diǎn)范圍也并不限于上述舉例。
例如,子帶w的頻點(diǎn)范圍也可根據(jù)實(shí)際需要確定,例如子帶w的最高頻點(diǎn)的取值范圍可為12kHz至16kHz,子帶w的最低頻點(diǎn)的取值范圍可為8kHz至14kHz。具體例如子帶w的頻點(diǎn)范圍為8kHz至12kHz,9kHz至11kHz,8kHz至9.6kHz,12kHz至14kHz,12.2kHz至14.5kHz等。當(dāng)然,子帶w的頻點(diǎn)范圍也并不限于上述舉例。在一些可能的實(shí)施方式中,子帶w的頻點(diǎn)范圍和子帶z的頻點(diǎn)范圍可相同或相近。
例如,上述子帶i的頻點(diǎn)范圍可為3.2kHz至6.4kHz,3.2kHz至4.8kHz,4.8kHz至6.4kHz,0.4kHz至6.4kHz或0.4kHz至3.6kHz,當(dāng)然,子帶i的頻點(diǎn)范圍也不限于上述舉例。
例如,上述子帶j的頻點(diǎn)范圍可為6.4kHz至9.6kHz,6.4kHz至8kHz,8kHz至9.6kHz,4.8kHz至9.6kHz或4.8kHz至8kHz等。當(dāng)然,子帶j的頻點(diǎn)范圍也不限于上述舉例。
例如,上述子帶m的頻點(diǎn)范圍為3.2kHz至6.4kHz,3.2kHz至4.8kHz,4.8kHz至6.4kHz,0.4kHz至6.4kHz或0.4kHz至3.6kHz,當(dāng)然,子帶m的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶m的頻點(diǎn)范圍和子帶i的頻點(diǎn)范圍可相同或相近。
例如,上述子帶n的頻點(diǎn)范圍可為6.4kHz至9.6kHz,6.4kHz至8kHz,8kHz至9.6kHz,4.8kHz至9.6kHz或4.8kHz至8kHz等。當(dāng)然,子帶n的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶n的頻點(diǎn)范圍和子帶j的頻點(diǎn)范圍可相同或相近。
例如,上述子帶x的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz,1.6kHz至3.2kHz,2kHz至3.2kHz或2.5kHz至3.4kHz。當(dāng)然,子帶x的頻點(diǎn)范圍也不限于上述舉例。
例如,上述子帶y的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz,4.8kHz至6.4kHz,4.4kHz至6.4kHz或4.5kHz至6.2kHz。當(dāng)然,子帶y的頻點(diǎn)范圍也不限于上述舉例。
例如,上述子帶p的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz,1.6kHz至3.2kHz,2.1kHz至3.2kHz或2.5kHz至3.5kHz。當(dāng)然,子帶p的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶p的頻點(diǎn)范圍和子帶x的頻點(diǎn)范圍可相同或相近。
例如,上述子帶q的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz,4.8kHz至6.4kHz,4.2kHz至6.4kHz或4.7kHz至6.2kHz。當(dāng)然,子帶q的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶q的頻點(diǎn)范圍和子帶y的頻點(diǎn)范圍可相同或相近。
例如,上述子帶r的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz,1.6kHz至3.2kHz,2.05kHz至3.27kHz或2.59kHz至3.51kHz。當(dāng)然,子帶r的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶r的頻點(diǎn)范圍和子帶x的頻點(diǎn)范圍可相同或相近。
例如,上述子帶s的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz,4.8kHz至6.4kHz,5.4kHz至7.1kHz或4.55kHz至6.29kHz。當(dāng)然,子帶s的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶s的頻點(diǎn)范圍和子帶y的頻點(diǎn)范圍可相同或相近。
例如,上述子帶e的頻點(diǎn)范圍可為0kHz至1.6kHz,1kHz至2.6kHz,1.6kHz至3.2kHz,0.8kHz至3kHz或1.9kHz至3.8kHz。當(dāng)然,子帶e的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶e的頻點(diǎn)范圍和子帶x的頻點(diǎn)范圍可相同或相近。
例如,上述子帶f的頻點(diǎn)范圍可為6.4kHz至8kHz,7.4kHz至9kHz,4.8kHz至6.4kHz,5.3kHz至7.15kHz或4.58kHz至6.52kHz。當(dāng)然,子帶f的頻點(diǎn)范圍也不限于上述舉例。在一些可能的實(shí)施方式中,子帶f的頻點(diǎn)范圍和子帶y的頻點(diǎn)范圍可相同或相近。
其中,上述第一參數(shù)條件和第二參數(shù)條件可能是多種多樣的。
例如,在本發(fā)明一些可能的實(shí)施方式中,本實(shí)施例中的第一參數(shù)條件例如可為上述方法實(shí)施例中舉例的第一參數(shù)條件。本實(shí)施例中的第二參數(shù)條件例如可為上述方法實(shí)施例中舉例的第二參數(shù)條件,相關(guān)描述請參考上述方法實(shí)施例中的記載。
可以理解的是,本實(shí)施例的音頻編碼器1000的各功能模塊的功能可根據(jù)上述方法實(shí)施例中的方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過程可以參照上述方法實(shí)施例的相關(guān)描述,此處不再贅述。
其中,音頻編碼器1000音頻編碼器可為任何需要采集,存儲(chǔ)或者向外傳輸音頻信號的裝置,例如手機(jī),平板電腦,個(gè)人電腦,筆記本電腦等等
可以看出,本實(shí)施例方案中,音頻編碼器1000獲取當(dāng)前音頻幀的編碼參考參數(shù)后,基于獲取的當(dāng)前音頻幀的編碼參考參數(shù)來選擇TCX算法或HQ算法對上述當(dāng)前音頻幀的頻譜系數(shù)進(jìn)行編碼。由于將當(dāng)前音頻幀的編碼參考參數(shù)與編碼上述當(dāng)前音頻幀的頻譜系數(shù)的編碼算法進(jìn)行關(guān)聯(lián),這樣就有利于提高編碼算法和當(dāng)前音頻幀的編碼參考參數(shù)之間的適應(yīng)性和匹配性,進(jìn)而有利于提高上述當(dāng)前音頻幀的編碼質(zhì)量或編碼效率。
進(jìn)一步的,利用多種可選的編碼參考參數(shù),有利于滿足多種場景下的算法選擇需求。
本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其中,該計(jì)算機(jī)存儲(chǔ)介質(zhì)可存儲(chǔ)有程序,該程序執(zhí)行時(shí)包括上述方法實(shí)施例中記載的任意一種音頻編碼方法的部分或全部步驟。
需要說明的是,對于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。
在上述實(shí)施例中,對各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。
在本申請所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的裝置,可通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如上述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性或其它的形式。
上述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī),服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤,只讀存儲(chǔ)器(ROM,Read-Only Memory),隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory),移動(dòng)硬盤,磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
以上所述,以上實(shí)施例僅僅是用以說明本發(fā)明的技術(shù)方案,而并非是對其限制;盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。