技術(shù)編號(hào):7812366
提示:您尚未登錄,請(qǐng)點(diǎn) 登 陸 后下載,如果您還沒有賬戶請(qǐng)點(diǎn) 注 冊(cè) ,登陸完成后,請(qǐng)刷新本頁(yè)查看技術(shù)詳細(xì)信息。本發(fā)明是,包括以下步驟第一步,掃描一遍視頻,通過(guò)小波變換和自相關(guān)函數(shù)法檢測(cè)出基音頻率;第二步,尋找基音頻率的平均值μ和標(biāo)準(zhǔn)差σ,作為講話人的基因頻率;第三步,根據(jù)基音頻率,進(jìn)行初劃分,劃分為時(shí)間軸單元;第四步,對(duì)于每一個(gè)時(shí)間軸單元,計(jì)算其基音頻率相似性A及頻譜相似性B,對(duì)于A,B取兩個(gè)閾值,當(dāng)A和B均大于這兩個(gè)閾值時(shí),認(rèn)為是演講人在說(shuō)話,排除非演講人說(shuō)話的時(shí)間軸,得到的時(shí)間軸為演講人說(shuō)話的時(shí)間軸。本發(fā)明是一種針對(duì)視頻講座可以自動(dòng)產(chǎn)生出高精度的講座視頻時(shí)間軸...
注意:該技術(shù)已申請(qǐng)專利,請(qǐng)尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識(shí)儲(chǔ)備,不適合論文引用。