(相關(guān)資料圖)
6月19日消息,近日,Meta發(fā)布了Voicebox AI模型,它在音頻模擬方面有著顯著優(yōu)勢。
據(jù)悉,Voicebox只需要一段2秒鐘的音頻樣本,即可準確辨別出音頻細節(jié)、音色,并基于文字結(jié)果轉(zhuǎn)換為語音輸出。
同時,它還可以基于語音片段的前后內(nèi)容,自動補齊中間缺失的內(nèi)容。
根據(jù)Meta的介紹,Voicebox能夠為AI助手,或是未來元宇宙的NPC提供自然且真實的語音效果,大大提升用戶使用時的沉浸感。
關(guān)鍵詞: