Meta 推出語音生成 AI 「 Voicebox」,支援元宇宙角色配音、語音編輯除噪等多種功能

Crumax
分享
Meta 推出語音生成 AI 「 Voicebox」,支援元宇宙角色配音、語音編輯除噪等多種功能

Meta 宣佈推出語音生成 AI「 Voicebox」,將能針對聲音協助進行編輯與風格設計。即便前些日子大裁超過萬名員工減少對 NFT 領域的投入,但仍能夠看出其對元宇宙及 AI 相關技術的熱忱仍未被熊市澆熄。

AI 不只能幫忙寫文案,還能產出對話

Meta 於今日(17)在其 Blog 中展示,釋出全新語音生成 AI「 Voicebox」,主打語音上多樣化的編輯與取樣功能,且同時適用於音樂及影片內容。

Voicebox 是一個主打語音層面的生成式 AI 模型,能幫助創作者輕鬆編輯音軌、讓元宇宙中的虛擬角色發出自然的聲音、讓視障人士聽到 AI 用他們的聲音朗讀朋友的書面資訊、並使人們能夠用自己的談吐風格說任何外語。

廣告 - 內文未完請往下捲動

 

詳細功能如下:

  • 文字生成音軌:輸入文字或語句,即能獲得該音軌,甚至還能選擇至多六種不同且符合人類聲線的說話方式。

  • 聲音編輯:不論是移除口誤部分或噪音干擾,都難不倒 Voicebox。只需要裁剪受損的片段,就能讓 Voicebox 重新生成該段的內容。
  • 跨語言風格的轉換:可以使用此功能來幫助人們以更加自然且真實的方式進行交流,加強社交回饋感。

即便大裁元宇宙部門,Meta 仍在產業內

據先前報導,Meta 的 Metaverse 部門與 Reality Labs 第一季度虧損近 40 億美元,雖然相比 2022 年的 140 億美元虧損仍算小事,但已足以讓投資人心驚膽顫。

不過眾所皆知,Meta 仍未放棄他的元宇宙夢。包括上個月與 BMW 有關 AR 及 VR 技術應用於智能車輛,以提供更高效且有趣乘客體驗的長期合作、還有幾週前曝光的 MR 頭戴式裝置 Meta Quest 3 等,都顯現出 Meta 仍對元宇宙願景抱有高度關注。

(有關 Meta Quest 3 與 Apple Vision Pro 的比較請見此篇

其堅定信念也能在 Meta CEO Zuckerberg 的 Facebook 貼文中看出:

我們將專注在開發能夠以多種方式幫助人們的 AI 工具。包括文本體驗(如 WhatsApp 及 Messenger 中的聊天)、圖像體驗(如 Instagram 濾鏡)以及影片體驗。