微軟Azure AI語音服務(wù)推出虛擬人形象，支持文本轉(zhuǎn)視頻

來源：IT之家

作者：汪淼

時間：2024-08-23

8月23日消息，微軟Azure AI語音服務(wù)允許開發(fā)者構(gòu)建多語言生成式AI語音應(yīng)用，Azure AI語音服務(wù)最新推出了文本到語音虛擬人功能，可以將簡單的文本轉(zhuǎn)換為人類自然說話視頻。

今天，微軟宣布全面推出Text to Speech Avatar功能。這項新功能使開發(fā)者能夠?yàn)槠溆脩魟?chuàng)建個性化虛擬人。該服務(wù)的輸出視頻分辨率為1920 x 1080，每秒25幀。IT之家附示例如下：

微軟Azure AI語音服務(wù)推出虛擬人形象，支持文本轉(zhuǎn)視頻

Text to Speech Avatar具有以下功能：

-將文本轉(zhuǎn)換為由Azure AI文本轉(zhuǎn)語音提供支持的人類說話視頻，該視頻具有自然的聲音。

-提供不同的人物預(yù)設(shè)形象。

-形象的聲音由Azure AI文本轉(zhuǎn)語音生成。

-使用批量合成API異步或?qū)崟r合成文本到語音人像視頻。

-在Speech Studio中提供內(nèi)容創(chuàng)建工具，無需編碼即可創(chuàng)建視頻內(nèi)容。

-通過Speech Studio中的實(shí)時聊天頭像工具啟用實(shí)時人像對話。

定價方面，文本轉(zhuǎn)視頻服務(wù)的收費(fèi)將根據(jù)視頻輸出的長度計算并按秒收費(fèi)。該服務(wù)現(xiàn)已在東南亞、北歐、西歐、瑞典中部、美國中南部和美國西部地區(qū)推出。

AI Azure 微軟云

上一篇：尼泊爾解除對TikTok禁令：要求其幫助提高當(dāng)?shù)芈糜螛I(yè)與公共教育等

原文鏈接：點(diǎn)擊前往 >

版權(quán)說明：本文內(nèi)容來自于IT之家，本站不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點(diǎn)，不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán)，請聯(lián)系管理員（zzx@kchuhai.com）刪除！

相關(guān)文章