微軟Azure AI又一里程碑:Neural TTS新模型呈現(xiàn)真人般情感飽滿的AI語(yǔ)音

來(lái)源: IT之家
作者:遠(yuǎn)洋
時(shí)間:2022-01-28
13519
如何讓AI語(yǔ)音有效模仿人類對(duì)話的豐富動(dòng)態(tài)與情感,已成為全球研究者的共同挑戰(zhàn)。

IT之家1月27日消息,如何讓AI語(yǔ)音有效模仿人類對(duì)話的豐富動(dòng)態(tài)與情感,已成為全球研究者的共同挑戰(zhàn)。據(jù)微軟官方消息,就在不久前,微軟Azure Neural TTS(神經(jīng)網(wǎng)絡(luò)文本轉(zhuǎn)語(yǔ)音)推出的新一代模型“Uni-TTS v4”在這一領(lǐng)域取得了里程碑式的重大突破。在“2021國(guó)際語(yǔ)音合成大賽(Blizzard Challenge 2021)”的測(cè)試中,Uni-TTS v4的語(yǔ)音表現(xiàn)與通用數(shù)據(jù)集上的自然語(yǔ)音相比幾乎沒有明顯差別,展現(xiàn)出足以“叫板”真人對(duì)話的實(shí)力。Uni-TTSv4的研究出發(fā)點(diǎn)是XYZ-代碼,它是三種認(rèn)知屬性的聯(lián)合表示:?jiǎn)握Z(yǔ)文本(X),音頻或視覺感官信號(hào)(Y),以及多語(yǔ)言(Z)。

cd4cbbf4-94c4-449c-b71e-82591042993e.png

用戶可以在Azure TTS在線服務(wù)中使用自創(chuàng)文本來(lái)創(chuàng)建新的demo。目前Uni-TTS v4可支持TTS語(yǔ)言庫(kù)中7個(gè)語(yǔ)種的8個(gè)語(yǔ)音,研發(fā)團(tuán)隊(duì)還將持續(xù)使用最新模型優(yōu)化Neural TTS已支持的其它語(yǔ)言以及自定義神經(jīng)語(yǔ)音,以便能讓用戶通過(guò)Azure TTS API、Microsoft Office和Edge browser直接獲得更出色的新一代TTS語(yǔ)音。

官方介紹,為了讓TTS在以上兩方面獲得提升,Uni-TTS v4在聲學(xué)建模中引入了兩項(xiàng)重要更新,研究團(tuán)隊(duì)首先采用了一個(gè)帶有transformer和卷積塊的新架構(gòu),以更好地模擬聲學(xué)模型中的局部和全局依賴關(guān)系;其次,從顯性視角(身份ID、語(yǔ)種ID、音調(diào)、語(yǔ)速)和隱性視角(話語(yǔ)級(jí)和音素級(jí)韻律)系統(tǒng)地對(duì)變量信息進(jìn)行建模。這些視角分別使用監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí),確保端到端的音頻具有足夠自然的表現(xiàn)力。

IT之家了解到,作為微軟Azure認(rèn)知服務(wù)中的強(qiáng)大語(yǔ)音合成功能,Neural TTS可用于幫助開發(fā)者將文本轉(zhuǎn)換為真人一般的逼真自然語(yǔ)音,常被用于語(yǔ)音助手場(chǎng)景、文字朗讀功能,及作為輔助性工具等等,同時(shí)也被整合到微軟的Edge Read Aloud、Immersive Reader和Word Read Aloud等旗艦產(chǎn)品中,還被AT&T、Duolingo、Progressive等眾多客戶采用。Neural TTS已擁有330多個(gè)音色,支持來(lái)自不同國(guó)家和地區(qū)的近130種語(yǔ)言或方言。用戶和企業(yè)可以通過(guò)搜索“Azure TTS”進(jìn)入產(chǎn)品網(wǎng)站,測(cè)試體驗(yàn)Neural TTS的豐富預(yù)設(shè)語(yǔ)音,抑或錄制并上傳自己的樣本,來(lái)創(chuàng)建獨(dú)有的自定義語(yǔ)音。

立即登錄,閱讀全文
版權(quán)說(shuō)明:
本文內(nèi)容來(lái)自于IT之家,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
Azure Arc為企業(yè)構(gòu)建安全的云基礎(chǔ)
Azure Arc為企業(yè)構(gòu)建安全的云基礎(chǔ)
隨著人工智能技術(shù)持續(xù)重塑企業(yè)運(yùn)營(yíng)方式,企業(yè)需要能夠處理海量數(shù)據(jù)的系統(tǒng),以支持實(shí)時(shí)洞察,同時(shí)幫助他們應(yīng)對(duì)跨IT和OT環(huán)境(包括云端、邊緣和本地)中運(yùn)營(yíng)、應(yīng)用、數(shù)據(jù)和基礎(chǔ)設(shè)施的協(xié)作難題。
Azure
微軟云
云服務(wù)
2024-12-172024-12-17
釋放.NET 9和Azure的AI技術(shù)與云計(jì)算潛力:更快、更智能、面向未來(lái)
釋放.NET 9和Azure的AI技術(shù)與云計(jì)算潛力:更快、更智能、面向未來(lái)
.NET 9現(xiàn)已正式發(fā)布,它為.NET平臺(tái)的發(fā)展掀開了嶄新的一頁(yè),突破了性能、云原生開發(fā)和AI技術(shù)集成的邊界。
Azure
微軟云
云服務(wù)
2024-12-162024-12-16
Azure網(wǎng)絡(luò)管理現(xiàn)已具備智能Microsoft Copilot副駕駛能力
Azure網(wǎng)絡(luò)管理現(xiàn)已具備智能Microsoft Copilot副駕駛能力
智能Microsoft Copilot副駕駛for Azure網(wǎng)絡(luò)服務(wù)現(xiàn)已推出公共預(yù)覽版。
Azure
微軟云
云服務(wù)
2024-12-102024-12-10
Microsoft Fabric功能更新,借助AI驅(qū)動(dòng)的數(shù)據(jù)平臺(tái)加速應(yīng)用創(chuàng)新
Microsoft Fabric功能更新,借助AI驅(qū)動(dòng)的數(shù)據(jù)平臺(tái)加速應(yīng)用創(chuàng)新
一年前,我們正式推出了一款端到端數(shù)據(jù)平臺(tái),旨在幫助組織推動(dòng)人工智能轉(zhuǎn)型,并重新定義數(shù)據(jù)的連接、管理和分析方式。
Azure
微軟云
云服務(wù)
2024-12-092024-12-09
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家