Meta發(fā)布新AI模型 可在數(shù)十種語(yǔ)言間進(jìn)行語(yǔ)音翻譯

來(lái)源:新浪科技
作者:新浪科技
時(shí)間:2023-08-24
2664
Meta發(fā)布了一個(gè)AI模型,能夠翻譯和轉(zhuǎn)錄數(shù)十種語(yǔ)言的語(yǔ)音,為實(shí)現(xiàn)跨語(yǔ)言實(shí)時(shí)交流奠定了潛在基礎(chǔ)。

c35a-ad99998ab230bac0da0733d0256c16f5.png

新浪科技訊 北京時(shí)間8月23日早間消息,Meta發(fā)布了一個(gè)AI模型,能夠翻譯和轉(zhuǎn)錄數(shù)十種語(yǔ)言的語(yǔ)音,為實(shí)現(xiàn)跨語(yǔ)言實(shí)時(shí)交流奠定了潛在基礎(chǔ)。

該公司在一篇博文中宣稱,其SeamlessM4T模型可支持近100種語(yǔ)言的文本和語(yǔ)音翻譯,以及35種語(yǔ)言的語(yǔ)音翻譯,將以前只能在單獨(dú)的模型中提供的技術(shù)結(jié)合在一起。

Meta首席執(zhí)行官馬克·扎克伯格表示,在他的設(shè)想中,這些工具將幫助全球用戶在元宇宙實(shí)現(xiàn)實(shí)時(shí)的無(wú)障礙互動(dòng)。

Meta表示將向公眾提供該模型,供非商業(yè)使用。

作為全球最大的社交媒體公司,Meta在今年發(fā)布了大量免費(fèi)的基本AI模型,包括一個(gè)名為L(zhǎng)lama的大型語(yǔ)言模型,該模型對(duì)OpenAI和谷歌(133.21,3.52,2.71%)銷售的專利模型構(gòu)成了嚴(yán)峻挑戰(zhàn)。

扎克伯格表示,開(kāi)放的人工智能生態(tài)系統(tǒng)對(duì)Meta來(lái)說(shuō)是有利的,因?yàn)橄啾忍峁┦召M(fèi)AI模型,該公司可以通過(guò)有效的眾包方式為其社交平臺(tái)創(chuàng)建面向用戶的工具。

盡管如此,Meta也面臨著與業(yè)界其他企業(yè)類似的法律問(wèn)題,這些問(wèn)題都與創(chuàng)建模型時(shí)所攝取的訓(xùn)練數(shù)據(jù)有關(guān)。

今年7月,喜劇演員莎拉·西爾弗曼(Sarah Silverman)等創(chuàng)作者對(duì)Meta和OpenAI提起了版權(quán)侵權(quán)訴訟,指控這兩家公司未經(jīng)許可將他們的書籍用作訓(xùn)練數(shù)據(jù)。

對(duì)于SeamlessM4T模型,Meta公司的研究人員在一份研究論文中表示,他們從400萬(wàn)小時(shí)的“原始音頻中”收集了音頻訓(xùn)練數(shù)據(jù),原始音頻來(lái)自一個(gè)公開(kāi)的網(wǎng)絡(luò)數(shù)據(jù)抓取庫(kù),但該公司沒(méi)有具體說(shuō)明是哪個(gè)庫(kù)。

Meta公司發(fā)言人也沒(méi)有回答有關(guān)音頻數(shù)據(jù)來(lái)源的問(wèn)題。

研究論文稱,文本數(shù)據(jù)來(lái)自去年創(chuàng)建的數(shù)據(jù)集,這些數(shù)據(jù)集是從維基百科和相關(guān)網(wǎng)站中提取的內(nèi)容。

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
版權(quán)說(shuō)明:本文內(nèi)容來(lái)自于新浪科技,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開(kāi)掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家