Meta的AI翻譯器可以解釋無文字的語言扎克伯格以閩南話舉例

來源：cnBeta.COM

作者：ugmbbc

時間：2022-10-20

世界上大約7000種已知的語言中，有將近一半的語言，也就是其中的十分之四是口耳相傳，沒有包含書面內(nèi)容。

世界上大約7000種已知的語言中，有將近一半的語言，也就是其中的十分之四是口耳相傳，沒有包含書面內(nèi)容。這些無文字的語言給現(xiàn)代機器學(xué)習(xí)翻譯系統(tǒng)帶來了一個獨特的問題，因為它們通常需要在翻譯到新語言之前將口頭語言轉(zhuǎn)換為書面文字，并將文字還原為語音，但Meta公司已經(jīng)通過其最新的開源語言AI進展解決了這個問題。

cc850317253a2f7.webp.jpg

作為Meta公司通用語音翻譯器（UST）項目的一部分，該項目正致力于開發(fā)實時語音到語音的翻譯，以便元宇宙居民能夠更容易地進行互動（讀作：互相進行性騷擾）。作為這個項目的一部分，Meta的研究人員研究了福建閩南話，這是一種散居在亞洲各地的無文字語言，也是臺灣地區(qū)的主流語言之一。

機器學(xué)習(xí)翻譯系統(tǒng)通常需要大量可標(biāo)記的語言例子，包括書面和口語來進行訓(xùn)練--這正是像閩南話這樣的無文字語言所不具備的。為了解決這個問題，"Meta使用語音到單元的翻譯（S2UT），將輸入的語音直接轉(zhuǎn)換為Meta以前開創(chuàng)的聲學(xué)單元序列，"首席執(zhí)行官馬克-扎克伯格在周三的一篇博文中解釋說。"然后，我們從這些單元生成波形。此外，UnitY被采用為雙通解碼機制，第一通解碼器生成相關(guān)語言（普通話）的文本，第二通解碼器創(chuàng)建單元。"

"我們利用普通話作為中間語言來建立偽標(biāo)簽，我們首先將英語（或上面說的閩南話）語音翻譯成普通話文本，然后我們再翻譯成閩南話（或英語）并將其加入訓(xùn)練數(shù)據(jù)。"目前，該系統(tǒng)允許講福建話的人與講英語的人交談，盡管很生硬，且該模型一次只能翻譯一個完整的句子。但扎克伯格相信，這項技術(shù)最終可以應(yīng)用于更多語言，并將改進到提供實時翻譯的程度。

扎克伯格宣布，除了Meta已經(jīng)從這個項目中開源的模型和訓(xùn)練數(shù)據(jù)外，該公司還將發(fā)布一個基于閩南話話語料庫的首個語音翻譯基準(zhǔn)系統(tǒng)，以及"語音矩陣，一個用Meta的創(chuàng)新數(shù)據(jù)挖掘技術(shù)LASER挖掘的語音翻譯大料庫"。這個系統(tǒng)將使研究人員能夠創(chuàng)建他們自己的語音到語音翻譯（S2ST）系統(tǒng)。

AI Meta

上一篇：TikTok成為美國35歲以下人群中第二大最受歡迎的視頻應(yīng)用

原文鏈接：點擊前往 >

文章來源：cnBeta.COM

版權(quán)說明：本文內(nèi)容來自于cnBeta.COM，本站不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點，不代表快出海對觀點贊同或支持。如有侵權(quán)，請聯(lián)系管理員（zzx@kchuhai.com）刪除！

相關(guān)文章