Zoom首席技術(shù)官黃學東:通過更高質(zhì)量的AI技術(shù)驅(qū)動協(xié)作

來源:Zoom視頻通訊
作者:Zoom視頻通訊
時間:2024-11-21
2907
技術(shù)的使用是促成人類進步的關(guān)鍵,而AI技術(shù)的到來,則是做到了協(xié)助我們完成許多曾經(jīng)看似不可能的事情。

技術(shù)的使用是促成人類進步的關(guān)鍵,而AI技術(shù)的到來,則是做到了協(xié)助我們完成許多曾經(jīng)看似不可能的事情。在為Zoom AI Companion拓展功能和提升性能的過程中,我們始終密切關(guān)注AI工具是如何賦予用戶力量,并致力于提供最優(yōu)的結(jié)果,以便用戶高效地完成工作。

目前,在日常工作中使用Zoom AI Companion的客戶已涵括金融服務(wù)、醫(yī)療保健、教育、政府等多個行業(yè)。在教育系統(tǒng)甚至大學中,學生和教師正利用Zoom的AI功能來提高講座的可訪問性。在醫(yī)療保健領(lǐng)域,人們則是通過Zoom進行網(wǎng)上預約并使用AI功能來轉(zhuǎn)錄和總結(jié)虛擬會診信息,以獲得更全面的醫(yī)療服務(wù)。

便捷的AI技術(shù)不僅可以給聽力受損人群提供實時字幕,還可以打破語言和溝通障礙。35年前,當我還在蘇格蘭愛丁堡時,觀看BBC的實時字幕不僅幫助了我學習英語,還使我理解了準確的字幕和翻譯能夠為全世界做什么。雖然AI技術(shù)的使用已經(jīng)相當廣泛,但我們?nèi)韵M^續(xù)提高AI技術(shù)的質(zhì)量并開拓更多的可能性。

滿足用戶轉(zhuǎn)錄需求只是我們Zoom利用AI技術(shù)實現(xiàn)創(chuàng)新的一部分縮影。我們還在從各方面協(xié)助用戶利用AI技術(shù)來增強個人技能和經(jīng)驗。這包含了會議或網(wǎng)絡(luò)研討會中自動生成的實時字幕、將實時字幕翻譯成另外一種語言、以及用戶使用AI Companion來做會議摘要、智能錄音和項目協(xié)作等。Zoom正盡我們所能,創(chuàng)造更適用于全球化商業(yè)模式的便攜且包容的會議體驗。

精準語音識別構(gòu)筑

Zoom AI Companion

今年初,我分享了Zoom的AI模型如何在成本顯著低于其他同類模型的同時,實現(xiàn)或超越它們的性能。今天,我很高興能跟大家分享來自TestDevLab對Zoom AI性能的最新評估結(jié)果。這項成果的發(fā)布進一步確立了Zoom AI Companion 2.0在語音識別和智能會議領(lǐng)域的領(lǐng)先地位。相較于其他參與測試的AI工具,我們的AI Companion的優(yōu)勢更加明顯。

Zoom AI Companion 2.0無縫集成至企業(yè)工作和網(wǎng)絡(luò)信息的能力再次大幅度優(yōu)化了Zoom Workplace的體驗。目前,Zoom Workplace已集成了多種AI功能,而其中最常用的AI功能,如會議摘要、項目寫作和轉(zhuǎn)錄服務(wù),均由AI Companion驅(qū)動著。

Zoom的AI功能的有效性很大一部分取決于AI Companion轉(zhuǎn)錄內(nèi)容的準確性。許多常用的會議功能,例如會中提問,都需要依托于高質(zhì)量的語音識別才能實現(xiàn)準確轉(zhuǎn)錄。一份可靠的轉(zhuǎn)錄將支持Zoom的AI功能精準抓捕包括姓名、會議主題和會議意圖等關(guān)鍵信息,從而形成摘要、要點和可行見解等關(guān)鍵總結(jié)。

詞錯誤率(WER)是衡量轉(zhuǎn)錄準確性的行業(yè)標準。WER是通過比較人工轉(zhuǎn)錄和AI轉(zhuǎn)錄之間的差異百分比來評估的。在過去幾年中,Zoom不斷致力于提升其人工智能架構(gòu),目標是顯著降低詞錯誤率(WER)。通過大幅度減少WER,Zoom能夠提供更準確、更可靠的轉(zhuǎn)錄服務(wù),進而為我們的客戶提供更高效、更實用的會議成果。

在WER分析中,紅色文本代表遺漏的詞,

藍色文本則代表在源轉(zhuǎn)錄中未找到的詞。

Zoom通過精準轉(zhuǎn)錄

強化AI功能

TestDevLab的測試結(jié)果很明確:Zoom AI Companion的表現(xiàn)優(yōu)于Microsoft Teams,WER更低,轉(zhuǎn)錄準確性更高。在一些字斟句酌的會議中,即使是微小的轉(zhuǎn)錄錯誤也可能對會議摘要、任務(wù)或會議期間的問答產(chǎn)生重大影響。

以下是TestDevLab如何創(chuàng)建和運行轉(zhuǎn)錄精確度測試的:

·開啟并錄制三場參與者從2人到16人不等的會議

·在會議期間,所有與會者通過個人電腦同步播放文件

·為保證測試結(jié)果的一致性,TestDevLab在每個平臺上對每項測試都執(zhí)行了五次

在每場測試中,TestDevLab都會對Zoom Workplace和Microsoft Teams進行比較,并記錄二者每場會議轉(zhuǎn)錄的詞錯誤率。

640.png

在測量WER時,較低的百分比表示轉(zhuǎn)錄質(zhì)量更高

會議摘要和轉(zhuǎn)錄是許多AI平臺上最受歡迎且使用最頻繁的功能之一。正因這項功能被頻繁使用,確保錯誤降至最低變得尤為關(guān)鍵。這項功能之所以受歡迎,是因為它可以幫助用戶在閱讀、總結(jié)和更好的理解重要信息方面節(jié)省寶貴的時間。

精準的轉(zhuǎn)錄為

AI功能打下堅實基礎(chǔ)

轉(zhuǎn)錄并非TestDevLab衡量AI Companion功能的唯一指標。與其他AI功能不同,如會議摘要,轉(zhuǎn)錄的目的不在于逐字復制,而是要提供一個符合用戶期望的、概述會議內(nèi)容的定制化文檔。

TestDevLab還在會議摘要質(zhì)量和AI對話(如答案穩(wěn)定性)方面對Zoom Workplace和Microsoft Teams進行了排名。為了評估摘要功能,他們創(chuàng)建了一個具有人工驗證結(jié)果的大型語言模型(LLM)助手。

640 (1).png

在這次評估中,TestDevLab測試了Microsoft Teams中的兩種摘要功能:Teams Premium和Microsoft 365 Copilot許可證提供的智能回顧功能,以及Microsoft Copilot AI助手在Teams會議中的提示式摘要生成能力。由于Copilot AI助手只能根據(jù)提示生成摘要,TestDevLab選擇了在會議結(jié)束時再給到Copilot提示來總結(jié)摘要和行動項目。

在AI對話方面,TestDevLab測量了AI平臺在會議中回答問題的能力,包括了與會議內(nèi)容相關(guān)的問題,以及與會議無關(guān)的網(wǎng)絡(luò)搜索問題,比如“世界上最高的建筑是什么?”。在響應(yīng)速度和應(yīng)答穩(wěn)定性方面,尤其是確保所有與會者能夠接收到相似答案的能力上,Zoom AI Companion的表現(xiàn)優(yōu)于Microsoft。

640 (2).png

更高的應(yīng)答穩(wěn)定性表明了Zoom的AI功能始終如一地為所有參與者提供可靠的響應(yīng),確保用戶在會議期間的體驗更流暢

Zoom AI Companion提供了

更好、更平等的會議體驗

以上結(jié)果展示了我們對Zoom Workplace和AI Companion的高質(zhì)量發(fā)展承諾。我們正致力于開發(fā)一種能夠讓人們更輕松地相互溝通、提升日常工作效率,并提供選擇性使用人工智能來輔助工作的便捷方式。我們旨在通過AI Companion提供的會議轉(zhuǎn)錄和輔助功能,打造一個更公正的協(xié)作辦公環(huán)境。這樣的環(huán)境將惠及聾人、聽力障礙者、神經(jīng)多樣性個體,以及那些與會議參與者使用不同語言的人。

TestDevLab進行的此次評估將Zoom Workplace和AI Companion認定為AI性能方面領(lǐng)導者。與競爭對手相比,Zoom在轉(zhuǎn)錄準確性、會議中問題的響應(yīng)速度以及AI對話穩(wěn)定性方面展現(xiàn)出了更卓越的性能。

作為Zoom的付費用戶,您無需支付任何額外費用即可使用Zoom Workplace協(xié)作平臺中的AI Companion功能,這與那些要求用戶為AI功能支付額外費用的競爭對手平臺形成鮮明對比。在Zoom,我們堅信向廣大客戶提供免費且具有變革性的工具至關(guān)重要。我們從提供高質(zhì)量的轉(zhuǎn)錄服務(wù)起步,并持續(xù)致力于為所有用戶打造卓越的AI體驗。

立即登錄,閱讀全文
原文鏈接:點擊前往 >
文章來源:Zoom視頻通訊
版權(quán)說明:本文內(nèi)容來自于Zoom視頻通訊,本站不擁有所有權(quán),不承擔相關(guān)法律責任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多