打造四大AI平臺:騰訊優(yōu)圖的視覺AI To B打法

來源:百家號
作者:機器之心Pro
時間:2020-07-13
2659
在近日在上海舉行的世界人工智能大會WAIC 2020上,馬化騰對人工智能的未來發(fā)出了這樣的預測。

騰訊的AI與產業(yè)互聯網已進入全新發(fā)展階段,優(yōu)圖實驗室的視覺智能在其中將發(fā)揮怎樣的作用?

「人工智能本身就是一場跨國跨學科的探索,正在將人類的認知推向更快更高更強,也勢必帶給我們一場前所未見的科技和產業(yè)革命,」在近日在上海舉行的世界人工智能大會WAIC 2020上,馬化騰對人工智能的未來發(fā)出了這樣的預測。

今天,AI技術正變得無所不在,新基建和產業(yè)互聯網將為各行各業(yè)的發(fā)展帶來新增量。面對新的發(fā)展機遇,騰訊提出了全新的戰(zhàn)略,而騰訊優(yōu)圖實驗室在其中正扮演著重要角色。

「我們可以看到,視覺AI相關應用業(yè)務正在飛速增長,這反映了企業(yè)端的人工智能技術需求正在釋放,」騰訊優(yōu)圖實驗室副總經理黃飛躍表示。

四大AI平臺齊亮相

在7月10日的WAIC大會上,騰訊提出的「雙引擎+雙輪」驅動人工智能發(fā)展新形式再次引來人們的關注。與此同時,騰訊優(yōu)圖一口氣發(fā)布了應用視覺AI能力的四大平臺:AI泛娛樂平臺、廣電傳媒AI中臺、內容審核平臺和工業(yè)AI平臺,成為了大會的亮點。

95eef01f3a292df515ec29504091aa6635a873f4.jpg

在WAIC 2020上,騰訊優(yōu)圖實驗室總經理吳運聲進行了「新基建新生態(tài)下的計算機視覺」的主題演講。

首先是泛娛樂平臺,依托騰訊在社交娛樂產品上的豐富實踐,優(yōu)圖在人臉融合、人像分割、人像變化、美顏美妝等方面積累了豐富的泛娛樂基礎能力,打造了泛娛樂全棧工具箱,其中包括AI互動體驗展解決方案、AI創(chuàng)意營銷解決方案、美顏特效SDK三大解決方案。

d6ca7bcb0a46f21fed51962708849d660d33ae81.jpg

在廣電傳媒行業(yè),通過引入AI技術,騰訊可以將視頻處理效率提升至1:1(花費1小時處理剪輯1小時長度的視頻),實現符合標準的結果輸出。在智能審核場景中,AI能幫助媒體內容管控效率提升并降低漏檢率。

廣電媒體AI中臺支持多維度的視頻理解和智能處理,為視頻運營側提供結構化的數據結果,建立了多模態(tài)搜索的基礎,提升了素材再利用效率(如幫助視頻再生產,打造內容專欄)。另外,能夠通過視頻理解結果進行內容運營,打造千人千面的媒體應用。

342ac65c10385343e23fe4c46eb34678c880888e.jpg

騰訊優(yōu)圖內容審核平臺可提供審核一站式服務。在常規(guī)審核系統(tǒng)基礎能力之上還包含ACG場景識別、兒童色情識別、低俗場景識別等功能。在識別效果上,鑒黃、監(jiān)控、鑒證的準召率超過99%。客戶接入后,三天即可完成定制化模型訓練,兩小時內完成客戶定向策略運營。這一技術可以更好地滿足用戶的實時定制需求,目前已在電商、文創(chuàng)、廣電等行業(yè)解決方案中廣泛應用。

d833c895d143ad4bc85292ef7ea2aca9a50f06cc.jpg

面向傳統(tǒng)行業(yè)的工業(yè)AI平臺則可以快速滿足工業(yè)領域的缺陷檢測、備件拍照識別、工廠工效優(yōu)化等客戶需求。并提供數據管理、在線訓練、效果評估、業(yè)務編排等全過程個性化訓練服務,滿足上述場景的差異化需求。平臺支持私有化及公有云部署,提供業(yè)界領先的加速、調度與容器服務,以更少的硬件資源支持更復雜的業(yè)務。

902397dda144ad34cfc7577d2c02faf230ad857c.jpg

騰訊表示,這些平臺具備靈活權限及可拓展能力,合作伙伴可直接使用平臺進行工業(yè)AI項目交付,還可基于平臺進行上層業(yè)務開發(fā),實現AI技術與行業(yè)能力的能力互補,合作共建各領域的工業(yè)AI解決方案。

八年如一日,聚焦視覺AI

在人工智能領域里,感知智能的發(fā)展速度更快。根據清華大學的數據顯示,計算機視覺、語音技術及自然語言處理技術的市場規(guī)模占比分別為34.9%、24.8%和21%,視覺幾乎是落地最順利、商業(yè)化程度最高的領域,這也是騰訊優(yōu)圖一直以來的主要研究方向。

「在騰訊930業(yè)務組織調整之后,云與智慧產業(yè)事業(yè)群CSIG成為騰訊to B的戰(zhàn)略窗口,而優(yōu)圖是CSIG的主要實驗室。對于優(yōu)圖來說,我們的定位已更加清晰——專注于視覺AI的技術研發(fā),」黃飛躍告訴我們。

2008年,從清華博士畢業(yè)的黃飛躍加入當時的騰訊研究院,帶領5人小組投身開發(fā)一款名為「QQ影像」的桌面處理軟件,他們是國內大規(guī)模應用計算機視覺先進技術的最早一批從業(yè)者。今天這個團隊已經發(fā)展成為幾百人規(guī)模,算法人員比例超過60%的大型研究機構,成為了騰訊旗下,乃至計算機視覺領域鼎鼎有名的優(yōu)圖實驗室。

優(yōu)圖從2012年成立至今,在技術從探索到落地的過程中,核心思路一直在發(fā)生轉變?!冈趦?yōu)圖團隊剛剛成立時,我們主要想的是怎樣把技術本身做好,」黃飛躍說道?!肝覀兓ㄙM大量時間深入理解了技術產生價值的方式,只有如此,才能夠把技術價值放大到最大?!?/span>

優(yōu)圖團隊最初的任務是把其開發(fā)的壓縮算法應用到QQ空間里。在這里,技術產生了一定的價值,但主要是業(yè)務成本降低和體驗優(yōu)化,仍沒有帶來最直接的用戶體驗提升。

在2015年,優(yōu)圖把視覺AI技術應用到微眾銀行的遠程開戶,實現了業(yè)務的對外輸出。很快,優(yōu)圖實驗室與騰訊云開始了整合,技術落地走上了快速軌道。

迄今為止,優(yōu)圖已打造了超過15種行業(yè)解決方案,為騰訊公司內部如QQ、QQ空間、微信、微視、騰訊云等超過90余個產品業(yè)務提供計算機視覺AI算法支持,并聯合騰訊云、微信等騰訊內外部合作伙伴,向工業(yè)、教育、交通、文旅等領域共同輸出行業(yè)解決方案。

騰訊優(yōu)圖在發(fā)展新技術時,一直以技術的應用價值為導向?!肝覀冊谶M行新技術研發(fā)時都會思考這個維度,這意味著它們必然是有業(yè)務基礎的。這也是和團隊基因有關系,初始團隊成員很多都具有相關的業(yè)務背景。」黃飛躍介紹道。

在業(yè)務落地后,優(yōu)圖會持續(xù)關注技術的實際價值和用戶體驗,根據反饋需求和發(fā)現的問題,不斷迭代優(yōu)化技術成果。隨著工具不斷升級,技術會越來越好,適用場景越來越多,更多用戶也會為此買單,實現良性循環(huán)的正反饋過程。

在探索方向上,騰訊優(yōu)圖團隊的技術研發(fā)非常聚焦——不傾向于發(fā)散放大技術,而是不斷積累技術,將一些方向做深做透。優(yōu)圖傾向于在成功技術的基礎上不斷拓展范圍,從而保證自己在一定方向上保持最好。

目前,優(yōu)圖旗下最熱門的技術之一人臉核身,支持了北京、上海等全國多地的健康碼,以及一些銀行大額轉賬的過程中的核身過程,這項技術在市場占有率上保持了絕對領先。

優(yōu)圖核身技術的領先,正是不斷迭代優(yōu)化的結果?!肝覀冏?014年就開始了身份識別技術的研發(fā),從微眾銀行、騰訊云慧眼,再到微信小程序。我們接觸到了大量客戶和場景,在這個過程中不斷提升了技術能力?!裹S飛躍表示。

核身技術中,除了識別人臉之外,活體檢測是重中之重:黑產會不斷嘗試在各個方面進行攻擊。據介紹,從2014年至今,優(yōu)圖已經迭代了5個不同的解決方案,從最開始的動作唇語,到交互檢測,到騰訊獨創(chuàng)的光線核體方案,再到現在更加先進的解決方案,通過海量用戶觸達,不斷更新的技術,優(yōu)圖把身份檢測這件事做到了極致。

8694a4c27d1ed21b369db24e51ce2bc250da3f68.jpg

目前優(yōu)圖人臉核身技術的流程。

「今年優(yōu)圖上線的全新人臉安全技術對于物理攻擊、模型合成攻擊、深度學習對抗樣本都有很強的防御能力。我們的多模態(tài)活體檢測技術已經通過了國家銀行卡檢測中心BCTC的人臉識別技術檢測,達到了金融支付級安全標準?!裹S飛躍說道。

不僅如此,優(yōu)圖也在不斷探索前沿技術。優(yōu)圖公開發(fā)表的論文涵蓋ICCV,CVPR,AAAI等各類頂級會議,僅2020年即被國際計算機視覺頂級會議CVPR接收了17篇論文。此外,優(yōu)圖與中科院軟件所、中科院自動化所、上海交通大學、廈門大學、密西根州立大學、中山大學等國內外高校開展高校合作項目,在人臉人體基礎技術、神經網絡模型壓縮、視覺內容檢索、智能硬件平臺、視頻內容分析等研究方向上進行合作研究。

轉向B端,成為新生產力

2017年,騰訊正式提出AI in All戰(zhàn)略,并逐漸搭建了以人工智能實驗室、前沿科技實驗室為雙引擎,消費互聯網和產業(yè)互聯網為雙輪的AI戰(zhàn)略布局。在930組織結構變革之后,優(yōu)圖成為了騰訊云與智慧產業(yè)事業(yè)群(CSIG)旗下的成員,該事業(yè)群成為騰訊To B的戰(zhàn)略窗口,是騰訊20余年歷史上首次出現完全面向企業(yè)客戶的大業(yè)務單元。

目前,騰訊為工業(yè)制造、醫(yī)療、政務、文旅、金融等行業(yè)提供了90余種互聯網解決方案,其中80%應用到了人工智能技術。

黃飛躍認為,產業(yè)互聯網最終的目的還是服務好C端用戶:「C to B是騰訊產業(yè)互聯網的優(yōu)勢,騰訊擁有超過10億用戶,也有長期積累的洞察和經驗。我們會把對于C端的服務經驗輸出給合作伙伴,幫助企業(yè)更好地觸達用戶?!?/span>

從面向消費者轉為面向企業(yè),是否會影響未來技術創(chuàng)新的思路?其實在優(yōu)圖內部,人們對此也有疑問?!冈谵D型的過程中,我們有很多人都在思考這個問題,研究團隊承擔的角色不僅是業(yè)務落地的支持——這對于優(yōu)圖來說缺少持續(xù)發(fā)展的動力,」黃飛躍說道?!肝覀儾粌H要支持業(yè)務發(fā)展,另一方面也要不斷探索,尋找業(yè)界、學術界的技術趨勢,能夠產生更大價值的技術。我們會花費更多精力進行研發(fā)?!?/span>

在WAIC大會上,騰訊公司副總裁、騰訊研究院院長司曉正式發(fā)布了《騰訊人工智能白皮書:泛在智能》,作為騰訊第一份全面介紹AI、闡述騰訊AI布局和思考的白皮書,該書從宏觀環(huán)境、技術研究、落地應用、創(chuàng)新經濟、制度保障五個維度,描繪了泛在智能的全景。計算機視覺是白皮書的重要內容:隨著5G等技術的發(fā)展,工業(yè)視覺正在成為新的生產力,而人們對于視頻內容的需求將催生更為廣泛的市場。

d52a2834349b033b8b9e5ad8e96ec0d5d439bdc2.jpg

騰訊在白皮書中指出,疫情之后的近未來將是全球經濟重建的重要時期,也是社會轉型的重要時期。這為人工智能的發(fā)展打開了新的窗口期,并將提供豐富的實踐場,一個「泛在智能」的世界正在加速成為現實。

5月26日,騰訊宣布未來五年將投入5000億,用于新基建項目的進一步布局,人工智能是重點投入的領域。現在,騰訊希望讓人工智能發(fā)揮產業(yè)互聯網「中央處理器」的作用。

原文鏈接:點擊前往 >
版權說明:本文內容來自于百家號,本站不擁有所有權,不承擔相關法律責任。文章內容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權,請聯系管理員(zzx@kchuhai.com)刪除!
個人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務合作
商務合作
投稿采訪
投稿采訪
出海管家
出海管家