華為云 AI 容器:零基礎(chǔ)搭建 AI 計(jì)算平臺,提升計(jì)算效率 50%

來源: 華為云社區(qū)
作者:鯤鵬小玩家
時(shí)間:2021-03-31
17218
如今,企業(yè)的數(shù)字化轉(zhuǎn)型和智能升級必談AI,AI在人們?nèi)粘I畹闹械漠a(chǎn)品和應(yīng)用也隨處可見,如智能音箱、AI相機(jī)、人臉支付等。但是,爆炸式增長的數(shù)據(jù)量、復(fù)雜的訓(xùn)練框架和算法,讓很多企業(yè)現(xiàn)有的AI計(jì)算平臺變得捉襟見肘:計(jì)算效率無法滿足業(yè)務(wù)增加訴求,運(yùn)營運(yùn)維成本也居高不下。華為云AI容器為客戶提供更高性價(jià)比的算力,更簡化了平臺運(yùn)維,提升AI計(jì)算效率50%,加速了AI計(jì)算在各行業(yè)的落地和發(fā)展。

如今,企業(yè)的數(shù)字化轉(zhuǎn)型和智能升級必談AI,AI在人們?nèi)粘I畹闹械漠a(chǎn)品和應(yīng)用也隨處可見,如智能音箱、AI相機(jī)、人臉支付等。

但是,爆炸式增長的數(shù)據(jù)量、復(fù)雜的訓(xùn)練框架和算法,讓很多企業(yè)現(xiàn)有的AI計(jì)算平臺變得捉襟見肘:計(jì)算效率無法滿足業(yè)務(wù)增加訴求,運(yùn)營運(yùn)維成本也居高不下。

華為云AI容器為客戶提供更高性價(jià)比的算力,更簡化了平臺運(yùn)維,提升AI計(jì)算效率50%,加速了AI計(jì)算在各行業(yè)的落地和發(fā)展。

計(jì)算量6年增長30萬倍AI平臺擴(kuò)容成本高

OpenAI分析報(bào)告顯示,從2012至2018年的6年時(shí)間,AI訓(xùn)練使用的算力增長了30萬倍,是同時(shí)期摩爾定律增長量的5倍。

這意味著,要保持計(jì)算速度不變,不能單單依靠芯片能力的升級,還必須增加計(jì)算設(shè)備投入。而專業(yè)GPU服務(wù)器配以高速網(wǎng)絡(luò)、高速存儲等設(shè)備,單臺平均成本在100萬左右,價(jià)格高昂,大部分企業(yè)難以承擔(dān)。

1579076060898214.JPG

系統(tǒng)日趨復(fù)雜AI平臺運(yùn)維難度激增

首先,不同的業(yè)務(wù)需要不同的AI訓(xùn)練框架、模型、加速庫,如何在統(tǒng)一平臺上管理不同的訓(xùn)練框架和模型,如何將線下訓(xùn)練快速部署到生產(chǎn)環(huán)境帶來巨大挑戰(zhàn)。

其次,AI訓(xùn)練和公司業(yè)務(wù)使用不同的資源管理工具,使得運(yùn)維團(tuán)隊(duì)需要掌握和使用多種資源管理工具,保障GPU利用率,增加運(yùn)維復(fù)雜度。

再者,GPU在集群內(nèi)被不同業(yè)務(wù)團(tuán)隊(duì)共享,團(tuán)隊(duì)間的資源協(xié)調(diào)也會耗費(fèi)不少精力。

1579076070868748.JPG

公有云+容器化:AI計(jì)算平臺建設(shè)的必選之路

面對上述問題,各企業(yè)開始著手構(gòu)建基于公有云和容器的AI計(jì)算平臺,基于公有云的容器平臺,能給客戶帶來什么樣的好處呢?

更快速的獲取算力資

面對AI計(jì)算需要的超大規(guī)模算力,自建IDC擴(kuò)容周期長、一次性投入大,后期維護(hù)成本高,采用公有云,可以即申請即用,快速補(bǔ)充企業(yè)IDC算力的不足,同時(shí)具備更低的使用成本、無需關(guān)注基礎(chǔ)設(shè)施維護(hù)、避免資源閑置造成浪費(fèi)等優(yōu)勢,成為了客戶擴(kuò)充算力的最佳選擇。

降低日常使用和運(yùn)維難

用戶搭建深度學(xué)習(xí)訓(xùn)練環(huán)境,需要準(zhǔn)備帶GPU的機(jī)器、安裝Python、TensorFlow、GPU驅(qū)動等,如果要從開發(fā)環(huán)境到測試環(huán)境,再從測試環(huán)境到生成環(huán)境,涉及環(huán)境遷移過程中需要花很大精力來保證環(huán)境的一致性。

容器帶來的標(biāo)準(zhǔn)化打包能力可以提供了絕佳的解決方案,將相關(guān)軟件一并打包到鏡像中,一次構(gòu)建,即可在不同平臺上運(yùn)行,極大降低安裝、部署的復(fù)雜度;同時(shí)各容器間相互隔離,可實(shí)現(xiàn)多訓(xùn)練框架并存,而且每一個(gè)框架都可以獨(dú)立進(jìn)行升級而不會影響其他業(yè)務(wù),降低的日常運(yùn)維的難度,讓客戶可以將更多的精力集中在AI訓(xùn)練上。

但是,我們在與用戶交流過程中發(fā)現(xiàn),用戶雖然認(rèn)可公有云+容器的模式,但是在公有云上自建一套容器化的AI計(jì)算平臺,對部分用戶仍存在較大的技術(shù)門檻,尤其是那些尚未接觸過容器的用戶。

華為云就此推出了面向AI計(jì)算場景的容器服務(wù)——AI容器,并于2018年在華為全聯(lián)接大會發(fā)布,今年我們對AI容器進(jìn)行了升級,在性能、易用性、可運(yùn)維等方面都有了很大的提升。

華為云AI容器:更易使用和運(yùn)維提升AI計(jì)算效率50%**

開箱即用免除基礎(chǔ)設(shè)施運(yùn)

AI容器采用華為云容器實(shí)例(CCI)作為基礎(chǔ)設(shè)施層,得益于CCI的Serverless架構(gòu),用戶完全無需關(guān)心主機(jī)的創(chuàng)建、管理、運(yùn)維,而只需要在使用時(shí)申請所需要的算力資源即可(算力類型、CPU核數(shù)、內(nèi)存量),省去了基礎(chǔ)設(shè)施的日常運(yùn)維工作,用戶可以更加專注于AI計(jì)算本身。

更快速的獲取算力資

AI容器基于全新的Volcano平臺進(jìn)行任務(wù)調(diào)度管理,Volcano是華為云高性能批量計(jì)算平臺,具有更高的調(diào)度性能,最高可達(dá)1000容器/秒,將算力獲取的效率提升近10倍。

同時(shí),有了Volcano的加持,AI容器還可以基于拓?fù)浜唾Y源親和進(jìn)行任務(wù)調(diào)度,根據(jù)策略將關(guān)聯(lián)任務(wù)調(diào)度到同一物理節(jié)點(diǎn)或二層網(wǎng)絡(luò)內(nèi),極大的提升了AI訓(xùn)練過程中任務(wù)間通信及數(shù)據(jù)交互的效率。

秒級計(jì)費(fèi)資源性價(jià)比更高

AI訓(xùn)練時(shí)客戶需要快速、多次計(jì)算進(jìn)行迭代,會對資源進(jìn)行頻繁的申請、釋放,AI容器采用按秒計(jì)費(fèi)和套餐包的計(jì)費(fèi)方式,真正做到按使用付費(fèi)(PAYU),避免客戶采用包周期等方式購買資源后,利用率不足而造成的浪費(fèi)。

開放生態(tài)支持主流訓(xùn)練框

隨著AI平臺容器化的深入,大量訓(xùn)練框架都已發(fā)布其容器版本,AI容器目前已支持Tensorflow,Caffe,Mxnet,Pytorch,MindSpore等近十種主流訓(xùn)練框架,用戶可以將訓(xùn)練代碼平滑的遷移上云。

多樣算力用戶選擇更加靈活

AI容器的能提供昇騰、鯤鵬、x86和GPU等類型的算力資源,用戶可以實(shí)現(xiàn)一套平臺運(yùn)行不同類型的應(yīng)用,根據(jù)應(yīng)用特點(diǎn)靈活選擇算力資源,達(dá)到資源的最優(yōu)配置。

立即登錄,閱讀全文
版權(quán)說明:
本文內(nèi)容來自于華為云社區(qū),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
近6成金融機(jī)構(gòu)的選擇!華為云GaussDB加快金融核心系統(tǒng)轉(zhuǎn)型
近6成金融機(jī)構(gòu)的選擇!華為云GaussDB加快金融核心系統(tǒng)轉(zhuǎn)型
當(dāng)前,數(shù)據(jù)庫在金融機(jī)構(gòu)的應(yīng)用正在從辦公、一般系統(tǒng)逐步邁入核心系統(tǒng)應(yīng)用的深水區(qū)。如何構(gòu)建安全可靠、高效穩(wěn)定的核心系統(tǒng)數(shù)據(jù)庫,支持業(yè)務(wù)運(yùn)營和管理決策,成為了眾多金融機(jī)構(gòu)關(guān)注的焦點(diǎn)問題。
華為云
2024-07-042024-07-04
華為云以系統(tǒng)性創(chuàng)新加速千行萬業(yè)智能化升級
華為云以系統(tǒng)性創(chuàng)新加速千行萬業(yè)智能化升級
華為云全球銷售收入達(dá)553億元人民幣,是全球增長最快的主流云廠商之一。
華為云
2024-04-222024-04-22
華為云發(fā)布新型工業(yè)互聯(lián)網(wǎng)平臺參考架構(gòu)
華為云發(fā)布新型工業(yè)互聯(lián)網(wǎng)平臺參考架構(gòu)
近日,在華為分析師大會上,華為混合云副總裁胡玉海重磅發(fā)布《新型工業(yè)互聯(lián)網(wǎng)平臺參考架構(gòu)》白皮書,在傳統(tǒng)工業(yè)互聯(lián)網(wǎng)的基礎(chǔ)上,融入大模型的能力,讓智能化賦能新型工業(yè)化。
華為云
云服務(wù)
2024-04-222024-04-22
支撐核心系統(tǒng)分布式改造,GaussDB為江南農(nóng)商銀行筑穩(wěn)根基
支撐核心系統(tǒng)分布式改造,GaussDB為江南農(nóng)商銀行筑穩(wěn)根基
在移動互聯(lián)網(wǎng)快速普及的當(dāng)下,金融機(jī)構(gòu)能否提供便捷、智能、個(gè)性化的金融服務(wù),成為關(guān)乎業(yè)務(wù)開展和企業(yè)成長的重要命題。
華為云
2024-01-252024-01-25
優(yōu)質(zhì)服務(wù)商推薦
更多
個(gè)人VIP