Google發(fā)布Cloud TPU v5p與超級(jí)計(jì)算機(jī)架構(gòu)AI Hypercomputer

來(lái)源:十輪網(wǎng)
作者:十輪網(wǎng)
時(shí)間:2023-12-08
3120
Google周四發(fā)布了新的張量處理器(Tensor Processing Unit)Cloud TPU v5p、超級(jí)計(jì)算機(jī)架構(gòu)AI Hypercomputer,以及資源管理工具Dynamic Workload Scheduler,以協(xié)助組織執(zhí)行與處理AI任務(wù)。

1207-google_cloud-cloud_tpu_v5-960.jpg

Google周四(12/7)發(fā)布了新的張量處理器(Tensor Processing Unit)Cloud TPU v5p、超級(jí)計(jì)算機(jī)架構(gòu)AI Hypercomputer,以及資源管理工具Dynamic Workload Scheduler,以協(xié)助組織執(zhí)行與處理AI任務(wù)。

Google始于今年11月推出Cloud TPU v5e,再于本周發(fā)布Cloud TPU v5p,前者強(qiáng)調(diào)的是成本效益,后者號(hào)稱是迄今最強(qiáng)大的TPU。每個(gè)TPU v5p pod具備8,960個(gè)芯片,芯片間的互聯(lián)速度達(dá)4,800 Gbps,相較于上一代的TPU v4,Cloud TPU v5p提供了2倍的FLOPS與3倍的高帶寬內(nèi)存(HBM)。

由于Cloud TPU v5p是性能取向,因此在訓(xùn)練大型LLM模型時(shí)的速度,比TPU v4快了2.8倍,在第二代SparseCores的幫助下,TPU v5p訓(xùn)練嵌入式密集模型的速度,也比TPU v4快了1.9倍。

1207-Google-cloud-Cloud-TPU-v5-600-1.jpg

至于AI Hypercomputer則是個(gè)超級(jí)計(jì)算機(jī)架構(gòu),它集成了優(yōu)化性能的硬件、開(kāi)源軟件、主要的各種機(jī)器學(xué)習(xí)框架,以及靈活的消費(fèi)模式。Google解釋,傳統(tǒng)上通常借由強(qiáng)化分散的組件來(lái)處理嚴(yán)苛要求的AI任務(wù),然而,AI Hypercomputer則是利用系統(tǒng)上的協(xié)同設(shè)計(jì)來(lái)提高AI在訓(xùn)練、微調(diào)與服務(wù)上的效率及生產(chǎn)力。

在硬件性能的優(yōu)化上,AI Hypercomputer具備基于超大規(guī)模數(shù)據(jù)中心基礎(chǔ)設(shè)施在運(yùn)算、存儲(chǔ)與網(wǎng)絡(luò)設(shè)備的優(yōu)化設(shè)計(jì);也允許開(kāi)發(fā)者通過(guò)開(kāi)源軟件來(lái)訪問(wèn)相關(guān)硬件,以微調(diào)與管理AI任務(wù),包括支持JAX、TensorFlow與PyTorch等機(jī)器學(xué)習(xí)框架,以及Multislice Training與Multihost Inferencing等軟件,并深度集成了Google Kubernetes Engine(GKE)與Google Compute Engine。

1207-Google-AI-Hypercomputer.jpg

AI Hypercomputer提供了更靈活的消費(fèi)模式,除了特定用量的折扣(Committed Use Discounts,CUD),以及隨選(On-Demand)與競(jìng)價(jià)(Spot)之外,AI Hypercomputer也借由全新的Dynamic Workload Scheduler,來(lái)提供專為AI任務(wù)設(shè)計(jì)的兩種消費(fèi)模式,F(xiàn)lex Start與Calendar。

Dynamic Workload Scheduler為一資源管理及任務(wù)調(diào)度平臺(tái),它支持Cloud TPU與Nvidia GPU,可同時(shí)調(diào)度所需的所有加速器來(lái)協(xié)助用戶優(yōu)化支出。其中的Flex Start主要用來(lái)微調(diào)模型、實(shí)驗(yàn)、較短的訓(xùn)練任務(wù)、蒸餾、脫機(jī)推理及批次任務(wù),并在準(zhǔn)備執(zhí)行請(qǐng)求GPU與TPU容量,是一種相對(duì)經(jīng)濟(jì)的選擇。

而Calendar模式則可替AI任務(wù)預(yù)留開(kāi)始時(shí)間,適用于需要精確開(kāi)始時(shí)間,與特定持續(xù)期間的訓(xùn)練及實(shí)驗(yàn)性任務(wù),可于該固定時(shí)間的區(qū)域中請(qǐng)求GPU容量,所持續(xù)的期間可以是7天或14天,最早可提前8周購(gòu)買。

圖片來(lái)源/Google Cloud

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
文章來(lái)源:十輪網(wǎng)
版權(quán)說(shuō)明:本文內(nèi)容來(lái)自于十輪網(wǎng),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
新版GKE可管理最多6.5萬(wàn)集群節(jié)點(diǎn),超越AWS、Azure 10倍
新版GKE可管理最多6.5萬(wàn)集群節(jié)點(diǎn),超越AWS、Azure 10倍
Google Cloud公布最新Google Kubernetes Engine版本,號(hào)稱可支持最高達(dá)65,000個(gè)節(jié)點(diǎn)的服務(wù)器集群,以執(zhí)行超大型AI模型。
Google Cloud
云服務(wù)
云計(jì)算
2024-11-15
Google Cloud細(xì)說(shuō)AI變現(xiàn)途徑:用戶一年暴增10倍
Google Cloud細(xì)說(shuō)AI變現(xiàn)途徑:用戶一年暴增10倍
Google云計(jì)算平臺(tái)(Google Cloud)首席執(zhí)行官Thomas Kurian在高盛舉行的會(huì)議上,說(shuō)明了該公司究竟是通過(guò)哪些途徑將AI變現(xiàn)。
Google Cloud
谷歌云
云計(jì)算
2024-09-13
云計(jì)算平臺(tái)GCP的服務(wù)存在權(quán)限提升漏洞,未經(jīng)授權(quán)的攻擊者可借此訪問(wèn)敏感數(shù)據(jù)
云計(jì)算平臺(tái)GCP的服務(wù)存在權(quán)限提升漏洞,未經(jīng)授權(quán)的攻擊者可借此訪問(wèn)敏感數(shù)據(jù)
7月24日安全企業(yè)Tenable披露影響Google Cloud Platform(GCP)的權(quán)限提升漏洞ConfusedFunction,這項(xiàng)弱點(diǎn)發(fā)生在名為Cloud Functions的無(wú)服務(wù)器運(yùn)算服務(wù),以及稱作Cloud Build的CICD渠道服務(wù)。
Google Cloud
谷歌云
云計(jì)算
2024-07-27
Gemini為核心,Google云計(jì)算AI戰(zhàn)略聚焦云服務(wù)和生產(chǎn)力GAI
Gemini為核心,Google云計(jì)算AI戰(zhàn)略聚焦云服務(wù)和生產(chǎn)力GAI
過(guò)去一年,企業(yè)GAI應(yīng)用的風(fēng)潮席卷全球,成了三大公有云積極搶攻的新戰(zhàn)場(chǎng),微軟靠著OpenAI助攻,去年在這場(chǎng)云計(jì)算GAI大戰(zhàn)中取得先機(jī),而Google后來(lái)居上,靠著自家PaLM模型和GAI生產(chǎn)力工具來(lái)迎戰(zhàn),AWS則是到去年底年會(huì)上,對(duì)于企業(yè)GAI應(yīng)用布局才有比較完整的布局與披露。
Google Cloud
谷歌云
云計(jì)算
2024-05-04
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開(kāi)掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家