AWS推出基于機(jī)器學(xué)習(xí)的EC2容量區(qū)塊,多種預(yù)訂方式便利企業(yè)AI開發(fā)

來源:十輪網(wǎng)
作者:十輪網(wǎng)
時間:2024-11-06
3222
過去數(shù)年GPU資源一直被企業(yè)熱搶作AI開發(fā)。但購買GPU卡預(yù)算高昂,實(shí)際所需算能也難以憑空估算。

過去數(shù)年GPU資源一直被企業(yè)熱搶作AI開發(fā)。但購買GPU卡預(yù)算高昂,實(shí)際所需算能也難以憑空估算。AWS為此推出適用于機(jī)器學(xué)習(xí)(ML)的EC2容量區(qū)塊,讓客戶能夠租用GPU算力,以運(yùn)行其短期ML workload。借助EC2容量塊,可以使用二代UltraCluster 3,200G網(wǎng)絡(luò),結(jié)合EFA技術(shù),以獲得最佳網(wǎng)絡(luò)性能,更可預(yù)留高達(dá)512個NVIDIA GPU。

AWS的GPU實(shí)例預(yù)訂方式讓用戶可以選定未來日子所需保留的實(shí)例數(shù)。EC2容量區(qū)塊目前最新可用到NVIDIA H200 Tensor Core GPU提供支持的Amazon EC2 P5e實(shí)例,最多可提早8星期預(yù)留或預(yù)留28天使用時長。以下將介紹以不同方法預(yù)訂容量區(qū)塊。

在Amazon EC2 Console上選擇Capacity Reservation,可以看到兩個容量預(yù)留選項(xiàng)。選擇Purchase Capacity Block for ML,然后選擇Get started以開始尋找EC2容量區(qū)塊。

4570CDF6-5A70-4D07-9928-52EC3F71D2A3.jpeg

其次,選擇總?cè)萘坎⒅付ㄋ枰狤C2容量塊的時間??梢灶A(yù)留以下大小的EC2容量塊:1、2、4、8、16、32或64個實(shí)例。可預(yù)留EC2容量區(qū)塊的總天數(shù)為1到28天。EC2容量塊最多可提前8星期預(yù)訂。以下例子為p5.48xlarge。

EC2容量區(qū)塊的價格取決于購買EC2容量區(qū)塊時的總可用供需量,和預(yù)訂酒店邏輯相似。用戶可以調(diào)整大小、持續(xù)時間或日期范圍,以搜索其他EC2容量區(qū)塊選項(xiàng)。當(dāng)選擇Find Capacity blocks時,AWS將提供指定的日期范圍內(nèi)符合規(guī)范的最低價格產(chǎn)品以供選訂。

查看EC2容量區(qū)塊詳細(xì)資訊、標(biāo)簽和總價格資訊后,選擇Purchase。有關(guān)總價格是預(yù)先收取的,購買后價格不會改變。用戶需在確認(rèn)購買EC2容量區(qū)塊的12小時內(nèi)完成付款。

所有EC2容量區(qū)塊預(yù)留均從(UTC+8)19:30開始。EC2容量塊在購買后無法修改或取消。

AWS也提供API形式尋找可供預(yù)訂的容量區(qū)塊并進(jìn)行預(yù)訂。使用API提供集群要求并發(fā)現(xiàn)可供購買的EC2容量塊。首先,使用describe-capacity-block-offerings API提供集群要求并發(fā)現(xiàn)可供購買的EC2容量區(qū)塊。

DA270F48-6ED7-4C56-8488-6FB26CF0983A.jpeg

使用上述指令找到可用的EC2容量區(qū)塊后,就可以使用以下API購買:CapacityBlockOfferingIdpurchase-capacity-block-reservation

CA16E362-94FF-4153-BBED-0077C5D447F2.jpeg

最后,會看見EC2容量區(qū)塊現(xiàn)已成功預(yù)留。在到達(dá)擬訂的開始日期,EC2容量區(qū)塊將態(tài)將變成Active。要使用Active的EC2容量塊,可點(diǎn)擊EC2容量區(qū)塊的ID。

6C4ECBBB-122E-4153-B10F-2B080B89C938.jpeg

選擇Launch instances,便可以啟動EC2實(shí)例,并開始運(yùn)行ML workload。

60C3F766-5BEA-4F65-A18D-549CDA10DE95.jpeg

請注意,當(dāng)EC2容量區(qū)塊臨近結(jié)束,EC2將通過Amazon EventBridge發(fā)出預(yù)留即將結(jié)束的通知,以便對工作負(fù)載進(jìn)行檢查點(diǎn)操作。在EC2容量區(qū)塊中運(yùn)行的任何實(shí)例都會在預(yù)留結(jié)束前30分鐘關(guān)閉。用戶不會為此時段支付金額。當(dāng)EC2容量區(qū)塊過期,任何仍在運(yùn)行的實(shí)例都將被終止。

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
文章來源:十輪網(wǎng)
版權(quán)說明:本文內(nèi)容來自于十輪網(wǎng),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點(diǎn),不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
Amazon EC2 Trn2實(shí)例正式可用,多款算力新品正式推出!
Amazon EC2 Trn2實(shí)例正式可用,多款算力新品正式推出!
在2024亞馬遜云科技re:Invent全球大會上,亞馬遜云科技宣布Amazon Trainium2 Server正式可用,并推出全新的Amazon Trainium2 UltraServer,讓用戶以優(yōu)越的性價比訓(xùn)練和部署最新的人工智能模型,以及未來的大語言模型(LLM)和基礎(chǔ)模型。
AWS
云服務(wù)
亞馬遜云科技
2024-12-14
重磅推出Amazon Nova模型系列
重磅推出Amazon Nova模型系列
在2024亞馬遜云科技re:Invent全球大會上,亞馬遜云科技宣布推出新一代基礎(chǔ)模型Amazon Nova,這些模型在多種任務(wù)上展現(xiàn)出頂尖智能,且具備行業(yè)領(lǐng)先的性價比。
AWS
云服務(wù)
亞馬遜云科技
2024-12-14
部署時間從數(shù)年減至數(shù)月,ERP讓業(yè)務(wù)增長起飛!
部署時間從數(shù)年減至數(shù)月,ERP讓業(yè)務(wù)增長起飛!
作為現(xiàn)代企業(yè)管理的中樞,卓越的ERP系統(tǒng)能夠提供企業(yè)一個集成化的平臺,實(shí)現(xiàn)財務(wù)、人力資源、供應(yīng)鏈和客戶服務(wù)等關(guān)鍵職能的自動化和智能化管理。
AWS
云服務(wù)
亞馬遜云科技
2024-12-14
你使用的云,足夠有韌性嗎?
你使用的云,足夠有韌性嗎?
權(quán)威研究機(jī)構(gòu)Frost&Sullivan最新發(fā)布了白皮書《你使用的云足夠有韌性嗎?需要關(guān)注的云基礎(chǔ)架構(gòu)設(shè)計關(guān)鍵要素》,旨在幫助企業(yè)深入了解云基礎(chǔ)設(shè)施韌性,并提供選擇最具彈性云服務(wù)提供商(CSP)的指南。
AWS
云服務(wù)
亞馬遜云科技
2024-12-14
優(yōu)質(zhì)服務(wù)商推薦
更多