剛剛在拉斯維加斯落下帷幕的2021亞馬遜云科技re:Invent全球大會(huì),全球云計(jì)算愛好者都體驗(yàn)了一場(chǎng)技術(shù)盛宴。
在這場(chǎng)盛會(huì)中,“人工智能”再一次領(lǐng)銜主演。這種對(duì)人的意識(shí)和思維過(guò)程的模擬,利用機(jī)器學(xué)習(xí)和數(shù)據(jù)分析方法賦予機(jī)器類人的科學(xué),將提升社會(huì)勞動(dòng)生產(chǎn)率,特別是在有效降低勞動(dòng)成本、優(yōu)化產(chǎn)品和服務(wù)、創(chuàng)造新市場(chǎng)和就業(yè)等方面為人類的生產(chǎn)和生活帶來(lái)革命性的轉(zhuǎn)變。
據(jù)Sage預(yù)測(cè),到2030年人工智能的出現(xiàn)將為全球GDP帶來(lái)額外14%的提升,相當(dāng)于15.7萬(wàn)億美元的增長(zhǎng)。而利用云計(jì)算的能力讓人工智能的數(shù)據(jù)匯聚更加便捷、模型訓(xùn)練快速部署、模型服務(wù)快速落地,甚至讓智能應(yīng)用更加智能,已經(jīng)成為了人們關(guān)注的要點(diǎn)。也就是所謂的AI Engineering——人工智能工程化?!癆I Engineering”也是2021年Gartner十大重要戰(zhàn)略科技趨勢(shì)預(yù)測(cè)之一。
而亞馬遜云科技在人工智能領(lǐng)域的頭部產(chǎn)品Amazon SageMaker的就是在這個(gè)領(lǐng)域的高端玩家。此次,亞馬遜云科技re:Invent全球大會(huì)陸續(xù)發(fā)布了數(shù)個(gè)新的Amazon SageMaker功能,使機(jī)器學(xué)習(xí)(ML)能夠?yàn)樾骂愋偷挠脩籼峁┰L問,同時(shí)繼續(xù)提高數(shù)據(jù)科學(xué)家和ML專家的性能并降低成本。
在這篇文章中,我們將這些信息以及資源進(jìn)行摘要,供您更準(zhǔn)確地了解到人工智能行業(yè)的重要產(chǎn)品及其發(fā)展方向與技術(shù)的未來(lái)展望。
ML for all——讓所有人可以使用機(jī)器學(xué)習(xí)
隨著ML應(yīng)用的增長(zhǎng),對(duì)ML技能的需求也越來(lái)越高。為了幫助滿足這一不斷增長(zhǎng)的需求,亞馬遜云科技希望企業(yè)在未來(lái)將ML的范圍從數(shù)據(jù)科學(xué)家和開發(fā)人員擴(kuò)展到更廣泛的業(yè)務(wù)用戶社區(qū),包括支持財(cái)務(wù)、營(yíng)銷、運(yùn)營(yíng)和人力資源團(tuán)隊(duì)的業(yè)務(wù)線分析師。為此,亞馬遜云科技新任CEO——Adam Selipsky在自己的主題演講中發(fā)布了Amazon SageMaker Canvas。
這是一款通過(guò)為業(yè)務(wù)分析師提供的一個(gè)可視化點(diǎn)擊界面來(lái)實(shí)現(xiàn)機(jī)器學(xué)習(xí)。該界面允許他們自己生成準(zhǔn)確的ML預(yù)測(cè),而無(wú)需任何ML經(jīng)驗(yàn)或編寫一行代碼。并且,對(duì)外提供為期兩個(gè)月的免費(fèi)試用,最多可訓(xùn)練10個(gè)ML模型和100萬(wàn)單元格的免費(fèi)數(shù)據(jù)空間。
大規(guī)模處理結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)
隨著越來(lái)越多的人開始在日常工作中使用人工智能,對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行標(biāo)記的需求越來(lái)越大,數(shù)據(jù)科學(xué)團(tuán)隊(duì)也無(wú)法滿足日益增長(zhǎng)的需求,甚至很多公司已經(jīng)開始培養(yǎng)專門的數(shù)據(jù)標(biāo)注團(tuán)隊(duì)。為此,亞馬遜云科技發(fā)布了Amazon SageMaker Ground Truth Plus,使您可以輕松創(chuàng)建高質(zhì)量的訓(xùn)練數(shù)據(jù)集,而無(wú)需自行構(gòu)建數(shù)據(jù)標(biāo)注應(yīng)用與管理數(shù)據(jù)標(biāo)注工作人員。
Amazon SageMaker Ground Truth Plus提供了一支經(jīng)過(guò)ML訓(xùn)練的專家隊(duì)伍,可以幫助滿足您的數(shù)據(jù)安全、隱私和法規(guī)遵從性要求。只需上傳您的數(shù)據(jù),Amazon SageMaker Ground Truth Plus即可創(chuàng)建數(shù)據(jù)標(biāo)簽工作流并代表您管理工作流。
優(yōu)化構(gòu)建、訓(xùn)練和部署ML模型的性能和成本
我們?cè)诔掷m(xù)的使數(shù)據(jù)科學(xué)家和開發(fā)人員準(zhǔn)備數(shù)據(jù)、構(gòu)建、訓(xùn)練和部署ML模型變得更容易、成本更低。
首先,為了構(gòu)建ML模型,我們發(fā)布了對(duì)Amazon SageMaker Studio的功能增強(qiáng),以便您現(xiàn)在可以在一個(gè)統(tǒng)一的Notebook中進(jìn)行數(shù)據(jù)處理、分析和ML工作流。通過(guò)這個(gè)通用Notebook您可以訪問各種數(shù)據(jù)源,并為各種數(shù)據(jù)工作負(fù)載的任何轉(zhuǎn)換編寫代碼。
除了加快模型訓(xùn)練速度外,亞馬遜云科技還推出了一款新的編譯器Amazon SageMaker Training Compiler,它可以通過(guò)圖形和內(nèi)核級(jí)優(yōu)化將訓(xùn)練速度提高50%,從而更有效地使用GPU。Amazon SageMaker Training Compiler與Amazon SageMaker中的TensorFlow和PyTorch版本集成。因此,您可以在這些流行框架中以最少的代碼更改來(lái)加速訓(xùn)練。
最后,對(duì)于推理,亞馬遜云科技還宣布了兩個(gè)Amazon SageMaker的特性以減少推理成本。Amazon SageMaker Serverless Inference(預(yù)覽版)允許您在按用量付費(fèi)的定價(jià)模型上部署ML模型,而無(wú)需擔(dān)心服務(wù)器或集群是否存在間歇性流量模式。此外,Amazon SageMaker Inference Recommender推理推薦程序可幫助您選擇最佳可用的計(jì)算實(shí)例和配置,以部署ML模型,從而獲得最佳的推理性能和成本。
One more thing...
One more thing...一個(gè)免費(fèi)、無(wú)需配置的ML服務(wù)——Amazon SageMaker Studio Lab(Preview)
Amazon SageMaker Studio Lab是一項(xiàng)免費(fèi)、無(wú)需配置的服務(wù),允許開發(fā)者、學(xué)者和數(shù)據(jù)科學(xué)家動(dòng)手實(shí)踐機(jī)器學(xué)習(xí)。使用Amazon SageMaker Studio Lab,客戶將能夠?qū)W⒂趯?shí)踐機(jī)器學(xué)習(xí)與數(shù)據(jù)科學(xué),而無(wú)需設(shè)置或配置任何環(huán)境與機(jī)器。
基于開源JupterLab web應(yīng)用程序,您可以擁有一個(gè)完全開放的機(jī)器學(xué)習(xí)開發(fā)環(huán)境,能夠利用各類主流框架,如Pytorch、TensorFlow、MxNet或Hugging Face,以及SciKitLearn、NumPy和Pandas等庫(kù)。Amazon SageMaker Studio Lab具有自動(dòng)保存功能,可以自動(dòng)保存客戶的用戶會(huì)話,這樣他們就可以在下次用戶會(huì)話中繼續(xù)進(jìn)行。SageMaker Studio Lab的其他好處是它與Github的集成,使用者能夠使用Jupyter打開、查看、編輯和運(yùn)行任何來(lái)自Github的項(xiàng)目代碼,并與開源分布式版本控制系統(tǒng)Git集成。
四大亮點(diǎn)
無(wú)需注冊(cè)云賬號(hào)
只需要郵箱即可注冊(cè)使用您的電子郵件地址注冊(cè)studiolab.sagemaker.aws上的帳戶,也不需要像云賬號(hào)一樣綁定信用卡。
提供限時(shí)免費(fèi)CPU、GPU算力
對(duì)于復(fù)雜的算法,您可以選擇使用12小時(shí)的CPU session運(yùn)行Notebook,對(duì)于深度學(xué)習(xí)(DL)架構(gòu),例如卷積神經(jīng)網(wǎng)絡(luò)(CNN)和遞歸神經(jīng)網(wǎng)絡(luò)(RNN),您可以選擇使用4小時(shí)的GPU session運(yùn)行Notebook??倲?shù)沒有限制,但無(wú)法同時(shí)進(jìn)行兩個(gè)以上的session,上一個(gè)session結(jié)束,才可以開始新session。
持久化存儲(chǔ)
提供15GB免費(fèi)的持久化存儲(chǔ)。用來(lái)存儲(chǔ)代碼、模型、與訓(xùn)練數(shù)據(jù)。會(huì)話結(jié)束時(shí),您的工作將自動(dòng)保存在專用存儲(chǔ)中。
集成的機(jī)器學(xué)習(xí)框架
為您的項(xiàng)目選擇最佳的Python包管理器,如Pip、Conda或Mamba。默認(rèn)情況下,Amazon SageMaker Studio實(shí)驗(yàn)室支持終端和Git命令行以及GitHub集成以進(jìn)行協(xié)作。安裝快速簡(jiǎn)單,無(wú)需配置即可運(yùn)行Jupyter Notebook。