新功能 — Amazon SageMaker管道為您的機器學習項目帶來開發(fā)運維能力

來源: AWS
作者:Julien Simon
時間:2020-12-28
16998
Amazon SageMaker管道,這是Amazon SageMaker的一項新功能,可讓數(shù)據(jù)科學家和工程師輕松構建、自動化、并擴展端到端的機器學習管道。

今天,我非常高興地宣布推出Amazon SageMaker管道,這是Amazon SageMaker的一項新功能,可讓數(shù)據(jù)科學家和工程師輕松構建、自動化、并擴展端到端的機器學習管道。

機器學習(ML)本質上是實驗性的,且不可預測。您花費數(shù)天或數(shù)周時間以許多不同的方式探索和處理數(shù)據(jù),試圖破解開Geode以揭示其珍貴寶石。然后,您可以嘗試不同的算法和參數(shù),培訓和優(yōu)化大量模型以尋找最高準確度。此過程通常涉及許多不同的步驟,它們之間存在依賴關系,人工管理可能會變得相當復雜。特別是,跟蹤模型沿襲可能很困難,這妨礙了可審計性和治理。最后,部署頂級模型,然后根據(jù)參考測試集對其進行評估。終于?不是很重要,因為你肯定會一次又一次地迭代,無論是嘗試新想法,還是只是就新數(shù)據(jù)建立定期重新培訓模型。

遺憾的是,無論ML有多令人興奮,它確實涉及大量重復性工作。即使是小型項目也需要幾百個步驟才能獲得生產綠燈。隨著時間的推移,這項工作不僅減少了項目的樂趣和興奮,還為監(jiān)督和人為錯誤創(chuàng)造了充足的空間。

為了減輕人工工作并提高可追溯性,許多機器學習團隊采用了開發(fā)運維理念,并實施了持續(xù)集成和持續(xù)交付(CI/CD)的工具和流程。盡管這肯定是朝著正確方向邁出的一步,但編寫自己的工具往往會導致復雜的項目,這些項目需要的軟件工程和基礎設施工作量超過最初預期。寶貴的時間和資源被從實際機器學習項目中挪用,使得創(chuàng)新放緩??杀氖?,一些團隊決定恢復人工工作,以進行模型管理、批準和部署。

Amazon SageMaker管道簡介

簡而言之,Amazon SageMaker管道為您的機器學習項目帶來了一流的開發(fā)運維實踐。這一新功能使數(shù)據(jù)科學家和機器學習開發(fā)人員能夠輕松創(chuàng)建自動化、可靠的端到端機器學習管道。與往常使用SageMaker一樣,所有基礎設施都是完全托管的,不需要您做任何工作。

Care.com是全球領先的尋找和管理高質量家庭護理的平臺。Care.com數(shù)據(jù)科學經理Clemens Tummeltshammer告訴我們的:“一個供需平衡的強大護理行業(yè),對于從個體家庭到全國國內生產總值的經濟增長都至關重要。我們對Amazon SageMaker功能庫和Amazon SageMaker管道感到興奮,因為我們相信,它們將通過使用一組一致的精選數(shù)據(jù),幫助我們在數(shù)據(jù)科學和開發(fā)團隊中更好地實現(xiàn)擴展,我們可以使用這些數(shù)據(jù)構建從數(shù)據(jù)準備到部署的可擴展端到端機器學習(ML)模型管道。借助Amazon SageMaker新公布的功能,我們可以加快針對不同應用程序的機器學習模型的開發(fā)和部署,通過更快的實時推薦幫助客戶作出更明智的決策?!?/span>

讓我向您詳細介紹Amazon SageMaker管道中的主要組件:管道、模型注冊表和MLOps模板。

管道—模型構建管道使用簡單的Python SDK定義。它們可以包括Amazon SageMaker中可用的任何操作,例如使用Amazon SageMaker Processing或Amazon SageMaker Data Wrangler進行數(shù)據(jù)準備、模型培訓、模型部署到實時終端節(jié)點或批量轉換。您還可以將Amazon SageMaker Clarify添加到您的管道中,以便在培訓之前或模型部署后檢測偏向。同樣,您可以添加Amazon SageMaker模型監(jiān)控器來檢測數(shù)據(jù)和預測質量問題。

一旦啟動,模型構建管道將作為CI/CD管道執(zhí)行。每個步驟都會被記錄下來,并提供詳細的日志記錄信息,以供追蹤和調試。當然,您還可以在Amazon SageMaker Studio中可視化管道,并實時跟蹤不同的執(zhí)行情況。

模型注冊表—模型注冊表允許您跟蹤和編錄模型。在SageMaker Studio中,您可以輕松查看模型歷史記錄、列出和比較版本以及跟蹤模型評估指標等元數(shù)據(jù)。您還可以定義在生產環(huán)境中可部署或不部署哪些版本。事實上,您甚至可以構建管道,在獲得批準后自動觸發(fā)模型部署。您會發(fā)現(xiàn),模型注冊表在跟蹤模型沿襲、改進模型治理和加強合規(guī)性狀況方面非常有用。

MLOps模板—SageMaker管道包括一系列內置CI/CD模板,用于熱門管道(構建/培訓/部署、僅部署等)。您還可以添加和發(fā)布自己的模板,以便您的團隊可以輕松地發(fā)現(xiàn)和部署它們。模板不僅節(jié)省了大量時間,還使機器學習團隊能夠輕松地從實驗到部署,使用標準流程進行協(xié)作,而無需管理任何基礎設施。模板還可讓運維團隊根據(jù)需要自定義步驟,并為他們提供故障排除的完全可見性。

現(xiàn)在,我們來做一個快速演示!

使用Amazon SageMaker管道構建端到端管道

打開SageMaker Studio,我選擇“Components”(組件)選項卡和“Projects”(項目)視圖。這將顯示內置項目模板的列表。我選擇一個來構建、培訓和部署模型。

pipeline01-1024x333.png

然后,我只需為項目命名,然后創(chuàng)建它。

幾秒鐘后,項目就緒。我可以看到,它包含兩個托管在AWS CodeCommit中的Git存儲庫,一個用于模型培訓,另一個用于模型部署。

pipelines4-1024x426.png

第一個存儲庫提供了用于創(chuàng)建多步模型構建管道的支撐代碼:數(shù)據(jù)處理、模型培訓、模型評估和基于準確性的條件模型注冊。正如您將在pipeline.py文件中看到的那樣,該管道在眾所周知的Abalone數(shù)據(jù)集上使用XGBoost算法來培訓線性回歸模型。此存儲庫還包括一個構建規(guī)范文件,由AWS CodePipeline和AWS CodeBuild自動執(zhí)行管道。

同樣,第二個存儲庫包含模型部署的代碼和配置文件,以及通過質量門所需的測試腳本。此操作還基于AWS CodePipeline和AWS CodeBuild,后者運行AWS CloudFormation模板來創(chuàng)建用于暫存和生產的模型終端節(jié)點。

單擊兩個藍色鏈接,我在本地克隆了存儲庫。這將觸發(fā)管道的第一次執(zhí)行。

pipelines9-1024x290.png

幾分鐘后,管道已成功運行。切換到“Pipelines”(管道)視圖,我可以直觀地顯示其步驟。

pipelines12-1024x487.png

點擊培訓步驟,我可以看到模型的均方根錯誤(RMSE)指標。

pipelines13-1024x457.png

由于RMSE低于條件步驟中定義的閾值,因此我的模型被添加到模型注冊表中,如下所示。

pipelines14-1-1024x419.png

為簡單起見,注冊步驟將模型狀態(tài)設置為“Approved”(已批準),這將自動觸發(fā)模型部署到同一賬戶中的實時終端節(jié)點。幾秒鐘之內,我看到模型正在部署。

pipelines15-1024x280.png

或者,您可以將模型注冊為“Pending manual approval”(等待人工批準)狀態(tài)。這將阻止部署,直到模型經過人工審查和批準。由于模型注冊表支持跨賬戶部署,因此您還可以輕松地在其他賬戶中部署,而無需跨賬戶復制任何內容。

幾分鐘后,終端節(jié)點啟動了,我可以用它來測試我的模型。

pipelines16-1024x498.png

一旦我確定此模型能夠按預期運行,我就可以發(fā)送回顯信息給MLOps團隊,并要求他們在生產環(huán)境中部署模型。

打開我的MLOps后,我打開AWS CodePipeline控制臺,看到我的部署確實在等待批準。

pipelines17.png

然后我批準部署模型,這將觸發(fā)管道的最后階段。

pipelines18.png

返回我的數(shù)據(jù)科學家,我在SageMaker Studio中看到我的模型正在部署中。大功告成!

pipelines19-1024x326.png

開始使用

正如您所看到的,Amazon SageMaker Pipelines使數(shù)據(jù)科學團隊和MLOps團隊能夠使用熟悉的工具輕松協(xié)作。他們可以創(chuàng)建和執(zhí)行強大的自動化機器學習管道,從而比以前更快地提供高質量生產模型。

您可以在SageMaker可用的所有商業(yè)區(qū)域開始使用SageMaker管道。在CodePipeline也可用的區(qū)域,MLOps功能可用。

我們提供示例筆記本電腦來幫助您入門。立即試用,并向我們提供反饋。我們始終期待您的反饋,您可通過一貫的AWS Support聯(lián)系人向我們提供反饋,也可在針對SageMaker在AWS論壇上提出反饋。

–Julien

特別感謝我的同事Urvashi Chowdhary在早期測試期間提供的寶貴協(xié)助。

立即登錄,閱讀全文
版權說明:
本文內容來自于AWS,本站不擁有所有權,不承擔相關法律責任。文章內容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權,請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質服務商推薦
更多
掃碼登錄
打開掃一掃, 關注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
小程序
快出海小程序
公眾號
快出海公眾號
商務合作
商務合作
投稿采訪
投稿采訪
出海管家
出海管家