今天,權(quán)威AI基準評測組織MLPerf公布了最新一期推理性能榜單——基于自研的軟硬一體協(xié)同方案,阿里云在數(shù)據(jù)中心、邊緣計算、IoT領(lǐng)域,斬獲多項第一。
MLCommons發(fā)布最新MLPerf榜單
·阿里云磐久服務(wù)器M系列:成為MLPerf有史以來CPU-Only推理性能得分最高的服務(wù)器,且在數(shù)據(jù)中心和邊緣側(cè)該類別的總體性能均為第一。
·平頭哥玄鐵RISC-V處理器:在聚焦低功耗、高能效的IoT領(lǐng)域Tiny v0.7榜單中,刷新了視覺喚醒、圖像分類、語音喚醒及異常監(jiān)測4個典型AI任務(wù)的紀錄,創(chuàng)造了RISC-V架構(gòu)在AI基準測試的最好成績。
CPU-Only推理性能數(shù)據(jù)對比
Tiny v0.7推理性能數(shù)據(jù)對比
此次磐久服務(wù)器和玄鐵RISC-V處理器取得優(yōu)異成績,得益于阿里云自研震旦異構(gòu)計算加速平臺穩(wěn)定、強大的軟硬協(xié)同優(yōu)化能力。
基于震旦異構(gòu)計算加速平臺,可實現(xiàn)AI框架及算法的無縫遷移適配,支持云邊端多場景快速部署,大幅提升AI應(yīng)用開發(fā)效率:
·模型優(yōu)化:震旦利用模型優(yōu)化工具SinianML來進行用于AI任務(wù)的神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索和壓縮,以及最佳算子實現(xiàn);
·高精度、高效率:通過震旦算子Autotune能力,得到適配ARM架構(gòu)處理器的最佳算子實現(xiàn),保證達到基準測試精度目標,且得到遠高于標準ResNet50 v1.5的計算效率;
·提升CPU利用率:通過大規(guī)模深度算子融合和針對平頭哥玄鐵RISC-V微架構(gòu)的極致優(yōu)化,大大提高CPU算力利用率。
MLPerf
MLPerf由圖靈獎得主David Patterson于2018年發(fā)起,每年組織全球AI訓(xùn)練和AI推理性能測試并發(fā)榜,已成為業(yè)界最主流標準之一。
本次榜單重點更新了面向數(shù)據(jù)中心和邊緣計算的場景,以及最新的MLPerf Tiny 0.7測試榜單。
Tiny場景是MLPerf近年新增的性能測試分類,聚焦于低功耗、高性價比的IoT場景,考驗在日益廣泛的IoT智能應(yīng)用場景下的軟硬件性能和優(yōu)化能力。