甲骨文(Oracle)數(shù)據(jù)倉庫分析工具MySQL HeatWave更新,除了強化自動機器學(xué)習(xí)(AutoML)功能,增加支持的機器學(xué)習(xí)用例,同時也擴展MySQL HeatWave的多云支持。
HeatWave是甲骨文的高性能MySQL查詢工具,使用戶能夠快速地查詢存儲在MySQL數(shù)據(jù)庫的資料,而HeatWave原本就有提供內(nèi)置在數(shù)據(jù)庫中的原生機器學(xué)習(xí)服務(wù),能夠直接執(zhí)行機器學(xué)習(xí)訓(xùn)練、推理和解釋資料,提供自動訓(xùn)練回歸、分類和單變量時間串行預(yù)測模型。
而本次MySQL HeatWave的新功能,甲骨文擴展HeatWave AutoML生命周期自動化,新支持多變量時間串行預(yù)測、非監(jiān)督異常偵測和推薦系統(tǒng),資料分析師可以不需要專業(yè)人員協(xié)助,就能以互動式控制臺,構(gòu)建、訓(xùn)練、執(zhí)行和解釋這些機器學(xué)習(xí)模型。
多變量時間串行預(yù)測是以過去多變量時間串行,預(yù)測未來資料變化的一種方法,像是可用于創(chuàng)建模型,預(yù)測冬季用電需求等,多變量時間串行有多種可用的預(yù)測算法,而挑選適合的算法并非一件簡單的工作,現(xiàn)在MySQL HeatWave所提供的AutoML,能夠預(yù)處理資料,并且自動選擇最適合的機器學(xué)習(xí)模型算法,還能自動調(diào)校模型。
官方提到,他們在自動化預(yù)測工作管線中,使用由高端時間串行預(yù)處理、算法選擇和超參數(shù)調(diào)校等多階段組成的專利技術(shù),使得用戶可以不需要專業(yè)統(tǒng)計人員,就可以完成多變量時間串行預(yù)測。
MySQL HeatWave新支持的無監(jiān)督異常偵測,則可讓用戶能夠簡單地從未標記的資料集中,偵測不同類型的異常,官方解釋,有多種算法都能夠用于偵測資料異常,但是通常只能偵測特定類型的資料,因此當用戶不知道資料集中存在哪些異常資料,算法可能無法正確運行。
而MySQL HeatWave所生成的模型,能夠針對各類型的資料異常,執(zhí)行高精確度預(yù)測,而且該過程完全自動化,分析師不需要選擇算法、特征,也不用擔(dān)心超參數(shù)的數(shù)值。另外,MySQL HeatWave中的推薦系統(tǒng)現(xiàn)在也完全自動化,算法、特征和超參數(shù)優(yōu)化都不需要用戶決定。
甲骨文改進了在MySQL HeatWave與AWS服務(wù)的集成,MySQL HeatWave可在AWS上原生運行,并且提供S3優(yōu)化存儲層,當MySQL資料要加載至HeatWave時,系統(tǒng)會將資料復(fù)制到S3擴展資料管理層,好處是當需要資料恢復(fù),重新加載資料到HeatWave時,多個HeatWave節(jié)點可以平行訪問資料,這大幅加速資料恢復(fù)速度和服務(wù)可用性,使得原本4 TB的HeatWave集群從S3恢復(fù)只要3.5分鐘,比從MySQL重新加載資料需時140分鐘要快上許多。
MySQL HeatWave控制臺開始支持MySQL自動形狀預(yù)測(Autopilot Auto-shape Prediction),該機器學(xué)習(xí)功能將會即時監(jiān)控OLTP工作負載,預(yù)測應(yīng)用程序的執(zhí)行狀況和性能需求,根據(jù)歷史性能分析趨勢,像是吞吐量、緩沖區(qū)命中率,自動推薦適合的數(shù)據(jù)庫形狀。數(shù)據(jù)庫的形狀指得是數(shù)據(jù)庫執(zhí)行實例的配置,包括CPU、內(nèi)存和存儲空間等。