AWS針對其云計(jì)算數(shù)據(jù)倉庫服務(wù)Redshift進(jìn)行一系列更新,目標(biāo)是要讓用戶能夠更簡單地截取資料,并且在安全可靠的環(huán)境,快速分析資料。
Redshift現(xiàn)在支持從S3自動(dòng)復(fù)制資料,也就是說,Redshift能夠自動(dòng)將進(jìn)到S3存儲(chǔ)桶中的文件加載到數(shù)據(jù)倉庫中,這包括CSV、JSON、Parquet和Avro格式,如此用戶便不需要手動(dòng),或是重復(fù)執(zhí)行復(fù)制程序這些繁瑣的工作。另外,Redshift也開始支持流媒體截取,可以從MSK和Kinesis服務(wù),每秒截取數(shù)百M(fèi)B的資料。
AWS關(guān)聯(lián)數(shù)據(jù)庫服務(wù)Aurora的零ETL功能也已經(jīng)與Redshift集成,如此用戶便可以利用Redshift,以接近即時(shí)的速度,對存儲(chǔ)在Aurora MySQL數(shù)據(jù)庫的資料,進(jìn)行分析和執(zhí)行機(jī)器學(xué)習(xí)工作負(fù)載。AWS解釋了服務(wù)集成背后的機(jī)制,當(dāng)交易資料寫入到Aurora后,資料便會(huì)在數(shù)秒鐘內(nèi)復(fù)制到Redshift中。復(fù)制過程不需要用戶手動(dòng)構(gòu)建和維護(hù)復(fù)雜的資料工作管線,還可以選擇從多個(gè)Aurora數(shù)據(jù)庫,復(fù)制資料到同一個(gè)Redshift執(zhí)行實(shí)例,以跨多個(gè)應(yīng)用程序進(jìn)行分析。
Redshift執(zhí)行實(shí)例現(xiàn)在能夠被部署于多個(gè)可用區(qū)域,以增加數(shù)據(jù)倉庫的可用性,并利用自動(dòng)恢復(fù)將恢復(fù)時(shí)間降至數(shù)秒鐘,另外,Redshift提供動(dòng)態(tài)資料遮罩功能,可以保護(hù)存儲(chǔ)在數(shù)據(jù)倉庫中的敏感資料,限制不同權(quán)限的用戶能夠查看到的資料。這使得管理者不需要?jiǎng)?chuàng)建多個(gè)人信息料副本,就能方便不同層級的用戶和群組,訪問不同層級的資料。
除此之外,Redshift現(xiàn)在也與Apache Spark集成,使得用戶更容易在Redshift和無服務(wù)器Redshift服務(wù)上,構(gòu)建和執(zhí)行Spark應(yīng)用程序。AWS Backup也添加了Redshift的支持,AWS Backup使用戶可以定義備份策略來管理應(yīng)用程序的資料保護(hù),而現(xiàn)在Redshift也受AWS Backup保護(hù),讓用戶在資料服務(wù)獲得更一致的保護(hù)功能。