我們很高興地宣布
Azure Databricks
已在中國Azure北三區(qū)正式開放使用!
Azure Databricks是Azure云平臺(tái)上的第一方服務(wù),用于構(gòu)建、部署、共享和維護(hù)企業(yè)級(jí)的數(shù)據(jù)解決方案,幫助用戶進(jìn)行大規(guī)模數(shù)據(jù)處理和使用機(jī)器學(xué)習(xí)。
Azure Databricks與Azure云平臺(tái)緊密結(jié)合,在Azure上通過PaaS方式提供服務(wù),按需計(jì)費(fèi),幫助用戶快速上線,解鎖數(shù)據(jù)價(jià)值。目前所有Azure的用戶都可以直接通過Azure Portal在北三區(qū)開通Azure Databricks服務(wù)。
Azure Databricks服務(wù)具有眾多優(yōu)點(diǎn),包括:
1 新一代Lakehouse湖倉架構(gòu)
Databricks Lakehouse將數(shù)倉ACID事務(wù)和數(shù)據(jù)治理與數(shù)據(jù)湖的靈活性和成本效益相結(jié)合,以開源數(shù)據(jù)標(biāo)準(zhǔn)將數(shù)據(jù)保存在對(duì)象存儲(chǔ)中,方便了數(shù)據(jù)的隨時(shí)調(diào)用,全面激活數(shù)據(jù)商業(yè)智能(BI)和機(jī)器學(xué)習(xí)(ML)。
2 性能強(qiáng)大
提供最新Photon Runtime高性能運(yùn)行時(shí),與Apache Spark API兼容,能夠更快地運(yùn)行SQL和DataFrame API調(diào)用,降低總成本。
3 開源對(duì)接
提供最新版本的Apache Spark,用戶可以與開源代碼庫無縫集成。
4 快速啟動(dòng)
可以在幾分鐘內(nèi)輕松設(shè)置和使用,無需擔(dān)心硬件和基礎(chǔ)架構(gòu)的問題。
5 簡化部署
自動(dòng)化Spark集群的創(chuàng)建管理,讓開發(fā)人員專注數(shù)據(jù)處理和機(jī)器學(xué)習(xí)任務(wù)。
6 一站式集成
與其他Azure服務(wù)優(yōu)化集成,如Azure Blob存儲(chǔ)、Azure SQL數(shù)據(jù)庫、Azure Data Lake及Azure Synapse Analytics等。用戶可以輕松地將數(shù)據(jù)存儲(chǔ)在云中,并使用其他服務(wù)進(jìn)行分析,滿足各種類型的數(shù)據(jù)工作負(fù)載。
7 全面的語言和框架支持
支持Python、Scala、R、Java和SQL,以及數(shù)據(jù)科學(xué)框架和庫,包括TensorFlow、PyTorch和scikit-learn等。
8 全面的安全、身份認(rèn)證和訪問控制
基于Azure企業(yè)級(jí)的安全防護(hù),與Azure活動(dòng)目錄(Azure AD)集成,提供基于角色的訪問控制,無需拼接單獨(dú)的身份驗(yàn)證方案,且身份和訪問管理可擴(kuò)展到解決方案內(nèi)的其他Azure服務(wù)。Azure Databricks還支持用戶在Azure Key Vault安全存儲(chǔ)、管理保密信息,降低安全信息丟失的可能性。
Azure Databricks的使用場景也多種多樣,全面支持?jǐn)?shù)據(jù)開發(fā)人員。Azure Databricks的常見使用場景包括:
構(gòu)建企業(yè)級(jí)數(shù)據(jù)湖倉
ETL和數(shù)據(jù)工程
機(jī)器學(xué)習(xí)、人工智能和數(shù)據(jù)科學(xué)
數(shù)據(jù)倉庫、分析和BI
數(shù)據(jù)治理和安全數(shù)據(jù)共享
DevOps、CI/CD和任務(wù)編排
實(shí)時(shí)和流數(shù)據(jù)分析
所有Azure用戶從即日起即可馬上登錄Azure門戶,創(chuàng)建新的Azure Databricks Workspace(工作區(qū))。在創(chuàng)建工作區(qū)后,就可使用Azure Databricks來開展數(shù)據(jù)處理和機(jī)器學(xué)習(xí)工作。
Azure Databricks是一個(gè)經(jīng)濟(jì)高效、功能強(qiáng)大的平臺(tái),每天都在幫助全球的開發(fā)人員高效地進(jìn)行大規(guī)模數(shù)據(jù)處理和機(jī)器學(xué)習(xí)。
Azure Databricks是Hadoop及所有Databricks工作負(fù)載的最佳遷移上云目的地,同時(shí)也大力增強(qiáng)了機(jī)器學(xué)習(xí)對(duì)大數(shù)據(jù)的處理能力。只需幾次點(diǎn)擊,數(shù)據(jù)團(tuán)隊(duì)就可以建立Azure Databricks工作區(qū),立即開始跨團(tuán)隊(duì)協(xié)作,收獲大數(shù)據(jù)的商業(yè)價(jià)值。