微軟新推出的云計(jì)算數(shù)據(jù)和分析平臺(tái)名為Microsoft Fabric,是一套全面的工具,能夠使企業(yè)客戶(hù)存儲(chǔ)、管理和分析其最重要應(yīng)用程序的數(shù)據(jù)。該平臺(tái)還集成了滿(mǎn)足微軟公司所有數(shù)據(jù)用戶(hù)的產(chǎn)品,從處理數(shù)據(jù)的工程師到希望從數(shù)據(jù)中獲得見(jiàn)解并做出決策的分析師。
Microsoft Fabric目前處于公開(kāi)預(yù)覽模式,并將在未來(lái)幾個(gè)月更新更多功能,這讓許多事先沒(méi)有聽(tīng)取微軟公司簡(jiǎn)報(bào)的行業(yè)專(zhuān)家感到驚訝。一些人保留了自己的原先判斷,直到看到它確實(shí)在實(shí)踐中發(fā)揮重要作用。有些人稱(chēng)贊該平臺(tái)是一個(gè)重大進(jìn)步,可以幫助微軟公司超越亞馬遜和谷歌等其他云計(jì)算提供商,至少在為大型企業(yè)提供服務(wù)方面。分析人士稱(chēng),Microsoft Fabric也將給Snowflake公司和微軟公司的親密合作伙伴Databricks公司等其他科技供應(yīng)商帶來(lái)競(jìng)爭(zhēng)壓力。
調(diào)研機(jī)構(gòu)Forrester公司的分析師Noel Yuhanna說(shuō),“將所有這些功能結(jié)合在一起,微軟公司目前肯定比其他超大規(guī)模企業(yè)有一些優(yōu)勢(shì)?!?/p>
研究機(jī)構(gòu)Gartner公司聲稱(chēng),甚至在宣布這一消息之前,微軟就已經(jīng)成為數(shù)據(jù)和分析軟件領(lǐng)域的領(lǐng)導(dǎo)者。分析人士表示,微軟已經(jīng)將其產(chǎn)品的集成和易用性提升到了一個(gè)新的水平,這可能是其競(jìng)爭(zhēng)對(duì)手短期內(nèi)難以匹敵的。
分析師稱(chēng),Microsoft Fabric提供了主導(dǎo)產(chǎn)品,其關(guān)鍵在于執(zhí)行。亞馬遜公司的AWS云服務(wù)在總收入上仍明顯領(lǐng)先于微軟Azure,而且這種優(yōu)勢(shì)可能還會(huì)持續(xù)一段時(shí)間。在企業(yè)分析和數(shù)據(jù)領(lǐng)域,微軟的云產(chǎn)品目前在功能的廣度方面處于領(lǐng)先地位。Amalgam Insights公司的分析師Hyoun Park表示,“執(zhí)行能力通常是由銷(xiāo)售來(lái)定義的。因此,這個(gè)數(shù)字尚未得到證實(shí)?!?/p>
Microsoft Fabric的秘方:OneLake
那么是什么讓Microsoft Fabric脫穎而出呢?據(jù)分析人士稱(chēng),這是微軟用一個(gè)名為OneLake的數(shù)據(jù)湖簡(jiǎn)化和統(tǒng)一其數(shù)據(jù)架構(gòu)的方式,該數(shù)據(jù)湖可以存儲(chǔ)并允許訪(fǎng)問(wèn)來(lái)自不同來(lái)源和應(yīng)用程序的各種數(shù)據(jù)。
他們表示,這種方法將在節(jié)約成本、透明度、靈活性、管理和數(shù)據(jù)質(zhì)量方面為客戶(hù)帶來(lái)顯著好處。OneLake不僅被設(shè)計(jì)為微軟自己的軟件服務(wù)生成的數(shù)據(jù)的中心存儲(chǔ)庫(kù),而且還被設(shè)計(jì)為來(lái)自外部來(lái)源的數(shù)據(jù)的中心存儲(chǔ)庫(kù),例如第三方應(yīng)用程序。它還為用戶(hù)提供一致的體驗(yàn)和界面,無(wú)論數(shù)據(jù)的類(lèi)型或格式如何。這聽(tīng)起來(lái)似乎是一個(gè)顯而易見(jiàn)的想法,但對(duì)于包括微軟、亞馬遜和谷歌在內(nèi)的大多數(shù)云計(jì)算提供商來(lái)說(shuō),這一想法一直難以實(shí)現(xiàn)。
多年來(lái),這些科技巨頭已經(jīng)收購(gòu)或開(kāi)發(fā)了數(shù)十種用于各種數(shù)據(jù)和分析任務(wù)的軟件工具,例如商業(yè)智能、數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和實(shí)時(shí)流媒體,但他們?cè)诤艽蟪潭壬弦粤闼榈姆绞綄⑦@些工具拼湊在一起,而沒(méi)有創(chuàng)建一個(gè)連貫無(wú)縫的平臺(tái)。
因此,客戶(hù)必須處理復(fù)雜而分散的工具和數(shù)據(jù)庫(kù),每個(gè)工具和數(shù)據(jù)庫(kù)都有自己的資源配置、定價(jià)和數(shù)據(jù)池,這給客戶(hù)帶來(lái)了挫敗感,并降低效率,他們不得不花費(fèi)更多的時(shí)間和費(fèi)用來(lái)管理他們的數(shù)據(jù)基礎(chǔ)設(shè)施。它還對(duì)客戶(hù)征收“集成稅”,客戶(hù)要為每項(xiàng)服務(wù)的計(jì)算和存儲(chǔ)資源分別支付費(fèi)用。
Microsoft Fabric承諾通過(guò)提供真正的集成來(lái)消除這種復(fù)雜性——只包括一個(gè)數(shù)據(jù)副本、一種體驗(yàn)和一個(gè)接口。Amalgam公司的Park說(shuō),“這里的部分創(chuàng)新在于,微軟公司以一個(gè)集成包的形式提供了所有這些功能。雖然聽(tīng)起來(lái)很簡(jiǎn)單,但這并不是大多數(shù)數(shù)據(jù)和分析供應(yīng)商能夠提供的?!?/p>
Gartner公司的分析師Jason Medd對(duì)此表示認(rèn)同。他說(shuō),Gartner公司對(duì)首席數(shù)據(jù)官的調(diào)查顯示,只有約30%的首席數(shù)據(jù)官表示,他們從數(shù)據(jù)和分析工具中獲得了價(jià)值。通過(guò)整合工具和降低價(jià)格,微軟公司正在解決這些痛點(diǎn)。
OneLake數(shù)據(jù)湖是如何工作的
微軟公司是如何通過(guò)OneLake實(shí)現(xiàn)這種簡(jiǎn)單和統(tǒng)一的呢?關(guān)鍵是OneLake以一種稱(chēng)為Apache Parquet的通用格式存儲(chǔ)了來(lái)自微軟公司各種服務(wù)的所有數(shù)據(jù)的單一副本。這是一種在業(yè)界廣泛使用的開(kāi)源文件格式,它按列來(lái)組織數(shù)據(jù)。
這使得查詢(xún)和分析數(shù)據(jù)變得更加容易和快速。無(wú)論何時(shí),客戶(hù)向其系統(tǒng)添加或更新任何數(shù)據(jù),Microsoft Fabric都會(huì)自動(dòng)以Parquet格式將其保存在OneLake數(shù)據(jù)湖中,而不管其原始格式如何。這意味著客戶(hù)可以直接從OneLake訪(fǎng)問(wèn)和查詢(xún)他們的數(shù)據(jù),而不必通過(guò)多個(gè)來(lái)源或服務(wù)。
例如,如果客戶(hù)想要使用微軟公司的商業(yè)智能工具Power BI來(lái)分析來(lái)自微軟數(shù)據(jù)倉(cāng)庫(kù)Synapse的數(shù)據(jù),他們不必向Synapse發(fā)送查詢(xún)。Power BI只是從OneLake檢索數(shù)據(jù),這減少了跨服務(wù)的查詢(xún)數(shù)量,并降低了客戶(hù)的成本,客戶(hù)只需為單個(gè)存儲(chǔ)和數(shù)據(jù)存儲(chǔ)桶付費(fèi),而不必為多個(gè)存儲(chǔ)和數(shù)據(jù)桶付費(fèi)。
OneLake如何從外部來(lái)源獲取數(shù)據(jù)
OneLake的簡(jiǎn)潔性和統(tǒng)一性也延伸到了微軟生態(tài)系統(tǒng)之外的數(shù)據(jù)。這就是技術(shù)細(xì)節(jié)的問(wèn)題所在:OneLake以一種名為Delta Lake的開(kāi)源格式存儲(chǔ)其數(shù)據(jù)表,該格式創(chuàng)建了一層元數(shù)據(jù),可將來(lái)自各種來(lái)源(例如CSV或JSON文件)的原始數(shù)據(jù)轉(zhuǎn)換為可被業(yè)內(nèi)任何計(jì)算引擎分析的通用格式。
DBInsights公司的分析師Tony Baer在談到微軟公司擁抱開(kāi)源時(shí)說(shuō),“微軟在這方面做了正確的事情。”
他說(shuō),供應(yīng)商之間的競(jìng)爭(zhēng)不在于文件格式,而在于實(shí)現(xiàn)數(shù)據(jù)庫(kù)的準(zhǔn)確性和一致性標(biāo)準(zhǔn),即ACID。Fabric通過(guò)開(kāi)放格式進(jìn)行的集成就是朝著這個(gè)方向邁出的一步。微軟的數(shù)據(jù)工廠(chǎng)提供了150多個(gè)預(yù)先構(gòu)建的連接器,讓客戶(hù)可以輕松地從第三方服務(wù)轉(zhuǎn)換數(shù)據(jù)。
微軟公司也在研究自動(dòng)化轉(zhuǎn)換過(guò)程的方法,而不是依賴(lài)于傳統(tǒng)的、耗時(shí)的提取、轉(zhuǎn)換和加載(ETL)方法。
Microsoft Fabric還支持多云場(chǎng)景,而亞馬遜公司在這方面進(jìn)展緩慢。通過(guò)一項(xiàng)名為“快捷方式”的功能,OneLake可以在亞馬遜的S3存儲(chǔ)和谷歌的存儲(chǔ)(即將推出)中虛擬化數(shù)據(jù)存儲(chǔ)。
微軟Azure Data副總裁Arun Ulagaratchagan在接受行業(yè)媒體采訪(fǎng)時(shí)說(shuō):“既然要使用單一的開(kāi)放格式進(jìn)行共享,所有這些引擎都可以與數(shù)據(jù)原生協(xié)同工作,而不是碎片化?!彼硎?,微軟是第一個(gè)從完全受保護(hù)的格式轉(zhuǎn)向完全開(kāi)放的格式的主要云計(jì)算供應(yīng)商。
Ulagaratchagan說(shuō),在過(guò)去的幾年里,他與財(cái)富500強(qiáng)中的100家公司進(jìn)行了探討,他們最感興趣的是Fabric的低成本、易于使用和無(wú)鎖定的承諾。
Microsoft Fabric的集成工作耗時(shí)數(shù)年
微軟發(fā)布Microsoft Fabric這一舉措可能看起來(lái)很突然,但這是該公司四年多來(lái)打破孤島和整合其數(shù)據(jù)服務(wù)的成果,這還需要克服內(nèi)部政治和不同高管之間的斗爭(zhēng)。
其中一個(gè)里程碑是Synapse,它將多個(gè)服務(wù)(例如數(shù)據(jù)湖和數(shù)據(jù)倉(cāng)庫(kù))合并到一個(gè)中心。Microsoft Fabric是最終的集成,它將Synapse、Power BI和其他數(shù)據(jù)服務(wù)整合為一個(gè)單一的SaaS產(chǎn)品。
Blue Badge Insights公司行業(yè)顧問(wèn)Andrew Brust說(shuō),“我認(rèn)為這是一種跨越。它的功能是全面而有凝聚力的,這在以前是不可能的?!彼傅氖俏④浌驹贛icrosoft Fabric方面的舉動(dòng)。
Brust承認(rèn)自己有偏見(jiàn)。他表示,微軟公司是他的客戶(hù),他是微軟數(shù)據(jù)平臺(tái)的產(chǎn)品經(jīng)理,這使他成為在Microsoft Fabric發(fā)布之前了解Fabric的一群顧問(wèn)、客戶(hù)和合作伙伴中的一員。Brust還表示,微軟將Microsoft Fabric作為SaaS,而不是PaaS,這一點(diǎn)意義重大。這意味著數(shù)據(jù)工程師不必處理計(jì)算單元的供應(yīng),這簡(jiǎn)化了他們的工作。他認(rèn)為,亞馬遜和谷歌在這一領(lǐng)域還有很多工作要做。
數(shù)據(jù)質(zhì)量是贏得企業(yè)云競(jìng)賽的關(guān)鍵
分析人士還強(qiáng)調(diào),云計(jì)算提供商之間的主要競(jìng)爭(zhēng)是數(shù)據(jù)質(zhì)量,這是使客戶(hù)能夠獲得更好的見(jiàn)解并做出更好決策的因素。
Forrester公司的分析師Noel Yuhanna表示,他每天都會(huì)與三到四位企業(yè)客戶(hù)交談,他們抱怨遷移到云計(jì)算并沒(méi)有解決他們的數(shù)據(jù)質(zhì)量問(wèn)題。Yuhanna總結(jié)了大多數(shù)企業(yè)高管的觀(guān)點(diǎn),他說(shuō),“我們有計(jì)算,有存儲(chǔ),有Kubernetes。這很酷。但是我們真的使這個(gè)系統(tǒng)實(shí)現(xiàn)現(xiàn)代化了嗎?”他表示,這就是BearingPoint、Capgemini、Infosys和Wipro等系統(tǒng)集成商迄今為止通過(guò)云計(jì)算提供見(jiàn)解而獲利的原因。他們有自己的顧問(wèn),將根據(jù)數(shù)據(jù)編寫(xiě)報(bào)告。
這也是微軟公司推動(dòng)Microsoft Fabric的原因。Yuhanna表示,通過(guò)將數(shù)據(jù)源連接在一起,Microsoft Fabric提高了數(shù)據(jù)的一致性和可信度。他說(shuō),“數(shù)據(jù)復(fù)制的最大挑戰(zhàn)是數(shù)據(jù)到處都是,用戶(hù)無(wú)法再獲得一致的數(shù)據(jù)……Microsoft Fabric真的提供了數(shù)據(jù)的一致性?!?/p>
通過(guò)提供一個(gè)地方,就像提供了一個(gè)單一的窗口來(lái)查看數(shù)據(jù)管理。他說(shuō),“安全、治理、集成、發(fā)現(xiàn),這正是它的意義所在。”
如果客戶(hù)希望將安全規(guī)則應(yīng)用于他們的數(shù)據(jù),他們可以在OneLake完成大部分工作。微軟公司在發(fā)布的一份聲明中表示,所有訪(fǎng)問(wèn)數(shù)據(jù)的Microsoft Fabric下游應(yīng)用程序都必須遵守這些規(guī)則。例如,如果客戶(hù)在Power BI中有敏感的工資信息,他們只希望某個(gè)團(tuán)隊(duì)訪(fǎng)問(wèn),那么他們可以設(shè)置規(guī)則來(lái)確保這一點(diǎn)。無(wú)論文件被導(dǎo)出到哪里,它們都將遵循同樣的規(guī)則——甚至如果發(fā)送到Microsoft Fabric之外,也將遵循同樣的加密規(guī)則。
微軟趕上了Lakehouse的潮流
微軟公司落后于一些競(jìng)爭(zhēng)對(duì)手的領(lǐng)域之一是所謂的“Lakehouse”,它結(jié)合了兩種技術(shù):存儲(chǔ)企業(yè)數(shù)據(jù)的數(shù)據(jù)湖和分析數(shù)據(jù)的數(shù)據(jù)倉(cāng)庫(kù)。
由于人工智能等需要大量數(shù)據(jù)和分析的應(yīng)用程序的興起,Lakehouse變得流行起來(lái)。尤其是一家名為Databricks的公司,它一直是創(chuàng)建安全、開(kāi)放的“Lakehouse”的行業(yè)先驅(qū),許多分析師認(rèn)為這是行業(yè)領(lǐng)先的技術(shù)。畢竟,是Databricks公司創(chuàng)建了DeltaLake協(xié)議。
另一家供應(yīng)商Snowflake公司也提供了集成良好的Lakehouse產(chǎn)品。據(jù)報(bào)道,在Synapse品牌下,微軟公司在這一領(lǐng)域的產(chǎn)品表現(xiàn)不佳,微軟公司通過(guò)與Databricks公司建立密切的合作關(guān)系來(lái)彌補(bǔ)這一不足,Databricks公司在其Azure云平臺(tái)上提供支持。所以Microsoft Fabric也采用了DeltaLake協(xié)議也就不足為奇了。所有使用Databricks的客戶(hù)將繼續(xù)使用Microsoft Fabric。
分析師表示,Microsoft Fabric的整合也縮小了與Databricks公司和Snowflake公司的差距,并旨在超越它們。Microsoft Fabric將Databricks公司開(kāi)創(chuàng)的開(kāi)放格式擴(kuò)展到微軟數(shù)據(jù)棧的其余部分,這更加全面。雖然微軟公司的Ulagaratchagan表示,很高興通過(guò)與Databricks這樣的平臺(tái)合作,為客戶(hù)提供選擇,但他也明確表示,微軟的Synapse打算引領(lǐng)Lakehouse市場(chǎng)。他說(shuō),“我們確實(shí)打算成為最好的產(chǎn)品和最好的套件?!?/p>
分析人士說(shuō),微軟的單一體驗(yàn)和轉(zhuǎn)向SaaS產(chǎn)品,幫助Fabric的Synapse在一些關(guān)鍵方面取得了飛躍。Databricks仍然是一個(gè)PaaS產(chǎn)品,這意味著數(shù)據(jù)工程師仍然需要做更多的工作,并指定他們想要運(yùn)行處理作業(yè)的節(jié)點(diǎn)數(shù)量。
Microsoft Fabric將其在商業(yè)智能和數(shù)據(jù)科學(xué)方面的優(yōu)勢(shì)結(jié)合起來(lái),并增加了其他功能,例如模式檢測(cè)和工作流(Data Activator),這是一件大事,Amalgam的Park表示,將商業(yè)智能與人工智能結(jié)合起來(lái)對(duì)企業(yè)來(lái)說(shuō)仍然是一個(gè)挑戰(zhàn)。微軟公司正在提供一個(gè)軟件包,在更大程度上解決了這個(gè)問(wèn)題,超過(guò)了任何競(jìng)爭(zhēng)對(duì)手。
生成式人工智能的力量尚未實(shí)現(xiàn)
最后,微軟公司表示,正在利用其從OpenAI公司投資中獲得的生成式人工智能技術(shù)來(lái)增強(qiáng)其Copilot工具。Copilot可以幫助用戶(hù)執(zhí)行任務(wù),例如閱讀和匯總數(shù)據(jù)報(bào)告。借助OpenAI公司的技術(shù),Copilot現(xiàn)在可以讓開(kāi)發(fā)人員和分析師使用自然語(yǔ)言提出數(shù)據(jù)問(wèn)題,并以自然語(yǔ)言接收答案。微軟的Ulagaratchagan表示,雖然這將提高生產(chǎn)力,但在Microsoft Fabric產(chǎn)品中應(yīng)用生成式人工智能的全面影響還需要一段時(shí)間才能看到。
畢竟,Microsoft Fabric是客戶(hù)第一次體驗(yàn)到端到端的數(shù)據(jù)集成,他們還沒(méi)有探索生成式人工智能能夠做什么。
Ulagaratchagan說(shuō):“你可以認(rèn)為,它不僅僅是利用生成式人工智能加速客戶(hù)旅程中的一步,而是整個(gè)旅程,所以這是客戶(hù)尚未發(fā)現(xiàn)的機(jī)會(huì)。從客戶(hù)的實(shí)際使用情況中學(xué)習(xí),并獲得正確的體驗(yàn),這一點(diǎn)至關(guān)重要?!?/p>