治理企業(yè)“數(shù)據(jù)懸河”,阿里云 DataWorks 全鏈路數(shù)據(jù)治理新品發(fā)布

來(lái)源: ZAKER
作者:阿里云
時(shí)間:2021-10-27
16859
10 月 19 日,在 2021 年云棲大會(huì)上,阿里云重磅發(fā)布 DataWorks 全鏈路數(shù)據(jù)治理產(chǎn)品體系,基于數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)湖、湖倉(cāng)一體等多種大數(shù)據(jù)架構(gòu),DataWorks 幫助企業(yè)治理內(nèi)部不斷上漲的 數(shù)據(jù)懸河 ,釋放企業(yè)的數(shù)據(jù)生產(chǎn)力。

10 月 19 日,在 2021 年云棲大會(huì)上,阿里云重磅發(fā)布 DataWorks 全鏈路數(shù)據(jù)治理產(chǎn)品體系,基于數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)湖、湖倉(cāng)一體等多種大數(shù)據(jù)架構(gòu),DataWorks 幫助企業(yè)治理內(nèi)部不斷上漲的 " 數(shù)據(jù)懸河 ",釋放企業(yè)的數(shù)據(jù)生產(chǎn)力。

photo-1616587226157-48e49175ee20.JPG

阿里巴巴集團(tuán)副總裁 阿里云智能計(jì)算平臺(tái)事業(yè)部高級(jí)研究員賈揚(yáng)清現(xiàn)場(chǎng)分享

" 當(dāng)數(shù)據(jù)量變得越來(lái)越大,單位數(shù)據(jù)的價(jià)值會(huì)變得越來(lái)越小。全鏈路數(shù)據(jù)治理讓數(shù)據(jù)從低質(zhì)低效向高質(zhì)高效流動(dòng)。"

阿里巴巴集團(tuán)副總裁,阿里云智能計(jì)算平臺(tái)事業(yè)部高級(jí)研究員賈揚(yáng)清在現(xiàn)場(chǎng)表示。黃河泥沙的淤積使河床不斷抬高,形成了河高于地平面的 " 地上懸河 ",在河南開(kāi)封,最高的懸河達(dá)到 10 米,并且河床每年都會(huì)以 10 厘米的速度增高,而隨之而來(lái)的,兩邊的堤壩也在不斷地增高。在企業(yè)的數(shù)字化轉(zhuǎn)型中,數(shù)據(jù)量變得越來(lái)越大,機(jī)器變得越來(lái)越多,團(tuán)隊(duì)變得越來(lái)越大,數(shù)字化轉(zhuǎn)型真的變得越來(lái)越好嗎?對(duì)于企業(yè)來(lái)說(shuō),表象的繁榮不代表未來(lái)不會(huì)發(fā)生一場(chǎng) " 洪水 "。在阿里巴巴,雙 11 已經(jīng)成為了日常,2021 年大數(shù)據(jù)計(jì)算服務(wù) MaxCompute 的日常數(shù)據(jù)處理的水位線已經(jīng)超過(guò) 2020 年雙 11 的峰值,不斷增長(zhǎng)的數(shù)據(jù)量已經(jīng)造成了極大的成本與效率的壓力。

l 機(jī)器的效率 + 人的效率 = 數(shù)據(jù)的效率

面對(duì)每年如此膨脹的數(shù)據(jù),阿里巴巴的解法是通過(guò)大數(shù)據(jù) +AI 一體化平臺(tái)的能力,讓數(shù)據(jù)效率成為企業(yè)的核心指標(biāo)。在機(jī)器的效率層面,MaxCompute 作為離線數(shù)倉(cāng),單日數(shù)據(jù)處理量已經(jīng)達(dá)到 1.7EB,但是除了數(shù)據(jù)量,更應(yīng)該關(guān)注的是 MaxCompute 僅用 10% 的機(jī)器增長(zhǎng),就支撐了 75% 的數(shù)據(jù)量增長(zhǎng)。這里面是 MaxCompute 在底層的存儲(chǔ)和性能不斷地追求極致的優(yōu)化,并且連續(xù) 5 年打破 TPCx-BigBench 100TB 規(guī)模性能世界記錄。同時(shí) Hologres 作為實(shí)時(shí)數(shù)倉(cāng),峰值每秒寫(xiě)入 5.96 億條,單表存儲(chǔ)高達(dá) 2.5PB,基于萬(wàn)億級(jí)數(shù)據(jù)對(duì)外提供多維分析和服務(wù),99.99% 的查詢(xún)可以在 80ms 以?xún)?nèi)返回結(jié)果。Hologres 與 MaxCompute 組成離線、實(shí)時(shí)、分析、服務(wù)一體化的數(shù)據(jù)倉(cāng)庫(kù),從底層就極大地簡(jiǎn)化了大數(shù)據(jù)架構(gòu)的復(fù)雜度。機(jī)器層面的效率往往容易被衡量,但是人的效率卻很難被量化。DataWorks 從 2009 年開(kāi)始成為阿里巴巴集團(tuán)統(tǒng)一的大數(shù)據(jù)開(kāi)發(fā)治理平臺(tái),完成阿里巴巴數(shù)據(jù)中臺(tái)的搭建。對(duì)一個(gè)平臺(tái)的完善性與易用性,用戶(hù)往往會(huì)用腳投票。目前在 DataWorks 上構(gòu)建的大規(guī)模協(xié)同數(shù)據(jù)中臺(tái)的每日活躍用戶(hù)數(shù)已經(jīng)超過(guò) 5 萬(wàn),平均每 3 個(gè)阿里巴巴員工就有 1 個(gè)在使用 DataWorks,服務(wù)阿里巴巴內(nèi)部幾乎所有部門(mén),沉淀的全鏈路數(shù)據(jù)治理核心能力超過(guò)數(shù)百項(xiàng)。FY2020,阿里巴巴通過(guò)數(shù)據(jù)治理的綜合收益超過(guò) 10 億元,可以說(shuō)大數(shù)據(jù)開(kāi)發(fā)治理平臺(tái) DataWorks 與計(jì)算引擎 MaxCompute、Hologres 組成了大數(shù)據(jù)架構(gòu)下的 "Wintel 聯(lián)盟 ",共同提高企業(yè)數(shù)據(jù)的效率。

l 建設(shè)經(jīng)驗(yàn):從小作坊到大平臺(tái)到敏捷制造

數(shù)據(jù)治理也好、數(shù)據(jù)中臺(tái)也好,從來(lái)也不是一個(gè)從象牙塔里想出來(lái)的產(chǎn)品,而是經(jīng)過(guò)很多年磨出來(lái)的。阿里巴巴的數(shù)字化轉(zhuǎn)型也經(jīng)歷過(guò)刀耕火種的年代,每個(gè)業(yè)務(wù)團(tuán)隊(duì)維護(hù)多套 Hadoop 集群,像一個(gè)個(gè)小作坊:有什么用什么,需要什么加什么,各種技術(shù)組件像搭積木一樣逐漸堆砌起來(lái)。而在這個(gè)過(guò)程中,經(jīng)常會(huì)非常痛苦,平臺(tái)發(fā)布了一個(gè)新的功能,不知道什么原因把另一個(gè)組件搞掛了,然后技術(shù)人員花很長(zhǎng)時(shí)間去排查另一個(gè)組件有什么問(wèn)題,修復(fù)了一個(gè)組件,發(fā)布了一下,又把另一個(gè)搞掛了,問(wèn)題不斷冒出就像 " 按下葫蘆浮起瓢 ",好像永遠(yuǎn)沒(méi)有盡頭。于是,阿里巴巴開(kāi)始轟轟烈烈的平臺(tái)統(tǒng)一計(jì)劃,搭建起了大平臺(tái),把開(kāi)源的架構(gòu)改成自研的架構(gòu),數(shù)據(jù)逐漸都遷移到 MaxCompute 上。這個(gè)時(shí)候數(shù)據(jù)中臺(tái)的概念也開(kāi)始在集團(tuán)內(nèi)推廣,逐漸將 3 個(gè) ONE 的數(shù)據(jù)中臺(tái)方法論落地到 DataWorks,完成了阿里巴巴整個(gè)數(shù)據(jù)中臺(tái)的搭建。至此,從核心的電商天貓?zhí)詫?,到餓了么、優(yōu)酷、盒馬等各個(gè)業(yè)務(wù)團(tuán)隊(duì)都在同一套大平臺(tái)上進(jìn)行一站式的協(xié)同數(shù)據(jù)開(kāi)發(fā)。但是隨著大平臺(tái)的普及,使用的人數(shù)越來(lái)越多,數(shù)據(jù)的治理也會(huì)越變得更加復(fù)雜。在不斷產(chǎn)生成千上萬(wàn)張表中,企業(yè)無(wú)法知道有多少條不規(guī)范的語(yǔ)句像白蟻一樣正在消耗大量的計(jì)算資源;有多少?gòu)埍碚谥貜?fù)地被復(fù)制,制造表象的 " 數(shù)據(jù)繁榮 ";有多少臟數(shù)據(jù)在不斷生產(chǎn)污染數(shù)據(jù)的質(zhì)量;有多少?gòu)埍碚诒徊粩嗌暾?qǐng)權(quán)限使用,面臨數(shù)據(jù)安全的風(fēng)險(xiǎn)。這些問(wèn)題都對(duì)大平臺(tái)提出了嚴(yán)峻的挑戰(zhàn)。于是,大平臺(tái)逐漸往敏捷制造不斷演進(jìn),通過(guò)全鏈路的數(shù)據(jù)治理能力,以全局的視角進(jìn)行管控,并同時(shí)實(shí)現(xiàn)數(shù)據(jù)的決策的下放。

l DataWorks 全鏈路數(shù)據(jù)治理新品發(fā)布

2021 云棲大會(huì)全鏈路數(shù)據(jù)治理峰會(huì),DataWorks 在十二年積累的數(shù)百項(xiàng)數(shù)據(jù)開(kāi)發(fā)治理能力之上,重磅發(fā)布全鏈路數(shù)據(jù)治理新品。

數(shù)據(jù)治理中心

數(shù)據(jù)治理對(duì)于企業(yè)的大數(shù)據(jù)團(tuán)隊(duì),不單是一個(gè)技術(shù)問(wèn)題,更是組織和管理問(wèn)題。對(duì)于整個(gè)組織來(lái)說(shuō),如何來(lái)衡量數(shù)據(jù)治理最終的效果?如何更好地發(fā)揮組織的主動(dòng)性?在一些企業(yè)當(dāng)中,會(huì)成立了專(zhuān)門(mén)的數(shù)據(jù)委員會(huì),制定一些數(shù)據(jù)治理的規(guī)范,但是發(fā)現(xiàn)平臺(tái)并不能很好地支持這些規(guī)范,又或者說(shuō)企業(yè)購(gòu)買(mǎi)了一個(gè)數(shù)據(jù)平臺(tái),但是卻不知道如何通過(guò)平臺(tái)來(lái)完成數(shù)據(jù)治理的工作。在阿里巴巴內(nèi)部經(jīng)常會(huì)參考一個(gè)健康分的概念,從組織設(shè)計(jì)上,數(shù)據(jù)委員會(huì)下面有平臺(tái)團(tuán)隊(duì),業(yè)務(wù)團(tuán)隊(duì),以及風(fēng)控、財(cái)務(wù)等協(xié)同團(tuán)隊(duì)。那對(duì)于某個(gè)業(yè)務(wù)團(tuán)隊(duì)來(lái)說(shuō),會(huì)制定一個(gè)今年的目標(biāo)比如說(shuō)把健康分從 80 分提升為 90 分,從計(jì)算、存儲(chǔ)等方面入手,不單從業(yè)務(wù)側(cè)、生產(chǎn)側(cè)開(kāi)展治理優(yōu)化工作,有需求也會(huì)提給數(shù)據(jù)平臺(tái)團(tuán)隊(duì),對(duì)引擎和數(shù)據(jù)平臺(tái)產(chǎn)品進(jìn)行優(yōu)化演進(jìn),大家一起朝這個(gè)目標(biāo)努力。組織有了可測(cè)量的方式,這些部門(mén)就可以把這些數(shù)字放到自己的目標(biāo)里去。同時(shí)各類(lèi)的數(shù)據(jù)治理戰(zhàn)役,各個(gè)團(tuán)隊(duì)的比武等等長(zhǎng)效的運(yùn)營(yíng)工作,也可以通過(guò)健康分做不斷地延展,達(dá)到組織數(shù)據(jù)協(xié)同的目的,發(fā)揮數(shù)據(jù)治理組織的主動(dòng)性。

DataWorks 全新發(fā)布的數(shù)據(jù)治理中心,針對(duì)企業(yè)計(jì)算、存儲(chǔ)、研發(fā)、質(zhì)量、安全五個(gè)方面形成企業(yè)數(shù)據(jù)治理健康分,以問(wèn)題驅(qū)動(dòng)的理念,覆蓋事前、事中、事后的全鏈路主動(dòng)式數(shù)據(jù)治理和數(shù)據(jù)治理健康度評(píng)估。

企業(yè)的數(shù)據(jù)治理不再一個(gè) " 階段性項(xiàng)目 ",而是一個(gè) " 可持續(xù)的運(yùn)營(yíng)項(xiàng)目 "。

智能數(shù)據(jù)建模

企業(yè)建了一個(gè)平臺(tái),做了很多規(guī)范治理,對(duì)于業(yè)務(wù)人員的價(jià)值到底是什么?省了多少成本,治理了多少問(wèn)題,對(duì)于業(yè)務(wù)人員相對(duì)是無(wú)感的。業(yè)務(wù)方只希望更快地拿到想要的數(shù)據(jù),于是原先的數(shù)據(jù)倉(cāng)庫(kù)建設(shè)方式更多的是自底向上小步快跑,快速滿(mǎn)足需求為先。而如今的全鏈路數(shù)據(jù)治理,讓數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)向規(guī)范化,可持續(xù)發(fā)展方向演進(jìn),強(qiáng)調(diào)面向業(yè)務(wù)視角自頂向下進(jìn)行規(guī)范建模與面向開(kāi)發(fā)視角自底向上構(gòu)建數(shù)倉(cāng)雙管齊下。

DataWorks 全新發(fā)布智能數(shù)據(jù)建模,沉淀阿里巴巴數(shù)據(jù)中臺(tái)建設(shè)方法論,從數(shù)倉(cāng)規(guī)劃、數(shù)據(jù)標(biāo)準(zhǔn)、維度建模、數(shù)據(jù)指標(biāo)四個(gè)方面,以業(yè)務(wù)視角對(duì)業(yè)務(wù)的數(shù)據(jù)業(yè)務(wù)進(jìn)行詮釋。智能數(shù)據(jù)建模支持快速數(shù)據(jù)建模,包含正向建模與逆向建模,提供分鐘級(jí)的模型創(chuàng)建能力。同時(shí)打通數(shù)據(jù)開(kāi)發(fā),可以直接將數(shù)據(jù)模型發(fā)布到多個(gè)引擎,一鍵生成質(zhì)量規(guī)則,直接發(fā)布表并自動(dòng)生成 ETL 簡(jiǎn)代碼。企業(yè)的業(yè)務(wù)人員可以方便地了解數(shù)據(jù)全貌,快速獲取所需的數(shù)據(jù)指標(biāo)以及基于數(shù)據(jù)模型進(jìn)行數(shù)據(jù)分析和探查,企業(yè)內(nèi)所有的員可以實(shí)現(xiàn) " 數(shù)同 " 的快速理解與流通,讓數(shù)據(jù)決策可以實(shí)現(xiàn)真正有效的下放!

盒馬鮮生通過(guò) DataWorks 智能數(shù)據(jù)建模落地新零售行業(yè)數(shù)據(jù)模型 Rex-LDM

同時(shí),現(xiàn)場(chǎng)還發(fā)布了 DataWorks 數(shù)據(jù)集成實(shí)時(shí)同步能力、智能數(shù)據(jù)查詢(xún)、隱私安全計(jì)算、DataWorks 開(kāi)放平臺(tái)、數(shù)據(jù)作業(yè)遷云工具與遷云專(zhuān)家服務(wù)等多項(xiàng)功能。

中國(guó)信通院在 2021 年 9 月發(fā)布的《全球數(shù)字經(jīng)濟(jì)白皮書(shū)》報(bào)道,去年我國(guó)的數(shù)字經(jīng)濟(jì)規(guī)模已經(jīng)達(dá)到 5.4 萬(wàn)億美元,占比 GDP 近 1/3。在數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)已經(jīng)成為關(guān)鍵生產(chǎn)要素,就像在農(nóng)業(yè)經(jīng)濟(jì)時(shí)代和工業(yè)經(jīng)濟(jì)時(shí)代中,土地、勞動(dòng)力是關(guān)鍵的生產(chǎn)要素。DataWorks 通過(guò)智能數(shù)據(jù)建模、全域數(shù)據(jù)集成、高效數(shù)據(jù)生產(chǎn)、主動(dòng)數(shù)據(jù)管理、全面數(shù)據(jù)安全、快速數(shù)據(jù)服務(wù)六大全鏈路數(shù)據(jù)治理的能力,承載千行百業(yè)數(shù)字化轉(zhuǎn)型的可能。目前,DataWorks 已經(jīng)在數(shù)字政府、新金融、新零售、能源、工業(yè)、交通、游戲、教育、數(shù)字營(yíng)銷(xiāo)等行業(yè)落地?cái)?shù)千家客戶(hù)。國(guó)家電網(wǎng)大數(shù)據(jù)中心通過(guò) DataWorks 實(shí)現(xiàn)總部 +27 家?。ㄊ校┕?PB 級(jí)數(shù)據(jù)的統(tǒng)一管理,通過(guò)全鏈路數(shù)據(jù)中臺(tái)的治理與監(jiān)測(cè)運(yùn)營(yíng)體系,加快電網(wǎng)整體數(shù)字化轉(zhuǎn)型升級(jí)。創(chuàng)夢(mèng)天地基于開(kāi)源的 EMR 引擎,用 DataWorks 替換自研調(diào)度系統(tǒng),讓技術(shù)人員更加專(zhuān)注業(yè)務(wù),助力游戲行業(yè)的數(shù)據(jù)化運(yùn)營(yíng)。億滋中國(guó)通過(guò) DataWorks 智能數(shù)據(jù)建模進(jìn)行全鏈路的數(shù)據(jù)模型治理,極大提升數(shù)據(jù)中臺(tái)的自服務(wù)能,讓企業(yè)數(shù)據(jù)決策實(shí)現(xiàn)下放,釋放新零售的數(shù)字化力量。

企業(yè)數(shù)字化轉(zhuǎn)型正在進(jìn)入的深水區(qū)," 數(shù)據(jù)懸河 " 將逐漸成為企業(yè)的 " 達(dá)摩克斯之劍 ",阿里云正在與各行各業(yè)的客戶(hù)與合作伙伴一起,通過(guò)全鏈路數(shù)據(jù)治理,管得好數(shù)據(jù)、用得好數(shù)據(jù),讓數(shù)據(jù)向先進(jìn)生產(chǎn)力集聚!

立即登錄,閱讀全文
版權(quán)說(shuō)明:
本文內(nèi)容來(lái)自于ZAKER,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
阿里云助力《誅仙世界》端游正式開(kāi)服!
阿里云助力《誅仙世界》端游正式開(kāi)服!
近?,完美世界游戲歷時(shí)多年打造的新國(guó)?仙俠MMORPG端游《誅仙世界》在阿?云上正式開(kāi)服。
阿里云
云服務(wù)
2024-12-292024-12-29
一文詳解阿里云AI大基建
一文詳解阿里云AI大基建
面向AI時(shí)代,阿里云基礎(chǔ)設(shè)施是如何創(chuàng)新與發(fā)展的?計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、服務(wù)器、集群、可觀測(cè)等,阿里云全新升級(jí)的AI Infra到底有哪些重磅更新?
阿里云
云服務(wù)
2024-11-022024-11-02
AI時(shí)代云安全新范式,阿里云安全能力全線升級(jí)!
AI時(shí)代云安全新范式,阿里云安全能力全線升級(jí)!
AI時(shí)代,云安全面臨著新的挑戰(zhàn),不僅要持續(xù)面對(duì)以往的傳統(tǒng)問(wèn)題,更需要全新理念落地于產(chǎn)品設(shè)計(jì)、技術(shù)演進(jìn)、架構(gòu)設(shè)計(jì),才能實(shí)現(xiàn)效果、性能、和成本的最優(yōu)解。
AI
阿里云
云服務(wù)
2024-09-272024-09-27
連續(xù)四年!阿里云領(lǐng)跑中國(guó)公有云大數(shù)據(jù)平臺(tái)
連續(xù)四年!阿里云領(lǐng)跑中國(guó)公有云大數(shù)據(jù)平臺(tái)
近日,國(guó)際數(shù)據(jù)公司(IDC)發(fā)布《中國(guó)大數(shù)據(jù)平臺(tái)市場(chǎng)份額,2023:數(shù)智融合時(shí)代的真正到來(lái)》報(bào)告——2023年中國(guó)大數(shù)據(jù)平臺(tái)公有云服務(wù)市場(chǎng)規(guī)模達(dá)72.2億元人民幣,其中阿里巴巴市場(chǎng)份額保持領(lǐng)先,占比達(dá)40.2%,連續(xù)四年排名第一。
阿里云
云服務(wù)
2024-09-182024-09-18
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開(kāi)掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家