騰訊云賀永紅:混合云存儲(chǔ)為大數(shù)據(jù)應(yīng)用提供更強(qiáng)便利性

來(lái)源:新浪財(cái)經(jīng)
作者:東方財(cái)富網(wǎng)
時(shí)間:2020-06-27
2506
企業(yè)數(shù)字化轉(zhuǎn)型過(guò)程中,數(shù)據(jù)價(jià)值被顯著放大,大數(shù)據(jù)應(yīng)用成為不少企業(yè)探索的重點(diǎn)。這其中,企業(yè)在綜合考量數(shù)據(jù)安全性、可擴(kuò)展、可管理和成本效益等因素后,混合云部署的方式就成為了企業(yè)的主流選擇。

1d1a-ivmqpci0411452.png

企業(yè)數(shù)字化轉(zhuǎn)型過(guò)程中,數(shù)據(jù)價(jià)值被顯著放大,大數(shù)據(jù)應(yīng)用成為不少企業(yè)探索的重點(diǎn)。

從技術(shù)上看,大數(shù)據(jù)業(yè)務(wù)由于數(shù)據(jù)體量大,且數(shù)據(jù)量很多時(shí)候呈急速膨脹狀態(tài);在進(jìn)行大數(shù)據(jù)計(jì)算分析時(shí),對(duì)資源的需求呈現(xiàn)浪涌式特征,又偶有突發(fā)性,因此通過(guò)上云充分發(fā)揮資源按需使用按需付費(fèi)的優(yōu)勢(shì),成為了不少企業(yè)在探索大數(shù)據(jù)應(yīng)用時(shí)的常見(jiàn)模式。

這其中,企業(yè)在綜合考量數(shù)據(jù)安全性、可擴(kuò)展、可管理和成本效益等因素后,混合云部署的方式就成為了企業(yè)的主流選擇。

近日,騰訊云存儲(chǔ)高級(jí)產(chǎn)品經(jīng)理賀永紅在混合云主題論壇上發(fā)表演講,詳解了大數(shù)據(jù)應(yīng)用上云的新思路。

一、企業(yè)自建大數(shù)據(jù)的難點(diǎn)

企業(yè)數(shù)據(jù)中心自建大數(shù)據(jù)業(yè)務(wù),一般會(huì)遇到擴(kuò)容的問(wèn)題,隨著大數(shù)據(jù)分析在業(yè)務(wù)價(jià)值挖掘上的作用愈加重要,新增及突發(fā)的分析任務(wù)越來(lái)越多,此時(shí),趨于飽和使用率的硬件資源便會(huì)成為瓶頸,從提交預(yù)算申領(lǐng)設(shè)備到新設(shè)備加入分析集群通常需要較長(zhǎng)時(shí)間(有時(shí)會(huì)超過(guò)一個(gè)月),這樣會(huì)也導(dǎo)致大數(shù)據(jù)計(jì)算結(jié)果延期交付。隨著時(shí)間推移,大數(shù)據(jù)中存儲(chǔ)的數(shù)據(jù)越來(lái)越多,如何降低數(shù)據(jù)的存儲(chǔ)成本,在需要的時(shí)候又能快速分析。

二、大數(shù)據(jù)混合云存儲(chǔ)之道

大數(shù)據(jù)混合云存儲(chǔ)將IDC大數(shù)據(jù)和公有云大數(shù)據(jù)連接為混合云,通過(guò)存算分離(計(jì)算與存儲(chǔ)分離),實(shí)現(xiàn)計(jì)算彈性伸縮;通過(guò)數(shù)據(jù)全生命周期自動(dòng)沉降實(shí)現(xiàn)存儲(chǔ)低成本。

852c-ivmqpci0875387.png

三、大數(shù)據(jù)混合云存儲(chǔ)中的關(guān)鍵技術(shù)

1.存算分離

存算分離,計(jì)算與存儲(chǔ)分離,計(jì)算基于標(biāo)準(zhǔn)HDFS協(xié)議訪問(wèn)存儲(chǔ),計(jì)算資源和存儲(chǔ)資源各自按需擴(kuò)容;計(jì)算資源可以分鐘級(jí)按需創(chuàng)建及銷毀,數(shù)據(jù)存儲(chǔ)在COS(Cloud Object Storage)https://cloud.tencent.com/product/cos」統(tǒng)一存儲(chǔ)層,集中存儲(chǔ)、統(tǒng)一管理。

a863-ivmqpci0875438.png

存算分離,讓數(shù)據(jù)存儲(chǔ)在云中對(duì)象存儲(chǔ)COS上,計(jì)算集群直接分析COS中的數(shù)據(jù),計(jì)算資源專注于計(jì)算,按需實(shí)現(xiàn)彈性伸縮,按需創(chuàng)建及銷毀,不用維持冗余設(shè)備來(lái)保存數(shù)據(jù);通過(guò)計(jì)算與存儲(chǔ)分離,實(shí)現(xiàn)計(jì)算彈性伸縮,按需創(chuàng)建及銷毀,可以節(jié)約大數(shù)據(jù)20-30%的成本。

2.高效存儲(chǔ)

存儲(chǔ)資源COS(Cloud Object Storage)海量、無(wú)容量上限、無(wú)需擴(kuò)容、按需供給,高效、平滑接入大數(shù)據(jù)生態(tài)、按需使用付費(fèi)、通過(guò)生命周期策略自動(dòng)沉降極致降低成本。

1cde-ivmqpci0875437.png

COS中存儲(chǔ)類型分為標(biāo)準(zhǔn)存儲(chǔ)、低頻存儲(chǔ)和歸檔存儲(chǔ),通過(guò)配置數(shù)據(jù)全生命周期策略實(shí)現(xiàn)自動(dòng)沉降:經(jīng)常訪問(wèn)的數(shù)據(jù)放在標(biāo)準(zhǔn)存儲(chǔ),較少訪問(wèn)的數(shù)據(jù)放在低頻存儲(chǔ),基本不訪問(wèn)的數(shù)據(jù)放在歸檔存儲(chǔ),以上三種存儲(chǔ)類型,價(jià)格不同,例如歸檔存儲(chǔ)刊例價(jià)就不到標(biāo)準(zhǔn)存儲(chǔ)刊例價(jià)的1/3,數(shù)據(jù)自動(dòng)沉降后成本節(jié)約20-30%。數(shù)據(jù)沉降歸檔后,能及時(shí)回?zé)幔枰玫臅r(shí)候能及時(shí)被計(jì)算集群訪問(wèn)。

3.統(tǒng)一管理

云上云下的統(tǒng)一管理,一致使用體驗(yàn);在數(shù)據(jù)面云上COS與IDC中HDFS統(tǒng)一元數(shù)據(jù)管理,實(shí)現(xiàn)全量數(shù)據(jù)ETL(抽取、轉(zhuǎn)換、裝載)。在技術(shù)面,云上和云下均采用大數(shù)據(jù)開源組件,接入大數(shù)據(jù)開源生態(tài),保持一致使用體驗(yàn)。

bdb4-ivmqpci0875480.png

4.數(shù)據(jù)高效流動(dòng)

云下與云上的數(shù)據(jù)流動(dòng),這里主要包括兩種數(shù)據(jù)流動(dòng)。

其一、數(shù)據(jù)在IDC與云上COS間快速水平流動(dòng);用戶每天可往云上COS灌入200TB+數(shù)據(jù),基于COS海量并發(fā)設(shè)計(jì),可進(jìn)一步加粗上傳管道,加速數(shù)據(jù)上云。數(shù)據(jù)下云,一般是結(jié)算結(jié)果返回到用戶IDC,這部分?jǐn)?shù)據(jù)量比較小,是從海量沙子里掏出的金子,不存在技術(shù)挑戰(zhàn)。

3af2-ivmqpci0875481.png

其二、數(shù)據(jù)在EMR「https://cloud.tencent.com/product/emr」計(jì)算與COS存儲(chǔ)間快速垂直流動(dòng),在EMR進(jìn)行大數(shù)據(jù)計(jì)算時(shí),需要在瞬間從COS中讀取大量數(shù)據(jù)到EMR中進(jìn)行計(jì)算,關(guān)鍵技術(shù)是COS的高性能,來(lái)滿足數(shù)據(jù)的快速讀寫。

四、騰訊云大數(shù)據(jù)混合云存儲(chǔ)實(shí)踐

騰訊云大數(shù)據(jù)混合云存儲(chǔ)方案,經(jīng)歷騰訊內(nèi)部業(yè)務(wù)(微信、QQ、騰訊視頻等)長(zhǎng)期打磨而沉淀下來(lái)。

騰訊云大數(shù)據(jù)混合云存儲(chǔ),包括三層:混合大數(shù)據(jù)引擎、任務(wù)統(tǒng)一編排、數(shù)據(jù)開發(fā)平臺(tái):數(shù)據(jù)開發(fā)平臺(tái)實(shí)現(xiàn)數(shù)據(jù)價(jià)值開發(fā),包括用戶畫像、廣告推薦等;任務(wù)統(tǒng)一編排實(shí)現(xiàn)大數(shù)據(jù)任務(wù)在IDC及云中全局調(diào)度及計(jì)算彈性伸縮;混合大數(shù)據(jù)引擎對(duì)IDC及云中大數(shù)據(jù)進(jìn)行管理。

2589-ivmqpci0875518.png

某頭部游戲直播公司,大數(shù)據(jù)體量大,很早就成立了近百人的專業(yè)大數(shù)據(jù)團(tuán)隊(duì),以支撐近百P規(guī)模的離線、實(shí)時(shí)流式數(shù)據(jù)的高效存儲(chǔ)計(jì)算及數(shù)據(jù)科學(xué)探索。

其大數(shù)據(jù)架構(gòu)如圖,左邊本地IDC,右邊騰訊云EMR ON COS,通過(guò)專線打通,數(shù)據(jù)互通,優(yōu)先上傳分析用到的數(shù)據(jù),將數(shù)據(jù)導(dǎo)入到騰訊云COS中;基于存算分離,通過(guò)騰訊云EMR產(chǎn)品創(chuàng)建的Hadoop集群分析已導(dǎo)入到COS中數(shù)據(jù)。分析任務(wù)結(jié)束后,銷毀EMR集群,不再產(chǎn)生費(fèi)用,COS數(shù)據(jù)自動(dòng)沉降進(jìn)一步降低成本。

67aa-ivmqpci0875520.png

五、結(jié)語(yǔ)

騰訊云大數(shù)據(jù)混合云,能夠?qū)崿F(xiàn)大數(shù)據(jù)業(yè)務(wù)平滑上云,并實(shí)現(xiàn)對(duì)已有IDC硬件資源的合理利用,實(shí)現(xiàn)業(yè)務(wù)彈性伸縮,實(shí)現(xiàn)存儲(chǔ)資源和計(jì)算資源的高效利用。

未來(lái),騰訊云存儲(chǔ)還將以業(yè)務(wù)場(chǎng)景為指引,推出更多高效的云存儲(chǔ)方案,并結(jié)合生態(tài)資源,為用戶提供更好的云上存儲(chǔ)服務(wù)。

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
文章來(lái)源:新浪財(cái)經(jīng)
版權(quán)說(shuō)明:本文內(nèi)容來(lái)自于新浪財(cái)經(jīng),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
騰訊云數(shù)據(jù)庫(kù)PostgreSQL全面支持PG 17
騰訊云數(shù)據(jù)庫(kù)PostgreSQL全面支持PG 17
即日起,騰訊云PostgreSQL全面支持PostgreSQL 17.0。所有用戶可使用大版本升級(jí)能力升級(jí)至最新的PostgreSQL 17.0進(jìn)行體驗(yàn),也可以在產(chǎn)品購(gòu)買頁(yè)直接購(gòu)買。
騰訊云
云服務(wù)
2024-12-15
高可用這個(gè)問(wèn)題,加機(jī)器就能解決?
高可用這個(gè)問(wèn)題,加機(jī)器就能解決?
互聯(lián)網(wǎng)服務(wù)的可用性問(wèn)題是困擾企業(yè)IT人員的達(dá)摩克利斯之劍:防于未然,體現(xiàn)不出價(jià)值。已然發(fā)生,又面臨P0危機(jī)。就更別提穩(wěn)定性建設(shè)背后顯性的IT預(yù)算問(wèn)題與隱性的人員成本問(wèn)題。
騰訊云
云服務(wù)
2024-11-25
TDSQL TDStore引擎版替換HBase:在歷史庫(kù)場(chǎng)景中的成本與性能優(yōu)勢(shì)
TDSQL TDStore引擎版替換HBase:在歷史庫(kù)場(chǎng)景中的成本與性能優(yōu)勢(shì)
HBase憑借其高可用性、高擴(kuò)展性和強(qiáng)一致性,以及在廉價(jià)PC服務(wù)器上的低部署成本,廣泛應(yīng)用于大規(guī)模數(shù)據(jù)分析。
騰訊云
云服務(wù)
2024-11-04
復(fù)雜查詢性能弱,只讀分析引擎來(lái)幫忙
復(fù)雜查詢性能弱,只讀分析引擎來(lái)幫忙
隨著當(dāng)今業(yè)務(wù)的高速發(fā)展,復(fù)雜多表關(guān)聯(lián)的場(chǎng)景越來(lái)越普遍。但基于行式存儲(chǔ)的數(shù)據(jù)庫(kù)在進(jìn)行復(fù)雜查詢時(shí)性能相對(duì)較弱。
騰訊云
云服務(wù)
2024-11-02
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家