利用rsync和云存儲網(wǎng)關(guān)備份文件到阿里云對象存儲

來源: 阿里云
作者:阿里云
時間:2021-03-29
17071
本文通過具體的實踐展示了利用rsync和云存儲網(wǎng)關(guān)將本地目錄備份到阿里云對象存儲的方案。

背景

隨著數(shù)字化在我們?nèi)粘I钪性絹碓礁叩谋戎?,各行各業(yè)不可避免的產(chǎn)生越來越多的數(shù)據(jù)。對于日益增多的數(shù)據(jù),我們都有著備份的需求。如果有一套方案能夠提供無限的存儲空間,可以存儲所有主機(jī)上的數(shù)據(jù)的備份,那么我們就再也無需擔(dān)心數(shù)據(jù)的增長了。阿里云對象存儲是一種海量、安全、低成本、高可靠的云存儲服務(wù),能夠完美契合我們的需求。而且通過將數(shù)據(jù)備份放在云端,本地就不再需要預(yù)留任何存儲空間給備份,可以大大提高本地存儲空間的利用效率。

如果我們想將數(shù)據(jù)從當(dāng)前主機(jī)定期備份到阿里云對象存儲,有沒有什么好的方法呢?我們可以利用rsync命令,rsync是linux下面的一個非常強(qiáng)大和高效的工具,可以在指定的源目錄和目標(biāo)目錄之間進(jìn)行數(shù)據(jù)的同步,并且能夠?qū)崿F(xiàn)增量備份。不過它的源端和目標(biāo)端都是目錄,而阿里云對象存儲的訪問協(xié)議是RESTFUL的接口,沒有辦法直接通過文件的協(xié)議進(jìn)行訪問。這時候就需要用到云存儲網(wǎng)關(guān)了,云存儲網(wǎng)關(guān)能夠?qū)ESTFUL的對象訪問協(xié)議轉(zhuǎn)換為傳統(tǒng)的NFS/SMB文件訪問協(xié)議,大大降低應(yīng)用對于對象存儲的適配。而且通過云存儲網(wǎng)關(guān)提供的文件接口進(jìn)行備份,源端文件的uid/gid之類的文件屬性在備份到OSS之后也不會丟失。接下來我們通過具體的實踐來展示整個數(shù)據(jù)備份的過程。

配置實踐

我們本地有一個/working的目錄,我們需要將這個目錄里面的數(shù)據(jù)備份到OSS存儲桶里面的/rsync/目錄里面。

[root@hz1 working]# ls

dir1 dir2 dir3

[root@hz1 working]# pwd

/working

我們首先創(chuàng)建了一個云存儲網(wǎng)關(guān)并創(chuàng)建了一個NFS共享。如果不熟悉云存儲網(wǎng)關(guān),可以參考如何在Linux上掛載OSS Bucket,里面詳細(xì)描述了創(chuàng)建網(wǎng)關(guān)NFS共享以及掛載的過程。下面就是我們創(chuàng)建的NFS共享,這里NFS共享的數(shù)據(jù)最終會存儲在OSS Bucket里面的rsync子目錄里面。

fd5789bb258d458ab0c5d1ccac54a261.png

在我們的主機(jī)上,云存儲網(wǎng)關(guān)的NFS共享的掛載點位于/oss,剛開始里面什么數(shù)據(jù)都沒有。

[root@hz1 /]# mount 172.16.0.241:/test-rsync /oss

[root@hz1 /]# ls /oss

[root@hz1 /]#

現(xiàn)在源端目錄和目的端目錄都已經(jīng)有了,接下來就該使用rsync進(jìn)行數(shù)據(jù)備份了。rsync功能很強(qiáng)大,但是使用起來卻非常簡單。通過下面的命令我們就可以進(jìn)行備份了。-r選項表示對源目錄進(jìn)行遞歸操作。-a選項表明備份的時候保留文件uid/gid/owner/mtime等基本的文件屬性,其中mtime屬性會被用來后續(xù)判斷增量。以/working或者/working/方式指定源目錄決定了目標(biāo)目錄里面是否包含working這個文件夾。下面的示例是不會在目的端生成working目錄的。

[root@hz1 ——]# rsync /working/ /oss -rav

sending incremental file list

working/dir3/

working/dir3/new_abc

sent 1,557 bytes received 46 bytes 1,068.67 bytes/sec

total size is 400 speedup is 0.25

執(zhí)行完上面的命令之后,我們看到/oss目錄下面已經(jīng)包含了源目錄里面的那些文件了。

[root@hz1 ——]# ls /oss

dir1 dir2 dir3 new_file

那么這些文件有沒有同步到OSS里面呢,我們打開阿里云OSS控制臺瀏覽相應(yīng)的目錄,可以看見這些文件無一例外的都已經(jīng)被上傳到了對應(yīng)的存儲桶里面。

8b76a651d18342a581eeaa49de3a4518.png

總結(jié)

我們前面展示了如何利用rsync將文件備份到阿里云對象存儲里面。不過在實際的使用中,還有一些需要關(guān)注的地方,結(jié)合下面幾點相信能滿足絕大多數(shù)用戶的需求了,有需要的小伙伴感覺來嘗試一下吧。

前面只是展示了單次的備份過程,如果想要定期備份怎么辦呢?答案很簡單,通過Linux Crontab定時任務(wù)就可以實現(xiàn)啦,網(wǎng)上相關(guān)的教程很多,這里就不做展開了。

rsync是單線程工作的,所以如果碰到數(shù)據(jù)的備份速度不能滿足需求的時候,可以通過起多個rsync進(jìn)程的方式來提升同步的速度,可以讓不同的rsync進(jìn)程處理不同的目錄。

rsync通過掃描所有源端文件和目標(biāo)端文件來比對從而發(fā)現(xiàn)增量。如果源端文件非常多,比如達(dá)到億級別或者更多,掃描本身會產(chǎn)生非常大的負(fù)擔(dān)。所以如果結(jié)合用戶自身的業(yè)務(wù)能夠直接導(dǎo)出增量文件或者目錄,然后指定rsync只負(fù)責(zé)處理這部分增量文件,那么勢必能大大減少備份的時間。

立即登錄,閱讀全文
版權(quán)說明:
本文內(nèi)容來自于阿里云,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
AI時代云安全新范式,阿里云安全能力全線升級!
AI時代云安全新范式,阿里云安全能力全線升級!
AI時代,云安全面臨著新的挑戰(zhàn),不僅要持續(xù)面對以往的傳統(tǒng)問題,更需要全新理念落地于產(chǎn)品設(shè)計、技術(shù)演進(jìn)、架構(gòu)設(shè)計,才能實現(xiàn)效果、性能、和成本的最優(yōu)解。
AI
阿里云
云服務(wù)
2024-09-272024-09-27
連續(xù)四年!阿里云領(lǐng)跑中國公有云大數(shù)據(jù)平臺
連續(xù)四年!阿里云領(lǐng)跑中國公有云大數(shù)據(jù)平臺
近日,國際數(shù)據(jù)公司(IDC)發(fā)布《中國大數(shù)據(jù)平臺市場份額,2023:數(shù)智融合時代的真正到來》報告——2023年中國大數(shù)據(jù)平臺公有云服務(wù)市場規(guī)模達(dá)72.2億元人民幣,其中阿里巴巴市場份額保持領(lǐng)先,占比達(dá)40.2%,連續(xù)四年排名第一。
阿里云
云服務(wù)
2024-09-182024-09-18
直降算力成本!阿里云容器計算服務(wù)ACS正式商業(yè)化
直降算力成本!阿里云容器計算服務(wù)ACS正式商業(yè)化
今日,阿里云容器計算服務(wù)ACS正式商業(yè)化,綜合算力成本最高可降55%。
阿里云
云服務(wù)
2024-08-242024-08-24
驕傲!全球一半人口看奧運,阿里云成功支撐史上最大規(guī)模電視網(wǎng)絡(luò)轉(zhuǎn)播
驕傲!全球一半人口看奧運,阿里云成功支撐史上最大規(guī)模電視網(wǎng)絡(luò)轉(zhuǎn)播
今年,云上轉(zhuǎn)播將正式超越衛(wèi)星轉(zhuǎn)播,成為奧運賽事走向全球數(shù)十億觀眾的主要轉(zhuǎn)播方式。巴黎奧運會11000小時的賽事直播畫面,通過阿里云向全球分發(fā)。這是1964年奧運會開始衛(wèi)星電視轉(zhuǎn)播以來,又一次重大技術(shù)進(jìn)步。
阿里云
2024-08-152024-08-15
優(yōu)質(zhì)服務(wù)商推薦
更多
個人VIP