AWS開源文件客戶端Mountpoint,供用戶在本地文件系統(tǒng)掛載S3對象

來源:十輪網(wǎng)
作者:十輪網(wǎng)
時(shí)間:2023-03-17
1417
AWS開源適用于Amazon S3的文件客戶端MountpointAlpha測試版,Mountpoint以程序語言Rust開發(fā),能將本地文件系統(tǒng)的API調(diào)用,轉(zhuǎn)換成為S3對象的API調(diào)用,適合用于處理PB級資料,或是跨數(shù)千個(gè)執(zhí)行實(shí)例的讀取密集資料湖工作負(fù)載。

mountpoint-for-amazon-s3-local-file-system-command-line-tools-1024x511.jpg

AWS開源適用于Amazon S3的文件客戶端MountpointAlpha測試版,Mountpoint以程序語言Rust開發(fā),能將本地文件系統(tǒng)的API調(diào)用,轉(zhuǎn)換成為S3對象的API調(diào)用,適合用于處理PB級資料,或是跨數(shù)千個(gè)執(zhí)行實(shí)例的讀取密集資料湖工作負(fù)載。

AWS開發(fā)Mountpoint的原因,官方解釋,因?yàn)椴糠仲Y料湖用戶使用特定領(lǐng)域的工具,這些工具輸入和輸出皆為本地文件系統(tǒng)的文件,而不支持S3對象API。像是開源的Linux基因組學(xué)研究工具便需要對本地文件系統(tǒng)讀取定序資料,又或是機(jī)器學(xué)習(xí)訓(xùn)練工作管線,也需要在本地文件系統(tǒng)存儲檢查點(diǎn)文件。

用戶要將這些應(yīng)用串聯(lián)上S3可能是一件復(fù)雜的工作,又或是缺乏應(yīng)用程序的源碼,因此也無法完成這樣的目標(biāo)。Mountpoint是開源文件客戶端,能夠讓Linux應(yīng)用程序簡單地連接到S3存儲桶,并且使用文件API訪問對象,Mountpoint擅長處理需要平行讀取、生成大量S3資料,且不需要更新既有S3對象的任務(wù)。

Mountpoint使用戶能夠?qū)3存儲桶或是前綴,映射到執(zhí)行實(shí)例的文件系統(tǒng)命名空間,把存儲桶的內(nèi)容當(dāng)作本地文件一樣取用,對S3進(jìn)行GET和PUT操作,并且在不需要更改程序代碼和擔(dān)心性能配置下,就可達(dá)到每秒TB級的聚合吞吐量。

不過,Mountpoint畢竟不是通用網(wǎng)絡(luò)文件系統(tǒng),因此存在一些文件操作限制,目前Alpha測試版還不支持寫入對象,官方提到,未來Mountpoint也只會支持串行寫入新對象。因此需要執(zhí)行跨執(zhí)行實(shí)例或是用戶協(xié)作的共享文件應(yīng)用程序,AWS建議使用FSx或是EFS等全托管文件服務(wù)。

當(dāng)資料湖應(yīng)用程序不需要使用其他文件系統(tǒng)文件讀取大型對象,或是只需要對單一節(jié)點(diǎn)寫入對象,則Mountpoint便是可高性能訪問S3的好用工具。AWS目前已經(jīng)發(fā)布Mountpoint Alpha測試版,用戶可以在GitHub上取用程序代碼。

立即登錄,閱讀全文
AWS
原文鏈接:點(diǎn)擊前往 >
版權(quán)說明:本文內(nèi)容來自于十輪網(wǎng),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開掃一掃, 關(guān)注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
個(gè)人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家