Azure Database for PostgreSQL 中的節(jié)點(diǎn)和表–超大規(guī)模 (Citus)

來源: Microsoft Azure
作者:Microsoft Azure
時間:2021-02-01
16120
超大規(guī)模(Citus)承載類型允許Azure Database for PostgreSQL服務(wù)器(稱為節(jié)點(diǎn),)在無共享體系結(jié)構(gòu)中彼此協(xié)調(diào)。服務(wù)器組中的節(jié)點(diǎn)共同保存更多的數(shù)據(jù),并使用比單個服務(wù)器上的更多的CPU內(nèi)核。該體系結(jié)構(gòu)還允許通過向服務(wù)器組中添加更多節(jié)點(diǎn)來縮放數(shù)據(jù)庫。

Nodes

超大規(guī)模(Citus)承載類型允許Azure Database for PostgreSQL服務(wù)器(稱為節(jié)點(diǎn),)在"無共享"體系結(jié)構(gòu)中彼此協(xié)調(diào)。服務(wù)器組中的節(jié)點(diǎn)共同保存更多的數(shù)據(jù),并使用比單個服務(wù)器上的更多的CPU內(nèi)核。該體系結(jié)構(gòu)還允許通過向服務(wù)器組中添加更多節(jié)點(diǎn)來縮放數(shù)據(jù)庫。

協(xié)調(diào)器和輔助角色

每個服務(wù)器組都有一個協(xié)調(diào)器節(jié)點(diǎn)和多個輔助角色。應(yīng)用程序?qū)⑵洳樵儼l(fā)送到協(xié)調(diào)器節(jié)點(diǎn),該節(jié)點(diǎn)將其中繼到相關(guān)的工作線程并累計(jì)其結(jié)果。應(yīng)用程序無法直接連接到輔助角色。

超大規(guī)模(Citus)使數(shù)據(jù)庫管理員能夠在不同的工作節(jié)點(diǎn)上分發(fā)表,并存儲不同的行。分布式表是超大規(guī)模(Citus)性能的關(guān)鍵。如果無法分發(fā)表,則會將它們完全留在協(xié)調(diào)器節(jié)點(diǎn)上,并且無法利用跨計(jì)算機(jī)并行。

對于分布式表的每個查詢,協(xié)調(diào)器會將其路由到單個輔助角色節(jié)點(diǎn),或?qū)⑵洳⑿性诙鄠€節(jié)點(diǎn)上,具體取決于所需的數(shù)據(jù)是位于單個節(jié)點(diǎn)上還是在多個節(jié)點(diǎn)上。協(xié)調(diào)器通過咨詢元數(shù)據(jù)表確定要執(zhí)行的操作。這些表跟蹤輔助角色節(jié)點(diǎn)的DNS名稱和運(yùn)行狀況,以及跨節(jié)點(diǎn)分布的數(shù)據(jù)。

表類型

超大規(guī)模(Citus)服務(wù)器組中有三種類型的表,每個表在節(jié)點(diǎn)上以不同方式存儲,并用于不同目的。

類型1:分布式表

第一種類型,最常見的是分布式表。它們看起來像是SQL語句的普通表,但它們在工作節(jié)點(diǎn)之間水平分區(qū)。這意味著表中的行存儲在名為分片的碎片表中的不同節(jié)點(diǎn)上。

超大規(guī)模(Citus)只在整個群集中運(yùn)行SQL但DDL語句。更改分布式表的架構(gòu)會進(jìn)行級聯(lián)以更新所有表在工作線程中的分片。

分布列

超大規(guī)模(Citus)使用算法分片將行分配到分片。根據(jù)名為分布列的表列的值,賦值是明確的。群集管理員必須在分發(fā)表時指定此列。做出正確的選擇對性能和功能非常重要。

類型2:引用表

引用表是一種分布式表,其整個內(nèi)容將集中到單個分片中。分片在每個輔助角色上復(fù)制。對任何工作人員的查詢都可以在本地訪問引用信息,而無需從另一個節(jié)點(diǎn)請求行的網(wǎng)絡(luò)開銷。引用表沒有分布列,因?yàn)闊o需區(qū)分單獨(dú)的分片每行。

引用表通常很小,用于存儲與在任何輔助節(jié)點(diǎn)上運(yùn)行的查詢相關(guān)的數(shù)據(jù)。例如訂單狀態(tài)或產(chǎn)品類別等枚舉值。

類型3:本地表

使用超大規(guī)模(Citus)時,連接到的協(xié)調(diào)器節(jié)點(diǎn)是一個常規(guī)的PostgreSQL數(shù)據(jù)庫。可以在協(xié)調(diào)器上創(chuàng)建普通表,并選擇不分片。

對于本地表,最好是不參與聯(lián)接查詢的小型管理表。例如,應(yīng)用程序登錄和身份驗(yàn)證的用戶表。

分片

上一部分介紹了如何將分布式表存儲為輔助角色節(jié)點(diǎn)上的分片。本部分將討論更多技術(shù)詳細(xì)信息。

pg_dist_shard協(xié)調(diào)器的元數(shù)據(jù)表為系統(tǒng)中每個分布式表的每個分片都包含一行。該行將分片ID與(shardminvalue,shardmaxvalue)的哈??臻g中的整數(shù)范圍匹配。

SQL

SELECT*from pg_dist_shard;

logicalrelid|shardid|shardstorage|shardminvalue|shardmaxvalue

---------------+---------+--------------+---------------+---------------

github_events|102026|t|268435456|402653183

github_events|102027|t|402653184|536870911

github_events|102028|t|536870912|671088639

github_events|102029|t|671088640|805306367

(4 rows)

如果協(xié)調(diào)器節(jié)點(diǎn)要確定哪些分片包含一行g(shù)ithub_events,則將對該行中分布列的值進(jìn)行哈希處理。然后,該節(jié)點(diǎn)檢查哪些分片的'范圍包含哈希值。定義這些范圍是為了使哈希函數(shù)的圖像是其不相交的聯(lián)合。

分片放置

假設(shè)分片102027與相關(guān)行相關(guān)聯(lián)。在其中一個輔助角色中調(diào)用的表中讀取或?qū)懭朐撔術(shù)ithub_events_102027。哪個工作線程?這完全由元數(shù)據(jù)表確定。分片到輔助角色的映射稱為分片位置。

協(xié)調(diào)器節(jié)點(diǎn)將查詢重寫為引用特定表的片段,github_events_102027并在相應(yīng)的輔助角色上運(yùn)行這些片段。下面是在幕后運(yùn)行的查詢示例,用于查找包含分片ID 102027的節(jié)點(diǎn)。

SQL

SELECT

shardid,

node.nodename,

node.nodeport

FROM pg_dist_placement placement

JOIN pg_dist_node node

ON placement.groupid=node.groupid

AND node.noderole='primary'::noderole

WHERE shardid=102027;

輸出

┌─────────┬───────────┬──────────┐

│shardid│nodename│nodeport│

├─────────┼───────────┼──────────┤

│102027│localhost│5433│

└─────────┴───────────┴──────────┘ 

立即登錄,閱讀全文
版權(quán)說明:
本文內(nèi)容來自于Microsoft Azure,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點(diǎn),不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開掃一掃, 關(guān)注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
個人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家