新BigQuery推薦器可提供用戶(hù)表格分區(qū)與分群優(yōu)化建議

來(lái)源:十輪網(wǎng)
作者:十輪網(wǎng)
時(shí)間:2023-06-01
2537
Google云計(jì)算推出BigQuery推薦器,通過(guò)分析工作負(fù)載和表格,協(xié)助用戶(hù)對(duì)表格進(jìn)行分區(qū)(Partitioning)或是分群(Clustering),以?xún)?yōu)化成本支出。

2023-05-30-3.00.40.jpg

Google云計(jì)算推出BigQuery推薦器,通過(guò)分析工作負(fù)載和表格,協(xié)助用戶(hù)對(duì)表格進(jìn)行分區(qū)(Partitioning)或是分群(Clustering),以?xún)?yōu)化成本支出。

所謂的資料表分區(qū),是將大表格分為多個(gè)區(qū)段,每個(gè)區(qū)段可包含特定時(shí)窗的資料,因此像是針對(duì)特定時(shí)間范圍的資料查詢(xún),BigQuery就僅需要查詢(xún)?cè)摃r(shí)間范圍的分區(qū),而不需要掃描整個(gè)表格。而分群則是根據(jù)用戶(hù)定義的字段,對(duì)表格進(jìn)行排序,因此當(dāng)用戶(hù)在查詢(xún)特定值的資料時(shí),BigQuery就可以快速定位包含該數(shù)值的資料區(qū)塊。

這兩種方法都可以提高特定類(lèi)型的查詢(xún)性能,像是使用過(guò)濾條件的查詢(xún),和對(duì)資料進(jìn)行聚合的查詢(xún)。

不過(guò),決定資料分區(qū)或是分群的最佳策略并不容易,尤其在大型數(shù)據(jù)庫(kù)中,優(yōu)化查詢(xún)工作變得非常復(fù)雜,每個(gè)表格可能包含數(shù)百萬(wàn)和數(shù)十億筆資料,要人工決定分區(qū)還是分類(lèi),不只需要專(zhuān)業(yè)知識(shí),還會(huì)耗費(fèi)大量時(shí)間。而且數(shù)據(jù)庫(kù)用戶(hù)具有不同的查詢(xún)需求,查詢(xún)觸及表格的不同部分和字段,要預(yù)測(cè)查詢(xún)模式進(jìn)行優(yōu)化,是一件困難的事。

BigQuery推薦器會(huì)分析過(guò)去30天每個(gè)項(xiàng)目的工作負(fù)載執(zhí)行情況,并尋找表格資料缺乏效率的掃描,通過(guò)減少不必要的資料掃描,減少成本并增加查詢(xún)速度。推薦器會(huì)運(yùn)用機(jī)器學(xué)習(xí)技術(shù),提供可以?xún)?yōu)化資料訪問(wèn)的建議。

推薦器主要會(huì)對(duì)大于100 Gb的表格分區(qū),10 Gb以上的表格則是提供分類(lèi)建議,官方提到,過(guò)小的表格的優(yōu)化效益不高,且成效難以預(yù)測(cè)。用戶(hù)要使用推薦器有幾種方式,除了直接在UI上操作,也可以在推薦器集成中心Recommendation Hub中以控制臺(tái)操作,或是使用推薦器API。

原文鏈接:點(diǎn)擊前往 >
版權(quán)說(shuō)明:本文內(nèi)容來(lái)自于十輪網(wǎng),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家