Google進(jìn)一步強(qiáng)化BigQuery功能,不只提升BI引擎的性能,還加入具體化視圖圖(Materialized View,MV)功能,Google提到,BI引擎和MV功能,可進(jìn)一步擴(kuò)展他們的開放數(shù)據(jù)云端策略。
BigQuery是Google的云端數(shù)據(jù)倉儲服務(wù),用戶可以使用BigQuery來分析企業(yè)運(yùn)營數(shù)據(jù),以獲得一些業(yè)務(wù)上的數(shù)據(jù),像是預(yù)測客戶購買趨勢,或是下一季物流中心可處理的包裹數(shù)量。
最新的BI引擎版本,除了整合Looker或是Google的連接試算表(Connected Sheets),而且還可與其他第三方的BI工具搭配使用,包括Salesforce的Tableau、微軟的Power BI,甚至是其他客制化工具都可以。
Google提到,這項內(nèi)存內(nèi)分析服務(wù),讓用戶可以在Looker和Data Studio中,以交互式的方法,分析大型且復(fù)雜的數(shù)據(jù)集。在機(jī)構(gòu)上,Google使用分散式內(nèi)存執(zhí)行引擎,使得BI引擎操作速度更加快速。
BI引擎現(xiàn)在原生整合到BigQuery API中,任何BI工具的用戶,或是透過JDBC/ODBC連接到BigQuery API的自定義應(yīng)用程序,現(xiàn)在都可以在GCP專案中預(yù)留BI引擎容量,并且指定特定大小的內(nèi)存,進(jìn)而利用BI引擎的分析能力,而當(dāng)查詢需要使用超過預(yù)留的資源,則BI Engine會無縫地透過BigQuery Slots轉(zhuǎn)為混合模式。
Google提到,傳統(tǒng)的BI工具要求用戶將數(shù)據(jù),從數(shù)據(jù)倉儲平臺移動到數(shù)據(jù)市集或是BI平臺上,但這通常需要經(jīng)過復(fù)雜的ETL工作管線,而這些過程會增加分析報告的輸出時間,并且降低報告的新鮮度,而BI引擎可在BigQuery中就地分析數(shù)據(jù),就不需要移動數(shù)據(jù)或是創(chuàng)建工作管線。
而BigQuery新的具體化視圖圖功能,其實就是常用數(shù)據(jù)的快取副本,MV大幅提高常見和重復(fù)查詢的工作負(fù)載性能,且不需要用戶維護(hù),就能總是維持?jǐn)?shù)據(jù)新鮮度。BigQuery提供了可定期快取查詢結(jié)果的預(yù)訓(xùn)練視圖數(shù)據(jù),不只加快查詢性能,并且加速即時數(shù)據(jù)取用。