Google進(jìn)一步強(qiáng)化BigQuery功能,不只提升BI引擎的性能,還加入具體化查看圖(Materialized View,MV)功能,Google提到,BI引擎和MV功能,可進(jìn)一步擴(kuò)展他們的開放資料云計(jì)算策略。
BigQuery是Google的云計(jì)算數(shù)據(jù)倉庫服務(wù),用戶可以使用BigQuery來分析企業(yè)運(yùn)營資料,以獲得一些業(yè)務(wù)上的數(shù)據(jù),像是預(yù)測客戶購買趨勢,或是下一季物流中心可處理的包裹數(shù)量。
最新的BI引擎版本,除了集成Looker或是Google的連接試算表(Connected Sheets),而且還可與其他第三方的BI工具搭配使用,包括Salesforce的Tableau、微軟的Power BI,甚至是其他定制化工具都可以。
Google提到,這項(xiàng)內(nèi)存內(nèi)分析服務(wù),讓用戶可以在Looker和Data Studio中,以交互式的方法,分析大型且復(fù)雜的資料集。在架構(gòu)上,Google使用分布式內(nèi)存執(zhí)行引擎,使得BI引擎操作速度更加快速。
BI引擎現(xiàn)在原生集成到BigQuery API中,任何BI工具的用戶,或是通過JDBC/ODBC連接到BigQuery API的自定義應(yīng)用程序,現(xiàn)在都可以在GCP項(xiàng)目中預(yù)留BI引擎容量,并且指定特定大小的內(nèi)存,進(jìn)而利用BI引擎的分析能力,而當(dāng)查詢需要使用超過預(yù)留的資源,則BI Engine會無縫地通過BigQuery Slots轉(zhuǎn)為混合模式。
Google提到,傳統(tǒng)的BI工具要求用戶將資料,從數(shù)據(jù)倉庫平臺移動到資料市場或是BI平臺上,但這通常需要經(jīng)過復(fù)雜的ETL工作管線,而這些過程會增加分析報(bào)告的輸出時間,并且降低報(bào)告的新鮮度,而BI引擎可在BigQuery中本地分析資料,就不需要移動資料或是創(chuàng)建工作管線。
而BigQuery新的具體化查看圖功能,其實(shí)就是常用資料的緩存副本,MV大幅提高常見和重復(fù)查詢的工作負(fù)載性能,且不需要用戶維護(hù),就能總是維持資料新鮮度。BigQuery提供了可定期緩存查詢結(jié)果的預(yù)訓(xùn)練查看資料,不只加快查詢性能,并且加速即時資料取用。