與AWS不同，谷歌云希望繼續(xù)走x86路線

來源：百家號

作者：云體驗師

時間：2021-07-09

后摩爾時代，通用處理器越來越不合時宜，越來越多的嘗試在讓軟件和硬件做更深入的配合，通俗地說，就是面向場景做優(yōu)化，與另起爐灶的AWS不同，谷歌打算讓x86面向特定場景做優(yōu)化，從僅有的信息來看，效果還不錯。

剛剛過去的十年中，CPU、GPU、FPGA以及ASIC的分工越來越明確，讓計算變得原來越專業(yè)化。好處是，在云計算的技術(shù)創(chuàng)新和商業(yè)競爭的推動下，企業(yè)可以根據(jù)自己的實際需求量體裁衣，尋找最（挑剔）合適的計算方式。

谷歌云最近發(fā)布的Tau實例也是一個很好的例子。Tau是一個希臘字符，表示的是黃金分割比。谷歌工程副總裁烏爾斯·赫茲勒（Urs Holzle）表示，這個名字表達(dá)了谷歌想面向特定負(fù)載實現(xiàn)計算、內(nèi)存和I/O之間一個恰到好處的平衡。t2d是一個Tau系列實例中的第一個，t2d使用的處理器都經(jīng)過了特殊調(diào)整，使得在一些非常特定的工作負(fù)載上能提供更好的性價比。t2d實例基于AMD的“米蘭”單路Epyc 7003處理器打造，該處理器最多可提供64個核心，但在t2d的實現(xiàn)中，用戶最多可激活60個內(nèi)核，還有4個內(nèi)核用來運(yùn)行KVM hypervisior以及存儲和網(wǎng)絡(luò)等功能。聽到這里，忍不住又想起了AWS的Nitro卡，阿里云神龍架構(gòu)的MoC卡，英偉達(dá)的DPU，還有前不久英特爾宣布推出的IPU。目前為止，谷歌并沒有自研專用硬件來運(yùn)行KVM hypervisior以及存儲和網(wǎng)絡(luò)等功能，從而讓所有核心全新全意運(yùn)行應(yīng)用負(fù)載，AWS的Nitro除了有自研的Nitro，還能讓改良版的KVM hypervisior運(yùn)行在Nitro上。不過，谷歌很有可能也有某種SmartNIC，它也可以O(shè)ffload一些存儲和網(wǎng)絡(luò)功能，不用非得是DPU那種。因為，我們看到Tau t2d實例的64個內(nèi)核中有60個內(nèi)核可用于運(yùn)行實際工作負(fù)載，如果谷歌沒有類似的Offload方案的話，運(yùn)行Hypervisior、存儲和網(wǎng)絡(luò)就需要占用大約30%的內(nèi)核。

谷歌通過運(yùn)行SPECrate2017_int_base整數(shù)基準(zhǔn)測試，對AWS的Graviton2實例和Azure的至強(qiáng)Cascade Lake實例做了一個對比，測試結(jié)果發(fā)現(xiàn)谷歌的t2d實例的性能比AWS的Graviton2實例高56%，性價比比AWS的Graviton2實例高42%，比Azure基于至強(qiáng)的方案表現(xiàn)就強(qiáng)的更多了。

下圖中是谷歌自己做的SPEC測試得到的性能對比數(shù)據(jù)：

下圖是性價比對比數(shù)據(jù)：

測試中，谷歌選擇的是AWS的Graviton2 m6g.8xlarge實例，32 vCPU和128GB內(nèi)存，成本是1.232美金每小時，Tau實例也是32vCPU，128GB內(nèi)存，成本是1.352美金每小時，雖然比AWS貴一點，但性能要高很多。

不過，目前還不清楚t2d上使用的AMD 64核米蘭的成本情況，但谷歌愿意強(qiáng)調(diào)的是性價比的提升。

另外，上圖測試中，谷歌選擇的是Azure的D32s_v4實例，32vCPU加128GB內(nèi)存，成本是1.536美金每小時。

D32s_v4實例使用的不是英特爾最新的Ice Lake至強(qiáng)可擴(kuò)展處理器，如果是Ice Lake的話，英特爾方案的性價比也會有所提升，與前兩者的差距應(yīng)該會有所縮小。

Azure從四月份就公開預(yù)覽的了新一代基于Ice Lake至強(qiáng)的主機(jī)——DS_v5，DS_v5也是32vCPU加128GB內(nèi)存的配置，但成本只有每小時0.768美金，性能方面，特別是單核原始整數(shù)性能方面在提升20%的同時，價格只有原來的一半，仔細(xì)對比一下，結(jié)果如下圖：

看起來，微軟可能在Ice Lake至強(qiáng)可擴(kuò)展處理器上拿到了非常大的折扣，微軟在Ice Lake 實例的發(fā)布細(xì)則中也提到，這是特殊的預(yù)覽版定價。

考慮這個價格水平，再考慮到從Cascade Lake到Ice Lake帶來的整數(shù)性能提升，Azure的Ice Lake主機(jī)才是性價比之王，所以這也就能理解為什么谷歌不用Azure的Ice Lake實例做對比了。

到此為止，可以肯定的是，谷歌肯定也算了一筆賬，谷歌也想知道微軟在這種性價比之下，最后要怎么定價，答案很可能是：每小時不到 1.00 美元。至于結(jié)果如何，我們且拭目以待吧。

競爭是好事兒，所有的云廠商都需要為怎么才能更省錢（怎么優(yōu)雅滴降價吸引客戶）展開技術(shù)競賽。

順便提一下，t2d相對于AWS主機(jī)56%的性能優(yōu)勢是因為使用了AMD優(yōu)化過的C/C++ (AOCC) 編譯器，該編譯器針對 Epyc（霄龍）架構(gòu)進(jìn)行了許多調(diào)整，就像英特爾編譯器針對其至強(qiáng)可擴(kuò)展處理器芯片進(jìn)行的優(yōu)化一樣。

谷歌也承認(rèn)，使用開源GCC 11 編譯器時，它的性能僅比 Graviton2 高了25%，所以說，有一半的性能優(yōu)勢來自編譯器，一半則來自芯片。之所以價格下降是因為 Tau 實例沒有將內(nèi)存配置拉滿，還可能有一些功能特性有所精簡。

以下是三個不同的主機(jī)在 CoreMark 基準(zhǔn)測試中的情況，CoreMark 基準(zhǔn)測試也是衡量 CPU 性能的一種比較常用的方法，然而，谷歌在這里只討論性價比數(shù)據(jù)：