IT之家 12月12日消息,12月7日,亞馬遜AWS云服務(wù)出現(xiàn)宕機(jī),導(dǎo)致部分互聯(lián)網(wǎng)服務(wù)離線數(shù)小時(shí)。
近日,亞馬遜已經(jīng)查明了本次宕機(jī)的原因,一項(xiàng)自動(dòng)化過(guò)程導(dǎo)致了中斷,該中斷始于美國(guó)東部時(shí)間上午10:30左右。
據(jù)解釋稱(chēng),一項(xiàng)用于AWS主網(wǎng)絡(luò)中的自動(dòng)化容量擴(kuò)展服務(wù)出現(xiàn)錯(cuò)誤,觸發(fā)了內(nèi)部網(wǎng)絡(luò)大量客戶(hù)端的意外行為,這導(dǎo)致連接活動(dòng)大量涌現(xiàn),使內(nèi)部網(wǎng)絡(luò)和AWS主網(wǎng)絡(luò)之間的網(wǎng)絡(luò)設(shè)備不堪重負(fù),并最終導(dǎo)致網(wǎng)絡(luò)之間的通信延遲。
這個(gè)錯(cuò)誤甚至影響了亞馬遜修復(fù)該問(wèn)題的能力,它阻止了運(yùn)營(yíng)團(tuán)隊(duì)使用實(shí)時(shí)監(jiān)控系統(tǒng)和內(nèi)部控制,不得不使用日志來(lái)查明發(fā)生了什么。亞馬遜指出,服務(wù)啟動(dòng)直到美國(guó)東部時(shí)間下午4:34才開(kāi)始改進(jìn),問(wèn)題在美國(guó)東部時(shí)間下午5:22完全解決。
IT之家了解到,由于亞馬遜的支持聯(lián)絡(luò)中心也在AWS網(wǎng)絡(luò)上運(yùn)行,因此客戶(hù)在中斷期間的七個(gè)小時(shí)內(nèi)無(wú)法創(chuàng)建支持案例,亞馬遜服務(wù)健康儀表板也受到影響。
亞馬遜表示,它正在努力改進(jìn)對(duì)中斷的響應(yīng),并計(jì)劃發(fā)布服務(wù)健康儀表板的改進(jìn)版本,如果發(fā)生中斷,應(yīng)該可以幫助客戶(hù)及時(shí)收到更新。