久久99国产精品尤物|久久黄色视频二区|三级在线播放试看无码一区二区|国产综合在线观看精品12

電話:+86 574 88168918 郵(you)箱:sales@aliance.cn

首頁-新聞動態-新聞詳情

數據中心運營,云巨頭是如何修煉“內功”的?

發布時(shi)間:作者:cobinet 萬兆網絡模(mo)塊瀏覽:190次(ci)來源:
CobiNet(寧波)推薦文章:

亞馬遜云(yun)服務(AWS)是全(quan)(quan)球最大的云(yun)服務提供商,目前它在全(quan)(quan)球擁有24個地理區域,77個可用區(AZ)。如(ru)此(ci)龐大的云(yun)基礎設施是如(ru)何運維的,一直以來都備受(shou)業界關注,而多(duo)年來AWS很(hen)少談及(ji)這(zhe)個話題。

在(zai)今年的(de)(de)(de)(de)亞馬(ma)遜re:Invent在(zai)線(xian)峰會上,AWS首次揭(jie)開了自己云(yun)基礎設施的(de)(de)(de)(de)神(shen)秘面紗(sha),從的(de)(de)(de)(de)供電管理系統,云(yun)數據中心的(de)(de)(de)(de)延(yan)遲,到芯片的(de)(de)(de)(de)研發等等,雖然只(zhi)是冰山一(yi)角,但可以從不同的(de)(de)(de)(de)視角更加直觀(guan)、清晰的(de)(de)(de)(de)了解AWS是如(ru)何修煉 內功 的(de)(de)(de)(de)。

讓深(shen)度睡(shui)眠不再 奢侈

在AWS全(quan)球基礎(chu)架構和客戶支(zhi)持資深副總裁Peter DeSantis看來(lai), AWS保持如此龐大、復(fu)雜的云(yun)基礎(chu)設施的穩定性和可(ke)靠(kao)性沒(mei)有捷徑(jing),是(shi)靠(kao)一步一步的積累走出(chu)來(lai)的,必須對每個細(xi)節進行研究 。

對于負責數據中心運維的(de)工程師而言,充分的(de)睡眠是相(xiang)當 奢侈 的(de)東西,因為他們會(hui)時(shi)刻收(shou)到(dao)來自數據中心基礎(chu)設(she)施中的(de)各(ge)項報警郵件(jian)、短信等信息,Peter也(ye)不例外。

Peter通過(guo)數據中心(xin)的(de)(de)(de)(de)配電(dian)系(xi)(xi)統(tong)和UPS管理來展示(shi)其(qi)如何(he)通過(guo)良好(hao)的(de)(de)(de)(de)數據中心(xin)運維手段來保證自己的(de)(de)(de)(de)睡(shui)眠(mian)質量,十分形(xing)象。圖上的(de)(de)(de)(de)橫軸為云(yun)(yun)數據中心(xin)的(de)(de)(de)(de)復雜度,縱軸是破(po)壞(huai)半(ban)徑,當(dang)AWS云(yun)(yun)數據中心(xin)的(de)(de)(de)(de)發電(dian)機、配電(dian)系(xi)(xi)統(tong)和UPS復雜度越高,破(po)壞(huai)半(ban)徑系(xi)(xi)數越高的(de)(de)(de)(de)時(shi)候,Peter的(de)(de)(de)(de)睡(shui)眠(mian)質量就處于Insomnia的(de)(de)(de)(de)失眠(mian)狀態;而(er)當(dang)Peter通過(guo)優化AWS云(yun)(yun)數據中心(xin)基(ji)礎(chu)設施之(zhi)后,其(qi)睡(shui)眠(mian)質量得到了(le)明(ming)顯改善(shan),處于了(le)Deep Sleep深度睡(shui)眠(mian)的(de)(de)(de)(de)狀態。

Peter是如何做到(dao)的?總體來看,關于AWS云數據中(zhong)心運維可(ke)(ke)總結為可(ke)(ke)靠可(ke)(ke)控,降低管(guan)理復(fu)雜度。

AWS云數據中心的供電(dian)系統由發電(dian)機組(zu)、配電(dian)系統和(he)UPS等組(zu)件構(gou)成。AWS為其發電(dian)機組(zu)配備(bei)了冗(rong)余的發電(dian)機來提升可靠性(xing)。

相比(bi)于發(fa)電(dian)機可以通過冗余(yu)來作為基礎(chu)的思考,配電(dian)系(xi)統(tong)(tong)和UPS就要(yao)復雜的多。 不論是GE、ABB還是施(shi)耐德(de),它們的配電(dian)開關系(xi)統(tong)(tong)功(gong)能都很完善,但(dan)挑戰是對于AWS這樣的超大規模(mo)云數(shu)據(ju)中心(xin)而(er)言,并不是每(mei)個功(gong)能都適用 ,Peter坦(tan)言。

說(shuo)白了就是配(pei)電開(kai)關的(de)嵌(qian)入(ru)式軟件束(shu)縛(fu)了AWS數據中心運維的(de)手(shou)腳(jiao),而AWS憑借多年的(de)運維經驗(yan)很清楚(chu)哪(na)些功能適(shi)合,哪(na)些根本(ben)不需(xu)要。比如(ru)有(you)的(de)功能,AWS不需(xu)要;而有(you)的(de),AWS有(you)更加優(you)化的(de)方案(an)。

Peter總結(jie)了三(san)個方(fang)面:第(di)一(yi),當發現軟件系(xi)統的Bug,AWS工(gong)程師的響應(ying)很快,而等配(pei)(pei)電(dian)供應(ying)商去(qu)修改周期更長;第(di)二(er),有(you)些功(gong)能與實際用途不(bu)匹配(pei)(pei);第(di)三(san),AWS需要經常優化自己的管理系(xi)統、流(liu)程等,嵌入式軟件無法保證可(ke)控性。

基于此(ci),AWS重寫了配電控制(zhi)系(xi)統,從而為(wei)其配電系(xi)統帶來了可控性,運維也更加簡單。

同(tong)樣(yang)對UPS的控(kong)制系(xi)統,AWS也通(tong)過重寫(xie)UPS控(kong)制系(xi)統來(lai)滿足(zu)自身對功(gong)能(neng)的需求。Peter特別介紹了如(ru)何(he)為(wei)UPS電(dian)池(chi)減重,從而大大降低了UPS電(dian)池(chi)管理的復雜度。

標(biao)準的一兆瓦UPS電池(chi)重(zhong)達12000磅,AWS重(zhong)新定制(zhi)了UPS電池(chi),做成了5000瓦一個,可插拔(ba)(ba)的放入(ru)到(dao)機架中(zhong),并通過(guo)專有控(kong)制(zhi)系統來(lai)對UPS進(jin)行管理。這樣做的好處的顯然的, UPS電池(chi)單元體積和(he)重(zhong)量(liang)降低(di)后,破(po)壞半徑會降低(di),可插拔(ba)(ba)的方式讓工程師可秒級換掉損壞的UPS,運維復雜性大大降低(di) ,Peter說。

這(zhe)些是AWS設計(ji)基礎架(jia)構中最重要的(de)思維模式,思考(kao)它的(de)破壞半(ban)徑大概有多(duo)大,同時(shi)它的(de)復(fu)雜度有多(duo)大,從這(zhe)兩個維度想(xiang)辦法去提升運維穩定性(xing) ,Peter總結說(shuo)。這(zhe)也讓AWS云數據中心的(de)UPS的(de)冗余系統擁有了7個9的(de)可(ke)用性(xing),遠超行業的(de)平均(jun)水平。

一毫秒 是關鍵

從電商業務起家(jia)的(de)亞馬遜,最早(zao)的(de)數(shu)據中心位(wei)于美國(guo)(guo)西(xi)雅圖(tu),隨著業務的(de)發展,亞馬遜開始在(zai)美國(guo)(guo)多地建立數(shu)據中心,以滿足不(bu)斷增長的(de)數(shu)據規模和業務需要。

在數據中(zhong)(zhong)心(xin)(xin)的(de)(de)(de)(de)地(di)理位(wei)置(zhi)選擇上,亞馬遜(xun)會綜合考慮(lv)諸多(duo)自然條(tiao)件因素(su),比如(ru)(ru)雷電、龍卷風、海嘯、地(di)震等(deng),這就使得數據中(zhong)(zhong)心(xin)(xin)的(de)(de)(de)(de)之間(jian)的(de)(de)(de)(de)距離較(jiao)遠。Peter說,早期亞馬遜(xun)的(de)(de)(de)(de)數據中(zhong)(zhong)心(xin)(xin)之間(jian)有70毫秒的(de)(de)(de)(de)延(yan)遲,如(ru)(ru)何將數據中(zhong)(zhong)心(xin)(xin)之間(jian)的(de)(de)(de)(de)延(yan)遲降低(di)?于是(shi),亞馬遜(xun)考慮(lv)到(dao)數據中(zhong)(zhong)心(xin)(xin)之間(jian)數據傳輸,以及自然條(tiao)件的(de)(de)(de)(de)因素(su),找到(dao)了平衡的(de)(de)(de)(de)區域AZ概念,即(ji)在同(tong)一區域部(bu)署多(duo)個數據中(zhong)(zhong)心(xin)(xin)。

于(yu)(yu)是亞馬遜在(zai)(zai)2003年開始(shi)著(zhu)手(shou)考慮云(yun)(yun)業務AWS的(de)(de)時候(hou),首次提出了區域(yu)(Region)和可(ke)用區(AZ)的(de)(de)概念。區域(yu)英(ying)文名稱Region,是指云(yun)(yun)提供(gong)(gong)(gong)商(shang)的(de)(de)基(ji)礎設(she)施所(suo)(suo)覆蓋的(de)(de)范圍,比如你的(de)(de)云(yun)(yun)數(shu)據中心(xin)位(wei)于(yu)(yu)北美(mei)或(huo)者亞太,抑(yi)或(huo)歐洲。在(zai)(zai)《Gartner的(de)(de)云(yun)(yun)基(ji)礎設(she)施和平臺服務魔(mo)力象限(xian)》報告中,如果要(yao)參與評估,會要(yao)求云(yun)(yun)提供(gong)(gong)(gong)商(shang)在(zai)(zai)說(shuo)明格式中表述關于(yu)(yu)位(wei)置的(de)(de)要(yao)求: 按國家、公司(si)開展業務所(suo)(suo)用的(de)(de)語(yu)(yu)言(yan)和可(ke)提供(gong)(gong)(gong)技術(shu)支持的(de)(de)語(yu)(yu)言(yan)所(suo)(suo)劃分(fen)的(de)(de)數(shu)據中心(xin)位(wei)置,供(gong)(gong)(gong)應商(shang)必(bi)須(xu)在(zai)(zai)至少三個大洲擁有經過ISO27001審(shen)核(he)(或(huo)同等標準)的(de)(de)數(shu)據中心(xin)。 所(suo)(suo)以在(zai)(zai)一個區域(yu),云(yun)(yun)提供(gong)(gong)(gong)商(shang)會建設(she)一組數(shu)據中心(xin)。

可(ke)用(yong)區(qu)(qu)英文簡(jian)稱AZ是(shi)指(zhi)一(yi)個(ge)(ge)數(shu)據中(zhong)心,即在一(yi)個(ge)(ge)區(qu)(qu)域(yu)(Region)中(zhong)可(ke)包含(han)多個(ge)(ge)可(ke)用(yong)區(qu)(qu)(AZ),AWS為每個(ge)(ge)區(qu)(qu)域(yu)標(biao)配至少三個(ge)(ge)可(ke)用(yong)區(qu)(qu),比如AWS位于(yu)中(zhong)國的北(bei)京(jing)區(qu)(qu)域(yu)(光(guang)環新網運營(ying))和寧夏(xia)區(qu)(qu)域(yu)(西云(yun)數(shu)據運營(ying)),至少就(jiu)有6個(ge)(ge)數(shu)據中(zhong)心。

AZ之間的距離(li)在(zai)若干英(ying)里(li)或幾十英(ying)里(li)之間,這樣的距離(li)是保持數據中心(xin)延遲在(zai)一毫秒的關鍵 ,Peter說。

也就是說在保證(zheng)一毫秒關鍵的(de)(de)前提下,讓數(shu)據中(zhong)心(xin)(xin)之間的(de)(de)距離拉遠,來減小數(shu)據中(zhong)心(xin)(xin)的(de)(de)相互干擾,甚至是雷(lei)電等不可預測因素(su)同時給相近(jin)的(de)(de)數(shu)據中(zhong)心(xin)(xin)帶來相互影響。

在AZ的(de)設計上,AWS為(wei)數據中心(xin)配(pei)(pei)置獨立的(de)網(wang)絡,供配(pei)(pei)電系統,配(pei)(pei)線(xian)系統等。

所以,AZ之間盡量的(de)(de)互不干擾,獨(du)立系統,以及低(di)延(yan)遲等嚴苛因素的(de)(de)配(pei)置,不僅帶來的(de)(de)更(geng)好的(de)(de)冗余,也(ye)將破壞半徑的(de)(de)影響再次(ci)降低(di)。

如圖中所示,一個AWS區(qu)域,配備了(le)3個獨(du)立的可用區(qu),以及(ji)兩個網絡接入(ru)點(Transit Center)。

目(mu)前,AWS在24個(ge)(ge)地理區(qu)域擁有77個(ge)(ge)可(ke)用區(qu),并已公布計劃(hua)在澳大利亞、印度(du)、印度(du)尼西亞、日本、西班牙和瑞(rui)士新建(jian)6個(ge)(ge)AWS區(qu)域、18個(ge)(ge)可(ke)用區(qu) ,Peter說。

同時,除了可用區架構之外,AWS也會(hui)(hui)充分考慮人對數(shu)據(ju)中(zhong)心(xin)的影響。AWS數(shu)據(ju)中(zhong)心(xin)執(zhi)行嚴格的保(bao)密(mi)制度(du), AZ所(suo)在(zai)的位置是嚴格保(bao)密(mi)的,比如所(suo)有運往AZ的硬件(jian)設備(bei),都(dou)會(hui)(hui)首先運達一(yi)個(ge)中(zhong)轉中(zhong)心(xin),再由那里運往AZ所(suo)在(zai)的位置 ,AWS大中(zhong)華(hua)區產品部計算與存儲總監周(zhou)舸(ge)如是說。

云端 適用 的芯片設計

自從2015年(nian)亞馬遜收購Annapurna labs后(hou),AWS云上(shang)的芯片研發(fa)就在加速奔(ben)跑(pao)。如(ru)今(jin),其自研的Graviton2處(chu)理器(qi)已(yi)經(jing)上(shang)市,同(tong)時Nitro系統也演進(jin)了到了第(di)四代。

AWS是目前(qian)在(zai)云端唯一能夠提供支(zhi)持英特爾、AMD、英偉(wei)達和ARM處理器的云提供商,Nitro系統起了非常關鍵的作用 ,Peter說。

正是如此廣泛的(de)芯片(pian)支持,使得Amazon EC2計(ji)算(suan)(suan)實例(li),從2019年的(de)270種跨(kua)越到了(le)現(xian)在超過400種,并(bing)不斷給(gei)用戶帶來更具(ju)性價比的(de)計(ji)算(suan)(suan)實例(li)選擇。

在今年的re:Invent大會上,AWS發布了Amazon EC2 Mac實(shi)例(li),來支持(chi)2800萬Apple開發者(zhe)在云端(duan)構建(jian)macOS環境,并可(ke)(ke)以動態(tai)擴容,按需付費(fei);基(ji)于AWS Graviton 2處(chu)理器的C6gn實(shi)例(li),可(ke)(ke)提供100 Gbps的網(wang)絡性能,與當前基(ji)于x86的同類實(shi)例(li)相比(bi)(bi),性價(jia)比(bi)(bi)提高了40%。

而且,在(zai)Nitro系(xi)統的(de)(de)(de)加(jia)持下(xia),AWS專門為機(ji)器學習推出了滿足模型訓練和推理(li)的(de)(de)(de)高性(xing)價(jia)(jia)比芯片,比如使用AWS自(zi)研AWS Inferentia芯片的(de)(de)(de)Inf1實例,為機(ji)器學習推理(li)帶來最優的(de)(de)(de)性(xing)價(jia)(jia)比;以(yi)及(ji)剛(gang)(gang)剛(gang)(gang)發布的(de)(de)(de)全新(xin)機(ji)器學習訓練芯片AWS Trainium,與標準的(de)(de)(de)AWS GPU實例相比,可(ke)帶來30%的(de)(de)(de)吞(tun)吐(tu)量(liang)提升,以(yi)及(ji)降低(di)45%的(de)(de)(de)單次引用成(cheng)本。

為什么AWS自研(yan)了基于Arm架構的(de)芯(xin)片后,Graviton2很快在(zai)云端獲(huo)得了諸多用戶的(de)青睞(lai)?

Graviton 2處理器(qi)跨(kua)越(yue)到了更(geng)多的領域(yu),激活了整(zheng)個生態(tai)系統,很(hen)多基于Linux系統的應用(yong)都可(ke)以快速、簡單的轉到Graviton上 ,Peter說。

AWS在芯片設計上有自己(ji)的(de)(de)理(li)解, AWS要(yao)做(zuo)的(de)(de)是(shi)真(zhen)正滿(man)足云(yun)端(duan)性能而且省電的(de)(de)處理(li)器,這(zhe)是(shi)關鍵 ,Peter解釋(shi)說(shuo), 所以我們自研(yan)處理(li)盡(jin)量做(zuo)到多核,以及(ji)滿(man)足微服務的(de)(de)發(fa)展。

近年來,AWS在芯(xin)片上(shang)的每一次(ci)迭代(dai),都(dou)會給(gei)用戶帶來更優的計算實例(li)性價(jia)比,性能(neng)提升的同時,整體成本也(ye)大幅降低(di)。

在給(gei)用戶帶來(lai)高(gao)性價比芯片(pian)的(de)同時,通過(guo)自(zi)研芯片(pian)的(de)發展,AWS大(da)大(da)降(jiang)(jiang)低了(le)其云數據中心的(de)碳排放(fang),降(jiang)(jiang)幅達88%。

結語

Peter還提及(ji)(ji)了數(shu)(shu)據(ju)中(zhong)心采購供(gong)應鏈的(de)多元(yuan)化,以及(ji)(ji)數(shu)(shu)據(ju)中(zhong)心的(de)可再生(sheng)(sheng)能(neng)源對AWS云(yun)基礎設施(shi)的(de)影響。在2015年(nian),AWS云(yun)數(shu)(shu)據(ju)中(zhong)心中(zhong)4個關鍵(jian)組件的(de)供(gong)應商來自(zi)4個國家和地(di)區的(de)29個供(gong)應商,而在2020年(nian)已(yi)經變成7個國家和地(di)區的(de)86個供(gong)應商,多元(yuan)化夯實了AWS抵御(yu)風(feng)險的(de)能(neng)力;同時AWS也(ye)積極擁抱再生(sheng)(sheng)能(neng)源,如今的(de)規模已(yi)經達(da)到每(mei)年(nian)6.5GW,并承(cheng)諾在2025年(nian)實現(xian)100%使用再生(sheng)(sheng)能(neng)源。

文章編輯:CobiNet(寧波)  
本公司專注于電訊配件,銅纜綜合布線系列領域產品研發生產超五類,六類,七類屏蔽網線/屏蔽模塊及相關模塊配件, 光纖及配件,我們是萬兆屏蔽模塊10G屏蔽模塊屏蔽線生產廠家(jia),綜合布線實施公司。

歡迎來電咨詢0574 88168918,郵(you)箱sales@aliance.cn,網址aliance.cn

相關新聞

 

?2016-2019寧波科博通信技術有限公司版權所有