Aastaid, luguandmekeskusenergiatarbimine järgis prognoositavat kaaret. Digitaliseerumine kasvas kindlasti, kuid paremate serverite, virtualiseerimise ja pilve konsolideerimise tõhususe kasv hoidis kogu elektritarbimise üllatavalt madalal tasemel. Ülemaailmne andmekeskuste võimsusnõudlus püsis kümne aasta jooksul ligikaudu 1 protsendi ulatuses kogu elektritarbimisest – ligikaudu 200 teravatt-tundi aastas.
See ajastu on lõppemas.
Generatiivse tehisintellekti, krüptovaluutade kaevandamise, servaarvutite lähenemine ja ühendatud seadmete eksponentsiaalne kasv on murdnud vana efektiivsuskõvera. Tööstusharu hinnangud näitavad nüüd, et andmekeskuste võimsusnõudlus kasvab aastamääraga, mida pole nähtud alates 2000. aastate algusest. Mõnes piirkonnas – Iirimaa, Põhja-Virginia, Singapur – annavad andmekeskused juba 15–25 protsenti kogu elektritarbimisest, mis sunnib reguleerivaid asutusi kehtestama uutele ehitustele moratooriumi.
Selle taustal on kunagi tehniliste detailidena tundunud infrastruktuurivalikud – jahutusarhitektuur, voolujaotuse topoloogia, riiulitiheduse planeerimine – muutunud koosolekuruumi otsusteks. Energiakulu ei ole enam reaartikkel. See on kasvupiirang.
Power Usage Effectiveness ehk PUE on olnud andmekeskuste tööstuse standardne tõhususe mõõdik peaaegu kaks aastakümmet. See on lihtne suhe: rajatise koguvõimsus jagatud IT-seadmete võimsusega.
PUE 2,0 tähendab, et iga serverite ja salvestusruumi toitega vati kohta läheb veel üks vatt jahutus-, valgustus-, toitekadudele ja muudele üldkuludele. PUE 1,2 tähendab, et üldkulud tarbivad ainult 0,2 vatti IT-vati kohta.
Tööstusharu on laialdaselt aktsepteeritud PUE-l põhinevad tasemed.
| Tase | PUE | DCiE | Mida see tähendab |
|---|---|---|---|
| Plaatina | <1.25 | >0,80 | Maailmatasemel tõhusus, nõuab tavaliselt vabajahutust või vedelikjahutust |
| Kuldne | 1.25 – 1.43 | 0,70 – 0,80 | Väga tõhus, tänapäevase disainiga saavutatav mõõdukas kliimas |
| Hõbedane | 1,43 – 1,67 | 0,60 – 0,70 | Vastuvõetav vanemate rajatiste või soojema kliima jaoks |
| Pronks | 1.67 – 2.00 | 0,50 – 0,60 | Tüüpiline pärandandmekeskuste jaoks, kus pole suuri ümberehitusi |
| Õiglane | 2.00 – 2.50 | 0,40 – 0,50 | Kehv efektiivsus, kõrged tegevuskulud |
| Vaene | >2.50 | <0,40 | Kriitiline ebaefektiivsus, nõuab tõenäoliselt viivitamatut tähelepanu |
Probleem on selles, et paljud organisatsioonid ei tea tegelikult oma PUE-d. Nad hindavad. Nad arvavad. Või nad mõõdavad ainult peamise kommunaalarvesti juures ja eeldavad ülejäänu.
2023. aasta tööstusuuringust selgus, et peaaegu 40 protsenti andmekeskuste operaatoritest polnud kunagi mõõtnud PUE-d püstiku tasemel. Nende seas, kes seda tegid, oli erinevus teatatud ja tegeliku PUE vahel keskmiselt 0,3 punkti – piisav, et viia üksus kuldselt hõbedale ilma, et keegi seda märkaks.
PUE nii suure varieeruvuse mõistmine algab sellest, kui uurida, kust andmekeskusest toide väljub.
Tüüpilises õhkjahutusega seadmes, mille PUE on umbes 1,8, näeb jaotus välja ligikaudu järgmine:
Jahutuskoormus on suurim muutuja. Mõõduka kliimaga rajatis, mis kasutab tasuta jahutamiseks välisõhku, võib kulutada jahutamisele vaid 15 protsenti oma mitte-IT-energiast. Sama aastaringse mehaanilise jahutusega troopilises kliimas asuv rajatis võib kulutada 40 protsenti.
Seetõttu reklaamivad kolokatsiooniteenuse pakkujad PUE-d rajatise tasemel, kuid edastavad PUE-d kliendiarvestis – erinevad numbrid, erinevad tagajärjed. Klient maksab selle kõige eest.
Traditsiooniline andmekeskuse haldamine eeldas suhteliselt staatilist keskkonda. Riiulid täideti kuude või aastate jooksul. Jahutust sai reguleerida aeglaselt. Elektrijaotus oli esimesest päevast peale liiga suur.
Pilveajastu muutis eeldusi. Riiulid täituvad nüüd päevadega. Töökoormused nihkuvad serverite vahel automaatselt. Suure tihedusega AI-klastrid võivad tarbida kolm korda rohkem võimsust kui külgnevad üldotstarbelised arvutusriiulid.
Need muudatused on sundinud infrastruktuuri haldamist ümber mõtlema. Kolm suundumust paistavad silma.
Esiteks suureneb tihedus ebaühtlaselt.Tavaline serveririiul kümme aastat tagasi tõmbas 5-8 kilovatti. Tänapäeval tarbivad üldotstarbelised nagid 10-15 kilovatti. Suure jõudlusega andmetöötluse ja AI-treeningu riiulite võimsus ületab tavaliselt 30 kilovatti riiuli kohta. Mõned üle 50 kilovatti.
See tekitab soojusjuhtimise probleeme, mida õhkjahutusel on raske lahendada. Kui võimsus on 20 kilovatti püstiku kohta, jääb õhkjahutus tõhusaks ka korraliku isolatsiooni korral. 30 kilovati juures muutub see marginaalseks. Kui võimsus on 40 kilovatti ja rohkem, liigub vedelikjahutus valikulisest vajadusest.
Teiseks on suutlikkuse planeerimine muutunud ennustavaks.Vana meetod – ostke rohkem võimsust kui vaja ja laske sellel jõude olla – ei tööta enam mastaapselt. Tühikäigul on nii kapitalikulud kui ka jooksvad hoolduskulud.
Kaasaegsed infrastruktuurihaldussüsteemid kasutavad ajaloolisi andmeid ja töökoormuse prognoosi, et ennustada, millal toide, jahutus või riiuliruum otsa saab. Parimad süsteemid oskavad soovitada, kas konfigureerida ümber olemasolev võimsus või tellida uus riistvara, päevi või nädalaid enne, kui piirang muutub kriitiliseks.
Kolmandaks on nähtavusnõuetel ntpaned.Traditsiooniline andmekeskus võib jälgida võimsust PDU tasemel. Kaasaegne rajatis vajab nähtavust püstiku tasemel, mõnikord serveri tasemel ja üha enam töökoormuse tasemel – teades, milline virtuaalmasin või konteiner millist energiat kasutab.
Andmekeskuse infrastruktuurHaldustarkvara (DCIM) on eksisteerinud üle kümne aasta, kuid kasutuselevõtt on endiselt ebaühtlane. Vähem kui pooled ettevõtete andmekeskustest on juurutanud täieliku DCIM-süsteemi. Paljud neist kasutasid vaid murdosa oma võimalustest.
Õigesti rakendatud DCIM-süsteem teeb nelja asja:
Varahaldus.Iga serverit, lülitit, PDU-d ja jahutusseadet jälgitakse konfiguratsioonihalduse andmebaasis (CMDB). Asukoht, võimsus, võrguühendused, hooldusajalugu – kõik see. See kõlab lihtsalt, kuid paljud organisatsioonid jälgivad varasid endiselt arvutustabelites, mille värskenduste vahel kulub kuid.
Reaalajas jälgimine.Energiatarve PDU või riiuli tasemel, temperatuur ja niiskus toite- ja tagasivoolupunktides, jahutussüsteemi olek, UPS-i aku seisund. Häired käivituvad, kui parameetrid erinevad seadeväärtustest. Eesmärk on avastada probleemid enne, kui need põhjustavad seisakuid.
Võimsuse planeerimine.Süsteem teab, kui palju võimsust ja jahutusvõimsust on saadaval, kui palju seda kasutatakse ja kui palju on reserveeritud tulevaseks kasutuselevõtuks. See võib modelleerida uue suure tihedusega riiuli lisamise või vanemate serverite komplekti eemaldamise mõju.
Visualiseerimine.Andmekeskuse digitaalne kaksik – riiulite kaupa, plaatide kaupa – näitab hetkeolukordi ja võimaldab operaatoritel muudatusi simuleerida. 10 kilovatti koormuse lisamine kolmandale reale neljandale veerule: kas see ületab jahutusvõimsust? Süsteem vastab enne, kui keegi seadmeid liigutab.
Andmekeskuse energiatarbimise vähendamine pole müstiline. Meetodid on hästi arusaadavad. Väljakutse on rakendamise distsipliin.
Tõstke sissepuhkeõhu temperatuuri.Enamikes andmekeskustes on külm – 18–20 kraadi Celsiuse järgi jahutusseadme tagasivoolul –, sest seda on operaatorid alati teinud. ASHRAE juhised soovitavad nüüd 24–27 kraadi. Iga kraadi suurendamine vähendab jahutusenergiat ligikaudu 4 protsenti. 20 kraadi asemel 26 kraadiga jooksmine säästab 20-25 protsenti jahutusvõimsust.
Kõrvaldage kuuma ja külma õhu segunemine.Kuuma vahekäigu tõkestus, külma vahekäigu tõkestus või vertikaalsed väljatõmbekanalid sunnivad jahutusõhku minema sinna, kus seda vajatakse, selle asemel, et lühikest tsüklit läbi riiulite esiosa liikuda. Ainuüksi piiramine vähendab jahutusenergiat tavaliselt 15-25 protsenti.
Kasutage muutuva kiirusega ajamid.Püsikiirusega ventilaatorid ja pumbad raiskavad osalise koormuse korral energiat. Muutuva kiirusega ajamid vastavad õhu- ja veevoolu tegelikule nõudlusele. Renoveerimise tasuvusaeg on tavaliselt 1-3 aastat.
UPSi töö optimeerimine.Enamik UPS-süsteeme töötab pidevalt topeltkonversiooni režiimis – vahelduvvoolu konverteerimine alalisvooluks ja tagasi vahelduvvooluks isegi siis, kui elektritoide on puhas. Kaasaegsed UPS-süsteemid võivad lülituda ökorežiimile, kui voolukvaliteet seda võimaldab, saavutades 99-protsendilise efektiivsuse 94–96 protsendi asemel. Kompromiss on lühike ülekandeaeg akule, kui elektritoide katkeb. Sellisteks ülekanneteks mõeldud toiteallikatega IT-koormuste puhul on risk minimaalne.
Võtta kasutusele kõrgema pinge jaotus.Toite jaotamine 415 V 208 V asemel vähendab jaotuskadusid ligikaudu 25 protsenti. Selleks on vaja ühilduvaid PDU-sid ja serveri toiteallikaid, kuid paljud kaasaegsed seadmed toetavad seda.
Shangyu CPSY ettevõte, kõrgtehnoloogiline ettevõte, mis keskendub andmekeskuste infrastruktuurile, teatab oma modulaarsete andmekeskuselahenduste PUE-ks 1,3. See asetab ettevõtte kullatasemele, liikudes plaatina taseme poole.
Väidetav 25-protsendiline energiasääst võrreldes tavapäraste konstruktsioonidega tuleneb mitmest tegurist. Modulaarsed UPS-süsteemid, mille tõhusus on 97,4 protsenti süsteemi tasemel, vähendavad jaotuskadusid, mis muidu töötavad 15–20 protsenti. Muutuva kiirusega kompressorite ja EC-ventilaatoritega täppiskliimaseadmed reguleerivad jahutusvõimsust nii, et need vastaksid tegelikule soojuskoormusele, mitte ei töötaks fikseeritud võimsusel. Ja füüsiline paigutus – kuumade vahekäikude piiramine, optimaalne riiulivahe, tõstetud põrand koos sobiva suurusega perforeeritud plaatidega – käsitleb õhuvoolu juhtimist, mis kahjustab paljusid muidu tõhusaid rajatisi.
Ettevõtte sertifitseerimisportfelli kuuluvad ISO 9001 (kvaliteedijuhtimine) ja ISO 27001 (infoturbe juhtimine). Selle klientide kasutuselevõtt hõlmab partnerlussuhteid Huawei, ZTE ja Inspuriga ning ekspordiettevõtteid Ameerika Ühendriikides, Ühendkuningriigis, Saksamaal, Prantsusmaal ja Austraalias.
Vedelikjahutus oli aastaid superarvutuskeskuste nišitehnoloogia. See muutub kiiresti.
NVIDIA H100 või eelseisvaid B200 GPU-sid kasutavad AI-treeningklastrid toodavad puhtalt õhkjahutusega konfiguratsioonides 30–50 kilovatti riiuli kohta. Nende tiheduste korral nõuab õhkjahutus suurt õhuvoolu – valju ventilaatorit, sügavaid riiulid ja endiselt marginaalset termoregulatsiooni.
Otse-kiibile vedelikjahutus eemaldab allika juures 60-80 protsenti soojusest. Laastud jooksevad jahedamalt. Fännid töötavad aeglasemalt. Ruumi konditsioneer töötleb ainult toiteallikatest, mälust ja muudest komponentidest saadavat ülejäänud soojust.
Tõhususe suurenemine on märkimisväärne. Otse-kiibile jahutusega rajatised teatavad PUE väärtusteks 1,1–1,2. Kompromissideks on kõrgemad kapitalikulud, keerulisem lekkejuhtimine ja vajadus rajatisele vastava veetöötluse järele.
Täiskümblusjahutus – tervete serverite dielektrilisse vedelikku uputamine – viib PUE taseme alla 1,1, kuid jääb spetsialiseerumiseks. Enamik kommertsandmekeskusi võtab esmalt kasutusele otse-kiibile jahutuse, seejärel konkreetsete suure tihedusega tsoonide jaoks sukeldamise.
SHANGYU andmekeskuse platvorm sisaldab sätteid nii õhu- kui ka vedelikjahutusarhitektuuride jaoks, tunnistades, et tulevane suure tihedusega kasutuselevõtt nõuab vedelikupõhist soojusjuhtimist olenemata rajatise konstruktsioonist.
Enamik andmekeskuste töörühmi töötab endiselt reaktiivselt. Kõlab äratus. Keegi uurib. Rakendatakse parandus. Tsükkel kordub.
Ennustavale juhtimisele üleminek nõuab kolme võimalust, mis paljudel organisatsioonidel puuduvad.
Täielikud konfiguratsiooniandmed.Teadmine, mis andmekeskuses asub – iga server, iga lüliti, iga PDU, iga jahutusseade – on aluseks. Ilma täpsete CMDB andmeteta on võimsuse planeerimine oletus.
Granuleeritud telemeetria.Rack-taseme võimsuse mõõtmine on minimaalne. Serveri võimsuse mõõtmine on parem. Töökoormuse tasemel võimsuse omistamine on parim, kuid kõige raskemini saavutatav.
Analüütika, mis eristab signaali mürast.Temperatuuri tõus ühel riiulil võib tähendada ventilaatori ebaõnnestumist. Temperatuuri tõus pooles andmekeskuses võib tähendada jahuti riket. Süsteem peab eristama ja vastavalt sellele vastuseid soovitama.
SHANGYU DCIM-platvorm pakub SNMP- ja Modbus-seadmete tuge, veebipõhiseid ja Windowsi rakendusliideseid ning integratsiooni võrgukaameratega sündmuste käivitatud pildistamiseks. Väljatoodud eesmärgid on lihtsad: vähendada kulukaid seisakuid, vähendada igapäevaseid tegevuskulusid täieliku keskkonnakontrolli abil ning parandada juhtimise nähtavust ja jälgitavust.
Andmekeskuste energiatarbimine moodustab ligikaudu 1 protsendi ülemaailmsest elektrivajadusest. See arv kõlab väikesena, kuni konteksti asetada. See on ligikaudu võrdne Ühendkuningriigi elektrienergia kogutarbimisega.
Veelgi olulisem on see, et kasvutempo kiireneb. Tööstusharu prognoosid näitavad, et andmekeskuste võimsusnõudlus kasvab 2030. aastani igal aastal 10–15 protsenti, mis on tingitud tehisintellektist, pilve kasutuselevõtmisest ja ühendatud seadmete jätkuvast laienemisest. Selle kiirusega tarbiksid andmekeskused kümnendi lõpuks 3–4 protsenti maailma elektrienergiast.
Eelmisel kümnendil energiatarbimist madalal hoidnud tõhususe kasv tulenes serveri virtualiseerimisest (füüsiliste serverite arvu vähendamine), draivi efektiivsuse paranemisest (ketaste pöörlemiselt SSD-dele üleminek) ja vabajahutuse laialdasest kasutuselevõtust (välisõhu kasutamine mehaanilise jahutuse asemel). Need madalal rippuvad viljad on suures osas korjatud.
Järgmine tõhususe laine tuleneb vedelikjahutusest, kõrgema pinge jaotusest, tehisintellektile optimeeritud jahutusjuhtimisseadmetest ja – ehk kõige olulisemast – infrastruktuuri läbilaskevõime ja tegeliku IT-koormuse vahelisest paremast vastavusest. See viimane osa nõuab sellist reaalajas nähtavust ja ennustavat analüütikat, mida DCIM-süsteemid pakuvad, kuid vähesed seadmed kasutavad täielikult ära.
Kas teate oma tegelikku PUE-d, mitte spetsifikatsioonilehel olevat numbrit?Kui te pole mõõtnud UPS-i väljundis ja IT-seadmete sisendis, siis te ei tea. Erinevus on teie tegelikud üldkulud.
Kas teie jahutussüsteemid võitlevad üksteisega?Paljudes andmekeskustes on CRAC-i üksused seadistatud kattuvate temperatuuri- ja niiskusribadega. Üks seade kuivatab, teine niisutab. Üks jahutab, teine soojendab uuesti. See pole ebatavaline. Samuti ei ole see tõhus.
Kui suur on teie serverite jõudeoleku võimsus?Tööstusandmed näitavad, et tüüpilised ettevõtteserverid kasutavad 30–40 protsenti oma tippvõimsusest, kui nad midagi ei tee. Kasutamata serverite väljalülitamine või magama panemine on suurim võimalik investeeringutasuvuse tõhususe meede. See on ka kõige tähelepanuta jäänud.
Kas saaksite oma sissepuhkeõhu temperatuuri tõsta kahe kraadi võrra ilma seadmete spetsifikatsioone rikkumata?Tõenäoliselt jah. Enamik seadmeid on ette nähtud 25-27 kraadise sisselasketemperatuuri jaoks. Enamik andmekeskusi töötab 20-22 kraadi juures. See kuuekraadine vahe tähistab aastaid tarbetut jahutusenergiat.
Millal viimati oma UPSi tõhusust kinnitasite?Andmesildi efektiivsust mõõdetakse täiskoormusel täiusliku võimsusteguriga. Tegelik kasutegur osalise koormuse korral tegeliku võimsusteguriga võib olla 5–10 punkti madalam.