„Intel Xeon 6+“: litografijos proveržis ir nauja taktinė dėlionė agentinio DI eroje
„Computex“ parodoje Taipėjuje „Intel“ žengė strateginį žingsnį, oficialiai pristatydama naujos kartos duomenų centrų procesorius „Xeon 6+“ (kodiniu pavadinimu „Clearwater Forest“). Tai nėra tiesiog dar vienas kosmetinis atnaujinimas spartos lentelėse, o kritinis technologinis posūkis, kuriuo bendrovė siekia susigrąžinti prarastas pozicijas prieš agresyviai augančias „Arm“ architektūros alternatyvas bei pagrindinį konkurentą AMD. Didžiausias šio debiuto inžinerinis pasiekimas – tai pirmasis komercinis lustas, pagamintas naudojant pažangiausią „Intel 18A“ technologinį procesą ir revoliucinį trimatį komponentų pakavimą „Foveros Direct 3D“. Šis derinys leido pasiekti rinkoje pirmaujančią fizinę tanką, talpinančią iki 288 efektyviųjų branduolių (E-cores) su įspūdinga 576 MB paskutinio lygio spartinančiąja atmintimi disperguotoje kristalų architektūroje.
Naujoji architektūra demonstruoja radikalų „Intel“ požiūrį į modernias dirbtinio intelekto ekosistemas, tiksliau – į vadinamąjį „agentinį DI“ (angl. Agentic AI). Inžinieriai atsispiria nuo idėjos, kad autonominių DI agentų veikimo ciklui, apimančiam konteksto paiešką, įrankių vykdymą ir užduočių planavimą, nereikia milžiniškų vaizdo plokščių skaičiuojamųjų resursų (FLOPS). Vietoje to kur kas svarbesniu faktoriumi tampa branduolių tankis bei atminties podsistemio pralaidumas, leidžiantis efektyviai lygiagrečiu režimu apdoroti daugybę vienalaikių užklausų. Kaip savo apžvalgoje pastebi analitinė grupė The Futurum Group, toks pozicionavimas CPU paverčia ne konkurentu, o idealiu partneriu GPU sistemoms, perimančiu visą infrastruktūros valdymo bei orchestracijos naštą.
Nuo teorinės galios prie realių skaičių duomenų centruose
Praktinis šių architektūrinių sprendimų efektyvumas atsispindi tiesioginiuose našumo metrikuose, kur flagmanas „Xeon 6990E+“ demonstruoja raumenis prieš konkurentų sprendimus. Remiantis oficialiais duomenimis, naujieji procesoriai pasiekia apie 30 procentų didesnį vidutinį našumą vienai gijai bei 30 procentų geresnį efektyvumą vienam vatui, lyginant su analogišku AMD „EPYC 9965“ modeliu tipinėmis duomenų centrų apkrovos sąlygomis. Jei lygintume su pačios „Intel“ ankstesnės kartos „Sierra Forest“ platforma, progresas dar akivaizdesnis. Technologijų portalas ServeTheHome išskiria telekomunikacijų ir serverių konsolidacijos segmentą, kuriame „Xeon 6+“ pasiekia iki 60 procentų geresnį energijos vartojimo efektyvumą ir leidžia net 38 procentais sumažinti bendrą serverių spintos energijos suvartojimą.
Šis energijos ir vietos taupymas leidžia pasiekti precedento neturintį skaičiavimo tankį fizinėje erdvėje. Komplektuojant modernias, skysčiu aušinamas rack-scale DI sistemas, viena 32U dydžio spinta gali talpinti net iki 36 864 procesoriaus branduolių, suvartodama maždaug 100 kilovatų energijos. Kartu su naująja „Ethernet E835“ tinklo plokšte, „Intel“ sukuria vientisą platformą, kuri sprendžia opiausią šių dienų problemą – kaip išplėsti duomenų centrų DI pajėgumus neperstatant pačių pastatų ir neviršijant elektros tinklo ribojimų. Kompanijai tai itin svarbus technologinis egzaminas, leisiantis parodyti, ar visiškai nauja „Intel 18A“ litografija bei „PowerVia“ galinės maitinimo linijos technologija gali užtikrinti stabilią masinę gamybę rinkos deficito sąlygomis.
Aukštųjų technologijų užkulisiai: naujosios „Xeon 6+“ architektūros stuburas slepia kur kas daugiau nei vien įspūdingą branduolių skaičių ant silicio plokštelės. Sistemos inžinieriams, kasdien kovojantiems su atminties pralaidumo ribojimais (angl. memory wall), esminiu proveržiu tampa visiškai pertvarkyta vidinė magistralė. „Intel 18A“ procese debiutuojanti „PowerVia“ technologija leidžia maitinimo linijas perkelti į galinę kristalo pusę, o tai radikaliai sumažina signalų interferenciją bei įtampos kritimą. Dėl šio struktūrinio išskirstymo viršutiniuose metalizacijos sluoksniuose atsilaisvina neįkainojama erdvė spartesniems duomenų maršrutizavimo takams, sujungiantiems milžinišką 576 MB trečiojo lygio (L3) spartinančiąją atmintį su skaičiavimo blokais.
Žvelgiant iš kodo optimizavimo perspektyvos, šis architektūrinis posūkis reikalauja iš esmės peržiūrėti gijų planavimo algoritmus operacinės sistemos branduolyje. Tradiciniai serverių algoritmai dažnai optimizuojami didelės galios monotoniškoms užduotims, tačiau „Clearwater Forest“ reikalauja dinamiško mikroužduočių paskirstymo per šimtus mažesnių, bet energetiškai efektyvių branduolių. Kai sistemoje veikia agentinio dirbtinio intelekto ciklai, operacinė sistema privalo išnaudoti aparatinį „Intel Thread Director“ grįžtamąjį ryšį. Tai leidžia milisekundžių tikslumu identifikuoti, kurios gijos vykdo duomenų laukimo ciklus (angl. spin-locks), o kurios atlieka intensyvias atminties operacijas, taip užkertant kelią podėlio sinchronizacijos vėlinimui (angl. cache-coherency latency).
AMX instrukcijų evoliucija ir atminties podsistemių valdymas
Nors „E-core“ branduoliai yra fiziškai mažesni, juose integruotas patobulintas „Advanced Matrix Extensions“ (AMX) blokas keičia žaidimo taisykles vektorinių ir matricos operacijų apdorojime. Sistemos inžinieriams tai reiškia, kad žemo tikslumo duomenų tipai, tokie kaip FP16 ar INT8, dabar gali būti apdorojami tiesiogiai procesoriaus branduolyje be papildomo duomenų perkėlimo į diskrečiąsias vaizdo plokštes. Mažesnis duomenų judėjimas tarp lustų ne tik dramatiškai sumažina energijos sąnaudas, bet ir eliminuoja PCIe magistralės sukeliamus kamščius. Programinės įrangos inžinieriai, optimizuojantys didelių kalbos modelių (LLM) išvedimą (angl. inference), dabar gali pasiekti minimalų pirmojo žetono vėlavimą (angl. time-to-first-token) tiesiogiai serverio pagrindinėje plokštėje.
Galiausiai, sėkmingas tokios masinės lygiagrečios architektūros funkcionavimas remiasi į visiškai naują MR-DIMM (angl. Multiplexed Rank Dual In-line Memory Module) operatyviosios atminties palaikymą. Ši technologija leidžia efektyviai padvigubinti duomenų perdavimo spartą tame pačiame fiziniame kanale, pasiekiant iki 8800 MT/s greitį. Sistemos inžinieriams tai suteikia galimybę subalansuoti atminties pralaidumą vienam branduoliui, kas anksčiau buvo didžiausia didelio branduolių tankio procesorių problema. Rezultatas – subalansuotas, itin tankus skaičiavimų mazgas, gebantis vienu metu apdoroti tūkstančius mikroužklausų be mikrosekundinių vėlavimų šuolių, kas yra kritiškai svarbu stabiliam didelio masto DI paslaugų veikimui.
Skaitant tarp eilučių: nors „Intel“ rinkodaros mašina garsiai trimituoja apie 288 branduolių triumfą ir „18A“ technologinio proceso pranašumą, sveika skepticizmo dozė čia tiesiog būtina. Pirmiausia, visa ši įspūdinga architektūra remiasi išskirtinai „E-core“ (efektyviaisiais) branduoliais, kas iš esmės keičia tradicinę serverių skaičiavimų paradigmą. Ilgą laiką duomenų centrų ekosistema buvo optimizuojama didelio našumo „P-core“ tipo branduoliams, gebantiems žaibiškai susidoroti su sunkiomis monolitinėmis užduotimis. Perėjimas prie masinio mikrobranduolių taikymo reiškia, kad reali „Xeon 6+“ sėkmė priklausys ne nuo paties silicio galimybių, o nuo programinės įrangos kūrėjų noro ir gebėjimo perrašyti dešimtmečių senumo serverinį kodą.
Kitas prieštaravimas slypi pačiame agentinio dirbtinio intelekto pozicionavime. „Intel“ bando įtikinti rinką, kad autonominių DI agentų orchestracijai pakanka didelio tankio CPU branduolių, tačiau realybė yra kur kas labiau hibridinė. Didieji kalbos modeliai ir multimodalios sistemos vis dar reikalauja milžiniško matricos skaičiavimų pralaidumo, kurį GPU ir specializuoti greitintuvai (TPU/ASIC) atlieka nepalyginamai efektyviau. Bandymas CPU paversti pagrindiniu DI infrastruktūros eismo reguliuotoju gali tapti brangiu eksperimentu, jei paaiškės, kad specializuoti kiti koprocesoriai šią užduotį atlieka su mažesnėmis energijos sąnaudomis vienai užklausai.
Gamybos rizikos ir hibridinės infrastruktūros akligatviai
Negalima ignoruoti ir pačios „Intel 18A“ litografijos pramoninės rizikos, kuri bendrovei yra gyvybės ar mirties klausimas. Tai pirmasis kartas, kai masinėje gamyboje vienu metu pradedama naudoti ir nauja tranzistorių struktūra („RibbonFET“), ir galinis maitinimas („PowerVia“). Istorija rodo, kad tokie radikalūs technologiniai šuoliai dažnai atsitrenkia į prastus gamybos išeigos (angl. yield rates) rodiklius pradiniuose etapuose. Jei „Intel“ nesugebės užtikrinti pakankamo stabilių lustų kiekio, didieji debesų komandų milžinai, tokie kaip „Microsoft Azure“ ar AWS, tiesiog negalės rizikuoti savo infrastruktūros plėtra ir liks prie patikrintų AMD ar pačių kuriamų „Arm“ procesorių.
Galiausiai, naujųjų MR-DIMM atminties modulių integravimas sukuria savitą technologinį akligatvį. Nors 8800 MT/s sparta popieriuje atrodo įspūdingai, ši platforma reikalauja specifinės pagrindinių plokščių architektūros ir brangių komponentų, kas pastebimai išaugina bendrąją nuosavybės kainą (TCO). Duomenų centrų valdytojai turės labai tiksliai paskaičiuoti, ar sutaupyta elektros energija serverių spintoje atsvers milžiniškas pradines investicijas į naują, hibridinę infrastruktūrą, kurios gyvavimo ciklas, technologijoms keičiantis kas pusmetį, išlieka itin trumpas.
„Panašu, kad didžiausias „Intel“ inžinerinis pasiekimas yra ne pats silicio stebuklas, o gebėjimas įtikinti investuotojus, jog 288 mažesni varikliai serverių spintoje veikia geriau nei vienas reaktyvinis variklis. Lieka tikėtis, kad programinės įrangos kūrėjai spės parašyti instrukcijas šiam chorui vėluodami mažiau, nei vėluoja naujų gamyklų statybos.“
Vyr. redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per „LinkedIn“.
Vyr. redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per
Komentarai