Kaip dirbtinio intelekto titanai perrašo serverių CPU rinkos taisykles
Tradicinė serverių centrinių procesorių (CPU) rinka, kurioje dešimtmečius dominavo „Intel“ ir AMD, išgyvena tektoninį lūžį. Didžiosios technologijų bendrovės, dažnai vadinamos „hiperkonkurentais“, vis aktyviau atsisako standartinės x86 architektūros ir investuoja milijardus dolerių į savo kuriamus, specifinėms dirbtinio intelekto (AI) bei debesų kompiuterijos užduotims pritaikytus lustus. Ši strateginė transformacija leidžia technologijų milžinėms ne tik sumažinti priklausomybę nuo išorinių tiekėjų, bet ir drastiškai padidinti savo duomenų centrų energetinį efektyvumą bei našumą.
Pagrindinis šio pokyčio variklis yra spartus perėjimas prie „Arm“ architektūros pagrindu suprojektuotų procesorių. Nors grafiniai procesoriai (GPU) išlieka pagrindine jėga apmokant didžiuosius kalbų modelius, kasdienėms operacijoms, duomenų bazių valdymui ir išvedimo (angl. inference) užduotims atlikti reikalingi itin efektyvūs serverių CPU. Rinkos analitikai fiksuoja, kad specializuotų integrinių grandynų (ASIC) ir pritaikytų CPU paklausa auga kartais, o tai sukuria tiesioginę grėsmę seniesiems puslaidininkių rinkos lyderiams.
„Amazon Web Services“ dominavimas su „Graviton“
Debesų kompiuterijos pionierė „Amazon Web Services“ (AWS) jau ne vienerius metus diktuoja madas pritaikyto silicio sektoriuje. Bendrovės pristatyti Amazon Graviton4 procesoriai užtikrina iki 30 % geresnį našumą žiniatinklio programoms ir iki 40 % spartesnį duomenų bazių apdorojimą, palyginti su ankstesne karta. Negana to, AWS neseniai dar labiau pakėlė kartelę pristatydama naujausios kartos Graviton5 procesorius, kurie ne tik pagreitina mašininio mokymosi užduotis, bet ir siūlo matematiškai įrodytą izoliuotą saugumą debesų infrastruktūroje.
„Microsoft“ atsakas: „Cobalt“ ekosistemos plėtra
Siekdama optimizuoti savo „Azure“ platformą, „Microsoft“ į rinką sėkmingai įsiliejo su pritaikytais „Arm“ procesoriais. Kompanijos sukurti Azure Cobalt 100 procesoriai yra orientuoti į debesų kompiuterijai pritaikytas Linux darbo apkrovas ir užtikrina iki 50 % geresnį kainos ir našumo santykį. Tokios paslaugos kaip „Microsoft Teams“ jau perėjo prie šios architektūros, o tai leido bendrovei atlikti tas pačias užduotis naudojant net 35 % mažiau procesoriaus branduolių.
„Google Axion“ – x86 architektūros iššūkis
„Google“ taip pat agresyviai plečia savo pozicijas su pirmuoju pritaikytu „Arm“ procesoriumi, skirtu duomenų centrams. Naujosios Google Axion N4A virtualios mašinos užtikrina dvigubai geresnį kainos ir našumo santykį, palyginti su senesnės kartos sprendimais. Nepriklausomi testai rodo, kad „Axion“ integracija į duomenų bazių infrastruktūrą analitinių užklausų greitį padidina nuo 30 % iki 55 %, o tai žymi rimtą konkurencinį pranašumą prieš tradicinius x86 serverius.
Puslaidininkių pramonės ateitis ir vertikali integracija
Šie penkių didžiųjų AI ir debesų technologijų lyderių žingsniai demonstruoja platesnę tendenciją – visišką vertikalią integraciją. Kontroliuodamos viską nuo mikroschemų dizaino iki galutinės programinės įrangos, bendrovės eliminuoja standartinės aparatinės įrangos apribojimus. Tradiciniams milžinams nelieka kito kelio, tik adaptuotis prie rinkos, kurioje pirkėjas tampa didžiausiu ir pavojingiausiu konkurentu.
Kas lieka už oficialių pranešimų spaudai ribų
Ko nepastebi standartinės rinkos apžvalgos: tikroji kova serverių procesorių rinkoje vyksta ne dėl skaičių techninių duomenų lapuose, o dėl visiškos programinės ir aparatinės įrangos ekosistemos kontrolės. Dešimtmečius „Intel“ ir AMD dominavimą garantavo vadinamasis „x86 ekosistemos takelis“ – programinė įranga buvo optimizuota būtent šiems procesoriams, o jos perkėlimas kitur reikalavo milžiniškų išlaidų. Šiandien dirbtinio intelekto titanai šį barjerą griauna kurdami atvirojo kodo kompiliatorius ir abstrakcijos sluoksnius, kurie leidžia įmonėms perkelti savo kodą į naujuosius „Arm“ architektūros lustus praktiškai be jokių papildomų investicijų į programavimą.
Šis lūžis sukelia rimtų strateginių iššūkių tradiciniams puslaidininkių gamintojams, kurie dabar privalo iš esmės keisti savo verslo modelius. Pavyzdžiui, „Intel“ bando persiorientuoti į sutartinės gamybos (angl. foundry) paslaugas, siekdama gaminti lustus tiems patiems technologijų milžinams, kurie anksčiau buvo jos didžiausi klientai. Tačiau ši transformacija reikalauja šimtų milijardų dolerių investicijų į naujas gamyklas ir susiduria su stipriu politiniu bei logistiniu spaudimu, kadangi puslaidininkių tiekimo grandinių saugumas tapo nacionalinio saugumo prioritetu tiek JAV, tiek Europos Sąjungoje.
Kartu keičiasi ir paties duomenų centro architektūros samprata, kur centrinis procesorius nebėra vienintelis sistemos valdovas. Šiuolaikiniuose AI serveriuose CPU atlieka labiau eismo reguliuotojo vaidmenį, kuris paskirsto milžiniškus duomenų srautus specializuotiems greitintuvams ir atminties moduliams. Dėl šios priežasties debesų kompiuterijos milžinės savo kuriamuose lustuose prioritetą teikia ne maksimaliam vieno branduolio greičiui, o neįtikėtinai dideliam pralaidumui ir gebėjimui efektyviai valdyti energijos sąnaudas laukimo režimu, kai AI modeliai laukia naujų užklausų.
Galiausiai, ši integracija keičia ir galutinių verslo klientų elgseną, nes jie vis dažniau renkasi ne konkrečią techninę įrangą, o paslaugos efektyvumą. Įmonės, nuomojančios skaičiavimo galią iš „Google“, „Microsoft“ ar AWS, dažnai net nežino, koks tiksliai silicio gabalas apdoroja jų duomenis, kol pamato mažesnę sąskaitą už elektros energiją ir greitesnį programų veikimą. Tai reiškia, kad tradiciniai lustų prekės ženklai praranda savo tiesioginį ryšį su galutiniu vartotoju, o visa rinkos galia konsoliduojasi kelių didžiųjų platformų rankose.
Skeptiko žvilgsnis į silicio nepriklausomybę
Žvelgiant giliau į fasadinę pusę: technologijų milžinių skelbiama nepriklausomybė nuo tradicinių lustų gamintojų tėra iliuzija, kurią tiesiog pakeitė nauja priklausomybės forma. Nors „Google“, „Amazon“ ir „Microsoft“ džiugiai raportuoja apie savo sukurtus procesorius, nė viena iš šių įmonių neturi savo gamyklų ir fiziškai šių lustų negamina. Jos visos yra visiškai priklausomos nuo tų pačių kelių gamybos gigantų, pirmiausia TSMC, o tai reiškia, kad geopolitinė rizika Taivano sąsiauryje ar gamybos linijų perkrovimas niekur nedingo, o tik persikėlė vienu laipteliu giliau į tiekimo grandinę.
Kitas esminis paradoksas slypi tame, kad pritaikyto silicio kūrimas reikalauja astronominių kapitalo investicijų, kurias pateisinti gali tik nuolatinis ir eksponentinis debesų paslaugų poreikio augimas. Šiuo metu rinkoje pastebima tam tikra euforija, kai įmonės masiškai perka bet kokius AI skaičiavimo išteklius, tačiau pirmieji ekonominio atvėsimo ar AI investicijų grąžos (ROI) stabilizavimosi ženklai gali paversti šiuos pritaikytus lustų projektus milžiniška finansine našta. Kurti savo CPU apsimoka tik tada, kai konvejeris dirba pilnu pajėgumu, o prastovos atveju nuosavo dizaino išlaidos tampa nepakeliamos net ir didžiausiems technologijų titanams.
Galiausiai, energetinio efektyvumo naratyvas taip pat turi tamsiąją pusę, apie kurią korporacijos linkusios nutylėti savo tvarumo ataskaitose. Nors naujieji „Arm“ procesoriai atskirai paėmus suvartoja mažiau vatų vienai operacijai, bendras duomenų centrų energijos poreikis visame pasaulyje auga geometrine progresija dėl masinio dirbtinio intelekto modelių pritaikymo. Rezultatas – pritaikyti lustai tiesiog leidžia technologijų įmonėms bėgti vietoje šiek tiek greičiau, tačiau tai neišsprendžia fundamentalios problemos, kad dabartinis AI plėtros tempas reikalauja daugiau energijos, nei gali pasiūlyti esami elektros tinklai.
„Galiausiai ironiška, kad po dešimtmečius trukusių kalbų apie programinės įrangos triumfą prieš geležį, didžiausios pasaulio programinės įrangos įmonės dabar privalo tapti metalurgais ir lustų architektais, kad jų sukurti skaitmeniniai protai tiesiog neperdegintų vietinės elektros pastotės saugiklių.“
Vyr. redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per „LinkedIn“.
Vyr. redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per
Komentarai