Apie Viską DI Agentai DI Atviro Kodo DI Kodui DI Medicinoje DI Modeliai - LLM DI Muzikai DI Nuotraukoms DI Prietaisai DI Satyra ir Humoras DI Saugumas DI Video DI ir Teisėtvarka DI Žaidimuose Dirbtinis Intelektas NVIDIA AI Pamąstymai Apie DI Redaktoriaus Žodis Robotika Technologijų Dvikova

Dirbtinio intelekto iššūkis: kaip AMD ir „Intel“ pasidalino inferencijos frontą

Artūras Malašauskas 2026-06-15 5 min skaitymui
AMD ir „Intel“ stojo į bekompromisę dvikovą dėl dirbtinio intelekto inferencijos rinkos, kur neapdorota „Instinct MI325X“ atminties galia susiduria su pragmatišku „Gaudi 3“ kainos ir efektyvumo santykiu. Šis technologinis karas duomenų centruose galutinai nubrėžia ribą tarp ekstremalaus našumo siekiančių gigantų ir išlaidas skaičiuojančio verslo.

Didžiųjų kalbos modelių (LLM) ir agentinio dirbtinio intelekto bumas technologijų rinką pastūmėjo į naują etapą, kuriame pagrindiniu mūšio lauku tapo nebe modelių treniravimas, o kasdienis jų darbas – inferencija (angl. inference). Analitikai prognozuoja, kad jau artimiausiais metais būtent užklausų apdorojimas sugeneruos liūto dalį duomenų centrų apkrovų, todėl puslaidininkių titanai AMD ir „Intel“ pristatė radikaliai skirtingas strategijas šiai rinkai užkariauti. Kol viena įmonė pasikliovė neapdorota grafinių procesorių galia bei milžiniška atminties talpa, kita pasirinko koncentruotis į energetinį efektyvumą ir strategines partnerystes serverių rinkoje.

Ši technologinė priešprieša puikiai matoma per naujausių architektūrų prizmę. AMD į kovą meta savo „Instinct MI325X“ platformą, ginkluotą įspūdinga 256 GB HBM3E atmintimi ir pasiekiančią iki 6 TB/s pralaidumą, o tai leidžia milžiniškus modelius talpinti tiesiog viename luste ir dramatiškai sumažinti signalo vėlavimą. Tuo tarpu „Intel“ su savo „Gaudi 3“ akceleratoriumi pasirinko visiškai kitą kelią – nors siūlo kuklesnę 128 GB HBM2e atmintį, šis sprendimas orientuotas į geresnį skaičiavimų spartos ir suvartojamos galios santykį bei žymiai agresyvesnę kainodarą masiniuose serverių klasteriuose.

Geležies metrika: kur slepiasi tikroji sparta

Vertinant grynuosius skaičius, AMD „Instinct MI325X“ demonstruoja neabejotiną pranašumą žemo tikslumo operacijose, pasiekdama maždaug 2,6 PFLOPS FP8 skaičiavimo galią, kai „Intel Gaudi 3“ ties šia žyma fiksuoja apie 1,8 PFLOPS rezultatą. Remiantis nepriklausomų testų platformos AMD apžvelgtais „InferenceX“ duomenimis, realiame pasaulyje šie skirtumai transformuojasi į apčiuopiamą naudą: AMD architektūra užtikrina geresnį našumą dirbant su populiariais atvirojo kodo modeliais, tokiais kaip „Llama“ ar „Mixtral“. Didžiulė atminties talpa leidžia išvengti sudėtingo ir lėto duomenų keitimosi tarp kelių skirtingų modulių, kas yra esminis faktorius realaus laiko sistemose.

Visgi „Intel“ nepasiduoda ir demonstruoja puikius rezultatus ten, kur svarbiausias tampa mastelis ir investicijų grąža. „Gaudi 3“ pasižymi geresniu FP32 bei FP16/BF16 teoriniu efektyvumu vienam vatui, o tai reiškia, kad masiniuose duomenų centruose, kur elektros sąnaudos tiesiogiai koreguoja verslo maržas, „Intel“ siūlo finansiškai racionalesnę alternatyvą. Šis lustas buvo kuriamas galvojant apie masinę inferenciją už mažesnę kainą, eliminuojant brangių ir deficitinių komponentų poreikį.

Centrinių procesorių renesansas ir rinkos dalis

Nors diskusijose dažniausiai dominuoja vaizdo plokštės, dirbtinio intelekto užklausų apdorojimas stipriai paveikė ir tradicinių serverių procesorių (CPU) segmentą, kadangi smulkesnėms užduotims ir hibridiniams modeliams jie lieka ekonomiškiausias pasirinkimas. Kaip pastebi The Motley Fool analitikai, „Intel“ vis dar išlaiko dominuojančią poziciją x86 serverių CPU rinkoje, kontroliuodama didžiąją dalį infrastruktūros, o tai suteikia bendrovei natūralų pranašumą integruojant pirminius DI inferencijos procesus be papildomų investicijų į akceleratorius.

Kita vertus, AMD labai agresyviai mažina šį atotrūkį. Remiantis rinkos tyrimų agentūros „Mercury Research“ duomenimis, AMD pajamų dalis serverių CPU rinkoje pasiekė rekordinius 46,2 procento, kas rodo, jog klientai yra pasiruošę mokėti daugiau už technologinį pranašumą ir „Epyc“ procesorių siūlomą spartą. „Intel“ bando stabilizuoti situaciją aktyviai ruošdama savo naująją 18A gamybos architektūrą ir bendradarbiaudama su kitais rinkos gigantais, siekdama užtikrinti, kad jų Xeon procesoriai taptų neatsiejama naujos kartos sistemų dalimi.

Investuotojų verdiktas ir ateities perspektyvos

Akcijų rinkoje šios technologinės lenktynės taip pat atsispindi su kaupu – abiejų kompanijų vertė pastaruoju metu fiksavo triženklius šuolius, tačiau investuotojų lūkesčiai skiriasi. Finansų ekspertai linkę palankiau vertinti AMD poziciją dėl jos gebėjimo sėkmingai konkuruoti pelningame duomenų centrų GPU segmente ir užsitikrintų sutarčių su stambiausiais debesų komandų teikėjais. Tuo tarpu „Intel“ sprendžia gamybinių pajėgumų trūkumo iššūkius, nes serverių procesorių paklausa šiuo metu viršija realią pasiūlą.

Galutinis nugalėtojas šiame etape priklausys ne tik nuo sausų testų rezultatų, bet ir nuo programinės įrangos ekosistemos brandos. Kol AMD intensyviai investuoja į atvirojo kodo iniciatyvas ir optimizuoja savo ROCm platformą, „Intel“ stiprybe išlieka visuotinis suderinamumas bei integracija su jau egzistuojančia įmonių infrastruktūra, todėl abu puslaidininkių gigantai dar ilgai dalinsis šią sparčiai augančią dirbtinio intelekto rinką.

Redakcijos vertinimas: privalumai ir trūkumai

Platforma Operaciniai privalumai (Pros) Operaciniai trūkumai (Cons)
AMD Instinct MI325X • Milžiniška 256 GB HBM3E atmintis leidžia talpinti didelius modelius viename luste. • Ekstremalus 6 TB/s pralaidumas minimizuoja vėlavimą realaus laiko užklausose. • Puikus suderinamumas su populiariais atvirojo kodo LLM modeliais. • Labai aukšta pradinė vieno lusto ir platformos įsigijimo kaina. • Didelės energijos sąnaudos reikalauja pažangių aušinimo sprendimų. • ROCm programinė ekosistema vis dar vejasi rinkos standartus.
Intel Gaudi 3 • Agresyvi kainodara užtikrina žymiai geresnį investicijų grąžos santykį. • Integruoti 24 vnt. 200 GbE tinklo prievadai supaprastina klasterių keitimą. • Didelis energetinis efektyvumas sumažina ilgalaikes TCO sąnaudas. • Ribota 128 GB HBM2e atmintis priverčia skaidyti itin didelius modelius. • Mažesnis grynasis skaičiavimo našumas FP8 žemo tikslumo operacijose. • Mažesnis lankstumas už duomenų centrų ribų esančioms hibridinėms užduotims.

Skaityti tarp eilučių: Žvelgiant į šią specifikacijų ir operacinių galimybių suvestinę tampa akivaizdu, kad kova dėl dirbtinio intelekto inferencijos nėra tik inžinerinių ambicijų demonstravimas. AMD pasirinko bekompromisės galios kelią, bandydama pasiūlyti sprendimą, kuris tiesiog užpila bet kokią architektūrinę problemą milžinišku atminties kiekiu ir neįtikėtinu pralaidumu. Tai idealus pasirinkimas technologijų gigantams, kurie kuria nuosavus, šimtų milijardų parametrų modelius ir negali sau leisti prarasti nei vienos milisekundės generuojant atsakymus galutiniam vartotojui.

„Intel“ tuo tarpu demonstruoja kur kas žemiškesnį, pragmatiškesnį požiūrį į rinkos poreikius. Užuot bandžiusi mušti rekordus sintetiniuose testuose, kompanija sutelkė dėmesį į tai, kas labiausiai skauda vidutinio dydžio įmonėms ir duomenų centrų valdytojams – bendrąją nuosavybės kainą (TCO). Integruodama tinklo valdiklius tiesiai į lustą, „Intel“ eliminuoja papildomų brangių tinklo plokščių poreikį, o lėtesnė, bet pigesnė HBM2e atmintis leidžia pasiūlyti produktą už kainą, kuriai AMD tiesiog negali prilygti.

Galiausiai, pasirinkimas tarp šių dviejų platformų priklauso nuo įmonės programinės įrangos architektūros subrendimo. AMD „Instinct“ serija reikalauja gilaus supratimo apie atvirojo kodo optimizavimą ir gebėjimo išnaudoti ROCm platformos teikiamus privalumus. „Intel Gaudi 3“ siūlo kur kas paprastesnį integracijos kelią toms sistemoms, kurios jau dabar veikia tradicinėje x86 infrastruktūroje, leidžiant sklandžiai išplėsti esamus pajėgumus be radikalaus sistemų perrašymo.

„Galiausiai viskas atsiremia į paprastą tiesą: AMD sukūrė lenktyninį bolidą, kuris reikalauja brangiausio kuro ir idealių trasos sąlygų, o Intel pristatė patikimą dyzelinį vilkiką su integruotu navigacijos paketu. Abu pasieks tikslą, tačiau tik vienas iš jų leis jūsų buhalteriui ramiai miegoti naktį.“

Vyr. redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per „LinkedIn“.

Komentarai

Prisijunk jei nori komentuoti: