Asmeninių agentų aušra: kaip „NVIDIA“ ir „Microsoft“ perrašė „Windows“ kompiuterių architektūrą
Ilgus dešimtmečius asmeninis kompiuteris veikė pagal tą pačią klasikinę schemą – procesorius skaičiuoja, vaizdo plokštė piešia kadrus, o operacinė sistema tiesiog paskirsto užduotis tarp programų. Tačiau ši rami evoliucija oficialiai baigėsi, nes technologijų milžinių aljansas nusprendė sukurti visiškai naują įrenginių kategoriją. Neseniai pristatyta NVIDIA ir „Microsoft“ partnerystė žymi radikalų lūžį, perkeliantį dirbtinio intelekto skaičiavimus iš tolimų debesų serverių tiesiai ant vartotojų stalų ir kelių.
Šios revoliucijos šerdyje stovi „RTX Spark“ platforma, sukurta bendradarbiaujant su „MediaTek“ ir sulaužanti tradicines aparatinės įrangos ribas. Inžinieriai atsisakė įprasto komponentų atskyrimo ir viską sujungė į vieną sistemą kristale (SoC), kurioje montuojamas našus „Arm“ architektūros centrinis procesorius bei galingas „Blackwell“ kartos grafinis posistemis. Didžiausias šio architektūrinio sprendimo pasiekimas – net iki 128 GB talpos unifikuota operatyvioji atmintis, prie kurios tiesioginę prieigą turi abu skaičiavimo blokai, taip visiškai panaikinant duomenų perdavimo butelio kakliuką.
Nuo branduolių iki petaflopo našumo
Sistemos galia išties stulbina, nes pilnavertis „RTX Spark Superchip“ savyje talpina iki 20 skaičiavimo branduolių ir net 6144 „Blackwell“ architektūros CUDA branduolius. Toks derinys leidžia vietiniu režimu pasiekti neįtikėtiną 1 petaflopo dirbtinio intelekto skaičiavimų našumą, o tai atveria duris autonominiams agentams veikti fone be jokių debesų paslaugų mokesčių ar delsos. Kasdienėje praktikoje vietinis modelių apdorojimas užklausas įvykdo nuo 10 iki 50 kartų greičiau, nei siunčiant duomenis į išorinius serverius, kartu užtikrinant visišką vartotojo privatumą.
Šis aparatinis šuolis pakeitė ir pačią operacinę sistemą, kurioje „Microsoft“ integravo gilias „Windows Copilot Runtime“ bei specializuotas saugumo primityvų aplinkas. Dėl glaudžios integracijos su „NVIDIA OpenShell“ sistema, autonominiai asistentai, pavyzdžiui, „OpenClaw“ ar „Hermes Agent“, gali saugiai atlikti užduotis izoliuotoje aplinkoje (sandbox), turėdami prieigą prie vietinio konteksto, bet nekeldami grėsmės vartotojo failams. Vartotojams tai reiškia galimybę kurti milžiniškas 3D scenas, redaguoti didelės raiškos vaizdo įrašus ir žaisti naujausius žaidimus plonuose, vos 14 milimetrų storio nešiojamuosiuose kompiuteriuose, kurie realiu laiku mąsto kartu su jais.
Užkulisių inžinerija: Giliau pažvelgus į šią naująją architektūrą, esminis sistemos pranašumas slypi ne tik brutaliame branduolių skaičiuje, bet ir visiškai perrašytame atminties valdymo posistemyje. Tradiciniai asmeniniai kompiuteriai ilgą laiką kentėjo dėl milžiniškų vėlavimų, atsirandančių perkeliant didelius kalbinius modelius (LLM) iš pagrindinės operatyviosios atminties į vaizdo plokštės VRAM per riboto pralaidumo PCI Express magistralę. „NVIDIA“ ir „Microsoft“ inžinieriai šį apribojimą pašalino pritaikydami unifikuotos atminties architektūrą (UMA), kuri užtikrina, kad centrinis ir grafinis procesoriai dalijasi ta pačia fizine atminties erdve su nulinio kopijavimo (zero-copy) mechanizmu, o tai dramatiškai pagreitina tenzorinių operacijų vykdymą.
Sistemų programuotojams didžiausią įspūdį palieka tai, kaip žemo lygio tvarkyklės optimizuoja svorių kvantavimą (quantization) tiesiogiai aparatinėje įrangoje. Naudojant naujausius FP4 ir INT4 skaičiavimo formatus, kuriuos palaiko „Blackwell“ tenzoriniai branduoliai, dešimčių milijardų parametrų modeliai yra suspaudžiami taip, kad tilptų į vietinę atmintį, neprarandant konteksto supratimo tikslumo. Tai pasiekiama per dinaminį svorių dekompresavimą, kuris vyksta skrydžio metu (on-the-fly) tiesiai vykdymo konvejeriuose, todėl atminties magistralė nėra apkraunama pertekliniais duomenų srautais.
Branduolio lygio optimizacija ir išteklių paskirstymas
Operacinės sistemos lygmenyje „Windows 11“ branduolys (kernel) gavo specialų atnaujinimą, atsakingą už heterogeninių užduočių planavimą realiu laiku. Naujasis dispečeris naudoja nuspėjamuosius algoritmus, kurie analizuoja ateinančių užklausų pobūdį ir akimirksniu nusprendžia, ar užduotį nukreipti į mažos galios NPU (neuroninių procesorių bloką) foniniam tekstų apdorojimui, ar pažadinti masinius „Blackwell“ tenzorinius masyvus sudėtingoms multimodalinėms operacijoms. Toks hibridinis požiūris leidžia išlaikyti neįtikėtiną energijos efektyvumą, nes galingiausi lusto blokai aktyvuojami tik mikro sekundžių intervalams, o likusį laiką veikia gilaus miego režimu.
Galiausiai, programinės įrangos kaminas (software stack) buvo papildytas tiesiogine DirectML ir NVIDIA TensorRT-LLM integracija, kuri leidžia programuotojams apeiti kelis abstrakcijos sluoksnius. Rašant kodą, užklausos siunčiamos per optimizuotus konvejerius, kurie naudoja puslapio lygio atminties fiksavimą (pinned memory), apsaugantį dirbtinio intelekto modelio konteksto langą nuo iškėlimo į lėtą SSD diską (paging). Šis sisteminis inžinerijos triumfas užtikrina, kad net ir esant maksimaliai sistemos apkrovai, asmeniniai agentai sugeba išlaikyti pastovų žetonų generavimo greitį (tokens per second), paversdami kompiuterį nuspėjamu ir žaibiškai reaguojančiu įrankiu.
Skaitant tarp eilučių: Nors technologijų milžinių demonstruojami skaičiai ir petaflopų galia ant popieriaus atrodo įspūdingai, praktinis šios vietinės architektūros pritaikymas susiduria su rimtais realybės iššūkiais. Didžiausias paradoksas slypi tame, kad vartotojams žadama visiška autonomija ir nepriklausomybė nuo debesų serverių, tačiau pati operacinė sistema vis labiau priklauso nuo nuolatinių atnaujinimų, telemetry duomenų rinkimo ir korporacijų diktuojamų saugumo sertifikatų. Vietinis privatumo pažadas tampa sunkiai suderinamas su ekosistema, kuri reikalauja nuolatinio ryšio su motinine platforma tam, kad atpažintų naujausias grėsmes izoliuotose agentų aplinkose.
Kitas svarbus aspektas yra vartotojų programinės įrangos pasirengimas tokiam radikaliam aparatinės įrangos šuoliui. Istorija rodo, kad programinės įrangos kūrėjai labai lėtai adaptuojasi prie naujų architektūrų, ypač kai kalbama apie perėjimą nuo tradicinio x86 standarto prie „Arm“ ir specializuotų tenzorinių branduolių sinergijos. Kol kas didžioji dalis kasdienių programų vis dar remiasi senais kodo principais, todėl vartotojai rizikuoja nusipirkti itin brangius, ateičiai paruoštus įrenginius, kurių reali galia didžiąją laiko dalį bus naudojama tik fone veikiančiam tekstų redaktoriaus asistentui.
Ekonominė realybė ir vartotojų elgsenos barjerai
Galiausiai, negalima ignoruoti vartotojų psichologijos ir ekonominio šios revoliucijos faktoriaus. Norint pasiekti gamintojų deklaruojamą 1 petaflopo našumą ir sklandų 128 GB unifikuotos atminties veikimą, pirkėjams teks investuoti į aukščiausios klasės įrenginius, kurių kaina gerokai viršys vidutines rinkos galimybes. Kyla natūralus skepticizmas, ar eilinis vartotojas bus pasiruošęs mokėti didžiulę priemoką vien už tai, kad jo kompiuteris galėtų sugeneruoti elektroninį laišką ar surasti dokumentą keliomis sekundėmis greičiau, ypač kai nemokami debesų modeliai vis dar puikiai atlieka šias užduotis bet kuriame sename nešiojamame kompiuteryje.
Galiausiai viskas susiveda į seną tiesą: inžinieriai sukūrė stebuklą, galintį vietiniu režimu apskaičiuoti visatos paslaptis per kelias milisekundes, tačiau galutinis vartotojas šį technologinį šedevrą greičiausiai naudos tam, kad dar greičiau ištrintų nepageidaujamus elektroninius laiškus ir sukurtų tobulesnius kačių paveikslėlius.
Redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per „LinkedIn“.
Redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per
Komentarai