Superkompiuteris po stalu: „Asus ExpertCenter Pro ET900N G3“ sujungia „Nvidia DGX Station“ galią ir biuro patogumą
Kai kalba pakrypsta apie milžiniškų kalbų modelių (LLM) treniravimą ir sudėtingas dirbtinio intelekto užduotis, įprasta įsivaizduoti triukšmingas duomenų centrų serverines. Tačiau naujasis ASUS inžinerijos kūrinys – „ExpertCenter Pro ET900N G3“ darbo stotis – šią paradigmą verčia aukštyn kojomis. Sukurtas glaudžiai bendradarbiaujant su „Nvidia“ ir panaudojant jų elitinę „DGX Station GB300“ architektūrą, šis įrenginys atneša duomenų centro lygio infrastruktūrą tiesiai ant jūsų darbo stalo. Tai nėra tiesiog dar viena galinga stacionari mašina; tai pilnavertis autonominių DI agentų ir giliojo mokymosi tyrimų centras, kuriam nereikia specifinio aušinimo ar specialiai tam pritaikytų elektros įvadų.
Šios sistemos širdyje plaka pažangiausias „Nvidia GB300 Grace Blackwell Ultra Desktop Superchip“ procesorius. Architektūrinis grožis slypi tame, kaip procesorius ir vaizdo plokštė bendrauja tarpusavyje: naudojant didelės spartos „Nvidia NVLink-C2C“ jungtį, sukuriamas vientisas tiltas, leidžiantis abiem komponentams akimirksniu dalintis duomenimis. Gamintojo teigimu, ši konstrukcija užtikrina iki 748 GB koherentinės unifikuotos atminties, o kai kurios konfigūracijos gali pasiekti net iki 775 GB talpą. Tokie parametrai leidžia kūrėjams vietoje, visiškai privačioje aplinkoje, apdoroti nepalyginamai didesnius duomenų masyvus ir išvengti varginančių debesų kompiuterijos vėlavimų ar kintančių nuomos kaštų.
Nuo geležies iki stulbinančių skaičių
Kai visa ši architektūrinė simfonija paleidžiama pilnu pajėgumu, skaičiai kalba patys už save. „ExpertCenter Pro ET900N G3“ pasiekia protu sunkiai suvokiamą iki 20 PFLOPS dirbtinio intelekto skaičiavimo našumą. Realiuose testuose, naudojant atvirojo kodo „Qwen“ modelį ir „vLLM“ sistemą, ši darbo stotis pademonstravo įspūdingą maždaug 864 žetonų per sekundę (tokens per second) išvesties spartą, o bendras įvesties bei išvesties pralaidumas pasiekė net 1600 žetonų per sekundę. Kad visas šis našumas neužspringtų ties tinklo riba, ASUS integravo itin sparčią „Nvidia ConnectX-8 SuperNIC“ tinklo plokštę. Galutinis rezultatas – tylus, efektyviai aušinamas ir stulbinančiai greitas įrenginys, transformuojantis vietinę DI plėtrą iš teorinės prabangos į kasdienį verslo įrankį.
Rinkos realybė, inžineriniai kompromisai ir ateities perspektyvos
Reading Between the Lines: Nors 20 PFLOPS skaičiavimo galia ant standartinio biuro stalo skamba kaip revoliucinis pasiekimas, verta pažvelgti giliau į šios technologijos praktinį pritaikomumą realioje verslo aplinkoje. „Asus“ ir „Nvidia“ rinkodaros strategija sumaniai akcentuoja autonomiškumą, privatumą ir nepriklausomybę nuo debesų kompiuterijos gigantų, tačiau nutyli apie pradinės investicijos atsiperkamumą. Tokio lygio techninė įranga reikalauja milžiniško kapitalo, kurį pagrįsti vidutinio dydžio įmonei gali būti itin sudėtinga, ypač atsižvelgiant į tai, kad DI modelių architektūros ir optimizavimo algoritmai keičiasi kur kas greičiau nei fizinės aparatinės įrangos gyvavimo ciklas.
Kitas svarbus aspektas yra susijęs su sistemos aušinimu ir elektros energijos suvartojimu, kurį gamintojai bando pateikti kaip pritaikytą standartiniam biurui. Net ir naudojant pažangiausias skysčių cirkuliacijos sistemas, „Blackwell Ultra“ architektūros lustai generuoja milžinišką šilumos kiekį veikiant maksimaliu režimu. Tai reiškia, kad nors įrenginiui techniškai ir nereikia specialios pramoninės vėdinimo infrastruktūros, jo nuolatinis darbas pilnu pajėgumu uždaroje kabineto erdvėje neišvengiamai pakeis patalpos mikroklimatą ir pareikalaus papildomų pastangų palaikant komfortišką temperatūrą. Tad riba tarp tikro duomenų centro ir „darbo stoties po stalu“ išlieka labiau teorinė nei praktinė.
Galiausiai, unifikuotos atminties architektūra, nors ir pašalina duomenų perdavimo butelio kaklelį, sukuria tam tikrą technologinę priklausomybę nuo uždaros „Nvidia“ ekosistemos. Kūrėjai, investuojantys į šią platformą, yra griežtai susiejami su specifinėmis „CUDA“ bei „Transformer Engine“ bibliotekomis, o tai apriboja lankstumą migruoti prie alternatyvių atvirojo kodo platformų ar kitų aparatinės įrangos gamintojų sprendimų. Ilgalaikėje perspektyvoje ši darbo stotis bus vertinama ne tik pagal jos generuojamų žetonų skaičių per sekundę, bet ir pagal tai, ar įmonės sugebės maksimaliai išnaudoti šį specifinį resursą prieš jam tampant morališkai pasenusiu.
„Pirkti duomenų centro lygio superkompiuterį tam, kad jis tilptų po jūsų stalu, yra žavingai ambicingas sprendimas, tačiau tikrasis iššūkis prasideda tada, kai supranti, jog jūsų kuriami DI agentai naudoja daugiau elektros energijos nei visa likusi įmonės buhalterija, o kavą biure dabar galima virti tiesiog pasinaudojant šoniniu korpuso oro srautu.“
Vyr. redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per „LinkedIn“.
Vyr. redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per
Komentarai