Generatyvaus dirbtinio intelekto pėdsakai naujajame „Tomb Raider“: technologinė revoliucija ar tiesiog spartesnis darbas?
Žaidimų pramonėje žodis „dirbtinis intelektas“ jau seniai nebėra tik skambi frazė marketingo skrajutėse, o naujausias „Crystal Dynamics“ projektas įpylė dar daugiau alyvos į šią diskusijų ugnį. Neseniai platformoje „Steam“ pasirodęs oficialus pranešimas patvirtino, kad kuriamame „Unreal Engine 5“ grafinio variklio perdirbinyje „Tomb Raider: Legacy of Atlantis“ buvo pritaikyti generatyvaus DI įrankiai. Šis žingsnis akimirksniu patraukė technologijų entuziastų dėmesį, priversdamas giliau pasidomėti, kaip modernūs algoritmai susijungia su pažangiausia „Epic Games“ architektūra.
Kaip leidiniui Game Informer paaiškino projekto patirties direktorius Jeffas Adamsas, DI integracija buvo pasitelkta siekiant greičiau rasti teisingus atsakymus ankstyvosiose aplinkos ir lygių dizaino stadijose. Užuot laukus, kol dailininkai rankiniu būdu sukurs kiekvieno objekto juodraštį, kūrėjai algoritmų pagalba akimirksniu vizualizavo laikinąsias detales trimačiame pasaulyje. Tokia darbo eiga leido eksperimentuoti su dinamiškomis erdvėmis bei objektų išdėstymu realiuoju laiku, nelėtinant bendro „Unreal Engine 5“ gamybos konvejerio.
Nuo variklio architektūros iki optimizavimo rodiklių
Techniniu požiūriu generatyvaus DI generuojami tūriai puikiai koreliuoja su „Unreal Engine 5“ kertinėmis technologijomis, tokiomis kaip „Nanite“ virtualizuota geometrija bei „Lumen“ dinaminis apšvietimas. Ankstyvosiose stadijose DI įrankiai padėjo suformuoti pirmines geometrines formas, kurias variklis geba apdoroti mikroskopinių trikampių lygmeniu, o tai leido programuotojams testuoti atminties pralaidumą dar prieš galutinį modeliavimą. Vis dėlto, leidinio Kotaku apžvalgose pastebima, kad ankstyvosiose versijose vizualiniai elementai dar turėjo pastebimų netolygumų, reikalaujančių kruopštaus specialistų prisilietimo.
Kūrėjai griežtai pabrėžia, kad visi DI asistuoti elementai galutiniame produkto variante yra pilnai pakeičiami arba rankiniu būdu patobulinami žmonių rankomis, užtikrinant, kad kūrybinė kontrolė liktų programuotojų ir dailininkų rankose. Toks hibridinis metodas tiesiogiai atsiliepia ir našumo metrikoms, nes testuojant kadrų dažnį (FPS) su preliminariais DI objektais, komanda gali iš anksto numatyti procesoriaus bei vaizdo plokštės apkrovas dinaminėse scenose. Galutinis žaidimo optimizavimas vis tiek priklauso nuo inžinierių gebėjimo suvaldyti srautinio duomenų įkėlimo (angl. streaming) algoritmus, o ne nuo pačių generatyvinių modelių.
Nors diskusijos dėl autorinių teisių ir DI naudojimo AAA klasės žaidimuose išlieka karštos, „Crystal Dynamics“ strategija aiškiai demonstruoja pramonės posūkį link automatizuotų pagalbinių procesų. Žaidėjams lieka tikėtis, kad šis technologinis eksperimentas padės pasiekti nepriekaištingą vizualinę kokybę, kai Lara Croft sugrįš į ekranus.
Užkulisių inžinerija: Kai kalbame apie generatyvaus turinio integravimą į „Unreal Engine 5“ (UE5), tikroji magija prasideda ne kūrybiniuose eskizuose, o giliojo kodo optimizavimo lygmenyje. Sistemų inžinieriams didžiausias iššūkis yra užtikrinti, kad dinamiškai generuojami aplinkos duomenys nesukeltų mikrotrūkčiojimų (angl. stuttering) pagrindiniame vykdymo sraute. Kadangi UE5 remiasi griežta gijų hierarchija, bet koks neatsargus kreipimasis į atmintį runtime metu gali paralyžiuoti kadrų generavimą, todėl kūrėjai turėjo iš esmės perrašyti asinchroniškų užduočių valdymą.
Esminis architektūrinis sprendimas buvo priimtas perkeliant visus generatyvinių algoritmų skaičiavimus į atskiras fonines gijas per „UE5 Tasks Graph“ sistemą. Tai leido izoliuoti geometrinių tūrių formavimą nuo kritinio žaidimo logikos ciklo (angl. game loop). Duomenų mainams tarp DI posistemės ir pagrindinio variklio branduolio buvo pritaikytos lock-free žiedinės buferio struktūros, kurios minimizuoja gijų sinchronizacijos laukimo laiką ir leidžia išvengti atminties konfliktų. Tokiu būdu žaidimo variklis sugeba priimti naujus aplinkos taškų masyvus (angl. point clouds) fone, kol žaidėjas vis dar tiria esamą lokaciją.
Atminties valdymas ir virtualizuotos geometrijos srautai
Sistemų architektūros požiūriu, didžiausia apkrova tenka vaizdo atminties (VRAM) valdymui, kurį „Tomb Raider: Legacy of Atlantis“ kūrėjai optimizavo pasitelkdami patobulintą „Nanite“ duomenų srautinio perdavimo (angl. streaming) algoritmą. Generatyvaus DI sukurti preliminarūs tinkleliai (angl. meshes) iš pradžių yra apdorojami kaip supaprastinti proxy objektai, užimantys minimalią vietą operatyviojoje atmintyje. Tik žaidėjui artėjant prie konkrečios zonos, variklis fone konvertuoja šiuos duomenis į didelės raiškos virtualizuotą geometriją, suskaidytą į optimizuotus atminties puslapius.
Šis procesas reikalauja itin agresyvaus šiukšlių surinkėjo (angl. Garbage Collector) valdymo, kad nebūtų perpildyta tekstūrų ir geometrijos talpykla (angl. cache pool). Inžinieriai įdiegė dinaminį prioritetų algoritmą, kuris akimirksniu pašalina iš atminties tuos DI sugeneruotus elementus, kurie nebėra žaidėjo matymo lauke arba tiesioginėje sąveikos zonoje. Rezultatas – tolygus VRAM išteklių paskirstymas, leidžiantis išlaikyti stabilią kadrų generavimo spartą net ir keičiantis sudėtingoms aplinkos konfigūracijoms.
Galiausiai, siekiant suderinti dinaminį apšvietimą su realiuoju laiku modifikuojama geometrija, buvo modifikuota „Lumen“ sistemos atspindžių kortelių (angl. Lumen Card) generavimo logikos dalis. Įprastai UE5 iš anksto apskaičiuoja šias korteles statiniams objektams, tačiau dinamiškai kintančioje aplinkoje tai tekdavo daryti skraidant. Kūrėjai pritaikė žemo lygio skaičiavimo šešėliuotojus (angl. compute shaders), kurie asinchroniškai atnaujina apšvietimo tūrius tik tuose regionuose, kur DI pakeitė geometrinę struktūrą, taip sutaupydami brangaus GPU laiko.
Žvelgiant giliau į kodą: Nors studijos skambiai deklaruoja, kad generatyvusis dirbtinis intelektas atveria duris neregėtam kūrybiniam lankstumui, techninė šios inžinerijos pusė atskleidžia kur kas prozaiškesnę realybę. Didžiausias prieštaravimas slypi pažade sukurti „dinamiškas, reaguojančias aplinkas“, kurios tuo pat metu privalo išlaikyti griežtą, scenarijų valdomą naratyvą. Pramonės stebėtojai pagrįstai abejoja, ar algoritmų sugeneruoti tarpiniai etapai iš tiesų taupo brangų inžinierių laiką, mat netvarkingos geometrijos valymas ir DI paliktų klaidų (angl. artifacts) taisymas neretai reikalauja tiek pat valandų, kiek ir tradicinis rankinis modeliavimas.
Kitas esminis iššūkis, keliantis skepticizmą sistemų architektams, yra determinizmo trūkumas. Žaidimų testavimas ir kokybės užtikrinimas (QA) remiasi prielaida, kad tas pats programinio kodo segmentas, esant toms pačioms sąlygoms, visada sugeneruos identišką rezultatą. Kai į gamybos grandinę įpjaunami tikimybiniai modeliai, klaidų fiksavimas tampa tikru košmaru, nes viena ir ta pati procedūrinė anomalija gali pasirodyti tik vienam iš tūkstančio žaidėjų, priklausomai nuo fone veikiančių gijų sinchronizacijos mikrosekundžių tikslumu.
Kūrybinis automatizavimas prieš techninę skolą
Ilgalaikėje perspektyvoje šis entuziazmas gali virsti rimta technine skola, su kuria susidurs būtent galutiniai vartotojai. Jei kūrėjai pradės per daug pasikliauti realiuoju laiku fone generuojamais tūriais, nukentės žaidimų optimizavimas mažesnės galios sistemose bei konsolėse. „Unreal Engine 5“ ir taip yra žinomas kaip itin imlus aparatinės įrangos ištekliams variklis, o papildomas fone veikiančių algoritmų sluoksnis tik dar labiau pakelia reikalavimų kartelę procesoriaus pralaidumui ir SSD disko skaitymo greičiui.
Galiausiai kyla klausimas, ar toks automatizavimas nesunaikins to savito, rankomis nugludinto lygių dizaino (angl. level design), kuris ir pavertė „Tomb Raider“ seriją kultine. Algoritmai puikiai geba užpildyti tuščias erdves matematiškai teisingais uolų ar griuvėsių masyvais, tačiau jie nesupranta emocinio tempo, įtampos auginimo ir vizualinių nuorodų, kurios veda žaidėją per sudėtingus galvosūkius. Todėl ši technologija kol kas turėtų būti vertinama ne kaip revoliucinis dizaineris, o kaip itin pažangus, tačiau priežiūros reikalaujantis skaitmeninis plaktukas.
„Galiausiai viskas susiveda į seną tiesą: dirbtinis intelektas gali akimirksniu sugeneruoti tūkstantį senovinių šventyklų koridorių, tačiau prireiks būrio pamišusių programuotojų, kad Lara Croft juose neužstrigtų tiesiog pirmoje tekstūrų sandūroje.“
Vyr. redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per „LinkedIn“.
Vyr. redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per
Komentarai