Pasitikėjimo kūrimas dirbtinio intelekto agentais: kritiniai SRE komandų reikalavimai technologijos diegimui

Artūras Malašauskas 2026-06-11 5 min skaitymui

Autonominių DI agentų bumas gamybinėse aplinkose atsitrenkia į griežtą SRE komandų skepticizmą – be visiško sprendimų skaidrumo ir „Zero Trust“ saugumo inžinieriai atsisako patikėti kritinės infrastruktūros kontrolę mašinoms.

Skaitmeninės infrastruktūros valdyme prasidėjo esminis lūžis, kai tradicinius automatizavimo scenarijus keičia autonominiai dirbtinio intelekto (DI) agentai, gebantys savarankiškai priimti sprendimus incidentų metu. Kaip pastebi rinkos analitikai, pramonėje stebimas spartus technologijos brandos augimas ir masiškas judėjimas link autonominių sistemų epochos. Tačiau svetainėje McKinsey paskelbta analizė atskleidžia gilų disbalansą: organizacijų taikomi valdymo bei kontrolės mechanizmai nespėja paskui itin greitą DI agentų integraciją į gamybines aplinkas.

Svetainių patikimumo inžinerijos (SRE) komandos, atsakingos už kritinės infrastruktūros stabilumą, demonstruoja pagrįstą skepticizmą ir reikalauja griežto validavimo, kad galėtų visiškai pasitikėti šiais skaitmeniniais asistentais. Incidentų valdymo lyderio PagerDuty atlikti tyrimai rodo, jog net 38 % technologijų sektoriaus vadovų tikisi, kad DI agentai taps pamatine operacijų dalimi jau artimiausiais metais. Vis dėlto, norint pasiekti šį etapą, inžinieriai atsisako pasikliauti „juodosios dėžės“ principais veikiančiais modeliais ir reikalauja absoliutaus sprendimų priėmimo skaidrumo.

Siekdamos apsaugoti sistemas nuo neprognozuojamo elgesio, didžiosios technologijų korporacijos jau keičia savo veiklos gaires. Pavyzdžiui, bendrovės Google SRE komanda viešai akcentuoja, kad bet koks gamybinėje aplinkoje veikiantis DI agentas privalo gebėti aiškiai argumentuoti, kodėl buvo atliktas tam tikras veiksmas, kokios alternatyvos buvo apsvarstytos ir kodėl jos buvo atmestos. Tik per realiu laiku pateikiamą telemetrijos ir sprendimų auditą įmanoma sukurti sinergiją, kurioje žmogus ir DI dirba kaip liaupsę keliantys partneriai.

Skaidrus sprendimų priėmimas ir aiškinamasis DI

SRE specialistams nepakanka žinoti, kad DI agentas sėkmingai suvaldė infrastruktūros incidentą ar sumažino triukšmo lygį stebėjimo sistemose. Kiekviena sugeneruota hipotezė apie šakninę problemos priežastį (RCA) turi būti pagrįsta istoriniais duomenimis, topologijos pokyčiais ir aiškia logika. Jeigu agentas autonomiškai nusprendžia perkrauti serverių klasterį arba pakeisti maršrutizavimo taisykles, inžinieriai privalo matyti visą priežastingumo grandinę, kad būtų išvengta kaskadinių sistemos gedimų.

Griežti saugumo protokolai ir tapatybės valdymas

Didžiausiu barjeru platesniam agentų diegimui išlieka saugumo spragos, susijusios su prieigos teisių valdymu ir duomenų nutekėjimo rizika. Saugumo ataskaitos, kurias publikuoja Gravitee, demonstruoja pavojingą tendenciją: nors daugiau nei 80 % techninių komandų jau aktyviai testuoja arba naudoja DI agentus, tik maža dalis jų turi pilną IT saugumo skyriaus patvirtinimą. SRE komandos reikalauja, kad agentams būtų taikoma „Zero Trust“ architektūra, suteikianti jiems unikalią tapatybę ir tik minimalias operacijoms būtinas teises, užuot naudojus bendrus, nesaugus API raktus.

Nuolatinis vertinimas ir integracija su stebėjimo platformomis

Sėkmingas DI agentų adaptavimas neįmanomas be glaudžios integracijos su esamomis infrastruktūros stebėjimo (angl. observability) platformomis. Pasauliniai technologijų gigantai, tokie kaip Datadog, kuria specializuotas realaus laiko vertinimo platformas, leidžiančias stebėti pačių autonominių agentų elgseną gamybinėse sistemose. Nuolatinis agentų tikrinimas naudojant istorinius incidentų scenarijus leidžia SRE komandoms įsitikinti, kad DI modelis laikosi dokumentuotų procedūrų ir neviršija jam patikėtos autonomijos ribų.

Kas lieka už pranešimų spaudai ribų: nematoma inžinerinė kova dėl kontrolės

Ko nepasako rinkos apžvalgos: tikroji takoskyra tarp DI agentų vizijos ir jų praktinio pritaikymo gamybinėse aplinkose slypi ne algoritmų efektyvume, o žmogaus ir mašinos atsakomybės pasidalijime. SRE komandos dešimtmečius tobulino deterministinius automatizavimo įrankius, kurių elgsena buvo visiškai nuspėjama. Perėjimas prie probabilių, tikimybe grįstų DI sprendimų sukelia kultūrinį šoką inžinerinėje kultūroje, kurioje bet koks neapibrėžtumas tradiciškai laikomas rizika sistemų stabilumui. Dėl šios priežasties pradinė euforija technologijų sektoriuje greitai užleido vietą pragmatiškam, kartais net griežtam reikalavimui pateikti matematinius ir loginius įrodymus prieš suteikiant agentams teisę keisti kritinės infrastruktūros parametrus.

Ši transformacija stipriai keičia ir pačių SRE specialistų kasdienybę bei kompetencijų ribas. Užuot patys rašę scenarijus (angl. playbooks) incidentų valdymui, inžinieriai tampa DI agentų auditoriais ir kuratoriais. Šis vaidmenų pasikeitimas reikalauja gilaus supratimo apie didžiųjų kalbos modelių (LLM) veikimo principus, konteksto langų valdymą ir vadinamųjų „haliucinacijų“ prevenciją. Didžiosiose organizacijose jau dabar kuriasi vidinės platformų inžinerijos grupės, kurių vienintelė užduotis – kurti saugias DI agentų vykdymo aplinkas (angl. sandboxes), kur autonominiai sprendimai yra izoliuojami ir emuliuojami prieš jiems patenkant į realų gamybinį tinklą.

Istorinė patirtis rodo, kad bet koks skubotas automatizavimo diegimas be pakankamo matomumo anksčiau ar vėliau lemia katastrofiškus gamybinių aplinkų gedimus. Stakeholderių lūkesčiai greitai sumažinti veiklos sąnaudas dažnai susiduria su realybe, kai DI agentas, spręsdamas lokalią problemą, sukelia globalią kaskadinę avariją visoje debesų kompiuterijos infrastruktūroje. Štai kodėl patyrę technologijų architektai pabrėžia, kad pasitikėjimas nėra vienkartinis sprendimas ar sertifikatas. Tai yra tęstinis procesas, reikalaujantis nuolatinio agentų elgsenos stebėjimo ir jų teisių gradacijos, pradedant nuo patariamosios funkcijos ir tik po ilgų testavimo mėnesių pereinant prie ribotos autonomijos veiksmų.

Skeptiko žvilgsnis: autonomijos paradoksas ir nepatogi skaitmenizacijos tiesa

Žvelgiant giliau į detales: rinkoje vyraujantis optimizmas dėl autonominių DI agentų kuria iliuziją, kad operacijų valdymas netrukus taps visiškai nepriklausomas nuo žmogaus įsikišimo. Tačiau gilesnė analizė atskleidžia esminį paradoksą: siekdamos apsisaugoti nuo DI klaidų, organizacijos yra priverstos kurti dar sudėtingesnes stebėjimo, audito ir validavimo sistemas. Rezultatas – užburtas ratas, kuriame inžinerinis sudėtingumas ne sumažėja, o tiesiog persikelia į kitą lygmenį. Užuot prižiūrėjusios pačią infrastruktūrą, SRE komandos dabar privalo prižiūrėti DI agentus, prižiūrinčius tą infrastruktūrą, o tai padidina technologinio stoso trapumą ir sukuria naujų, dar nepažintų gedimo vektorių.

Kitas sisteminis prieštaravimas kyla iš pačios DI modelių prigimties, kuri prieštarauja pamatiniams SRE principams. Šiuolaikinė svetainių patikimumo inžinerija yra grįsta determinizmu, pakartojamumu ir absoliučiu nuspėjamumu. Tuo tarpu didieji kalbos modeliai ir agentinės sistemos pagal savo architektūrą yra stochastinės – tas pats signalas ar incidentas skirtingu metu gali iššaukti visiškai skirtingą agento reakciją. Bandymai įsprausti šiuos dinamiškus modelius į griežtus korporatyvinius rėmus dažnai neutralizuoja jų pagrindinį privalumą – kūrybišką problemų sprendimą, palikdami organizacijas su brangiu, bet iš esmės apribotu įrankiu, kuris veikia ne geriau už tradicinius scenarijus.

Žvelgiant į ateitį, reali DI agentų vertė išryškės tik tada, kai pramonė nustos juos vertinti kaip magišką panacėją ir pradės traktuoti kaip jaunesniuosius kolegas su ribota atsakomybe. Tikrasis lūžis įvyks ne tada, kai agentas sugebės savarankiškai išspręsti sudėtingiausią sistemos architektūros krizę, o tada, kai jis sugebės laiku ir tiksliai pasakyti „aš nežinau“ ir perduoti valdymą žmogui. Iki to laiko technologijų vadovai privalo išlaikyti sveiką skepticizmą ir suprasti, kad joks autonominis agentas neapsaugos nuo prastovų, jei pati sistemų architektūra bus pasenusi, o procesai – chaotiški.

„Galiausiai visi DI agentai susiduria su ta pačia sena tiesa: mašina gali rasti klaidą per milisekundę, tačiau jai vis tiek reikės žmogaus, kuris po to tris valandas aiškinsis, kodėl ta mašina nusprendė išjungti pagrindinį duomenų centrą tiesiog norėdama sutaupyti elektros energijos.“

Vyr. redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per „LinkedIn“.