Aparatinės ir programinės įrangos sinergija: žvilgsnis į „Jio“ ir „Google“ biudžetinio dirbtinio intelekto telefono architektūrą
Išmaniųjų telefonų rinka jau seniai įstrigo uždarame rate, kur tikrosios technologinės inovacijos rezervuojamos tik tiems, kurie gali sau leisti keturženkles sumas. Tačiau naujausias „Reliance Jio“ ir „Google“ aljansas rodo, kad ši paradigma keičiasi iš esmės. Ambicingas bendras projektas pristatyti masinei rinkai pritaikytą, pigų dirbtinio intelekto (DI) telefoną žada ne šiaip dar vieną biudžetinį įrenginį, o visiškai naują požiūrį į tai, kaip nebrangi aparatinė įranga gali bendradarbiauti su pažangiais mašininio mokymosi modeliais.
Šis žingsnis yra natūrali jų ilgalaikės strategijos evoliucija. Prisimenant, kaip abiejų technologijų milžinių sukurta „Pragati OS“ platforma bandė skaitmenizuoti Indijos regionus, naujasis 2026 m. architektūros modelis žengia dar toliau, integruodamas giliąsias mašininio mokymosi funkcijas ten, kur anksčiau neužtekdavo nei operatyviosios atminties, nei procesoriaus resursų.
Hibridinė architektūra: kai lustas ir debesis veikia išvien
Didžiausias iššūkis kuriant biudžetinį DI telefoną – suderinti ribotą vietinę skaičiavimo galią su milžiniškais neuroninių tinklų reikalavimais. „Google“ inžinieriai šią problemą išsprendė pritaikydami specifinį hibridinį modelį. Vietoj to, kad brangus ir energijai imlus neuroninis procesorius (NPU) atliktų visas užduotis pačiame įrenginyje, architektūra buvo suprojektuota taip, kad kritinės, privatumo reikalaujančios užduotys vyktų lokaliai, o sudėtingesnės generatyvinio intelekto operacijos būtų deleguojamos optimizuotai debesijos infrastruktūrai.
Tam pasitarnauja glaudus programinės įrangos optimizavimas, leidžiantis operacinei sistemai dinamiškai suspausti modelius. Šis procesas remiasi pažangiais kvantavimo algoritmais, kurie sumažina DI modelio svorį, neaukodami konteksto supratimo kokybės. Rezultatas – telefonas veikia sklandžiai, o vartotojo sąsaja nereaguoja su pastebimu vėlavimu, net kai fone apdorojami sudėtingi kalbos ar vaizdo atpažinimo procesai.
Našumo metrikos ir realus efektyvumas
Skeptikai iškart bakstelės pirštu į sintetinį našumą, tačiau realūs sistemos testai rodo ką kita. Kadangi „Google“ pastaruoju metu investuoja milžiniškas lėšas į savo DI infrastruktūros plėtrą, kaip užfiksuota „Remio“ technologijų apžvalgoje, šis pasirengimas tiesiogiai atsispindi galutinio vartotojo patirtyje. Įrenginio atsako laikas atliekant kasdienes užduotis su Gemini ekosistema, pavyzdžiui, realaus laiko vertimą ar išmanųjį teksto generavimą, buvo sumažintas iki minimalių milisekundžių verčių.
Energijos suvartojimo efektyvumas taip pat demonstruoja stebėtinus skaičius. Dėl išmanaus užduočių paskirstymo tarp lokalaus mikro-NPU ir išorinių serverių, baterijos nusidėvėjimas DI sesijų metu išaugo vos keliais procentais, lyginant su įprastu naršymu. Tai pasiekta panaudojus naują predikcinį algoritmą, kuris numato vartotojo veiksmus ir pažadina DI procesus tik tiksliu momentu, taip išvengiant nuolatinio procesoriaus branduolių apkrovimo aukščiausiu dažniu.
Aizkulisiniuose sistemos procesuose: pagrindinis šios architektūros inžinerinis triumfas slepiasi ne pačiuose dirbtinio intelekto modeliuose, o giliame Linux branduolio lygio modifikavime. Tradicinės Android sistemos dažnai susiduria su atminties trūkumu, kai fone veikia resursams imlios paslaugos, tačiau „Google“ inžinieriai šiuo atveju pritaikė agresyvų puslapių reclaimingą (angl. page reclaiming) ir patobulintą Low Memory Killer Daemon (LMKD) mechanizmą. Sistemos atminties valdiklis iš anksto rezervuoja fiksuotus puslapius tik mašininio mokymosi modelių svoriams, užkizdamas kelią procesų fragmentacijai, kuri paprastai paralyžiuoja pigių įrenginių su 4GB ar 6-GB operatyviąja atmintimi darbą.
Kadangi kiekvienas procesoriaus taktas biudžetiniame luste yra brangus, inžinieriai atsisakė standartinio FP32 (32 bitų slankiojo kablelio) tikslumo skaičiavimų. Vietoj to sistemoje integruotas aparatinis INT8 ir FP16 modelių kvantavimas per specialiai modifikuotą Android Neural Networks API (NNAPI) tvarkyklę. Tai leidžia atlikti tenzorines operacijas tiesiogiai procesoriaus instrukcijų lygiu, naudojant SIMD (Single Instruction, Multiple Data) architektūrą, kas dramatiškai sumažina reikalingų atminties pralaidumo ciklų skaičių ir leidžia išvengti termoreguliacinio taktų mažinimo.
Kitas kritinis sisteminės inžinerijos aspektas – asimetrinis užduočių planavimas tarp procesoriaus branduolių. Naudojant patobulintą Energy-Aware Scheduling (EAS) algoritmą, operacinė sistema realiu laiku analizuoja gaunamus DI užklausų paketus; smulkios užduotys, pavyzdžiui, kontekstinis teksto nuspėjimas, nukreipiamos į energiją taupančius branduolius, o didesni neuroninių tinklų aktyvavimo grafai apdorojami trumpais, intensyviais pliūpsniais didžiuosiuose branduoliuose, iškart po to grąžinant mikroschemą į žemo vartojimo būseną.
Galiausiai, tinklo posistemėje įdiegtas dinaminis paketų prioritetizavimas (Quality of Service) branduolio lygiu. Kai lokalaus modelio tikslumo nepakanka ir užklausa turi būti deleguojama į debesį, telefonas naudoja modifikuotą TCP BBR kongestijos kontrolės algoritmą, optimizuotą specialiai „Jio“ 5G tinklo infrastruktūrai, užtikrinant, kad DI duomenų paketai turėtų mažesnį vėlinimą nei įprastas fone siunčiamas medijos srautas. Toks visapusiškas aparatinės ir programinės įrangos suderinamumas paverčia teorinį našumą realiu, stabiliu funkcionalumu.
Rinkos realybė ir paslėptos architektūros kainos
Žvelgiant giliau į detales: technologijų pramonė yra meistriškai įvaldžiusi gražių pažadų meną, tačiau už entuziastingų pranešimų spaudai apie „dirbtinį intelektą visiems“ visada slepiasi prozaiški ekonominiai kompromisai. Didžiausias šio ambicingo projekto paradoksas yra tas, kad mažindami pačio įrenginio gamybos sąnaudas, „Jio“ ir „Google“ tiesiog perkelia finansinę naštą kitur. Lokalus skaičiavimų kvantavimas ir modelių apkarpymas iki INT8 tikslumo turi aiškias ribas, o tai reiškia, kad vartotojai neišvengiamai bus priklausomi nuo hibridinio modelio debesijos dalies, kurios išlaikymas generuoja nuolatines, astronomines išlaidas serverių infrastruktūrai.
Ši priklausomybė nuo debesų infrastruktūros sukuria akivaizdžią prieštarą pačiai pigių įrenginių koncepcijai. Jei telefonas tampa funkcionalus tik esant stabiliam, didelės spartos 5G ryšiui, jo efektyvumas regionuose su prastesne infrastruktūra drastiškai krenta. Be to, iškyla esminis klausimas dėl monetizacijos ilgalaikėje perspektyvoje; jei vartotojas už įrenginį sumoka minimalią sumą, gamintojas bus priverstas ieškoti būdų, kaip susigrąžinti lėšas už DI užklausų apdorojimą serveriuose, o tai dažniausiai reiškia agresyvesnį duomenų rinkimą tikslinėms reklamoms arba tam tikrų funkcijų perkėlimą už mokamos prenumeratos sienos.
Skepticizmo kelia ir pati 2026 metų rinkos dinamika, kurioje šie įrenginiai turės konkuruoti su jau dabar pingančiais senesnių kartų flagmanais. Nors inžineriniai sprendimai, tokie kaip energiją taupantis EAS algoritmų modifikavimas, skamba įspūdingai, jie tik kompensuoja silpnos aparatinės įrangos trūkumus, bet nepadaro jos pranašesne. Rizika, kad šis revoliuciniu vadinamas DI telefonas po kelių operacinės sistemos atnaujinimų tiesiog pavirs dar vienu stringančiu biudžetiniu įrenginiu, išlieka itin didelė, ypač žinant, kaip greitai auga pačių neuroninių tinklų apetitas resursams.
Galutinis šios technologinės demokratizacijos rezultatas tikriausiai bus toks: vartotojai pagaliau gaus nebrangų kišeninį superkompiuterį, kuris bus pakankamai protingas, kad suprastų, jog savininkas neturi pinigų brangesniam modeliui, ir pakankamai mandagus, kad apie tai praneštų be jokio pastebimo vėlavimo.
Redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per „LinkedIn“.
Redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per
Komentarai