„Alibaba“ metė kortą fiziniam AI: pristatyti robotams skirti modeliai, išmokysiantys mašinas mąstyti realiame pasaulyje
Pokalbių robotų era, regis, pamažu užleidžia vietą kai kam kur kas apčiuopiamesniam, o technologijų milžinė „Alibaba“ nusprendė nelaukti užribyje. Kinijos e-komercijos ir debesų kompiuterijos lyderė žengė ambicingą žingsnį į vadinamojo fizinio arba įkūnytojo dirbtinio intelekto (angl. embodied AI) teritoriją. Bendrovės tyrimų padalinys „Tongyi Lab“ oficialiai pristatė specializuotų AI modelių rinkinį, skirtą robotų galimybėms išplėsti, apie ką pranešė Reuters.
Šis debiutas žymi strateginį posūkį visoje technologijų pramonėje – nuo tekstą generuojančių asistentų pereinama prie autonominių agentų, gebančių suprasti fizinius dėsnius ir valdyti mechaninius kūnus. Naujasis įrankių rinkinys, pavadintas „Qwen-Robot Suite“, sukonstruotas tam, kad padėtų mašinoms sklandžiai prisitaikyti prie nepažįstamos aplinkos, interpretuoti užduotis, pateiktas paprasta žmonių kalba, ir akimirksniu apdoroti gausius jutiklių duomenis. Tai nebėra tik laboratoriniai eksperimentai, nes „Alibaba“ jau pradėjo realaus pasaulio bandomuosius testus su atrinktais pramoniniais „Alibaba Cloud“ klientais robotikos sektoriuje.
Trispalvė išmanioji architektūra: nuo kojų iki smegenų
„Alibaba“ inžinieriai robotų intelektą išskirstė į tris tarpusavyje susietus sluoksnius, kurių kiekvienas atlieka unikalią funkciją. Pirmasis sistemos elementas yra „Qwen-RobotNav“ – navigacijos modelis, atsakingas už erdvės suvokimą ir maršrutų planavimą. Kaip savo tinklaraštyje teigia kūrėjai iš Qwen, šis modelis leidžia mašinai judėti nepažįstamose patalpose ar gamyklų zonose, orientuojantis pagal vizualinius orientyrus ir žodines instrukcijas be jokio išankstinio skaitmeninio žemėlapio.
Antrasis komponentas, pavadintas „Qwen-RobotWorld“, veikia kaip vaizdo duomenimis grįstas pasaulio simuliatorius. Jis leidžia robotui prognozuoti ir virtualiai sumodeliuoti, kaip pasikeis aplinka po jo atlikto veiksmo, dar prieš fiziškai pajudinant mechaninę dalį. Galiausiai, už fizinį užduočių įvykdymą atsakingas „Qwen-RobotManip“ modelis, pritaikytas preciziškam manipuliavimui objektais nelygiose ir nestruktūrizuotose erdvėse.
Konkurencinė kova persikelia į gamyklas
Šis technologinis šuolis įvyko itin įtemptu metu, kai pasauliniai gigantai, įskaitant „Nvidia“ su savo fiziniam AI skirtais modeliais, bando užimti kuo geresnes pozicijas pramoninės automatizacijos rinkoje, pastebi PYMNTS.com. „Alibaba“ generalinis direktorius Eddie Wu jau anksčiau užsiminė, kad su AI susiję produktai ateityje taps pagrindiniu debesų kompiuterijos segmento pajamų varikliu. Sukurdama vientisą ekosistemą nuo algoritmų iki debesų infrastruktūros, bendrovė tikisi transformuoti sandėlių logistiką, gamybos linijas ir pristatymo sistemas, paversdama teorinį AI pranašumą realiu pramoniniu produktyvumu.
Gilioji analizė: kas slepiasi už robotų smegenų revoliucijos
Už blizgių prezentacijų fasado: Tikroji „Alibaba“ ambicija nėra tiesiog sukurti dar vieną programinį įrankį logistikos įmonėms. Bendrovė sąmoningai taikosi į skaudžiausią dabartinės robotikos vietą – vadinamąjį Moraveco paradoksą, teigiantį, kad mašinoms yra nepalyginamai lengviau išlaikyti sudėtingus intelekto testus nei išmokti elementarių trijų metų vaiko motorinių įgūdžių. Iki šiol pramoniniai robotai veikė kaip akli vykdytojai, užprogramuoti atlikti milimetro tikslumo judesius identiškoje aplinkoje. Vos tik ant konvejerio linijos pasirodydavo ne ta puse pasukta detalė, visa sistema sustodavo, reikalaudama žmogaus įsikišimo. „Qwen-Robot Suite“ pristatymas rodo, kad technologijų sektorius pagaliau turi pakankamai skaičiavimo galios, kad suteiktų mašinoms dinaminį grįžtamąjį ryšį realiuoju laiku.
Istorinis kontekstas leidžia suprasti, kodėl šis žingsnis žengtas būtent dabar. Pastaruosius dvejus metus technologijų rinka buvo persisotinusi dideliais kalbos modeliais (LLM), kurie, nepaisant savo iškalbingumo, liko uždaryti ekranuose ir serveriuose. Ekspertai vis garsiau kalbėjo apie „AI žiemos“ grėsmę, jei generatyvinis intelektas nepradės kurti apčiuopiamos ekonominės vertės fiziniame pasaulyje. „Alibaba“, valdanti milžinišką e-komercijos ir sandėlių tinklą „Cainiao“, turi idealią poligoninę aplinką šių modelių testavimui. Tai suteikia bendrovei strateginį pranašumą prieš Vakarų konkurentus, kurie dažnai privalo pasikliauti vien tik kompiuterinėmis simuliacijomis arba ribotomis laboratorijomis.
Azijos technologijų analitikai pastebi, kad šis žingsnis taip pat atspindi platesnius demografinius ir ekonominius pokyčius regione. Kinija susiduria su sparčiai senstančia visuomene ir traukiausiomis darbo jėgos atsargomis gamybos sektoriuje, todėl autonominių sistemų poreikis čia yra nebe prabangos, o išgyvenimo klausimas. Pereidama nuo tekstinių asistentų prie fizinių agentų kūrimo, „Alibaba“ bando užsitikrinti nepakeičiamos infrastruktūros tiekėjos vaidmenį būsimoje Azijos pramonės transformacijoje. Bendrovės vadovybė neslepia, kad integracija su „Alibaba Cloud“ paslaugomis yra pagrindinis šios strategijos ašies elementas, leisiantis monetizuoti AI modelius per ilgalaikes prenumeratas.
Vis dėlto, užkulisiuose inžinieriai pripažįsta, kad perėjimas prie įkūnytojo intelekto kelia milžiniškų techninių iššūkių. Didieji kalbos modeliai gali leisti sau klysti ar „haliucinuoti“ tekste, tačiau roboto klaida fizinėje erdvėje reiškia sugadintą brangią įrangą arba realų pavojų gamyklos darbuotojų saugumui. Būtent todėl „Qwen-RobotWorld“ simuliatoriaus vaidmuo yra toks kritinis. Gebėjimas iš anksto „pamatyti“ savo veiksmo pasekmes leidžia algoritmams atmesti nesaugius trajektorijos variantus dar prieš aktyvuojant mechaninius variklius, o tai priartina autonomines mašinas prie intuityvaus elgesio modelio, kurį žmonės naudoja kasdienybėje.
Skeptiko žvilgsnis: technologinis akligatvis ar pramoninė realybė
Žvelgiant giliau į technologinį optimizmą: Nors „Alibaba“ pristatyti „Qwen-Robot“ modeliai ant popieriaus atrodo kaip revoliucinis proveržis, praktinis jų įgyvendinimas susiduria su rimtomis inžinerinėmis ir ekonominėmis realijomis. Didžioji dalis dabartinio triukšmo aplink fizinį AI yra pagrįsta prielaida, kad programinė įranga gali lengvai išspręsti aparatinės įrangos trūkumus. Realybėje joks pažangiausias neuroninis tinklas negali kompensuoti lėtų mechaninių pavarų, netikslių jutiklių ar riboto baterijų veikimo laiko. Technologijų gigantai dažnai demonstruoja įspūdingus vaizdo įrašus iš sterilių laboratorijų, tačiau gamyklos grindys yra pilnos dulkių, vibracijų ir nuolat kintančio apšvietimo, kur net patys galingiausi modeliai pradeda strigti.
Čia išryškėja ir akivaizdus ekonominis prieštaravimas, kurį pramonės lyderiai linkę nutylėti. Didžiųjų AI modelių apmokymas ir palaikymas reikalauja astronominių skaičiavimo išteklių bei milžiniškų energijos sąnaudų. Jei roboto valdymui realiame laike reikia nuolatinio didelio pralaidumo ryšio su debesų serveriu, kyla ne tik kibernetinio saugumo, bet ir elementaraus atsiperkamumo klausimas. Daugelis smulkių ir vidutinių gamybos įmonių tiesiog negalės sau leisti mokėti milžiniškų prenumeratos mokesčių už „intelektualią“ sistemą, kai tradicinė, paprastais algoritmais grįsta automatizacija tą patį darbą atlieka pigiau ir patikimiau. „Alibaba“ bando sukurti poreikį produktui, kurio infrastruktūros kaina kol kas viršija jo teikiamą naudą.
Be to, masinė integracija neišvengiamai atsimuš į reguliavimo ir teisinių atsakomybių sieną. Kai autonominis robotas priima sprendimą, pagrįstą tikimybiniais AI modelio skaičiavimais, ir padaro klaidą, kas prisiima teisinę atsakomybę už prastovas ar sugadintą produkciją. Modelio kūrėjas, debesų paslaugos tiekėjas ar gamyklos savininkas. Kol šie klausimai lieka pilkojoje zonoje, didieji pramonės žaidėjai elgsis labai atsargiai, o naujieji robotikos modeliai greičiausiai liks izoliuoti specifinėse bandomosiose zonose. Todėl šis „Alibaba“ žingsnis labiau primena ilgalaikį vėliavos persmeigimą ateities teritorijoje, o ne produktą, kuris jau rytoj pakeis pasaulinę gamybos grandinę.
„Galiausiai, didžiausias paradoksas lieka tas pats: mes išmokėme dirbtinį intelektą tapyti paveikslus, rašyti esė ir programuoti, tačiau vis dar negalime sukurti roboto, kuris be panikos priepuolio sugebėtų ištuštinti indaplovę pramoninėje virtuvėje.“
Vyr. redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per „LinkedIn“.
Vyr. redaktorius Artūras Malašauskas, DI sistemų integratorius, sukaupęs daugiau nei 20 metų patirties kuriant gamybinio lygio žiniatinklio inžinerijos sprendimus. Jis projektavo, diegė ir plėtė verslo klasės „Python“/„PHP“ sistemas logistikos, SaaS bei viešojo sektoriaus klientams. Pastaruosius metus jis specializuojasi išskirtinai DI integracijų srityje: diegia atvirojo kodo didžiuosius kalbos modelius (LLM), kuria generatyvinių medijų (vaizdo, garso, video) srautus bei projektuoja daugiagentines darbo eigas realioms gamybinėms aplinkoms. Jo standartas: atkuriamumas, saugumas ir ekonomiškai efektyvi išvestis – jokio „vaporware“. Artūras dokumentuoja bei vertina naujus DI įrankius, atskirdamas patvirtintas galimybes nuo rinkodarinio triukšmo. Techninis redaktorius svetainėse: ai-naujienos.lt, ai-verslas.lt, muza-ai.eu. Susisiekite per
Komentarai