Frissítve: 16 perce·Ma: 57
Robotika & CV
AI által generált szöveg

A Physical Intelligence π0.7 modellje betanítás nélkül old meg robotfeladatokat

A San Franciscó-i startup legújabb modellje olyan feladatokra is képes, amelyekre soha nem képezték ki, ami a cég kutatóit is meglepte.

A Physical Intelligence π0.7 modellje betanítás nélkül old meg robotfeladatokat
Fotó: Shahabudin Ibragimov / Unsplash
Forrás: TechCrunchSzerző: AI Forradalom szerk.
Megosztás

A Physical Intelligence, a Szilícium-völgy egyik legfigyelemreméltóbb AI-cége, új kutatást tett közzé, amely szerint legújabb modellje, a π0.7, képes olyan feladatok elvégzésére, amelyekre a robotokat soha nem képezték ki explicit módon — írja a TechCrunch.

Ez a képesség, az úgynevezett kompozíciós általánosítás, lehetővé teszi, hogy a modell különböző kontextusokban tanult készségeket kombinálva oldjon meg korábban nem látott problémákat. Sergey Levine, a Physical Intelligence társalapítója és az UC Berkeley professzora szerint a képességek nem lineárisan, hanem annál gyorsabban növekednek az adatok mennyiségével, hasonlóan a nyelvi és vizuális modellekhez.

A robotok tanulási folyamata

A kutatás egyik legmegdöbbentőbb demonstrációja egy olyan fritőzt érintett, amelyet a modell gyakorlatilag soha nem látott a betanítás során. A kutatók mindössze két releváns epizódot találtak a teljes betanítási adathalmazban: az egyikben egy másik robot egyszerűen becsukta a fritőzt, a másikban pedig egy nyílt forráskódú adathalmazból egy harmadik robot valaki utasítására műanyag palackot helyezett bele. A modell valahogyan szintetizálta ezeket a töredékeket, valamint a szélesebb körű webes előzetes betanítási adatokat, és funkcionális megértést alakított ki a készülék működéséről.

Ashwin Balakrishna, a Physical Intelligence kutatója és a Stanford számítástechnikai PhD hallgatója szerint „nagyon nehéz nyomon követni, honnan származik a tudás, vagy hol fog sikerülni vagy kudarcot vallani a modell”. Ennek ellenére a modell nulla betanítással is elfogadhatóan próbálta használni a készüléket édesburgonya sütésére. Lépésről lépésre adott verbális utasításokkal – mintha egy ember végigvezetné a robotot a feladaton, ahogyan egy új alkalmazottnak elmagyarázna valamit – sikeresen teljesítette azt.

A modell korlátai és lehetőségei

A kutatók nem rejtik véka alá a modell korlátait. Balakrishna elmondta, hogy egy korai fritőz kísérlet mindössze 5%-os sikerességi arányt hozott, de miután fél órát töltöttek a feladat magyarázatának finomításával, az arány 95%-ra ugrott. A modell még nem képes komplex, több lépéses feladatokat önállóan végrehajtani egyetlen magas szintű parancsból, például „készíts nekem pirítóst”. Ha azonban lépésről lépésre vezetik, például „a kenyérpirítóhoz, nyisd ki ezt a részt, nyomd meg azt a gombot, tedd ezt”, akkor „általában elég jól működik”.

A Physical Intelligence eddig több mint 1 milliárd dollár befektetést gyűjtött, és legutóbb 5,6 milliárd dollárra értékelték, a π0.7 modelljének tesztelése 2024-ben kezdődött.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom