A Generalist GEN-1 modellje 99%-os megbízhatósággal hajt végre komplex feladatokat
A rendszer képes improvizálni, új mozdulatokat kitalálni zavaró tényezők jelenlétében, és háromszor gyorsabban hajtja végre a feladatokat, mint az előző modell

A Generalist GEN-1 nevű fizikai AI-rendszere 99%-os megbízhatósággal hajt végre összetett feladatokat, miközben háromszor gyorsabb, mint elődje, a GEN-0 — írja az Ars Technica.
A modell a gyártási szintű sikerességi rátát is eléri számos fizikai feladatban, amelyek korábban emberi kézügyességet és izommemóriát igényeltek. A rendszer képes improvizálni is, új mozdulatokat kitalálni zavaró tényezők esetén, és összekapcsolni különböző ötleteket új problémák megoldásához.
A GEN-1 a Generalist korábbi GEN-0 modelljére épül, amelyet még novemberben mutattak be. Akkor a skálázási törvények alkalmazhatóságát demonstrálták a robotika betanításában, kimutatva, hogy több előzetes betanítási adat és számítási idő javítja a teljesítményt.
Míg a nagy nyelvi modellek az interneten gyűjtött szövegek milliárdjait dolgozzák fel, a robotikai modelleknek nincs hasonlóan könnyen hozzáférhető, minőségi adatforrásuk arról, hogyan manipulálják az emberek a tárgyakat. Ennek megoldására a Generalist úgynevezett „adatkezeket” használ, amelyek viselhető csipeszekként rögzítik az emberi kéz mikro-mozgásait és a vizuális információkat manuális feladatok végzése közben. A vállalat állítása szerint már több mint félmillió órányi és petabájtnyi fizikai interakciós adatot gyűjtöttek össze a modell betanításához.
Az autonóm rendszer így elég pontos ahhoz, hogy pénzt tegyen egy pénztárcába, és elég adaptív ahhoz, hogy ruhát hajtogasson vagy autóalkatrészeket válogasson. A Generalist szerint a modell 99%-os sikerességi rátát ér el olyan ismétlődő, de finom mechanikai feladatoknál, mint a dobozhajtogatás, telefonok csomagolása és robotporszívók szervizelése. A GEN-1 mindezt úgy éri el, hogy mindössze körülbelül egy órát tölt az előzetes betanítás adaptálásával a „robotadatokhoz”, amelyek az adott robot specifikus testfelépítéséhez igazodnak.
A hibákból tanuló robot
A múltban a komplex robotrendszerek általában gondosan előreprogramozott mozgásokra támaszkodtak, vagy kizárólag egyetlen feladatra képezték ki őket, kevés variációval. A Generalist szerint a GEN-1-et a különbözteti meg, hogy egyetlen modell képes improvizálni korábbi tapasztalatai alapján, és természetesen reagálni a zavaró tényezőkre, még akkor is, ha azok „messze kívül esnek a betanítási eloszlásból”. Például a Forbesnak adott interjúban a Generalist mérnökei leírják, hogyan ráz meg a modell egy műanyag zacskót, hogy egy plüssjáték belecsússzon, még akkor is, ha ez a mozdulat nem volt kifejezetten beprogramozva a betanítási adatokba. A Generalist által közzétett videó is bemutatja, ahogy a robotkezek intelligensen alkalmazkodnak, amikor rugalmas tárgyak kiugranak a várt pozíciójukból, vagy újra összehajtanak egy inget, amelyet egy hajtogatási feladat közepén mozdítanak el.
A Generalist mérnöke, Felix Wang a videóban hangsúlyozta, hogy a robotot senki sem programozta hibázásra, ezért a hibákból való felépülésre sem. „És ez csak úgy megtörténik” — tette hozzá. A Generalist szerint fizikai modelljeik elérték a GPT-3-hoz hasonló fordulópontot, ahol egyes feladatok „átlépik a gazdaságilag hasznos környezetben való telepítéshez szükséges teljesítményszintet”, és ahol „minden új modellgenerációtól egyre összetettebb feladatok elsajátítását várhatjuk”.