A Physical Intelligence új robotmodellje, a π0.7 LLM-szerű általánosítást mutat
A π0.7 nevű modell a Google Gemma3 nyelvi modelljére épül, és 80 százalékos sikerrel hajtott végre ismeretlen feladatokat ipari robotokon.

A Physical Intelligence amerikai startup bemutatta a π0.7 nevű új robot alapmodelljét, amely a betanítás során elsajátított készségeket képes rekombinálni, hasonlóan ahhoz, ahogyan egy nyelvi modell újrarendezi a szövegtöredékeket a betanítási adataiból — írja a The Decoder.
A kutatók ezt a robotikában a „kompozíciós általánosítás” korai jeleként írják le. A modell alapját a Google nyílt forráskódú, négymilliárd paraméteres Gemma3 nyelvi modellje adja, amelyet egy kisebb, 860 millió paraméteres akció szakértővel párosítottak, amely a tényleges robotmozgásokat generálja. A PI szerint azonban nem az architektúra, hanem a betanítási módszer a döntő.
A korábbi robotmodellek jellemzően csak rövid feladatleírást kaptak a betanítás során, például „hajtsd össze a pólót”. A π0.7 emellett számos kontextuális információt is kap: természetes nyelven megfogalmazott alfeladat-utasításokat, a demonstráció minőségére és sebességére vonatkozó epizód metaadatokat, vezérlési mód címkéket, sőt még részcél képeket is, amelyek megmutatják, hogyan nézzen ki egy köztes lépés eredménye.
A robotika új dimenziója
A PI szerint egyetlen π0.7 modell megfelel a korábban RL-finomhangolt π*0.6 specialisták teljesítményének a ruhaösszehajtás, eszpresszókészítés és dobozépítés terén. A kereszt-embodiment transzfer is működik: egy kétkarú UR5e ipari manipulátor 80 százalékos sikerrel hajtogatott pólókat, annak ellenére, hogy ehhez a robothoz nem gyűjtöttek hajtogatási adatokat.
A skálázás kulcsa
A π0.7 azt sugallja, hogy a robot alapmodellek olyan méretet érnek el, ahol a nagy nyelvi modellekhez hasonló hatások válnak láthatóvá: a prompt jellege jelentősen megnő, a teljesítmény nagymértékben függ a megadott kontextustól, és a „valódi” általánosítás, a remixelés és a hasonló példák visszakeresése közötti különbségtétel válik a központi értékelési problémává. A Physical Intelligence 2024-ben tervezi a π0.7-hez hasonló modellek továbbfejlesztését.