Mira Murati új cége, a Thinking Machines valós idejű interakciós modelleket fejleszt
Az OpenAI korábbi technológiai vezetője, Mira Murati által alapított Thinking Machines olyan mesterséges intelligencia rendszereket fejleszt, amelyek képesek folyamatosan feldolgozni hangot, videót és szöveget, valós időben reagálva a felhasználókra.

„Interakciós modellek” koncepcióját mutatta be a Thinking Machines, Mira Murati, az OpenAI korábbi technológiai igazgatójának cége — írja a The Verge. Ezek a modellek lehetővé teszik az emberek számára, hogy „úgy működjenek együtt az AI-val, ahogyan természetesen együttműködnek egymással”.
A Thinking Machines szerint a jelenlegi AI-modellek „egyszálas valóságot tapasztalnak”. Ez azt jelenti, hogy a felhasználó befejezi a gépelést vagy beszédet, mielőtt a modell reagálna, és fordítva. Ez a korlátozott kommunikációs csatorna gátolja az ember és AI közötti együttműködést, mivel kevésbé jut el a felhasználó tudása és szándéka a modellhez, és a modell munkája is nehezebben érthető.
Az interakció új dimenziója
A Thinking Machines célja, hogy megoldja ezt a „sávszélesség-szűkületet azáltal, hogy az AI-t valós időben interaktívvá teszi bármely modalitáson keresztül”. Ezáltal az AI-felületek alkalmazkodnak az emberekhez, nem pedig fordítva.
A cég több példát is bemutatott a modell működésére, például állatok említésének felismerését egy történetben, valós idejű beszédfordítást, vagy a testtartás korrekcióját.
A jövő hangja
A Thinking Machines egy korlátozott kutatási előzetest tervez a következő hónapokban, szélesebb körű bevezetésre pedig az év későbbi szakaszában számítanak, a The Verge szerint 2024-ben várható a szélesebb körű bevezetés.