A Microsoft összefogatta a GPT-t és a Claude-ot: az egyik ír, a másik ellenőriz
A Microsoft 365 Copilot új Critique funkciójában az OpenAI GPT generálja a válaszokat, az Anthropic Claude pedig felülvizsgálja azokat — 13,8%-kal pontosabb eredményeket hozva.
A Microsoft március 30-án bemutatta a Microsoft 365 Copilot Researcher új funkcióját, amely az AI-ipar két legnagyobb riválisát fogja össze egyetlen munkafolyamatban. A Critique nevű rendszerben az OpenAI GPT modellje generálja a kutatási válaszokat, az Anthropic Claude modellje pedig átnézi és kijavítja azokat, mielőtt a felhasználó megkapná. Két, egymással nyíltan versengő AI-óriás termékei így először dolgoznak együtt egy kereskedelmi termékben.
A rendszer működése egyszerű, de hatékony: a GPT megírja a választ egy kutatási kérdésre, majd a Claude felülvizsgálja a pontosságot, a teljességet és a hivatkozások minőségét. Jelenleg az együttműködés egyirányú — a GPT mindig ír, a Claude mindig ellenőriz —, de a Microsoft jelezte, hogy a jövőben kétirányúvá teszi a folyamatot, amelyben a felhasználó választhatja meg, melyik modell milyen szerepet kapjon.
Az eredmények figyelemre méltóak: a többmodelles megközelítés 13,8 százalékos javulást hozott a DRACO teljesítményteszten a korábbi, egymodelles rendszerhez képest. A gyakorlatban ez azt jelenti, hogy a Copilot Researcher válaszai pontosabbak, átfogóbbak és megbízhatóbb forrásokra hivatkoznak, mint korábban.
A Critique mellett a Microsoft a Copilot Cowork nevű funkciót is kiterjeszti. Ez egy Claude-alapú önálló ügynök, amely többlépéses feladatokat tud tervezni és végrehajtani emberi beavatkozás nélkül — például adatelemzést futtatni, jelentéseket összeállítani vagy prezentációkat készíteni a felhasználó munkastílusához igazodva. A Cowork a Frontier programon keresztül érhető el korai hozzáférésben.
A lépés egyértelműen jelzi, hogy a Microsoft AI-stratégiája többgyártós irányba mozdult el. A vállalat — amely az OpenAI legnagyobb befektetője — most hivatalosan is integrálja a fő versenytárs Anthropic technológiáját a zászlóshajó irodai termékeibe. Ez a pragmatikus megközelítés azt mutatja, hogy az iparágban a legjobb eredményeket már nem egyetlen modell, hanem a modellek együttműködése hozza.
A fejlesztés különösen a nagyvállalati felhasználók számára ígéretes, ahol a kutatási válaszok pontossága üzleti döntéseket befolyásol. A rivális AI-rendszerek egymást ellenőrző működése olyan minőségbiztosítási réteget ad, amelyet egyetlen modell önmagában nem képes nyújtani — és ez az irány valószínűleg az egész iparágban meghatározó lesz.