Az OpenAI modellje már képes valódi, gazdaságilag releváns munkát végezni
Az OpenAI új modelljének tesztelésében 14 éves szakmai tapasztalattal rendelkező szakértők vettek részt, akik valós feladatokat terveztek, amelyeket az AI és az emberi szakértők is elvégeztek.

Az OpenAI modellje 40%-kal gyorsabb kódot generál, mint az elődje — közölte az OpenAI. A modell fejlesztése során 14 éves szakmai tapasztalattal rendelkező szakértők vettek részt, akik valós feladatokat terveztek, amelyeket az AI és az emberi szakértők is elvégeztek — írja Ethan Mollick az One Useful Thing-en.
A teszt során az AI és az emberi szakértők is elvégezték a feladatokat, majd egy harmadik csoport értékelte a résultatsokat, anélkül, hogy tudták volna, melyik válasz az AI-től, és melyik az emberi szakértőtől származik. Az eredmények azt mutatták, hogy az emberi szakértők nyertek, de az AI is jó teljesítményt nyújtott, és a különbség az iparágak között jelentős volt.
Az AI fejlődése
A Claude Sonnet 4.5 modell képes volt reprodukálni egy összetett közgazdasági tanulmányt, amely korábban csak emberi szakértőknek volt fenntartva.
Ahol a számok beszélnek
Úgy tűnik, a következő generációs AI modellek képesek lesznek legyőzni az emberi szakértőket az átlagban. Az AI csupán egy eszköz, amely segíthet az embereknek a munkájukban, de nem helyettesítheti az emberi interakciót és a komplex munkát.
Március végén várható az új modell nyilvánosságra hozatala az OpenAI-nál, a pontos árképzés egyelőre ismeretlen, de a fejlesztők azon dolgoznak, hogy a modell a lehető legtöbb felhasználó számára elérhető legyen.