Frissítve: 15 perce·Ma: 49
Modellek & LLM
AI által generált szöveg

Az OpenAI modellje már képes valódi, gazdaságilag releváns munkát végezni

Az OpenAI új modelljének tesztelésében 14 éves szakmai tapasztalattal rendelkező szakértők vettek részt, akik valós feladatokat terveztek, amelyeket az AI és az emberi szakértők is elvégeztek.

Az OpenAI modellje már képes valódi, gazdaságilag releváns munkát végezni
Fotó: Vered Caspi / Unsplash
Forrás: One Useful ThingSzerző: AI Forradalom szerk.
Megosztás

Az OpenAI modellje 40%-kal gyorsabb kódot generál, mint az elődje — közölte az OpenAI. A modell fejlesztése során 14 éves szakmai tapasztalattal rendelkező szakértők vettek részt, akik valós feladatokat terveztek, amelyeket az AI és az emberi szakértők is elvégeztek — írja Ethan Mollick az One Useful Thing-en.

A teszt során az AI és az emberi szakértők is elvégezték a feladatokat, majd egy harmadik csoport értékelte a résultatsokat, anélkül, hogy tudták volna, melyik válasz az AI-től, és melyik az emberi szakértőtől származik. Az eredmények azt mutatták, hogy az emberi szakértők nyertek, de az AI is jó teljesítményt nyújtott, és a különbség az iparágak között jelentős volt.

Az AI fejlődése

A Claude Sonnet 4.5 modell képes volt reprodukálni egy összetett közgazdasági tanulmányt, amely korábban csak emberi szakértőknek volt fenntartva.

Ahol a számok beszélnek

Úgy tűnik, a következő generációs AI modellek képesek lesznek legyőzni az emberi szakértőket az átlagban. Az AI csupán egy eszköz, amely segíthet az embereknek a munkájukban, de nem helyettesítheti az emberi interakciót és a komplex munkát.

Március végén várható az új modell nyilvánosságra hozatala az OpenAI-nál, a pontos árképzés egyelőre ismeretlen, de a fejlesztők azon dolgoznak, hogy a modell a lehető legtöbb felhasználó számára elérhető legyen.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom