Frissítve: 9 perce·Ma: 10
Modellek & LLM
AI által generált szöveg

GPT-5 szintű érveléssel érkezik az OpenAI új hangmodellje, a GPT-Realtime-2

Az új modellekkel az OpenAI célja, hogy a hangalapú interfészek ne csak válaszoljanak, hanem valós munkát is végezzenek: hallgassanak, érveljenek, fordítsanak, átírjanak és cselekedjenek.

GPT-5 szintű érveléssel érkezik az OpenAI új hangmodellje, a GPT-Realtime-2
Fotó: Levart_Photographer / Unsplash
Forrás: TechmemeSzerző: AI Forradalom szerk.
Megosztás

Három új valós idejű hangmodellt tett elérhetővé az OpenAI az API-ján keresztül, amelyek „új osztályú” alkalmazásokat nyithatnak meg — írja a 9to5Mac a Techmeme hivatkozása alapján.

Ezek közül a GPT-Realtime-2 modell az OpenAI szerint „GPT-5-ös osztályú” érvelési képességekkel rendelkezik, ami jelentős előrelépést jelenthet a komplexebb hangalapú interakciók terén. A GPT-Realtime-Whisper a valós idejű átírást, míg a GPT-Realtime-Translate a fordítást célozza.

Az OpenAI szerint a modellekkel a fejlesztők olyan hanginterfészeket hozhatnak létre, amelyek képesek meghallgatni, érvelni, fordítani, átírni és cselekedni a beszélgetés során. Ez a képesség messze túlmutat a hagyományos kérdés-válasz alapú rendszereken.

A GPT-Realtime-2 érvelési képességei különösen ígéretesek, mivel a GPT-5-ös osztályú teljesítmény a legfejlettebb nyelvi modellek szintjén van. Ez azt jelenti, hogy a modell képes lehet összetettebb problémák megértésére és logikus válaszok generálására hangalapú bemenetek alapján.

Az új modellek API-n keresztüli elérhetősége lehetővé teszi a fejlesztők számára, hogy saját alkalmazásaikba integrálják ezeket a fejlett hangfunkciókat. Az OpenAI ezzel a lépéssel tovább erősíti pozícióját a valós idejű hangfeldolgozás és a generatív AI területén.

A GPT-Realtime-2, GPT-Realtime-Whisper és GPT-Realtime-Translate modellek már elérhetők az OpenAI API-jában.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom