Az OpenAI új ChatGPT-je 59 ponttal veri az orvosokat a HealthBench Professional teszten
Az amerikai egészségügyi szakembereknek szánt ingyenes AI-eszköz a HealthBench Professional teljesítményteszten 59.0 pontot ért el, míg az emberi orvosok csak 43.7 pontot.

Új ingyenes AI-eszközt indított az OpenAI az amerikai egészségügyi szakemberek számára, a 'ChatGPT for Clinicians' néven. A platform valós idejű klinikai kereséseket, munkafolyamat-sablonokat és automatikus CME-kredit elismerést is kínál — írja a The Decoder.
Az eszközzel együtt az OpenAI közzétette a 'HealthBench Professional' teljesítménytesztet is, amelyen a testreszabott GPT-5.4 modell 59.0 pontot szerzett. Ez jelentősen felülmúlja az emberi orvosok 43.7 pontos teljesítményét, még akkor is, ha korlátlan idejük és internet-hozzáférésük volt. A teljesítménytesztet szándékosan nehézre tervezték, a feladatok mintegy harmada úgynevezett 'red teaming' tesztekből származik, ahol orvosok keresték a modell gyengeségeit.
Az orvosi pontosítás új korszaka
A 'ChatGPT for Clinicians' munkaterületen futó GPT-5.4 modell 11 ponttal magasabb eredményt ért el (59.0), mint az alap GPT-5.4 (48.1). Az Anthropic Claude Opus 4.7 modellje 47.0, a Google Gemini 3.1 Pro 43.8, a xAI Grok 4.2 pedig 36.1 pontot kapott. Az OpenAI hangsúlyozza, hogy az eszköz az orvosok támogatására szolgál, nem pedig a helyettesítésükre.
A biztonságos és pontos válaszok birodalma
A bevezetés előtti tesztelés során orvosok 6924 beszélgetést vizsgáltak, és a válaszok 99.6 százalékát biztonságosnak és pontosnak ítélték – közölte Karan Singhal, az OpenAI egészségügyi részlegének vezetője. A 'ChatGPT for Clinicians' ingyenes hozzáférést biztosít az OpenAI jelenlegi élvonalbeli modelljeihez, klinikai keresési funkcióhoz és mélyreható orvosi kutatási lehetőségekhez. Az eszköz egyelőre csak az Egyesült Államokban érhető el, de az OpenAI tervei szerint nemzetközileg is terjeszkedni fognak, 2024-ben kezdve a nemzetközi piacokon való megjelenéssel.