Öt AI-modell tesztelése: melyik adja a legjobb diétás tanácsokat?
A Perplexity által végzett tanulmány szerint a diétás tanácsok minősége jelentősen változik az egyes AI-modellek között.

A Perplexity által végzett kutatás során öt különböző AI-modellt használtak, hogy diétás és testmozgásra vonatkozó betegoktatási útmutatókat generáljanak cukorbetegség, magas vérnyomás és elhízás esetén. A vizsgálatban a ChatGPT‑4o, a Google Gemini 1.5, a Claude Sonnet 4, a Perplexity és a Grok modelljei szerepeltek.
A kutatás szerint a diétás tanácsok minősége jelentősen különbözött a modelljek között. Egyes AI-k képesek voltak részletes, személyre szabott útmutatásokat adni, míg mások általánosabb, kevésbé releváns információkat tartalmaztak. A Perplexity szerinti adatok szerint a legjobb eredményt a ChatGPT‑4o nyújtotta, míg a Grok a legkevesebb pontot értékelte.
Az ilyen típusú tanulmányok azért fontosak, mert a betegek gyakran támaszkodnak online forrásokra a táplálkozási döntéseik meghozatalakor. A mesterséges intelligencia által készített útmutatók gyors, skálázható megoldást kínálnak, de a minőségüknek meg kell felelnie a klinikai szempontoknak. A kutatás rámutatott arra, hogy a modellek közötti különbségek a táplálkozási iránymutatások megbízhatóságát befolyásolhatják.
A technikai részletek középpontjában a modellek betanítási adathalmazai és a finomhangolási stratégiák állnak. A Perplexity említi, hogy a vizsgálat során a modelleket olyan egészségügyi szövegek alapján finomhangolták, amelyek tartalmaztak diabétesz‑, hipertónia‑ és elhízás‑specifikus táplálkozási tanácsokat. Ez a megközelítés segít a modelleknek, hogy pontosabb, célzottabb információkat adjanak.
Az eredmények alapján a jövőben a fejlesztőknek fókuszálniuk kell a minőségbiztosítási mechanizmusokra, hogy a generált tartalom megfeleljen a klinikai irányelveknek. A kutatás eredményei szerint a modellek közötti pontossági különbségek miatt a gyártóknak érdemes lehet további finomhangolást végezni, különösen a cukorbetegség és a magas vérnyomás területén. A következő hónapokban várható, hogy a legújabb AI‑modellverziók megpróbálják zárni ezt a szakadékot, és egyre megbízhatóbb betegoktatási útmutatókat kínálnak majd a felhasználók számára.