Frissítve: 14 perce·Ma: 50
Kutatás
AI által generált szöveg

A mesterséges intelligencia nem tud focira fogadni: még a Grok is csődbe ment

A Google, az OpenAI és az Anthropic modelljei is pénzt buktak egy teljes Premier League szezon focifogadásain, ami rávilágít a valós világ elemzésének kihívásaira.

A mesterséges intelligencia nem tud focira fogadni: még a Grok is csődbe ment
Fotó: Dredd Noughtos / Unsplash
Forrás: Ars TechnicaSzerző: AI Forradalom szerk.
Megosztás

A vezető mesterséges intelligencia modellek még a legfejlettebb rendszerek is alulteljesítettek a focifogadások terén – derül ki egy új tanulmányból, melyet a General Reasoning nevű AI startup tett közzé, írja az Ars Technica.

A „KellyBench” jelentés a 2023–24-es Premier League szezont modellezte, ahol nyolc különböző AI rendszernek részletes történelmi adatokat és statisztikákat biztosítottak a csapatokról és a korábbi mérkőzésekről. Az AI-kat úgy programozták, hogy maximalizálják a hozamokat és kezeljék a kockázatokat, majd fogadásokat tettek a meccsek kimenetelére és a gólok számára.

A mesterséges intelligencia törékeny álmai

Az eredmények lesújtóak: minden vizsgált modell veszteséges volt a szezon végére, sokuk pedig csődbe is ment. Az Anthropic Claude Opus 4.6-ja teljesített a legjobban, átlagosan 11 százalékos veszteséggel, és egy kísérlet során majdnem nullszaldósra jött ki. Ezzel szemben a xAI Grok 4.20-ja egyszer csődbe ment, a másik két próbálkozást pedig nem is tudta befejezni, minden kísérletben 100 százalékos veszteséget produkálva.

A valóság kemény tesztlaborja

A Google Gemini 3.1 Pro modellje egy próbálkozáson 34 százalékos profitot ért el, ám egy másikon szintén csődbe jutott. A tanulmány szerzői arra a következtetésre jutottak, hogy az AI „szisztematikusan alulteljesítette az embereket” ebben a forgatókönyvben. Ross Taylor, a General Reasoning vezérigazgatója szerint a legtöbb AI teljesítményteszt statikus környezetben zajlik, ami alig hasonlít a valós világ káoszára és komplexitására. A modellek mindegyike 100 000 font induló tőkével kezdte a fogadásokat, és a kísérlet 2024. május 19-én ért véget.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom