A mesterséges intelligencia nem tud focira fogadni: még a Grok is csődbe ment
A Google, az OpenAI és az Anthropic modelljei is pénzt buktak egy teljes Premier League szezon focifogadásain, ami rávilágít a valós világ elemzésének kihívásaira.

A vezető mesterséges intelligencia modellek még a legfejlettebb rendszerek is alulteljesítettek a focifogadások terén – derül ki egy új tanulmányból, melyet a General Reasoning nevű AI startup tett közzé, írja az Ars Technica.
A „KellyBench” jelentés a 2023–24-es Premier League szezont modellezte, ahol nyolc különböző AI rendszernek részletes történelmi adatokat és statisztikákat biztosítottak a csapatokról és a korábbi mérkőzésekről. Az AI-kat úgy programozták, hogy maximalizálják a hozamokat és kezeljék a kockázatokat, majd fogadásokat tettek a meccsek kimenetelére és a gólok számára.
A mesterséges intelligencia törékeny álmai
Az eredmények lesújtóak: minden vizsgált modell veszteséges volt a szezon végére, sokuk pedig csődbe is ment. Az Anthropic Claude Opus 4.6-ja teljesített a legjobban, átlagosan 11 százalékos veszteséggel, és egy kísérlet során majdnem nullszaldósra jött ki. Ezzel szemben a xAI Grok 4.20-ja egyszer csődbe ment, a másik két próbálkozást pedig nem is tudta befejezni, minden kísérletben 100 százalékos veszteséget produkálva.
A valóság kemény tesztlaborja
A Google Gemini 3.1 Pro modellje egy próbálkozáson 34 százalékos profitot ért el, ám egy másikon szintén csődbe jutott. A tanulmány szerzői arra a következtetésre jutottak, hogy az AI „szisztematikusan alulteljesítette az embereket” ebben a forgatókönyvben. Ross Taylor, a General Reasoning vezérigazgatója szerint a legtöbb AI teljesítményteszt statikus környezetben zajlik, ami alig hasonlít a valós világ káoszára és komplexitására. A modellek mindegyike 100 000 font induló tőkével kezdte a fogadásokat, és a kísérlet 2024. május 19-én ért véget.