A Reddit szerint az AI rendszerek teljesítménymérése egyre bonyolultabb
Egy szakértői csoport szerint az AI modellek teljesítményének értékelése összetett mérnöki feladat, amely a szoftverfejlesztési feladatok komplexitásán alapul. A csoport egy diagramot publikált, amely az AI modelleket hasonlítja össze a feladatok komplexitása alapján.

Az AI rendszerek teljesítményének értékelése ma már nem egyszerű teljesítménytesztek kérdése, hanem összetett mérnöki feladatokhoz kötődik — írja egy Reddit bejegyzés.
A szakértői csoport, amely számos táblázatot publikált a témában, egy olyan diagramot emel ki hívókártyájaként, amely az AI modelleket a szoftverfejlesztési feladatok komplexitása alapján hasonlítja össze. Ezt a komplexitást azzal mérik, hogy mennyi időbe telik egy emberi programozónak ugyanazt a feladatot elvégeznie.
Barış Oku, a Medium szerzője szerint vége van a „AI-asszisztált” szoftverfejlesztés korszakának, és el kell ismernünk, hogy ma már mi, emberek vagyunk azok, akik az AI-t asszisztáljuk. A Betterworks kiemeli, hogy az AI-nak nem csak a teljesítményértékelések megírásában kellene segítenie, hanem egész évben a teljesítmény megértésében is.