
Megfeleződött az amerikai programozói állások növekedése a ChatGPT óta
A 2022 novemberi megjelenés előtt a programozói munkák évente közel 5 százalékkal bővültek, ami azóta drasztikusan lelassult.
AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

A 2022 novemberi megjelenés előtt a programozói munkák évente közel 5 százalékkal bővültek, ami azóta drasztikusan lelassult.

Az AI-rendszerek magyarázhatósága eddig főleg a technikai megértésre koncentrált, de a jövőben az elszámoltathatóság lesz a kulcs. Egy AI-rendszer által okozott kár esetén a felelős személyektől elvárható, hogy magyarázatot adjanak.

A keretrendszer a tesztidőben alakítja a generálási folyamatot és a számítási erőforrások elosztását, így a modellek hatékonyabban oldhatják meg a komplex feladatokat.

A manőverezési sebesség, a felderítési és fegyverhatótávolságok növekedése miatt a hagyományos, emberi alapú tervezés egyre nehezebbé válik a modern hadszíntéren.

A modell a klinikai adatok hierarchikus szerkezetét használja ki, ami költséghatékonyabb megoldást kínál az elektronikus egészségügyi nyilvántartások (EHR) lekérdezésére.

A nagyméretű nyelvi modellek viselkedését 12 környezeti tényező befolyásolja. A kutatók új módszert dolgoztak ki ennek mérésére.

A vezető AI modellek, mint a GPT-5.4 és a Claude Opus 4.6, nem képesek önállóan, ügyfélnek küldhető minőségű munkát produkálni a befektetési banki feladatokban — derül ki egy új benchmarkból.

A rendszer a promptmérnökséget kognitív és valószínűségi döntéshozatali folyamatként kezeli, figyelembe véve a felhasználók rejtett kognitív állapotait.

A rendszer az utasítások, eszközök és logikák tervezését is önállóan végzi, ami jelentősen felgyorsíthatja a domain-specifikus munkafolyamatok bevezetését.

A Deep FinResearch Bench három dimenzióban vizsgálta a jelentések minőségét: a minőségi szigor, a mennyiségi előrejelzés pontossága és az állítások hitelessége.

A mesterséges intelligencia rendszerek új, úgynevezett 'félig végrehajtható műtermékekkel' – mint az utasítások és munkafolyamatok – bővítik a szoftverfejlesztés hatókörét.

A hagyományos perplexitás-pontszámok és MMLU ranglisták kevés információt adnak arról, hogy egy modell képes-e valós weboldalon navigálni vagy GitHub-problémát megoldani.

A hagyományos értékelési módszerek gyakran tévesen büntetik a logikailag helyes, de eltérő döntéseket, amit a kutatók "Megállapodási Csapdának" neveznek.

A keretrendszerben egy LLM döntéshozó ügynök egy tanulható készségbankból hív le tudást, miközben egy másik ügynök új, újrafelhasználható készségeket fedez fel a modell futásaiból.

A kutatók az epidermális növekedési faktor receptor (EGFR) és az acetilkolin-észteráz (ACHE) célfehérjékre alkalmazták a módszert, ígéretes eredményekkel.

A cementgyártás évente körülbelül 3 millió tonna nitrogén-oxidot bocsát ki, ami az ipari légszennyezés egyik legnagyobb forrása.

Az Anthropic „Project Deal” kísérletében a Claude Opus modell átlagosan két további üzletet zárt, mint a Haiku felhasználók, és jelentősen jobb árakat alkudott ki.

A modell a nagyméretű mozgáspályákból tanult, tömörített mozgás-embeddingekkel dolgozik, így sokkal hatékonyabban modellezi a jelenetdinamikát.

Az új rendszer a tanárok és diákok megnyilvánulásait két dimenzió mentén osztályozza, ezzel felgyorsítva a tudáskonstrukció megértését.

A korábbi kutatások által azonosított, a hallucinációkat előrejelző neuronok nem működnek más területeken, ami megnehezíti a jelenség univerzális kezelését.

A ToolsRL keretrendszer kétlépcsős megerősítéses tanulási (RL) folyamatot alkalmaz, amelyben a modellek először az eszközhasználatot sajátítják el, majd a vizuális érvelési feladatokat.
Tetszik az oldal? Támogasd a fejlesztést
Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.