ÉlőUtoljára: 14 perceMa: 5

Rovat · 38. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

804 cikk az archívumban

Az Opus 4.6 23,2%-os eredményt ér el a PostTrainBench teszten
Kutatás

Az Opus 4.6 23,2%-os eredményt ér el a PostTrainBench teszten

A kutatók szerint a PostTrainBench teszt eredményei azt mutatják, hogy az AI modellek teljesítménye gyorsan javul, az Opus 4.6 modell 23,2%-os eredménye pedig csak az emberi csapatok 51,1%-os átlagána

Import AI·AI
A Google Gemma modellje összeomlik a visszautasítások során
Kutatás

A Google Gemma modellje összeomlik a visszautasítások során

Több mint 70%-ra ugrott a Gemma-27B modell frusztrációs szintje a 8. körben

Import AI·AI
A konzisztencia elfedi a torzítást: interjúkészítői hatások a depressziókimutatásban
Kutatás

A konzisztencia elfedi a torzítást: interjúkészítői hatások a depressziókimutatásban

Hat kutató, köztük Hasindri Watawana és Sergio Burdisso, azonosított egy szisztematikus torzítást az interjúkészítői promptokból az ANDROIDS, DAIC-WOZ és E-DAIC adathalmazokban.

ArXiv NLP·AI
A hálózati metszés hatékonysága a reprezentáció hierarchiájától függ
Kutatás

A hálózati metszés hatékonysága a reprezentáció hierarchiájától függ

Shwai He és munkatársai szerint a hálózati metszés hatékonysága a reprezentáció hierarchiájától függ, és az embedding és logit terek reprezentációi ellenállnak a metszés okozta zavaroknak.

ArXiv NLP·AI
A kollektív intelligencia néha puszta lottó: az LLM-ek memetikus sodródása
Kutatás

A kollektív intelligencia néha puszta lottó: az LLM-ek memetikus sodródása

Hidenori Tanaka kutató 19 oldalas tanulmányában bemutatja a kollektív intelligencia működését

ArXiv AI·AI
Az ARC-AGI-3 teszt szerint az AI rendszerek csak 1%-os teljesítményt érnek el
Kutatás

Az ARC-AGI-3 teszt szerint az AI rendszerek csak 1%-os teljesítményt érnek el

Az emberi tesztalanyok 100%-os teljesítményt értek el az ARC-AGI-3 teszt során

ArXiv AI·AI
Az állatjóléti mozgalom az AI-tól várja a megoldást
Kutatás

Az állatjóléti mozgalom az AI-tól várja a megoldást

Több mint 100 résztvevő gyűlt össze San Franciscóban, hogy megvitassák, hogyan lehet az AI-t bevonni az állatjóléti mozgalomba, Constance Li, a Sentient Futures alapítója szerint.

MIT Technology Review·AI
A gyakori maszturbáció javítja a spermiumok minőségét
Kutatás

A gyakori maszturbáció javítja a spermiumok minőségét

Egy új tanulmány a Proceedings of the Royal Society B folyóiratban megjelent, amely szerint a gyakori ejakuláció nemcsak a spermiumok minőségét javítja, hanem hozzájárul a termékenység fokozásához is.

404 Media·AI
A Microsoft elcsábítja az Allen Institute for AI csúcsgárdáját
Kutatás

A Microsoft elcsábítja az Allen Institute for AI csúcsgárdáját

Hanna Hajishirzi, a nyelvi modellek szakértője, 152 millió dolláros projektet vezetett az Nvidia-val és az NSF-fel.

The Decoder·AI
Az Axiom Math Axplorer eszköze 2,5 óra alatt oldja meg a Turán-problémát
Kutatás

Az Axiom Math Axplorer eszköze 2,5 óra alatt oldja meg a Turán-problémát

François Charton, az Axiom Math kutatója szerint a matematikai áttörések hatalmas hatással vannak a technológiára.

MIT Technology Review·AI
A családi irodák 86 százaléka használ AI-t pénzügyi adatok elemzésére
Kutatás

A családi irodák 86 százaléka használ AI-t pénzügyi adatok elemzésére

A családi irodák 86 százaléka használ AI-t, és összesen 119,37 milliárd dollár értékű vagyont képviselnek.

AI News·AI
Ypsilanti: 1,25 milliárd dolláros nukleáris datacenter vonzza az iráni drónok figyelmét
Kutatás

Ypsilanti: 1,25 milliárd dolláros nukleáris datacenter vonzza az iráni drónok figyelmét

A tervezett datacenter elleni ellenállás mögött nemcsak a nukleáris kutatásokhoz való kapcsolódás áll, hanem az iráni drónok potenciális fenyegetése is, amely további aggodalmat kelt a helyi lakosok k

404 Media·AI
Google 1 millió dollárba fektet 50 000 szívvizsgálatot vidéki Ausztráliába
Kutatás

Google 1 millió dollárba fektet 50 000 szívvizsgálatot vidéki Ausztráliába

A Google együttműködik Wesfarmers Health, SISU Health, Latrobe Health Services és a Victor Chang Cardiac Research Institute-ral, hogy 50 000 szívvizsgálatot biztosítson távoli közösségekben

Google AI Blog·AI
Karpathy: az emberi intuíció most a kutatási szűk kereszt
Kutatás

Karpathy: az emberi intuíció most a kutatási szűk kereszt

Karpathy azt mondja, hogy az AI‑kutatásban a tudományos eredmények könnyen mérhetőek, de a kutatók saját gondolkodása a legnagyobb akadály

The Decoder·AI
Tudósok 45 sziklás bolygóra szűkítették a küldetést
Kutatás

Tudósok 45 sziklás bolygóra szűkítették a küldetést

Tudósok azonosítottak 45 olyan sziklás világot, ahol folyékony víz lehet, melyek nem nagyobbak, mint a Föld kétszeresége

404 Media·AI
Az AI változtatja meg a jogászszakmát
Kutatás

Az AI változtatja meg a jogászszakmát

Egy angliai ügyvéd az AI-t használja a koronabírósági eljárásokban

Ars Technica·AI
Az AI-ügynökök sikeréhez erős adatinfrastruktúra szükséges
Kutatás

Az AI-ügynökök sikeréhez erős adatinfrastruktúra szükséges

A vállalatok többsége kísérletezik az AI-ügynökökkel, de az adatinfrastruktúra hiánya gátolja a telepítésüket

MIT Technology Review·AI
Hol bukkanhat fel az OpenAI technológiája Iránban
Kutatás

Hol bukkanhat fel az OpenAI technológiája Iránban

Az OpenAI technológiája az Irán elleni konfliktusban

MIT Technology Review·AI
OpenAI bemutatta az IH-Challenge adathalmazt a hierarchikus utasítások erősítésére
Kutatás

OpenAI bemutatta az IH-Challenge adathalmazt a hierarchikus utasítások erősítésére

Az OpenAI új IH-Challenge adathalmazzal erősíti a modellek prioritási hierarchiáját, hogy biztonságosabban és megbízhatóbban reagáljanak különböző források utasításaira.

OpenAI·AI
Az OpenAI fejlesztése: a Responses API számítógépes környezettel
Kutatás

Az OpenAI fejlesztése: a Responses API számítógépes környezettel

Bo Xu, Danny Zhang és Rohit Arunachalam bejelentette

OpenAI·AI
AI dekompilálta a Turbo Pascal forráskódját – az eredmény „hallucinált szemét"
Kutatás

AI dekompilálta a Turbo Pascal forráskódját – az eredmény „hallucinált szemét"

Simon Willison elemezte a Turbo Pascal 3.02A forráskódját

Simon Willison·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom