ÉlőUtoljára: 3 perceMa: 14

Rovat · 34. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

809 cikk az archívumban

Kvantum modellekben a klasszikus adatokat 5 lépésben dolgozzák fel
Kutatás

Kvantum modellekben a klasszikus adatokat 5 lépésben dolgozzák fel

A kutatók szerint a klasszikus adatok kvantum modellekbe történő bevitelének legnagyobb kihívása az adatok hatékony kvantum állapotba történő átalakítása.

Towards Data Science·AI
Az OpenAI modellje 20%-kal pontosabban generál hipotéziseket a CrossTrace adathalmazzal
Kutatás

Az OpenAI modellje 20%-kal pontosabban generál hipotéziseket a CrossTrace adathalmazzal

A CrossTrace adathalmaz 1389 darab, tudományosan megalapozott okoskodási nyomot tartalmaz, amelyek három különböző területen oszlanak meg: biomedicina, AI/ML és többterületű munka.

ArXiv NLP·AI
A Mimosa Framework 43,1%-os sikerarányt ér el a ScienceAgentBench teszten
Kutatás

A Mimosa Framework 43,1%-os sikerarányt ér el a ScienceAgentBench teszten

A Mimosa Framework nyílt forráskódú, az Apache License 2.0 alatt érhető el.

ArXiv AI·AI
Az OpenAI modelljei 30%-kal pontosabban becslik a bizonytalanságot az új TAC módszerrel
Kutatás

Az OpenAI modelljei 30%-kal pontosabban becslik a bizonytalanságot az új TAC módszerrel

A TAC módszer a nyílt forráskódú és kevés adatos felügyelet mellett is képes jól kalibrált bizonytalansági becsléseket adni.

ArXiv AI·AI
A Google AI-vezér szerint továbbra is érdemes megtanulni programozni
Kutatás

A Google AI-vezér szerint továbbra is érdemes megtanulni programozni

Jeff Dean, a Google AI-részlegének vezetője szerint a programozás továbbra is alapvető készség marad — még ha az AI-rendszerek egyre többet is átvesznek a rutinfeladatokból.

The Batch·AI
A WAM modell 12 százalékponttal javítja a viselkedési klónozás sikerét
Kutatás

A WAM modell 12 százalékponttal javítja a viselkedési klónozás sikerét

A WAM modell a CALVIN teljesítményteszt 8 manipulációs feladatán tesztelték, ahol a DreamerV2 és DiWA alapmodellhez képest javította a viselkedési klónozás sikerét.

ArXiv AI·AI
Az EVOM keretrendszer 90%-os pontossággal oldja meg az optimalizálási feladatokat
Kutatás

Az EVOM keretrendszer 90%-os pontossággal oldja meg az optimalizálási feladatokat

A kutatók szerint az EVOM keretrendszerrel való munka során a szabályozási feladatok megoldásához nincs szükség folyamatszintű felügyeletre.

ArXiv AI·AI
A biztonsági finomhangolás csökkenti az LLM-ek elmetulajdonítását, de nem rontja az empátiáját
Kutatás

A biztonsági finomhangolás csökkenti az LLM-ek elmetulajdonítását, de nem rontja az empátiáját

A kutatók kimutatták, hogy a biztonsági finomhangolás csökkenti az LLM-ek hajlamát, hogy elismerjék az állatok mentális állapotát

ArXiv NLP·AI
A Google-kutatók felfedezték, hogy az LLM-ek több személyiséget szimulálnak a kérdések megválaszolásához
Kutatás

A Google-kutatók felfedezték, hogy az LLM-ek több személyiséget szimulálnak a kérdések megválaszolásához

A Google-kutatók DeepSeek-R1 és QwQ-32B modelleken végzett vizsgálata kimutatta, hogy az LLM-ek komplex, többszereplős belső gondolkodást szimulálnak — ez különböző kognitív folyamatokat és perspektívákat tesz lehetővé egy modellen belül.

Import AI·AI
Az AI-projektek 65%-a munkabérre megy el
Kutatás

Az AI-projektek 65%-a munkabérre megy el

A Tshepo Tshabalala által végzett elemzés szerint a havi 34 750 dollárt is elérheti egy AI-projekt menedzser költsége nyolc hónapra.

AI for Newsroom·AI
Az OptiMer 15-35-ször kevesebb számítási kapacitást igényel, mint a hagyományos adatkeverés
Kutatás

Az OptiMer 15-35-ször kevesebb számítási kapacitást igényel, mint a hagyományos adatkeverés

Az OptiMer a Gemma 3 27B modellen végzett kísérletek során egyaránt felülmúlta a hagyományos adatkeverést és a modellátlagolást japán, kínai nyelveken és matematika, kódolás területeken.

ArXiv NLP·AI
A Microsoft és az NVIDIA együttműködése 92%-kal csökkenti a nukleáris engedélyezési folyamatot
Kutatás

A Microsoft és az NVIDIA együttműködése 92%-kal csökkenti a nukleáris engedélyezési folyamatot

Aalo Atomics évente becslés szerint 80 millió dollárt takarít meg a Microsoft és az NVIDIA együttműködésének köszönhetően.

Azure Blog·AI
A Microsoft bevezeti az „The Shift” podcastot, 8 epizóddal az agentic AI-ről
Kutatás

A Microsoft bevezeti az „The Shift” podcastot, 8 epizóddal az agentic AI-ről

A podcast első epizódja, „Are my agents hunting for data?”, holnap jelenik meg, Ronald Chang, Dipti Borkar, Josh Caplan és Cillian Mitchell részvételével.

Azure Blog·AI
Az Anthropic PBC megvalósította a valaha volt legnagyobb AI-kutatást
Kutatás

Az Anthropic PBC megvalósította a valaha volt legnagyobb AI-kutatást

Több mint 1000 résztvevővel készült el a kutatás, amelyben az emberek véleményét és tapasztalatait gyűjtötték össze az AI-ról.

Anthropic·AI
A ChatGPT és a Grok LLM-ek terveznek adatbázist vírusok és tengeri mérgek elleni ellenszerekhez
Kutatás

A ChatGPT és a Grok LLM-ek terveznek adatbázist vírusok és tengeri mérgek elleni ellenszerekhez

A ChatGPT LLM két AI-ügynököt használ a vírusok és tengeri mérgek elleni ellenszerek rangsorolására

ArXiv AI·AI
1500 videómintát tartalmaz az új SyriSign adathalmaz a szíriai arab jelnyelv fordításához
Kutatás

1500 videómintát tartalmaz az új SyriSign adathalmaz a szíriai arab jelnyelv fordításához

A SyriSign adathalmaz fejlesztésében 20 kutató vett részt, akik 6 hónapon keresztül dolgoztak a projektön

ArXiv NLP·AI
Az Emergence WebVoyager 95,9%-os egyetértést ért el az annotátorok között
Kutatás

Az Emergence WebVoyager 95,9%-os egyetértést ért el az annotátorok között

A kutatók a WebVoyager teljesítményteszt felülvizsgálatával fejlesztették ki az Emergence WebVoyagert

ArXiv AI·AI
Az LLM-ek háromszor olyan gyakran vetnek be nukleáris fegyvert, mint az emberek
Kutatás

Az LLM-ek háromszor olyan gyakran vetnek be nukleáris fegyvert, mint az emberek

A kutatók szerint az LLM-ek agresszivitása jelentősen változik: a Claude Sonnet 4 67%-os, a GPT-5.2 50%-os, míg a Gemini 3 Flash csak 33%-os győzelmi arányt ért el a szimulált nukleáris válságjátékokb

Import AI·AI
A nyelvi modellek emberi szemantikai ítéletekhez igazodnak a koncepció-képzésnek köszönhetően
Kutatás

A nyelvi modellek emberi szemantikai ítéletekhez igazodnak a koncepció-képzésnek köszönhetően

A Chen Shani és munkatársai által végzett kutatás szerint a koncepció-képzésnek köszönhetően a nyelvi modellek jobban igazodnak az emberi szemantikai ítéletekhez.

ArXiv NLP·AI
5 ingyenes finomhangolást kínál egy vállalat a visszajelzésekért cserébe
Kutatás

5 ingyenes finomhangolást kínál egy vállalat a visszajelzésekért cserébe

A vállalat a lokális és nyílt modelleket célozza meg az ajánlatával.

Reddit ML·AI
Indul a HAISM: az ember-AI szimbiózis mozgalom
Kutatás

Indul a HAISM: az ember-AI szimbiózis mozgalom

A HAISM mozgalom célja, hogy az embereket és az AI-t szimbiózisba hozza, és ezzel megakadályozza a félreértéseket.

LessWrong AI·AI

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom