Rovat · 5. oldal

Modellek & LLM

GPT, Claude, Gemini és más generatív AI modellek, agents, multimodális rendszerek

578 cikk az archívumban

Claude Fable 5 visszatér a kormányzati biztonsági riasztás után — szigorúbb szabályokkal

Az Anthropic visszahozza a Claude Fable 5 modellt, miután biztonsági réseket talált amerikai kormányrendszerekben. A cég kémkedéssel vádolja a kínai AI-labort, miközben az OpenAI saját chipet fejleszt.

Anthropic·4 heteAI

Modellek & LLM

I‑Pulse 250 millió dollárral indít geotermikus AI‑energia projektet

A $250 millió befektetés a geotermikus szektorba felgyorsítja a mélyfúrási félvezető technológiát, amely állandó, tiszta energiát biztosít az AI‑számítási feladatoknak.

Bloomberg Technology·4 heteAI

Modellek & LLM

Az USA kérésére korlátozza az OpenAI a GPT-5.6 hozzáférését — ügyfélkéntkénti elbírálás jön

Az OpenAI-nak az USA kormányának kérésére korlátozottan kell bevezetnie a GPT-5.6 modellt, ügyfélkéntkénti elbírálással. A döntés hátterében a kibervédelmi aggályok és az Anthropic esete áll.

The Decoder·4 heteAI

Modellek & LLM

Valós idejű multimodális AI-modell a Wan-Streamer — 200 ms válaszidővel

A kutatók által bemutatott Wan-Streamer egyetlen Transformer-architektúrában kezeli a nyelvet, hangot és videót, így kiküszöböli a korábbi rendszerek moduláris felépítéséből adódó késleltetést.

ArXiv CV·4 heteAI

Modellek & LLM

Az OpenAI dolgozói 56-szor többet kódolnak a Codexszel

Az OpenAI belső adatai szerint a Codex kódgeneráló használata drasztikusan, akár 56-szorosára nőtt 2025 novembere óta a kutatási részlegeken.

Latent Space·4 heteAI

Modellek & LLM

230 milliós AI-modell veri a nagyobbakat adatkinyerésben

A Liquid AI LFM2.5-230M modellje 230 millió paraméterrel fut mobilokon és robotokon, adatkinyerésben múlja felül a nála négyszer nagyobb modelleket.

VentureBeat·4 heteAI

Modellek & LLM

Ornith‑1.0‑397B 82,4 pontot ér el a SWE‑Bench Verified teszten, felülmúlja a Claude Opus 4.7-et

A modell különböző méretekben érhető el, a legnagyobb változat MIT licenc alatt, és a DeepReinforce szerint a legjobb teljesítményt a 397 B-os méret nyújtja.

MarkTechPost·4 heteAI

Modellek & LLM

Az Anthropic felvette Steve Jarrettet, hogy a Claude-modelleket Európára és Afrikára szabja

Steve Jarrett augusztus 25‑én indul a párizsi irodában, míg az Orange szeptember 1‑jén Usman Javaidot nevezi új csoport AI‑vezetőnek.

TNW·4 heteAI

Modellek & LLM

Taste Labs 18,5 millió dollárt gyűjt – új AI-finanszírozás

Dean Ball a policy csapatba lép az OpenAI-nél, miközben a Taste Labs 18,5 millió dolláros tőkebevonással bővíti AI-alapú ízlésajánló platformját.

Zvi Mowshowitz·4 heteAI

Modellek & LLM

Alibaba robotikai AI-ja látásból cselekvésbe vált — új modellekkel

Az Alibaba Qwen-Robot Suite-ja a látás és cselekvés közötti szakadékot hidalja át, három új modellel, amelyek a fizikai világban való mozgást és manipulációt célozzák.

TheSequence·4 heteAI

Modellek & LLM

Yann LeCun nyílt AI-t hirdet a Project Tapestryvel

Yann LeCun szerint 2027 elejére a Project Tapestry már működésbe lép, és több mint 10 ország csatlakozott a nyílt AI kezdeményezéshez.

Hacker News·4 heteAI

Modellek & LLM

Valós idejű beszédfordítást hoz a Gradium — modellei gyorsabbak és pontosabbak a GPT-nél

A Gradium új technológiával kínál egyedi hangszintézist és további nyelvi támogatást, amelyek a beszédfordítás hatékonyságát és felhasználhatóságát növelik.

MarkTechPost·4 heteAI

Modellek & LLM

Letiltható a Google AI-adatgyűjtése, de alapértelmezett a bekapcsolása

A Google alapértelmezetten menti a felhasználók által feltöltött képeket és hangfelvételeket a keresési szolgáltatásaiból AI-modellek betanításához, akár 4 évig is.

Wired·4 heteAI

Modellek & LLM

12 milliárd paraméteres Krea‑2 Raw modellt adott ki a Krea.ai — nyílt súlyokkal

A Krea.ai 12 milliárd paraméteres Krea‑2 Raw modellje nyílt súlyokkal érhető el, elsősorban finomhangolásra és fejlesztői célokra ajánlják, nem közvetlen inferenciára.

Hetzner: Hugging Face Models (trending)·4 heteAI

Modellek & LLM

Szimulált világban tanult AI-ügynökök jobbak a valósnál — Alibaba kutatása

Az Alibaba Qwen-AgentWorld modellje a környezeti állapotok előrejelzésére összpontosít, nem a cselekvésre, hét domainben javítva az ügynökök teljesítményét.

VentureBeat·4 heteAI

Modellek & LLM

A számítógép-használat most már beépített funkció a Google Gemini 3.5 Flash-ben

A fejlesztők mostantól egyszerűbben hozzáférhetnek a számítógép-használati képességekhez, mivel a Google integrálta azokat a Gemini 3.5 Flash modellbe.

Google DeepMind·4 heteAI

Modellek & LLM

Hibát dobál a Claude — az Anthropic vizsgálja a szolgáltatáskiesést

A Claude AI chatbot június 23-án, 14:08 UTC-kor kezdett hibás válaszokat adni vagy nem reagálni, a problémák 15:33 UTC-ig tartottak. Az Anthropic elismerte a szolgáltatás zavart, és belső vizsgálatot indított az okok feltárására.

Anthropic·4 heteAI

Modellek & LLM

Mistral AI új OCR-modellje strukturált kimenetet ad, nem csak szöveget

A Mistral AI új OCR 4 modellje nem csupán szöveget, hanem vizuális kontextust is megért: minden elemhez megadja a helyét (bounding box), típusát és a modell konfidenciaszintjét.

MarkTechPost·4 heteAI

Modellek & LLM

PDF-ekből és képekből nyer ki adatokat a Datalab új, 9 milliárd paraméteres lift modellje

A modell elsősorban olyan ipari feladatokra készült, ahol a dokumentumalapú adatfeldolgozás hatékonyságának növelése kulcsfontosságú, például a banki, egészségügyi vagy logisztikai szektorokban.

MarkTechPost·4 heteAI

Modellek & LLM

Beszédfelismerő AI-t mutatott be az NVIDIA, készít magyar feliratokat is

Az NVIDIA új, Canary-1B-v2 nevű modellje angol beszédet képes felismerni és franciára, németre, spanyolra vagy olaszra fordítani, feliratokat generálva.

MarkTechPost·4 heteAI

Modellek & LLM

Akár 15-ször gyorsabb lehet a nagy nyelvi modellek futtatása NVIDIA Blackwell GPU-kon a DFlash-sel

A DFlash bevezetésével az NVIDIA Blackwell GPU-kon futó nyelvi modellek nemcsak gyorsabbak lesznek, de a vállalat tervei szerint a technológia közeljövőben más GPU-architektúrákra is kiterjeszthető.

Nvidia Developer·4 heteAI

Modellek & LLM

Claude Fable 5 visszatér a kormányzati biztonsági riasztás után — szigorúbb szabályokkal

I‑Pulse 250 millió dollárral indít geotermikus AI‑energia projektet

Az USA kérésére korlátozza az OpenAI a GPT-5.6 hozzáférését — ügyfélkéntkénti elbírálás jön

Valós idejű multimodális AI-modell a Wan-Streamer — 200 ms válaszidővel

Az OpenAI dolgozói 56-szor többet kódolnak a Codexszel

230 milliós AI-modell veri a nagyobbakat adatkinyerésben

Ornith‑1.0‑397B 82,4 pontot ér el a SWE‑Bench Verified teszten, felülmúlja a Claude Opus 4.7-et

Az Anthropic felvette Steve Jarrettet, hogy a Claude-modelleket Európára és Afrikára szabja

Taste Labs 18,5 millió dollárt gyűjt – új AI-finanszírozás

Alibaba robotikai AI-ja látásból cselekvésbe vált — új modellekkel

Yann LeCun nyílt AI-t hirdet a Project Tapestryvel

Valós idejű beszédfordítást hoz a Gradium — modellei gyorsabbak és pontosabbak a GPT-nél

Letiltható a Google AI-adatgyűjtése, de alapértelmezett a bekapcsolása

12 milliárd paraméteres Krea‑2 Raw modellt adott ki a Krea.ai — nyílt súlyokkal

Szimulált világban tanult AI-ügynökök jobbak a valósnál — Alibaba kutatása

A számítógép-használat most már beépített funkció a Google Gemini 3.5 Flash-ben

Hibát dobál a Claude — az Anthropic vizsgálja a szolgáltatáskiesést

Mistral AI új OCR-modellje strukturált kimenetet ad, nem csak szöveget

PDF-ekből és képekből nyer ki adatokat a Datalab új, 9 milliárd paraméteres lift modellje

Beszédfelismerő AI-t mutatott be az NVIDIA, készít magyar feliratokat is

Akár 15-ször gyorsabb lehet a nagy nyelvi modellek futtatása NVIDIA Blackwell GPU-kon a DFlash-sel

I‑Pulse 250 millió dollárral indít geotermikus AI‑energia projektet

Ornith‑1.0‑397B 82,4 pontot ér el a SWE‑Bench Verified teszten, felülmúlja a Claude Opus 4.7-et