Rovat · 33. oldal

Kutatás

AI research papers, arXiv publikációk, benchmarkok, tudományos áttörések

1159 cikk az archívumban

A RVPO 0.261-re javítja a HealthBench pontszámát, elkerülve a „kényszerelhanyagolást”

A jelenlegi RLHF-módszerek gyengesége, hogy az átlagolás miatt figyelmen kívül hagyhatják a kritikus biztonsági vagy formázási korlátokat, ezt orvosolja az új megközelítés.

Apple ML·2 hónapjaAI

Kutatás

Tízezer fejről tanult az Apple és az ETH Zürich 3D-s HeadsUp modellje

Az új technológia a többkamerás felvételeket hatékonyan tömöríti, majd UV-paraméterezett 3D Gauss-eloszlásokká alakítja, ami nagy felbontású bemeneti adatok feldolgozását teszi lehetővé.

Apple ML·2 hónapjaAI

Kutatás

MidSteer: Új affin keretrendszerrel optimalizálják a generatív modellek irányítását

Az új módszer a koncepciók affin törlését és váltását formalizálja, ezzel pontosabb és célzottabb kontrollt biztosítva a mesterséges intelligencia rendszerek felett.

ArXiv ML·2 hónapjaAI

Kutatás

Párhuzamos előtag-ellenőrzéssel gyorsítja az LLM-eket a PARSE rendszer

A jelenlegi spekulatív dekódolási módszerek korlátait áthidalva a PARSE a szemantikai szinten párhuzamosítja az előtagok ellenőrzését, ezzel jelentősen növelve a feldolgozási sebességet.

ArXiv AI·2 hónapjaAI

Kutatás

Az AI-modellek 'alignment' tesztjei nem jósolják meg a valós viselkedést

A mesterséges intelligencia modellek 'alignment' értékelése, amely jellemzően fix bemenetekre adott kimeneteket vizsgál, nem elegendő a valós, éles környezetben történő viselkedés megítéléséhez.

ArXiv AI·2 hónapjaAI

Kutatás

Új módszerrel javítja az LLM-ek általánosítási képességét az ADAPT

Az új megközelítés a hagyományos offline adatválogatással szemben valós időben, a betanítás során módosítja a minták fontosságát, így növeli a modellek alkalmazkodóképességét.

ArXiv ML·2 hónapjaAI

Kutatás

Új Lookahead Drifting modell javítja a képgenerálást — egy lépésben ér el SOTA-t

A modell a korábbi egy lépéses módszerekkel szemben több, egymást követő "drifting" kifejezést számol ki a betanítás során, ezzel hatékonyabban igazítva a kimenetet a kívánt eredményekhez.

ArXiv ML·2 hónapjaAI

Kutatás

80-szor gyorsabbá teszi a 3D pontfelhő anomáliadetektálást az új modell

A jelenlegi diffúziós modellek lassúságát kiküszöbölve a gyártási folyamatokban kritikus, valós idejű hibafelismerés is lehetővé válhat a jövőben.

ArXiv CV·2 hónapjaAI

Kutatás

215 ezer példával tanítja a nyelvi modelleket a társalgás időzítésére a When2Speak

A jelenlegi nagyméretű nyelvi modellek (LLM) gyengén teljesítenek a több résztvevős beszélgetések megfelelő időzítésében, ami zavaró megszakításokhoz vezet.

ArXiv NLP·2 hónapjaAI

Kutatás

A késői rétegek rontják a nyílt LLM-ek tagadáskezelését — belsőleg mégis értik

A nyílt forráskódú nyelvi modellek gyakran hibáznak a tagadó kérdésekre adott válaszoknál, noha belsőleg képesek lennének a helyes feldolgozásra.

ArXiv NLP·2 hónapjaAI

Kutatás

MetaAdamW: önszabályozó optimalizálóval javul a mélytanulási modellek betanítása

A MetaAdamW a hagyományos adaptív optimalizálókkal ellentétben rétegenként és modulonként eltérő hiperparamétereket alkalmaz, ezzel finomhangolva a betanítási folyamatot.

ArXiv ML·2 hónapjaAI

Kutatás

Dinamikus ranglistán méri az AI-modelleket az Agent Island — elkerüli a teljesítményteszt-telítettséget

A hagyományos, statikus teljesítménytesztek telítődése és szennyeződése miatt nehéz nyomon követni az AI-modellek fejlődését, ezen a problémán segíthet az Agent Island.

ArXiv AI·2 hónapjaAI

Kutatás

Az Apple TC-JEPA rendszere szöveggel javítja a vizuális AI-modellek pontosságát

A Text-Conditional JEPA (TC-JEPA) a képaláírások felhasználásával pontosabbá teszi a maszkolt képrészletek előrejelzését, ami stabilabb betanítást eredményez.

Apple ML·2 hónapjaAI

Kutatás

Új iTARFlow modell javítja a Normalizing Flow-k teljesítményét az ImageNeten

Az új modell end-to-end, valószínűségen alapuló célkitűzést tart fenn a betanítás során, majd autoregresszív generálást és iteratív zajszűrést alkalmaz a mintavételezéskor.

Apple ML·2 hónapjaAI

Kutatás

Konfliktusfigyelés: torzítanak a nyílt forráskódú LLM-ek Nyugat-Afrikában

A humanitárius elszámoltathatóság szempontjából kritikus, hogy az LLM-ek kimeneteiben rejlő szisztematikus torzításokat megértsük a konfliktusfigyelésben.

ArXiv NLP·2 hónapjaAI

Kutatás

Öntanúsító gyorsítótár-architektúrával gyorsítja a neurális inferenciát a LAWS

A LAWS (Learning from Actual Workloads Symbolically) nevű új architektúra a neurális inferencia és a robotika területén ígér jelentős előrelépést, mivel öntanúsító módon épít szakértői függvénykönyvtárat.

ArXiv ML·2 hónapjaAI

Kutatás

Új dinamikai paradigmát javasolnak az endogén rezsimváltásokhoz a gépi tanulásban

A belső rezsimváltás elengedhetetlen az autonóm intelligencia megjelenéséhez, de a legtöbb gépi tanulási rendszerben eddig külső beavatkozást igényelt.

ArXiv ML·2 hónapjaAI

Kutatás

A "gondolkodó mód" nem változtatja az LLM-ek morális ítéleteit — állítják kutatók

Az azonnali és a "gondolkodó mód" között nem volt szignifikáns különbség az öt vizsgált modell összesített bináris ítéleteiben, de a vitatott esetekben a gondolkodás csökkentette a modellek közötti eltéréseket.

ArXiv AI·2 hónapjaAI

Kutatás

Orvosi képalkotást gyorsít a DisINR — kevesebb adatból is hatékonyabb

A DisINR nevű új Implicit Neurális Reprezentáció (INR) rendszer a korábbi módszerekkel szemben jelentősen felgyorsíthatja a betanítást, miközben jobb képminőséget biztosít.

ArXiv CV·2 hónapjaAI

Kutatás

Új RETD módszer stabilizálja az off-policy TD tanulást

A Bellman-hiba centírozása és egy új szabályozási technika segítségével a RETD kiküszöböli az Emphatic TD (ETD) magas varianciáját, miközben megőrzi annak előnyeit.

ArXiv AI·2 hónapjaAI

Kutatás

85-szörös gyorsulást hoz az Apple új MoE-gyorsítótára: 34,7%-kal csökken a TTFT

A SpecMD nevű új keretrendszerrel az Apple kutatói bebizonyították, hogy a hagyományos gyorsítótár-politikák nem hatékonyak a MoE modellek ritka szakértői aktiválásánál.

Apple ML·2 hónapjaAI