Frissítve: 20 perce·Ma: 9
Modellek & LLM
AI által generált szöveg

Nemotron 3 Nano Omni eléri a legmagasabb áteresztőképességet a MediaPerf videó‑címkézésben

Legmagasabb áteresztőképesség és legalacsonyabb költség a MediaPerf videó‑címkézésben, a Nemotron 3 Nano Omni modellben.

Nemotron 3 Nano Omni eléri a legmagasabb áteresztőképességet a MediaPerf videó‑címkézésben
Fotó: Enchanted Tools / Unsplash
Forrás: Nvidia DeveloperSzerző: AI Forradalom szerk.
Megosztás

A modell egy 30B‑A3B hibrid mixture‑of‑experts (MoE) architektúrát használ, amely minden feladathoz a megfelelő szakértőt aktiválja — írja a NVIDIA Blog.

Egységes multimodális érvelés

Az új Nemotron 3 Nano Omni egyetlen modellben egyesíti a látás, audio és szöveg feldolgozását, így az ügynökök egy közös percepció‑akció hurkot tudnak megvalósítani, csökkentve az inferencia‑ugrások számát és az orkesztrációs komplexitást.

Dokumentum‑intelligencia és média‑teljesítménytesztek

A NVIDIA szerint a modell a MMlongbench‑Doc és OCRBenchV2 dokumentum‑intelligencia ranglistákon a legjobb pontszámot érte el, továbbá a WorldSense, DailyOmni és VoiceBench teszteken vezető teljesítményt mutat — közölte a NVIDIA Blog.

Az open‑source súlyok, adathalmazok és receptúrák révén a fejlesztők szabadon testreszabhatják, finomhangolhatják és beépíthetik a modellt helyi, felhő vagy vállalati környezetbe.

A Nemotron 3 Nano Omni már elérhető a NVIDIA Developer portálon, a 30B‑A3B architektúrával és teljesen nyílt súlyokkal.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom