Nemotron 3 Nano Omni eléri a legmagasabb áteresztőképességet a MediaPerf videó‑címkézésben
Legmagasabb áteresztőképesség és legalacsonyabb költség a MediaPerf videó‑címkézésben, a Nemotron 3 Nano Omni modellben.

A modell egy 30B‑A3B hibrid mixture‑of‑experts (MoE) architektúrát használ, amely minden feladathoz a megfelelő szakértőt aktiválja — írja a NVIDIA Blog.
Egységes multimodális érvelés
Az új Nemotron 3 Nano Omni egyetlen modellben egyesíti a látás, audio és szöveg feldolgozását, így az ügynökök egy közös percepció‑akció hurkot tudnak megvalósítani, csökkentve az inferencia‑ugrások számát és az orkesztrációs komplexitást.
Dokumentum‑intelligencia és média‑teljesítménytesztek
A NVIDIA szerint a modell a MMlongbench‑Doc és OCRBenchV2 dokumentum‑intelligencia ranglistákon a legjobb pontszámot érte el, továbbá a WorldSense, DailyOmni és VoiceBench teszteken vezető teljesítményt mutat — közölte a NVIDIA Blog.
Az open‑source súlyok, adathalmazok és receptúrák révén a fejlesztők szabadon testreszabhatják, finomhangolhatják és beépíthetik a modellt helyi, felhő vagy vállalati környezetbe.
A Nemotron 3 Nano Omni már elérhető a NVIDIA Developer portálon, a 30B‑A3B architektúrával és teljesen nyílt súlyokkal.