ÉlőUtoljára: 4 perceMa: 8
Modellek & LLMfrissítve: 16:10

Közvetlen képértelmezést kínál a SenseTime nyílt forráskódú SenseNova-U1 modellje

A modell a képeket közvetlenül dolgozza fel, ezzel elkerüli a hagyományos módszerekre jellemző, erőforrásigényes szöveggé alakítást.

Közvetlen képértelmezést kínál a SenseTime nyílt forráskódú SenseNova-U1 modellje
Fotó: Fotó: Albert Stoynov / Unsplash
forrás: Techmeme·AI Forradalom szerk.·
Megosztás

Nyílt forráskódú képmodellt adott ki a SenseTime, a SenseNova-U1 a gyártó szerint szövegfordítás nélkül képes értelmezni a képeket — írja a Wired. Ez a megközelítés állítólag jelentősen csökkenti a számítási teljesítmény iránti igényt.

A SenseNova-U1 képessége, hogy a vizuális adatokat közvetlenül, szöveges leírások generálása nélkül dolgozza fel, új utakat nyithat a hatékonyabb AI-alkalmazások előtt. A hagyományos modellek gyakran először szöveggé alakítják a képeket, ami extra számítási kapacitást és időt emészt fel.

A képértelmezés új távlatokat nyit

A SenseTime állítása szerint a közvetlen értelmezés nemcsak gyorsabb, de kevesebb energiafelhasználással is jár, ami különösen fontos lehet a nagy léptékű képfeldolgozási feladatoknál és az eszközön futó AI-alkalmazásoknál. A nyílt forráskódú modell lehetővé teszi a fejlesztők számára, hogy saját projektjeikben is felhasználják és továbbfejlesszék a technológiát.

A nyílt innováció jegyében

A SenseNova-U1 kiadása a SenseTime elkötelezettségét mutatja a nyílt AI-innováció iránt, miközben a vállalat a hatékonyabb és erőforrás-takarékosabb megoldásokra fókuszál. A modell elérhető a fejlesztői közösség számára, és a SenseTime szerint 2024-ben további fejlesztéseket és frissítéseket tervez a SenseNova-U1-hez.

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom