ÉlőUtoljára: 30 perceMa: 12
Modellek & LLMfrissítve: 07:05

A Google Gemini 3.1 Flash-Lite modellje 2,5-ször gyorsabban válaszol, mint az elődje

A Google Gemini 3.1 Flash-Lite modell 0,25 dollárba kerül millió bemeneti tokenenként, és 1,50 dollárba millió kimeneti tokenenként.

A Google Gemini 3.1 Flash-Lite modellje 2,5-ször gyorsabban válaszol, mint az elődje
Fotó: Albert Stoynov / Unsplash
forrás: Google AI Blog·AI Forradalom szerk.·
Megosztás

A Google bejelentette a Gemini 3.1 Flash‑Lite modellt, amely 2,5-szor gyorsabb, mint a 2.5 Flash, és 45 % gyorsabb kimeneti sebességgel rendelkezik. A fejlesztők már most próbaüzemben elérhetik a modellt a Gemini API-n keresztül Google AI Studio-ban, míg a vállalati felhasználók a Vertex AI-n keresztül használhatják. A modell ára 0,25 dollár millió bemeneti tokenenként és 1,50 dollár millió kimeneti tokenenként.

Az új modell célja a nagy mennyiségű, valós idejű munkafolyamat támogatása. A 2,5‑Flash-hez képest a Time to First Answer Token 2,5‑szorosabb, ami alacsony késleltetést jelent a gyakori, gyors válaszokat igénylő alkalmazásokban, mint például fordítás vagy tartalommoderálás. A költséghatékonyság pedig lehetővé teszi, hogy a fejlesztők több feladatot futtassanak egyszerre anélkül, hogy a költségek exponenciálódnának.

A Gemini 3.1 Flash‑Lite nem csak sebességben, hanem minőségben is felülmúlja a 2,5 Flash-et. Az Arena.ai Leaderboardon 1432‑es Elo pontszámot ért el, és 86,9 % pontot szerez a GPQA Diamond, 76,8 %-ot a MMMU Pro feladatokon – ez még nagyobb, mint néhány korábbi Gemini modell teljesítménye. A modelleket “thinking levels” beállítással is testre szabhatják a fejlesztők, így finomhangolható a gondolkodási mélység a feladat igényei szerint.

Az elsődleges felhasználási területek közé tartozik a nagy volumenű fordítás, tartalommoderálás, UI és dashboard generálás, valamint szimulációk készítése valós időben. Már olyan vállalatok, mint a Latitude, a Cartwheel és a Whering, tesztelik a modellt komplex, nagy terhelésű feladatokon, és pozitív visszajelzéseket adnak a pontosságáról és a költséghatékonyságról.

A Google a Gemini 3.1 Flash‑Lite-t a Gemini 3 sorozat részeként, a következő napokban és hetekben kiterjeszti a elérhetőséget, és a fejlesztők számára folyamatosan frissített dokumentációt és példakódot biztosít. A következő hónapokban a vállalat további fejlesztéseket és integrációkat tervez a Vertex AI környezetében, hogy a vállalati szintű alkalmazások is profitálhassanak a modell sebességéből és költséghatékonyságából.

tetszett a cikk? oszd meg →
Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom