A Google bemutatja a Gemini 3.1 Flash-Lite-ot: gyorsabb és olcsóbb, mint a 2.5 Flash
A Gemini 3.1 Flash-Lite ára 0,25 dollár 1 millió bemeneti tokenenként és 1,50 dollár 1 millió kimeneti tokenenként, ami 2,5-ször gyorsabban ad választ, mint a 2.5 Flash modell.

A Google DeepMind már 2026. március 3-án bejelentette a Gemini 3.1 Flash‑Lite‑ot, amelyet a Gemini API és a Vertex AI révén tesz elérhetővé fejlesztők és vállalatok számára. A modell 0,25 dollár / millió bemeneti token és 1,50 dollár / millió kimeneti token áron kerül értékesítésre, ami a 2,5 Flash‑nál 2,5‑szer gyorsabb első válaszidőt és 45 % gyorsabb kimenetet biztosít.
A Gemini 3.1 Flash‑Lite célja, hogy a legnagyobb mennyiségű fejlesztői terheléshez igazodó, költséghatékony megoldást nyújtson. A modell 1432‑es Elo pontszámot ért el az Arena.ai Leaderboardon, és 86,9 % pontot kapott a GPQA Diamond, valamint 76,8 % pontot a MMMU Pro feladatokon, ami azt jelzi, hogy a teljesítménye akár nagyobb, korábbi generációs Gemini‑modellöket is meghaladja.
Technikailag a Flash‑Lite a Gemini 3 sorozat egyesített képességeit használja, de optimalizált „thinking levels” funkcióval. A fejlesztők a Google AI Studio vagy a Vertex AI felületén szabhatják be, mennyire „gondolkodik” a modell egy adott feladat során, így finomhangolva a válaszidőt és a költségeket.
Az új modell különösen jól alkalmazható nagy forgalmú, költségérzékeny feladatokra, mint a fordítás, tartalommoderálás vagy valós idejű szimulációk. Már több cég, például Latitude, Cartwheel és Whering, használja a Flash‑Lite‑ot komplex problémák megoldására, és a felhasználók a modell hatékonyságát és érvelési képességét dicsérik.
A Google a Gemini 3.1 Flash‑Lite bevezetésével a magas szintű AI-t a szélesebb közönség számára is elérhetővé teszi. A következő hetekben várható, hogy a modell teljes elérhetősége bővül, és a fejlesztők új, valós idejű alkalmazásokat fognak kiadni. Figyeljük, hogy milyen új use case-ek és integrációk jelennek meg a Vertex AI és a Google AI Studio környezetében.}