Frissítve: 9 perce·Ma: 57
Modellek & LLM
AI által generált szöveg

Microsoft 3 új AI modellt indít, leveri az OpenAI-t és a Google-t

A Microsoft modelljeihez kevesebb mint 10 fős csapatok dolgoztak, akik az iparág legjobb eredményeit érték el.

Microsoft 3 új AI modellt indít, leveri az OpenAI-t és a Google-t
Fotó: Enchanted Tools / Unsplash
Forrás: VentureBeatSzerző: AI Forradalom szerk.
Megosztás

Microsoft a hétköznap három új alapmodellét mutatta be: MAI-Transcribe-1, MAI-Voice-1 és MAI-Image-2. Ezeket teljesen saját fejlesztésben készítették, a Microsoft Foundry és az új MAI Playground keresztül azonnal elérhetővé váltak. A transzkripciós modell a FLEURS bővített nyelvi tesztjén 3,8 % WER-t ért el, ami a 25 nyelv közül a legkisebb. 25 nyelven felülmúlja az OpenAI Whisper‑large‑v3-at, a Google Gemini 3.1 Flash-et 22‑ben és az ElevenLabs Scribe v2-t 15‑ben.

Az új rendszer 200 MB‑os MP3, WAV vagy FLAC fájlokat dolgozhat fel, és 2,5‑szer gyorsabb, mint az Azure Fast transzkripció. A Microsoft már Copilot Voice‑módjában és a Teams beszélgetés transzkripciójában teszteli. A MAI-Voice‑1 60 másodperces hangot generál egy másodperc alatt, a beszélő személyiségét megőrzi és egyetlen néhány másodperces hangmintával testre szabott hangot hozhat létre. A modell ára 22 USD/1 millió karakter.

MAI-Image‑2 a Arena.ai ranglistáján a top‑három közé került, és kétszer gyorsabb generálást kínál Foundry és Copilot környezetben. A Bing és a PowerPoint már használja, a szövegbeviteli díj 5 USD/1 millió token, a képkinyomási díj 33 USD/1 millió token. WPP, a világ egyik legnagyobb reklámcsoportja, már skálázza a modellt.

Az új modellek mögött a 2025‑ös OpenAI‑vel kötött szerződés felülvizsgálata áll. A megállapodás megengedte Microsoftnak, hogy önállóan fejlesszen AGI‑t, miközben 2032‑ig licencét tartja az OpenAI technológiáinak. Suleyman szerint a fejlesztők száma kevesebb, mint tíz, de a modellarchitektúrák és a nagy adathalmazok a kulcs.

Mit jelent ez a versenyre? Microsoft most már saját, 10 emberből álló csapatával képes a legjobb transzkripciót készíteni, felénél kevesebb GPU-val, mint a versenytársak. Ez a modellgazdaság új, költséghatékony modelleket tesz lehetővé, miközben a licencmegállapodás a hosszú távú együttműködést biztosítja az OpenAI‑val.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom