A Microsoft 2,5-szer gyorsabb beszédfelismerő modellt dob piacra
A Microsoft új modelljei olcsóbbak, mint a Google és az OpenAI modelljei, a MAI-Transcribe-1 például 0,36 dollárba kerül óránként.

A Microsoft három új AI modellt adott ki, amelyek képesek szöveget, hangot és képeket generálni. A MAI-Transcribe-1 modell 2,5-szer gyorsabban felismeri a beszédet, mint a Microsoft Azure Fast ajánlata, és óránként mindössze 0,36 dollárba kerül.
Az új modellek kiadása a Microsoft folyamatos erőfeszítését jelzi, hogy saját multimodális AI modelljeit építse ki, és rivális AI laborokkal versenyezzen. A MAI-Voice-1 hanggeneráló modell lehetővé teszi a felhasználók számára, hogy egyéni hangot hozzanak létre, míg a MAI-Image-2 videógeneráló modell képeket és videókat hozhat létre.
A modellek fejlesztését a Microsoft MAI Szuperintelligencia csapata végezte, amelyet Mustafa Suleyman, a Microsoft AI vezérigazgatója vezet. A csapat célja, hogy olyan AI modelleket hozzon létre, amelyek az emberek központjában állnak, és gyakorlati használatra vannak tervezve.
A Microsoft reméli, hogy az új modellek árszintje vonzó lesz az ügyfelek számára, hiszen a MAI-Transcribe-1 modell óránként 0,36 dollárba kerül, a MAI-Voice-1 modell 1 millió karakterért 22 dollárba kerül, míg a MAI-Image-2 modell 1 millió tokenre 5 dollárba kerül szöveges bemenet esetén, és 33 dollárba kerül képes bemenet esetén.
A Microsoft továbbra is elkötelezett a partnerei mellett, köztük az OpenAI mellett, és az új modellek kiadása nem jelenti a partnerekkel való együttműködés végeét. A Microsoft 13 milliárd dollárt fektetett be az AI kutatásba, és a modelleket saját termékeiben használja fel.
Most, hogy a Microsoft kiadta saját AI modelljeit, érdekes lesz látni, hogyan fogja ezt a lépést az iparág fogadni, és hogyan fogja befolyásolni a jövőbeli fejleményeket az AI területén.