A Google csendben indította el az offline AI diktáló alkalmazását iOS-re
Az ingyenes "Google AI Edge Eloquent" alkalmazás a Gemma-alapú beszédfelismerő modelljeivel automatikusan kiszűri a töltelékszavakat és formázza a szöveget.

Halkában indított el egy új, mesterséges intelligencia alapú diktáló alkalmazást a Google iOS-re, a Google AI Edge Eloquent néven. Az ingyenes applikáció a Gemma-alapú automatikus beszédfelismerő (ASR) modelljeivel már a telefonra letöltve, offline is képes működni — írja a TechCrunch.
Az alkalmazás élő átírást biztosít, és a szüneteltetés után automatikusan kiszűri a töltelékszavakat, mint a „ööö” vagy „ááá”, majd finomítja a szöveget. A felhasználók választhatnak a „Főbb pontok”, „Formális”, „Rövid” és „Hosszú” opciók közül is a szöveg átalakítására.
A szöveg varázslata
Lehetőség van a „felhő mód” kikapcsolására is, ekkor csak helyi feldolgozást végez az app. Ha be van kapcsolva a felhő mód, akkor a Google felhőalapú Gemini modelljeit használja a szöveg tisztítására. Az Eloquent képes importálni kulcsszavakat, neveket és szakszavakat a Gmail-fiókból, és egyedi szavak is hozzáadhatók a listához.
Beszéd és szöveg hídja
Az alkalmazás megjeleníti az átírási előzményeket, kereshetővé teszi azokat, és mutatja az utolsó munkamenetben diktált szavakat, a percenkénti szószámot és az összes kimondott szót. Az App Store leírása szerint az Eloquent „áthidalja a természetes beszéd és a professzionális, használatra kész szöveg közötti szakadékot”, mesterséges intelligencia segítségével rögzíti a szándékolt jelentést, és automatikusan szerkeszti ki a felesleges hangokat és önkorrekciókat.
Bár az app jelenleg csak iOS-en érhető el, az App Store leírása egy Android verzióra is utal. Eszerint az Eloquent „zökkenőmentes Android-integrációt” kínálna, ahol alapértelmezett billentyűzetként állítható be a rendszerben, és egy lebegő gomb funkcióval is rendelkezne, hasonlóan a Wispr Flow Androidos megoldásához. A Google fejlesztői csapata a 2024. év elejére tervezi az Android verzió kiadását.