Frissítve: 16 perce·Ma: 57
Alkalmazások
AI által generált szöveg

Gemini a Google Fotókból generál személyre szabott képeket

A Google Gemini mesterséges intelligenciája mostantól közvetlenül a Google Fotók adatait használja fel, hogy személyre szabott képeket alkosson a felhasználók ízlése és életmódja alapján.

Gemini a Google Fotókból generál személyre szabott képeket
Fotó: Vitaly Gariev / Unsplash
Forrás: The VergeSzerző: AI Forradalom szerk.
Megosztás

A Google Gemini "Személyes Intelligencia" funkciója új képességgel bővült: a felhasználók a Google Fotókhoz csatlakoztatva egyedi, személyes kontextusú képeket generálhatnak. A funkció a Nano Banana 2 képmodellt használja a vizuális tartalom létrehozására – írja a The Verge.

Ez azt jelenti, hogy a felhasználók olyan promptokat adhatnak meg, mint „Tervezd meg álomházamat” vagy „Készíts képet a sivatagi szigeti alapvető dolgaimról”, és a Gemini által generált képek automatikusan tükrözik a felhasználó specifikus ízlését és életmódját, a csatlakoztatott Google alkalmazásokból gyűjtött adatok alapján – közölte a Google blogbejegyzésében. Az Ars Technica szerint akár olyan kérések is megadhatók, mint „készíts egy agyaganimációs képet rólam és a családomról, amint a kedvenc tevékenységünket űzzük”.

A művészi látomás kulcsa

A háttérben az integráció a Google Fotókban lévő címkéket használja fel, hogy azonosítsa a felhasználót, barátait és családját, majd a Nano Banana 2 hozza létre a képet – mondta Elijah Lawal, a Google szóvivője a The Verge-nek. Ez a folyamat jelentősen leegyszerűsíti az utasítások megfogalmazását, mivel nem kell hosszú, részletes leírásokat adni.

A személyre szabott alkotás folyamata

A Google hangsúlyozza, hogy bár a felhasználók választhatják a Személyes Intelligencia funkciót, a vállalat nem fogja közvetlenül betanítani AI modelljeit a privát Google Fotók könyvtárából származó adatokkal. Ugyanakkor „korlátozott információkat”, például a Gemini specifikus promptjait és a modell válaszait felhasználja a betanításhoz. A Google blogja szerint a felhasználók teljes kreatív kontrollt élveznek, bármikor finomíthatják az eredményeket vagy cserélhetik a referenciafotókat.

A funkció bevezetése az Egyesült Államokban az AI Plus, Pro és Ultra előfizetők számára 2024. március elsején kezdődik, és hamarosan elérhetővé válik a Gemini Chrome asztali verziójában is.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom