AI karaktergenerálás, képszerkesztés
Hogyan őrzi meg az AI ugyanazt a karaktert?
A képgenerálás egyik legnagyobb kihívása, hogy az AI ugyanazt a szereplőt vagy tárgyat több képen át felismerhetően megőrizze. Ha korábban próbáltál karaktert rajzoltatni, biztos észrevetted:
– egyik képen más a haja
– másikon eltűnik a pulcsija
– harmadikon már teljesen más lesz a stílusa.
A Gemini 2.5 Flash Image (más néven Nano Banana) ezt a problémát végre megoldja.
Ez az AI karaktergenerálás új szintje – a modell már képes ugyanazt a karaktert több képen keresztül megőrizni, akár más környezetben, hangulatban vagy pózban is.
Mit tud a Gemini 2.5 Flash Image?
Ezzel a modellel nemcsak képet szerkeszthetsz, hanem karaktert is építhetsz, aki aztán több jeleneten át is „él”. Ez az AI karaktergenerálás egyik legizgalmasabb területe: ugyanaz a szereplő több képen, más-más környezetben is felismerhető marad.
Nyisd meg a Google AI Studio felületét, válaszd ki a Gemini 2.5 Flash Image modellt (Nano Banana), majd töltsd fel a saját képedet.
A példában egy anime lányból indulunk ki – ő ennek a honlapnak a kulcsfigurája. Egyetlen prompt segítségével képesek vagyunk átalakítani a jelenetét:
💡 például az egyik képen, az utcán a levegő minőségét mérte, ebből a verzióból futóruhás, tavaszi erdei karaktert készítünk.
A promptom magyarul: tartsd meg ugyanazt az anime lányt, de öltöztesd futóruhába. Helyezd őt zöld fák közé, ahol tavaszi napsütésben lágy fénnyel körülvett erdei ösvényen fut. Az arcát, haját, arckifejezését tartsd meg az eredeti képpel összhangban. Ezt persze lehetne még finomítani, de a példa kedvéért elég lesz ennyi is.
🧩 Hogyan működik?
A rendszer elemzi a képen látható karaktert, és felismeri a jellegzetességeit:
arcforma, hajszín, testarány, ruházat, stílus.
Ezután a megadott új prompt alapján új kontextusban, de azonos karakterrel hozza létre a képet.
Ez az, amit az AI karaktergenerálás során karakterkövetkezetességnek nevezünk — és ami a Gemini 2.5 Flash Image egyik legnagyobb erőssége.
Mielőtt megmutatja a képet, ha ezt még nem állítottad be, fel fog dobni egy ablakot, hogy szeretnéd-e elmenteni a beszélgetéseidet és projektjeidet a Google Drive-odra, vagy csak ideiglenesen dolgozol.
Két lehetőséged van:
-
Enable Google Drive –
Ajánlott, ha tartósan szeretnél dolgozni (projektek, képszerkesztések, promptok megmaradnak).
A fájlok a Drive-od egy külön „AI Studio” mappájába kerülnek.
Ez jó, ha több leckét készítesz, vagy vissza akarsz térni egy előző képgeneráláshoz. -
Cancel and use Temporary chat –
Ezt válaszd, ha csak kipróbálod, és nem akarod, hogy bármi elmentődjön.
Ilyenkor a munkamenet a böngésző bezárásakor elveszik.
És íme anime lány, amit az utcáról az erdei ösvényre került:
Képgenerálás termékfotóhoz
Képzeld el, hogy egy webshopod van, ahol több termékeket árulsz, különféle színekben. A Nano Banana segítségével könnyedén cserélhetsz a termékeden hátteret, színeket, vagy készíthetsz karácsonyi, tavaszi, minimalista stb. verziókat ugyanarról a termékről.
A példában két horgolt babát alakítok át. Egy nem túl jó képet készítettem róluk, de most szeretném őket inkább karácsonyi környezetben megmutatni. A lényeg, magát a horgolást ne dolgozza át, csak a hátterét és a babák pozícióját helyezze át
A promptom: Tartsd meg ugyanazt a két horgolt babát, javítsd a fényeket és a kompozíciót.
Helyezd őket egy hangulatos karácsonyi környezetbe, meleg fényű égősorral, halvány elmosódott fényeffekttel, fenyőágakkal és ünnepi díszekkel a háttérben.
A babák horgolt textúrája maradjon természetes és részletes, az egész kép legyen webshop-kompatibilis termékfotó.
Mi várható a következő leckében?
Ebben a leckében a karakterkövetkezetességet néztük meg, legközelebb pedig a Gemini 2.5 Flash Image másik új képességét mutatom meg – a világismeretet (native world knowledge).
A korábbi AI modellek gyönyörű képeket készítettek, de nem értették, mit ábrázolnak. Ha lerajzoltál egy diagramot, az AI gyakran nem tudta értelmezni, mit szeretnél.
Ezen változtatott a Gemini 2.5 Flash Image: a modell már nemcsak a vizuális elemeket látja, hanem összefüggéseiben is érti, mit ábrázol a kép.
Ez a fejlődés az AI karaktergenerálás világában is új távlatokat nyit – hiszen most már nemcsak következetes szereplőket, hanem értelmes, kontextusban is helyes jeleneteket alkothatunk.
Erről bővebben a jövő heti leckében írok.
Addig is, ha szeretnél az AI világáról még többet megtudni, válogass a korábbi leckék között is.



