AI, képszerkesztés

Nano Banana

A Nano Banana képszerkesztő a Google Gemini 2.5 Flash Image modelljén alapuló mesterséges intelligencia, amely teljesen új szintre emeli a fotószerkesztést.
Ez az AI-eszköz nem helyetted alkot, hanem veled együtt dolgozik: megérti az utasításaidat, és csak azt változtatja meg a képen, amit te kérsz. Akár színeket módosítanál, akár eltüntetnél egy hátteret, vagy élesítenéd a részleteket, a Nano Banana pontosan követi a kreatív víziódat.

Anime lány egy fotólaborban, képeket nézeget – AI képszerkesztés és Nano Banana bemutatóhoz

A Nano Banana képszerkesztő születése

A Nano Banana képszerkesztő, hivatalos nevén Gemini 2.5 Flash Image, a Google legújabb mesterséges intelligencián alapuló képgeneráló és -szerkesztő rendszere. A modell a fejlesztés korai szakaszában „Nano Banana” kódnéven futott az LMArena nevű közösségi tesztplatformon, ahol a felhasználók valós feladatokon próbálhatták ki teljesítményét anélkül, hogy tudták volna, valójában a Google legújabb AI-járól van szó.

A titkos tesztelés 2025 augusztusában zárult, és augusztus 26-án a cég hivatalosan is bemutatta a modellt a Gemini termékcsalád részeként. A „Nano Banana” név eredetileg csak egy fejlesztési helykitöltő kód volt, ám az internet gyorsan felkapta, és a becenév hamar az AI közösségek egyik kedvencévé vált. A modell különösen azzal vált híressé, hogy precíz képszerkesztési képességei mellett elindította a „3D figurine” fotótrend-et – ahol a felhasználók saját szelfijeiket alakították át miniatűr játékfigurákra emlékeztető képekké.

Ez az AI azonban nem csak egy mesterséges intelligencia képgenerátor.

Ez az AI tényleg érti, mit akarsz – hajszínt cserél, hátteret módosít, új tárgyakat ad hozzá, vagy épp kitöröl valamit, amit nem szeretnél a képen.
És a legjobb? Mindezt természetes nyelven, egyszerűen beírt parancsokkal teszi, miközben megjegyzi a szereplőidet, így minden képed összhangban marad.

Anime-stílusú illusztráció, ahol egy lány a saját 3D figuráját tartja a kezében – a Nano Banana AI képszerkesztő trendje ihlette jelenet

A modell egyik legmenőbb funkciója a multi-image fusion, amivel több fotót összekombinál egyetlen, valósághű jelenetté.
A Nano Banana „világismereti” képessége is elképesztő – felismeri, mi tűnik logikusnak egy adott szituációban, így az eredmény mindig hiteles és élethű lesz.
A Google közben a felelősségteljes AI-használatról sem feledkezett meg: a képeket SynthID láthatatlan vízjellel látja el, így később is azonosíthatók, mint AI-alkotások.
A modell pár héttel a megjelenés után már elérhető volt a Gemini appban, a Google AI Studio-ban és a Vertex AI-ban.
A számok magukért beszélnek:
➡️ több mint 10 millió új felhasználó,
➡️ és 200 millió szerkesztett kép mindössze pár hét alatt.

A techvilág is imádta:

  • a TechRadar szerint a Nano Banana sokkal valósághűbb és következetesebb, mint más képgenerátorok,

  • a Tom’s Guide kiemelte, hogy kreatív és életteli képeket gyárt,

  • a PC Gamer pedig azt írta, hogy bár nincs benne minden alapfunkció (például vágás), lenyűgöző pontossággal dolgozik még bonyolult jeleneteknél is.

A Nano Banana még az építészeti látványterveknél is bizonyított: képes volt pontos méretarányokat tartani, akkor is, ha a geometria kifejezetten bonyolult volt.

Összességében ez az AI-eszköz nemcsak technológiai újítás, hanem egy fordulópont is:
megmutatja, hogy az emberi kreativitás és a gépi precizitás nem kizárják egymást, hanem együtt alkotnak.

Nano banana - első lépések

1. Lépés – Lépj be a Gemini platformra

👉 https://gemini.google.com
Ez a Google mesterséges intelligencia központi oldala, ahol a „Gemini Advanced” és a képgenerálás/szerkesztés funkciók is elérhetők.

  • Jelentkezz be a Google-fiókoddal

  • Ha több fiókod van (pl. magán és oktatási), érdemes a saját, személyes fiókoddal belépni — az AI-funkciók legtöbbször ott engedélyezettek

2. Lépés – Engedélyezd a képgenerálást

  • A fő Gemini-felületen a beviteli mező jobb oldalán látni fogsz egy 📷 ikon-t vagy egy „Create image” / Képek az Imagennel opciót.

  • Ha először használod, a rendszer engedélyt kér a képek generálására / szerkesztésére — engedélyezd.

  • Ezzel aktiválod a Gemini 2.5 Flash Image modellt (ez a „Nano Banana”).

A Gemini mesterséges intelligencia üdvözlő képernyője, ahol a felhasználó bejelentkezés után kiválaszthatja az eszközöket, például a képgenerálást vagy a Nano Banana modellt.

Google AI Studio

A Google AI Studio a Google által fejlesztett, webalapú fejlesztői és kísérleti környezet, melyet 2023 decemberében adtak ki a Gemini API-jával együtt. 
Ez a platform lehetőséget ad arra, hogy a felhasználók kipróbálják a Google legújabb generatív mesterséges intelligencia modelljeit – például a Gemini, Imagen, Veo és LearnLM modelleket. 

A felületet eredetileg fejlesztőknek szánták, de nem szükséges hozzá programozói tudás, hogy haszálhasd, a rendszer természetes nyelvű promptokkal is működik, így bárki kipróbálhatja a képgenerálást, videókészítést vagy akár a hangalapú kimeneteket is. 

A Google AI Studio főbb funkciói

A felület központi eleme egy promptmező, ahol utasításokat adhatsz a modellnek és egy beállításpanel, ahol kiválaszthatod, melyik modellt szeretnéd használni:

  • 🧩 Gemini 2.5 Pro – összetett szöveges feladatok, logika és programozás

  • 🖼️ Nano Banana (Gemini 2.5 Flash Image) – képgenerálás és képszerkesztés

  • 🎥 Veo – videók generálása és szerkesztése

  • 🔊 Text-to-Speech / LearnLM – hanggenerálás és oktatási célú modellek

A Google AI Studio támogatja a többlépéses párbeszédeket, az utasítások finomhangolását (tone / style), valamint az AI viselkedésének szabályozását (pl. barátságos, hivatalos, inspiráló stílus).

További különlegességei közé tartozik:

  • képek generálása az Imagen modellel,

  • valós idejű képernyőmegosztás és élő elemzés,

  • Python-futtatás biztonságos környezetben,

  • weboldalak elemzése URL alapján,

  • és a „thinking mode”, amely összetett érvelési feladatokra készült.

A Google AI Studio külön kezeli az ingyenes és a fizetős felhasználókat. Az ingyenes fiókoknál a beküldött promptokat és képeket a Google felhasználhatja fejlesztési célokra, anonimizálva. A fizetős fióknál az adatok nem kerülnek be a tréningfolyamatba, csak átmenetileg tárolják őket biztonsági ellenőrzés céljából. Erre figyelj mindenképp 

Adatkezelés és biztonság

A Google AI Studio külön kezeli az ingyenes és a fizetős felhasználókat. Az ingyenes fiókoknál a beküldött promptokat és képeket a Google felhasználhatja fejlesztési célokra, anonimizálva. A fizetős fióknál az adatok nem kerülnek be a tréningfolyamatba, csak átmenetileg tárolják őket biztonsági ellenőrzés céljából. Erre figyelj mindenképp – és főleg a free verzióban – ne küldj érzékeny vagy személyes információt

Elérhetőség és használat

A Google AI Studio mindenki számára elérhető, de bizonyos országokban 2024 közepéig korlátozott volt a hozzáférés. Ma Magyarországon teljes funkcionalitással használható, 18 éven felüliek számára. 

Google AI Studio felülete, ahol a felhasználó kiválaszthatja a Nano Banana (Gemini 2.5 Flash Image) képgeneráló modellt és beállíthatja a paramétereket, például a kreativitás szintjét és a képarányt.

Funkciók, amiket érdemes még kiemelni

🔹 1. Modellválasztás (bal oldali lista)

  • Nano Banana 🟢 (New) – a kép- és fotószerkesztésre fejlesztett modell.

  • Gemini 2.5 Pro – a legnagyobb nyelvi modell, kódoláshoz és szöveges feladatokhoz.

  • Gemini Flash Latest – gyorsabb, kisebb, de nagy kontextusablakkal rendelkező változat.

 

🔹 2. Jobb oldali beállítási panel (Run settings)

Ez a panel a kreatív beállítások központja.
A legfontosabb elemek:

  • Temperature → szabályozza, mennyire legyen kreatív az AI (0 = pontos, 1 = kreatívabb).
    👉 Például: 0.2-nél hű marad a prompthoz, 1-nél „művészibb” képeket hoz.

  • Aspect ratio → képarány (négyzet, fekvő, álló).

  • System instructions → itt adható meg az AI „személyisége” vagy stílusa
    (pl. „barátságos magyarázatot adó oktató” vagy „fotórealisztikus stílus”).

  • Advanced settings → ritkán szükséges, de itt lehet finomhangolni a válasz hosszát, képméretet stb.

 

🔹 3. Felső sáv (Chat prompt)

Ez a központi promptmező, ahol megadható az utasítás. A Gemini AI Studio itt valós időben kommunikál a kiválasztott modellel – vagyis ha a Nano Banana aktív, akkor a képgenerálás itt történik.

🔹 4. Bal oldali menü

  • Home / Chat → alap promptfelület

  • Build → AI-projektek (pl. alkalmazások, API-kapcsolatok)

  • Dashboard → futási statisztikák

  • Documentation → hivatalos leírások, tanári anyagokhoz is hasznos

 

Na, most már tudjuk, honnan jött a Nano Banana, hogyan működik a Google AI Studio, és miért lett ekkora őrület a „3D figurine” trend.
Itt az ideje, hogy mi is belevágjunk!
A következő leckében megnyitjuk a Nano Banánát, beírjuk az első promptokat, és megnézzük, mire képes ez az AI, ha a mi ötleteinket kapja meg 🍌

Lecke vége: anime lány V-jelet mutat, laptopon Visual Studio Code, mellette bögre tea és alvó cirmos macska, konfettivel.

Ha szeretnéd folytatni a tanulást, itt válogathatsz az AI anyagok között

ChatGPT a diákok szolgálatában

ChatGPT a diákok szolgálatában

ChatGPT "Helló, én vagyok ChatGPT. Egy digitális segítő, aki sosem felejti el a házit, nem kér kifogásokat, és mindig készen áll válaszolni."- ChatGPT - Képzelj el egy csendes, de okos padtársat, aki nem kér el tőled rágót, viszont mindig tud valami hasznosat mondani...

bővebben