AI, képszerkesztés
Nano Banana
A Nano Banana képszerkesztő a Google Gemini 2.5 Flash Image modelljén alapuló mesterséges intelligencia, amely teljesen új szintre emeli a fotószerkesztést.
Ez az AI-eszköz nem helyetted alkot, hanem veled együtt dolgozik: megérti az utasításaidat, és csak azt változtatja meg a képen, amit te kérsz. Akár színeket módosítanál, akár eltüntetnél egy hátteret, vagy élesítenéd a részleteket, a Nano Banana pontosan követi a kreatív víziódat.
A Nano Banana képszerkesztő születése
A Nano Banana képszerkesztő, hivatalos nevén Gemini 2.5 Flash Image, a Google legújabb mesterséges intelligencián alapuló képgeneráló és -szerkesztő rendszere. A modell a fejlesztés korai szakaszában „Nano Banana” kódnéven futott az LMArena nevű közösségi tesztplatformon, ahol a felhasználók valós feladatokon próbálhatták ki teljesítményét anélkül, hogy tudták volna, valójában a Google legújabb AI-járól van szó.
A titkos tesztelés 2025 augusztusában zárult, és augusztus 26-án a cég hivatalosan is bemutatta a modellt a Gemini termékcsalád részeként. A „Nano Banana” név eredetileg csak egy fejlesztési helykitöltő kód volt, ám az internet gyorsan felkapta, és a becenév hamar az AI közösségek egyik kedvencévé vált. A modell különösen azzal vált híressé, hogy precíz képszerkesztési képességei mellett elindította a „3D figurine” fotótrend-et – ahol a felhasználók saját szelfijeiket alakították át miniatűr játékfigurákra emlékeztető képekké.
Ez az AI azonban nem csak egy mesterséges intelligencia képgenerátor.
Ez az AI tényleg érti, mit akarsz – hajszínt cserél, hátteret módosít, új tárgyakat ad hozzá, vagy épp kitöröl valamit, amit nem szeretnél a képen.
És a legjobb? Mindezt természetes nyelven, egyszerűen beírt parancsokkal teszi, miközben megjegyzi a szereplőidet, így minden képed összhangban marad.
A modell egyik legmenőbb funkciója a multi-image fusion, amivel több fotót összekombinál egyetlen, valósághű jelenetté.
A Nano Banana „világismereti” képessége is elképesztő – felismeri, mi tűnik logikusnak egy adott szituációban, így az eredmény mindig hiteles és élethű lesz.
A Google közben a felelősségteljes AI-használatról sem feledkezett meg: a képeket SynthID láthatatlan vízjellel látja el, így később is azonosíthatók, mint AI-alkotások.
A modell pár héttel a megjelenés után már elérhető volt a Gemini appban, a Google AI Studio-ban és a Vertex AI-ban.
A számok magukért beszélnek:
➡️ több mint 10 millió új felhasználó,
➡️ és 200 millió szerkesztett kép mindössze pár hét alatt.
A techvilág is imádta:
-
a TechRadar szerint a Nano Banana sokkal valósághűbb és következetesebb, mint más képgenerátorok,
-
a Tom’s Guide kiemelte, hogy kreatív és életteli képeket gyárt,
-
a PC Gamer pedig azt írta, hogy bár nincs benne minden alapfunkció (például vágás), lenyűgöző pontossággal dolgozik még bonyolult jeleneteknél is.
A Nano Banana még az építészeti látványterveknél is bizonyított: képes volt pontos méretarányokat tartani, akkor is, ha a geometria kifejezetten bonyolult volt.
Összességében ez az AI-eszköz nemcsak technológiai újítás, hanem egy fordulópont is:
megmutatja, hogy az emberi kreativitás és a gépi precizitás nem kizárják egymást, hanem együtt alkotnak.
Nano banana - első lépések
1. Lépés – Lépj be a Gemini platformra
👉 https://gemini.google.com
Ez a Google mesterséges intelligencia központi oldala, ahol a „Gemini Advanced” és a képgenerálás/szerkesztés funkciók is elérhetők.
-
Jelentkezz be a Google-fiókoddal
-
Ha több fiókod van (pl. magán és oktatási), érdemes a saját, személyes fiókoddal belépni — az AI-funkciók legtöbbször ott engedélyezettek
2. Lépés – Engedélyezd a képgenerálást
-
A fő Gemini-felületen a beviteli mező jobb oldalán látni fogsz egy 📷 ikon-t vagy egy „Create image” / Képek az Imagennel opciót.
-
Ha először használod, a rendszer engedélyt kér a képek generálására / szerkesztésére — engedélyezd.
-
Ezzel aktiválod a Gemini 2.5 Flash Image modellt (ez a „Nano Banana”).
Google AI Studio
A Google AI Studio a Google által fejlesztett, webalapú fejlesztői és kísérleti környezet, melyet 2023 decemberében adtak ki a Gemini API-jával együtt.
Ez a platform lehetőséget ad arra, hogy a felhasználók kipróbálják a Google legújabb generatív mesterséges intelligencia modelljeit – például a Gemini, Imagen, Veo és LearnLM modelleket.
A felületet eredetileg fejlesztőknek szánták, de nem szükséges hozzá programozói tudás, hogy haszálhasd, a rendszer természetes nyelvű promptokkal is működik, így bárki kipróbálhatja a képgenerálást, videókészítést vagy akár a hangalapú kimeneteket is.
A Google AI Studio főbb funkciói
A felület központi eleme egy promptmező, ahol utasításokat adhatsz a modellnek és egy beállításpanel, ahol kiválaszthatod, melyik modellt szeretnéd használni:
-
🧩 Gemini 2.5 Pro – összetett szöveges feladatok, logika és programozás
-
🖼️ Nano Banana (Gemini 2.5 Flash Image) – képgenerálás és képszerkesztés
-
🎥 Veo – videók generálása és szerkesztése
-
🔊 Text-to-Speech / LearnLM – hanggenerálás és oktatási célú modellek
A Google AI Studio támogatja a többlépéses párbeszédeket, az utasítások finomhangolását (tone / style), valamint az AI viselkedésének szabályozását (pl. barátságos, hivatalos, inspiráló stílus).
További különlegességei közé tartozik:
-
képek generálása az Imagen modellel,
-
valós idejű képernyőmegosztás és élő elemzés,
-
Python-futtatás biztonságos környezetben,
-
weboldalak elemzése URL alapján,
-
és a „thinking mode”, amely összetett érvelési feladatokra készült.
A Google AI Studio külön kezeli az ingyenes és a fizetős felhasználókat. Az ingyenes fiókoknál a beküldött promptokat és képeket a Google felhasználhatja fejlesztési célokra, anonimizálva. A fizetős fióknál az adatok nem kerülnek be a tréningfolyamatba, csak átmenetileg tárolják őket biztonsági ellenőrzés céljából. Erre figyelj mindenképp
Adatkezelés és biztonság
A Google AI Studio külön kezeli az ingyenes és a fizetős felhasználókat. Az ingyenes fiókoknál a beküldött promptokat és képeket a Google felhasználhatja fejlesztési célokra, anonimizálva. A fizetős fióknál az adatok nem kerülnek be a tréningfolyamatba, csak átmenetileg tárolják őket biztonsági ellenőrzés céljából. Erre figyelj mindenképp – és főleg a free verzióban – ne küldj érzékeny vagy személyes információt
Elérhetőség és használat
A Google AI Studio mindenki számára elérhető, de bizonyos országokban 2024 közepéig korlátozott volt a hozzáférés. Ma Magyarországon teljes funkcionalitással használható, 18 éven felüliek számára.
Funkciók, amiket érdemes még kiemelni
🔹 1. Modellválasztás (bal oldali lista)
-
Nano Banana 🟢 (New) – a kép- és fotószerkesztésre fejlesztett modell.
-
Gemini 2.5 Pro – a legnagyobb nyelvi modell, kódoláshoz és szöveges feladatokhoz.
-
Gemini Flash Latest – gyorsabb, kisebb, de nagy kontextusablakkal rendelkező változat.
🔹 2. Jobb oldali beállítási panel (Run settings)
Ez a panel a kreatív beállítások központja.
A legfontosabb elemek:
-
Temperature → szabályozza, mennyire legyen kreatív az AI (0 = pontos, 1 = kreatívabb).
👉 Például: 0.2-nél hű marad a prompthoz, 1-nél „művészibb” képeket hoz. -
Aspect ratio → képarány (négyzet, fekvő, álló).
-
System instructions → itt adható meg az AI „személyisége” vagy stílusa
(pl. „barátságos magyarázatot adó oktató” vagy „fotórealisztikus stílus”). -
Advanced settings → ritkán szükséges, de itt lehet finomhangolni a válasz hosszát, képméretet stb.
🔹 3. Felső sáv (Chat prompt)
Ez a központi promptmező, ahol megadható az utasítás. A Gemini AI Studio itt valós időben kommunikál a kiválasztott modellel – vagyis ha a Nano Banana aktív, akkor a képgenerálás itt történik.
🔹 4. Bal oldali menü
-
Home / Chat → alap promptfelület
-
Build → AI-projektek (pl. alkalmazások, API-kapcsolatok)
-
Dashboard → futási statisztikák
-
Documentation → hivatalos leírások, tanári anyagokhoz is hasznos
Na, most már tudjuk, honnan jött a Nano Banana, hogyan működik a Google AI Studio, és miért lett ekkora őrület a „3D figurine” trend.
Itt az ideje, hogy mi is belevágjunk!
A következő leckében megnyitjuk a Nano Banánát, beírjuk az első promptokat, és megnézzük, mire képes ez az AI, ha a mi ötleteinket kapja meg 🍌
Ha szeretnéd folytatni a tanulást, itt válogathatsz az AI anyagok között
You.com – az intelligens kereső
You.comTi is éreztétek már azt, hogy túl sok a házi feladat, nehéz megtalálni a megfelelő infót egy projekthez, vagy egyszerűen csak elakadtatok egy kódolási feladatban? Ne aggódjatok, a kihívásunk harmadik napját egy újabb szuper AI-t mutatok be nektek, ami...
DeepSeek feladat – fedezd fel az AI erejét kihívásokkal
DeepSeekfeladatLegyél digitális nyomozó! Téma: Mesterséges intelligencia, programozás és forráselemzés Eszköz: Deepseek - ezen a linken megtalálod Cél: A második napi kihívás célja, hogy a tanulók aktív felfedezői legyenek az MI világának – ne csak olvassanak...
DeepSeek – ingyenes MI magyarul
DeepseekA mesterséges intelligencia alapú kereső- és szövegíró eszközök egyre több diák életében válnak mindennapossá. A legismertebb ezek közül a ChatGPT, de ma már több alternatíva is elérhető. Ebben a bejegyzésben bemutatjuk a DeepSeek Chatet, amely egy ingyenes,...




