Google-ning so‘nggi “Banana” AI tasvir modeli, foydalanuvchilarni “Vibe Photoshoping” bilan hayratda qoldirdi

MarsBit2025/08/30 06:53

Asl nusxasini ko'rsatish

tomonidan:TechFlow

Google AI Studio Gemini 2.5 Flash Image (kod nomi: nano-banana) ni chiqardi, bu Google’ning eng ilg‘or rasm yaratish va tahrirlash modeli bo‘lib, tez ishlaydi va ko‘plab reytinglarda yuqori natijalarni ko‘rsatmoqda. Mazkur xulosa Mars AI tomonidan ishlab chiqilgan. Ushbu xulosaning aniqligi va to‘liqligi hali ham yangilanish bosqichida.

Avval hamma muhokama qilgan sirli AI rasm tahrirlash modeli "nano-banana"ni eslaysizmi? O‘sha paytda LMArena katta til modeli arenasi ichida u ajoyib natijalari bilan ko‘plab muhokamalarga sabab bo‘lgandi. Google Gemini texnologiya mutaxassislari ham ijtimoiy tarmoqlarda ko‘plab qiziqish uyg‘otgan, hatto bir muddat Gemini 3.0 Pro deb mish-mishlar tarqalgan edi.

Endi esa, Google nihoyat uning sirini ochdi.

Sharqiy 8-chi zona vaqti bilan 27-avgust tongida, Google AI Studio rasmiy ravishda Gemini 2.5 Flash Image (kod nomi nano banana) 🍌 ni taqdim etdi.

Uzoq kutilgan Gemini 2.5 Flash Image nihoyat taqdim etildi ｜ Rasm manbasi: GeekPark

Bu hozirgacha Google tomonidan yaratilgan eng ilg‘or rasm generatsiyasi va tahrirlash modeli bo‘lib, nafaqat juda tez, deyarli "chaqmoqdek" tezlikda ishlaydi, balki bir nechta reytinglarda SOTA natijalarini qo‘lga kiritdi, LMArena’da esa ancha oldinda turibdi.

Gemini 2.5 Flash Image sahnaga chiqqan zahoti SOTA darajasiga yetdi ｜ Rasm manbasi: LMarena.ai

Texnik blogda Google Gemini 2.0 Flash allaqachon past kechikish va yuqori samaradorligi bilan ishlab chiquvchilarni o‘ziga jalb qilganini aytadi, lekin foydalanuvchilar har doim yanada yuqori sifatli rasm va kuchliroq ijodiy nazoratni kutishgan. Gemini 2.5 Flash Image aynan shu yirik yangilanishlar bilan chiqdi: personaj izchilligi nihoyat to‘liq saqlanadi, prompt asosidagi rasm tahriri yanada aniqroq, bir nechta rasmni birlashtirish tabiiy va silliq, haqiqatdagi dunyo bilimini tushunishi esa uni shunchaki model emas, balki keyingi avlod mashhur ilovalari uchun poydevor bo‘ladigan "nuqta"ga aylantiradi.

GeekPark ham uni birinchi bo‘lib sinab ko‘rdi. Kutilmaganda, bu shunchaki model yangilanishi emas, balki birinchi marta AI rasm tahriri kelajagi ko‘z oldimizda ekanini his qildirdi.

Google AI Studio’da hozirda ochiq tajriba mavjud ｜ Rasm manbasi: GeekPark

Dastlab, men oddiygina yangi model qayerda tezligini ko‘ray, deb sinab ko‘rdim. Lekin bir necha soatlik tajriba menga keyingi avlod mashhur ilovalarining qanday bo‘lishini oldindan ko‘rsatdi.

Oldin biz Meitu XiuXiu kabi vositalarga o‘rganib qolganmiz, tugmani bosasiz, filtr tanlaysiz va surat tezda chiroyli bo‘lib qoladi. Lekin Gemini 2.5 Flash Image butunlay boshqacha his qoldiradi. U aql bovar qilmas darajada tez, sizni tushunadigan dizaynerdek aqlli, siz faqat natijani aytasiz, u esa bir necha soniyada rasmni yaratib beradi.

Natijadan tashqari, tezlik ham Gemini 2.5 Flash Image’ni avvalgi model rasm generatsiyasi mahsulotlaridan ajratib turadigan asosiy tajriba ｜ Rasm manbasi: GeekPark

01 Yorqin tezlikda generatsiya, bir necha soniyada natija

Nano banana tajribasining eng sezilarli jihati — bu tezlik. Oldin ba’zi ochiq manba modellaridan foydalanganda, kompyuteringiz kuchli bo‘lsa ham, prompt kiritib, yaxshi rasm olish uchun o‘nlab soniyalar, ba’zan undan ham ko‘proq kutishingizga to‘g‘ri kelardi. Telefon foydalanuvchilari uchun bu kutish yanada og‘ir bo‘lardi.

Lekin Gemini 2.5 Flash Image bu to‘siqni bir necha soniyaga tushirdi. Bu Google tomonidan "eng yangi, eng tez, eng samarali" deb e’lon qilingan asl multimodal model bo‘lib, optimizatsiyaga juda katta e’tibor qaratilgan. Amaliy testda men bir gapli prompt kiritdim, taxminan uch-to‘rt soniyada natija oldim, ruxsat va detallar ham juda tiniq edi. (UTC+8)

Bu tajriba kundalik Meitu XiuXiu’da surat tahrirlashga o‘xshaydi: "Go‘zallashtirish" tugmasini bossangiz, natija deyarli darhol ko‘rinadi. Farqi shundaki, Meitu XiuXiu algoritm orqali filtr qo‘llaydi, Gemini 2.5 Flash Image esa rasmni noldan yaratadi yoki suratni siz xohlagan tarzda tubdan o‘zgartiradi. Bu "aytganingizni darhol bajarish" zavqi, ilgari murakkab P-rasm jarayonlarida tasavvur qilib bo‘lmasdi.

Bunday "fonni olib tashlash" kabi ehtiyojlar uchun faqat bitta prompt kifoya ｜ Rasm manbasi: GeekPark

Agar tezlik an’anaviy P-rasm foydalanuvchilari uchun tajribani yaxshilasa, demak "asl multimodal" esa AI rasm imkoniyatlari chegarasini kengaytiradi.

Gemini 2.5 Flash Image nafaqat rasm yaratadi, balki matn va rasm kirishini bir vaqtda tushunadi. Bu degani, men unga surat va matnli promptni birga bera olaman, u esa ikkalasini birlashtirib, aynan nimani xohlayotganimni tushunadi.

Masalan, men ko‘chada olingan suratni yukladim va unga "fonni Tokio Shinjuku tungi manzarasiga o‘zgartir" dedim. U nafaqat suratdagi asosiy ob’ektni aniqladi, balki odamni aniq ajratib oldi va fonni neonsimon Shinjuku ko‘chasiga almashtirdi. Eng muhimi, u odamning yorug‘lik va soya muvofiqligini saqlab qoldi, oddiy qo‘lda ajratishda ko‘p uchraydigan "qattiq joylashtirish" effektidan asar ham yo‘q.

Bu tushunish qobiliyati menga so‘nggi yillarda telefon ishlab chiqaruvchilari o‘z galereya ilovalariga qo‘shgan "bir bosishda fonni almashtirish" funksiyasini eslatdi. Lekin farqi shundaki, o‘sha paytdagi fon almashtirishda chekkalar xira, yorug‘lik noto‘g‘ri, natija sun’iy bo‘lardi. Endi esa, Gemini 2.5 Flash Image dunyo bilimlari va vizual tushunish orqali bu detallarni to‘ldiradi, natija tabiiyroq, an’anaviy matndan rasmga yoki rasmdan rasmga model vositalaridan ancha aniqroq detallarni saqlaydi.

Asl rasm & Gemini 2.5 Flash Image natijasi ｜ Rasm manbasi: GeekPark

Shu sababli menimcha, bu rasm tahriri tajribasini qayta belgilaydi: endi ko‘p qo‘lda sozlashga tayanmaydi, balki modelning tabiiy semantik tushunishi orqali, masalan, portret P-rasmda yuqori detal talab qilinadigan holatlarda, "kuchli va tez" tarzda vazifani bajaradi.

Bunday portret rasm tahriri ehtiyojlari uchun Gemini 2.5 Flash Image personaj izchilligi bilan ilgari bo‘lmagan "Vibe Photoshoping" tajribasini beradi.

Dasturchiga bir soniyada "obro‘ni saqlash" ｜ Rasm manbasi: GeekPark

Bu tajriba ko‘plab odamlarning AI rasm generatsiyasi haqidagi avvalgi tasavvurini — "sirli"ligini — buzadi: promptingiz yaxshi bo‘lsa, natija ajoyib; prompt o‘rtacha bo‘lsa, natija butunlay boshqa bo‘lib chiqishi mumkin.

Lekin Gemini 2.5 Flash Image’da bu "sirli"lik ancha kamayganini ko‘rdim. U promptlarni aniqroq va foydalanuvchi intuitsiyasiga yaqinroq tushunadi — shuning uchun ko‘plab odamlar uni ancha qulay deb hisoblashadi.

Masalan, men unga "fonni xiralashtir, oldingi odamni ajratib ko‘rsat" dedim, bir necha soniyadan so‘ng aynan xohlagan natijam chiqdi; "suratdagi odamni tabassumli qilib o‘zgartir" dedim, nafaqat lablar ko‘tarildi, balki ko‘z qarashi ham o‘zgardi, detallar juda aniq; hatto "qora-oq suratga rang ber" deb ko‘rdim, natijada rangli rasm tasodifiy emas, balki tarixiy suratga mos rang muhitini saqlagan.

Bu "aytganingizni bajarish" qobiliyati menga Meitu XiuXiu’da ilgari faqat terini yumshatmoqchi bo‘lib, butun yuz "10-darajali go‘zallashtirish"ga aylanganini eslatdi. Endi esa, Gemini 2.5 Flash Image harakati aniq va ehtiyotkor, u siz xohlagan narsani tushunadi va imkon qadar asl holatni saqlaydi.

02 Kuchaygan imkoniyatlar, qaytish qiyin

Yana ham aniqroq ko‘rsatish uchun, men uni kundalik foydalanadigan mobil rasm tahrir vositalarim bilan taqqoslab ko‘rdim.

Snapseed’da fonni xiralashtirish uchun odatda bir-ikki daqiqa oldingi hududni qo‘lda ajratib, xiralik darajasini sozlashim kerak. Tajribali bo‘lsam ham, bir necha marta tuzatishga to‘g‘ri keladi.

Meitu XiuXiu’da bir bosishda fonni xiralashtirish funksiyasi bor, lekin ko‘pincha odam chekkalarini ham xiralashtirib yuboradi, natija tabiiy chiqmaydi.

Gemini 2.5 Flash Image’da esa, men faqat bitta gap aytaman, u odam va fon chegarasini avtomatik aniqlaydi, xiralik tabiiy, umuman qo‘shimcha tuzatishga hojat yo‘q.

Bu taqqoslash bir narsani ko‘rsatadi: Gemini 2.5 Flash Image foydalanuvchini murakkab amallardan ozod qilib, ko‘proq ishni modelga topshiradi. Oddiy odamlar uchun bu rasm tahriri to‘sig‘ini pasaytiradi; mutaxassislar uchun esa ko‘p vaqtni tejaydi.

Tajriba natijasida eng katta taassurotim shuki, Gemini 2.5 Flash Image endi shunchaki rasm tahrir vositasi emas, balki "aqlli yordamchi"ga yaqinlashdi.

Oldin Meitu XiuXiu’dan foydalanganda, siz oldindan belgilangan funksiyalar to‘plamidan foydalanasiz: filtr, go‘zallashtirish, mozaika va har bir tugma bir funksiyaga mos keladi. Siz esa asta-sekin tanlaysiz, har bir bosqichda sozlaysiz, to natija sizni qoniqtirguncha.

Endi esa, Gemini 2.5 Flash Image tamomila boshqacha ishlaydi. U sizdan vosita mantiqini o‘rganishingizni talab qilmaydi, balki to‘g‘ridan-to‘g‘ri ehtiyojingizni tushunadi. Siz faqat aytasiz, u esa bajaradi.

Bu o‘zgarish mayda ko‘rinsa-da, aslida P-rasm jarayonidagi munosabatni butunlay o‘zgartiradi. Oldin biz vositaga moslashardik, endi esa vosita bizga moslashadi. Bu interaktiv usulning o‘zi keyingi avlod ilovalari shaklining boshlanishi.

Hozirgi nuqtadan qaraganda, Gemini 2.5 Flash Image hali erta bosqichda, funksiyalarda cheklovlar bo‘lishi mumkin. Lekin u ko‘rsatgan tezlik, tushunish va asl holatni saqlash darajasi kelajak uchun katta tasavvur uyg‘otadi.

Agar uni Meitu XiuXiu bilan birlashtirsak, nima bo‘ladi? Balki siz ilovani ochasiz, telefonga "Bu suratni tahrir qilib, terini tabiiyroq qil" deysiz va bir necha soniyadan so‘ng natija tayyor bo‘ladi (UTC+8); balki sayohatda suratga olayotganda, "Ob-havoni quyoshli qil" deysiz, surat darhol quyoshli ko‘rinishga ega bo‘ladi; hatto video tahrirda ham, bir gap bilan butun lavhaning muhitini o‘zgartira olasiz.

Kelajakda bu usul tez orada mobil operatsion tizimlarda asosiy rasm tahrir funksiyasiga aylanishi mumkin ｜ Rasm manbasi: Twitter

Shu sababli menimcha, u P-rasm vositalari sohasidagi mavjud ish jarayonini tezda inqilob qiladi va keyingi avlod "Meitu XiuXiu"ni belgilaydi: bu shunchaki rasm tahriri emas, balki rasmni qayta ishlash interaktiv usulini qayta yaratadi va AI sizning fotografiya hamkoringizga aylanadi.

Lekin hozircha Gemini 2.5 Flash Image hali bir zumda tayyor, ommaviy P-rasm ilovasi bo‘la olmaydi: sababi, uning asosiy maqsadi hali ham rasm generatsiyasi, mavjud rasmni mayda sozlash emas, va Gemini 2.5 Flash Image orqali yaratilgan yoki tahrirlangan barcha rasmda SynthID raqamli suv belgisi bo‘ladi, bu esa ijtimoiy platformalarda AI yaratilgan kontentni aniqlash uchun ishlatiladi.

03 Mashhurlik portlashi nuqtasi

Orqaga qarasak, Meitu XiuXiu bir paytlar ommaviy ilovaga aylanganining sababi, u eng oddiy usulda hamma hal qilmoqchi bo‘lgan muammoni hal qilgan — suratni chiroyli qilish.

Gemini 2.5 Flash Image esa, aynan shu asosda, murakkab AI imkoniyatlarini har kim foydalanishi mumkin bo‘lgan "bir zumda rasm" tajribasiga aylantiradi.

Unga birinchi marta "fonni xiralashtirib ber" deganimda, bir necha soniyadan so‘ng rasm tabiiy tarzda tahrirlangani — aynan mashhur ilova portlash nuqtasi ekanini angladim. U shunchaki model emas, balki kelajakdagi ko‘plab yangi mahsulotlarning asosiy imkoniyati.

So‘nggi yillarda telefon foydalanuvchilari orasida mashhur bo‘lgan AI bir bosishda osmonni almashtirish funksiyasi ｜ Rasm manbasi: vivo Community

Ehtimol, bir necha yildan so‘ng biz Banana kod nomini unutamiz, lekin "xohlagan narsangizni ayting, darhol amalga oshadi" tajribasini beradigan rasm tahrir vositalari tobora ko‘payadi, va ular ham Meitu XiuXiu kabi bir avlod foydalanuvchilarning umumiy xotirasiga aylanadi.

Faqat bu safar, AI tasavvurni yanada uzoqqa olib chiqadi.

Mas'uliyatni rad etish: Ushbu maqolaning mazmuni faqat muallifning fikrini aks ettiradi va platformani hech qanday sifatda ifodalamaydi. Ushbu maqola investitsiya qarorlarini qabul qilish uchun ma'lumotnoma sifatida xizmat qilish uchun mo'ljallanmagan.

PoolX: Aktivlarni kiriting va yangi tokenlar oling.

APR 12% gacha. Yangi tokenlar airdropi.

Qulflash!