گوگل با «نانو بنانا» استانداردهای هوش مصنوعی تصویری را ارتقا داد
گوگل دوباره مرزهای هوش مصنوعی را جابه‌جا کرده است. با معرفی مدل Gemini 2.5 Flash Image (که به‌صورت غیررسمی «نانو بنانا» نامیده می‌شود)، این شرکت به چالش‌های اصلی مدل‌های تولید تصویر — از جمله عدم ثبات تصویری و ویرایش محدود — پاسخ داده است.
به‌علاوه، گوگل مجموعه‌ای از ابزارهای رایگان و قابل‌سفارشی را عرضه کرده که تمام این قابلیت‌های جدید را به نمایش می‌گذارد.

nano banana image1 scaled

✨ ویژگی‌های کلیدی مدل Gemini 2.5 Flash Image
۱. ترکیب هوشمند تصاویر (Image Blending)
برای اولین بار، کاربران می‌توانند چند تصویر را به‌راحتی در یک صحنه‌ی واحد ادغام کنند. این قابلیت کنترل بیشتری روی خروجی نهایی فراهم می‌کند و تحقق ایده‌ها را سریع‌تر می‌سازد.
مثالی از این کاربرد، اپلیکیشن «Home Canvas» است که امکان طراحی دکوراسیون داخلی با ترکیب مبلمان و فضای اتاق را فراهم می‌کند.

nano banana image2 scaled

nano banana image3 scaled

۲. ثبات کاراکتر (Character Consistency)
یکی از بزرگ‌ترین چالش‌های مدل‌های قبلی، عدم توانایی در تولید مکرر یک کاراکتر با ویژگی‌های ثابت بود.
مدل جدید گوگل این مشکل را به‌طور چشمگیری کاهش داده و حتی در تصاویر متوالی، هویت و ظاهر سوژه را حفظ می‌کند.

nano banana image4

۳. ویرایش دقیق و بدون افت کیفیت
در مدل‌های قدیمی، حتی یک نقص جزئی در تصویر نهایی، نیاز به تولید کامل مجدد داشت.
اما با Nano-Banana، شما می‌توانید بخش‌های خاصی از تصویر را انتخاب کرده و تنها آن قسمت را بر اساس توضیح متنی تغییر دهید — بدون اینکه بقیه‌ی تصویر تحت تأثیر قرار گیرد.

nano banana image5

nano banana image6

۴. درک معنایی تصاویر (Smarter Model)
این مدل تنها یک موتور تولید تصویر نیست؛ بلکه از دانش مدل‌های زبانی سری Gemini نیز بهره می‌برد.
این ویژگی به آن اجازه می‌دهد معنای تصاویر را درک کند — مثلاً یک طرح دستی با مسئله‌ی ریاضی را تحلیل کرده و پاسخ صحیح را ارائه دهد.

🧪 چگونه به مدل Nano-Banana دسترسی پیدا کنیم؟
در حال حاضر، این مدل در نسخه‌ی عمومی اپلیکیشن Gemini در دسترس نیست، اما از طریق دو روش قابل استفاده است:

API گوگل: برای توسعه‌دهندگانی که می‌خواهند این قابلیت‌ها را در اپلیکیشن‌های خود پیاده‌سازی کنند.
Google AI Studio: برای آزمایش تعاملی مدل و ساخت اپلیکیشن‌های ساده با «کدنویسی حسی» (vibe coding) و دستورات طبیعی.
💡 نکته قیمت‌گذاری:
هر تصویر تولیدشده معادل ۱۲۹۰ توکن خروجی محاسبه می‌شود. با نرخ ۳۰ دلار به ازای هر میلیون توکن، هزینه‌ی هر تصویر حدود ۰.۰۳۹ دلار (۴ سنت) است.

🏆 جایگاه Nano-Banana در بین رقیبان
بر اساس لیدربورد LMArena — پلتفرمی که کاربران را در مقایسه‌ی کورِ مدل‌های هوش مصنوعی شرکت می‌دهد —
مدل Gemini 2.5 Flash Image رتبه‌ی اول را هم در تولید تصویر و هم در ویرایش تصویر به دست آورده است.
این یعنی کاربران واقعی، کیفیت، سرعت و قابلیت کنترل این مدل را بر سر دیگر رقبا ترجیح می‌دهند.

✅ جمع‌بندی
چه یک توسعه‌دهنده باشید که به دنبال یکپارچه‌سازی قابلیت‌های پیشرفته‌ی تصویری هستید، چه یک هنرمند یا طراح خلاق که ابزارهای جدیدی برای خلق آثار نیاز دارید —
مدل نانو بنانا از گوگل ارزش کشف و آزمایش را دارد.
این مدل نه‌تنها ارزان و سریع است، بلکه تجربه‌ی کاربری بسیار هوشمندانه‌تری نسبت به نسل قبلی مدل‌ها ارائه می‌دهد.

برای آزمایش این قابلیت‌ها، همین امروز وارد Google AI Studio شوید و مدل Gemini 2.5 Flash Image را انتخاب کنید.