گوگل با «نانو بنانا» استانداردهای هوش مصنوعی تصویری را ارتقا داد
گوگل دوباره مرزهای هوش مصنوعی را جابهجا کرده است. با معرفی مدل Gemini 2.5 Flash Image (که بهصورت غیررسمی «نانو بنانا» نامیده میشود)، این شرکت به چالشهای اصلی مدلهای تولید تصویر — از جمله عدم ثبات تصویری و ویرایش محدود — پاسخ داده است.
بهعلاوه، گوگل مجموعهای از ابزارهای رایگان و قابلسفارشی را عرضه کرده که تمام این قابلیتهای جدید را به نمایش میگذارد.

✨ ویژگیهای کلیدی مدل Gemini 2.5 Flash Image
۱. ترکیب هوشمند تصاویر (Image Blending)
برای اولین بار، کاربران میتوانند چند تصویر را بهراحتی در یک صحنهی واحد ادغام کنند. این قابلیت کنترل بیشتری روی خروجی نهایی فراهم میکند و تحقق ایدهها را سریعتر میسازد.
مثالی از این کاربرد، اپلیکیشن «Home Canvas» است که امکان طراحی دکوراسیون داخلی با ترکیب مبلمان و فضای اتاق را فراهم میکند.


۲. ثبات کاراکتر (Character Consistency)
یکی از بزرگترین چالشهای مدلهای قبلی، عدم توانایی در تولید مکرر یک کاراکتر با ویژگیهای ثابت بود.
مدل جدید گوگل این مشکل را بهطور چشمگیری کاهش داده و حتی در تصاویر متوالی، هویت و ظاهر سوژه را حفظ میکند.

۳. ویرایش دقیق و بدون افت کیفیت
در مدلهای قدیمی، حتی یک نقص جزئی در تصویر نهایی، نیاز به تولید کامل مجدد داشت.
اما با Nano-Banana، شما میتوانید بخشهای خاصی از تصویر را انتخاب کرده و تنها آن قسمت را بر اساس توضیح متنی تغییر دهید — بدون اینکه بقیهی تصویر تحت تأثیر قرار گیرد.


۴. درک معنایی تصاویر (Smarter Model)
این مدل تنها یک موتور تولید تصویر نیست؛ بلکه از دانش مدلهای زبانی سری Gemini نیز بهره میبرد.
این ویژگی به آن اجازه میدهد معنای تصاویر را درک کند — مثلاً یک طرح دستی با مسئلهی ریاضی را تحلیل کرده و پاسخ صحیح را ارائه دهد.
🧪 چگونه به مدل Nano-Banana دسترسی پیدا کنیم؟
در حال حاضر، این مدل در نسخهی عمومی اپلیکیشن Gemini در دسترس نیست، اما از طریق دو روش قابل استفاده است:
API گوگل: برای توسعهدهندگانی که میخواهند این قابلیتها را در اپلیکیشنهای خود پیادهسازی کنند.
Google AI Studio: برای آزمایش تعاملی مدل و ساخت اپلیکیشنهای ساده با «کدنویسی حسی» (vibe coding) و دستورات طبیعی.
💡 نکته قیمتگذاری:
هر تصویر تولیدشده معادل ۱۲۹۰ توکن خروجی محاسبه میشود. با نرخ ۳۰ دلار به ازای هر میلیون توکن، هزینهی هر تصویر حدود ۰.۰۳۹ دلار (۴ سنت) است.
🏆 جایگاه Nano-Banana در بین رقیبان
بر اساس لیدربورد LMArena — پلتفرمی که کاربران را در مقایسهی کورِ مدلهای هوش مصنوعی شرکت میدهد —
مدل Gemini 2.5 Flash Image رتبهی اول را هم در تولید تصویر و هم در ویرایش تصویر به دست آورده است.
این یعنی کاربران واقعی، کیفیت، سرعت و قابلیت کنترل این مدل را بر سر دیگر رقبا ترجیح میدهند.
✅ جمعبندی
چه یک توسعهدهنده باشید که به دنبال یکپارچهسازی قابلیتهای پیشرفتهی تصویری هستید، چه یک هنرمند یا طراح خلاق که ابزارهای جدیدی برای خلق آثار نیاز دارید —
مدل نانو بنانا از گوگل ارزش کشف و آزمایش را دارد.
این مدل نهتنها ارزان و سریع است، بلکه تجربهی کاربری بسیار هوشمندانهتری نسبت به نسل قبلی مدلها ارائه میدهد.
برای آزمایش این قابلیتها، همین امروز وارد Google AI Studio شوید و مدل Gemini 2.5 Flash Image را انتخاب کنید.







