گوگل مدل تولید تصویر خود را با قابلیتهای ویرایشی جدید، وضوح بالاتر، رندر دقیقتر متن و امکان جستجو در وب ارتقا میدهد.
این مدل جدید که نانو بنانا پرو (Nano Banana Pro) نام دارد، بر اساس آخرین مدل زبانی بزرگ گوگل، یعنی جمینی 3 (Gemini 3) ساخته شده که اوایل همین هفته منتشر شد. این شرکت ادعا میکند که نانو بنانا پرو نسبت به مدل قبلی خود، نانو بنانا (Nano Banana)، بهبود یافته و میتواند تصاویر دقیقتر و متنهای صحیحتری ایجاد کند و متن را در سبکها، فونتها و زبانهای مختلف تولید کند.

این مدل همچنین قابلیت جستجو در وب را دارد، بنابراین میتوانید کارهایی مانند جستجوی یک دستور غذا و تولید فلش کارت را از آن بخواهید.
به گفته گوگل، نانو بنانا پرو به منظور ارائه کنترل بیشتر بر تصاویر به متخصصان طراحی شده است و به کاربران اجازه میدهد تا جنبههایی مانند زوایای دوربین، نورپردازی صحنه، عمق میدان، فوکوس و درجهبندی رنگ را کنترل کنند. در مقایسه با محدودیت وضوح 1024 در 1024 پیکسلی نانو بنانا، کاربران میتوانند با نانو بنانا پرو تصاویر 2K یا 4K تولید کنند.
این شرکت اشاره کرد که در حالی که نانو بنانا پرو میتواند تصاویر با کیفیت بالاتری تولید کند، اما کندتر و پرهزینهتر از مدل اصلی است که هزینه آن 0.039 دلار به ازای هر تصویر 1024 پیکسلی بود. در مقایسه، مدل جدید 0.139 دلار برای هر تصویر 1080p یا 2K و 0.24 دلار برای هر تصویر 4K هزینه دارد.

مدل جدید میتواند از شش عکس با کیفیت بالا استفاده کند یا حداکثر 14 شیء را در یک تصویر ترکیب کند. همچنین میتواند ثبات و شباهت حداکثر پنج نفر را حفظ کند. این شرکت یک برنامه آزمایشی منتشر کرده است که در آن میتوانید برخی از این قابلیتها را امتحان کنید.
نانو بنانا پرو در بسیاری از ابزارهای هوش مصنوعی موجود گوگل عرضه میشود. برنامه جمینی اکنون از مدل جدید برای تولید تصاویر به طور پیشفرض استفاده میکند، اگرچه کاربران در سطح اشتراک رایگان میتوانند از این مدل برای تولید تعداد محدودی تصویر استفاده کنند، پس از آن به مدل اصلی نانو بنانا بازگردانده میشوند.
مشترکین Google AI Plus، Pro و Ultra آستانههای تولید بالاتری خواهند داشت، اگرچه این شرکت محدودیتهای دقیقی را اعلام نکرده است. این مشترکین همچنین به مدل در Notebook LM دسترسی خواهند داشت.
گوگل همچنین این مدل را در جستجو از طریق حالت هوش مصنوعی برای مشترکین AI Pro و Ultra در ایالات متحده در دسترس قرار میدهد. مشترکین Ultra میتوانند به این مدل در ابزار ویدیویی این شرکت، Flow، دسترسی داشته باشند و برای مشتریان Workspace در Google Slides و Vids نیز در دسترس است.
توسعهدهندگان میتوانند از طریق Gemini API، Google AI Studio و IDE جدید این شرکت، Antigravity، از نانو بنانا پرو بهره ببرند.
این شرکت همچنین SynthID، فناوری خود برای واترمارک کردن و تشخیص تصاویر تولید شده توسط هوش مصنوعی را در برنامه جمینی قرار میدهد. کاربران میتوانند یک تصویر را آپلود کنند و چتبات به آنها میگوید که آیا تصویر توسط مدلهای تصویر این شرکت ایجاد یا اصلاح شده است یا خیر.
گوگل اشارهای به این نکرد که آیا قصد دارد از سایر استانداردهای واترمارکگذاری هوش مصنوعی مانند C2PA نیز پشتیبانی کند یا خیر.








