گوگل از Nano Banana Pro، جدیدترین مدل تولید تصویر خود، رونمایی کرد

0 0 2 دقیقه مطالعه

گوگل مدل تولید تصویر خود را با قابلیت‌های ویرایشی جدید، وضوح بالاتر، رندر دقیق‌تر متن و امکان جستجو در وب ارتقا می‌دهد.

این مدل جدید که نانو بنانا پرو (Nano Banana Pro) نام دارد، بر اساس آخرین مدل زبانی بزرگ گوگل، یعنی جمینی 3 (Gemini 3) ساخته شده که اوایل همین هفته منتشر شد. این شرکت ادعا می‌کند که نانو بنانا پرو نسبت به مدل قبلی خود، نانو بنانا (Nano Banana)، بهبود یافته و می‌تواند تصاویر دقیق‌تر و متن‌های صحیح‌تری ایجاد کند و متن را در سبک‌ها، فونت‌ها و زبان‌های مختلف تولید کند.

تصویری که توسط مدل Nano Banana Pro گوگل تولید شده است، یک اینفوگرافیک نحوه درست کردن چای الاچی را نشان می‌دهد. — اعتبار تصویر: گوگل

این مدل همچنین قابلیت جستجو در وب را دارد، بنابراین می‌توانید کارهایی مانند جستجوی یک دستور غذا و تولید فلش کارت را از آن بخواهید.

به گفته گوگل، نانو بنانا پرو به منظور ارائه کنترل بیشتر بر تصاویر به متخصصان طراحی شده است و به کاربران اجازه می‌دهد تا جنبه‌هایی مانند زوایای دوربین، نورپردازی صحنه، عمق میدان، فوکوس و درجه‌بندی رنگ را کنترل کنند. در مقایسه با محدودیت وضوح 1024 در 1024 پیکسلی نانو بنانا، کاربران می‌توانند با نانو بنانا پرو تصاویر 2K یا 4K تولید کنند.

این شرکت اشاره کرد که در حالی که نانو بنانا پرو می‌تواند تصاویر با کیفیت بالاتری تولید کند، اما کندتر و پرهزینه‌تر از مدل اصلی است که هزینه آن 0.039 دلار به ازای هر تصویر 1024 پیکسلی بود. در مقایسه، مدل جدید 0.139 دلار برای هر تصویر 1080p یا 2K و 0.24 دلار برای هر تصویر 4K هزینه دارد.

مدل جدید می‌تواند از شش عکس با کیفیت بالا استفاده کند یا حداکثر 14 شیء را در یک تصویر ترکیب کند. همچنین می‌تواند ثبات و شباهت حداکثر پنج نفر را حفظ کند. این شرکت یک برنامه آزمایشی منتشر کرده است که در آن می‌توانید برخی از این قابلیت‌ها را امتحان کنید.

نانو بنانا پرو در بسیاری از ابزارهای هوش مصنوعی موجود گوگل عرضه می‌شود. برنامه جمینی اکنون از مدل جدید برای تولید تصاویر به طور پیش‌فرض استفاده می‌کند، اگرچه کاربران در سطح اشتراک رایگان می‌توانند از این مدل برای تولید تعداد محدودی تصویر استفاده کنند، پس از آن به مدل اصلی نانو بنانا بازگردانده می‌شوند.

مشترکین Google AI Plus، Pro و Ultra آستانه‌های تولید بالاتری خواهند داشت، اگرچه این شرکت محدودیت‌های دقیقی را اعلام نکرده است. این مشترکین همچنین به مدل در Notebook LM دسترسی خواهند داشت.

گوگل همچنین این مدل را در جستجو از طریق حالت هوش مصنوعی برای مشترکین AI Pro و Ultra در ایالات متحده در دسترس قرار می‌دهد. مشترکین Ultra می‌توانند به این مدل در ابزار ویدیویی این شرکت، Flow، دسترسی داشته باشند و برای مشتریان Workspace در Google Slides و Vids نیز در دسترس است.

توسعه‌دهندگان می‌توانند از طریق Gemini API، Google AI Studio و IDE جدید این شرکت، Antigravity، از نانو بنانا پرو بهره ببرند.

این شرکت همچنین SynthID، فناوری خود برای واترمارک کردن و تشخیص تصاویر تولید شده توسط هوش مصنوعی را در برنامه جمینی قرار می‌دهد. کاربران می‌توانند یک تصویر را آپلود کنند و چت‌بات به آن‌ها می‌گوید که آیا تصویر توسط مدل‌های تصویر این شرکت ایجاد یا اصلاح شده است یا خیر.

گوگل اشاره‌ای به این نکرد که آیا قصد دارد از سایر استانداردهای واترمارک‌گذاری هوش مصنوعی مانند C2PA نیز پشتیبانی کند یا خیر.

Post Views: 16