گوگل دیپ‌مایند از Gemini 2.5 Deep Think رونمایی کرد. به گفته این شرکت، این پیشرفته‌ترین مدل استدلال هوش مصنوعی آن‌هاست که می‌تواند با بررسی و در نظر گرفتن همزمان ایده‌های متعدد، به سؤالات پاسخ دهد و سپس از این خروجی‌ها برای انتخاب بهترین پاسخ استفاده کند.

مشترکین طرح Ultra گوگل با هزینه 250 دلار در ماه، از روز جمعه به Gemini 2.5 Deep Think در اپلیکیشن Gemini دسترسی خواهند داشت.

Gemini 2.5 Deep Think که اولین بار در ماه می در Google I/O 2025 معرفی شد، اولین مدل چندعاملی گوگل است که به صورت عمومی در دسترس قرار می‌گیرد. این سیستم‌ها، چندین عامل هوش مصنوعی را به طور همزمان برای پاسخ به یک سؤال ایجاد می‌کنند. این فرایند در مقایسه با یک عامل واحد، از منابع محاسباتی بسیار بیشتری استفاده می‌کند، اما معمولاً منجر به پاسخ‌های بهتری می‌شود.

گوگل از نوعی از Gemini 2.5 Deep Think برای کسب مدال طلا در المپیاد بین‌المللی ریاضی (IMO) امسال استفاده کرد.

گوگل اعلام کرده در کنار Gemini 2.5 Deep Think، مدلی که در المپیاد بین‌المللی ریاضی استفاده کرده را نیز در اختیار گروه منتخبی از ریاضیدانان و محققان قرار می‌دهد. گوگل می‌گوید این مدل هوش مصنوعی “برای استدلال، ساعت‌ها زمان صرف می‌کند”، در حالی که بیشتر مدل‌های هوش مصنوعی مورد استفاده عموم، این کار را در عرض چند ثانیه یا دقیقه انجام می‌دهند. این شرکت امیدوار است که مدل المپیاد بین‌المللی ریاضی به تلاش‌های تحقیقاتی کمک کند و قصد دارد بازخوردهایی را در مورد چگونگی بهبود سیستم چندعاملی برای کاربردهای علمی دریافت کند.

گوگل خاطرنشان می‌کند که مدل Gemini 2.5 Deep Think، پیشرفت چشمگیری نسبت به چیزی است که در I/O معرفی شد. این شرکت همچنین ادعا می‌کند که “تکنیک‌های یادگیری تقویتی جدیدی” را توسعه داده تا Gemini 2.5 Deep Think را تشویق کند تا از مسیرهای استدلال خود به شکل بهتری استفاده کند.

گوگل در یک پست وبلاگی که با دیپ تو تک به اشتراک گذاشته شد، گفت: “Deep Think می‌تواند به افراد کمک کند تا با مسائلی که نیازمند خلاقیت، برنامه‌ریزی استراتژیک و بهبود گام به گام هستند، مقابله کنند.”

این شرکت می‌گوید Gemini 2.5 Deep Think در Humanity’s Last Exam (HLE) عملکردی عالی دارد. این آزمون چالش‌برانگیز، توانایی هوش مصنوعی در پاسخگویی به هزاران سؤال جمع‌سپاری شده در زمینه‌های ریاضیات، علوم انسانی و علوم را می‌سنجد. گوگل ادعا می‌کند که مدل آن در HLE (بدون ابزار) امتیاز 34.8٪ را کسب کرده است، در حالی که Grok 4 از xAI امتیاز 25.4٪ و o3 از OpenAI امتیاز 20.3٪ را کسب کرده‌اند.

گوگل همچنین می‌گوید Gemini 2.5 Deep Think در LiveCodeBench6، یک آزمون چالش‌برانگیز از وظایف کدنویسی رقابتی، از مدل‌های هوش مصنوعی OpenAI، xAI و Anthropic بهتر عمل می‌کند. مدل گوگل امتیاز 87.6٪ را کسب کرد، در حالی که Grok 4 امتیاز 79٪ و o3 از OpenAI امتیاز 72٪ را کسب کردند.

نمره‌های بنچمارک. منبع تصویر: گوگل

Gemini 2.5 Deep Think به طور خودکار با ابزارهایی مانند اجرای کد و جستجوی گوگل کار می‌کند و به گفته این شرکت، قادر به تولید “پاسخ‌های بسیار طولانی‌تر” نسبت به مدل‌های هوش مصنوعی سنتی است.

در آزمایش‌های گوگل، این مدل در مقایسه با سایر مدل‌های هوش مصنوعی، وظایف توسعه وب دقیق‌تر و زیباتری تولید کرده است. این شرکت ادعا می‌کند که این مدل می‌تواند به محققان کمک کند و “به طور بالقوه مسیر کشف را تسریع بخشد.”

تصاویر هنری ساخته شده توسط هوش مصنوعی گوگل (منبع: گوگل)

به نظر می‌رسد که چندین آزمایشگاه پیشرو هوش مصنوعی در حال همگرا شدن حول رویکرد چندعاملی هستند.

xAI ایلان ماسک اخیراً سیستم چندعاملی خود را با نام Grok 4 Heavy منتشر کرده است که به گفته آن‌ها، توانسته در چندین بنچمارک، عملکردی پیشرو در صنعت داشته باشد. همچنین مدل Anthropic’s Research agent که خلاصه‌های تحقیقاتی کاملی را تولید می‌کند، توسط یک سیستم چندعاملی پشتیبانی می‌شود.

با وجود عملکرد قوی، به نظر می‌رسد که سیستم‌های چندعاملی حتی گران‌تر از مدل‌های هوش مصنوعی سنتی هستند. این بدان معناست که شرکت‌های فناوری ممکن است این سیستم‌ها را در پشت گران‌ترین طرح‌های اشتراک خود پنهان کنند، همانطور که xAI و اکنون گوگل تصمیم گرفته‌اند این کار را انجام دهند.

گوگل اعلام کرده در هفته‌های آینده قصد دارد Gemini 2.5 Deep Think را از طریق Gemini API با گروه منتخبی از آزمایش‌کنندگان به اشتراک بگذارد. این شرکت می‌گوید می‌خواهد درک بهتری از چگونگی استفاده توسعه‌دهندگان و شرکت‌ها از سیستم چندعاملی خود به دست آورد.

منبع: techcrunch.com

اشتراک‌ها:
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *