گوگل دیپمایند از Gemini 2.5 Deep Think رونمایی کرد. به گفته این شرکت، این پیشرفتهترین مدل استدلال هوش مصنوعی آنهاست که میتواند با بررسی و در نظر گرفتن همزمان ایدههای متعدد، به سؤالات پاسخ دهد و سپس از این خروجیها برای انتخاب بهترین پاسخ استفاده کند.
مشترکین طرح Ultra گوگل با هزینه 250 دلار در ماه، از روز جمعه به Gemini 2.5 Deep Think در اپلیکیشن Gemini دسترسی خواهند داشت.
Gemini 2.5 Deep Think که اولین بار در ماه می در Google I/O 2025 معرفی شد، اولین مدل چندعاملی گوگل است که به صورت عمومی در دسترس قرار میگیرد. این سیستمها، چندین عامل هوش مصنوعی را به طور همزمان برای پاسخ به یک سؤال ایجاد میکنند. این فرایند در مقایسه با یک عامل واحد، از منابع محاسباتی بسیار بیشتری استفاده میکند، اما معمولاً منجر به پاسخهای بهتری میشود.
گوگل از نوعی از Gemini 2.5 Deep Think برای کسب مدال طلا در المپیاد بینالمللی ریاضی (IMO) امسال استفاده کرد.
گوگل اعلام کرده در کنار Gemini 2.5 Deep Think، مدلی که در المپیاد بینالمللی ریاضی استفاده کرده را نیز در اختیار گروه منتخبی از ریاضیدانان و محققان قرار میدهد. گوگل میگوید این مدل هوش مصنوعی “برای استدلال، ساعتها زمان صرف میکند”، در حالی که بیشتر مدلهای هوش مصنوعی مورد استفاده عموم، این کار را در عرض چند ثانیه یا دقیقه انجام میدهند. این شرکت امیدوار است که مدل المپیاد بینالمللی ریاضی به تلاشهای تحقیقاتی کمک کند و قصد دارد بازخوردهایی را در مورد چگونگی بهبود سیستم چندعاملی برای کاربردهای علمی دریافت کند.
گوگل خاطرنشان میکند که مدل Gemini 2.5 Deep Think، پیشرفت چشمگیری نسبت به چیزی است که در I/O معرفی شد. این شرکت همچنین ادعا میکند که “تکنیکهای یادگیری تقویتی جدیدی” را توسعه داده تا Gemini 2.5 Deep Think را تشویق کند تا از مسیرهای استدلال خود به شکل بهتری استفاده کند.
گوگل در یک پست وبلاگی که با دیپ تو تک به اشتراک گذاشته شد، گفت: “Deep Think میتواند به افراد کمک کند تا با مسائلی که نیازمند خلاقیت، برنامهریزی استراتژیک و بهبود گام به گام هستند، مقابله کنند.”
این شرکت میگوید Gemini 2.5 Deep Think در Humanity’s Last Exam (HLE) عملکردی عالی دارد. این آزمون چالشبرانگیز، توانایی هوش مصنوعی در پاسخگویی به هزاران سؤال جمعسپاری شده در زمینههای ریاضیات، علوم انسانی و علوم را میسنجد. گوگل ادعا میکند که مدل آن در HLE (بدون ابزار) امتیاز 34.8٪ را کسب کرده است، در حالی که Grok 4 از xAI امتیاز 25.4٪ و o3 از OpenAI امتیاز 20.3٪ را کسب کردهاند.
گوگل همچنین میگوید Gemini 2.5 Deep Think در LiveCodeBench6، یک آزمون چالشبرانگیز از وظایف کدنویسی رقابتی، از مدلهای هوش مصنوعی OpenAI، xAI و Anthropic بهتر عمل میکند. مدل گوگل امتیاز 87.6٪ را کسب کرد، در حالی که Grok 4 امتیاز 79٪ و o3 از OpenAI امتیاز 72٪ را کسب کردند.

Gemini 2.5 Deep Think به طور خودکار با ابزارهایی مانند اجرای کد و جستجوی گوگل کار میکند و به گفته این شرکت، قادر به تولید “پاسخهای بسیار طولانیتر” نسبت به مدلهای هوش مصنوعی سنتی است.
در آزمایشهای گوگل، این مدل در مقایسه با سایر مدلهای هوش مصنوعی، وظایف توسعه وب دقیقتر و زیباتری تولید کرده است. این شرکت ادعا میکند که این مدل میتواند به محققان کمک کند و “به طور بالقوه مسیر کشف را تسریع بخشد.”

به نظر میرسد که چندین آزمایشگاه پیشرو هوش مصنوعی در حال همگرا شدن حول رویکرد چندعاملی هستند.
xAI ایلان ماسک اخیراً سیستم چندعاملی خود را با نام Grok 4 Heavy منتشر کرده است که به گفته آنها، توانسته در چندین بنچمارک، عملکردی پیشرو در صنعت داشته باشد. همچنین مدل Anthropic’s Research agent که خلاصههای تحقیقاتی کاملی را تولید میکند، توسط یک سیستم چندعاملی پشتیبانی میشود.
با وجود عملکرد قوی، به نظر میرسد که سیستمهای چندعاملی حتی گرانتر از مدلهای هوش مصنوعی سنتی هستند. این بدان معناست که شرکتهای فناوری ممکن است این سیستمها را در پشت گرانترین طرحهای اشتراک خود پنهان کنند، همانطور که xAI و اکنون گوگل تصمیم گرفتهاند این کار را انجام دهند.
گوگل اعلام کرده در هفتههای آینده قصد دارد Gemini 2.5 Deep Think را از طریق Gemini API با گروه منتخبی از آزمایشکنندگان به اشتراک بگذارد. این شرکت میگوید میخواهد درک بهتری از چگونگی استفاده توسعهدهندگان و شرکتها از سیستم چندعاملی خود به دست آورد.
منبع: techcrunch.com