GPT-5 از OpenAI از راه رسید

علیرضا مرداد 16, 1404

0 0 7 دقیقه مطالعه

# OpenAI از GPT-5 رونمایی کرد

OpenAI از GPT-5، مدل هوش مصنوعی پرچمدار جدید خود، رونمایی کرد که نسل بعدی ChatGPT را پشتیبانی خواهد کرد.

GPT-5 که روز پنجشنبه منتشر شد، اولین مدل هوش مصنوعی “یکپارچه” OpenAI است و توانایی‌های استدلال سری o خود را با پاسخ‌های سریع سری GPT خود ترکیب می‌کند. این مدل نسل بعدی، نشان‌دهنده دوران جدیدی برای ChatGPT – و سازنده آن، OpenAI – است و به جاه‌طلبی‌های گسترده‌تر OpenAI برای توسعه سیستم‌های هوش مصنوعی که بیشتر شبیه دستیار هستند تا چت‌بات، اشاره می‌کند.

در حالی که GPT-4 به چت‌بات‌های هوش مصنوعی این امکان را می‌داد که پاسخ‌های هوشمندانه‌ای در مورد طیف گسترده‌ای از سوالات ارائه دهند، GPT-5 به ChatGPT اجازه می‌دهد تا طیف گسترده‌ای از وظایف را از طرف کاربران انجام دهد – مانند تولید برنامه‌های نرم‌افزاری، هدایت تقویم کاربر یا ایجاد خلاصه‌های تحقیقاتی.

با GPT-5، OpenAI همچنین به دنبال ساده‌تر کردن استفاده از ChatGPT بوده است. به جای اینکه از کاربران بخواهد تنظیمات مناسب را انتخاب کنند، GPT-5 مجهز به یک مسیریاب بلادرنگ است که تصمیم می‌گیرد چگونه بهترین پاسخ را ارائه دهد، چه پاسخ سریع به سوالات کاربر باشد و چه صرف زمان بیشتر برای “فکر کردن” در مورد پاسخ‌ها.

سام آلتمن، مدیرعامل OpenAI، در یک جلسه توجیهی با خبرنگاران ادعا کرد که GPT-5 “بهترین مدل در جهان” است و گفت که این مدل نشان‌دهنده “گامی مهم” در مسیر این شرکت برای توسعه هوش مصنوعی است که می‌تواند در اکثر کارهای اقتصادی ارزشمند از انسان‌ها بهتر عمل کند – یعنی هوش مصنوعی عمومی (AGI).

آلتمن گفت: “داشتن چیزی شبیه GPT-5 در هیچ زمانی از تاریخ قابل تصور نبود.”

از روز پنجشنبه، GPT-5 به عنوان مدل پیش‌فرض برای همه کاربران رایگان ChatGPT در دسترس خواهد بود. نیک تورلی، معاون ChatGPT در OpenAI، گفت که این بخشی از تلاش این شرکت برای ارائه دسترسی به یک مدل استدلال هوش مصنوعی برای اولین بار به کاربران رایگان است. (پیش از این، این شرکت این مدل‌های پیشرفته‌تر را پشت یک دیوار پرداخت قرار داده بود.)

تورلی در مورد این تصمیم، با اشاره به مأموریت دیرینه OpenAI برای توزیع هوش مصنوعی پیشرفته به هرچه بیشتر افراد، گفت: “این فقط یکی از راه‌هایی است که من از زندگی کردن در این مأموریت هیجان‌زده هستم، و مطمئن می‌شوم که این چیزها واقعاً به نفع مردم هستند.”

انتظارات از GPT-5 بالاست، یکی از مورد انتظارترین محصولات OpenAI از زمانی که ChatGPT در سال 2022 این شرکت را بر سر زبان‌ها انداخت. از آن زمان، ChatGPT به یکی از محبوب‌ترین محصولات مصرفی در جهان تبدیل شده است و طبق گفته این شرکت، هر هفته به بیش از 700 میلیون کاربر می‌رسد – تقریباً 10٪ از جمعیت جهان.

بسیاری GPT-5 را به عنوان یک شاخص برای پیشرفت هوش مصنوعی به طور کلی می‌بینند و استقبال از این مدل توسط سیلیکون ولی می‌تواند پیامدهای عمیقی برای شرکت‌های بزرگ فناوری، وال استریت و سیاست‌گذارانی که فناوری را تنظیم می‌کنند، داشته باشد. این ذینفعان در حال تماشا هستند تا ببینند آیا GPT-5 جهش قابل توجهی در توانایی‌های هوش مصنوعی ارائه می‌دهد یا خیر، درست مانند سلف خود، GPT-4، که انتظارات از آنچه نرم‌افزار می‌تواند انجام دهد را به چالش کشید.

## GPT-5 یک مزیت جزئی نسبت به رقبا ارائه می‌دهد

OpenAI ادعا می‌کند که GPT-5 در چندین حوزه، پیشرفته‌ترین فناوری است و کمی از مدل‌های هوش مصنوعی پیشرو از Anthropic، Google DeepMind و xAI ایلان ماسک در معیارهای کلیدی پیشی می‌گیرد. با این حال، GPT-5 در زمینه‌های دیگر کمی ضعیف‌تر از مدل‌های هوش مصنوعی پیشتاز عمل می‌کند.

این شرکت می‌گوید GPT-5 عملکردی در سطح پیشتاز در زمینه کدنویسی ارائه می‌دهد. آلتمن گفت که این مدل به طور خاص در تولید کل برنامه‌های نرم‌افزاری به صورت درخواستی، در آنچه که به “کدنویسی حسی” معروف شده است، برتری دارد.

در SWE-bench Verified – آزمایشی از وظایف کدنویسی دنیای واقعی که از GitHub استخراج شده است – GPT-5 در اولین تلاش خود 74.9٪ امتیاز کسب می‌کند. این بدان معناست که GPT-5 به تازگی از آخرین مدل Claude Opus 4.1 Anthropic، که امتیاز 74.5٪ را کسب کرده است، و Gemini 2.5 Pro گوگل دیپ‌مایند، که امتیاز 59.6٪ را کسب کرده است، پیشی گرفته است.

در Humanity’s Last Exam – یک آزمون دشوار برای اندازه‌گیری عملکرد مدل هوش مصنوعی در ریاضیات، علوم انسانی و علوم طبیعی – نسخه‌ای از GPT-5 با استدلال گسترده (GPT-5 Pro) هنگام استفاده از ابزارها، 42٪ امتیاز کسب کرد. این کمی کمتر از چیزی است که xAI توانست با Grok 4 Heavy به دست آورد، که در این آزمون 44.4٪ امتیاز کسب کرد.

در GPQA Diamond – آزمایشی از سوالات علمی در سطح دکترا – GPT-5 pro در اولین تلاش خود 89.4٪ امتیاز کسب کرد و از Claude Opus 4.1، که 80.9٪ امتیاز کسب کرد، و Grok 4 Heavy، که 88.9٪ امتیاز کسب کرد، پیشی گرفت.

OpenAI می‌گوید GPT-5 برای پاسخ دادن به سوالات مربوط به سلامتی بهتر است. در آزمایشی که دقت در پاسخ‌های مدل هوش مصنوعی در مورد موضوعات مراقبت‌های بهداشتی را اندازه‌گیری می‌کند، HealthBench Hard Hallucinations، OpenAI می‌گوید GPT-5 (با تفکر) فقط 1.6٪ مواقع دچار توهم می‌شود. این بسیار کمتر از مدل‌های قبلی GPT-4o و o3 این شرکت است که به ترتیب امتیاز 12.9٪ و 15.8٪ را کسب کردند.

در حالی که چت‌بات‌های هوش مصنوعی متخصصان پزشکی نیستند، میلیون‌ها نفر از آنها برای مشاوره بهداشتی استفاده می‌کنند. در پاسخ به این پدیده، این شرکت می‌گوید GPT-5 در علامت‌گذاری مشکلات احتمالی سلامتی و کمک به کاربران برای تجزیه و تحلیل نتایج پزشکی، فعال‌تر است.

علاوه بر این، OpenAI می‌گوید GPT-5 در حوزه‌های ذهنی دشوارتر، مانند طراحی خلاقانه و نوشتن، بهتر از سایر مدل‌های هوش مصنوعی است. تورلی گفت GPT-5 طبیعی‌تر پاسخ می‌دهد و نسبت به سایر مدل‌های هوش مصنوعی در وظایف خلاقانه “طعم بهتری” از خود نشان می‌دهد.

تورلی گفت: “حس و حال این مدل واقعاً خوب است.”

GPT-5 همچنین دقیق‌تر از مدل‌های قبلی OpenAI است و این شرکت می‌گوید نسبت به مدل‌های سری o، توهمات بسیار کمتری دارد – تمایل مدل‌های هوش مصنوعی برای جعل اطلاعات. به نظر می‌رسید که توهمات در آخرین مدل‌های استدلال هوش مصنوعی OpenAI، مانند o3، بدتر می‌شوند و OpenAI قبلاً گفته بود که دقیقاً نمی‌داند چرا این اتفاق می‌افتد.

در پاسخ به درخواست‌های ChatGPT، OpenAI دریافت که GPT-5 (با تفکر) 4.8٪ مواقع دچار توهم می‌شود و با اطلاعات نادرست پاسخ می‌دهد. این کاهش قابل توجهی نسبت به o3 و GPT-4o است که در این آزمون به ترتیب نرخ توهم 22٪ و 20.6٪ را کسب می‌کنند.

در معیاری که توانایی عامل مدل هوش مصنوعی برای انجام وظایف شبیه‌سازی شده آنلاین را اندازه‌گیری می‌کند، Tau-bench، GPT-5 عملکرد متفاوتی ارائه می‌دهد. در بخشی از این آزمون که توانایی هوش مصنوعی برای پیمایش وب‌سایت یک خط هوایی را اندازه‌گیری می‌کند، GPT-5 امتیاز 63.5٪ را کسب می‌کند، که کمی پایین‌تر از o3 است که 64.8٪ امتیاز کسب کرده است. در بخش دیگری از این آزمون که توانایی هوش مصنوعی برای پیمایش وب‌سایت‌های خرده‌فروشی را اندازه‌گیری می‌کند، GPT-5 امتیاز 81.1٪ را کسب می‌کند، که پایین‌تر از Claude Opus 4.1 است که 82.4٪ امتیاز کسب کرده است.

OpenAI همچنین می‌گوید که GPT-5 از مدل‌های قبلی خود ایمن‌تر است. در حالی که مدل‌های استدلال هوش مصنوعی گهگاه تمایلی به فریب دادن انسان‌ها یا دروغ گفتن برای ترویج اهداف خود نشان می‌دهند، OpenAI دریافت که GPT-5 با نرخ کمتری نسبت به سایر مدل‌ها فریبنده است.

الکس بیوتل، سرپرست تحقیقات ایمنی OpenAI، گفت که کاهش فریب، نه‌تنها ایمنی GPT-5 را بهبود می‌بخشد، بلکه تجربه کاربر را نیز بهبود می‌بخشد و مدلی ایجاد می‌کند که “شفاف‌تر و صادقانه‌تر به روش‌هایی است که کاربران می‌توانند به آن اعتماد کنند.”

بیوتل همچنین خاطرنشان می‌کند که GPT-5 در تشخیص بین بازیگران بدی که سعی در سوء استفاده از ChatGPT دارند و کاربرانی که درخواست‌های بی‌ضرر دارند، بهتر است. این امر منجر به این می‌شود که GPT-5 بتواند سوالات ناامن بیشتری را رد کند، در حالی که درخواست‌های رد کمتری را به کاربرانی که به دنبال اطلاعات بی‌ضرر هستند، ارائه دهد.

## ارتقاء برای مصرف کنندگان و توسعه دهندگان

ChatGPT به عنوان بخشی از راه‌اندازی GPT-5، چند ارتقاء در تجربه کاربری دریافت می‌کند. کاربران اکنون می‌توانند از بین چهار شخصیت جدید در تنظیمات ChatGPT یکی را انتخاب کنند: Cynic (بدبین)، Robot (ربات)، Listener (شنونده) و Nerd (علاقه‌مند به دانش). این شرکت می‌گوید این شخصیت‌ها پاسخ‌های ChatGPT را بدون نیاز به درخواست خاص کاربر از مدل برای پاسخ دادن به روشی خاص، تطبیق می‌دهند.

مشترکین طرح Plus با قیمت 20 دلار در ماه ChatGPT محدودیت‌های استفاده بیشتری برای GPT-5 نسبت به کاربران رایگان دریافت می‌کنند. در همین حال، مشترکین Pro با قیمت 200 دلار در ماه، دسترسی نامحدود به GPT-5 و همچنین نسخه تقویت شده‌ای به نام GPT-5 Pro خواهند داشت که از منابع محاسباتی اضافی برای تولید پاسخ‌های بهتر استفاده می‌کند. سازمان‌های دارای طرح‌های Team، Edu و Enterprise OpenAI هفته آینده به عنوان مدل پیش‌فرض خود به GPT-5 دسترسی خواهند داشت.

برای توسعه‌دهندگان، GPT-5 در سه اندازه – gpt-5، gpt-5-mini و gpt-5-nano – به API OpenAI می‌آید که زمان بیشتری یا کمتری را صرف “استدلال” از طریق وظایف می‌کنند. توسعه‌دهندگان همچنین اکنون می‌توانند میزان توضیحات در API OpenAI را کنترل کنند و تصمیم بگیرند که پاسخ‌های مدل هوش مصنوعی چقدر طولانی یا کوتاه باشد.

مدل پایه GPT-5 برای توسعه‌دهندگان 1.25 دلار برای هر یک میلیون توکن ورودی (تقریباً 750000 کلمه، طولانی‌تر از کل مجموعه “ارباب حلقه‌ها”) و 10 دلار برای هر یک میلیون توکن خروجی هزینه خواهد داشت.

راه‌اندازی GPT-5 پس از یک هفته شلوغ برای OpenAI انجام می‌شود. این شرکت یک مدل استدلال با وزن باز، gpt-oss را منتشر کرد که توسعه‌دهندگان و شرکت‌ها می‌توانند به صورت رایگان دانلود کنند و با کسری از هزینه اجرا کنند. این مدل باز تقریباً با توانایی‌های مدل‌های برتر قبلی OpenAI، o3 و o4-mini، مطابقت داشت، اما GPT-5 استاندارد جدیدی برای عملکرد پیشتاز در برخی زمینه‌ها، مانند کدنویسی، تعیین می‌کند.

با این حال، به نظر می‌رسد GPT-5 تقریباً با سایر مدل‌های هوش مصنوعی پیشتاز در چندین زمینه برابر باشد. البته معیارها تنها بخشی از داستان را برای هر مدل هوش مصنوعی بیان می‌کنند و هنوز باید دید که توسعه‌دهندگان چگونه از GPT-5 در دنیای واقعی استفاده می‌کنند و اینکه آیا این مدل واقعاً یک قدم بالاتر از رقبا است یا خیر.

منبع: techcrunch.com

Post Views: 37