خانه
هوش مصنوعی
کلود دیگر گفتگوهای توهین‌آمیز را متوقف می‌کند

کلود دیگر گفتگوهای توهین‌آمیز را متوقف می‌کند

شرکت Anthropic اعلام کرده که مدل‌های بزرگ و جدیدش قابلیت‌های جدیدی پیدا کرده‌اند که به آن‌ها اجازه می‌دهد مکالمات را در “موارد نادر و حادِ تعاملات مخرب یا توهین‌آمیز کاربران” به پایان برسانند. نکته جالب اینجاست که Anthropic می‌گوید این کار را نه برای محافظت از کاربر، بلکه برای محافظت از خودِ مدل هوش مصنوعی انجام می‌دهد.

برای روشن شدن موضوع، این شرکت ادعا نمی‌کند که مدل‌های هوش مصنوعی Claude احساس دارند یا مکالمات کاربران می‌توانند به آن‌ها آسیب بزنند. به گفته خود Anthropic، این شرکت هنوز “نسبت به وضعیت اخلاقی بالقوه Claude و سایر مدل‌های زبانی بزرگ، چه در حال حاضر و چه در آینده، بسیار نامطمئن است.”

با این حال، اطلاعیه این شرکت به برنامه اخیری اشاره دارد که برای مطالعه چیزی که آن را “بهزیستی مدل” می‌نامند، ایجاد شده است. Anthropic می‌گوید اساساً رویکرد “احتیاط شرط عقل است” را در پیش گرفته و “در تلاش است تا مداخلات کم‌هزینه را برای کاهش خطرات مربوط به بهزیستی مدل شناسایی و اجرا کند، در صورتی که چنین بهزیستی‌ای امکان‌پذیر باشد.”

این تغییر جدید در حال حاضر فقط برای Claude Opus 4 و 4.1 اعمال می‌شود. و باز هم، این اتفاق فقط در “موارد حاد” مانند “درخواست‌های کاربران برای محتوای جنسی مرتبط با کودکان و تلاش برای به دست آوردن اطلاعاتی که امکان خشونت گسترده یا اقدامات تروریستی را فراهم کند” رخ می‌دهد.

در حالی که این نوع درخواست‌ها به طور بالقوه می‌توانند مشکلات حقوقی یا تبلیغاتی برای خود Anthropic ایجاد کنند (شاهد گزارش‌های اخیر در مورد اینکه چگونه ChatGPT می‌تواند تفکرات هذیانی کاربران خود را تقویت یا در آن سهیم شود)، این شرکت می‌گوید که در آزمایش‌های قبل از عرضه، Claude Opus 4 “تمایل زیادی” به عدم پاسخگویی به این درخواست‌ها و “الگویی از پریشانی آشکار” هنگام انجام این کار نشان داده است.

در مورد این قابلیت‌های جدیدِ پایان دادن به مکالمه، این شرکت می‌گوید: “در همه موارد، Claude فقط باید از قابلیت پایان دادن به مکالمه خود به عنوان آخرین راه حل استفاده کند، یعنی زمانی که تلاش‌های متعدد برای تغییر مسیر با شکست مواجه شده و امید به یک تعامل سازنده از بین رفته باشد، یا زمانی که کاربر صراحتاً از Claude بخواهد که چت را خاتمه دهد.”

Anthropic همچنین می‌گوید Claude “دستور گرفته است که در مواردی که کاربران ممکن است در معرض خطر قریب‌الوقوع آسیب رساندن به خود یا دیگران باشند، از این قابلیت استفاده نکند.”

وقتی Claude مکالمه‌ای را به پایان می‌رساند، Anthropic می‌گوید کاربران همچنان می‌توانند مکالمات جدیدی را از همان حساب کاربری شروع کنند و با ویرایش پاسخ‌های خود، شاخه‌های جدیدی از مکالمه مشکل‌ساز ایجاد کنند.

این شرکت می‌گوید: “ما این ویژگی را به عنوان یک آزمایش مداوم در نظر می‌گیریم و به اصلاح رویکرد خود ادامه خواهیم داد.”

منبع: techcrunch.com

اشتراک‌ها:

ارسال‌شده توسطعلیرضا

علیرضام، یه عشق تکنولوژی که همیشه دنبال خبرای جدید و داغ دنیای دیجیتال می‌گرده

کلود دیگر گفتگوهای توهین‌آمیز را متوقف می‌کند

مقالات مرتبط

هفت خانواده دیگر از OpenAI به دلیل نقش ChatGPT در خودکشی‌ها شکایت کردند.

افزایش سرمایه ۱.۵ میلیارد دلاری Lambda پس از قرارداد چند میلیارد دلاری با مایکروسافت

تحقیقات FTC درباره همراهان ربات‌چت هوش مصنوعی متا و OpenAI

جهان هنوز برای انسان‌نماها آماده نیست

جمینی گوگل، دستیار شما در برنامه‌ریزی جلسات تقویم گوگل

خلاصه‌ ویدئویی با هوش مصنوعی در پرایم ویدیو آمازون

پیشنهاد میکنیم

احتمال عقب‌نشینی دولت ترامپ از مبارزه با مقررات هوش مصنوعی ایالتی

وایمو مجوز گسترش فعالیت در سراسر خلیج سانفرانسیسکو و جنوب کالیفرنیا را دریافت کرد

ورود متا به تجارت برق

بنیانگذار بایجو به حکم دادگاه آمریکا برای پرداخت بیش از یک میلیارد دلار اعتراض می‌کند

درطرفدارترین خبرها

احتمال عقب‌نشینی دولت ترامپ از مبارزه با مقررات هوش مصنوعی ایالتی

وایمو مجوز گسترش فعالیت در سراسر خلیج سانفرانسیسکو و جنوب کالیفرنیا را دریافت کرد

پیشنهاد میکنیم

احتمال عقب‌نشینی دولت ترامپ از مبارزه با مقررات هوش مصنوعی ایالتی

وایمو مجوز گسترش فعالیت در سراسر خلیج سانفرانسیسکو و جنوب کالیفرنیا را دریافت کرد

ورود متا به تجارت برق

بنیانگذار بایجو به حکم دادگاه آمریکا برای پرداخت بیش از یک میلیارد دلار اعتراض می‌کند