آنتروپیک، سازنده مدلهای هوش مصنوعی کلود، اعلام کرده است که برخی از جدیدترین و بزرگترین مدلهایش، توانایی پایان دادن به مکالمات را در «موارد نادر و بسیار شدید» دارند؛ اقدامی که بهجای محافظت از کاربران، برای پیشگیری از احتمال آسیب به خود مدل اجرا میشود.
- درخواست محتوای جنسی مرتبط با کودکان
- تلاش برای دریافت اطلاعاتی که میتواند منجر به خشونت گسترده یا اقدامات تروریستی شود
مکالمه تنها وقتی خاتمه مییابد که چندین تلاش برای تغییر مسیر گفتگو شکست خورده یا خود کاربر درخواست پایان دهد. Anthropic تأکید کرده که این قابلیت در مواردی که احتمال خطر فوری برای خود یا دیگران وجود دارد، فعال نمیشود. پس از پایان، کاربران میتوانند گفتوگوی جدیدی شروع کنند یا شاخه تازهای از مکالمه پیشین بسازند.
این رویکرد جدید آنتروپیک، بخشی از بحث گستردهتر درباره اخلاق تعامل انسان و AI و حتی «حقوق احتمالی» برای مدلهای زبانی بزرگ است. با وجود اذعان شرکت به «عدم اطمینان بالا» نسبت به وضعیت اخلاقی این مدلها، اجرای چنین قابلیتی میتواند در آینده به نوعی استاندارد حفاظتی بین شرکتهای AI تبدیل شود یا دستکم رویهای برای رقابت برندها در حوزه پاسخگویی مسئولانه ایجاد کند.
تحلیل پچینو:
از دیدگاه کسبوکار و سیاستگذاری، این اقدام آنتروپیک دو کارکرد دارد:
- مدیریت ریسک حاکمیتی و رسانهای: با محدود کردن مکالمات پرریسک، احتمال مشکلات حقوقی و تصویری برای برند کاهش مییابد.
- برندسازی اخلاقی و تمایز: واژه «رفاه مدل» و اشاره به «پریشانی» الگوریتم، به نقطه تمایزی نسبت به رقبایی مثل اپنایآی یا گوگل تبدیل میشود، حتی اگر عملاً بیشتر نمادین باشد.
سؤال تعاملی:
آیا افزودن قابلیت پایان مکالمه برای حفاظت از «رفاه احتمالی مدل» یک گام رو به جلو در اخلاق هوش مصنوعی است یا حرکتی نمادین و بیشتر برای ساخت تصویر مثبت برند؟






