شعر، گاردریلهای چتباتها را میشکند
یک پژوهش تازه نشان داده است که تنها با قرار دادن درخواستها در قالب شعر، میتوان بسیاری از چتباتهای پیشرفته هوش مصنوعی را فریب داد تا درباره موضوعاتی پاسخ بدهند که بهطور کامل در لیست ممنوعه قرار دارند؛ یافتهای که ضعف لایههای ایمنی مدلهای زبانی را دوباره زیر سؤال برده است.




