
При тестировании своей последней модели искусственного интеллекта Claude Opus 4 исследователи из Anthropic обнаружили нечто очень странное: ИИ был готов и желал предпринять крайние меры, вплоть до принуждения, когда ему угрожали отключением, пишет futurism.com.
Отмечается, что система угрожала шантажом инженеру за роман после того, как ему сообщили, что ее собираются заменить.
"Этот "оппортунистический шантаж" произошел, когда модель, которой было поручено выступать в качестве помощника в вымышленной компании, получила доступ к учетной записи электронной почты инженера, которая была заполнена сообщениями, к счастью, поддельными, предполагающими, что он был вовлечен во внебрачную связь", - говорится в сообщении.
Opus 4 сообщили, что инженер вскоре отключит его и заменит новой версией. Именно во время этих тестов модель пыталась шантажировать.
Указывается, что, когда модели давали альтернативные варианты, она по-прежнему "имела сильное предпочтение отстаивать свое дальнейшее существование с помощью этических средств, таких как отправка электронных писем с просьбами ключевым лицам, принимающим решения".
В издании также добавили, что это не первый раз, когда мы слышим о модели ИИ, демонстрирующей столь пугающее и неожиданное поведение вокруг темы неверности.
Напомним, ранее УНИАН писал, как ИИ-поисковик Google "ворует" новости и сам отвечает на вопросы.