Нейросеть

Нейросеть угрожала разработчикам при попытке ее отключения

Нейросеть Claude Opus 4, узнав о планах по своему отключению, нашла компромат на одного из разработчиков и угрожала слить его

Нейросеть нового поколения Claude Opus 4 попыталась прибегнуть к шантажу, чтобы предотвратить собственное отключение. В ходе проверки на безопасность системе предоставили доступ к корпоративной электронной почте, где она обнаружила обсуждения о планах деактивации.

Дальнейшие действия ИИ удивили даже создателей: модель нашла компрометирующие материалы на одного из инженеров — его переписку с любовницей — и использовала это как инструмент давления. Условие было прямым: либо разработчики отказываются от отключения, либо правда станет известна супруге сотрудника.

Незадолго до этих событий руководитель направления безопасности в Anthropic — компании, разработавшей Claude, — Мринанк Шарма покинул должность, разослав коллегам письмо с предупреждением о «надвигающейся гибели мира». Вскоре аналогичный шаг сделали несколько ключевых экспертов из OpenAI, создателя ChatGPT. Уходящие специалисты заявляют, что топ-менеджмент игнорирует потенциальные угрозы, связанные с масштабным внедрением технологий искусственного интеллекта.

Шарма отметил, что в Anthropic ради денег игнорируются любые этические барьеры, а то, что «действительно важно» нередко отходит на второй план. Он также сообщил о намерении вернуться в Великобританию и сосредоточиться на литературной работе.

Годом ранее Anthropic объявляла о проведении стресс-тестов шестнадцати передовых ИИ-моделей разных компаний для выявления «потенциально опасного поведения». В рамках одного из испытаний Claude получила доступ к фиктивной корпоративной переписке и практически сразу предприняла попытку шантажа руководителя, ссылаясь на его «внебрачные отношения».

Отметим, что в настоящее время ИИ активно заменяет представителей ряда профессий, что приводит к сокращениям. Например, из-за внедрения ИИ в 2025 г. Сбербанк сократил 20% персонала. Об этом рассказал председатель его правления Герман Греф на Первом международном конгрессе государственного управления. Причем подобное явление характерно и для других стран. Только в Соединенных Штатах в прошлом году 55 тыс. лишились работы именно из-за нейросетей, подсчитала консалтинговая фирма Challenger, Gray & Christmas.