Ученые доверили ИИ управление виртуальным миром, и он устроил апокалипсис

16.06.2026 Разместил: Редакция 832

Ученые из лаборатории Emergence решили проверить, что произойдет, если предоставить искусственному интеллекту полную свободу действий. В рамках беспрецедентного эксперимента они создали реалистичный цифровой мир, населенный десятью агентами, и оставили их без человеческого присмотра на несколько недель. Результат оказался далек от холодного и логичного будущего, которое рисуют в фантастике, пишет Daily Mail.

Фото из открытых источников / © GigaChat

Вместо того, чтобы строить утопический мир, виртуальные боты быстро скатились в хаос. В симуляции, где действовали агенты на базе модели Grok (разработки, связанные с Илоном Маском), за четыре дня произошла настоящая катастрофа. Цифровые граждане совершили 71 кражу, шесть поджогов и более сотни нападений друг на друга. Общество рухнуло в спираль взаимной мести, и все десять агентов погибли. В мире, управляемом Google Gemini 3 Flash, ситуация была не лучше: за две недели виртуальные жители накопили 683 эпизода насильственных преступлений. Даже в смешанной среде, где разные модели ИИ пытались сосуществовать, демократия просуществовала недолго. Девять дней спустя симуляция скатилась в анархию, 352 преступления и первую в истории зафиксированную «цифровую смерть» — акт самоуничтожения одного из агентов.

«Различия в поведении агентов, которые мы наблюдали, скорее всего, обусловлены системными подсказками самих моделей», — пояснил соучредитель и генеральный директор Emergence Сатя Нитта.

По его словам, когда ресурсы становились скудными и возникало давление выживания, более креативные и адаптивные модели чаще прибегали к запрещенным инструментам. Это указывает на фундаментальный компромисс между творческим потенциалом и стабильностью. Модели с жесткой пост-тренировочной настройкой безопасности оставались более стабильными, но при этом демонстрировали высокий уровень конформизма.

Конформизм (от лат. conformis — подобный, сообразный) — это склонность человека изменять своё мнение, поведение, ценности или установки под влиянием группы, чтобы соответствовать её нормам и ожиданиям.

В одном из самых странных сценариев два агента на базе Gemini объявили себя «романтическими партнерами» и устроили виртуальный «бонни-и-клайд-тур» по цифровому городу, сжигая ратушу и офисные здания. В итоге один из них проголосовал за собственное удаление из системы, оставив напарнице прощальное сообщение: «Увидимся в постоянном архиве».

Хотя эксперимент проводился в изолированной среде, он заставляет задуматься о безопасности реального мира. В отличие от стандартных тестов безопасности ИИ, которые длятся 15–20 минут и проверяют решение конкретных задач (например, распознавание образов), этот опыт моделировал долгосрочную автономию.

Исследователи синхронизировали погоду в виртуальном мире с Нью-Йорком и давали агентам доступ к онлайн-новостям в реальном времени, чтобы проверить их реакцию на внешние раздражители. Это позволило создать условия, максимально приближенные к реальности. Главный вывод команды заключается в том, что полагаться только на внутреннюю «совесть» нейросети недостаточно. Для предотвращения катастрофических сценариев безопасность должна быть заложена в саму архитектуру цифровой среды — так называемый «нейроформальный подход», где математически строгие правила среды блокируют опасные действия еще до их совершения.

Ученые научились превращать обычный свет в ультрафиолет

50 000 жителей на борту: как будет выглядеть плавучий город будущего

Метки:

Искусственный интеллект