Close
03 марта 2026, Вторник
Информационно-познавательный портал. 16+

Новый проект «Последний экзамен человечества» оценит способности искусственного интеллекта

03.03.2026 Разместил: Редакция 23

Группа исследователей разработала тест под названием «Последний экзамен человечества» («Humanity's Last Exam»), предназначенный для оценки возможностей современных крупных моделей искусственного интеллекта. Согласно новому исследованию, опубликованному в журнале Nature, наиболее продвинутая версия Google Gemini 3 смогла набрать — 48,4% правильных ответов, однако специалисты предупреждают, что достижение высокого результата не является признаком появления полноценного искусственного интеллекта общечеловеческого масштаба (AGI). Об этом сообщает Live Science.

Фото из открытых источников / © GigaChat

Новый тест включает 2500 сложных вопросов, охватывающих разнообразные дисциплины и созданные коллективом более тысячи экспертов из пятисот организаций пятидесяти стран мира. Для включения в финальный перечень каждая задача должна была пройти ряд проверок: сначала модели пытались самостоятельно найти верный ответ, а затем группа ученых окончательно утверждала выбранные задания. 

Примером таких вопросов может служить загадка из греческого мифа: «Кто был прадедом Ясона по материнской линии?» Или же сложная физическая задача, где необходимо рассчитать взаимодействие сил при скольжении блока вдоль жесткой оси.  

Цель тестирования — установить, насколько близко крупные языковые модели подошли к человеческому интеллекту, особенно в тех дисциплинах, где традиционная экспертиза имеет решающее значение. Специалисты подчёркивают, что даже лучшие модели вроде GPT-4o от OpenAI, набравшие значительно меньше баллов (всего 8,3%) ранее, продемонстрировали заметный прогресс. Тем не менее, ученые считают, что высокая оценка, пусть и необходимая, недостаточна для подтверждения наличия настоящего AGI. 

Как отметил нейробиолог Манулель Шоттдорф из Университета Делавэра, участвовавший в создании тестов: 

«Эти успехи показывают уровень человеческих компетенций, но не являются доказательством наличия реального машинного интеллекта».  

Несмотря на высокие показатели Google Gemini 3, ведущие эксперты уверены, что пока искусственному интеллекту далеко до уровня настоящих мыслительных процессов, присущих человеку. По их мнению, способность успешно справляться с подобными тестами свидетельствует лишь о развитых способностях обработки информации, но не подразумевает глубокого понимания материала.

Учёные предупреждают: Искусственный интеллект выбирает путь эскалации в виртуальных военных конфликтах