Новая версия ChatGPT разочаровывает и останавливает мечту об обещанном сверхчеловеческом ИИ.

Сэм Альтман, словно Стив Джобс, анонсирующий iPhone в 2007 году, вчера представил свою новую мечту: GPT-5, последнее обновление ChatGPT . В целом, это более умная, быстрая и продуманная версия, чем предыдущие. Но в этом-то и суть. Это не тот общий искусственный интеллект (ОИИ), к которому стремится Альтман, и даже не превосходит, скажем, лучшего программиста на Земле.
Это разочаровало всех экспертов по искусственному интеллекту, которые, с нетерпением ожидая анонсов на прошлой неделе, увидели, как Альтман нагнетал ажиотаж, публикуя в Твиттере посты вроде «Звезды Смерти», намекая на то, что GPT-5 «уничтожит» все остальные системы искусственного интеллекта на рынке. Однако этого не произошло, и это также напомнило о фиаско с запуском Apple Intelligence , если сравнивать с обещаниями, данными при анонсе на WWDC 2024.
Мэтт Шумер, эксперт по искусственному интеллекту и владелец OthersideAI, несколько недель назад получил доступ к GPT-5 и объяснил ABC, что, хотя это лучшая на данный момент модель, «нужно приложить немало усилий, чтобы извлечь из нее максимальную пользу», а среднестатистический пользователь на данный момент на это не способен, поэтому он не заметит особой разницы с GPT-4.5, которую использовал до сих пор.
«GPT-5 очень ориентирован на детализацию и нацелен на максимальную эффективность в длительных контекстах, поскольку допускает меньше глупых ошибок. Мы обнаружили, что это идеальный, если не лучший, ИИ для программирования», — отмечает Шумер. Более того, Альтман во время презентации новой модели отметил, что это «идеальный помощник для программиста».

В бенчмарке SWE-bench Verified, ориентированном на реальные задачи GitHub, GPT-5 достигает 74,9% успеха с первой попытки. Ни один альтернативный инструмент не достигал такого уровня. По данным компании под руководством Сэма Альтмана, он превосходит Claude Opus 4.1 (74,5%) и Gemini 2.5 Pro (59,6%). Он позволяет создавать веб-сайты с нуля всего несколькими инструкциями, разрабатывать приложения, интерактивные игры и отлаживать код в больших репозиториях без потери точности. Он не только выполняет команды, но и объясняет, что делает и почему.
С другой стороны, GPT-5 не просто улучшается изнутри: он также меняет способ нашего взаимодействия с ним. С его появлением ChatGPT включает четыре новых типа личности: Циник, Робот, Слушатель и Ботан. Каждый отвечает в своём стиле, подстраивая тон, отношение и подход без необходимости инструкций. Он также позволяет менять цвет чата с ИИ, хотя эта возможность доступна только пользователям с платными аккаунтами. Всё указывает на то, что сотрудничество OpenAI с Джони Айвом, бывшим дизайнером Apple, повлияло на новые функции GPT-5.
Однако, похоже, GPT-o3 остаётся лучшим вариантом для научных исследований, а GPT-4.5 — идеальной моделью для письма. Хорошая новость заключается в том, что со вчерашнего дня GPT-5 стала доступна бесплатно всем пользователям ChatGPT, начиная с сегодняшнего дня. Бесплатные пользователи получат доступ как к GPT-5, так и к более быстрой, но менее точной версии GPT-5 mini. Это первый случай, когда продвинутая модель рассуждений доступна без подписки.
Хотя есть основания для энтузиазма по поводу GPT-5 (модель отказывается от разделения версий, чтобы стать единой моделью, которая в режиме реального времени решает, что важнее – рассуждение или скорость), скачок не такой, как обещалось. Двое из первых тестировщиков новой модели сообщили Reuters, что они также впечатлены её способностью программировать и решать научные и математические задачи, но, по их мнению, скачок от GPT-4 к GPT-5 не так велик, как от GPT-3 к GPT-4. «Это далеко от идеи почти человеческого интеллекта, на которую некоторые как внутри, так и за пределами OpenAI намекали годами», – подчеркивают они. В ABC мы провели несколько тестов, и, как отмечают эксперты, она даёт сбои при ответе на самые простые вопросы, например, существует ли уже GPT-5 или какое пятое слово в её ответе.

Разработка GPT-5 тоже была непростой. Альтман публично признал, что запуск пришлось отложить на несколько месяцев из-за невозможности интегрировать все компоненты модели. Он также заявил, что они хотели убедиться в наличии достаточных мощностей для удовлетворения ожидаемого «беспрецедентного» спроса. Но эти задержки были не единственными причинами. С одной стороны, OpenAI столкнулась с проблемой данных: новых, крупных и чистых источников для обучения моделей такого типа стало мало.
Илья Суцкевер, бывший главный научный сотрудник компании, объяснил это так: «Мы можем масштабировать мощность, но не объём данных». Другая проблема заключалась в том, что «тренировочные прогоны» для больших моделей более подвержены аппаратным сбоям, учитывая сложность системы, и исследователи могут не знать окончательных результатов работы моделей до конца прогона, который может занять несколько месяцев.
ABC.es