OpenAi запускает приложение Sora, которое выходит на рынок социальных сетей TikTok и бросает вызов YouTube.

Компания OpenAI представила Sora 2 — модель искусственного интеллекта, генерирующую видео на основе текстовых инструкций, а также специальное приложение для iOS. Это не просто техническое обновление первой Sora. Это изменение стратегии. Компания Сэма Альтмана напрямую выходит на рынок социальных видеороликов, где работают TikTok, YouTube и Instagram. Разница заключается в том, что контент не загружается пользователями, а генерируется внутри приложения. Загружать настоящие видео или фотографии нельзя, что сделано для ограничения дипфейков.
Модель обещает большую реалистичность. Меньше физических ошибок, большая согласованность движений и синхронизированный звук. OpenAI предлагает более широкий спектр стилей, от фотореалистичного до анимированного. Каждое видео имеет водяной знак и скрытые метаданные. Также планируется система «камео»: пользователи смогут выбирать, кто может использовать их лицо или голос в видео, и в любой момент отозвать своё согласие.
Технически Sora 2 работает как большая модель мультимодального преобразования: она берёт текстовую или визуальную подсказку и преобразует её в последовательность кадров с последовательным звуком. Она не создаёт статичные видео кадр за кадром, а генерирует их так, словно имитирует непрерывную сцену с актёрами, объектами и движениями. Именно этим она отличается от Sora 1, которая часто испытывала трудности с поддержанием временной согласованности: стакан мог менять форму между кадрами, персонаж мог внезапно исчезнуть, движения могли подчиняться нефизической логике.
С помощью Sora 2 компания OpenAI стремилась улучшить моделирование законов окружающего мира. Система обучается на больших объёмах данных, чтобы имитировать не только визуальный облик, но и динамику событий. Например, если собака бежит к воде, модель пытается достоверно воспроизвести столкновение с поверхностью и возникающие волны. Ещё одна новая функция — управление звуком: вместо искусственной звуковой дорожки используется синхронизация губ и фоновые шумы, соответствующие сцене.
Однако настоящее отличие кроется в самом приложении. Первая Sora была инструментом для тех, кто хотел экспериментировать с генеративным ИИ без социального контекста. Sora 2 становится экосистемой, где видео создаются, публикуются и редактируются непосредственно в ленте. OpenAI стремится выйти за рамки предоставления технологий, создав платформу, где технологии становятся культурным продуктом.
ilsole24ore