От Google Ultra до выхода Gemini на Chrome. Что нового на Google I/O
Персонализированный, универсальный, вездесущий. Сегодня Google возобновляет миссию, объединяющую многие крупные имена в области искусственного интеллекта, в первую очередь OpenAI: они хотят сделать его нашим персональным и универсальным помощником одновременно для повседневной жизни и работы. С большим интеллектом, большим количеством функций, большей автономией, лучшим пониманием наших потребностей. Сегодняшние заявления на Google I/O (известной конференции, посвященной разработчикам) носят всеобъемлющий характер в отношении ИИ и частично отражают то, что делают другие крупные компании (см. все более сложные модели рассуждений). Google делает больший упор на агентов, мультимодальность и видео, а также обещает интеграцию с поисковой системой и другими своими сервисами.
Некоторые из более продвинутых функций, такие как видеогенератор, теперь со звуком, Veo 3 и появление Gemini в Chrome, зарезервированы для тех, кто подпишется на новый тарифный план AI Ultra за 249,99 долларов в месяц (аналогично Chatgpt Pro). В любом случае, пока только в США.
Анонсировано множество улучшений для Gemini 2.5. Вспышка теперь является режимом по умолчанию.
Получите собственный аудиовыход для более естественного общения и расширенных мер безопасности. Google сообщает, что Gemini 2.5 Pro будет улучшена с помощью Deep Think — экспериментального расширенного режима рассуждений для очень сложных математических и программных операций.
2.5 Flash — самая надежная и эффективная модель, разработанная для скорости и низкой стоимости, которая теперь улучшена практически во всех отношениях. Он улучшил ключевые показатели рассуждений, мультимодальности, программирования и длинного контекста, став еще более эффективным, используя на 20–30 % меньше токенов.
С другой стороны, 2.5 Pro указан Google как лидер в некоторых рейтингах, таких как рейтинг программирования WebDev Arena и рейтинг LMArena. Кроме того, 2.5 Pro теперь является ведущей моделью Google для обучения. «При прямом сравнении педагогических качеств и эффективности преподаватели и эксперты отдали предпочтение Gemini 2.5 Pro», — сообщает Google.
«Наша конечная цель — превратить приложение Gemini в универсального помощника на базе искусственного интеллекта, который будет выполнять за нас повседневные задачи, справляться с утомительными административными задачами и давать новые замечательные рекомендации, делая нас более продуктивными и обогащая нашу жизнь», — заявила Google.
Для достижения этой цели предстоит пройти многочисленные научно-исследовательские разработки, которые сейчас находятся на стадии прототипа под названиями Project Mariner и Project Astra .
Проект Mariner теперь включает в себя систему агентов, которая может выполнять до десяти задач одновременно. Эти агенты могут помочь вам найти информацию, забронировать билеты, совершить покупки, провести исследование и многое другое — все одновременно. Обновленная версия Project Mariner доступна подписчикам Google AI Ultra в США.
Google также интегрирует функционал Project Astra Live в Поиск в США, чтобы вы могли взаимодействовать с Поиском в режиме реального времени относительно того, что вы видите с помощью камеры. «Застряли на проекте? Просто нажмите значок «Прямой эфир» в режиме ИИ, наведите камеру, задайте свой вопрос и получите объяснение со ссылками на другие ресурсы, которые вы можете изучить более подробно», — поясняет Google.
В то же время Google делает ИИ более персонализированным. «С вашего разрешения приложение будет интегрировано с такими сервисами Google, как Карты, Календарь, Задачи и Keep (и многими другими в будущем), что обеспечит более глубокую повседневную помощь», — объясняет он. Тенденция персонализации на основе наших данных, которая касается также OpenAI, Meta, Microsoft. У Google есть возможность использовать то, что мы делаем в этих известных сервисах.
Сегодня компания Google представила Veo 3 и Imagen 4 — свои модели для создания видео и изображений. Veo 3 не только превосходит Veo 2 по качеству, но и впервые способен создавать видео со звуком: фоновый шум транспорта на городской улице, пение птиц в парке и даже разговоры людей.
Imagen 4 может создавать изображения в широком диапазоне соотношений сторон и с разрешением до 2K для печати или презентаций. Орфография и типографика были значительно улучшены, что упростило создание поздравительных открыток, плакатов и даже комиксов. Развитие, которого OpenAI уже достигла с Gpt4.
Также ожидается выход Flow — нашего нового инструмента для создания фильмов на базе искусственного интеллекта, позволяющего создавать элементы повествования (актеров, локации, объекты, стили) на естественном языке — и все это в одном месте.
Компания заявила сегодня, что AI Overview представляет собой один из самых успешных запусков в поиске Google за последнее десятилетие. «На наших ключевых рынках, таких как США и Индия, AI Overviews помогает увеличить использование Google более чем на 10% для тех типов запросов, которые активируют эту функцию».
Итак, Google движется вперед. Сегодня режим AI Mode доступен всем пользователям США (регистрация больше не требуется).
«AI Mode — это то, где мы впервые представим самые передовые возможности Gemini, и это также взгляд на то, что будет дальше. По мере получения отзывов многие функции и возможности перейдут из AI Mode непосредственно в основной опыт поиска. Начиная с этой недели, мы представим настроенную версию Gemini 2.5 как в Search for AI Mode, так и в AI Overview в США».
«Для вопросов, требующих еще более полного ответа, мы внедряем возможности углубленного поиска в режиме искусственного интеллекта с функцией Deep Search».
Он также представляет «живые» функции («с помощью Search Live вы можете общаться с Search о том, что видите, в режиме реального времени, используя камеру») и агентов Mariner в режиме поиска AI Mode.
Режим ИИ станет более персонализированным, получит нашу контекстную информацию и режим покупок. «Посмотрите, подходит ли вам товар, и попросите нашу автоматическую функцию оформления заказа оформить покупку, когда цена будет подходящей».
Цель, с учетом конкретных инструментов и прерогатив Google, заключается в следующем: ИИ как универсальный инструмент для каждого из нас. В конце концов, другого способа вернуть миллиардные инвестиции нет. Однако другие крупные технологические компании тоже делают это и имеют схожие амбиции. В конце концов, возможно, победит только один — в конце концов, скольким универсальным ИИ есть место в нашей жизни? Теперь картина запутанная. Однако по мере развития рынка ИИ крупным игрокам придется искать более эффективные способы выделиться.
Новости и аналитика политических, экономических и финансовых событий.
Зарегистрироватьсяilsole24ore