Mistral при поддержке Microsoft запускает европейское облако искусственного интеллекта, чтобы конкурировать с AWS и Azure

Присоединяйтесь к мероприятию, которому доверяют руководители предприятий уже почти два десятилетия. VB Transform объединяет людей, которые создают настоящую стратегию искусственного интеллекта для предприятий. Узнать больше
Французский стартап в области искусственного интеллекта Mistral AI объявил в среду о масштабном расширении инфраструктуры ИИ, которое позиционирует компанию как европейский ответ американским гигантам облачных вычислений, одновременно представляя новые модели рассуждений, которые конкурируют с самыми передовыми системами OpenAI.
Парижская компания представила Mistral Compute , комплексную платформу инфраструктуры ИИ, созданную в партнерстве с Nvidia , призванную предоставить европейским предприятиям и правительствам альтернативу американским облачным провайдерам, таким как Amazon Web Services , Microsoft Azure и Google Cloud . Этот шаг представляет собой значительный стратегический сдвиг для Mistral от чистой разработки моделей ИИ к контролю всего технологического стека.
«Этот переход к инфраструктуре ИИ знаменует собой преобразующий шаг для Mistral AI, поскольку он позволяет нам охватить критически важную вертикаль цепочки создания стоимости ИИ», — сказал Артур Менш, генеральный директор и соучредитель Mistral AI. «С этим сдвигом возникает ответственность за то, чтобы наши решения не только стимулировали инновации и внедрение ИИ, но и поддерживали технологическую автономию Европы и способствовали ее лидерству в области устойчивого развития».
Наряду с анонсом инфраструктуры Mistral представила свою серию моделей рассуждений Magistral — системы ИИ, способные к пошаговому логическому мышлению, подобно модели o1 от OpenAI и китайской DeepSeek R1 . Но Гийом Лампле, главный научный сотрудник Mistral, говорит, что подход компании отличается от конкурентов в важных отношениях.
«Мы делали все с нуля, в основном потому, что мы хотели изучить экспертные знания, которые у нас есть, гибкость в том, что мы делаем», — сказал мне Лампл в эксклюзивном интервью. «На самом деле нам удалось быть, типа, действительно очень эффективными в более мощном конвейере обучения с подкреплением в режиме онлайн».
В отличие от конкурентов, которые часто скрывают свои процессы рассуждения, модели Mistral отображают пользователям полную цепочку мыслей — и, что особенно важно, на родном языке пользователя, а не на английском по умолчанию. «Здесь у нас есть как бы полная цепочка мыслей, которая предоставляется пользователю, но на его родном языке, так что они могут фактически прочитать ее, посмотреть, имеет ли она смысл», — объяснил Лэмпл.
Компания выпустила две версии: Magistral Small — модель с открытым исходным кодом, насчитывающую 24 миллиарда параметров, и Magistral Medium — более мощную фирменную систему, доступную через API Mistral.
Модели продемонстрировали удивительные возможности, которые проявились во время обучения. В частности, Magistral Medium сохранила способности к мультимодальному рассуждению — способность анализировать изображения — даже несмотря на то, что процесс обучения был сосредоточен исключительно на текстовых математических и кодирующих задачах.
«Мы поняли, и не совсем по ошибке, а совсем не ожидали, что если в конце обучения с подкреплением вы снова подключите исходный кодер зрения, то вы внезапно, как будто из ниоткуда, увидите, что модель способна рассуждать на основе изображений», — сказал Лэмпл.
Модели также получили сложные возможности вызова функций, автоматически выполняя многошаговый поиск в Интернете и выполнение кода для ответа на сложные запросы. «То, что вы увидите, — это модель, которая делает это, думает, а затем понимает, что, хорошо, эта информация может быть обновлена. Давайте я сделаю это как веб-поиск», — объяснил Лэмпл. «Она будет искать как в Интернете, а затем фактически передаст результаты, и она выдаст результат по ним, и она скажет, может быть, может быть, ответа нет в этих результатах. Давайте я поищу еще раз».
Такое поведение возникло естественным образом без специальной подготовки. «Это то, что зависит от того, что делать дальше, или нет, но мы обнаружили, что это происходит как-то естественно. Так что для нас это был очень приятный сюрприз», — отметил Лэмпл.
Техническая команда Mistral преодолела значительные инженерные проблемы, чтобы создать то, что Лампл описывает как прорыв в инфраструктуре обучения. Компания разработала систему для «онлайн-обучения с подкреплением», которая позволяет моделям ИИ постоянно совершенствоваться, генерируя ответы, а не полагаться на уже существующие данные обучения.
Ключевое нововведение заключалось в синхронизации обновлений модели по сотням графических процессоров (GPU) в режиме реального времени. «Мы нашли способ просто раскручивать модель по GPU. Я имею в виду, от GPU к GPU», — объяснил Лампл. Это позволяет системе обновлять веса модели по разным кластерам GPU за считанные секунды, а не за часы, как обычно требуется.
«Нет подобной инфраструктуры с открытым исходным кодом, которая будет делать это правильно», — отметил Лэмпл. «Обычно существует множество подобных попыток сделать это с открытым исходным кодом, но это очень медленно. Здесь мы сосредоточились на эффективности».
Процесс обучения оказался намного быстрее и дешевле, чем традиционное предварительное обучение. «Это было намного дешевле, чем обычное предварительное обучение. Предварительное обучение — это то, что заняло бы недели или месяцы на других GPU. Здесь мы даже близко не подошли к этому. Это было похоже на то, сколько людей мы на это поместим. Но это было больше похоже на то, что это было похоже на то, что было меньше одной недели», — сказал Лэмпл.
Платформа Mistral Compute будет работать на 18 000 новейших чипах Grace Blackwell от Nvidia, изначально размещенных в центре обработки данных в Эссонне, Франция, с планами расширения по всей Европе. Генеральный директор Nvidia Дженсен Хуанг охарактеризовал партнерство как решающее для европейской технологической независимости.
«Каждая страна должна создавать ИИ для своей страны, в своей стране», — сказал Хуан на совместном объявлении в Париже. «С Mistral AI мы разрабатываем модели и фабрики ИИ, которые служат суверенными платформами для предприятий по всей Европе для масштабирования интеллекта в разных отраслях».
Хуан прогнозирует, что вычислительная мощность искусственного интеллекта в Европе увеличится в десять раз за следующие два года, и по всему континенту планируется построить более 20 «фабрик искусственного интеллекта». Некоторые из этих объектов будут иметь мощность более гигаватта, что потенциально позволит им войти в число крупнейших в мире центров обработки данных.
Партнерство выходит за рамки инфраструктуры и включает сотрудничество Nvidia с другими европейскими компаниями в области искусственного интеллекта и поисковой компанией Perplexity по разработке моделей рассуждений на различных европейских языках, где данные для обучения часто ограничены.
Mistral Compute решает две основные проблемы, связанные с развитием ИИ: воздействие на окружающую среду и суверенитет данных. Платформа гарантирует, что европейские клиенты могут хранить свою информацию в пределах границ ЕС и под европейской юрисдикцией.
Компания сотрудничает с французским национальным агентством по экологическому переходу и Carbone 4, ведущей климатической консалтинговой компанией, для оценки и минимизации углеродного следа своих моделей ИИ на протяжении всего их жизненного цикла. Mistral планирует снабжать свои центры обработки данных декарбонизированными источниками энергии.
«Выбрав Европу для размещения наших объектов, мы даем себе возможность извлекать выгоду из в значительной степени декарбонизированных источников энергии», — заявила компания в своем заявлении.
Раннее тестирование показывает, что модели рассуждений Mistral обеспечивают конкурентоспособную производительность, одновременно устраняя распространенную критику существующих систем — скорость. Текущие модели рассуждений от OpenAI и других могут тратить минуты на ответ на сложные запросы, что ограничивает их практическую полезность.
«Одна из вещей, которая обычно не нравится людям в этой модели рассуждений, заключается в том, что, хотя она и умная, иногда она занимает много времени», — отметил Лэмпл. «Здесь вы действительно видите результат всего за несколько секунд, иногда менее чем за пять секунд, иногда даже меньше. И это меняет опыт».
Преимущество в скорости может оказаться решающим для внедрения технологий в бизнесе, где ожидание ответов ИИ, длящееся несколько минут, создает узкие места в рабочем процессе.
Переход Mistral в инфраструктуру ставит ее в прямую конкуренцию с технологическими гигантами, которые доминируют на рынке облачных вычислений. Amazon Web Services , Microsoft Azure и Google Cloud в настоящее время контролируют большую часть облачной инфраструктуры во всем мире, в то время как новые игроки, такие как CoreWeave, добились успеха именно в рабочих нагрузках ИИ.
Подход компании отличается от конкурентов тем, что предлагает комплексное вертикально интегрированное решение — от аппаратной инфраструктуры до моделей ИИ и программных сервисов. Сюда входят Mistral AI Studio для разработчиков, Le Chat для корпоративной производительности и Mistral Code для помощи в программировании.
Аналитики отрасли рассматривают стратегию Mistral как часть более широкой тенденции к региональному развитию ИИ. «Европе необходимо срочно масштабировать свою инфраструктуру ИИ, если она хочет оставаться конкурентоспособной на мировом уровне», — заметил Хуан, разделяя опасения, высказанные европейскими политиками.
Объявление прозвучало на фоне растущей обеспокоенности европейских правительств своей зависимостью от американских технологических компаний в плане критической инфраструктуры ИИ. Европейский союз выделил 20 миллиардов евро на строительство «гигафабрик» ИИ по всему континенту, и партнерство Mistral с Nvidia может помочь ускорить эти планы.
Двойное объявление Mistral об инфраструктурных и модельных возможностях сигнализирует об амбициях компании стать комплексной платформой ИИ, а не просто еще одним поставщиком моделей. При поддержке Microsoft и других инвесторов компания привлекла более 1 миллиарда долларов и продолжает искать дополнительное финансирование для поддержки своего расширенного охвата.
Но Лампл видит еще большие возможности для моделей рассуждений. «Я думаю, когда я смотрю на внутренний прогресс, и я думаю, что по некоторым показателям, модель получала точность плюс 5% каждую неделю в течение, может быть, шести недель в целом», - сказал он. «Так что она улучшается очень быстро, есть много, много, я имею в виду, тонна тонн, знаете ли, маленьких идей, которые вы можете придумать, чтобы улучшить производительность».
Успех этого европейского вызова американскому доминированию ИИ может в конечном итоге зависеть от того, будут ли клиенты ценить суверенитет и устойчивость достаточно, чтобы отказаться от устоявшихся поставщиков. По крайней мере, на данный момент у них есть выбор.
Если вы хотите произвести впечатление на своего босса, VB Daily вам поможет. Мы даем вам внутреннюю информацию о том, что компании делают с генеративным ИИ, от изменений в регулировании до практических развертываний, чтобы вы могли поделиться идеями для максимальной окупаемости инвестиций.
Ознакомьтесь с нашей Политикой конфиденциальности
Спасибо за подписку. Ознакомьтесь с другими рассылками VB здесь .
Произошла ошибка.

venturebeat