Seleccione idioma

Spanish

Down Icon

Seleccione país

America

Down Icon

Mistral, respaldado por Microsoft, lanza una nube de inteligencia artificial europea para competir con AWS y Azure

Mistral, respaldado por Microsoft, lanza una nube de inteligencia artificial europea para competir con AWS y Azure

Únase al evento en el que los líderes empresariales confían desde hace casi dos décadas. VB Transform reúne a quienes desarrollan una verdadera estrategia de IA empresarial. Más información.

Mistral AI , la startup francesa de inteligencia artificial, anunció el miércoles una amplia expansión en infraestructura de IA que posiciona a la compañía como la respuesta de Europa a los gigantes estadounidenses de la computación en la nube, al tiempo que revela nuevos modelos de razonamiento que rivalizan con los sistemas más avanzados de OpenAI.

La empresa parisina presentó Mistral Compute , una plataforma integral de infraestructura de IA, desarrollada en colaboración con Nvidia , diseñada para ofrecer a las empresas y gobiernos europeos una alternativa a la dependencia de proveedores de nube estadounidenses como Amazon Web Services , Microsoft Azure y Google Cloud . Esta iniciativa representa un cambio estratégico significativo para Mistral, que pasa de centrarse exclusivamente en el desarrollo de modelos de IA a controlar toda la infraestructura tecnológica.

“Esta transición hacia la infraestructura de IA marca un paso transformador para Mistral AI, ya que nos permite abordar un sector vertical crítico de la cadena de valor de la IA”, afirmó Arthur Mensch, director ejecutivo y cofundador de Mistral AI. “Con este cambio, surge la responsabilidad de garantizar que nuestras soluciones no solo impulsen la innovación y la adopción de la IA, sino que también preserven la autonomía tecnológica de Europa y contribuyan a su liderazgo en sostenibilidad”.

Junto con el anuncio de infraestructura, Mistral presentó su serie Magistral de modelos de razonamiento: sistemas de IA capaces de un pensamiento lógico paso a paso, similar al modelo o1 de OpenAI y al DeepSeek R1 de China. Sin embargo, Guillaume Lample, director científico de Mistral, afirma que el enfoque de la compañía difiere del de la competencia en aspectos cruciales.

“Lo hicimos todo desde cero, básicamente porque queríamos aprovechar nuestra experiencia y la flexibilidad que ofrecemos”, me contó Lample en una entrevista exclusiva. “De hecho, logramos ser muy eficientes en el proceso de aprendizaje de refuerzo en línea más sólido”.

A diferencia de la competencia, que suele ocultar sus procesos de razonamiento, los modelos de Mistral muestran la cadena de pensamiento completa a los usuarios, y, fundamentalmente, en su idioma nativo, en lugar de usar el inglés como idioma predeterminado. "Aquí tenemos la cadena de pensamiento completa, que se le proporciona al usuario, pero en su propio idioma, para que pueda leerla y comprobar si tiene sentido", explicó Lample.

La compañía lanzó dos versiones: Magistral Small , un modelo de código abierto de 24 mil millones de parámetros, y Magistral Medium , un sistema propietario más poderoso disponible a través de la API de Mistral.

Los modelos demostraron capacidades sorprendentes que surgieron durante el entrenamiento. Cabe destacar que Magistral Medium conservó la capacidad de razonamiento multimodal (la capacidad de analizar imágenes) a pesar de que el proceso de entrenamiento se centró exclusivamente en problemas matemáticos y de codificación basados ​​en texto.

“Algo que nos dimos cuenta, no exactamente por error, pero algo que absolutamente no esperábamos, es que si al final del entrenamiento de aprendizaje de refuerzo, conectas nuevamente el codificador de visión inicial, entonces de repente, como de la nada, ves que el modelo puede razonar sobre imágenes”, dijo Lample.

Los modelos también adquirieron sofisticadas capacidades de llamada de funciones, realizando automáticamente búsquedas en internet de varios pasos y ejecutando código para responder consultas complejas. "Lo que verán es un modelo haciendo esto, pensando y luego dándose cuenta: 'Bueno, esta información podría actualizarse. Permítanme hacer una búsqueda en la web'", explicó Lample. "Buscará en internet, luego enviará los resultados y los mostrará, y dirá: 'Quizás la respuesta no esté en estos resultados. Permítanme buscar de nuevo'".

Este comportamiento surgió de forma natural, sin necesidad de entrenamiento específico. "Es algo que depende de qué hacer a continuación, pero descubrimos que, de hecho, ocurre de forma bastante natural. Así que fue una grata sorpresa para nosotros", señaló Lample.

El equipo técnico de Mistral superó importantes desafíos de ingeniería para crear lo que Lample describe como un avance en la infraestructura de entrenamiento. La empresa desarrolló un sistema de "aprendizaje de refuerzo en línea" que permite a los modelos de IA mejorar continuamente mientras generan respuestas, en lugar de depender de datos de entrenamiento preexistentes.

La innovación clave consistió en sincronizar las actualizaciones del modelo en cientos de unidades de procesamiento gráfico (GPU) en tiempo real. "Encontramos una manera de descifrar el modelo mediante GPU. Es decir, de GPU a GPU", explicó Lample. Esto permite que el sistema actualice los pesos del modelo en diferentes clústeres de GPU en segundos, en lugar de las horas que suelen requerirse.

“No existe una infraestructura de código abierto que lo haga correctamente”, señaló Lample. “Normalmente, hay muchos intentos de código abierto para lograrlo, pero es extremadamente lento. En este caso, nos centramos mucho en la eficiencia”.

El proceso de entrenamiento resultó mucho más rápido y económico que el preentrenamiento tradicional. "Fue mucho más económico que el preentrenamiento normal. El preentrenamiento es algo que llevaría semanas o meses con otras GPU. Aquí, no estamos ni cerca de eso. Depende de cuántas personas participemos. Pero fue más bien bastante menos de una semana", dijo Lample.

La plataforma Mistral Compute se basará en 18.000 chips Grace Blackwell de Nvidia, alojados inicialmente en un centro de datos en Essonne, Francia, con planes de expansión por toda Europa. El director ejecutivo de Nvidia, Jensen Huang, calificó la alianza como crucial para la independencia tecnológica europea.

“Cada país debería desarrollar IA para su propia nación, en su nación”, declaró Huang en un anuncio conjunto en París. “Con Mistral AI, estamos desarrollando modelos y fábricas de IA que sirven como plataformas soberanas para que las empresas de toda Europa escalen la inteligencia en todos los sectores”.

Huang proyectó que la capacidad de computación de IA en Europa se decuplicaría en los próximos dos años, con más de 20 "fábricas de IA" planificadas en todo el continente. Varias de estas instalaciones tendrán más de un gigavatio de capacidad, lo que podría situarlas entre los centros de datos más grandes del mundo.

La asociación se extiende más allá de la infraestructura para incluir el trabajo de Nvidia con otras empresas europeas de IA y Perplexity, la empresa de búsqueda, para desarrollar modelos de razonamiento en varios idiomas europeos donde los datos de entrenamiento a menudo son limitados.

Mistral Compute aborda dos preocupaciones principales en el desarrollo de la IA: el impacto ambiental y la soberanía de los datos. La plataforma garantiza que los clientes europeos puedan mantener su información dentro de las fronteras de la UE y bajo la jurisdicción europea.

La empresa se ha asociado con la Agencia Nacional Francesa para la Transición Ecológica y Carbone 4, consultora climática líder, para evaluar y minimizar la huella de carbono de sus modelos de IA a lo largo de su ciclo de vida. Mistral planea alimentar sus centros de datos con fuentes de energía descarbonizadas.

“Al elegir Europa para la ubicación de nuestras plantas, nos damos la posibilidad de beneficiarnos de fuentes de energía en gran medida descarbonizadas”, afirmó la empresa en su anuncio.

Las primeras pruebas sugieren que los modelos de razonamiento de Mistral ofrecen un rendimiento competitivo, a la vez que abordan una crítica común a los sistemas existentes: la velocidad. Los modelos de razonamiento actuales de OpenAI y otros pueden tardar minutos en responder a consultas complejas, lo que limita su utilidad práctica.

“Una de las cosas que a la gente no suele gustarle de este modelo de razonamiento es que, aunque es inteligente, a veces lleva mucho tiempo”, señaló Lample. “Aquí realmente se ve el resultado en tan solo unos segundos, a veces en menos de cinco segundos, a veces incluso menos. Y cambia la experiencia”.

La ventaja de la velocidad podría resultar crucial para la adopción empresarial, donde esperar minutos para obtener respuestas de la IA crea cuellos de botella en el flujo de trabajo.

La incursión de Mistral en el sector de la infraestructura la coloca en competencia directa con gigantes tecnológicos que han dominado el mercado de la computación en la nube. Amazon Web Services , Microsoft Azure y Google Cloud controlan actualmente la mayor parte de la infraestructura en la nube a nivel mundial, mientras que empresas más nuevas como CoreWeave han ganado terreno, especialmente en cargas de trabajo de IA.

El enfoque de la empresa se distingue de la competencia al ofrecer una solución completa e integrada verticalmente, que abarca desde la infraestructura de hardware hasta los modelos de IA y los servicios de software. Esto incluye Mistral AI Studio para desarrolladores, Le Chat para la productividad empresarial y Mistral Code para la asistencia en programación.

Los analistas del sector consideran la estrategia de Mistral como parte de una tendencia más amplia hacia el desarrollo regional de la IA. «Europa necesita urgentemente ampliar su infraestructura de IA si quiere seguir siendo competitiva a nivel mundial», observó Huang, haciéndose eco de las preocupaciones expresadas por los responsables políticos europeos.

El anuncio se produce en un momento en que los gobiernos europeos se preocupan cada vez más por su dependencia de las empresas tecnológicas estadounidenses para la infraestructura crítica de IA. La Unión Europea ha comprometido 20 000 millones de euros para la construcción de «gigafábricas» de IA en todo el continente, y la colaboración de Mistral con Nvidia podría impulsar estos planes.

El doble anuncio de Mistral sobre infraestructura y capacidades de modelo demuestra la ambición de la compañía de convertirse en una plataforma integral de IA, en lugar de simplemente un proveedor de modelos. Con el respaldo de Microsoft y otros inversores, la compañía ha recaudado más de mil millones de dólares y continúa buscando financiación adicional para respaldar su alcance ampliado.

Pero Lample ve posibilidades aún mayores para los modelos de razonamiento. "Creo que, al analizar el progreso interno, y según algunos puntos de referencia, el modelo obtuvo una precisión del 5 % cada semana durante aproximadamente seis semanas en total", dijo. "Así que, si está mejorando muy rápido, hay muchísimas, es decir, muchísimas pequeñas ideas que se te ocurren para mejorar el rendimiento".

El éxito de este desafío europeo al dominio estadounidense de la IA podría depender, en última instancia, de si los clientes valoran la soberanía y la sostenibilidad lo suficiente como para cambiar de proveedores establecidos. Por ahora, al menos, tienen una opción.

Perspectivas diarias sobre casos de uso empresarial con VB Daily

Si quieres impresionar a tu jefe, VB Daily te tiene cubierto. Te ofrecemos información exclusiva sobre lo que las empresas están haciendo con la IA generativa, desde cambios regulatorios hasta implementaciones prácticas, para que puedas compartir tus conocimientos y maximizar el retorno de la inversión.

Lea nuestra Política de Privacidad

Gracias por suscribirte. Consulta más boletines de VB aquí .

Se produjo un error.

venturebeat

venturebeat

Noticias similares

Todas las noticias
Animated ArrowAnimated ArrowAnimated Arrow