Claude 3.7 Sonnet de Anthropic apunta a OpenAI y DeepSeek en la próxima gran batalla de la IA

Suscríbase a nuestros boletines diarios y semanales para recibir las últimas actualizaciones y contenido exclusivo sobre la cobertura de inteligencia artificial líder en la industria. Más información
Anthropic acaba de lanzar una advertencia a OpenAI , DeepSeek y toda la industria de la IA con el lanzamiento de Claude 3.7 Sonnet , un modelo que ofrece a los usuarios un control sin precedentes sobre cuánto tiempo pasa una IA " pensando " antes de generar una respuesta. El lanzamiento, junto con el debut de Claude Code , un agente de codificación de IA de línea de comandos, señala el impulso agresivo de Anthropic en el mercado de la IA empresarial, uno que podría cambiar la forma en que las empresas crean software y automatizan el trabajo.
Lo que está en juego no podría ser más importante. El mes pasado, DeepSeek sorprendió al mundo de la tecnología con un modelo de IA que igualaba los sistemas estadounidenses a una fracción del costo , lo que hizo que las acciones de Nvidia cayeran un 17% y generó alarmas sobre el liderazgo de Estados Unidos en IA. Ahora Anthropic apuesta a que el control preciso sobre el razonamiento de la IA (no solo la velocidad bruta o el ahorro de costos) le dará una ventaja.

“Creemos que el razonamiento es una parte fundamental y un componente fundamental de una IA, en lugar de algo independiente por lo que hay que pagar por separado para acceder a él”, dijo Dianne Penn, quien dirige la gestión de productos para la investigación en Anthropic, en una entrevista con VentureBeat. “Al igual que los humanos, la IA debe manejar tanto respuestas rápidas como pensamiento complejo. Para una pregunta sencilla como '¿qué hora es?', debe responder al instante. Pero para tareas complejas, como planificar un viaje de dos semanas a Italia y tener en cuenta las necesidades dietéticas sin gluten, necesita un tiempo de procesamiento más extenso”.
“No consideramos que el razonamiento, la planificación y la autocorrección sean capacidades separadas”, añadió. “Así que, en esencia, esta es nuestra forma de expresar esa diferencia filosófica… Lo ideal sería que el propio modelo reconociera cuándo un problema requiere un pensamiento más intensivo y se ajustara, en lugar de exigir a los usuarios que seleccionen explícitamente diferentes modos de razonamiento”.

Los datos de referencia respaldan la ambiciosa visión de Anthropic. En el modo de pensamiento extendido, Claude 3.7 Sonnet logra una precisión del 78,2 % en tareas de razonamiento de nivel de posgrado, desafiando los últimos modelos de OpenAI y superando a DeepSeek R1.
Pero las métricas más reveladoras provienen de aplicaciones del mundo real: el modelo obtiene un 81,2% en el uso de herramientas centrado en el comercio minorista y muestra mejoras marcadas en el seguimiento de instrucciones (93,2%) , áreas en las que los competidores han tenido dificultades o no han publicado resultados.
Si bien DeepSeek y OpenAI lideran los puntos de referencia matemáticos tradicionales , el enfoque unificado de Claude 3.7 demuestra que un solo modelo puede cambiar eficazmente entre respuestas rápidas y análisis profundo, eliminando potencialmente la necesidad de que las empresas mantengan sistemas de IA separados para diferentes tipos de tareas.
El momento de su publicación es crucial. La aparición de DeepSeek el mes pasado causó conmoción en Silicon Valley, demostrando que se podía lograr un razonamiento de IA sofisticado con mucho menos poder computacional de lo que se creía anteriormente. Esto puso en tela de juicio los supuestos fundamentales sobre los costos de desarrollo de la IA y los requisitos de infraestructura. Cuando DeepSeek publicó sus resultados, las acciones de Nvidia cayeron un 17% en un solo día; los inversores de repente se preguntaron si los chips caros eran realmente esenciales para la IA avanzada.
Para las empresas, lo que está en juego no podría ser mayor. Las compañías están gastando millones en integrar la IA en sus operaciones, apostando a qué enfoque dominará. El modelo híbrido de Anthropic ofrece una vía intermedia convincente: la capacidad de ajustar el rendimiento de la IA en función de la tarea en cuestión, desde respuestas instantáneas de servicio al cliente hasta análisis financieros complejos. El sistema mantiene el precio anterior de Anthropic de 3 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida, incluso con funciones de razonamiento adicionales.

“Nuestros clientes intentan lograr resultados para sus clientes”, explicó Michael Gerstenhaber, director de plataforma de Anthropic. “Usar el mismo modelo y aplicarlo de diferentes maneras permite a alguien como Thompson Reuters realizar investigaciones legales y permite a nuestros socios de codificación como Cursor o GitHub desarrollar aplicaciones y cumplir esos objetivos”.
El enfoque híbrido de Anthropic representa tanto una evolución técnica como una apuesta estratégica. Mientras que OpenAI mantiene modelos separados para diferentes capacidades y DeepSeek se centra en la rentabilidad , Anthropic busca sistemas unificados que puedan gestionar tanto tareas rutinarias como razonamientos complejos. Es una filosofía que podría cambiar la forma en que las empresas implementan la IA, eliminando la necesidad de hacer malabarismos con varios modelos especializados.
Anthropic también presentó hoy Claude Code , una herramienta de línea de comandos que permite a los desarrolladores delegar tareas de ingeniería complejas directamente a la IA. El sistema requiere la aprobación humana antes de realizar cambios en el código, lo que refleja el creciente interés de la industria por el desarrollo responsable de la IA.

“De hecho, todavía hay que aceptar los cambios que hace Claude. Uno es un revisor que tiene las manos en el volante”, señaló Penn. “Básicamente, hay una especie de lista de verificación que hay que aceptar para que el modelo realice determinadas acciones”.
Los anuncios se producen en medio de una intensa competencia en el desarrollo de la IA. Los investigadores de Stanford crearon recientemente un modelo de razonamiento de código abierto por menos de 50 dólares, mientras que Microsoft acaba de integrar el modelo o3-mini de OpenAI en Azure. El éxito de DeepSeek también ha impulsado nuevos enfoques para el desarrollo de la IA, y algunas empresas están explorando técnicas de destilación de modelos que podrían reducir aún más los costos.

Penn ilustró el espectacular progreso en las capacidades de la IA con un ejemplo inesperado: “Le hemos pedido a diferentes versiones de Claude que jueguen Pokémon… Esta versión llegó hasta Ciudad Vermilion , capturó varios Pokémon e incluso se esforzó para subir de nivel. Tiene los Pokémon adecuados para luchar contra sus rivales”.
“Creo que seguiremos innovando y mejorando la calidad del razonamiento, avanzando hacia cosas como el razonamiento dinámico”, explicó Penn. “Siempre lo hemos considerado como una parte fundamental de la inteligencia, en lugar de algo separado”.
La verdadera prueba del enfoque de Anthropic vendrá de la adopción empresarial. Si bien jugar Pokémon puede parecer trivial, demuestra el tipo de inteligencia adaptativa que necesitan las empresas: una IA que pueda manejar tanto operaciones rutinarias como decisiones estratégicas complejas sin cambiar entre modelos especializados. Las versiones anteriores de Claude no podían navegar más allá de la ciudad inicial de un juego. La última versión crea estrategias, administra recursos y toma decisiones tácticas: capacidades que reflejan la complejidad de los desafíos comerciales del mundo real.
Para los clientes empresariales, esto podría significar la diferencia entre mantener múltiples sistemas de IA para distintas tareas e implementar una única solución más eficaz. Los próximos meses revelarán si la apuesta de Anthropic por el razonamiento unificado de IA transformará el mercado empresarial o se convertirá en otro experimento en la rápida evolución de la industria.
Si desea impresionar a su jefe, VB Daily lo tiene cubierto. Le brindamos información exclusiva sobre lo que las empresas están haciendo con la IA generativa, desde cambios regulatorios hasta implementaciones prácticas, para que pueda compartir información y obtener el máximo retorno de la inversión.
Lea nuestra Política de privacidad
Gracias por suscribirse. Vea más boletines de VB aquí .
Se produjo un error.

venturebeat