El último buque insignia de inteligencia artificial de Anthropic podría no haber sido increíblemente costoso de entrenar

El modelo estrella de IA más nuevo de Anthropic, Claude 3.7 Sonnet, costó “unas decenas de millones de dólares” entrenarlo utilizando menos de 10^26 FLOP de potencia informática.
Así lo afirma el profesor de Wharton Ethan Mollick, que en un artículo publicado el lunes en X transmitió una aclaración que había recibido del departamento de relaciones públicas de Anthropic. “Anthropic se puso en contacto conmigo y me dijo que Sonnet 3.7 no se consideraría un modelo de 10^26 FLOP y que costaría unas decenas de millones de dólares”, escribió , “aunque los modelos futuros serán mucho más grandes”.
TechCrunch contactó a Anthropic para solicitar confirmación, pero no recibió respuesta hasta el momento de la publicación.
Suponiendo que el entrenamiento de Claude 3.7 Sonnet realmente costó solo "unas pocas decenas de millones de dólares", sin tener en cuenta los gastos relacionados, es una señal de lo relativamente barato que se está volviendo lanzar modelos de última generación. El predecesor de Claude 3.5 Sonnet, lanzado en el otoño de 2024, también costó unas pocas decenas de millones de dólares para entrenar , reveló el director ejecutivo de Anthropic, Dario Amodei, en un ensayo reciente.
Estos totales se comparan bastante favorablemente con los precios de entrenamiento de los mejores modelos de 2023. Para desarrollar su modelo GPT-4, OpenAI gastó más de 100 millones de dólares, según el director ejecutivo de OpenAI, Sam Altman. Mientras tanto, Google gastó cerca de 200 millones de dólares para entrenar su modelo Gemini Ultra, según un estudio de Stanford.
Dicho esto, Amodei espera que los futuros modelos de IA cuesten miles de millones de dólares . Ciertamente, los costos de capacitación no incluyen trabajos como las pruebas de seguridad y la investigación fundamental. Además, a medida que la industria de la IA adopte modelos de "razonamiento" que trabajen en problemas durante períodos prolongados de tiempo , los costos computacionales de ejecutar modelos probablemente seguirán aumentando.
techcrunch