La nouvelle version de ChatGPT déçoit et met un terme au rêve de l'IA surhumaine promise.

Comme si Steve Jobs annonçait l'iPhone en 2007, Sam Altman a présenté hier la nouvelle pomme de ses yeux : GPT-5, la dernière mise à jour de ChatGPT . En gros, c'est une version plus intelligente, plus rapide et plus rationnelle que ses prédécesseurs. Mais c'est précisément là l'essentiel. Ce n'est pas l' intelligence artificielle générale (IAG) recherchée par Altman, ni même supérieure, par exemple, au meilleur programmeur du monde.
Cela a déçu tous les experts en IA qui, attendant avec impatience les annonces de la semaine dernière, avaient vu Altman créer le buzz en tweetant des choses comme une Étoile de la Mort, insinuant que GPT-5 allait « anéantir » tous les autres systèmes d'IA du marché. Ce ne fut pas le cas, et cela rappelait aussi le fiasco du lancement d' Apple Intelligence , comparé aux promesses faites lors de son annonce lors de la WWDC 2024.
Matt Shumer, expert en IA et propriétaire d'OthersideAI, a pu accéder à GPT-5 il y a quelques semaines et explique à ABC que, bien qu'il s'agisse du meilleur modèle global jusqu'à présent, « il faut faire beaucoup d'efforts pour en tirer le meilleur parti », quelque chose que l'utilisateur moyen n'est pas capable de faire pour le moment, il ne remarquera donc pas beaucoup de différence avec le GPT-4.5 qu'il a utilisé jusqu'à présent.
« GPT-5 est très minutieux et vise à être optimal dans les contextes longs, car il y commet moins d'erreurs stupides. Nous avons constaté qu'il s'agit d'une IA idéale, voire la meilleure, pour la programmation », note Shumer. D'ailleurs, Altman a souligné lors de la présentation du nouveau modèle qu'il s'agissait de « l'assistant idéal pour un programmeur ».

Dans le benchmark SWE-bench Verified, qui se concentre sur des tâches GitHub réelles, GPT-5 atteint un taux de réussite de 74,9 % dès le premier essai. Aucune autre solution n'a jamais atteint ce niveau. Selon l'entreprise dirigée par Sam Altman, il surpasse Claude Opus 4.1 (74,5 %) et Gemini 2.5 Pro (59,6 %). Il permet de créer des sites web de A à Z avec seulement quelques instructions, de concevoir des applications, des jeux interactifs ou de déboguer du code dans de grands dépôts sans perte de précision. Non seulement il exécute, mais il explique également ce qu'il fait et pourquoi.
D'autre part, GPT-5 ne se contente pas d'améliorer l'interface : il transforme également notre façon d'interagir avec lui. Avec son arrivée, ChatGPT intègre quatre nouvelles personnalités : Cynique, Robot, Auditeur et Nerd. Chacune réagit avec son propre style, adaptant son ton, son attitude et son approche sans instructions. Il permet également de changer la couleur de la conversation avec l'IA, bien que cette option ne soit disponible que pour les utilisateurs disposant d'un compte payant. Tout porte à croire que la collaboration d'OpenAI avec Jony Ive, ancien designer chez Apple, a influencé les nouvelles fonctionnalités de GPT-5.
Cependant, il semble que GPT-o3 reste la meilleure option pour la recherche scientifique, tandis que GPT-4.5 est le modèle idéal pour l'écriture. Bonne nouvelle : depuis hier, GPT-5 est disponible gratuitement pour tous les utilisateurs de ChatGPT à partir d'aujourd'hui. Les utilisateurs gratuits auront accès à GPT-5 et à une version plus rapide mais moins précise, GPT-5 mini. C'est la première fois qu'un modèle de raisonnement avancé est disponible sans abonnement.
Bien qu'il y ait des raisons d'être enthousiaste à propos de GPT-5 (le modèle abandonne la subdivision des versions pour devenir un modèle unique qui décide en temps réel de la priorité à donner au raisonnement ou à la vitesse), le bond en avant n'est pas aussi important que prévu. Deux des premiers testeurs du nouveau modèle ont déclaré à Reuters qu'ils étaient également impressionnés par sa capacité à programmer et à résoudre des problèmes scientifiques et mathématiques, mais ils estiment que le bond de GPT-4 à GPT-5 n'est pas aussi important que celui de GPT-3 à GPT-4. « On est loin de cette idée d'intelligence quasi humaine que certains, à l'intérieur comme à l'extérieur d'OpenAI, évoquent depuis des années », soulignent-ils. Chez ABC, nous avons effectué quelques tests et, comme le soulignent les experts, le modèle échoue dès qu'on lui pose des questions très basiques, comme celle de savoir si GPT-5 existe déjà ou quel est le cinquième mot de sa réponse.

Le développement de GPT-5 n'a pas non plus été simple. Altman a publiquement reconnu que le lancement avait dû être retardé de plusieurs mois, faute d'intégration de tous les composants du modèle. Il a également déclaré qu'ils souhaitaient s'assurer de disposer de capacités suffisantes pour répondre à une demande « sans précédent ». Mais ces retards étaient plus importants. D'une part, OpenAI était confronté à un problème de données : il n'existait plus beaucoup de sources nouvelles, volumineuses et fiables pour entraîner ce type de modèles.
Ilya Sutskever, ancien directeur scientifique de l'entreprise, l'a expliqué ainsi : « Nous pouvons évoluer en puissance, mais pas en données. » Un autre problème était que les « cycles d'entraînement » pour les grands modèles étaient plus sujets aux problèmes matériels compte tenu de la complexité du système, et les chercheurs pouvaient ne pas connaître les performances finales des modèles avant la fin de l'exécution, ce qui pouvait prendre des mois.
ABC.es