Sam Altman, directeur général d'OpenAI, avait présenté GPT-5 comme un modèle avancé depuis des mois. Il affirmait qu'il s'agissait d'un modèle plus intelligent, plus rapide et capable de raisonner comme un doctorat. L'entreprise a présenté ce lancement comme une avancée majeure pour ChatGPT, destinée à améliorer l'intelligence du codage, du raisonnement et de la précision.
Mais les premières réactions dressent un tableau plus flou . Les développeurs ont salué la capacité du modèle à comprendre des invites complexes et à produire un code bien structuré. Le premier testeur, Simon Willison, a décrit GPT-5 comme « compétent » et « parfois impressionnant », sans toutefois constituer une avancée majeure par rapport à GPT-4. D'autres ont été moins impressionnés.
Plusieurs publications sur les réseaux sociaux se sont rapidement transformées en plaintes concernant de nombreuses erreurs factuelles, de faibles compétences en mathématiques et, dans certains cas, même des fautes d'orthographe élémentaires. Noah Giansiracusa, professeur de mathématiques à l'université Bentley, a qualifié la publication de « décevante », notant que les mises à jour en question semblaient « plus marginales que je ne l'aurais espéré ».
Une partie de la confusion était due à l'architecture du modèle. GPT-5 incluait un « autoswitcher » pour les différentes tailles de modèle , en fonction de sa tâche. Cela permettait d'économiser du temps de traitement et d'éviter de toujours accéder à l'intégralité de GPT-5, ce qui trompait de nombreuses personnes. Après avoir répondu incorrectement à une question, l'agent avec lequel il travaillait lui demandait de « réfléchir davantage » au nombre de lettres « b » dans Blueberry. Suite à ce retour, il obtenait la bonne réponse lorsqu'on lui demandait.
Les utilisateurs réagissent et OpenAI répond
La frustration pourrait se propager sur Reddit et X d'ici vendredi. Si certains utilisateurs ont détesté ne pas savoir de qui, ni même de quel modèle, provenait le texte, beaucoup ont eu l'impression que l'enfer n'était qu'une inférence et que GPT5 avait remplacé leurs anciens favoris. Certains ont déclaré que la qualité avait été affectée, que l'écriture n'était pas aussi bonne que celle de GPT-4.5 , ce qui, selon vous, devrait l'être, et que certains aspects créatifs et techniques semblaient moins bons.
Cette discussion a conduit le PDG d'OpenAI à participer à une discussion Reddit « Ask Me Anything » pour répondre aux critiques. Il a expliqué qu'un bug dans le commutateur automatique avait empêché GPT-5 d'exploiter pleinement son potentiel dès le premier jour. Il a promis une plus grande transparence concernant les futures transitions de modèles : « À partir d'aujourd'hui, GPT-5 devrait paraître de plus en plus intelligent. » OpenAI a également promis de redéployer des modèles antérieurs, comme GPT-4o, pour ceux qui en auraient exprimé la préférence, afin d'apaiser les critiques les plus virulentes.
La nécessité d'agir aussi rapidement souligne l'ampleur des enjeux. Aujourd'hui, OpenAI est engagé dans une course effrénée avec des concurrents comme Anthropic, Google DeepMind et même xAI d'Elon Musk. Face à cette concurrence, un petit faux pas, et bientôt votre concurrent vous devance.
La concurrence s'intensifie dans la course à l'IA
Malgré ces différences, l'accueil réservé à GPT-5 a été mitigé, ce qui ne l'a pas empêché de se hisser en tête de LMArena, un classement utilisateur pour les modèles d'entraînement. Bien qu'il ne soit pas ce que l'on pourrait qualifier aujourd'hui de programmable, il était extrêmement rapide et expressif, prenant en charge des requêtes volumineuses et complexes. Cependant, d'autres benchmarks ont révélé un environnement problématique différent et plus complexe. Grok 4, développé par xAI par Musk, a obtenu un score si élevé à ARC-AGI-2 (un ensemble de tests de raisonnement avancé) qu'il a constitué un défi majeur à la suprématie d'OpenAI.
Certains analystes du secteur estiment qu'il faudra au moins un jour avant que les effets de GPT-5 soient pleinement compris, à l'instar des précédentes avancées de l'entreprise, comme GPT-3. GPT-5 et GPT-4 ont suscité de vives réactions négatives avant même de bénéficier d'améliorations dans les mises à jour et d'autres cas d'utilisation. Le modèle a le potentiel de réussir (ou d'échouer) selon son utilité pour le quotidien des utilisateurs, et ChatGPT compte près de 700 millions d'utilisateurs hebdomadaires dans le monde.
Selon Ethan Mollick, professeur à Wharton : « GPT-5 fait des choses, parfois étonnantes, parfois déroutantes, tout seul. C’est ce qui le rend si fascinant. Qualifier d’« intéressant » ce domaine de la santé publique reste une approche technocratique et un peu inquiétante. »
Si vous lisez ceci, vous êtes déjà en avance. Restez informés grâce à notre newsletter .