OpenAI bouleverse le monde de l'intelligence artificielle avec sa nouvelle série de modèles o1. Ces IA, conçues pour « réfléchir » avant d'agir, promettent des avancées majeures dans la résolution de problèmes complexes. Une révolution qui soulève autant d'espoirs que de questions sur notre avenir avec les machines pensantes. Présentation.
Les IA, comme ChatGPT, fonctionnent sur le principe des modèles de langage, entraînés sur d'immenses quantités de textes. Elles apprennent les structures du langage, les faits et les concepts, pour ensuite générer du texte cohérent en réponse à des questions ou des instructions. Jusqu'à présent, ces modèles étaient conçus pour réagir rapidement, générant un mot après l'autre, privilégiant la vitesse à la réflexion approfondie. Ils excellaient dans les tâches simples mais peinaient souvent face à des problèmes complexes nécessitant un raisonnement élaboré, requérant la capacité à corriger ses erreurs et demandant l'élaboration de plans.
Le temps de la réflexion
Les nouveaux modèles OpenAI o1 sont en totale rupture avec cette approche de réponse instantanée. Ils ont été conçus pour imiter le processus de réflexion humain, prenant le temps d'analyser et de peser chaque aspect d'un problème avant de formuler une réponse. Cette méthode peut être comparée à un joueur d'échecs qui, au lieu de jouer le premier coup qui lui vient à l'esprit, examine attentivement l'échiquier, envisage différentes stratégies et anticipe les conséquences de chaque mouvement, quitte à revoir son plan au milieu de l'attaque. Les modèles o1 ont été entraînés à affiner leur processus de réflexion, à essayer diverses approches et à reconnaître leurs erreurs. Les capacités de raisonnement améliorées des modèles OpenAI o1 se manifestent de manière spectaculaire dans divers domaines. Par exemple, lors d'un examen de qualification pour l'Olympiade internationale de mathématiques, là où le modèle GPT-4 ne résolvait correctement que 13 % des problèmes, le nouveau modèle o1 a atteint un impressionnant score de 83 %. Dans le domaine de la programmation, ces IA ont démontré des compétences plaçant leurs performances dans le 89e centile des compétitions Codeforces, surpassant ainsi de nombreux programmeurs humains. Ces résultats illustrent comment la capacité à « réfléchir » plus longuement permet à ces modèles de résoudre des problèmes complexes qui auraient auparavant nécessité l'intervention d'experts humains qualifiés.
Des applications nouvelles
L'avènement des modèles OpenAI o1 promet de révolutionner de nombreux domaines scientifiques et techniques. Dans le secteur de la santé, ces IA pourraient assister les chercheurs en annotant des données de séquençage cellulaire, accélérant ainsi la compréhension de maladies complexes. Les physiciens pourraient bénéficier de leur aide pour générer des formules mathématiques intriquées, essentielles en optique quantique. Pour les développeurs, ces modèles offrent un potentiel immense, capable de construire et d'exécuter des workflows multi-étapes sophistiqués. OpenAI a mis en place une nouvelle approche d'entraînement à la sécurité, exploitant les capacités de raisonnement de ces modèles pour mieux appliquer les directives d'alignement et de sécurité. Les tests montrent une amélioration significative : sur une échelle de 0 à 100 évaluant la résistance aux tentatives de contournement des règles de sécurité, le modèle o1-preview a obtenu un score de 84, largement supérieur au 22 de GPT-4. La firme américaine semble avoir conscience des questions cruciales que soulèvent ces nouveaux modèles. L'entreprise a également formalisé des accords avec les instituts de sécurité de l'intelligence artificielle aux États-Unis et au Royaume-Uni, leur accordant un accès anticipé à une version de recherche. Les rapports qui se noueront désormais entre l'homme et la machine, lorsque celle-ci atteint un tel niveau de compétence, sont encore flous et suscitent des inquiétudes justifiées. Quoi qu'il en soit, la version « preview » des modèles est d'ores et déjà disponible pour les utilisateurs de ChatGPT Pro (20 €/mois), à raison de 30 requêtes par semaine, ainsi que pour les développeurs via l'API.