Multimédia

Avec les modèles o1, les IA d'OpenAI passent leur doctorat en physique, chimie, biologie et programmation

OpenAI bouleverse le monde de l'intelligence artificielle avec sa nouvelle série de modèles o1. Ces IA, conçues pour « réfléchir » avant d'agir, promettent des avancées majeures dans la résolution de problèmes complexes. Une révolution qui soulève autant d'espoirs que de questions sur notre avenir avec les machines pensantes. Présentation.

Les IA, comme ChatGPT, fonctionnent sur le principe des modèles de langage, entraînés sur d'immenses quantités de textes. Elles apprennent les structures du langage, les faits et les concepts, pour ensuite générer du texte cohérent en réponse à des questions ou des instructions. Jusqu'à présent, ces modèles étaient conçus pour réagir rapidement, générant un mot après l'autre, privilégiant la vitesse à la réflexion approfondie. Ils excellaient dans les tâches simples mais peinaient souvent face à des problèmes complexes nécessitant un raisonnement élaboré, requérant la capacité à corriger ses erreurs et demandant l'élaboration de plans.

Le temps de la réflexion

Les nouveaux modèles OpenAI o1 sont en totale rupture avec cette approche de réponse instantanée. Ils ont été conçus pour imiter le processus de réflexion humain, prenant le temps d'analyser et de peser chaque aspect d'un problème avant de formuler une réponse. Cette méthode peut être comparée à un joueur d'échecs qui, au lieu de jouer le premier coup qui lui vient à l'esprit, examine attentivement l'échiquier, envisage différentes stratégies et anticipe les conséquences de chaque mouvement, quitte à revoir son plan au milieu de l'attaque. Les modèles o1 ont été entraînés à affiner leur processus de réflexion, à essayer diverses approches et à reconnaître leurs erreurs. Les capacités de raisonnement améliorées des modèles OpenAI o1 se manifestent de manière spectaculaire dans divers domaines. Par exemple, lors d'un examen de qualification pour l'Olympiade internationale de mathématiques, là où le modèle GPT-4 ne résolvait correctement que 13 % des problèmes, le nouveau modèle o1 a atteint un impressionnant score de 83 %. Dans le domaine de la programmation, ces IA ont démontré des compétences plaçant leurs performances dans le 89e centile des compétitions Codeforces, surpassant ainsi de nombreux programmeurs humains. Ces résultats illustrent comment la capacité à « réfléchir » plus longuement permet à ces modèles de résoudre des problèmes complexes qui auraient auparavant nécessité l'intervention d'experts humains qualifiés.

Des applications nouvelles

L'avènement des modèles OpenAI o1 promet de révolutionner de nombreux domaines scientifiques et techniques. Dans le secteur de la santé, ces IA pourraient assister les chercheurs en annotant des données de séquençage cellulaire, accélérant ainsi la compréhension de maladies complexes. Les physiciens pourraient bénéficier de leur aide pour générer des formules mathématiques intriquées, essentielles en optique quantique. Pour les développeurs, ces modèles offrent un potentiel immense, capable de construire et d'exécuter des workflows multi-étapes sophistiqués. OpenAI a mis en place une nouvelle approche d'entraînement à la sécurité, exploitant les capacités de raisonnement de ces modèles pour mieux appliquer les directives d'alignement et de sécurité. Les tests montrent une amélioration significative : sur une échelle de 0 à 100 évaluant la résistance aux tentatives de contournement des règles de sécurité, le modèle o1-preview a obtenu un score de 84, largement supérieur au 22 de GPT-4. La firme américaine semble avoir conscience des questions cruciales que soulèvent ces nouveaux modèles. L'entreprise a également formalisé des accords avec les instituts de sécurité de l'intelligence artificielle aux États-Unis et au Royaume-Uni, leur accordant un accès anticipé à une version de recherche. Les rapports qui se noueront désormais entre l'homme et la machine, lorsque celle-ci atteint un tel niveau de compétence, sont encore flous et suscitent des inquiétudes justifiées. Quoi qu'il en soit, la version « preview » des modèles est d'ores et déjà disponible pour les utilisateurs de ChatGPT Pro (20 €/mois), à raison de 30 requêtes par semaine, ainsi que pour les développeurs via l'API.

City Presse
Multimédia

Avatar Frontiers of Pandora D'entre les cendres : l'extension qui ressuscite le ...

Deux ans après la sortie d'Avatar Frontiers of Pandora, et pile à l'heure pour profiter du succès colossal du dernier opus cinématographique, Ubisoft et Massive Entertainment proposent D'entre les cendres, une extension qui corrig...
Lire la suite
Avatar Frontiers of Pandora D'entre les cendres : l'extension qui ressuscite le jeu d'Ubisoft
Multimédia

Samsung Galaxy Z TriFold, le smartphone qui se plie en trois

Samsung lance le Galaxy Z TriFold, premier smartphone à trois volets du constructeur coréen. Un concentré de technologie qui se déplie en tablette de 10 pouces.
Lire la suite
Samsung Galaxy Z TriFold, le smartphone qui se plie en trois
Multimédia

Les jeux les plus attendus de 2026, des étoiles filantes et un trou noir

L'industrie du jeu vidéo s'apprête à vivre une année historique. De Resident Evil Requiem à GTA 6, le calendrier 2026 s'annonce exceptionnel sur toutes les plateformes.
Lire la suite
Les jeux les plus attendus de 2026, des étoiles filantes et un trou noir