Plutôt que de recourir aux méthodes d’enseignement direct habituelles, l’équipe a opté pour l’apprentissage par renforcement.
Ce processus permet au modèle d’apprendre à travers une série d’expérimentations et d’erreurs, où il reçoit des récompenses pour les solutions correctes qu’il propose.
Ainsi, R1 a pu développer des aptitudes avancées, telles que la vérification de ses propres réponses et l’élaboration de stratégies efficaces pour la résolution de problèmes.
Les résultats obtenus grâce à cette approche novatrice sont remarquables : lors de l’American Invitational Mathematics Examination 2024, R1 a atteint un taux de précision de 86,7 %, surpassant les performances de modèles qui avaient été formés sous la supervision humaine.
Néanmoins, les chercheurs reconnaissent certaines limitations, comme des malentendus linguistiques et une tendance à complexifier des problèmes simples.
Malgré ces défis, ils demeurent optimistes quant au potentiel de ces avancées en matière de raisonnement des intelligences artificielles, ouvrant ainsi la voie vers des systèmes encore plus performants et autonomes.
L’article « L’IA capable d’apprendre à résoudre des problèmes sans intervention humaine » a été publié en premier sur IA Tech News, où vous pouvez vous tenir informé des dernières évolutions dans le secteur de la technologie et de l’intelligence artificielle.
Source: IA Tech news