Cette série comprend quatre modèles de différentes tailles, dont le plus puissant, un modèle de 671 milliards de paramètres (MOE), se positionne comme l’une des intelligences artificielles open source les plus performantes.
Contrairement à d’autres systèmes, Cogito V2 se distingue par sa méthode d’apprentissage, intégrant ses propres processus de raisonnement grâce à une technique appelée distillation et amplification itérée (IDA), ce qui permet d’anticiper les résultats sans réaliser des recherches approfondies.
Cette approche améliore l’efficacité des chaînes de raisonnement, les rendant 60 % plus courtes par rapport à des concurrents.
De plus, Deep Cogito a su développer ses modèles avec un budget modeste, totalisant moins de 3,5 millions de dollars, bien en-dessous des coûts habituels en IA.
Significativement, le modèle phare excelle même dans le raisonnement image, une capacité émergente qu’il n’a pas été explicitement formé à maîtriser, laissant entrevoir des possibilités prometteuses pour l’avenir de l’IA multimodale.
L’équipe envisage de continuer à perfectionner l’auto-amélioration, tout en s’engageant à maintenir la nature open-source de ses développements.