Grâce à leur méthode de formation appelée distillation et amplification itérée (IDA), Deep Cogito affirme que leurs modèles surpassent les modèles existants en utilisant des techniques d’amplification et de distillation pour améliorer les capacités des modèles.
Cette approche permet à la superintelligence de se développer plus directement, sans être restreinte par les limites des superviseurs.
Les modèles de Deep Cogito, basés sur les points de contrôle LLAMA et QWEN, sont conçus pour le codage, les appels de fonction et les cas d’utilisation d’agent.
Ils offrent une double fonctionnalité permettant une réponse directe ou une auto-réflexion avant de répondre.
Ces modèles ont montré des améliorations significatives par rapport à leurs homologues dans différentes mesures de performance, démontrant ainsi leur potentiel pour des applications pratiques de la superintelligence générale.
Deep Cogito prévoit de continuer à développer des modèles encore plus grands dans les prochaines semaines, tous étant open-source.