5-Max en réponse à Deepseek, un modèle de mélange d’Experts (MOE).
Ce nouveau modèle prometteur a été entraîné sur plus de 20 billions de jetons et bénéficie de techniques avancées telles que le réglage fin supervisé et l’apprentissage du renforcement de la rétroaction humaine.
Alibaba offre maintenant aux développeurs et chercheurs la possibilité d’explorer Qwen 2.5-Max via Alibaba Cloud et QWEN Chat, avec des performances supérieures à plusieurs modèles d’IA bien connus.
La comparaison des performances de Qwen 2.5-Max avec d’autres modèles d’IA montre des résultats prometteurs, notamment en surpassant Deepseek V3 dans plusieurs domaines.
Alibaba souligne les avantages de Qwen 2.5-Max par rapport à d’autres modèles tels que GPT-4O et Claude-3.5-Sonnet.
Le modèle est désormais accessible via l’API Alibaba Cloud et intégré à la plate-forme de chat QWEN pour une interaction directe, ce qui devrait faciliter son utilisation et son intégration pour les développeurs.
En continuant à repousser les limites de l’apprentissage du renforcement, Alibaba vise à améliorer encore les capacités de raisonnement de ses modèles, ouvrant ainsi la voie à des avancées significatives dans le domaine de l’IA.