Ces modèles, allant de 0,5 à 7 milliards de paramètres, sont optimisés pour différents environnements, allant des dispositifs peu puissants aux systèmes de production.
Ils héritent des caractéristiques de performance de leur modèle Hunyuan-A13B plus puissant et se distinguent par leur capacité à gérer des textes longs grâce à une fenêtre de contexte de 256k, essentielle pour des applications comme l’analyse de documents complexes et la génération de contenu.
Les Hunyuan AI sont également efficaces en matière d’inférence, utilisant des techniques avancées comme l’attention de requête groupée pour améliorer la vitesse de traitement.
Tencent a développé un outil de compression, Angleslim, permettant une quantification efficace à travers deux méthodes : la quantification FP8 et INT4, garantissant une légère dégradation des performances tout en optimisant la vitesse.
Les modèles Hunyuan ont obtenu de bonnes performances sur des benchmarks, montrant leurs capacités solides dans des tâches variées tout en étant facilement intégrables dans des frameworks établis, renforçant ainsi leur position sur le marché de l’IA open-source.