Actuellement, les techniques de décodage autorégressif adoptées s’avèrent limitées en raison de leur caractère séquentiel, engendrant ainsi des délais notables.
Pour remédier à cette situation, des chercheurs du MIT et de Google ont proposé une méthode novatrice dénommée « Pâtes ».
Cette approche exploite l’apprentissage pour permettre aux modèles de reconnaître et de générer des segments de texte de manière parallèle.
Contrairement aux systèmes traditionnels qui reposent sur des règles rigides, cette technique permet aux modèles de maîtriser leur propre processus de décodage.
Les résultats montrent une amélioration significative des temps de réponse, atteignant jusqu’à deux fois la rapidité antérieure, tout en maintenant un niveau de qualité comparable.
L’essence de cette innovation réside dans l’utilisation d’un langage d’annotation, lequel permet aux modèles d’identifier les sections pouvant être traitées simultanément, optimisant ainsi les ressources disponibles et promettant des applications plus vastes.
Source: IA Tech news