Les techniques utilisées actuellement, telles que le décodage autorégressif, posent des problèmes de délais en raison de leur fonctionnement séquentiel.
Pour remédier à cette situation, des chercheurs du MIT et de Google ont développé une méthode novatrice appelée « Pâtes ».
Cette approche repose sur l’apprentissage pour identifier et générer des segments de texte en parallèle.
Contrairement aux systèmes traditionnels basés sur des règles rigides, cette technique permet aux modèles d’apprendre à gérer leur décodage de manière autonome, ce qui améliore les temps de réponse sans sacrifier la qualité.
Les résultats obtenus montrent une diminution significative des délais, avec des vitesses pouvant atteindre le double de celle des méthodes auparavant utilisées, tout en maintenant des standards de qualité similaires.
Grâce à un langage d’annotation spécifique, les modèles peuvent signaler les parties du texte à traiter simultanément, optimisant ainsi leur efficacité et élargissant leurs applications possibles.
Source: IA Tech news