Actuellement, les méthodes comme le décodage autorégressif présentent des limitations en raison de leur mode de fonctionnement séquentiel, ce qui engendre des délais.
Pour remédier à cette situation, des chercheurs du MIT et de Google ont introduit une approche novatrice appelée « Pâtes », qui permet d’optimiser le processus de génération et de compréhension de texte en apprenant à reconnaître et à traiter des segments de manière parallèle.
Cette nouvelle méthode diffère des approches classiques fondées sur des règles rigides, car elle permet aux modèles de développer leur propre stratégie de décodage.
Comme résultat, la rapidité des réponses s’améliore sans sacrifier la qualité du contenu.
Les recherches ont montré que cette technique peut réduire les temps d’attente de manière significative, atteignant des renforcements de jusqu’à deux fois la vitesse habituelle, tout en conservant des standards de qualité élevés.
L’innovation se situe également dans l’intégration d’un langage d’annotation qui aide les modèles à identifier les sections susceptibles d’être traitées simultanément, ce qui optimise l’emploi des ressources disponibles.
Ces avancées pourraient rendre les modèles plus accessibles et efficaces, ouvrant ainsi de nouvelles perspectives d’utilisation.
Source: IA Tech news