Cette technique utilise un tokenizer unidimensionnel capable de convertir des images en séquences de nombres compressées, ce qui facilite la manipulation d’images.
Contrairement aux approches classiques qui nécessitent d’entraîner des modèles sur des milliers d’images, cette nouvelle méthode permet de générer des visuels originaux et d’éditer des visuels existants à l’aide d’un décodeur nourri par un réseau neuronal.
Cette avancée a le potentiel de révolutionner le secteur de la génération d’images en diminuant de manière significative les coûts de calcul liés à la création d’images complexes.
Les retombées de ces découvertes ne se limitent pas à la vision par ordinateur, puisque des applications pourraient également émerger dans d’autres domaines, comme la robotique.
Par ailleurs, les chercheurs s’intéressent à la compression extrême des données, ce qui ouvrirait des perspectives innovantes pour une variété de secteurs.
L’article intitulé « Les jetons et les décodeurs facilitent l’édition et la désillusion sans l’utilisation de générateurs » a été publié en premier sur IA Tech News, une plateforme dédiée à l’actualité technologique et aux avancées en intelligence artificielle.
Source: IA Tech news