Présenté lors de la conférence CVPR à Nashville, cet ensemble se compose de 40 087 scènes de la vie quotidienne générées par une intelligence artificielle, qui applique automatiquement des annotations en 3D.
Cette méthode a permis d’obtenir des résultats nettement supérieurs à ceux des ensembles précédents, affichant une précision de mise à la terre de 38 % et réduisant les erreurs à 6,67 %.
L’innovation majeure de ce projet réside dans l’utilisation de données synthétiques, ce qui rend le processus d’annotation à la fois rapide et économique.
Un modèle d’intelligence artificielle a été chargé de décrire chaque objet présent dans les scènes, suivi d’une vérification humaine qui a confirmé un taux d’erreur remarquablement faible, comparable aux annotations réalisées par des professionnels.
Cette avancée pourrait profondément transformer la manière dont les robots appréhendent leur environnement, améliorant ainsi leurs interactions avec les humains dans un univers 3D riche et complexe.
Les prochaines étapes incluront des évaluations pratiques sur des robots pour tester leur capacité à interpréter et à se déplacer dans ces espaces tridimensionnels.
Source: IA Tech news