Même une petite quantité d’exemples mal identifiés peut sérieusement compromettre l’efficacité des SVM, ces systèmes reposant sur des données clés pour prendre des décisions.
Pour s’attaquer à ce problème, une équipe de chercheurs de la Florida Atlantic University a conçu une approche novatrice permettant d’identifier et de retirer automatiquement les étiquettes erronées avant l’entraînement des modèles, ce qui contribue à améliorer la précision des résultats.
En utilisant une méthode mathématique appelée analyse des composants principaux avec la norme L1, cette technique détecte les anomalies sans besoin d’intervention humaine.
Les résultats obtenus sur divers ensembles de données ont révélé des augmentations notables dans la précision de la classification, même lorsque les données d’origine semblaient correctes.
Cette avancée offre un potentiel encourageant pour des applications critiques en santé et en finance, où des erreurs peuvent entraîner des conséquences graves.
En se concentrant sur l’amélioration de la qualité des données dès le départ, les chercheurs aspirent à rendre l’IA plus fiable et éthique.
Source: IA Tech news