Cette méthode révolutionne la manière dont les systèmes d’intelligence artificielle interprètent les images en les adaptant en fonction du contexte de classification, contrastant ainsi avec les approches traditionnelles qui se basent sur des catégories fixes.
Grâce à OAK, une même image peut être analysée différemment selon les objectifs ou les circonstances, offrant ainsi une flexibilité inédite.
Par exemple, une image d’individu en train de boire peut être classée selon l’activité effectuée, le cadre ou l’émotion ressentie.
L’approche OAK utilise à la fois des données marquées et non marquées, en intégrant des jetons contextuels qui influencent le traitement des images.
Ce modèle d’IA, inspiré du système CLIP d’OpenAI, a prouvé sa capacité à reconnaître de nouvelles catégories d’objets, comme des chapeaux ou des sacs, lors de ventes de garage, même sans disposer d’exemples préalables.
Les chercheurs ont soumis OAK à des ensembles de données d’images et ont constaté des résultats prometteurs, avec une précision accrue dans la détection de concepts par rapport aux techniques actuelles.
Cette avancée pourrait ouvrir la voie à diverses applications, notamment dans le domaine de la robotique, où une perception contextuelle est essentielle.
Source: IA Tech news