Ce système intègre des éléments de communication tels que des expressions d’écoute active, appelées « Aizuchi », afin de favoriser une interaction plus fluide avec des opérateurs humains, notamment dans des environnements comme l’Aquarium Nifrel d’Osaka.
Grâce à une impressionnante base de données de 67 000 heures d’audio provenant de diverses sources, J-Moshi s’est rapidement imposé parmi les locuteurs japonais pour sa capacité à adopter des styles de conversation naturels.
Néanmoins, des défis demeurent, tels que le manque de données vocales adéquates et la gestion de situations sociales complexes.
Les chercheurs s’efforcent de trouver des solutions pour renforcer la coopération entre l’intelligence artificielle et les humains, en élaborant des systèmes permettant aux opérateurs d’intervenir dès que l’IA atteint ses limites.
Malgré ses progrès significatifs, J-Moshi requiert encore un soutien humain dans bon nombre de scénarios pratiques.
L’équipe de Higashinaka vise à développer des technologies susceptibles de transformer le paysage des interactions humaines-robots, en favorisant des échanges plus naturels et des réponses gestuelles coordonnées.
Source: IA Tech news