Google et Facebook AI font une nouvelle découverte linguistique

L’IA avait l’habitude de comprendre les phénomènes émergents du langage naturel

geralt/pixabay

Source: geralt / pixabay

À la croisée intellectuelle des sciences et des sciences humaines se trouve la linguistique, l’étude scientifique du langage. La structure de la linguistique touche les disciplines de la psychologie, des neurosciences, de la biologie et de la philosophie. La langue est l’une des caractéristiques déterminantes les plus fondamentales de l’être humain. Pourtant, son origine demeure un mystère scientifique non seulement pour les linguistes, mais aussi pour les psychologues, les neuroscientifiques, les anthropologues, les biologistes et les archéologues. Comment le langage humain a-t-il émergé et évolué? Le défi de résoudre ce mystère est en grande partie dû au manque de preuves empiriques. L’autre obstacle est le temps – il pourrait prendre de nombreuses années, voire des siècles, pour observer et comprendre les schémas d’émergence et d’évolution du langage naturel. Des chercheurs de Google AI, Facebook et de l’Université de New York ont ​​récemment déployé l’apprentissage approfondi de l’IA pour simuler et comprendre les phénomènes émergents du langage et ont publié leurs résultats dans arXiv en janvier 2019.

Les équipes de recherche de Laura Graesser, Kyunghyun Cho et Douwe Kiela ont utilisé les dernières techniques en matière d’intelligence artificielle (IA) pour créer un cadre informatique «dans lequel des agents dotés de capacités de communication jouent simultanément une série de jeux de référence Selon l’équipe, il s’agit d’un nouveau cadre car ils ont utilisé l’apprentissage par renforcement en profondeur de dernière génération permettant de traiter une entrée sensorielle riche.

La structure informatique multi-agents utilise des réseaux de neurones pouvant échanger des messages sur leurs entrées perceptuelles. Les composants du modèle informatique multi-agents sont constitués des agents, de l’algorithme d’apprentissage, de l’environnement et du mécanisme de récompense. L’agent utilisé allait du simple au complexe et comprenait des équations aux différences, une «architecture de type CPU avec un jeu d’instructions et des registres», une «matrice de co-occurrence entre objets et symboles», un réseau de neurones à une seule couche et un réseau de neurones profonds. L’algorithme d’apprentissage utilisé était soit une optimisation basée sur un gradient, soit une variante des algorithmes évolutifs.

Les chercheurs ont constaté que «les taux de réussite entre le jeu personnel et le jeu à deux sont indiscernables, ce qui implique fortement qu’une langue commune et partagée émerge comme une convention sociale si et seulement si nous avons plus de deux utilisateurs de langue.» “Ce qui est nécessaire pour qu’un langage commun puisse émerger, c’est un nombre minimum d’agents.”

L’équipe a ensuite effectué des simulations au niveau de la communauté. Ils voulaient comprendre ce qui se passerait si deux communautés différentes de langues différentes entraient en contact. L’équipe a découvert que la connectivité inter et intra-groupe était un facteur important dans la détermination du niveau de convergence des langues. Avec suffisamment de connectivité entre les groupes, les langues deviennent mutuellement compréhensibles par contact, que les agents aient été exposés ou non à l’autre langue.

L’équipe a appris qu’avec le contact linguistique au fil du temps, le protocole de la majorité dominante prend le dessus et l’autre langue disparaît. Si les communautés sont équilibrées, un nouveau protocole «créole» plus simple que les langues d’origine apparaît. Les langues voisines sont plus compréhensibles mutuellement et la communicabilité diminue à mesure que la distance entre les communautés augmente. Les chercheurs ont découvert que «les propriétés complexes de l’évolution d’une langue ne doivent pas nécessairement dépendre de capacités linguistiques évoluées complexes, mais peuvent émerger de simples échanges sociaux entre des agents dotés de capacités perceptuelles jouant à des jeux de communication.

Les scientifiques disposent maintenant d’un outil sophistiqué pour étudier l’évolution et les caractéristiques émergentes du langage naturel. Les résultats de la recherche pourraient potentiellement avoir un impact sur les théories sur l’origine du langage et permettre de mieux comprendre l’une des caractéristiques déterminantes qui rendent l’être humain unique.

Copyright © 2019 Cami Rosso Tous droits réservés.

Références

Graesser, Laura, Cho, Kyunghyun, Kiela, Douwe. «Phénomènes linguistiques émergents dans les jeux de communication multi-agents». ArXiv . 25 janvier 2019.