Le talon d’Achille de AI Computer Vision

Le problème contraignant de l’IA et des neurosciences.

pixabay

Source: pixabay

Conduiriez-vous dans un véhicule autonome si vous saviez qu’il est sujet à des problèmes de vision? Que diriez-vous de suivre un traitement contre le cancer basé sur une interprétation informatique d’images radiologiques telles qu’une radiographie, une échographie, une tomodensitométrie, une TEP ou une IRM, sachant que la vision par ordinateur pourrait facilement être trompée? La vision par ordinateur pose un problème: il suffit de légères modifications dans la saisie des données pour tromper les algorithmes d’apprentissage automatique en leur permettant de «voir» ce qui ne va pas.

Les progrès récents de la vision par ordinateur sont en grande partie dus aux capacités améliorées de reconnaissance des formes obtenues grâce à l’apprentissage en profondeur, un type d’apprentissage basé sur la machine. L’apprentissage automatique est un sous-ensemble de l’intelligence artificielle dans le cadre duquel un ordinateur est capable d’apprendre des concepts à partir du traitement de données d’entrée, soit par apprentissage supervisé lorsque les données d’apprentissage sont étiquetées, soit par apprentissage non supervisé ou par une combinaison sans programmation explicite. La profondeur de l’apprentissage en profondeur fait référence au nombre de couches de traitement neural artificielles de son réseau neuronal.

Une équipe de chercheurs en intelligence artificielle (IA) composée de Kevin Eykholt et Ivan Evtimov, ainsi que d’autres chercheurs de l’Université de Californie à Berkeley, de l’Université du Michigan, de l’Université Stony Brook et de l’Université de Washington ont découvert qu’il ne fallait que de légers changements pour s’arrêter Signer à l’aide d’autocollants noir et blanc entraîne la classification erronée d’images dans des réseaux de neurones profonds (DNN) à la pointe de la technologie. L’équipe a publié ses conclusions en avril 2018 dans arXiv .

L’un des inconvénients actuels de l’apprentissage en profondeur est le grand nombre de données nécessaires à la formation de l’ordinateur. À l’inverse, une fois qu’un enfant a appris ce qu’est un oiseau, il peut facilement l’identifier comme un oiseau sans avoir à connaître toutes les différentes espèces d’oiseaux existantes.

Différentes régions du cerveau traitent différents types d’entrées. Par exemple, le lobe pariétal est la zone du cerveau où les entrées sensorielles pour le toucher, la température et la douleur sont traitées. Le lobe occipital interprète la vision. Le lobe temporal joue un rôle dans l’audition. Étant donné que différentes régions du cerveau traitent les entrées sensorielles dans différentes régions, comment forment-elles une expérience unifiée? Ceci décrit le problème de la liaison.

Par exemple, quand un avion à réaction haut dans le ciel passe au-dessus de la tête, le cerveau sait que le son qui s’écroule lui correspond. Le cerveau reconnaît que les ailes, la queue, le fuselage et la traînée blanche (traînée de condensation) appartiennent au jet, et non au ciel, au soleil ou aux nuages ​​en arrière-plan. D’une manière ou d’une autre, le cerveau humain est capable de saisir diverses données d’entrée sensorielles telles que la vue, le son, le goût, l’odorat et le toucher, et de composer une expérience cohérente. Pourtant, les scientifiques ne savent pas exactement comment le cerveau le fait.

Simon Stringer, mathématicien et professeur de neurosciences britannique à la Oxford Foundation for Neuroscience théorique et intelligence artificielle, recherche actuellement des neurones dans le cerveau qui agissent comme des «neurones de liaison» et ont pour ambition de conférer «une intelligence de rat à une machine dans 20 ans».

Pour le moment, la solution de rechange pour les chercheurs en IA est de viser à obtenir de bonnes performances en moyenne lorsqu’il s’agit d’interpréter correctement des images visuelles.

“L’œil ne voit que ce que l’esprit est prêt à comprendre.” – Robertson Davies

Copyright © 2019 Cami Rosso Tous droits réservés.

Références

National Geographic. «Cerveau». Extrait du 16/01/2019 à l’adresse https://www.nationalgeographic.com/science/health-and-human-body/human-body/brain/.

Eykholt, Kevin, Evtimov, Ivan, Fernandes, Earlence, Li, Bo, Rahmati, Amir, Xiao, Chaowei, Prakash, Atul, Kohno, Tadayoshi, Chanson, Aube. “Attaques du monde physique robustes contre la classification visuelle d’apprentissage en profondeur.” ArXiv : 1707.08945v5. 10 avril 2018.

Geddes, Linda. “Les” événements étranges “qui font des machines halluciner.” BBC . 5 décembre 2018.