08. Du flou dans la mémoire des visages
Notre cerveau a-t-il besoin d’un visage net pour prendre une décision ?
Non, et les arguments donnés dans cet article sont complétés par l’étude du « flou périphérique » des tableaux de Paul Cézanne, voir 08.02. Notre mémoire, Paul Cézanne … et le flou intelligent
Le degré de netteté/flou acceptable dépend de la décision à prendre.
Les informations contenues dans un visage complètement flou peuvent être suffisantes pour la recherche d'une information sociale très rapide/urgente, comme l’expression de la peur, de la joie, ou de la sérénité.
Deux exemples de traitement d’images (par informatique) :
- rendues floues par compression
… montrent qu’il n'est pas nécessaire qu'un visage soit net pour être analysé par le cerveau et, éventuellement, reconnu.
Tout en restant dans le domaine de l’image floue, traitée par une logique floue, la reconnaissance de visage par informatique pourrait être améliorée en optimisant la compression d’images ou, mieux, une reconnaissance dynamique utilisant des vidéos de visages passant, par exemple, de la joie à la tristesse.
Pour ne pas être complètement pessimiste regardons quelques travaux qui donnent l’espoir de sortir de l’ultra conservatisme des sujets de recherche, et pour commencer voyons le traitement flou des images (même nettes) d'un visage.
Pour la question quasi métaphysique : "à quoi sert la vue ?" Ou plutôt les vues, lire le paragraphe déterminisme et suivant.
Notre système mnésique fonctionne en fonction de son utilité. Ce n’est pas de connaître les paramètres précis du visage d’une personne qui est utile mais de reconnaître la personne avec suffisamment de confiance.
Le degré de netteté (le « degré d’appartenance », dans le vocabulaire de la Logique floue) d’un visage analysé par le cerveau est fonction de la décision à prendre (= la « probabilité acceptable » = la conclusion.)
Des informations sociales sur « l’ambiance » environnante sont gérées de façon différente de la reconnaissance de visages.
Comme l’a montrée l’équipe internationale de Bryan Strange (Université Technique de Madrid, Espagne), pour des fonctions de survie, le cerveau – dans ce cas l’amygdale cérébrale - peut interpréter l’expression d’un visage qui exprime la peur, la joie ou une neutre sérénité, même si le visage est complètement flou.
Selon la logique floue (Voir Notre mémoire floue)
Si je rencontre un visage qui exprime la peur Alors j'en tire la conclusion qu’il existe un danger
L’interprétation est réalisée en moins de 70 millisecondes, comme pour détecter un mouvement, tandis que
250 millisecondes est un minimum nécessaire pour savoir si un visage est connu ou non, ou hésiter et refaire une nouvelle analyse.
La compression de données réalisée par Gintare Karolina Dziugaite, de l’université de Cambridge (Royaume Uni), semble la voie la plus "simple", pour ne par dire la plus évidente !
« Avant de faire apprendre une image au réseau, on lui appliquera un algorithme de compression d’images d’usage courant. Cela modifie un peu certains pixels, mais la compression, en simplifiant l’image, la débarrasse des caractéristiques inutiles que le réseau pourrait prendre en compte alors qu’elles ne sont qu’accidentelles. Ce lissage ramène à ce qui est essentiel dans l’image. »
Cette « compression d’images » et la réduction du nombre de pixels, revient à rendre des images floues, aussi floues que le sont les « objets cognitifs »
« ce qui est essentiel dans l’image » peut être traduit en science cognitive par « ce qui permet au cerveau de prendre une décision »
Encore plus subtil est le travail de Robert Jenkins, A. Mike Burton et leurs collègues du département de Psychologie de Université de Glasgow
Ceux-ci ont en effet montré qu’une image « moyennée » à partir de diverses photographies de la personne, (ici Bill Clinton)
... en diverses circonstances et à différents âges de sa vie,
… permet la reconnaissance d’un visage avec, et c'est très important, une « efficacité équivalente à celle d’’un humain ».
C’est ce qu’affirment les auteurs, mais cette « efficacité équivalente à celle d’’un humain » est aussi/surtout un enseignement pour comprendre la méthode utilisée par notre cerveau pour reconnaître les visages.
Ce moyennage n’est pas sans rappeler la redondance (voir article précédent) de l’acquisition d’image :
c’est en utilisant plusieurs images que notre cerveau prend une décision
Comme l’indique Jean-Paul Delahaye, la compression d’images imaginée par Gintare Karolina Dziugaite pourra faire « globalement progresser la science de l’apprentissage automatique »,
mais je suggère à cette brillante et jeune mathématicienne de compléter son travail par
- plusieurs compressions par différents programmes de compression d’images.
- puis de moyenner les différentes images obtenues.
Il est généralement difficile de travailler sur des photographies du visage d’une personne dans différentes circonstances de sa vie. Aller piocher sur les réseaux sociaux, pourrait être une piste, mais avec de grands risques d’erreur sur l’identité de la personne, sans compter l’aspect éthique !
Une autre piste de recherche, certainement beaucoup plus riche et mimant le cerveau, serait dynamique, c'est-à-dire utiliser le « mouvement »
- non pas de travailler sur des images fixes mais sur des visages en mouvement,
- le plus efficace serait certainement d’enregistrer une séquence filmée du visage d’une personne pendant qu’elle mime de passer de la « tristesse » à la « joie ».
Cela faciliterait la reconnaissance faciale comme celle utilisée pour débloquer son Smartphone ou un I-phone, même si vous bouger un peu trop vite ……
… ou pour « suivre » les personnes dans leurs déplacements, par exemple dans un aéroport.
Pour utiliser cette technique, il faudrait non pas faire une photographie mais une petite vidéo, à son entrée dans l'aéroport. Quelques secondes devraient suffirent,
Au lieu d’utiliser des pixels, une méthode dynamique devrait traiter des vecteurs, comme le fait déjà le cerveau.
Les mathématiciens savent aussi très bien le faire.
Retour vers
Le cerveau gère des « objets cognitifs »
Le cerveau compare des « objets cognitifs » dans un dialogue
Ces « objets » sont plastiques et flous, de plus la plupart correspondent à des mouvements.
La coordination de toutes les comparaisons entre les "objets cognitifs" dans une agora neuro-astrocytaire permet au cerveau de prendre une décision, éventuellement après une nouvelle analyse.
La logique floue (fuzzy logic) pourrait être un bon outil pour mieux comprendre le fonctionnement du cerveau
mais la philosophie serait une première étape particulièrement enrichissante.
Le vecteur correspondant au champ électrique des protéines de mémoire permet de paramétrer des données sur cinq dimensions, plus une dimension binaire.
Des données floues permettent d’intégrer un beaucoup plus grand nombre d’informations que des données « précises »
Un espace aussi réduit qu’un cerveau est suffisant pour emmagasiner des données vectorielles et floues.