Overblog
Editer l'article Suivre ce blog Administration + Créer mon blog

Publié par Jean-Pierre FORESTIER

L’essentiel  

Notre cerveau a-t-il besoin d’un visage net pour prendre une décision ?

Non, et les arguments donnés dans cet article sont complétés par l’étude du « flou périphérique »  des tableaux de Paul Cézanne, voir 08.02. Notre mémoire, Paul Cézanne … et le flou intelligent

 

Le degré de netteté/flou dépend de la décision à prendre mais dans tous les cas un visage flou peut être suffisant.

     Le visage peut être complètement flou pour une information sociale très rapide, comme un visage exprimant la peur, la joie, la sérénité.

Deux exemples de traitement d’images (par informatique) :

          - rendues floues par compression

          - moyennées à partir de photographies de la même personne dans différentes circonstances et périodes de sa vie  

… montrent qu’il n'est pas nécessaire qu'un visage soit net pour être  analysé par le cerveau et, éventuellement, reconnu.

     Tout en restant dans le domaine de l’image floue, traitée par une logique floue, la reconnaissance de visage par informatique pourrait être améliorée en optimisant la compression d’images ou, mieux, une reconnaissance dynamique  utilisant des vidéos de visages passant, par exemple, de la joie à la tristesse.

Pour ne pas être complètement pessimiste regardons quelques travaux qui donnent l’espoir de sortir de l’ultra conservatisme des sujets de recherche, et pour commencer voyons le traitement flou des images (même nettes) d'un visage.

 

 

Pour la question quasi métaphysique : "à quoi sert la vue ?" Ou plutôt les vues, lire le paragraphe déterminisme et suivant.

Informations sociales

Notre système mnésique fonctionne en fonction de son utilité. Ce n’est pas de connaître les paramètres précis du visage d’une personne qui est utile mais de reconnaître la personne avec suffisamment de confiance.

Le degré de netteté (le « degré d’appartenance », dans le vocabulaire de la Logique floue) d’un visage analysé par le cerveau est fonction de la décision à prendre (= la « probabilité acceptable »  = la conclusion.)

 

Des informations sociales sur « l’ambiance » environnante sont gérées de façon différente de la reconnaissance de visages.

 

Comme l’a montrée l’équipe internationale de Bryan Strange (Université Technique de Madrid, Espagne), pour des fonctions de survie, le cerveau – dans ce cas l’amygdale cérébrale - peut interpréter l’expression d’un visage qui exprime la peur, la joie ou une neutre sérénité, même si le visage est complètement flou.

 

Selon la logique floue (Voir Notre mémoire floue)

Si je rencontre un visage qui exprime la peur Alors j'en tire la conclusion qu’il existe un danger

 

L’interprétation est réalisée vraisemblablement en 70 millisecondes (peut être même deux fois plus rapidement), comme pour détecter un mouvement, tandis que

250 millisecondes est un minimum nécessaire pour savoir si un visage est connu ou non, ou hésiter et refaire une nouvelle analyse.

Images compressées et floues

La compression de données réalisée par Gintare Karolina Dziugaite, de l’université de Cambridge (Royaume Uni), semble la voie la plus "simple",  pour ne par dire la plus évidente !

 

« Avant de faire apprendre une image au réseau, on lui appliquera un algorithme de compression d’images d’usage courant. Cela modifie un peu certains pixels, mais la compression, en simplifiant l’image, la débarrasse des caractéristiques inutiles que le réseau pourrait prendre en compte alors qu’elles ne sont qu’accidentelles. Ce lissage ramène à ce qui est essentiel dans l’image. »

 

Cette « compression d’images » et la réduction du nombre de pixels, revient à rendre des images floues, aussi floues que le sont les « objets cognitifs »

 

« ce qui est essentiel dans l’image » peut être traduit en science cognitive par « ce qui permet au cerveau de prendre une décision »

Images moyennées

Encore plus subtil est le travail de Robert Jenkins, A. Mike Burton et leurs collègues du département de Psychologie de Université de Glasgow

Ceux-ci ont en effet montré qu’une image « moyennée » à partir de diverses photographies de la personne, (ici Bill Clinton)

... en diverses circonstances et à différents âges de sa vie,

permet la reconnaissance d’un visage avec, et c'est très important, une « efficacité équivalente à celle d’’un humain ».

C’est ce qu’affirment les auteurs, mais cette « efficacité équivalente à celle d’’un humain » est aussi/surtout un enseignement pour comprendre la méthode utilisée par notre cerveau pour reconnaître les visages.

 

Ce moyennage n’est pas sans rappeler la redondance (voir article précédent) de l’acquisition d’image :

c’est en utilisant plusieurs images que notre cerveau prend une décision  

Amélioration de la reconnaissance de visages

Comme l’indique Jean-Paul Delahaye, la compression d’images imaginée par Gintare Karolina Dziugaite pourra faire « globalement progresser la science de l’apprentissage automatique »,

 

mais je suggère à cette brillante et jeune mathématicienne de compléter son travail par

- plusieurs compressions par différents programmes de compression d’images.

- puis de moyenner les différentes images obtenues.

 

Moyennage ?

Il est généralement difficile de travailler sur des photographies du visage d’une personne dans différentes circonstances de sa vie. Aller piocher sur les réseaux sociaux, pourrait être une piste, mais avec de grands risques d’erreur sur l’identité de la personne, sans compter l’aspect éthique !

Reconnaissance dynamique

Une autre piste de recherche, certainement beaucoup plus riche et mimant le cerveau, serait dynamique, c'est-à-dire utiliser le « mouvement »

- non pas de travailler sur des images fixes mais sur des visages en mouvement,

 

- le plus efficace serait certainement d’enregistrer une séquence filmée du visage d’une personne pendant qu’elle mime de passer de la « tristesse » à la « joie ».

 

 

 

 

Cela faciliterait la reconnaissance faciale comme celle utilisée pour débloquer son Smartphone ou un I-phone, même si vous bouger un peu trop vite ……

 

… ou pour « suivre » les personnes dans leurs déplacements, par exemple dans un aéroport. 

Pour utiliser cette technique, il faudrait non pas faire une photographie mais une petite vidéo, à son entrée dans l'aéroport.  Quelques secondes devraient suffirent,

 

Au lieu d’utiliser des pixels, une méthode dynamique devrait traiter des vecteurs, comme le fait déjà le cerveau.

Les mathématiciens savent aussi très bien le faire.

Retour vers

Le cerveau gère des « objets cognitifs »

Le cerveau compare des « objets cognitifs » dans un dialogue

Ces « objets » sont plastiques et flous, de plus la plupart correspondent à des mouvements.

La coordination de toutes les comparaisons entre les "objets cognitifs" dans une agora neuro-astrocytaire permet au cerveau de prendre une décision, éventuellement après une nouvelle analyse.

La logique floue (fuzzy logic) pourrait être un bon outil pour mieux comprendre le fonctionnement du cerveau

mais la philosophie serait une première étape particulièrement enrichissante.

Le vecteur correspondant au champ électrique des protéines de mémoire permet de paramétrer des données sur cinq dimensions, plus une dimension binaire.

Des données floues permettent d’intégrer un beaucoup plus grand nombre d’informations que des données « précises »

Un espace aussi réduit qu’un cerveau est suffisant pour emmagasiner des données vectorielles et floues. 

Commenter cet article