PSY 2055. Psychologie de la perception. Reconnaissance dobjets. Frédéric Gosselin.
Post on 04-Apr-2015
108 Views
Preview:
Transcript
PSY 2055. Psychologie de la perception.
Reconnaissance d’objets.
Frédéric Gosselin
Les niveaux de traitement de Marr (1982; et l’ajout de Palmer, 1999)
• Image rétinienne (Marr) / stimulus proximal (Palmer)
• “Primal sketch” / stade de l’image
– Détection de contours, de blobs, de régions; groupement minimal
• “2.5-D sketch” / stade de la surface
– Surface visible, orientée en profondeur par rapport à l’observateur
• Représentation 3-D / stade de l’objet
– Représentations centrées sur les objets complets
• Stade de la catégorie (Palmer)
– Propriétés, fonctions, etc. de l’objet ou des objets
Objet distal
Qualia...
Objet perceptuel
Observatrice
“Top-down” / “bottom-up”
“Bottom-up”
“Top-down”
Extraction des contours
Application de la règledes minima
Activation des représentationsd’objets
Détection des propriétésnon-accidentelles
Identification des géonset de leurs relations
spatiales
1 monde
Neurophysiologie
1 percept véridique
Psychologie cognitive
Niveau de traitement
… IT?...
Retour au problème du “liage”• Comment ces activations morcelées sont-elles
regroupées en éléments de plus en plus complexes pour aboutir à des objets puis à des catégories?
• Une réponse provenant des neurosciences : la synchronie neurale– Mais comment expliquer que l’on peut percevoir plusieurs
choses en même temps?
– Et les groupements temporaux?
• Une réponse venant de l’école de la Gestalt : la Pragnanz– Correspond à la “vraissemblance” de Helmholtz
Lois d’organisation de la Gestalt
Symmétrie
Proximité
Similarité
Fermeture
Bonne continuation (V1 et V2; Grosof, Shapley & Hawken, 1993)
(Marroquin)
La synchronie événementielle
La synchronie événementielle
Forme/fond
Une “mooney figure”: groupement par “familiarité”
La nécessité de l’attention et la FIT
• Quelques démonstrations
• “Feature Integration Theory” (FIT)
• Tests empiriques de la FIT
Choisissez et mémorisez une carte.
Votre carte est celle qui manque!
Quelques phénomènes révélants l’importance des processus “top-down” (et la relative
pauvreté des processus “bottom-up)
• “Change blindness” (p. ex. le tour de magie)
• “Inattentional blindness”
Mud-splash change blindness
(O'Regan, Rensink et Clark, 1998)
Mud-splash change blindness
(O'Regan, Rensink et Clark, 1998)
Flicker change blindness
(O'Regan, Rensink et Clark, 1998)
Mud-splash change blindness
(O'Regan, Rensink et Clark, 1998)
“Inattentional blindness”
(Simons et Chabris, 1999)
Démo
http://viscog.beckman.uiuc.edu/djs_lab/demos.html
“Feature Integration Theory” (FIT)Treisman (1980, 1988, 1993)
• L’attention est nécessaire pour “lier” les attributs visuels
• Les objets sont codés à la fois en parallèle et en série
• L’attention ressemble à un faisceau circulaire
FIT: dans le détail
• Les attributs visuels (couleur, taille, orientation, etc.) sont codés en parallèle par des modules spécialisés
• Les modules créent deux types de “cartes”– Cartes d’attributs (e.g., carte des couleurs, carte des
orientations , etc.)– Une carte maîtresse des positions
Cartes d’attributs
• Y est encodé ce qu’il y a dans le monde en fait d’attributs visuels
• N’y est pas encodé :– Où ces attributs sont dans le monde– Et, donc, quels sont les objets présents dans le
monde
Carte maîtresse des positions
• Y sont encodées les positions mais pas la nature des attributs
Le rôle de l’attention dans la FIT• L’attention peut se déplacer dans la carte
maîtresse des positions
• Fait le pont entre les attributs et les positions
• Les attributs dans le faisceau attentionel activent temporairement une représentation d’objet
Tests empiriques de la FIT
• Recherche visuelle
• Conjonctions illusoires
Expériences en recherche visuelle
• Enregistre les temps pris par les sujet pour dire si la cible est présente ou pas.
• Le nombre de distracteurs varie.
• Prédictions :– La recherche d’attributs simples devrait être
indépendante du nombre de distracteurs
– La recherche de cibles définies par des conjonctions d’attributs devrait varier en fonction du nombre distracteurs
Recherche d’un seul attribut
• Y a-t-il un T à droite?
TT
T
T
T
T
T
TT
T T• D’après la FIT une
recherche d’un seul attribut visuel ne devrait pas demander d’attention
• Il devrait y avoir “pop out”
Recherche d’une conjunction d’attributs
X
T
TT
X
T
TX
T TX
X
T
T• La cible est définie par
sa forme et sa couleur
• Ceci requière l’intervention de l’attention
• Il faut donc porter sont attention sur chaque “objet” jusqu’à ce que la cible soit trouvée
• Y a-t-il un T à droite?
Résultats typiques (p. ex. Treisman et Geldade, 1980)
0
500
1000
1500
2000
2500
3000
1 5 15 30Display Size
Feature Target
Conjunction Target
Conjonctions illusoires
• Sans attention les attributs devraient se combiner aléatoirement
Conjonctions illusoires
Treisman et Schmidt (1986)
• Deux réponses demandées à chaque essai :
i) Identifier les chiffres noirs
ii) Identifier les couleurs et les formes des lettres
• Les sujets combinent les attributs visuels des lettres illusoirement environ 30% du temps
– P. ex. disent avoir vu un T ou un O.
2 8X T O
Quelques critiques
• Un seul faisceau attentionnel?• Quels sont les attributs primitifs?
– P. ex., le traitement des conjonctions devient de plus en plus “parallèle” avec la pratique
• Une chose est certaine : l’attention est cruciale (voire nécessaire) pour que le traitement visuel se fasse
Qu’est-ce qui vient après le groupement de quelques attributs
primitifs?• Souvenez-vous du problème des cellules de
type “grand-mère”• Un alphabet de “partie primitives” (les
géons)– Nous n’avons que 26 lettres dans notre alphabet
mais nous pouvons nous en servir pour écrire les 75,000 mots de la langue française
“Recognition by Components Theory” (RBC) (Biederman, 1987, 1990)
• Geons = alphabet de moins de 50 parties
…
Quatre dimensions : (1) le type de symétrie perpendiculairement à l’axe (3 poss.)? (2) taille constante, expansion et/ou contraction le long de l’axe (4 poss.)? (3) axe droit ou courbé (2 poss.)? et (4) possède des coins ou pas (2 poss.)? (3 * 4 * 2 * 2 ≈ 48 géons)
482 = 2304
Extraction des contours
Application de la règle des minima
Activation des représentations d’objets
RBC
Détection des propriétés non-accidentelles
Identification des géons et de leurs relations
spatiales
...
• Les geons sont définis par des propriétés qui sont robustes aux changements de perspectives.
• P. ex. une “brique” = 3 * 3 arêtes parallèles, 1 coin interieur en ‘Y’ et 3 coins extérieurs en flèche
• Il s’agit de propriétés “non-accidentelles” des contours dans l’image.
• Kayaert, Biedeman et Vogels (2003) ont montré que les cellules de IT répondaient davantage aux propriétés non-accidentelles qu’aux propriétés accidentelles des objets.
(Gibson et al., 2007)
Extraction des contours
Application de la règle des minima
Activation des représentations d’objets
RBC
Détection des propriétés non-accidentelles
Identification des géons et de leurs relations
spatiales
...
Segmentation des parties
• Les parties d’un objet sont habituellement délimitées par des points de concavité maximale– Règle des minima
• Comment apparier les points de concavité maximale?– Règle des plus proches voisins (?)
(Hoffman et Richard, 1984)
Exemple de segmentation en parties
(Hoffman et Richard, 1984)
Test empirique, I• L’élimination des contours qui définissent les
concavités (et les propriétés non-accidentielles) rend la reconnaissance difficile (Biederman, 1987)
(Fahlstrom)
Extraction des contours
Application de la règle des minima
Activation des représentations d’objets
RBC
Détection des propriétés non-accidentelles
Identification des géons et de leurs relations
spatiales
...
•Macaroni•À l’embouchure du•Cylindre
?
Différent exemplaire de lamême catégorie de base
Test empirique, II : Biederman et Cooper (1991, Expérience 1)
Imagescomplémentaires…
(1) ne partageant pas leurs géons
(2) partageant leurs géons
Extraction des contours
Application de la règle des minima
Activation des représentations d’objets
RBC
Détection des propriétés non-accidentelles
Identification des géons et de leurs relations
spatiales
...
Amorçage visuel
Amorçage sémantique
Test empirique, II : Biederman et Cooper (1991, Expérience 1)
Biederman et Cooper (1991, Expérience 1)
Amorçage sémantique
Bloc 1 Identique Complémentaireavec mêmes géons
Différent exemplaire de la même catégorie de base
Tem
ps d
e ré
pons
e
Amorçage visuel
Biederman et Cooper (1991, Expérience 2)
Image complémentaire 1 Image complémentaire 2 Différent exemplaire de lamême catégorie de base
Biederman et Cooper (1991, Expérience 2)
Amorçage sémantique
Bloc 1 Identique Complémentaireavec géons différents
Différent exemplaire de la même catégorie de base
Tem
ps d
e ré
pons
e
Amorçage visuel
top related