Cours 9 Flashcards

(16 cards)

1
Q

B.F. Skinner pt1

A
  • Carrière d’écrivain (écrit des livres pour enfant et des écrits scientifiques)
  • Décès en 1990 de la leucémie et continue à travailler jusqu’en 1989
  • Un peu la même chose que Freud les deux partagent cette passion pour l’écriture
  • Dernier défendeur de la psy béhaviorisme dans les années 80, à présent on est dans la psy cognitive
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

B.F. Skinner pt2

A
  • N’a jamais placé d’enfant dans sa boîte de Skinner
  • Cette boîte est FONDAMENTALE
  • Influence pratique concrète qui a changé le visage de c’est quoi être un chercheur en psy, influence comparable à celle de Freud
  • Vu comme le plus radicaux des radicaux (extrémiste)
  • Convaincu qu’étudier un rat = étudié un humain
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

La boîte de Skinner

A
  • La boite de Skinner n’est qu’une façon pratique de gérer les conditions d’apprentissage
  • Un des premiers à automatiser ses expériences avec les ordinateurs
  • Façonner notre manière de travailler en lab
  • Pousser vers la standardisation des méthodes et du vocabulaire en psy
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Essaie-discret

A
  • Thorndyke
  • des essais particuliers avec un début et une fin qui sont identifiables; il requière une plus grande implication du chercheur; plus efficace
  • Un seul essaie, dans laquelle il y a un début et une fin lorsqu’un certain comportement sera fait, lorsqu’il arrive à la fin du labyrinthe le chat ne va pas retourner au début pour le refaire, c’est pk on dit que c’est un seul essaie. C’est à nous de remettre le chat au début ce qui signalerait un deuxième essaie
  • Avantage : apprennent plus facilement à l’animal une séquence
  • Désavantage : pas particulièrement réaliste : c’est la succession des expériences qui font en sorte que le chat apprend, dans le milieu naturel ça pourrait prendre des mois avant que la séquence se répète C’EST PK LA GÉNÉRALISATION EST SI IMPORTANTE : pour répéter les séquences même lorsqu’elles ne sont pas identiques identiques
  • sert à faire des apprentissages avec des choses nouvelles
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Opérante libre

A
  • pas d’essai particulier, réponse disponible en tout temps, mais pour période fixée à l’avance ; plus réaliste
  • ressemble à l’environnement naturel, plus réaliste
  • ressemble plus à l’environnement naturel, l’expérience continu toujours, un rat qui presse un levier pour recevoir de la nourriture, il peut presser le levier autant de fois qu’il veut, le temps est prédéterminé (30min) : le but est de voir combien de fois le rat à presser le levier
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Paradigme instrumentale

A
  • Sd –> R –> Sr (ou C pour conséquence)
  • Dérivé de la loi de l’effet de Thorndike
  • Dans une situation de stimulation (Sd), une réponse (R) est suivi d’un stimulus renforçant (Sr)/conséquence. (On fait aussi référence à Sd comme étant un stimulus discriminatif.)
  • Sr = stimulus renforçant
  • C = conséquence
  • Punition est un mécanisme d’apprentissage
  • Hasard diminue grâce au renforcement ou grâce à la punition (loi de l’effet)
  • Stimulus sert de signal à l’animal
  • S devient prédicteur de la consquence si on connait la réponse
  • Sans R il n’y aurait pas C
  • Dans l’instrumentale, l’animal est techniquement en contrôle
  • Pas la même contingence : lien de prédiction de l’apparation de stimulus, instrumentale lien de prédiction entre R et C (voir enregistrement 40 min environ)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Différence entre conditionnement classique et instrumental

A
  • Classique : RC est automatique, RC prépare pour la RI, S’apprend par la contingence
  • Instrumental : R est émise, R nous amène à Sr, s’apprend par la contingence
  • Pas la même contingence
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Similitude entre les deux

A
  • Loi de la pratique
  • Loi de l’intensité des stimuli
  • Extinction et récupération spontanée
  • Importance de la contiguïté
  • Importance de la contingence
  • Blocage (si on ajoute un bouton qui distribue de la nourriture mais s’il sait déjà que le levier en distribue bahhh il ne va pas presser le bouton) et masquage (bouton qui brille qui s’allume va être plus presser que le levier dans le coin, une affaire d’attention)
  • Généralisation et discrimination
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Type de contingence par type d’effet sur la réponse

A
  • Renforcement : toute situation Sd-R-C dans laquelle l’effet de C sur R est d’augmenter la probabilité de la réponse R.
  • Punition : toute situation Sd -R-C dans laquelle l’effet de C sur R est de diminuer la probabilité de la réponse R.
  • Sd = stimulus discriminatif
  • C’est la réaction, le comportement qu’on mesure (agréable, désagréable, mais on n’utilise pas ces termes c’est simplement pour mieux comprendre)
  • La punition pour l’éducateur n’est pas une punition pour l’élève ; si son comportement augmente vous ne l’avez pas puni vous l’avez renforcé
  • Les deux sont de l’apprentissage
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Renforcement positif

A
  • Le renforcement positif consiste à donner au sujet un stimulus agréable, c’est un événement qui augmente la fréquence d’apparition d’un comportement grâce à un stimulus «agréable».
  • Par exemple, une gâterie pour un chien qui fait le beau.
  • Récompense est un renforcement positif
  • Récompense fonctionne toujours si ça ne fonctionne pas augmenter la récompense
  • Rien de problématique éthiquement mais ne veut pas dire que c’est libre de problème : le problème quand on renforce trop positivement l’enfant va trop vouloir une récompense externe il n’aura plus de motivation interne
  • Motivateur interne : ce que nous même nous nous donnons
  • Motivateur externe : ce que l’environnement nous donne
  • Système de renforcement positif coûte en ressource
  • Ce système devrait être utilisé avec modération
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Renforcement négatif

A
  • Le renforcement négatif consiste à supprimer un stimulus désagréable ou douloureux, c’est un événement qui augmente la fréquence d’apparition d’un comportement grâce à un retrait ou à l’arrêt d’un stimulus «désagréable» .
  • Par exemple, prendre une aspirine qui fait disparaître un mal de tête.
  • Drogues peuvent être un renforcement positif et négatif
  • Travailler plus vite faisait tourner les fans plus vite ce qui sortait le mauvais air de l’usine, le tout inconsciemment des travailleurs
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Punition positive

A
  • Procédure par laquelle la probabilité de fréquence d’apparition d’un comportement tend à diminuer suite à l’ajout d’un stimulus «aversif» ou conséquence désagréable contingente au comportement cible.
  • Par exemple, l’ajout d’une obligation, d’une douleur…
  • La pire punition en termes d’être humain
  • Claque dans le visage
  • Punition au sens traditionnel
  • Mécanisme le plus puissant pour faire changer le comportement
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Punition positive et ces effets nocifs

A
  • La punition positive est la façon la plus directe et plus rapide pour contrôler le comportement. Elle a toutefois plusieurs effets nocifs dont :
  • Agressivité passive : forme subtile d’agressivité caractérisée par la bouderie, la procrastination, l’entêtement et l’inefficacité intentionnelle. (agression sans agresser, quelque chose qui frustre grandement (oubli répétitif), inégalité de pouvoir, problème moyen long terme)
  • Intensification de l’agressivité chez celui qui administre la punition. Cercle vicieux : le «punisseur» est renforcé d’avoir puni ; le «puni» est renforcé d’adopter des attitudes de soumission, mais aussi d’agressivité passive. (Punisseur : renforcement négatif, punit : punition positive, on continue de punir violemment et quand les claques marchent moins bien, on frappe avec le poing)
  • L’apprentissage de l’agressivité par le sujet puni. (on sait que les enfants abusés ont plus de chance de devenir abuseur à l’âge adulte, catégorie d’abus sexuel : famille, frère sœur, et non pas les étrangers)
  • Comportement d’évitement de la punition : l’exemple de l’adolescent qui va éviter l’endroit de la punition (la maison) et mentir. (plus problématique que tous les autres)
  • Pas particulièrement intelligent d’utiliser la punition positive
  • Premier problème l’agression engendre l’agression
  • Quand on punit trop, autrement ils auraient respecté les règles, mais maintenant ils ne les respectent plus parce que dans tous les cas on se fait punir,
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Punition négative

A
  • Procédure par laquelle la probabilité de fréquence d’apparition d’un comportement tend à diminuer suite au retrait contingent d’un stimulus agréable, dit «appétitif»
  • Par exemple: Retrait d’un privilège, d’un droit…
  • Perte de privilège, prison
  • Marc dit que la prison est une punition positive et négative, car il va nous arriver des trucs en prison
  • Elle peut engendrer tous les trucs de la punition positive (agressivité passive, intensification de l’agressivité), mais c’est plus rare
  • Les deux types de punition sont perceptives et changent d’un individu à l’autre
  • Mal mis en place elle a souvent le même impact que la punition positive
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Le façonnement

A
  • Les comportements ne peuvent pas être renforcés s’ils ne se produisent pas.
  • Or, attendre après l’apparition de la réponse n’est pas pratique.
  • Skinner proposera le façonnement comme solution: des approximations successives sont renforcées, débuter avec un critère large pour le renforcement, augmenter graduellement le critère
  • Façonnement c’est tricher
  • On est toujours à la mercie du hasard
  • Plus petit environnement augmentait le hasard, la probabilité que le rat mette sa patte sur le levier est plus élevé dans une petite boite que dans une grande
  • Je vais récompenser toutes les réponses qui rapproche le rat du presser le levier, récompenser lorsqu’il tourne à gauche alors que le levier est à gauche, le rat va apprendre à tourner à gauche, maintenant je veux qu’il aille jusqu’au mur, donc on arrête de récompenser lorsqu’il tourne simplement à gauche, on demande un critère plus exigeant
  • Augmenter le hasard en découpant la tâche graduellement
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Apprentissage de chaînes comportementales

A
  • Faire l’apprentissage des réponses indépendamment
  • Commencer par le dernier comportement dans la chaîne
  • Ajouter des liens à la chaîne en ordre inverse (vers le premier comportement)
  • Pour établir la chaîne, chaque comportement est renforcé par la possibilité de faire la réponse suivante
  • Pas linéaire directe
  • Quand on arrête de renforcer le premier étage, le rat va rester en bas
  • Si le chat voit l’endroit de la récompense, il ne sera plus capable de faire le parcours, il faut parfois s’éloigner pour arriver à l’objectif, conditionnement spatial, il associe la récompense à l’endroit
  • Les rats ont une excellente mémoire spatiale
  • Ici on essaie de déplacement la source de renforcement et ça ne marche pas avec les rats
  • Skinner fait partir le rat de la fin puis le recul au bout de l’étage, puis on le descend en bas de l’escalier de où il voit l’endroit où il voyait le levier et etc. Le rat se représente l’endroit et si chaque étape permet de voir l’étape suivante alors le rat peut se retrouver, avec ça on peut faire apprendre des choses extrêmement complexes à un rat
  • Une personne va apprendre si elle voit la conséquence désirable