Qu’est-ce qu’un programme de renforcement?
La demande de réponse à satisfaire pour obtenir un renforcement
Ce qui doit être fait pour s’assurer d’obtenir un renforçateur
Ensemble de règles à suivre pour obtenir un renforçateur
Explique ce qui est entendu par «effets de programme»
Différents programmes (demandes) vont produire différents effets sur le comportement
Ces effets sont nommés «effets de programme»
Qu’est-ce qu’un programme de renforcement continu?
Programme où chaque réponse est renforcée
Quelles sont les caractéristiques du programme de renforcement continu?
Très efficace
Facile à comprendre
Donc utile lorsque l’on veut faire apprendre quelque chose à quelqu’un ou amener quelqu’un à faire quelque chose
Le problème de ce type d’apprentissage est que c’est coûteux (énergie, argent, etc.)
Qu’est-ce qu’un programme de renforcement intermittent?
Programme où seules certaines réponses sont renforcées
-Ex: Le rat doit appuyer trois fois sur le levier afin d’obtenir de l’eau
-Ex: tu dois faire 20 push-ups pour avoir le droit d’aller prendre de l’eau
-Ex: dans certains groupes, pour mettre fin à une pause, on doit dire 3 ou 4 fois que l’on va recommencer avant d’obtenir le silence
Quelles sont les caractéristiques du programme de renforcement intermittent?
Le plus courant dans la vie
-L’environnement renforce rarement tous nos comportements
Quel est un autre nom pour programme de renforcement intermittent?
Programme de renforcement partiel
Quels sont les 4 types de programmes intermittents de base?
Qu’est-ce qu’un programme à proportion fixe?
Programme ou le renforcement est fonction d’un nombre de réponses PRÉVISIBLE et FIXE
-P.ex., Un pigeon doit donner 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit
Quelles sont les caractéristiques d’un programme à proportion fixe?
Ce type de programme engendre habituellement
-Un débit de réponse rapide
-Une courte pause après l’obtention de chaque renforçateur (nommée pause après renforcement)
-Le retour rapide des réponses après la pause
Après une pause de renforcement, le retour des réponses (l’amorce) peut parfois être plus long
-Mais une fois que l’on a amorcé le programme, les réponses ou comportements se font rapidement
-Dans nos comportements de tous les jours, bien qu’ils soient renforcés, on doit souvent trouver des trucs pour favoriser l’amorce
-Commencer par quelque chose de facile
Comment annotons-nous un programme à proportion fixe?
Notés PFXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
-PF1=programme continu
Explique pourquoi on observe une courte pause après le renforcement de façon générale.
Fonction adaptative
Permet à l’animal d’explorer et non juste d’exploiter ses ressources (le renforcement). Dans la nature, l’animal prend une pause en mangeant pour regarder aux alentours et voir s’il n’y a pas de meilleures opportunités ailleurs.
Explique pourquoi, dans un programme à proportion fixe, il vaut mieux commencer par une tâche plus simple.
Parce qu’après une pause de renforcement, le retour des réponses (l’amorce) peut parfois être plus long
-Il est mieux de renforcer un comportement plus simple. Le fait de renforcer des comportements plus simples fait que c’est plus facile ensuite de recommencer après la pause. Une fois que le programme est bien amorcé, les réponses et les comportements se font plus rapidement. Meilleure fluidité du programme.
Dans le programme à proportion fixe, on observe une relation positive entre… et …
Il y a habituellement une relation positive entre la taille de la proportion et la durée de la pause
-Pause pour PF25 < pause pour PF100
Différencie un programme à proportion fixe dense/riche vs frugal.
On considère un programme à bas ratio où le renforçateur est facile à obtenir comme DENSE ou RICHE
On considère un programme à haut ratio où le renforçateur est difficile à obtenir comme FRUGAL
Ratio = nb de comportements/renforçateur
Quel problème présente les programmes à proportion fixe denses?
Problème: programme DENSE souvent très couteux alors on va souvent essayer de passer à des programmes plus frugaux
Qu’est-ce qu’un étirement de la proportion dans un programme à proportion fixe?
Le fait de passer d’un programme DENSE à un programme FRUGAL se nomme l’étirement de la proportion
-Ex: féliciter Charlie d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter à chaque 3 fois
Discute d’une conséquence possible de l’étirement de la proportion.
L’étirement de la proportion engendre parfois une dégradation dans le comportement
-Tension du ratio: perturbation de la réponse causée par une demande trop exigeante
-Ex: l’écart entre les demandes du BAC et du doc est monumental. Cela peut mener à une perte de motivation.
Qu’est-ce qu’un renforcement à proportion variable?
Programme où le renforcement est fonction d’un nombre de réponses IMPRÉVISIBLE et VARIÉ
-P.ex., Un pigeon doit donner EN MOYENNE 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit
Comment annotons-nous les programmes à proportion variable?
Notés PVXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
-Le chiffre va représenté la moyenne de réponses pour obtenir le renforçateur.
Quelles sont les caractéristiques d’un programme à proportion variable?
Le programme est fonction d’une moyenne donc on peut avoir un PV10
-Renforçateur obtenu si la réponse est faite entre 1 et 20 fois mais en moyenne après 10 fois
-Renforçateur obtenu si la réponse est faite entre 8 et 12 fois mais en moyenne après 10 fois
Ne tient donc pas vraiment compte de la variance
Ce type de programme engendre habituellement
-Un débit de réponse rapide et stable
-Peu de pause après l’obtention de chaque renforçateur
-Peut aller à aucune pause si le nombre minimum de réponses est très bas
Ces types de programmes peuvent engendrer des comportements mal adaptés.
Explique pourquoi on observe un débit de réponse rapide et stable dans le programme à proportion variable.
Débit de réponse rapide et stable: on veut augmenter la quantité de renforçateurs. On sait que plus on fait de comportements, plus on va obtenir des récompenses.
Explique le peu de pause ou même l’absence de pause dans un programme à proportion variable.
Comme l’organisme n’a pas de certitude quant au moment où la récompense va être donnée, l’organisme va éviter de prendre des pauses.
Le comportement de l’animal va s’ajuster selon la variance.
-Plus il y a de variance, plus l’animal va se dire qu’il a des chances d’avoir une récompense à n’importe quel moment. Alors, moins il va prendre des pauses.
-Moins il y a de variance, plus l’animal va prendre des pauses après un certain nombre de comportements et plus ces pauses seront longues. Par exemple, un animal a généralement des récompenses après 8-12 fois. Alors, il prendra des pauses après ce nombre de fois.
Quel programme de renforcement se cache derrière le jeu compulsif?
Programme à proportion variable