Cours 7 Flashcards

(85 cards)

1
Q

Qu’est-ce qu’un programme de renforcement?

A

La demande de réponse à satisfaire pour obtenir un renforcement

Ce qui doit être fait pour s’assurer d’obtenir un renforçateur

Ensemble de règles à suivre pour obtenir un renforçateur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Explique ce qui est entendu par «effets de programme»

A

Différents programmes (demandes) vont produire différents effets sur le comportement

Ces effets sont nommés «effets de programme»

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’un programme de renforcement continu?

A

Programme où chaque réponse est renforcée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les caractéristiques du programme de renforcement continu?

A

Très efficace

Facile à comprendre

Donc utile lorsque l’on veut faire apprendre quelque chose à quelqu’un ou amener quelqu’un à faire quelque chose

Le problème de ce type d’apprentissage est que c’est coûteux (énergie, argent, etc.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce qu’un programme de renforcement intermittent?

A

Programme où seules certaines réponses sont renforcées
-Ex: Le rat doit appuyer trois fois sur le levier afin d’obtenir de l’eau
-Ex: tu dois faire 20 push-ups pour avoir le droit d’aller prendre de l’eau
-Ex: dans certains groupes, pour mettre fin à une pause, on doit dire 3 ou 4 fois que l’on va recommencer avant d’obtenir le silence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles sont les caractéristiques du programme de renforcement intermittent?

A

Le plus courant dans la vie
-L’environnement renforce rarement tous nos comportements

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quel est un autre nom pour programme de renforcement intermittent?

A

Programme de renforcement partiel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quels sont les 4 types de programmes intermittents de base?

A
  1. Programme à proportion
  2. Programme à proportion variable
  3. Programme à intervalle fixe
  4. Programme à intervalle variable
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce qu’un programme à proportion fixe?

A

Programme ou le renforcement est fonction d’un nombre de réponses PRÉVISIBLE et FIXE
-P.ex., Un pigeon doit donner 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelles sont les caractéristiques d’un programme à proportion fixe?

A

Ce type de programme engendre habituellement
-Un débit de réponse rapide
-Une courte pause après l’obtention de chaque renforçateur (nommée pause après renforcement)
-Le retour rapide des réponses après la pause

Après une pause de renforcement, le retour des réponses (l’amorce) peut parfois être plus long
-Mais une fois que l’on a amorcé le programme, les réponses ou comportements se font rapidement
-Dans nos comportements de tous les jours, bien qu’ils soient renforcés, on doit souvent trouver des trucs pour favoriser l’amorce
-Commencer par quelque chose de facile

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Comment annotons-nous un programme à proportion fixe?

A

Notés PFXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
-PF1=programme continu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Explique pourquoi on observe une courte pause après le renforcement de façon générale.

A

Fonction adaptative

Permet à l’animal d’explorer et non juste d’exploiter ses ressources (le renforcement). Dans la nature, l’animal prend une pause en mangeant pour regarder aux alentours et voir s’il n’y a pas de meilleures opportunités ailleurs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Explique pourquoi, dans un programme à proportion fixe, il vaut mieux commencer par une tâche plus simple.

A

Parce qu’après une pause de renforcement, le retour des réponses (l’amorce) peut parfois être plus long
-Il est mieux de renforcer un comportement plus simple. Le fait de renforcer des comportements plus simples fait que c’est plus facile ensuite de recommencer après la pause. Une fois que le programme est bien amorcé, les réponses et les comportements se font plus rapidement. Meilleure fluidité du programme.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Dans le programme à proportion fixe, on observe une relation positive entre… et …

A

Il y a habituellement une relation positive entre la taille de la proportion et la durée de la pause
-Pause pour PF25 < pause pour PF100

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Différencie un programme à proportion fixe dense/riche vs frugal.

A

On considère un programme à bas ratio où le renforçateur est facile à obtenir comme DENSE ou RICHE

On considère un programme à haut ratio où le renforçateur est difficile à obtenir comme FRUGAL

Ratio = nb de comportements/renforçateur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quel problème présente les programmes à proportion fixe denses?

A

Problème: programme DENSE souvent très couteux alors on va souvent essayer de passer à des programmes plus frugaux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est-ce qu’un étirement de la proportion dans un programme à proportion fixe?

A

Le fait de passer d’un programme DENSE à un programme FRUGAL se nomme l’étirement de la proportion
-Ex: féliciter Charlie d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter à chaque 3 fois

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Discute d’une conséquence possible de l’étirement de la proportion.

A

L’étirement de la proportion engendre parfois une dégradation dans le comportement
-Tension du ratio: perturbation de la réponse causée par une demande trop exigeante
-Ex: l’écart entre les demandes du BAC et du doc est monumental. Cela peut mener à une perte de motivation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Qu’est-ce qu’un renforcement à proportion variable?

A

Programme où le renforcement est fonction d’un nombre de réponses IMPRÉVISIBLE et VARIÉ
-P.ex., Un pigeon doit donner EN MOYENNE 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Comment annotons-nous les programmes à proportion variable?

A

Notés PVXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
-Le chiffre va représenté la moyenne de réponses pour obtenir le renforçateur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Quelles sont les caractéristiques d’un programme à proportion variable?

A

Le programme est fonction d’une moyenne donc on peut avoir un PV10
-Renforçateur obtenu si la réponse est faite entre 1 et 20 fois mais en moyenne après 10 fois
-Renforçateur obtenu si la réponse est faite entre 8 et 12 fois mais en moyenne après 10 fois

Ne tient donc pas vraiment compte de la variance

Ce type de programme engendre habituellement
-Un débit de réponse rapide et stable
-Peu de pause après l’obtention de chaque renforçateur
-Peut aller à aucune pause si le nombre minimum de réponses est très bas

Ces types de programmes peuvent engendrer des comportements mal adaptés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Explique pourquoi on observe un débit de réponse rapide et stable dans le programme à proportion variable.

A

Débit de réponse rapide et stable: on veut augmenter la quantité de renforçateurs. On sait que plus on fait de comportements, plus on va obtenir des récompenses.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Explique le peu de pause ou même l’absence de pause dans un programme à proportion variable.

A

Comme l’organisme n’a pas de certitude quant au moment où la récompense va être donnée, l’organisme va éviter de prendre des pauses.

Le comportement de l’animal va s’ajuster selon la variance.
-Plus il y a de variance, plus l’animal va se dire qu’il a des chances d’avoir une récompense à n’importe quel moment. Alors, moins il va prendre des pauses.
-Moins il y a de variance, plus l’animal va prendre des pauses après un certain nombre de comportements et plus ces pauses seront longues. Par exemple, un animal a généralement des récompenses après 8-12 fois. Alors, il prendra des pauses après ce nombre de fois.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Quel programme de renforcement se cache derrière le jeu compulsif?

A

Programme à proportion variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Qu'est-ce qu'un programme à intervalle fixe?
Programme où le renforcement est en fonction de la première réponse produite après une période de temps PRÉVISIBLE et FIXE. -P.ex., Un singe doit attendre 30 secondes avant de tirer sur une corde pour libérer de la nourriture
26
Comment notons-nous le programme à intervalle fixe?
Notés IFXX en fonction du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur
27
Quelles sont les caractéristiques du programme à intervalle fixe?
Ce type de programme engendre habituellement: -Un mode de réponse ondulatoire -Pause après l'obtention du renforçateur -Après la pause, débit de réponse de plus en plus rapide à mesure que l'intervalle s'écoule. Il y a une augmentation de la fréquence du comportement plus on approche du délai car on veut maximiser les chances d’avoir le renforçateur. Le temps est un SD qui devrait indiquer à l’organisme quand le renforçateur devient disponible. Important: tout comportement fait avant l’intervalle n’est pas efficace
28
Qu'est-ce qu'un programme à intervalle variable?
Programme où le renforcement est fonction de la première réponse produite après une période de temps IMPRÉVISIBLE et VARIÉE -P.ex., Un singe doit attendre en MOYENNE 30 secondes avant de tirer sur une corde pour libérer de la nourriture.
29
Comment notons-nous les programmes à intervalle variable?
Notés IVXX du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur -XX représente la moyenne de temps qui doit s'écouler
30
Quelles sont les caractéristiques d'un programme à intervalle variable?
Le programme est fonction d’une moyenne donc on peut avoir un IV10 -Renforçateur obtenu après la première réponse faite entre 1 et 20 minutes mais en moyenne après 10 minutes -Renforçateur obtenu après la première réponse faite entre 8 et 12 minutes mais en moyenne après 10 minutes Ne tient pas vraiment compte de la variance Ce type de programme engendre habituellement -Un débit de réponse stable et modéré -Peu de pause après l'obtention de chaque renforçateur -Peut aller à aucune pause après l'obtention de chaque renforçateur Puisqu'il s'agit de temps ici, le comportement devient très régulier -P.ex. pour un IV10 minutes avec renforçateur après 1 min à 20 min on aura souvent un patron de réponse d’un comportement par minutes -Ce patron permet de maximiser les chances de l’organisme d’obtenir le renforçateur (de ne pas le manquer) Façon de faire produire des comportements réguliers sans avoir besoin d'utiliser beaucoup de renforçateurs -On est capable d’obtenir le même patron avec un IV 10 et un IF 1 minutes. -Si dans le IV10 on montre à l’animal qu’il est possible d’avoir un renforçateur après 1 min. Il va faire le comportement à chaque 1 min. Donc je vais être capable d’avoir le même patron qu’avec un IF1 minute, mais ça m’aura coûté moins de renforçateurs.
31
Explique pourquoi le programme à intervalle variable génère peu ou aucune pause.
Peut aller à aucune pause si l’intervalle minimum est très court -p.ex.,IV10 avec renforçateur après 1 à 20 secondes avec moyenne de 10 -Le sujet sait que répondre même après un temps très court pourrait peut-être lui permettre d’obtenir le renforçateur alors il est « tenté » de ne jamais arrêter de faire le comportement -Il y aura donc plus de chances d’avoir des pauses (et des pauses plus grandes) avec IV10 avec renforçateur après 8 à 12 secondes
32
Explique pourquoi le débit de réponse est stable et modéré dans le programme à intervalle variable.
Pas besoin de faire le comportement très vite car l’obtention du renforçateur ne dépend pas du nombre de fois qu’on fait le comportement.
33
Quel programme de renforcement est le plus efficace?
Programme de renforcement continu
34
Explique en quoi le débit des comportements dans les programmes à proportion diffèrent du débit dans les programme à intervalle.
Débit plus rapide car renforçateurs dépendent entièrement du nombre de réponses produites -Pour augmenter le nb de renforçateurs, on augmente le nombre de nos réponses -P.ex., efficacité de donner des bonus à la performance ($ par vente)
35
Explique en quoi les programmes à composantes fixes diffèrent des programmes à composante variable au niveau des pauses.
Les programmes à composante fixe ont tendance à engendre des pauses après le renforçateur -L’organisme sait qu’avant d’obtenir le prochain il devra nécessairement attendre (un délai, ou de faire un certain nombre de comportements)
36
Mise à part les programmes de renforcement à intervalle et à proportion, nomme d'autres types de programmes simples.
1. Programmes à durée 2. Programmes de débit de réponse 3. Programmes non contingents
37
Qu'est-ce qu'un programme à durée à fixe?
Programmes pour lesquels le renforcement est fonction de l’exécution d’un comportement étalé tout au long D’UNE CERTAINE PÉRIODE DE TEMPS FIXE -P.ex., Un rat doit courir dans une roue pendant 10 secondes avant d’obtenir de la nourriture
38
Comment notons-nous les programmes à durée fixe?
Notés DFXX en fonction du nombre de temps que doit être exécuté le comportement pour obtenir le renforçateur
39
Qu'est-ce qu'un programme à durée variable?
Programmes pour lesquels le renforcement est fonction de l’exécution d’un comportement en continu pendant une période de temps IMPRÉVISIBLE ET VARIÉE -P.ex., Un rat doit courir dans une roue pendant en MOYENNE 10 secondes avant d’obtenir de la nourriture
40
Comment notons-nous un programme à durée variable?
Notés DVXX en fonction du nombre de temps moyen que doit être exécuter le comportement pour obtenir le renforçateur
41
Quelles sont les caractéristiques du programme à durée variable?
Le programme est fonction d’une moyenne donc on peut avoir un DV10 -Renforçateur obtenu si la réponse est faite en continue entre 1 et 20 minutes mais en moyenne pendant 10 minutes -Renforçateur obtenu si la réponse est faite entre 8 et 12 minutes mais en moyenne pendant 10 minutes Ne tient donc pas vraiment compte de la variance
42
Compare les programmes à durée fixe avec les autres programmes simples.
Comparés aux autres programmes simples vus, ils sont habituellement plus imprécis dans leur capacité à faire produire des comportements -Plus de place à l’interprétation de ce qui doit être fait -Ex: courir pendant 10 minutes (courir vite vs lentement) Besoin de plus de spécifications sur les détails des comportements à produire afin que l’on obtienne le résultat désiré
43
Qu'est-ce qu'un programme à débit de réponse?
Programmes pour lesquels le renforcement est fonction du débit de réponse Importance de l’aspect différentiel: -Un seul type de réponse est renforcé alors qu’un autre type ne l’est pas
44
Quels sont les types de programmes à débit de réponse?
Programmes de renforcement différentiel du débit rapide (RDDR) Programmes de renforcement différentiel du débit lent (RDDL) Programmes de renforcement différentiel de réponses rythmées (RDRR)
45
Qu'est-ce qu'un programme de renforcement différentiel du débit rapide (RDDR)?
Programme pour lequel le renforcement est fonction de la production d’au MOINS un certain nombre de réponses en une certaine période de temps -Plus généralement, seulement si le débit est assez rapide (aspect différentiel car tout débit plus lent n’est PAS renforcé) P.ex., Un pigeon qui doit appuyer au moins 10 fois en 1 minute afin de mettre fin à une stimulation douloureuse
46
Qu'est-ce qu'un programme de renforcement différentiel du débit lent (RDDL)?
Programme pour lequel le renforcement est fonction de la production d’au PLUS un certain nombre de réponses en une certaine période de temps -Plus généralement, seulement si le débit est assez lent (aspect différentiel car tout débit plus rapide n’est PAS renforcé) -P.ex., Un pigeon qui doit appuyer au maximum 10 fois en 1 minute s’il veut mettre fin à une stimulation douloureuse. Ou attendre au moins 5 secondes entre chaque coup de bec.
47
Quelle est la différence entre le renforcement différentiel du débit lent et le programme de renforcement à intervalle fixe?
Dans IF, les comportements faits dans l’intervalle n’ont pas de conséquence Dans le RDDL, tout comportement de trop fait dans l’intervalle élimine la chance d’obtenir le renforçateur (on doit recommencer l’intervalle)
48
Qu'est-ce qu'un programme de renforcement différentiel de réponses rythmées (RDRR)?
Programme pour lequel le renforcement est fonction d’une suite de réponses selon un débit préétabli -Plus généralement, seulement si le débit n’est NI TROP LENT, NI TROP RAPIDE (aspect différentiel car tout débit plus rapide ou plus lent n’est PAS renforcé) -P.ex., Un pigeon qui doit appuyer au minimum 5 fois et au maximum 10 fois en 1 minute s’il veut mettre fin à une stimulation douloureuse.
49
Qu'est-ce qu'un programme non contingent?
Programmes pour lesquels le renforcement apparaît indépendamment de toute réponse -Aucune réponse n’est nécessaire pour obtenir le renforçateur
50
Quel est un autre nom pour les programmes non contingents?
Programmes indépendants de la réponse
51
Quels sont les types de programmes non contingents?
Programme à temps fixe Programme à temps variable
52
Qu'est-ce qu'un programme non contingent à temps fixe?
Programme pour lequel le renforcement apparaît après une période de temps PRÉVISIBLE et FIXE, peu importe le comportement du sujet -P.ex., Un poisson va recevoir de la nourriture toutes les 60 secondes
53
Comment notons-nous le programme à temps fixe?
Noté TFXX en fonction du nombre de temps entre les renforçateurs
54
Qu'est-ce qu'un programme non contingent à temps variable?
Programme pour lequel le renforcement apparaît après une période de temps IMPRÉVISIBLE et VARIÉE, peu importe le comportement du sujet -P.ex., Un poisson va recevoir de la nourriture en MOYENNE toutes les 60 secondes
55
Comment notons-nous le programme non contingent à temps variable?
Noté TVXX en fonction du nombre de temps moyen entre les renforçateurs
56
Quelles sont les caractéristiques du programme non contingent à temps variable?
Le programme est fonction d’une moyenne donc on peut avoir un TV10 -Renforçateur obtenu après 1 à 20 minutes mais en moyenne après 10 minutes -Renforçateur obtenu après 8 à 12 minutes mais en moyenne après 10 minutes Ne tient donc pas vraiment compte de la variance
57
Discute du rôle des programmes non contingents dans l'apparition et le maintien de comportements superstitieux.
Les renforcements sont aléatoires (ne dépendent pas de ce que la personne fait). Alors, si une association est faite, c’est forcément superstitieux. Les humains en viennent à croire que quelque chose en particulier mène au renforcement alors que ce n’est pas le cas puisque c’est aléatoire. Parfois, ce n’est pas seulement le comportement global qui devient superstition, mais les petits détails précis de ce comportement. -Un individu peut croire que c’est une manière très spécifique de faire quelque chose qui cause le renforcement… alors qu’en réalité, le renforcement n’est pas causé par ce détail (il est non contingent). Tendance innée de l'humain à être intolérant à l’incertitude et à essayer de prévoir ou de contrôler l’incertitude -Les comportements superstitieux nous donne l'impression de contrer cet élément d'incertitude
58
Que se passe-t-il lorsqu'on passe d'un programme contingent à non contingent?
Le débit de réponse est habituellement ralenti. Par exemple, un joueur de baseball qui est payé selon ses performance puis qui reçoit un contrat. -Au début, le joueur est dans un programme contingent (il est payé selon ses performances). Alors, on observe une amélioration des performances. -Lorsque la personne obtient un contrat, il passe à un programme qui n’est plus contingent. Alors, on observe une diminution de la performance.
59
Qu'est-ce qu'un programme de renforcement complexe?
Une combinaison d’au moins deux programmes simples
60
Nomme les types de programmes complexes.
Programme conjonctif Programme ajustable Programme en chaîne
61
Qu'est-ce qu'un programme conjonctif?
Un programme complexe dans lequel les exigences à au moins deux programmes simples doivent être satisfaites avant de recevoir le renforçateur -P.ex., Un rat qui doit courir dans une roue pendant 2 minutes (DF2 minutes) et appuyer en moyenne 10 fois sur un levier (PV10) pour obtenir de la nourriture
62
Qu'est-ce qu'un programme ajustable?
Programme où la demande de réponse change en fonction de la performance du sujet pendant qu’il répond au renforçateur précédent -P.ex., Rat qui doit appuyer 10 fois sur un levier avant d’obtenir de la nourriture (PF10) puis qui doit appuyer 20 fois dans l’essai suivant (PF20) En gros, le critère pour obtenir le renforcement est ajusté après chaque réussite.
63
Le programme ajustable est très utile pour...
Façonner exactement le comportement que l'on veut. -On ajuste les critères pour les rendre le plus semblables à ce que l’on désire
64
Qu'est-ce qu'un programme en chaîne?
Programme qui consiste en une SUITE d’au moins deux programmes simples où chacun a son propre SD et dont le dernier produit un renforçateur terminal
65
En quoi le programme en chaîne diffère du programme conjonctif?
Diffère du programme conjonctif car les programmes doivent être complétés dans UN ORDRE PRÉCIS
66
Discute de l'exemple du pigeon pour le programme en chaîne.
Premier maillon: un lumière rouge apparaît, le pigeon appuie sur le levier -La lumière rouge est un stimulus discriminatif et indique au pigeon dans quel programme il est. Cela permet au pigeon de faire le comportement nécessaire pour avoir une renforcement. -Lumière rouge = stimulus discriminatif Deuxième maillon: une lumière bleue apparaît, le pigeon appuie sur le levier. -Quand l’animal réussit le premier maillon, on fait apparaître une lumière bleue. Cette lumière bleue agit comme renforçateur et comme stimulus discriminatif qui va indiquer au pigeon que s’il appuie, il va obtenir la lumière orange. -Lumière bleue = stimulus renforçateur et stimulus disriminatif Troisième maillon: la lumière orange apparaît, le pigeon appuie sur le levier. -La lumière orange agit comme renforçateur et comme stimulus discriminatif qui indique que s’il appuie il aura de la nourriture. -Lumière orange = stimulus renforçateur et stimulus discriminatif Chaque lumière indique au pigeon le type de programme dans lequel il est.
67
Discute des réponses aux premiers maillons vs aux derniers dans les programmes en chaînes. Quelles sont les causes derrière ce phénomène?
Dans ce type de programmes, les réponses aux premiers maillons ont tendance à être plus faibles que celles reliées aux maillons plus près du renforçateur terminal -P.ex., avec une chaîne faite de plusieurs IF60 secondes, il y a des pauses plus longues et des débits plus lents au début qu’à la fin de la chaîne Causes: -Renforcement immédiat plus efficace que renforcement différé -Plus il y a d’étapes entre les représentations des renforçateurs, moins le lien est fort -Principe général de l’effet du gradient: hausse de la force ou de l’efficacité de la réponse à mesure que l’on s’approche de l’objectif
68
Que pouvons-nous utiliser pour établir un programme en chaîne?
On peut utiliser l'enchaînement à rebours
69
Qu'est-ce que l'enchaînement à rebours?
Établir un programme en chaîne en débutant par le maillon terminal et et finissant par le maillon initial.
70
Qu'est-ce que la théorie de la réduction des pulsions de Clark Hull?
Un événement est renforçant dans la mesure où il se trouve associé à la réduction d’une pulsion physiologique -Cette pulsion pousse l’animal à agir afin de diminuer cette pulsion (motivation) -Si la pulsion diminue, les comportements qui ont précédé cette diminution seront automatiquement renforcés -P.ex., La privation de nourriture amène une pulsion de faim. L’animal va donc produire des comportements (p.ex., exploration) qui pourraient lui permettre de diminuer de cette pulsion (la faim). Si l’animal trouve de la nourriture et la consomme, la pulsion de faim va diminuer et les comportements qui lui ont permis d’obtenir la nourriture seront renforcés On sait qu’il existe des renforçateurs primaires qui sont définis comme ceux qui relèvent de besoins (pulsions) physiologiques primaires (nourriture, eau, comportements sexuels, etc.) Selon la théorie de la réduction des pulsions, tous les renforçateurs peuvent être reliés directement ou indirectement au besoin de réduire une pulsion physiologique
71
Explique un des problèmes que présent la théorie de la réduction des pulsions.
Certains comportements semblent n’être associés à aucun type de réduction des pulsions -Ou le lien entre le comportement et le besoin physiologique est très mince. -Souvent, l’aspect important semble plus être en lien avec l’aspect renforçant du stimulus en soi plutôt qu’au fait qu’il nous permet de diminuer une pulsion physiologique. On parle ici de motivation incitatrice.
72
Qu'est-ce que la motivation incitatrice?
Motivation issue d’une certaine propriété du renforçateur
73
Vrai ou faux. Nos comportements sont beaucoup mieux expliqués si on tient compte des motivations incitatrices que si on n’utilise que la réduction des pulsions.
Vrai, il y a donc eu un abandon graduel de la théorie de la réduction des pulsions.
74
Explique en quoi consiste le principe de Premack.
Un comportement très probable peut servir à renforcer un comportement peu probable.
75
Explique un élément important pour comprendre le Principe de Premack.
Pour comprendre le principe de Premack on doit concevoir qu’un renforçateur peut être envisagé comme un comportement plutôt que comme un stimulus. -P.ex., renforçateur = nourriture vs. = manger Ainsi le processus de renforcement passe du lien entre une réponse et un stimulus à une suite de deux réponses (ou comportements)
76
Dans le principe de Premack, on met l'accent sur ...
les probabilités relatives (ou fréquences relatives) des comportements
77
Explique ce que sont des comportements très probables et peu probables.
Comportements très probables (CTP): dans l’état actuel, l’animal a une forte probabilité de produire ce comportement Comportements peu probables (CPP): dans l’état actuel, l’animal a une faible probabilité de produire ce comportement
78
Comment peut-on identifier des comportements très probables vs peu probables dans l'environnement?
Temps mis pour X, temps mis pour Y -P.ex., je mets 2h pour me coiffer le matin, je mets 1h pour faire mes lectures pour le cours l’apprentissage: étudier (CPP) (R) –> coiffer (CTP) (SR) Le comportement peu probable est celui que l’on met le moins de temps à faire quand je suis libre de faire ce que je veux.
79
Selon l'hypothèse de la dépravation de réponse, un comportement peut servir de renforçateur à deux conditions:
L’accès à ce comportement est restreint Sa fréquence se situe sous son niveau préférentiel
80
Dans l'hypothèse de la déprivation de réponse, qu'est-ce que le niveau préférentiel?
Niveau de référence lorsque le sujet peut librement faire ce comportement. -P.ex., Charlie écouterait Ninjago the movie 24h par jour. Si on lui permet seulement d’en écouter 1h = état de déprivation car en dessous de son niveau préférentiel.
81
Explique en quoi l'hypothèse de la déprivation permet de comprendre pourquoi les contingences de renforcement sont efficaces.
Dans un état de déprivation, les comportements qui permettent de nous rapprocher de notre niveau préférentiel seront renforcés Dans un état de déprivation, si on ne fait pas les comportements, notre niveau restera sous le niveau préférentiel. -On ferait n'importe quoi pour atteindre notre niveau préférentiel.
82
Vrai ou faux. La fréquence du comportement est important dans l'hypothèse de la déprivation de réponse.
Contrairement au principe de Premack, pas besoin de connaître les fréquences relatives des deux comportements (CTP ou CPP) seul compte le fait que le comportement que l’on veut utiliser comme renforçateur est sous son niveau préférentiel -Permet d’explique un plus grand nombre de situations (avec deux CTP par exemple)
83
Quelle est l'idée derrière l'approche comportementale axée sur le point de satiété?
Un sujet ayant librement accès à de multiples activités va répartir son comportement de façon à maximiser le renforcement global -La durée de chaque activité représente leur renforcement optimal (le point de satiété comportemental)
84
Explique pourquoi, parfois, les points de satiété deviennent inatteignables.
Dans les contingences de renforcement, il est possible qu'on ne puisse pas atteindre le point de satiété. -P.ex., je fais du cardio 1h par jour, je fais des poids libres 30 min par jour. Toutefois, je suis dans un programme où je dois faire 10 minutes de cardio pour chaque 10 minutes de poids. Pour atteindre le point de satiété du cardio (60min je devrai faire 60 min de poids libre (donc 2X mon point de satiété) .
85
Considérant que la plupart de nos comportements sont dans des contingences de renforcement, que faisons-nous selon l'approche comportementale axée sur le point de satiété?
Puisque la plupart de nos comportements sont imbriqués dans des contingences de renforcement (p.ex., travailler vs. faire de la musique), nous devons ajuster notre temps afin d’atteindre un point qui nous rapproche de nos points de satiété (sans vraiment les atteindre) Ainsi, les organismes vont tenter de répartir leur comportement de façon à maximiser le renforcement global