Operant conditoneren

Operant conditioneren is een vorm van leren waarbij gedrag wordt aangeleerd op basis van de gevolgen die dat gedrag heeft. Succesvol gedrag blijft en niet succesvol gedrag zal geleidelijk verdwijnen. De mogelijkheden voor aanpassing aan complexere situaties worden zo uitgebreid omdat nu ook nieuw en doelgericht gedrag kan plaatsvinden. In de medische setting komen vaak situaties voor die te begrijpen zijn vanuit een leerproces dat berust op operante conditionering, bijvoorbeeld het vermijden van lichamelijke bewegingen bij chronische pijn omdat het bewegen zo’n pijn doet, of het negeren van gezondheidsadviezen of medische voorschriften omdat ze zo bewerkelijk zijn en niet worden beloond.
Wanneer een arts een advies geeft aan een patiënt, wordt de kans dat het advies ook daadwerkelijk wordt of kan worden opgevolgd verhoogd, als de arts zich bewust is van de factoren die het gewenste gedrag zullen bevorderen en welke factoren eventueel het oude, bestaande, ongewenste of ongezonde gedrag instandhouden. De arts hoort zich bovendien niet alleen bewust te zijn van het effect van het eigen voorbeeld op het gedrag van een patiënt, maar ook van de eigen potentiële mogelijkheden voor bekrachtiging van gezond gedrag.
Hoe werkt operant conditioneren?
Skinner (1904-1990) onderzocht op uitgebreide schaal de relatie tussen de gevolgen van gedrag en het gedrag zelf. Hij gebruikte hiervoor de term ‘reinforcement’ (beloning of bekrachtiging). Veel van onze gedragingen worden uitgevoerd op basis van de gevolgen die deze gedragingen hebben. Er is dus vanuit deze visie altijd een reden waarom bepaald gedrag al dan niet (meer) plaatsvindt en deze reden verwijst altijd naar de gevolgen die dit gedrag heeft. Als deze gevolgen aangenaam zijn, noemen we ze bekrachtigers van dat gedrag; als ze onaangenaam zijn (aversief) noemen we ze straf. Deze feedback kan zowel bewust als onbewust worden waargenomen en dus zowel bewust als onbewust invloed op ons gedrag uitoefenen.
Bekrachtigers kunnen zowel positief (iets krijgen dat gewenst is) als negatief zijn (iets dat ongewenst is niet krijgen). Positieve bekrachtigers zijn beloningen (voedsel, aandacht, rust na inspanning, geld, diploma’s etc). Negatieve bekrachtigers hebben een belonend effect door het wegnemen van een negatieve (veelal aversieve of onaangename) consequentie. De opluchting als we iets wat we vrezen kunnen vermijden of uitstellen, werkt als beloning (zie casus 4.1).
Tegenover beloning staat straf. Hierbij wordt een onderscheid gemaakt tussen positieve en negatieve straf. Positieve straf is een negatieve consequentie van gedrag (een standje, kritiek, een elektrische schok), negatieve straf is het wegnemen van positieve gevolgen (voedsel of geld afnemen, bijv. door een boete). Bedenk wel: negatieve bekrachtiging is dus iets heel anders dan straf!
 
Het aanleren en uitdoven van gedrag wordt bij operante conditionering sterk bepaald door de manier waarop bekrachtigers worden toegediend. Continue bekrachtiging komt niet zo vaak voor, behalve bij ongezond gedrag (roken, snoepen). Immers elke keer dat er een sigaret wordt opgestoken, geeft dat bijvoorbeeld ontspanning omdat dan de behoefte aan een sigaret (of misschien wel nicotine) wordt bevredigd en/of negatieve onthoudingsverschijnselen worden opgeheven. Het vaakst komt partiële bekrachtiging voor: het af en toe bekrachtigen van een respons bijvoorbeeld op basis van een bepaalde verhouding (bijvoorbeeld na elke tiende respons) of tijdsperiode (na elke tien minuten wordt het gedrag beloond) of juist een variabele verhouding en variabele tijdsperiode. In het begin van een leerproces werkt een schema van continue bekrachtiging het beste, maar na verloop van tijd is partiële (vooral variabele) bekrachtiging effectiever, bijvoorbeeld omdat anders al gauw een situatie van verzadiging kan optreden en een eerdere beloning nu niet meer als beloning wordt ervaren. Kenmerkend voor gedrag dat onder controle staat van een variabel beloningsschema is dat het zich vaak moeilijk laat uitdoven. Het (al dan niet) aanleren van nieuw gedrag wordt dus (ook) bepaald door de gevolgen die het gedrag heeft. Het niet opvolgen van medische richtlijnen – zoals in de voorgaande casus werd beschreven – kan bijvoorbeeld samenhangen met de neiging van die persoon niet geconfronteerd te willen worden (vermijding) met ‘anders zijn dan anderen’ of met de ziekte en de mogelijke ernstige gevolgen van deze ziekte op langere termijn. Op korte termijn kan dergelijk vermijdingsgedrag – indien succesvol – bekrachtigende eigenschappen hebben en dus leiden tot non-compliantie (tegenwoordig ook wel ‘non-adherence’ genoemd).
Vermijdingsgedrag in relatie met gezondheidsklachten kan ook voorkomen bij het vermijden van onplezierige situaties of gebeurtenissen, bijvoorbeeld vanwege buikpijn niet naar school kunnen, het vermijden van sociale situaties vanwege hoofdpijn, obstipatie, diarree of luchtwegproblemen. Vaak zijn deze situaties echter complexer dan hier voorgesteld. Deze complexiteit wordt veroorzaakt doordat bepaald gedrag meerdere positieve bekrachtigers kan hebben en vaak ook meerdere negatieve bekrachtigers. Het hebben van buikpijn kan zo samengaan met het vermijden van school (waar gepest wordt en/of waar het kind regelmatig faalervaringen oploopt), met de (positieve) aandacht die thuis wordt gegeven, en met de mogelijkheid om ongezien op de eigen kamer computerspelletjes te kunnen spelen.
Ook bij operant conditioneren komen we de principes van generalisatie en discriminatie tegen. Generalisatie wil hier zeggen dat bepaald gedrag ook plaatsvindt in situaties die een grote gelijkenis hebben met de oorspronkelijke situatie waarin het gedrag werd aangeleerd (in de verwachting dat het geleerde gedrag ook nu leidt tot beloning).
Discriminatie treedt op wanneer de situatie sterk lijkt op de oorspronkelijke situatie maar toch op een of meer punten zodanig afwijkt dat wanneer er wel gedrag plaatsvindt, dit niet wordt beloond. Discriminatie zegt dus ook iets over de kwaliteit van een leerproces, namelijk het vermogen om het geleerde niet te pas en te onpas te vertonen maar alleen wanneer dat zin heeft (bekrachtigd wordt).
De werking van straf is heel anders dan die van bekrachtiging. Straf heeft namelijk als effect, dat een respons alleen maar onderdrukt wordt en bovendien gekoppeld kan worden aan iets andersdan alleen het ongewenste gedrag. Angst voor straf kan bijvoorbeeld generaliseren naar de persoon die de straf toedient. We zien hier de invloed van cognitieve factoren bij de verwerking van stimuli in leerprocessen. Bovendien moet de toediening van straf ‘tijdcontingent’ zijn. Idealiter moet er een zo kort mogelijke tijd tussen het strafbare feit en de straf zelf bestaan, zoals iedereen weet die pas na zes weken een verkeersboete in de bus krijgt. De relatie tussen de overtreding en de straf is anders volledig verdwenen. Straf heeft dus niet altijd het gewenste effect, omdat er wel iets mee wordt afgeleerd maar geen nieuw, gewenst of beter aangepast gedrag mee wordt aangeleerd.
Nieuw gedrag kan totstandkomen via een proces van ‘trial and error’. Sommige spontane responsen hebben in een specifieke situatie meer bekrachtigende gevolgen dan andere. Geleidelijk aan blijft het gedrag met de meest bekrachtigende gevolgen over. Wanneer men nieuw en complex gedrag wil aanleren, is de kans echter klein dat dit gedrag spontaan plaatsvindt. In deze gevallen kan het uiteindelijk gewenste gedrag worden opgedeeld in elementaire, elkaar opvolgende ’stukjes’ gedrag. Vervolgens word elk stukje gedrag aangeleerd, waarbij het nieuw te leren gedragselement wordt toegevoegd aan de al geleerde elementen. Door middel van een dergelijke stapsgewijze benadering wordt het uiteindelijke gedrag aangeleerd. Dit proces wordt ‘shaping’ (vorming) genoemd. In de revalidatiegeneeskunde maakt men dankbaar gebruik van dit principe, bijvoorbeeld bij een patiënt die na een CVA opnieuw moet leren lopen of een patiënt die na een onderbeenamputatie moet leren lopen met behulp van een prothese. Elk onderdeel van het nieuwe gedrag wordt geoefend en beloond, tot een op zichzelf heel ingewikkeld motorisch proces weer even moeiteloos verloopt als vroeger.
Shaping is een van de meest toegepaste leerprincipes in de psychologie. Ook in de opleiding tot arts is shaping een fundamenteel leerprincipe. Op basis van shaping leer je steeds beter gesprekken met patiënten te voeren, maar bijvoorbeeld ook het testen van reflexen, het beluisteren van de longen, het toedienen van injecties, enzovoort. In alle situaties waar complexe vaardigheden moeten worden aangeleerd, zal steeds op een of andere wijze worden gebruikgemaakt van shaping.