OPERANTTI EHDOLLISTUMINEN

= välineellinen/instrumentaalinen ehdollistuminen = skinneriläinen ehdollistuminen

  • teorian perustana on syy-seuraussuhteen oppiminen: koira oppii, että sen tekemisillä on jokin seuraamus

  • seuraamukset vaikuttavat koiran toimintaan tulevaisuudessa

  • toiminnot vahvistuvat ehdollistamisen myötä, tulevat todennäköisemmiksi

  • ei ole olemassa tiettyä hetkeä, jolloin koira saa oivalluksen esim. mitä istuminen on, vaan koiralla saattaa olla vahva istuminen, heikko istuminen tai ei ollenkaan istumista

  • kouluttaminen muuttaa todennäköisyyksiä, ei siirrä tietoa

  • ihmisen lihas ei ymmärrä, että painojen nostaminen tekee siitä vahvemman, se ehdollistuu/vahvistuu harjoittelun myötä

  • ei pelkkä input-output –malli, mutta helpoin tapa selittää kuinka koira oppii (ja ihmiset)
     

  • periaatteessa suurin osa kouluttamisesta on operanttia kouluttamista: koiran käyttäytymisen seuraamuksia muokataan

  • operantti kouluttaminen yhdistetään usein siihen, että koiralle ei aiheuteta mitään ärsykettä, joka saa sen toimimaan vaan koira toimii itse, jonka jälkeen tapahtuu jokin seuraamus

       

koira istuu --> se saa ruokaa 

reaktio --> seuraamus

 

  • klassisessa ehdollistumisessa tilanne olisi esim. seuraava

 

       

ohjaaja ohjaa koiran kädellään istumaan --> koira istuu --> se saa ruokaa
ärsyke --> reaktio --> seuraamus

 

  • ko. tilanteessa ohjaaja AIHEUTTAA koiran käytöksen muuttumisen (reaktion) omalla toiminnallaan, mikä eroaa operantin ehdollistumisen ajatuksesta (reaktio - seuraamus)

  • kuitenkin perusajatus (reaktio - seuraamus) on molemmissa olemassa eli tämän perusteella kouluttamisessa on lähes aina mukana operantti puoli

  • lisäksi koulutuksessa yhdistetään myöhemmin klassista ja operanttia ehdollistumista: käsky - toiminta - seuraamus, jossa
    käsky - toiminta = klassista
    toiminta - seuraamus = operanttia
     

  • naksutinkoulutusta kuvataan usein operantiksi ehdollistumiseksi positiivisen vahvistamisen avulla, jossa merkkiäänenä käytetään naksutinta

  • tuolloin halutaan koiran itsensä tarjoavan käytöksiä (niitä ei aiheuteta koiralle), vahvistetaan koiran oikeaa toimintaa naksauttamalla, kun koira tekee oikein (ja sen jälkeen koira saa palkkion eli ehdottoman vahvisteen)

Toiminnan seuraamukset

 

1. HYVÄT seuraamukset -> tavoitteena lisätä toimintaa

2. PAHAT seuraamukset --> tavoitteena vähentää toimintaa

3. NEUTRAALIT seuraamukset

  • Eläimet oppivat nopeasti, mitkä käytökset ovat niiden kannalta kannattavia ja mitkä eivät ole

  • Koulutuksessa tämä tulee esille siinä, että KOULUTTAJA hallitsee koiran toiminnan seuraamuksia

  • Jos kouluttaja haluaa jonkin koiran tekemän asian toistuvan useammin, hän tarjoaa koiralle mukavia seuraamuksia

  • Jos kouluttaja haluaa jonkin koiran tekemän asian toistuvan harvemmin, hän tarjoaa koiralle epämukavia seuraamuksia tai ei ainakaan mukavia seuraamuksia

Termejä

  • koira tekee sitä, mikä kannattaa: maksimoi hyvät asiat ja minimoi pahat asiat

  • palkkio = hyvä seuraamus: on melkein sama kuin vahviste, mutta epämääräisempi. Vahvistaminen viittaa siihen, että käytös lisääntyy.

  • rangaistus = ikävä seuraamus: samalla tavalla epämääräinen, parempi voisi olla tukahduttaja (suppressment)

  • helppouden takia yleensä käytetään termeinä palkkiota ja rangaistusta

Käytöksen todennäköisyys lisääntyy

Käytöksen todennäköisyys vähenee

R+ = positiivinen vahvistaminen

  • hyvät asiat alkavat (palkkiot)

  • koira istuu -> nami (R+) -> istumisen todennäköisyys kasvaa

P+ = positiivinen rankaisu

  • pahat asiat alkavat

  • koira ei istu vaan seisoo -> kiskotaan hihnasta (P+) -> seisomisen todennäköisyys vähenee

R- = negatiivinen vahvistaminen

  • pahat asiat loppuvat

  • koira seisoo -> kiskotaan hihnasta (P+) -> koira istuu -> ei kiskota enää hihnasta (R-) -> istumisen todennäköisyys kasvaa

P- = negatiivinen rankaisu

  • hyvät asiat loppuvat

  • koira ei istu vaan seisoo -> palkkio pois (P-) -> uudelleen ja kun koira istuu -> palkkio (R+) -> seisomisen todennäköisyys vähenee

  • positiivinen ja negatiivinen vahvistaminen ovat molemmat hyviä mitä koiraan tulee ->  lisäävät käytöstä

  • positiivinen ja negatiivinen rankaisu ovat molemmat koiran kannalta pahoja -> vähentävät käytöstä

  • ero positiivinen vahvistaminen (palkitseminen) ja lahjominen: lahjomisessa palkkio näytetään ennen käytöstä, vahvistetaan "liian aikaisin", lupaillaan kaikenlaista (vrt. jumpstart)

  • vahvistaminen voi olla sisäistä (intrinsic) tai ulkoista (extrinsic):

    • sisäinen vahvistaminen sisältyy käytökseen itseensä, esim. pallon tai kissan jahtaaminen itsessään palkitsevaa

    • ulkoinen vahvistaminen tapahtuu käytöksen ulkopuolelta, mukavat ja epämukavat asiat mitä koiralle tarjotaan
       

  • erittäin halutut palkkiot -> voivat helpottaa yksinkertaisten käytösten omaksumista, mutta vaikeuttaa monimutkaisempien käytösten opettamista.

  • esim. suuret ruokamäärät -> innokasta toimintaa kun ruoka käsillä, mutta sammuminen helpompaa, kun ruokaa ei enää paikalla -> siksi pienet palkkiot parempia opettamisessa

  • myös hitaampi ja tasaisempi oppiminen on vahvempi sammumista vastaan

  • sovellus: helppo toiminto -> koira voi olla kiihtyneempi opetettaessa, vaikea ja monimutkainen käytös -> rauhallisempi opetettaessa (vrt. deprivaatio)

Yhteenvetotaulukko

 

Positiivinen vahvistaminen

Positive reinforcement

   R+

Käytöstä vahvistetaan tuottamalla miellyttävä seuraamus

Lisää käytöstä

Negatiivinen vahvistaminen

Negative reinforcement

   R-

Käytöstä vahvistetaan välttämällä tai lopettamalla epämiellyttävä seuraamus

Lisää käytöstä

Negatiivinen rankaisu

Negative punishment

   P-

Käytöstä heikennetään poistamalla miellyttävä seuraamus

Vähentää käytöstä

Positiivinen rankaisu

Positive punishment

   P+

Käytöstä heikennetään lisäämällä epämiellyttävä seuraamus

Vähentää käytöstä

 

Premarckin periaate

  • käytös, joka esiintyy korkealla todennäköisyydellä -> voi vahvistaa käytöstä, joka esiintyy heikommalla todennäköisyydellä

  • ”syö vihannekset ja saat jälkiruokaa”

  • hyvä seuraamus voi vahvistaa edeltävä ei-niin-kivaa asiaa

  • koira saa tokossa esim. palkkioksi tehdä sellaista, jota se normaalisti ei saa tehdä (hyppiä vasten, nuolla…)

  • monia tällaisista palkkioista ei ole helppoja käyttää (life rewards): pääsee nuuskimaan hajuja, pääsee ulos, pääsee juoksemaan, pääsee pissalle, pääsee ihmisten tai koirien luokse tai kauemmaksi heistä...)

  • liikkeiden käyttö palkkiona: toisia liikkeitä tulee vahvistettua enemmän kuin toisia. "Aktiiviset" liikkeet toimivat hyvin "staattisten", paikallaanpysyvien palkkiona. Esim. koiran voi palkita paikallaolosta seuraamisella (jos seuraamista ei tehdä liian pitkään ja se on koiran mielestä mukavaa). Toinen esimerkki luoksetulo, jossa koirat yleensä pitävät enemmän luoksetulosta kuin paikallaistumisesta -> paikallaistuminen vahvistuu, kun koira saa sen jälkeen tulla luokse. Jos koira joutuu istumaan tultuaan eteen -> koira liikkuu korkeasti vahvistetusta (luoksetulo) toiminnasta heikompaan (edessäistuminen) -> kokonaisvaikutus voi olla rankaiseva -> ei loppuasentoa joka kerta tai sitten pitää vahvistaa edessäistumista paljon, jotta se ylittäisi luoksetulon mukavuusrankingissa.

Opittu laiskuus / avuttomuus (learned laziness / helpness)

  • jos vahviste ja reaktio tapahtuvat toisistaan riippumatta eli esim. annetaan koiralle nameja huolimatta siitä, mitä se tekee; koira ei voi ennakoida tuleeko vahviste vai ei tekemisestään (laiskuus)

  • sama jos käytetään rangaistuksia reaktioista riippumatta, ennalta-arvaamatta (avuttomuus)

  • koe: koira laatikossa ja sähköiskuja satunnaisesti – koira sekosi ja sitten lamaantui täysin = opittua avuttomuutta <- rangaistus tulee huolimatta siitä, mitä tekee, masentuu. Ihmisillä sama asia ehkä syynä masennukseen, ihan sama mitä tekee, ei vaikutusta tuleviin tapahtumiin (perheväkivalta, keskitysleirit, rahattomuus, työttömyys). (Pakkokoulutetut koirat, joilla rangaistuksia tulee satunnaisesti/huonosti -> masentunutta työskentelyä pahimmillaan vrt. iänkaikkisen vanhat koulutusfilmit, koirien ilmeet ja eleet kokeissa)

  • jos em. koiralle annetaan myöhemmin mahdollisuus paeta sähköiskuja – ei tee sitä – makaa vain paikoillaan. Ei osaa yhdistää asioita toisiinsa, ei osaa hallita käytöstään

  • koiranpennuille huomiota, rapsutuksia ja nameja ilman selkeää yhteyttä niiden ja käytöksen välillä -> saattaa antaa pennuille mielikuvan, että käyttäytymisellä ei ole merkitystä palkkioiden saamiseen -> helpommin näille ongelmakäytöksiä vanhempina, vaikeampia kouluttaa aikuisena

  • vahvisteiden / rankaisujen jakaminen ilman ennakoivia vihjeitä / yhteyttä käytöksiin -> koira tuntee menettävänsä kontrollin tapahtumien suhteen -> haittaa oppimista, tulevat varovaisemmiksi ja hermostuneemmiksi tms. riippuen mitä jaellaan

Opittu välinpitämättömyys (learned irrelevance)

  • samantapainen habituaation kanssa

  • erona habituaatioon se, että spontaani palautuminen ei todennäköistä
     

  • kaksi koiraa, joille halutaan opettaa luoksetulo

  • testi: toinen koira on kuullut kutsun monta kertaa aikaisemmin – on huudettu ”tule”, koska se on häkissä lähellä koulutuskenttää ja kuulee siellä ko. huudon. Sillä ei ole merkitystä koiralle, koska siihen ei ole liittynyt mitään seuraamuksia

  • toinen koira ei koskaan ole kuullut kutsua

  • koira joka on kuullut käskyn aikaisemmin -> oppii hitaammin

  • koira on oppinut olemaan noteeraamatta ko. käskyä = opittu välinpitämättömyys

  • johtaa hitaampaan oppimiseen, jos ärsyke liitetään harjoitteluun (sama kutsusana)

  • tehokasta!

  • Eläimet oppivat olemaan välittämättä ärsykkeistä, jotka eivät ole niille tärkeitä

  • Koulutuksessa käytetään monesti käskyjä opettamatta koiralle, mitä ne tarkoittavat – koira kuulee sanan monta kertaa ennen seuraamusta --> välinpitämättömyys sanaa kohtaan

Klassista vai operanttia ehdollistumista?

  • koirien koulutus sisältää aina molempia ehdollistumisia

  • tahallaan manipuloidaan seuraamuksia (operanttia)

  • yhdistetään sanat ja signaalit toimintaan (klassista)

  • esim. koiran hihnan poimiminen voi sisältää klassista ehdoll. --> koira tulee iloiseksi, jännittyneeksi, odottaa ulospääsyä -> käytöstä vahvistetaan operantisti pääsyllä kävelylle

  • suurin osa koirien koulutuksesta käsittelee operanttia ehdoll.

  • klassinen ehdoll. kuitenkin muistettava, ettei esim. yritetä ehdollistaa käytöksiä, jotka eivät sovi yhteen vahvisteen laukaisemien käytösten kanssa

  • koulutuksessa koira voi tuottaa reaktioita, jotka riitelevät haluttujen reaktioiden kanssa

  • jos ne ovat klassisen ehdoll. tulosta -> voidaan ehkä muuttaa niitä sitä kautta

  • etuja, jos opettaa käyttäytymistieteiden periaatteita hyödyntäen:

  • koirat aktiivisia oppimisessa

  • koirat luottavaisia ja optimistisia

  • luodaan kommunikaatiosysteemi koiran ja ohjaajan välille

Thorndiken lait

Vaikutuksen laki: ärsyke - reaktio -yhteyttä voimistaa tai heikentää seuraamusten laatu

Harjoituksen laki: reaktio vahvistuu onnistuneiden toistojen myötä

Valmiuden laki: jos eläin on valmis toimimaan -> toiminta on tyydyttävää eläimelle. Jos eläin ei saa toimia vaikka olisi valmis -> eläin tulee miedosti rangaistuksi tai turhautuneeksi

Guthrien teoriaa

  • vahvistavan tapahtuman arvo (miellyttävä/epämiellyttävä) on siinä, mitä se tekee käytökselle

  • teorioissa mukana huonojen tapojen korvaaminen: eristetään käytöksen aiheuttava vihje ja yhdistetään se/ne toiseen käytökseen (eli vastaehdollistumista)

  • rankaisun käytöstä väärällä voimakkuudella -> voi lisätä väärän tekemistä tekemällä siitä entistäkin jännittävämmän (esim. rajuista leikeistä pitävä koira saattaa vain innostua epävarmasta komentamisesta)

  • rankaisuja käyttävä ihminen voi yhdistyä itsekin rankaisuun mukaan, on osa sitä ja herättää negatiivisia tuntemuksia

  • negatiivinen adapataatio, nykyään systemaattista poisherkistämistä (ärsykkeen voimakkuuden lisääminen vähitellen), mukana hänen tutkimuksissaan

  • reaktion väsyminen (fatigue) tai negatiivinen harjoittelu: käsketään toistamaan ei-toivottua käytöstä yhä uudelleen, jolloin se ei enää ole mukavaa (esim. pikkutyttö piti tulitikuilla leikkimisestä -> joutui raapimaan niitä vaikka kuinka paljon -> ei enää halunnutkaan koskea tikkuihin). Sama voi vahingossa tapahtua, jos koiran kanssa harjoitellaan liian pitkiä pätkiä kerrallaan ja liikaa samoja asioita toistaen.

Tolmanin pohjalta...

  • apinatesti: näytettiin banaani, joka piilotettiin purkin alle (2 purkkia esillä). Löysi helposti banaanin. Sitten apina pois ja banaani vaihdetiin toiseen herkkuun -> löysi sen -> ei huolinut, koska odotti löytävänsä banaanin - etsi banaania.

  • eläin yhdistelee asioita mielessään ja siksi "tietää" mitä sen pitäisi löytää/saada mistäkin missäkin yhteydessä

  • esim. nomekoiralle hakualue - nähnyt sinne vietävän riistaa -> onkin dameja tai dameja ja riistaa sekaisin -> ei ehkä ota dameja, koska odottaa löytävänsä riistaa -> siksi näitä ei yleensä sekaisin treeneissä (ellei opeteta että voi olla molempia)

  • palkitaan koira sillä, millä on sitä esim. houkuteltu (ei näytetä palloa ja saakin namia), opetetaan erikseen, että voi tulla erilaisia palkkioita

Skinner

  • mittasi käytöksiä

  • Skinnerin laatikko

  • lakeja mm. jos toimintoa seuraa vahvistavan ärsykkeen esiintyminen -> toiminto vahvistuu ja päinvastoin