Tavoitteena toiminnasta palkkautuva koira

Kirjoittaja Mirja Leinikka 18 syyskuu, 2021

Tavoitteena toiminnasta palkkautuva koira

Canis-lehdessä 03/2016 julkaistu Mirja Leinikan artikkeli.

Miltä kuulostaisi tilanne, jossa koira toistaa pitkää tehtäväsarjaa palkatta, tehtäviään motivoituneesti suorittaen ja tehtäväsarjan jokaisesta osasta palkkautuen? Entä jos lajiharrastuksissa ei tarvitsisikaan kantaa huolta siitä, kuinka pitkiä ketjuja on koiransa kanssa tottunut palkatta harjoittelemaan, vaan koira palkkautuisikin koko ajan tehtäviä suorittaessaan?

Positiivisen vahvistamisen kouluttajat ovat tottuneet siihen, että naksuttimen ääntä on aina seurattava palkkio. Jos naksuttimen äänen ja palkkion välinen yhteys katoaa, äänellä ei kohta enää ole koiralle merkitystä. Siksi myös sellaisissa tilanteissa, joissa kouluttaja naksuttaa koiralle väärästä asiasta, on koiralle toimitettava palkkio, jotta naksuttimen ja palkkion välinen yhteys ei katoa.

Miten siis voidaan päätyä tilanteeseen, jossa naksuttimen ääni, tai mikä tahansa muu palkkioon yhdistetty signaali voisikin toimia koiralle yhtä vahvana palkkiona kuin vaikkapa nami tai leikki? Mistä on kyse, jos toivottu käyttäytyminen lisääntyy, kun koira kuulee ihmisen sanovan “hyvä”,  tai kun ihminen taputtaa käsiään yhteen tai vaikkapa nostaa peukalonsa ylös?

Ken Ramirez on yhdysvaltalainen neroksikin tituleerattu eläinten kouluttaja, jolta ei merittejä puutu. 

Hän on luonut menetelmän nimeltä Smart Reinforcement, joka opettaa ihmisiä käyttämään erilaisia vahvisteita luovasti ja tehokkaasti. Ramirezin menetelmään kuuluu olennaisena osana myös niin sanottujen korvaavien vahvisteiden (reinforcement substitutes) opettaminen eläimelle. Korvaavien vahvisteiden kautta voidaan aikaansaada tilanne, jossa eläin toistaa pitkiäkin käyttäytymisketjuja ilman varsinaisia palkkiota, ja palkkautuu silti koko ajan. Käyttäytymisketjuja siis toistetaan siten, että eläimelle ei toimiteta kertaakaan varsinaista primäärivahvistetta kuten namia tai lelua ja silti eläin palkkautuu koko ajan. Varsin tavoiteltava tilanne ajateltaessa mitä tahansa lajiharrastusta, kuten vaikkapa tottelevaisuuskokeita.

Mikä on korvaava vahviste?

Jos ajatellaan naksutinta ja korvaavaa vahvistetta, puhutaan tieteen näkökulmasta yhdestä ja samasta asiasta. Molemmat ovat sekundäärisiä palkkioita, siis signaaleja, jotka edeltävät ensisijaista vahvistetta. Ensisijainen vahviste on puolestaan vaikkapa nami tai leikki, tai sitten jotakin toimintaa jota koira tavoittelee.

Koska sekä naksuttimella että korvaavalla vahvisteella, sekä muilla koulutuksessa käytettävillä signaaleilla on jokaisella oma tarkoituksensa, ne voidaan kaikki kouluttaa myös siten, että niiden merkitys on eläimellekin selvä - edellyttäen, että kouluttaminen toteutetaan huolella.

Ihmisten maailmassa erinomainen esimerkki korvaavasta vahvisteesta on raha. Seteli on useimmille ihmisille hyvinkin merkityksellinen asia, erityisesti mitä suuremmasta setelistä on kyse. Seteli itsessään on kuitenkin vain pala paperia, mutta sen vahvistava merkitys syntyy siitä, mitä tuo pala paperia meille mahdollistaa.

Jos pienelle lapselle annetaan seteli kouraan, hän tuskin ymmärtää sen arvoa. Setelin arvo siis myös opitaan. On myös luultavaa, että jatkamme toimintaa, jos meitä palkitaan sen suorittamisesta seteleillä. Toiminnan välissä emme tarvitse ensisijaisia palkkioita, jotka nuo setelit meille mahdollistavat. Seteli on korvaava vahviste, jonka kautta saavutamme jonkin tavoittelemamme asian.

Myös koiralle voidaan opettaa, että rahan kaltaisia korvaavia vahvisteita on olemassa.

Miten korvaavat vahvisteet opetetaan?

Korvaavien vahvisteiden kanssa toimiminen voi aluksi tuntua korkeammalta matematiikalta, ja sitä se jossain määrin onkin. Ramirez kertoo, ettei opeta näiden vahvisteiden käyttöä aloitteleville kouluttajille, vaan ainoastaan kokeneille ja taitaville sellaisille. Korvaavien vahvisteiden opettamisen teoriaan perehtyessä voi vierähtää tovi jos toinenkin ennenkuin menetelmän perusteet alkavat olla selvillä. 

Käytännössä opettaminen on kuitenkin helppoa - vahvisteet opetetaan eläimelle täsmälleen samalla tavalla kuin naksuttimen ääni. Jos siis koiralle haluaa opettaa, että taputtaminen on vahviste, taputetaan, ja toimitetaan koiralle tämän jälkeen palkkio. Useat toistot varmistavat sen, että taputuksen ja palkkion välille syntyy merkitys.

Ramirez suosittaa, että koiralle koulutetaan tähän tapaan useita korvaavia vahvisteita - tämä siksi, että kun niitä ryhdytään lisäämään itse koulutusprosessiin, olisi hyvä että vahvisteita olisi käytössä useita, jotta niitä voidaan vaihdella. Korvaaviksi vahvisteiksi kannattaa valita joko asioita, jotka ovat eläimelle uusia ja merkityksettömiä, tai asioita, joita eläin jo valmiiksi tuntuu pitävän positiivisina. Vahvisteiksi kannattaa opettaa myös eläimelle jo entuudestaan tuttuja pieniä temppuja - opetusprosessi ei tällöin eroa mitenkään normaalista koulutusprosessista. Temppujen käyttäminen palkkiona perustuu myös Premackin periaatteeseen - kun heikosti osattua asiaa seuraa jokin tuttu ja vahva temppu, heikko asia vahvistuu.

Vahvisteeksi ei kannata opettaa asiaa, jota ihminen tekee tai sanoo joka tapauksessa usein. Toisinsanoen, jos itsellä on tapana viljellä vaikkapa hyvä-sanaa useissa eri tilanteissa, tästä sanasta ei kannata opettaa korvaavaa vahvistetta.

Miten korvaavat vahvisteet otetaan käyttöön?

Kun koiralle on opetettu, että ihmisen taputtamisesta, ylöspäin osoittavasta peukalosta tai tietyistä sanoista seuraa palkkio, on aika siirtyä vahvisteiden käyttöönoton puolelle. Käytännössä taputuksia, ylöspäin osoittavia peukaloita ja muita vahvisteita ryhdytään käyttämään nimensä mukaisesti palkkion korvikkeina, kun koiraa pyydetään tekemään jotakin asiaa. 

Käyttöönottovaiheessa tapahtuvat Ramirezin mukaan suurimmat korvaavien vahvisteiden käyttöön liittyvät virheet - syynä on useimmiten se, että vahvisteita ylikäytetään, tai että on oletettu että eläin oppii muutamassa koulutustuokiossa pitämään korvaavaa vahvistetta palkkiona. 

Vahvisteet otetaan käyttöön vaiheittain. Ensin koiraa pyydetään vaikkapa menemään maahan, josta se palkitaan ensin vaikkapa käsien taputtamisella, ja sen jälkeen ensisijaisella vahvisteella, eli vaikkapa namilla tai lelulla.

Hiljalleen korvaavia vahvisteita aletaan uittaa harjoituksiin mukaan yhä enemmän ja enemmän kuitenkin niin, että korvaavaa vahvistetta ei käytetä enempää kuin ensisijaista vahvistetta. Ramirezilla on tarkat kaavat siihen, mihin kohtiin ja kuinka paljon ensisijaisia palkkioita voi korvata korvikkeilla, ja tässä kohdin tarkka kirjanpito koulutuksen etenemisestä on suureksi hyödyksi. Korvaavien vahvisteiden käyttöönotto ei tapahdu muutamassa koulutustuokiossa - koirasta ja ohjaajasta riippuen aikaa kuluu eripituisia aikoja. Yleisesti puhutaan kuitenkin puolen vuoden tai vuoden mittaisesta ajanjaksosta.

Salaperäinen suhde

Merkittävin syy korvaavien vahvisteiden käytön epäonnistumiselle on kouluttajan ja eläimen välinen suhde. Suhteen merkitys tulee Ramirezin mukaan esille esimerkiksi tarinassa, jossa miekkavalas esiintyi kahdessa eri näytöksessä kahden eri kouluttajan ohjauksessa. Ensimmäinen kouluttaja vei näytöksen läpi valasta korvaavilla vahvisteilla palkaten nuoremman kouluttajan seuratessa tätä taidonnäytettä vierestä. Valas suoritti kokeneen kouluttajan kanssa peräjälkeen useita eri temppuja, edeten viimeisenä olleeseen temppuun, jossa kouluttaja rapsutti kädellään valaan kieltä tämän pitäessään suutaan auki. Tempun päätteeksi kouluttaja palkitsi valaan kalalla. Toinen nuorempi kouluttaja halusi kokeilla seuraavassa näytöksessä samaa - siis pyytää valasta tekemään temppuja toisensa perään palkatta. Näytös etenikin viimeiseen temppuun saakka, jolloin nuorempi kouluttaja asetti kätensä valaan suuhun rapsuttaakseen sen kieltä, ja silloin valas pamautti suunsa kiinni. Valitettavasti nuoremman kouluttajan ura loppui tähän.

Syy tähän epäonniseen tapahtumaan löytyy Ramirezin mukaan kouluttajan ja valaan välisestä suhteesta -  vanhemman kouluttajan ja valaan välillä oli molemminpuolinen luottamussuhde, ja kouluttaja osasi lukea valaan elekielestä, voiko hän pyytää valaalta vielä lisää ilman että hän palkitsee valaan välissä. Nuorempi kouluttaja keskittyi mekaaniseen suorittamiseen, eikä hänen ja valaan välille ollut ehtinyt kehittyä vastaavaa suhdetta. 

Suhde on asia, jota tiede osaa huonosti selittää ehkäpä siksi, että kysymys on kahden elollisen yksilön tunteista ja heidän välisestä luottamuksesta. Siksi suhde on myös asia, jota helposti väärinkäytetään vaikkapa ongelmakäyttäytymisten syiden selittäjänä. 

Suhteen merkitys tulee helposti selville esimerkiksi silloin, jos vaikkapa omaa koiraa ohjaakin joku toinen - koira ei välttämättä osaakkaan sille opetettuja asioita, jos niitä pyytää oman ohjaajan sijaan koiralle vieras ihminen.

Lopputuloksena toiminnasta palkkautuva koira

Ramirez suosittaa kouluttamisessa seuraamaan neliaskelista portaikkoa, jonka kautta luodaan sekä luottamussuhde kouluttajan ja eläimen välille, että esitellään ja opetetaan eläimelle uusia korvaavia vahvisteita. Prosessi alkaa tutustumisesta, ja eläimen tekemän toiminnan jatkuvasta vahvistamisesta - koira saa siis ensisijaisia palkkioita kaikesta siitä, mitä kouluttaja siltä pyytää. Seuraavassa vaiheessa eläimelle ryhdytään esittelemään ja opettamaan korvaavia vahvisteita. Kolmannessa vaiheessa uudet vahvisteet otetaan hitaasti ja rauhallisesti koulutushetkiin käyttöön ja neljännessä vaiheessa voidaan ryhtyä käyttämään myös muita hyvin opittuja asioita, kuten pieniä temppuja palkkioina.

Parhaimmillaan korvaava vahviste johtaa tilanteeseen, jossa eläintä palkitaan koko ajan ja itse toiminnasta tulee eläimelle palkitsevaa. Tilanne eroaa perinteisestä ketjuttamisesta siten, että ketjutettaessa koiralta pyydetään yhtä tai useampaa asiaa yhtä palkkiota vastaan. Ketjuttamisessa koira ei voi koskaan tietää milloin palkkio tulee, ja se voi aiheuttaa koirassa epätietoisuutta ja sitä kautta turhautumista. Korvaavia vahvisteita käyttämällä koiran ei tarvitse miettiä saako se palkkion vaiko ei, kun sitä palkitaan käytännössä koko ajan.

Lopputulos on siis sekä ketjuttamisen että korvikevahvisteiden kautta koulutettuna samanlainen, mutta tavasta jolla eläin tehtäviä suorittaa löytyy merkittävä ero. Korvaavia vahvisteita hyödyntämällä eläin saadaan nauttimaan työnteosta ja itse tehtävän suorittamisesta. 

P.S. Kurkkaa myös Ramirezin oppeihin perustuva verkkoluento: Sosiaalinen palkitseminen - mystiikasta käytäntöön :)
Mirja Leinikka
Mirja Leinikka

Kirjoittaja

Mirja Leinikka on intohimoinen koiraharrastaja ja kouluttaja. Hän kilpailee koiriensa kanssa agilityssä, rally-tokossa ja tokossa, ja harrastaa myös muita lajeja. Mirja on opiskellut eläinten kouluttamista ja käyttäytymistä aikuisiällä, ihmisten valmentamista puolestaan työurallaan yritysmaailmassa. Syy eläinten kouluttamisen opintojen aloittamiseen on ollut loputon mielenkiinto siihen, kuinka me ihmiset voimme parantaa eläinten kokonaisvaltaista hyvinvointia ja opettaa niille mitä ihmeellisimpiä asioita. Mirja on opiskellut eläinten kouluttamista pääasiassa Suomessa, mutta viime vuosina hän on pyrkinyt kouluttautumaan myös ulkomaisilla kursseilla. Tämän on tehnyt mahdolliseksi jäsenyys kansainvälisessä IAABC organisaatiossa (International Association of Animal Behavior Consultants).Ilotraining-blogi -blogissa sinua saattavat kiinnostaa myös:

Koiran stressi ja selviytymisstrategiat
Koiran stressi ja selviytymisstrategiat

Kirjoittaja Mirja Leinikka 21 elokuu, 2022

Lue lisää

Onko ihminen eläin?
Onko ihminen eläin?

Kirjoittaja Mirja Leinikka 21 marraskuu, 2021

Lue lisää

Mitä on luottamus?
Mitä on luottamus?

Kirjoittaja Mirja Leinikka 21 marraskuu, 2021

Lue lisää