Każdy, kto kiedykolwiek spróbował dobrze wyszkolić swojego psa, wie jakie to niełatwe zadanie. Równie niełatwe zresztą jest nauczenie dziecka, aby sprzątało po sobie. Czy takie zadania są w ogóle możliwe bez stosowania metod przymusu?

Karen Pryor udowadnia w swojej książce, że owszem, jak najbardziej – ba, możliwe jest uczenie zachowań nie tylko zwierząt uważanych za inteligentne, jak delfiny czy psy, ale też takich, które uważane są za „nietresowalne” – jak kurczaki czy nawet kraby. W dodatku opisywane metody nauczania są na tyle uniwersalne, że można je zastosować nie tylko do większości gatunków zwierząt, ale i do ludzi, a sam proces nauki kojarzy się pozytywnie – zarówno trenerowi jak i obiektowi, który jest szkolony.
Metody te, to wcielane w życie zasady behawioryzmu, nauki, która powstała w latach 30 ubiegłego wieku, a czołowym jej przedstawicielem był  Burrhus F. Skinner.

Karen Pryor, biolog z wykształcenia, ma bogate doświadczenia w dziedzinie tresury zwierząt. Swoją karierę w tej dziedzinie zaczynała układając psy i konie metodami tradycyjnymi, opartymi głównie na stosowaniu przymusu. Gdy zajęła się tresurą delfinów (w oceanarium Sea Life Park na Hawajach), okazało się, że żadnej z dotychczas używanych metod nie może zastosować w tym przypadku, gdyż niemożliwe jest stosowanie przymusu do nauczenia czegokolwiek delfina. Karen zajęła się zatem studiowaniem zasad treningu ze wzmocnieniem pozytywnym i stała się jego gorącą orędowniczką. Okazało się, że jest to metoda tak efektywna, a w dodatku przynosząca mnóstwo satysfakcji i trenerowi, i obiektowi uczącemu się, że za jej pomocą można osiągnąć rezultaty nieosiągalne przy zastosowaniu metod klasycznych.

Na czym polega metoda treningu ze wzmocnieniem pozytywnym?
W skrócie – na podawaniu naszemu obiektowi (którym może być zwierzę albo człowiek) pozytywnego czynnika wzmacniającego (czyli potocznie – nagrody) w momencie wystąpienia pożądanego przez nas zachowania. Czyli, gdy chcemy, aby pies przybiegał do nas na wołanie, nagradzamy go smakołykiem, gdy tylko zareaguje na komendę; gdy chcemy nauczyć dziecko sprzątania po sobie, chwalimy je za każdym razem, gdy wrzuci brudne skarpetki do kosza. Rodzaj stosowanych wzmocnień powinien być zróżnicowany i dostosowany do obiektu – musi to być coś, co danej osobie lub zwierzęciu sprawia przyjemność. Bardzo ważne jest też, żeby wzmocnienie podać w momencie wykonywania czynności, na którą oczekujemy, a nie wcześniej (wtedy jest to przekupstwo) ani zbyt późno (wówczas obiekt nie skojarzy nagrody z zachowaniem).

zdjecie z SXC Przy tresurze zwierząt często niemożliwe jest podanie wzmocnienia dokładnie w tym momencie, kiedy czynność powinna być nagrodzona, np. gdy chcemy utrwalić u delfina jakiś wyjątkowy element skoku, a wzmocnienie w postaci ryby może dostać dopiero po podpłynięciu do tresera. Ten problem rozwiązuje się wprowadzając tzw. wzmocnienie warunkowe. Jest to sygnał, który początkowo nic dla zwierzęcia nie znaczy – może to być dźwięk, światło lub ruch, który poprzedza podanie wzmocnienia. Aby uwarunkować sygnał (np. gwizdek) jako wzmocnienie, należy  najpierw używać go jednocześnie z nagrodą „za nic”, czyli np. za to, że zwierzę obdarza nas swoją uwagą. Delfin szybko skojarzy, że sygnał gwizdka oznacza podanie mu ryby i wówczas treser może dla zaznaczenia pożądanego elementu akrobacji gwizdnąć – gwizdek działa już jako wzmocnienie. Oczywiście ryba, którą zapowiada gwizdek, musi być podana, ale wówczas nie ma już znaczenia, że zwierzę dostanie ją później.

Wzmocnienie warunkowe daje ogromne możliwości uczenia zwierząt. Właściciele psów czy koni jako wzmocnienia warunkowego używają dźwięku klikera – małego pudełeczka z wygiętą blaszką, która wydaje charakterystyczny odgłos kliknięcia. Za pomocą klikera można szybko nauczyć psa umiejętności, które są niemożliwe do nauczenia przy zastosowaniu tradycyjnych metod przymusu; kliker stanowi świetne narzędzie przekazu informacji między człowiekiem a zwierzęciem. Zazwyczaj bowiem problem szkolenia polega na niemożności wytłumaczenia zwierzęciu, czego od niego chcemy.

Stosując wzmocnienie warunkowe można szybko nauczyć zwierzę zachowań, które dotychczas u niego nie występowały – proces taki nazywany jest kształtowaniem. Aby ukształtować jakąś czynność, trzeba ustalić sobie cele pośrednie i wzmacniać zachowania, które do nich prowadzą. Na przykład, chcąc nauczyć kurczaka „tańca”, trzeba najpierw obserwować uważnie jego ruchy i zacząć wzmacniać (czyli nagradzać np. ziarnkiem kukurydzy) wszystkie ruchy w lewo. Gdy kurczak zacznie coraz częściej skręcać w lewo (w myśl zasady, że zachowania wzmacniane występują częściej, natomiast niewzmacniane mają tendencję do zaniku), wzmacniamy tylko zwroty o 90 stopni, a jeżeli zdarzą się obroty o 180 stopni, wybieramy tylko te. Po ukształtowaniu procedury obejmującej kilkanaście pełnych obrotów, można uznać, że udało się wytrenować tańczącego kurczaka.

Kształtowanie zachowań nie jest rzeczą prostą. Autorka wymienia dziesięć zasad, których przestrzeganie jest warunkiem powodzenia w nauce – począwszy od stopniowego podnoszenia kryteriów, uczenia pojedynczych elementów zachowań po kolei, po umiejętne kończenie sesji treningowej (którą należy kończyć zawsze wtedy, gdy obiekt czyni postępy, co powoduje, że następna sesja przebiega z większym sukcesem). Jednak czas poświęcony kształtowaniu nie jest czasem straconym – trener wyrabia u siebie zmysł obserwacji, a u szkolonych zwierząt można wręcz zauważyć przebiegający proces myślenia.

Jako przykład możliwości uczenia tym sposobem Karen Pryor opisuje eksperyment, który swojego czasu był bardzo głośny, a polegał na ukształtowaniu za pomocą odpowiedniego wzmocnienia „twórczego myślenia” u delfinów. Do eksperymentu wybrano dwa delfiny w Sea Life Park. Wzmacnianiu podlegało każde zachowanie zwierząt, które było całkiem nowe i nie było wzmacniane wcześniej. Delfiny zorientowały się dość szybko, o co chodzi, i zaczęły prześcigać się w „wymyślaniu” niecodziennych zachowań. Wkrótce stało się to bardzo uciążliwe – delfiny nie poprzestały na widowiskowych skokach, ale zaczęły otwierać przepusty między basenami, przeskakiwać przegrody czy podkradać różne przedmioty z brzegu.

U ludzi procesy kształtowania to rzecz codzienna – procedury te wykorzystujemy wychowując dzieci, ucząc się wszelkich umiejętności fizycznych, od gry w tenisa po pisanie na maszynie. Dzięki radom zawartym w książce możemy sprawić, że proces uczenia będzie przebiegał szybciej i sprawniej, przy minimalnej ilości koniecznych powtórek.

Autorka rozwiewa też wątpliwości przeciwników metody behawioralnej, którzy uważają, że rozpoczynając naukę ze wzmocnieniem pozytywnym, aby podtrzymać i utrwalić wyuczone zachowania, trzeba stosować wzmocnienia do końca życia naszego obiektu. Nie jest to prawda – badania wykazują, że najlepszą metodą na podtrzymanie wyuczonego zachowania jest tzw. zmienna procedura wzmocnień.   Początkującemu trzeba podawać wzmocnienia jak najczęściej – na przykład, gdy dziecko uczy się korzystać z toalety, należy chwalić je często, ale gdy zachowanie to staje się naturalne, nie ma już takiej potrzeby. Dążąc do utrwalenia nabytej już umiejętności należy wzmocnienia podawać rzadziej i nieregularnie. Taki system ma znacznie wyższą skuteczność od procedury wzmocnień stałych i przewidywalnych.
Gdyby delfin dostawał rybę za każdy skok, akrobacje nie byłyby widowiskowe, gdyż zwierzę szybko zorientowałoby się, że nie opłaca się szczególnie wysilać, aby zasłużyć na nagrodę. Jeżeli wtedy nie dostanie ryby, przestanie skakać w ogóle. Jeżeli natomiast jeszcze w trakcie nauki zaczynamy podawać mu rybę po co drugim lub co trzecim skoku, bez zachowania stałego porządku, delfin będzie podwajał swoje wysiłki z nadzieją, że wreszcie coś dostanie. Skoki staną się bardziej dynamiczne, co pozwoli na ich selektywne kształtowanie i uzyskanie w efekcie skoków bardziej widowiskowych.
Moc procedur zmiennych jest podstawą wszelkiego hazardu – wystarczy, że gracz wygrywa co jakiś czas, aby podtrzymało to jego zapał do dalszej gry, z nadzieją na kolejną wygraną.

Na koniec Karen Pryor radzi, jak można pozbyć się różnych zachowań niechcianych (czyli rozwiązywać problemy behawioralne) i omawia 8 metod do tego prowadzących. Połowa z nich to metody negatywne, druga połowa – pozytywne. Listę otwiera metoda 1 – „Zastrzel bestię!” (Shoot the dog!), a kończy ósma, najtrudniejsza – „Zmiana motywacji”. Gdy naszym problemem jest np. to, że wspólokator rozrzuca brudne ubrania po całym domu, to stosując metodę 1 należałoby zmienić współokatora, gdy byłby to pies szczekający całą noc w ogrodzie – należałoby sprzedać psa lub go zastrzelić. Gdy nasze dzieci hałasują w samochodzie, to zgodnie z metodą 1 należałoby je wysadzić, niech idą pieszo lub jadą autobusem.
Zmiana motywacji to metoda dość subtelna, wymagająca najpierw analizy, jaka przyczyna stoi za danym zachowaniem, a to często nie jest sprawą prostą. Nawiązując do powyższych przykładów – szczekający pies prawdopodobnie jest samotny, znudzony lub wystraszony, należy więc bawić się z nim, wtedy zaśnie w nocy ze zmęczenia, można też załatwić mu towarzysza lub zabrać na noc do domu. Hałasujące dzieci można nakarmić, skłonić do zaśnięcia, ewentualnie zająć grami albo książeczkami; przy długich podróżach często zatrzymywać auto, aby dzieci mogły sobie pobiegać. Co do uciążliwego współlokatora – optymalnym rozwiązaniem może być zatrudnienie sprzątaczki, która zajmie się porządkami i problem prania przestanie istnieć; ewentualnie istnieje też opcja, że bałaganiarz ukształtuje u lubiącego porządek podejście do sprawy z większym dystansem. A perfekcjonista może kształtować zamiłowanie do porządku, gdy każdorazowo po zrobieniu prania przez bałaganiarza na przykład kupi parę piw i zaprosi gości płci przeciwnej.

Autorka sporo miejsca poświęca najpowszechniej stosowanej metodzie wychowawczej, a mianowicie karze. Mało kto uświadamia sobie, że kara w większości przypadków nie przynosi oczekiwanych wyników. Jeżeli ukaraliśmy dziecko, psa lub pracownika za dane zachowanie, a ono się powtarza, nie zastanawiamy się, co innego może zadziałać, lecz zazwyczaj zaostrzamy karę. Tymczasem jedną z przyczyn nikłej skuteczności kar jest fakt, że nie zachodzą one jednocześnie z zachowaniami, które mają eliminować, stąd obiekt często nie potrafi powiązać kary z zachowaniami – jest to regułą u zwierząt, a często dotyczy też ludzi. Ponadto kara (o ile nie jest zastosowana za późno) jest w stanie najwyżej przerwać niechciane zachowanie, ale nie niesie w sobie informacji, co zrobić, aby je poprawić. Zatem jeżeli rzeczywiście chcemy, by nasz obiekt – czy to będzie pies, dziecko, czy pracownik – zmienił coś w swoim zachowaniu, mamy do czynienia z problemem treningowym i lepiej wtedy sięgnąć po inne metody.

Karen Pryor zauważyła, że większość znanych jej treserów delfinów ma uderzająco spokojne i grzeczne dzieci. Stwierdziła, że jest to efekt takiej a nie innej pracy ze zwierzętami, gdzie ludzie uświadamiają sobie, że w celu osiągnięcia pożądanych celów wychowawczych nie trzeba wcale stosować kar (sama zresztą pod wpływem metod pracy w delfinarium przestała krzyczeć na dzieci, a zaczęła je nagradzać). Jak to zresztą celnie ujął jeden z jej znajomych: „Nie powinno się pozwalać na posiadanie dzieci ludziom, którzy przedtem nie tresowali kurczaków”.

Karen Pryor
Najpierw wytresuj kurczaka
Don’t shoot the dog. The new art of teaching and training.
Wyd. Media Rodzina, 2004
tłum. Bolesław Ludwiczak