Should I stay or should I go? Novità sull’intelligenza dei cavalli
Lo studio di etologia sperimentale sull’abilità dei cavalli di prendere decisioni, prevedendo gli eventi ed elaborando strategie vantaggiose
E’ stato fatto un importante passo avanti nella comprensione delle abilità cognitive dei cavalli, grazie a uno studio sperimentale che ne ha riportato le evidenze di capacità di decisione strategica.
Precedentemente, si pensava che i cavalli mancassero della capacità e della struttura cerebrale predisposta al ragionamento di tipo strategico. Abilità invece posseduta dai predatori, ecologicamente utile soprattutto per quelli che cacciano in gruppo, in quanto la “strategia” implica la previsione di come diverse azioni si combinino nel tempo (si pensi agli attacchi coordinate delle leonesse). Questa credenza era supportata dall’assenza di evidenze sperimentali che riconoscessero nel cavallo tale caratteristica.
Anche le intelligenze artificiali utilizzano dei modelli sui quali basarsi per fornire risposte appropriate agli utenti. Le IA sono state create dall’uomo. Quanto agli altri animali, l’uomo stesso sta ancora attivamente studiando come pensino, ragionino e come prendano decisioni.
Il “model-based strategic decision making” è un concetto usato per esprimere un comportamento seguito a un modello mentale di interpretazione del mondo, proprio di un qualunque individuo, che gli permette di fare previsioni sulle conseguenze delle proprie azioni. Tutti noi, di fronte a un problema da risolvere o una decisione da prendere, utilizziamo dei modelli mentali che abbiamo sviluppato durante nostra vita e che cambiano nel corso di essa in base alle nostre esperienze. Nel tempo gli studi sulla teoria della mente (Tomasello, 2013) e sulla coscienza di sé (Plotnik et al., 2006; Herman, 2012) hanno indagato e supportato scientificamente la presenza di modelli mentali anche nelle altre specie.
Lo studio
Nell’esperimento, chiamato “Stop-Signal paradigm” e portato avanti dalla ricercatrice della Nottingham Trent University, Louise Evans (Evans et al., 2024), venti cavalli sono stati testati per imparare a modificare il proprio comportamento in base delle conseguenze: in una prima fase, i cavalli dovevano eseguire un semplice compito, secondo il condizionamento precedentemente appreso; nella seconda fase, dove è stata inserita una penalità per ogni errore commesso, essi hanno iniziato a rispondere con più attenzione, modificando il proprio comportamento per commettere meno errori e, quindi, ottenere più ricompense.
Vediamo nel dettaglio la procedura dello studio.
In precedenza, ai cavalli era stato insegnato, tramite condizionamento con rinforzo positivo (del cibo) a toccare con il muso un bersaglio, rappresentato da una carta plastificata A3 bianca o nera. Oltre alla ricompensa, è stato associato un rinforzo secondario: a compito effettuato, oltre al cibo, veniva aggiunto il suono di un fischietto.
Quando il cavallo migliorava nell’esecuzione del compito, il bersaglio veniva proposto in diverse angolazioni e non solo di fronte al cavallo, per essere certi che esso avesse compreso ottimamente la direttiva del compito.
Qui inizia l’esperimento “Stop-Signal Paradigm”. Sono state previste 40 sessioni per cavallo, in cui si alternavano in modo equilibrato due situazioni diverse, o “contingenze”.
Nella prima, “Go” i cavalli dovevano toccare il bersaglio come erano abituati a fare, e ricevevano i rinforzi come al solito.
Durante la seconda contingenza, “Stop”, i cavalli avrebbero dovuto restare fermi, senza toccare il bersaglio (inibizione del comportamento prima appreso). Durante questa fase, è stato acceso un segnale luminoso, una luce LED posta di fronte al cavallo in modo che fosse ben visibile. La luce, che non colpiva i cavalli negli occhi, rappresentava il segnale di “Stop”. In questa fase il cavallo avrebbe dovuto inibire il proprio comportamento di toccare il bersaglio, ed ogni tentativo di farlo sarebbe stato un errore.
Nella prima fase dell’esperimento, a cui i cavalli erano sottoposti a un numero variabile ma equilibrato di entrambe le contingenze, avrebbero ricevuto il solito premio se avessero giustamente toccato il bersaglio durante la contingenza “Go”, mentre non avrebbero ricevuto nulla, né premio né punizione, se l’avessero toccato comunque durante la contingenza “Stop”.
Nella seconda fase è stata introdotta una punizione negativa, ovvero la rimozione di uno stimolo piacevole per diminuire la probabilità che il comportamento indesiderato si ripresenti.
Cioè, se il cavallo avesse toccato il bersaglio durante la contingenza “Stop”, sbagliando, sarebbe stato applicato un time-out, durante il quale il trainer che reggeva il bersaglio si allontanava dal cavallo interrompendo l’esercizio. Durante il time-out, il cavallo non aveva la possibilità di fare nulla per ricevere dei premi. Ciò, in questo studio, rappresentava la punizione negativa.
La contingenza “Go” invece era uguale alla prima fase: il cavallo doveva toccare il bersaglio e riceveva il premio.
I risultati hanno mostrato che, durante la seconda fase, grazie alla presenza della penalità, i cavalli hanno imparato velocemente a correggere i propri errori, inibendo il proprio comportamento precedentemente condizionato (toccare il bersaglio) riconoscendo il segnale inibitorio (la luce).
L’introduzione di un costo nella contingenza (il time-out), ha portato il cavallo a fare velocemente una valutazione sulle conseguenze delle proprie azioni, e così a sviluppare risposte più appropriate al contesto. E ha portato noi a capirlo un po’ di più, allontanandoci dall’immagine del meccanicismo dato dal condizionamento o dall’idea di un animale che prende decisioni basandosi solo sulla propria esperienza passata.
di Carolina Signorelli
Scrivi un commento