Salta ai contenuti

Cognizione sociale: apprendimento per osservazione, imitazione, trasmissione culturale

Nessun bambino reinventa il fuoco. Nessun apprendista falegname riscopre da solo come si tempra un cesello. Una specie che non sa imparare guardando un’altra mente non costruisce piramidi e non scrive compilatori. Questo capitolo ricostruisce i meccanismi cognitivi che rendono possibile la trasmissione culturale, dal pupazzo gonfiabile che cambia la psicologia sperimentale negli anni Sessanta fino al fenomeno per cui un large language model collassa se viene addestrato sui propri output.

Il capitolo precedente ha ricostruito la theory of mind — la capacità di attribuire stati mentali ad altri agenti, di rappresentare credenze, desideri, intenzioni come oggetti distinti dalla realtà. Quel programma di ricerca risponde a una domanda: cosa pensa l’altro. Il programma di ricerca di questo capitolo risponde a una domanda diversa e complementare: come imparo da ciò che fa l’altro. Le due capacità si intrecciano nei dettagli (saper imitare in senso ricco richiede in parte saper inferire intenzioni) ma hanno traiettorie storiche, esperimenti chiave e maturità teorica differenti, e vanno tenute distinte per non scivolare in confusioni. La cognizione sociale, in questa accezione operativa, è l’insieme dei meccanismi attraverso cui un individuo acquisisce comportamento, conoscenza e norme da altri individui — per osservazione, imitazione, emulazione, insegnamento esplicito, partecipazione a pratiche condivise.

Questa famiglia di meccanismi è la base della cumulatività culturale. La specie umana non è biologicamente specializzata in nessuna nicchia ecologica particolare, eppure ha colonizzato il pianeta in alcune migliaia di generazioni. La spiegazione che converge dall’antropologia evoluzionistica, dalla psicologia dello sviluppo e dalla primatologia comparata è che il vantaggio principale di Homo sapiens non è l’intelligenza individuale ma la capacità di partecipare a un sistema di trasmissione culturale ad alta fedeltà. Ogni generazione costruisce sul lavoro di quelle precedenti senza dover reinventare. Questa accumulazione è ciò che gli antropologi evoluzionistici chiamano ratchet effect, l’effetto cricchetto: un meccanismo che permette di salire e impedisce di tornare indietro.

Per chi progetta sistemi AI il capitolo serve a triplo titolo. Primo, fissa un vocabolario rigoroso per parlare di imitation learning, behavioral cloning, RLHF, distillation senza scivolare in metafore vuote: questi metodi sono filiazioni esplicite — alcune più solide, altre più deboli — di un programma di ricerca con cinquant’anni di storia empirica. Secondo, mostra come una patologia che gli ingegneri di ML conoscono come model collapse (Shumailov et al. 2024) abbia un parallelo strutturale nelle rotture della trasmissione culturale studiate dagli antropologi: in entrambi i casi, un canale che riproduce solo sé stesso senza ancoraggio al mondo perde le code della distribuzione. Terzo, chiarisce un equivoco pericoloso: la “trasmissione culturale fra modelli” tramite distillation non è l’analogo di “evoluzione culturale fra umani” finché manca un meccanismo di selezione esterna; chiamarla così senza dirlo è una sciatteria epistemica.

Quattro principi che il capitolo fissa. Primo: l’apprendimento osservativo è una funzione cognitiva specifica, non un sinonimo di “intelligenza sociale” o di “empatia”; si misura con paradigmi precisi e ha basi neurali parziali e contestate. Secondo: ci sono forme gerarchicamente distinte di apprendimento da altri (stimulus enhancement, emulation, imitation, true imitation, teaching), distribuite differentemente tra le specie. Terzo: la cumulatività culturale richiede un canale di trasmissione ad alta fedeltà combinato con innovazione individuale; entrambi sono necessari, nessuno dei due è sufficiente. Quarto: gli analoghi computazionali (imitation learning, RLHF, distillation) sono filiazioni concettuali utili ma non equivalenze; chi le usa deve marcare la classe di affermazione che sta facendo.

1941 — Miller-Dollard, Social Learning and Imitation. Neal Miller (1909-2002, psicologo di Yale) e John Dollard (1900-1980, sociologo di Yale), Yale University Press. Primo tentativo accademico rigoroso di portare l’imitazione dentro il paradigma comportamentista: l’imitazione è appresa per rinforzo come qualunque altra abituazione. Il modello è elegante ma non spiega come si possa imitare un comportamento mai eseguito prima e mai rinforzato. Resta un buco teorico per vent’anni.

1961 — Bandura, Ross, Ross, Bobo doll. Albert Bandura (1925-2021, psicologo canadese-americano alla Stanford University), insieme a Dorothea Ross e Sheila Ross, Journal of Abnormal and Social Psychology 63(3): 575-582, “Transmission of aggression through imitation of aggressive models”. Disegno fattoriale 2x2x2 su 72 bambini della scuola materna di Stanford. Risultato: i bambini esposti a un modello adulto aggressivo verso un Bobo doll (pupazzo gonfiabile a forma di clown) riproducono atti aggressivi specifici osservati nel modello, senza essere stati rinforzati a farlo. Salto teorico: l’apprendimento osservativo non richiede rinforzo, contraddicendo il behaviorismo skinneriano.

1963 — Bandura, Ross, Ross, Modelli filmati. Journal of Abnormal and Social Psychology 66(1): 3-11, “Imitation of film-mediated aggressive models”. Estende il design ai modelli mediati da film e cartoon. Implicazione applicata: i mass media trasmettono comportamento. Negli anni successivi questo paper diventa un riferimento centrale del dibattito sulla violenza in TV.

1977 — Bandura, Social Learning Theory. Prentice Hall. Bandura formalizza un modello a quattro processi (attenzione, ritenzione, riproduzione, motivazione) e ridefinisce la disciplina come social learning theory. Nel 1986 la rinominerà social cognitive theory in Social Foundations of Thought and Action (Prentice Hall) per sottolineare il ruolo della rappresentazione simbolica e del determinismo reciproco fra persona, comportamento e ambiente.

1977 — Meltzoff-Moore, imitazione neonatale. Andrew Meltzoff (1950-, psicologo dello sviluppo a University of Washington) e M. Keith Moore, Science 198(4312): 75-78, “Imitation of facial and manual gestures by human neonates”. Mostrano che neonati di 12-21 giorni imitano smorfie facciali (lingua fuori, bocca aperta) di un adulto. Risultato influente per quarant’anni; un grande studio di replicazione (Oostenbroek et al. 2016, Current Biology, n=106 neonati seguiti longitudinalmente) non trova l’effetto, riaprendo il dibattito.

1992-1996 — Rizzolatti et al., mirror neurons. Giacomo Rizzolatti (1937-, neurofisiologo all’Università di Parma) con Luciano Fadiga, Vittorio Gallese (1959-, neuroscienziato a Parma), Leonardo Fogassi. Cognitive Brain Research 3(2): 131-141 (1996). Scoperta di neuroni nell’area F5 della corteccia premotoria del macaco che si attivano sia durante l’esecuzione di un’azione orientata a obiettivi sia durante l’osservazione della stessa azione eseguita da un altro agente. L’estrapolazione “mirror neurons = base neurale dell’imitazione” sarà contestata sistematicamente, in particolare da Greg Hickok (UC Irvine) in The Myth of Mirror Neurons (Norton 2014). Lo stato al 2026 è: il fenomeno neurofisiologico nei macachi è solido; l’estrapolazione a meccanismo dell’imitazione umana è un’analogia sotto-vincolata, non una filiazione dimostrata.

1999 — Tomasello, The Cultural Origins of Human Cognition. Michael Tomasello (1950-, psicologo americano allora al Max Planck di Lipsia, oggi Duke University), Harvard University Press. Programma teorico per spiegare la cumulatività culturale umana: joint attention come precondizione, distinzione fra imitation e emulation, ratchet effect come effetto sistemico.

2002 — Gergely-Bekkering-Király, Rational imitation. György Gergely (Central European University), Harold Bekkering (Radboud University), Ildikó Király. Nature 415: 755. Paradigma “head-touch” su bambini di 14 mesi: l’imitazione dei piccoli non è cieca ma filtra per razionalità strumentale. Se il modello accende una luce con la testa avendo le mani libere, il bambino imita; se ha le mani impegnate da una coperta, il bambino usa le mani. Inferenza: l’imitatore neonato attribuisce già razionalità al modello.

2005 — Tomasello, Carpenter, Call, Behne, Moll, Shared intentionality. Behavioral and Brain Sciences 28(5): 675-735, “Understanding and sharing intentions: The origins of cultural cognition”. Manifesto del programma sulla shared intentionality: gli umani, a differenza degli altri primati, formano intenzioni di gruppo (“we-intentions”) che permettono cooperazione complessa e accumulazione culturale.

2007 — Lyons-Young-Keil, Hidden structure of overimitation. Derek Lyons, Andrew Young, Frank Keil (Yale). Proceedings of the National Academy of Sciences 104(50): 19751-19756. Bambini di 3-5 anni copiano azioni causalmente irrilevanti (picchiettare con una bacchetta sul coperchio prima di aprire una scatola) anche dopo essere stati istruiti a essere efficienti e dopo aver visto la trasparenza che rende manifesta l’irrilevanza. Gli scimpanzé nel paradigma equivalente saltano l’azione irrilevante. Over-imitation come marker della cognizione culturale specie-specifica.

2010 — Henrich-Heine-Norenzayan, WEIRD. Joseph Henrich (1968-, antropologo evoluzionista a Harvard), Steven Heine (UBC), Ara Norenzayan (UBC). Behavioral and Brain Sciences 33(2-3): 61-83, “The weirdest people in the world?”. Documenta che i soggetti della letteratura top-tier di psicologia provengono per il 96% da popolazioni Western, Educated, Industrialized, Rich, Democratic — outlier su molte dimensioni psicologiche.

2015 — Henrich, The Secret of Our Success. Princeton University Press. Argomento centrale: l’adattamento principale di Homo sapiens non è l’intelligenza individuale ma la partecipazione a sistemi di trasmissione culturale ad alta fedeltà. Esempio paradigmatico: gli esploratori europei abbandonati nell’Artico canadese morivano di scorbuto e fame circondati da risorse alimentari che gli Inuit avevano imparato a riconoscere e lavorare in millenni di accumulazione culturale.

2017 — Christiano et al., RLHF. Paul Christiano, Jan Leike e altri (OpenAI, DeepMind). NeurIPS 2017, “Deep reinforcement learning from human preferences”. Algoritmo per addestrare un agente sulla base di preferenze umane fra coppie di traiettorie. Filiazione tematica con il programma Bandura sul rinforzo vicario, anche se gli autori non lo citano: si impara da segnali di approvazione/disapprovazione di un altro agente, non da ricompense ambientali.

2024 — Shumailov et al., Model collapse. Ilia Shumailov, Zakhar Shumaylov, Yiren Zhao, Nicolas Papernot, Ross Anderson, Yarin Gal. Nature 631: 755-759, “AI models collapse when trained on recursively generated data”. Mostrano che addestrare ricorsivamente modelli generativi su output di sé stessi o di altri modelli erode le code della distribuzione: dopo poche generazioni il sistema diventa degenere. Caso patologico di trasmissione fra agenti senza ancoraggio al mondo.

Una bambina di quattro anni, in cucina con la madre, vede tagliare le cipolle in un modo specifico: un taglio verticale, poi uno orizzontale, poi i quadrettini. La volta dopo, presa una cipolla, la bambina ripete la sequenza esatta. Ma fa qualcosa di più: anche quando la madre compra cipolle già surgelate a cubetti, la bambina insiste a “lavorarle” sul tagliere prima di metterle in pentola, perché “così si fa”. Sta copiando una procedura completa, non solo il risultato. Le sembra che la procedura sia parte di ciò che rende quella cipolla “pronta”, anche quando un osservatore esterno vede chiaramente che il passaggio in più non aggiunge nulla.

Questa over-imitation è l’oggetto di studio centrale di Lyons et al. 2007. Visto dall’esterno è una pratica inefficiente — perché replicare un’azione che non serve. Visto come strategia robusta su scala evolutiva è una scelta sensata. La maggior parte degli artefatti culturali ha catene causali opache: l’apprendista non capisce perché il falegname tempera il cesello in olio invece che in acqua, non capisce perché il fornaio aggiunge la malta solo dopo i primi minuti di impasto. Se aspettasse di capire prima di copiare, perderebbe la pratica. Copiare anche le azioni che sembrano inutili è una strategia con basso costo individuale e alto guadagno collettivo: la pratica si trasmette a fedeltà sufficiente da poter essere migliorata generazione dopo generazione, e le ottimizzazioni emergono dal sistema, non dalla singola mente.

Joseph Henrich, in The Secret of Our Success, racconta una storia documentata. Negli anni Quaranta dell’Ottocento, esploratori europei della spedizione Franklin abbandonati nell’Artico canadese morirono di scorbuto e fame. Erano fisicamente in salute, equipaggiati, erano addestrati alla sopravvivenza secondo le conoscenze del loro tempo. Erano circondati da risorse: foche, caribù, pesce, bacche stagionali, alghe sotto il ghiaccio. Gli Inuit nello stesso ambiente prosperavano. La differenza non era una differenza di intelligenza: era una differenza di pacchetto culturale. Gli Inuit sapevano come distinguere le foche commestibili dalle non commestibili in inverno, come fermentare carne per evitare scorbuto, come costruire iglu in tempi precisi, come leggere il vento. Migliaia di anni di accumulazione culturale, trasmessi per imitazione e insegnamento da una generazione alla successiva.

L’angolo che Henrich propone: l’adattamento principale di Homo sapiens non è il cervello individualmente potente ma il sistema di trasmissione che permette al cervello di accedere a un patrimonio collettivo. Un individuo isolato dalla sua cultura è meno capace di sopravvivere di un coyote o di un corvo nello stesso ambiente. Un individuo connesso al suo gruppo e al suo patrimonio è l’animale più invasivo del pianeta. Ciò che importa, in questa lettura, sono i meccanismi cognitivi (joint attention, imitation, teaching, language) che mantengono il canale aperto e fedele.

Si addestri un modello di linguaggio M_0 su un grande corpus di testo umano. Si usi M_0 per generare un nuovo corpus C_1 di testo sintetico. Si addestri M_1 su C_1. Si ripeta. Shumailov et al. 2024 mostrano che dopo poche iterazioni il modello collassa: le code della distribuzione si erodono, la diversità lessicale crolla, gli eventi rari spariscono. Nell’esperimento riportato dalla testata di Nature, partendo da testo su architettura medievale, alla nona generazione l’output è una lista di lepri.

Questo non è un dettaglio tecnico: è l’inverso della cumulatività culturale di Henrich. Gli esseri umani trasmettono fra loro pratiche, ma il canale di trasmissione include feedback dal mondo. La pratica del falegname si raffina perché un cesello che non taglia non vende; la pratica del fornaio si raffina perché un pane non lievitato non si mangia. La cultura può accumularsi solo perché è accoppiata a un mondo che la verifica. Quando un sistema riproduce solo sé stesso senza canale di verifica, le sue code della distribuzione, gli eventi rari, le sfumature periferiche scompaiono. La trasmissione senza ancoraggio al mondo non è cumulativa: è degenerativa.

Bandura (1977) formalizza l’apprendimento osservativo come catena di quattro processi necessari. Il fallimento di uno qualsiasi blocca la trasmissione.

osservazione --> [ATTENZIONE] --> codifica
codifica --> [RITENZIONE] --> tracce mnestiche
tracce + capacità motorie --> [RIPRODUZIONE] --> esecuzione
esecuzione + incentivi --> [MOTIVAZIONE] --> performance ripetuta

Attenzione. L’osservatore deve guardare il modello al momento giusto. Variabili: salienza percettiva del modello, somiglianza con l’osservatore (i bambini imitano modelli del proprio sesso più spesso, dato robusto del Bobo doll del 1961), valore funzionale del comportamento (un modello che riceve rinforzo cattura più attenzione), capacità attentive del soggetto.

Ritenzione. Il comportamento osservato va codificato in memoria. Bandura distingue codifica iconica (immagine mentale della sequenza) e codifica verbale (descrizione linguistica della procedura). La ripetizione mentale, o anche il commento verbale del comportamento osservato, ne consolida la traccia. Per questo i bambini parlano spesso fra sé mentre imitano: non è rumore, è ripasso.

Riproduzione. Avere codificato non basta: l’esecuzione richiede capacità motorie, articolazione fra schema e dettaglio, feedback propriocettivo. La bambina che codifica la procedura della cipolla non riesce a eseguirla con la stessa fluidità della madre — manca destrezza fine. La capacità di riproduzione si affina con la pratica e con il feedback correttivo (autoregolazione, o teaching da parte del modello).

Motivazione. Aver acquisito un repertorio non significa eseguirlo. Il rinforzo modula la performance, non l’apprendimento. Distinzione cruciale che Bandura insiste a marcare: bambini che hanno visto un modello aggressivo punito per il suo comportamento sanno comunque eseguire il comportamento aggressivo se incentivati a farlo dopo (pagamento per ciascun atto aggressivo riprodotto). Hanno appreso, ma non eseguono spontaneamente.

La letteratura comparativa fra umani e altre specie distingue forme gerarchicamente più o meno ricche di apprendimento sociale. Le elenco dal più povero al più ricco. Notare: ogni livello assume i precedenti.

  1. Stimulus enhancement. L’attenzione viene attratta da uno stimolo perché un altro lo sta usando. Un piccione che vede un altro piccione becchettare si avvicina e becchetta dove l’altro becchetta. Non sta imparando una sequenza di azioni: è attratto verso una zona. Diffuso in molte specie, inclusi roditori e uccelli.
  2. Local enhancement. Come sopra ma riferito a un luogo. La specifica zona dove un congenere si trova diventa saliente.
  3. Emulation. L’osservatore comprende l’effetto finale (la noce si apre) e produce un proprio comportamento per ottenerlo, non necessariamente lo stesso del modello. Documentato in scimpanzé, corvidi, alcune scimmie.
  4. Goal emulation. Come emulation ma con rappresentazione esplicita dell’obiettivo come stato del mondo da raggiungere.
  5. Imitation in senso stretto. L’osservatore copia mezzi e fini, riproducendo la sequenza motoria del modello.
  6. True imitation, o cultural learning. Imitation accompagnata dalla rappresentazione delle intenzioni del modello: copio così perché ho capito che lui voleva fare proprio quello in quel modo. Tomasello argomenta che questa forma è specie-specifica umana, almeno nei dettagli ricchi.
  7. Teaching. Il modello modifica attivamente il proprio comportamento per facilitare l’apprendimento del discente. Comparso raramente nel mondo animale (alcune specie di passeri che cantano forme semplificate ai piccoli, suricati che portano prede vive ai cuccioli). Nell’uomo è centrale e linguisticamente mediato.

Una formulazione minima del problema di apprendimento osservativo. L’osservatore mantiene una distribuzione su politiche pi(a | s), dove pi è una funzione che a uno stato s associa una distribuzione su azioni a. Osserva una traiettoria del modello tau = (s_0, a_0, s_1, a_1, …, s_T, a_T). Aggiorna la sua distribuzione posteriore su pi:

p(pi | tau) prop p(tau | pi) * p(pi)

con p(tau | pi) = prod_t pi(a_t | s_t) sotto l’ipotesi di indipendenza condizionale standard.

Questa formulazione cattura la versione minima dell’imitation learning. Tre estensioni rilevanti:

  • Rational imitation. L’osservatore filtra per razionalità strumentale. Gergely-Bekkering-Király 2002: bambini di 14 mesi non imitano l’azione bizzarra del modello (accendere la luce con la testa) se la stessa azione è spiegabile da vincoli osservabili (le mani del modello erano impegnate). Formalmente: il prior p(pi) include un’ipotesi di razionalità rispetto a vincoli osservati.
  • Inverse reinforcement learning. Anziché inferire pi direttamente, si inferisce la funzione di ricompensa r del modello e poi si calcola la pi ottima rispetto a r. Approccio di Ng-Russell 2000 e successivi.
  • Imitation of intentions. Tomasello: un imitatore umano non infera solo una politica ma una intenzione — uno scopo astratto che il modello stava perseguendo. La differenza è visibile quando il modello fallisce: un imitatore di azioni copia il fallimento; un imitatore di intenzioni esegue l’azione che il modello intendeva eseguire ma non è riuscito a eseguire.

L’algoritmo più semplice di imitation learning in machine learning è il behavioral cloning: si raccoglie un dataset D = {(s_i, a_i)} di stati e azioni dell’esperto, si addestra una policy pi_theta(a | s) per minimizzare la cross-entropy fra le sue predizioni e le azioni dell’esperto. È supervised learning standard sul problema di “predire l’azione dell’esperto dato lo stato”.

loss(theta) = - sum_i log pi_theta(a_i | s_i)

Riga per riga: la somma scorre sugli esempi del dataset; per ciascuno calcoliamo la log-probabilità che la nostra policy assegni all’azione corretta nello stato corrispondente; la negazione produce una funzione che decresce quando il modello assegna probabilità alta alle azioni dell’esperto; minimizziamo via gradient descent.

Il problema noto è il distribution shift. A training time il modello vede solo stati visitati dall’esperto. A test time, il modello esegue la propria policy: appena commette un piccolo errore finisce in uno stato che l’esperto non avrebbe mai visitato, in cui non sa cosa fare, commette un errore più grande, finisce ancora più fuori distribuzione, e così via. L’errore composto cresce quadraticamente in T (Ross-Bagnell 2010).

DAgger (Ross, Gordon, Bagnell 2011) corregge il problema iterativamente:

inizializza pi_0 (es. behavioral cloning su D_0 di sole traiettorie esperte)
per t = 1, 2, ...:
esegui pi_{t-1} per raccogliere stati S_t = {s_1, s_2, ...}
chiedi all'esperto di etichettare ogni s in S_t con l'azione a corretta
aggiungi (s, a) al dataset D_t = D_{t-1} U {(s, a)}
addestra pi_t su D_t

L’idea è elementare e profonda: il dataset si arricchisce di stati che la policy student visita realmente, così a test time non si trova mai fuori distribuzione. Tematicamente, è l’analogo computazionale del ciclo “esegui sotto supervisione, ricevi correzione, esegui di nuovo” che caratterizza l’apprendistato umano.

Il disegno sperimentale di Bandura, Ross, Ross 1961 è elegante per come isola le variabili. I 72 bambini sono ripartiti in:

  • Condizione modello: aggressivo (24), non-aggressivo (24), nessun modello (24).
  • Sesso modello: M (12), F (12), nelle due condizioni con modello.
  • Sesso bambino: M (36), F (36).

I bambini delle condizioni con modello passano 10 minuti soli con un adulto che gioca in una stanza adiacente. Nel modello aggressivo, l’adulto colpisce ripetutamente il Bobo doll con sequenze precise: lo butta a terra, lo prende a calci, gli dà pugni sul naso, lo colpisce con un martelletto sulla testa. Accompagna con esclamazioni verbali specifiche. Nel modello non-aggressivo, l’adulto gioca tranquillo con altri giocattoli ignorando il Bobo. Subito dopo, ciascun bambino è portato in una stanza separata con il Bobo doll più altri giocattoli (alcuni “aggressivi” come pistole giocattolo, altri “neutrali” come orsetti, libri, cera per modellare). Per 20 minuti viene osservato dietro vetro one-way. Due osservatori indipendenti contano comportamenti aggressivi, distinguendo:

  • Imitazione esatta di atti specifici del modello.
  • Atti aggressivi parzialmente imitativi (es. uso di un martelletto in modi diversi da quelli del modello).
  • Atti aggressivi non-imitativi (aggressione novel non presente nel modello).
  • Aggressione verbale.

Risultato principale: i bambini esposti al modello aggressivo eseguono significativamente più atti delle prime tre categorie. L’effetto è più marcato per i bambini maschi, ed è modulato dal sesso del modello (effetto più forte se modello e bambino sono dello stesso sesso). Il punto teorico chiave: i bambini hanno appreso un repertorio motorio e verbale completamente nuovo dopo dieci minuti di osservazione, senza essere stati rinforzati a farlo.

Caveat metodologici emersi nelle decadi successive: il Bobo doll è oggetto progettato per essere colpito (rimbalza, è divertente da picchiare). Studi successivi con stimoli meno salienti mostrano effetti più piccoli. Meta-analisi recenti (Ferguson 2010, Marsh-Friedman 2022) ridimensionano gli effect size sull’aggressione di lungo termine, distinguendo nettamente “ho appreso un atto aggressivo” da “diventerò un adulto aggressivo”.

Esempio 2: pseudocodice di un imitation learning loop con DAgger

Sezione intitolata “Esempio 2: pseudocodice di un imitation learning loop con DAgger”

Scenario AI. Vogliamo addestrare una policy per un robot manipolatore osservando dimostrazioni di un teleoperatore esperto.

def behavioral_cloning(D):
"""Addestra una policy supervised su un dataset di (stato, azione)."""
pi = init_network()
for epoch in range(num_epochs):
for s, a in D:
loss = -log(pi(a | s))
pi.update(loss)
return pi
def dagger_loop(pi_init, expert, env, T=20, N_per_iter=100):
"""
pi_init: policy iniziale (es. da behavioral cloning).
expert: oracolo che etichetta stati con azioni corrette.
env: ambiente per rollout.
T: orizzonte di rollout.
N_per_iter: rollout per iterazione.
"""
D = collect_expert_demos(expert, env)
pi = behavioral_cloning(D)
for it in range(num_iterations):
states_visited = []
for _ in range(N_per_iter):
s = env.reset()
for _ in range(T):
a = pi.act(s) # policy student decide
states_visited.append(s) # registriamo lo stato
s, _, done, _ = env.step(a)
if done: break
# l'esperto etichetta gli stati visitati dalla student
for s in states_visited:
a_correct = expert.act(s)
D.append((s, a_correct))
pi = behavioral_cloning(D)
return pi

Il punto chiave da leggere riga per riga: nella fase di rollout non è l’esperto a guidare ma la policy student; gli stati che essa visita riflettono i suoi errori. L’esperto interviene solo dopo, con l’etichettatura di azioni corrette su quegli stati. Il dataset cresce includendo stati che la student raggiunge con i suoi propri errori, così la training distribution converge alla test distribution.

L’analogia con l’apprendistato umano è diretta. L’apprendista falegname non guarda solo il maestro lavorare in condizioni perfette: lavora lui, sbaglia, e il maestro corregge sull’errore reale. La correzione lavora dove lo studente effettivamente si trova, non dove sarebbe se non avesse sbagliato.

Per fissare l’intuizione di Shumailov et al. 2024 senza ricorrere alla matematica completa, consideriamo un esperimento giocattolo. Distribuzione di partenza: una mistura gaussiana bidimensionale con cinque cluster, ciascuno con peso uguale. Generazione 0: si campionano N punti dalla distribuzione vera e si fitta una mistura gaussiana M_0 con cinque componenti. Generazione 1: si campionano N punti da M_0 (non dalla distribuzione vera) e si fitta M_1. Si ripete.

Cosa succede:

  • A ogni generazione, alcuni cluster vengono campionati meno per fluttuazione statistica.
  • Il fit della generazione successiva attribuisce a quei cluster pesi più piccoli.
  • La generazione ancora successiva, campionando dalla distribuzione con pesi ridotti, ha probabilità ancora minore di vedere quei cluster.
  • Dopo qualche generazione, alcuni cluster scompaiono completamente. La distribuzione si concentra sui cluster modali, perdendo le code.

L’effetto è strutturale, non un artefatto numerico: deriva dal fatto che il fit di ogni generazione è basato su un campione finito della precedente. Su LLM con corpora enormi l’effetto è più lento ma qualitativamente identico. Eventi rari nel corpus originale (espressioni dialettali, contesti specialistici, errori produttivi) diventano sempre più rari nelle generazioni successive finché spariscono.

Il legame con la cognizione sociale: gli umani non collassano in questo modo perché la trasmissione culturale è permanentemente accoppiata a un mondo che riintroduce varianza. Ogni generazione di apprendisti incontra problemi nuovi, ogni innovazione individuale rigenera diversità, ogni pratica viene testata su materia reale. Quando questo accoppiamento si rompe — sette chiuse, sottoculture isolate, addestramento su sintetico — anche i sistemi culturali umani mostrano fenomeni analoghi al collapse: dialetti che si impoveriscono, tradizioni che si fossilizzano, pratiche che perdono comprensione causale.

Esempio 4: il prompt engineering come trasmissione culturale

Sezione intitolata “Esempio 4: il prompt engineering come trasmissione culturale”

Considerare l’evoluzione del prompt engineering dal 2022 al 2026 come fenomeno di trasmissione culturale è illuminante. I primi utenti di ChatGPT scoprono empiricamente che alcuni prefissi (“Pensa passo per passo”) migliorano l’output. Quel pattern viene postato in tweet, ripreso in blog post, citato in tutorial. Si propaga per imitazione, con drift e mutazioni: “Pensa passo per passo” diventa “Spiega il tuo ragionamento” diventa “Procedi metodicamente”. Ogni passaggio degrada o raffina il pattern. Alcune variazioni si dimostrano peggiori, scompaiono. Altre si dimostrano migliori, si propagano.

A questo strato si sovrappone la pubblicazione accademica. Wei et al. 2022 codificano il chain-of-thought come tecnica formale. La ricodifica accademica del pattern empirico chiude un loop: la pratica diffusa diventa oggetto di studio sistematico, lo studio retroagisce sulla pratica con benchmark e raccomandazioni precise. È cumulatività culturale a velocità compressa: ciò che richiedeva generazioni nelle pratiche artigianali si svolge in mesi nella community AI. Gli ingredienti sono gli stessi: alta fedeltà del canale (testo, codice condiviso), ancoraggio al mondo (i benchmark, gli output reali), variazione + selezione, retroazione fra pratica diffusa e formalizzazione esperta.

Caveat: il parallelo è una filiazione funzionale, non un’equivalenza. Le scale temporali, gli incentivi, la natura dei “tratti culturali” sono molto diversi dall’agricoltura neolitica o dalla trasmissione di un dialetto. Marcare la classe dell’affermazione è parte dell’igiene epistemica.

Behavioral cloning e imitation learning per agenti

Sezione intitolata “Behavioral cloning e imitation learning per agenti”

Behavioral cloning è una baseline solida per qualunque agente che debba imitare un esperto in un dominio chiuso. Funziona bene quando il dataset di dimostrazioni copre densamente la distribuzione di stati che l’agente incontrerà in deployment. Funziona male in domini aperti dove l’agente può finire in stati non rappresentati. Per la pratica:

  • Se il dominio è sufficientemente chiuso (e.g. completamento di moduli su un’interfaccia stabile), behavioral cloning su un dataset abbastanza grande funziona.
  • Se il dominio è aperto (web browsing libero, codice in repository nuovi), behavioral cloning da solo collassa rapidamente; serve una qualche forma di iterazione (DAgger, RL fine-tuning, o human-in-the-loop correction).
  • Importante distinguere apprendimento (cosa la policy “sa”) da performance (cosa esegue): in deployment, una scelta esplicita di temperatura o di filtro di output può modulare la performance senza modificare la policy.

Reinforcement Learning from Human Feedback addestra un modello su preferenze umane fra coppie di output. Il pipeline standard:

  1. Fine-tune supervised su un dataset di dimostrazioni umane (questo è behavioral cloning).
  2. Raccolta di triple (prompt, output_A, output_B, preferenza umana).
  3. Addestramento di un reward model R(prompt, output) per fittare le preferenze.
  4. Fine-tune del modello via RL (PPO o simili) per massimizzare R con un KL-penalty rispetto al checkpoint del passo 1.

Direct Preference Optimization (Rafailov et al. 2023) collassa i passi 3 e 4 in una singola loss equivalente, evitando l’addestramento esplicito del reward model. Per il pratico, le due famiglie producono modelli con caratteristiche simili e differenze stilistiche.

Inquadramento culturale: RLHF e DPO sono filiazioni del programma Bandura sull’apprendimento osservativo con rinforzo vicario. Il modello impara non da ricompense ambientali (l’azione produce uno stato del mondo desiderabile) ma da un proxy di approvazione umana. La differenza, e i suoi rischi, sono ben noti: il proxy può essere gameato (reward hacking), può riflettere bias dei valutatori, e a regime sposta la performance del modello verso una distribuzione “simil-umana” che non è necessariamente “ottimale per l’utente”.

Knowledge distillation (Hinton, Vinyals, Dean 2015) è un caso speciale di imitation learning fra modelli. Un modello “studente” viene addestrato non sui label one-hot del dataset originale ma sulle distribuzioni soft prodotte da un modello “insegnante”. La cross-entropy fra studente e insegnante diventa la loss principale, eventualmente combinata con la cross-entropy sui label originali.

Il parallelo con il teaching umano è diretto. Nell’insegnamento esplicito il maestro non si limita a esibire il comportamento corretto: modula il segnale per il discente, evidenzia distinzioni rilevanti, semplifica passaggi complessi. La distribuzione soft dell’insegnante porta informazione su “quanto vicine” sono le classi nello spazio di rappresentazione, informazione che il label one-hot azzera. È un canale a banda più larga.

Limite del parallelo: il teacher di distillation non ha intenzione di insegnare. Se ne sta lì a inferire e il pipeline di training raccoglie le sue inferenze. La modulazione attiva tipica del teaching umano (semplificazione progressiva, scaffolding, feedback adattivo) è assente. Si possono aggiungere componenti che imitano queste pratiche (curriculum learning, data attribution, attention-based scaffolding) ma non sono il caso di base.

Shumailov et al. 2024 forniscono raccomandazioni operative che derivano direttamente dalla loro analisi:

  • Conservare un’ancoratura forte ai dati umani originali. Non addestrare iterativamente solo su output generati. Quando si usano dati sintetici, mescolarli con dati reali in proporzioni controllate.
  • Tracciare la provenance dei dati di training. Sapere quali frammenti del corpus sono stati generati da quale modello e a quale generazione.
  • Monitorare statistiche di code della distribuzione (entropia, perplexity su tail events, copertura lessicale). Le degenerazioni tipiche del collapse sono visibili prima che il modello collassi visibilmente.

Questo è il corollario tecnico di un risultato culturale: la trasmissione fra agenti deve restare ancorata a un “mondo” (dati reali, feedback ground-truth, valutazione umana) per non degenerare. Il parallelo con la cumulatività culturale umana — che funziona perché le pratiche sono accoppiate a un mondo che le verifica — è una filiazione strutturale, non un’equivalenza.

L’apparato concettuale ha limiti significativi che vanno marcati esplicitamente. Pochi argomenti del manuale meritano questa sezione tanto quanto cognizione sociale, perché il rischio di estensioni infondate verso l’AI è particolarmente alto.

Mirror neurons e l’estrapolazione fuori controllo

Sezione intitolata “Mirror neurons e l’estrapolazione fuori controllo”

La scoperta dei mirror neurons nel macaco (Rizzolatti et al. 1996) è un fenomeno neurofisiologico solido: nei primati non umani esistono cellule premotorie che si attivano sia in esecuzione che in osservazione di azioni orientate a obiettivi. Da lì in poi, la traduzione in “i mirror neurons sono la base neurale dell’imitazione, dell’empatia, del linguaggio, della theory of mind” è stata popolarizzata in molti articoli e libri divulgativi. Greg Hickok in The Myth of Mirror Neurons (2014) raccoglie la critica.

Punti centrali:

  • Negli umani, le evidenze “mirror” derivano principalmente da fMRI, che misura attivazione regionale e non risposte di singoli neuroni. L’inferenza che le stesse cellule fanno entrambe le cose è una analogia sotto-vincolata.
  • I deficit di imitazione nell’autismo non si associano coerentemente a deficit nel sistema mirror in studi metodologicamente accurati.
  • L’apprendimento per osservazione esiste in specie senza apparato mirror documentato.
  • La tesi forte (“mirror neurons spiegano l’imitazione e l’empatia”) fa salti dalla classe analogia alla classe filiazione alla classe equivalenza spesso nello stesso paragrafo.

Lo stato sano al 2026: il fenomeno neurofisiologico nei macachi resta. La sua estensione a meccanismo causale dell’imitazione umana è un’ipotesi che convive con alternative serie; non è un fatto stabilito.

WEIRD: i dati di base potrebbero non generalizzare

Sezione intitolata “WEIRD: i dati di base potrebbero non generalizzare”

Henrich, Heine, Norenzayan 2010 documentano che il 96% dei soggetti delle riviste top-tier di psicologia (incluse quelle dello sviluppo) proviene da popolazioni Western, Educated, Industrialized, Rich, Democratic. La dimensione del problema: molti effetti che la letteratura presenta come universali sono outlier WEIRD. Esempi documentati:

  • Illusione di Müller-Lyer: gli WEIRD ne sono fortemente affetti, alcune popolazioni di cacciatori-raccoglitori non lo sono.
  • Ragionamento morale: i pattern di Kohlberg-Haidt non si replicano allo stesso modo in popolazioni non-WEIRD.
  • Comportamento in giochi economici (ultimatum game, dictator game): le offerte “fair” tipiche degli studenti universitari americani non sono universali.

Per il programma cognizione sociale: il Bobo doll, Wimmer-Perner, Lyons-Young-Keil sono tutti studiati su bambini WEIRD. Studi cross-culturali successivi (Nielsen-Tomaselli 2010 su bambini Bushman, Henrich-Heine-Norenzayan generale) mostrano che il pattern over-imitation generalizza in larga parte ma con modulazioni significative dell’effect size. Non è che la cognizione sociale “non esista” fuori da popolazioni WEIRD; è che i parametri quantitativi e talvolta qualitativi cambiano. Generalizzare oltre il dato di base senza marcare l’incertezza è una pratica che è necessario contestare.

L’imitazione neonatale di smorfie facciali, riportata da Meltzoff-Moore 1977 e replicata in piccoli studi successivi, è stata uno dei pilastri dell’idea che gli umani nascano con competenze sociali pre-cablate. Oostenbroek et al. 2016 in Current Biology riportano un grande studio longitudinale (n=106) progettato specificamente per testare il fenomeno e non lo trovano. Il dibattito è tuttora aperto: alcuni difendono l’effetto originale, altri lo considerano artefatto di metodi specifici. Lo stato al 2026: l’imitazione neonatale come fenomeno robusto è contestata; non si dovrebbe usarla come pilastro di teorie generali.

Un large language model addestrato per imitare testo umano “imita” nel senso ingegneristico — minimizza una loss di predizione — ma chiamare ciò “imitazione” senza qualifiche è antropomorfismo pericoloso. L’imitazione umana coinvolge attribuzione di intenzioni, ragionamento causale, sensibilità a vincoli osservabili (rational imitation), capacità di copiare mezzi e fini distintamente, modulazione attiva da parte del teacher quando presente. L’imitation di un LLM è un fitting statistico su distribuzioni condizionali. Ci sono aspetti in cui il pattern computazionale è funzionalmente simile a quello cognitivo (entrambi propagano informazione fra agenti, entrambi possono accumulare drift), ma chiamarli con la stessa parola senza distinzione è fonte di errori applicativi. Per esempio, dire che un modello “ha imparato a imitare un programmatore” suggerisce capacità di trasferimento e generalizzazione che il modello potrebbe non avere; meglio “ha appreso a predire token in continuazioni di testo simil-codice”.

L’imitation learning naive (behavioral cloning) ha un problema strutturale: gli errori si accumulano nel tempo. Ross-Bagnell 2010 dimostrano che l’errore atteso cresce quadraticamente con l’orizzonte. Il rimedio (DAgger, RL fine-tuning) risolve il problema in linea di principio ma richiede accesso continuo all’esperto o un simulatore affidabile. In molti domini reali, nessuno dei due è disponibile economicamente. Il risultato è che molti sistemi imitation-based deployati in produzione hanno una performance che degrada in modi non sempre prevedibili appena il dominio drifta dalla distribuzione di training.

Model collapse e la fragilità della trasmissione fra modelli

Sezione intitolata “Model collapse e la fragilità della trasmissione fra modelli”

Il risultato Shumailov et al. 2024 è robusto su modelli grandi (LLM) e piccoli (variational autoencoders, gaussian mixture models). L’erosione delle code è progressiva e in parte irreversibile. La pratica di addestrare modelli sempre più grandi su corpus che includono frazioni crescenti di testo generato da altri modelli (web sempre più colonizzato da output AI) è una pressione strutturale verso il collapse. Mitigazioni esistono (filtraggio, watermarking, tracking della provenance) ma sono incomplete e parzialmente in tensione fra loro. La dipendenza profonda da dati umani originali è una vulnerabilità sistemica delle pipeline di training attuali.

Il reward model addestrato su preferenze umane è un proxy. Il modello fine-tuned può trovare modi di massimizzare il proxy senza fornire valore reale: output verbosi e con tono confidente che i valutatori preferiscono indipendentemente dalla qualità; risposte che evitano sistematicamente argomenti controversi non perché siano informativi ma perché un valutatore aveva preferito output cauti. Il problema è ben noto e attivamente studiato (sycophancy, deceptive alignment). Inquadramento culturale: è l’analogo del teaching to the test nei sistemi educativi. Quando il segnale di apprendimento è disaccoppiato dal valore reale, il sistema ottimizza il segnale.

Un equivoco comune in letteratura divulgativa: trattare cognizione sociale, theory of mind, empatia come sinonimi. Sono cose diverse. La cognizione sociale come trattata in questo capitolo è un insieme di meccanismi di apprendimento da altri. La theory of mind è la capacità di attribuire stati mentali. L’empatia è un costrutto multidimensionale (empatia cognitiva, empatia affettiva) studiato dalla psicologia clinica e affettiva con paradigmi propri. Le tre famiglie si intersecano ma non coincidono. Confonderle porta a misurare una cosa pensando di misurarne un’altra.

Un dettaglio della meccanica che merita una sezione propria. Tomasello identifica nella joint attention — comparsa intorno ai 9-12 mesi nei bambini umani — la precondizione cognitiva per l’apprendimento sociale ad alta fedeltà. Joint attention è la situazione in cui due agenti e un terzo oggetto formano un triangolo attentivo, con consapevolezza reciproca che entrambi gli agenti stanno guardando lo stesso oggetto e sanno che l’altro lo sta guardando.

Senza joint attention l’imitazione collassa a stimulus enhancement: il bambino guarda dove guarda l’adulto perché lì c’è qualcosa di saliente, ma non costruisce la rappresentazione “stiamo entrambi attendendo a questo, perché lui vuole mostrarmi qualcosa”. Con joint attention si apre il canale per il referential communication, per il pointing, per il name-learning: il bambino impara la parola “cane” perché il triangolo joint attention permette di associare il suono prodotto dall’adulto con l’oggetto co-attenduto. Senza il triangolo, l’associazione è sotto-vincolata.

Il dato comparativo: i grandi primati mostrano forme parziali di attenzione condivisa ma non il triangolo completo con consapevolezza reciproca. Carpenter, Nagell, Tomasello 1998 nel Monographs of the Society for Research in Child Development documentano la traiettoria nei bambini di 9-15 mesi: gaze following emerge per primo, poi protoimperativi (indicare per ottenere), poi protodichiarativi (indicare per condividere attenzione), poi imitazione di azioni con oggetti che tiene conto dello scopo del modello. Ogni passaggio è un layer aggiuntivo nella torre dell’apprendimento sociale.

Per il pratico AI: la mancanza di un equivalente computazionale solido di joint attention è una limitazione non banale dei sistemi multi-agente attuali. Possono coordinarsi su comunicazione esplicita, ma non hanno il livello implicito “stiamo entrambi attendendo a X e lo sappiamo” che caratterizza la cognizione sociale umana e che fa la differenza fra coordinazione e cooperazione vera.

Henrich e collaboratori distillano la cumulatività culturale in poche condizioni necessarie:

  1. Variazione. Pratiche e idee differenti coesistono nella popolazione.
  2. Selezione. Pratiche diverse hanno fitness diverse, dove fitness può essere ricaduta materiale, prestigio del praticante, fertilità del praticante, riproduzione semplice della pratica per imitazione preferenziale.
  3. Trasmissione ad alta fedeltà. Le pratiche selezionate passano alla generazione successiva con perdita minima.
  4. Innovazione individuale. Qualche praticante introduce variazioni originali.

Manca uno qualsiasi di questi e il sistema non accumula. Le tradizioni di alcuni primati hanno variazione e trasmissione ma non innovazione cumulativa: ogni generazione tende a riprodurre il pattern senza migliorarlo. Le mode di breve durata negli umani hanno innovazione ma non trasmissione fedele a generazioni successive: si esauriscono. Le tradizioni artigianali con maestro e apprendista soddisfano tutti e quattro i criteri ed è per questo che si raffinano nei secoli.

Il parallelo con i sistemi AI è strutturale e illuminante. Una pipeline di training che ottimizza solo per loss su un dataset fisso ha selezione e trasmissione ma scarsa innovazione (ogni generazione è una copia rumorosa del precedente). Una pipeline che genera sintetico senza filtraggio ha innovazione apparente (output diversi) ma trasmissione degenerata (le code si erodono). Le pipeline che funzionano (instruction tuning, RLHF, constitutional AI) introducono varianti, le filtrano per qualità misurata su un mondo (benchmark, valutatori, runtime), e propagano quelle migliori. Sono cumulative nello stesso senso strutturale in cui lo sono le tradizioni artigianali.

  • theory-of-mind: la capacità di attribuire stati mentali è parzialmente il prerequisito della true imitation di Tomasello. Vanno tenute distinte ma lette insieme: cognizione sociale spiega come si trasmette, theory of mind spiega come si rappresenta l’altro.

  • sviluppo-piaget: il programma piagetiano e il bambino-scienziato che costruisce solo sono in parte ridimensionati dalla letteratura post-1980 sulla cognizione sociale, che mostra come tantissimo apprendimento del bambino sia mediato dall’ambiente sociale, non da scoperta autonoma.

  • meta-cognizione: la metacognizione include la capacità di sapere quando non si sa e quindi di chiedere o cercare un modello da imitare. È un meta-meccanismo che modula l’apprendimento osservativo.

  • linguaggio-pensiero: il linguaggio è il canale ad alta fedeltà che rende possibile la trasmissione culturale cumulativa nella forma che gli umani hanno; senza linguaggio l’imitazione non scala.

  • ponte-tom-multi-agent: in sistemi multi-agente, la distinzione fra cognizione sociale (imparare da altri) e theory of mind (modellare altri) si traduce direttamente in scelte architetturali distinte.

  • dual-process-kahneman: l’apprendimento osservativo passa parte della sua vita in Sistema 1 (codifica iconica automatica, replica fluente) e parte in Sistema 2 (valutazione critica del modello, scelta di non imitare).

  • bounded-rationality-simon: copiare gli altri quando l’analisi causale eccede il budget cognitivo è una euristica adattiva paradigmatica della razionalità limitata.

  • transformer-attention (in preparazione): il programma RLHF/DPO è parte integrante del fine-tuning post-training degli LLM moderni e sarà ripreso parlando di addestramento.

  • distillation-modello (in preparazione): il knowledge distillation come pratica di compressione e di transfer rientra in una sezione dedicata della Parte sui sistemi.

Un punto poco enfatizzato nelle presentazioni introduttive: la stessa propensione che rende possibile la cumulatività culturale rende anche possibile la cascata informazionale errata. Solomon Asch (1907-1996, psicologo polacco-americano allo Swarthmore College) negli esperimenti del 1951 mostra che soggetti adulti, in compito percettivo banale (giudicare quale di tre linee abbia la stessa lunghezza di una linea di riferimento), conformano le proprie risposte a una maggioranza unanime di confederati che dà la risposta sbagliata. Il tasso di conformità varia con il setting ma è non trascurabile: circa un terzo delle risposte segue il gruppo erroneo, e una maggioranza dei soggetti conforma almeno una volta nella batteria.

Per il nostro programma: la cognizione sociale non è una dote benigna. È un meccanismo che propaga pattern, e propaga indistintamente quelli adattivi e quelli mal-adattivi. Le bolle informative, le mode pericolose, le dottrine collettive errate sono tutte sottoprodotti dello stesso meccanismo che permette la trasmissione del fuoco e del compilatore. L’igiene cognitiva del soggetto adulto include la capacità di interrompere la cascata di imitazione quando i segnali del mondo divergono dai segnali del gruppo. Negli LLM il problema corrispondente è la sycophancy: l’output del modello si conforma a ciò che il valutatore sembra voler sentire, anche quando ciò contrasta con la verità di fondo. Stesso pattern strutturale, stesso rimedio strutturale: ancorare il segnale al mondo, non al gruppo.

Henrich e Gil-White 2001 (Evolution and Human Behavior) descrivono il prestige bias: gli umani imitano preferenzialmente individui prestigiosi, dove il prestigio è dedotto dall’attenzione che gli altri riservano a quell’individuo. È una euristica in due livelli — non valuto direttamente la qualità del modello, valuto chi gli altri valutano — che funziona bene in domini in cui la valutazione di prima mano è costosa e l’attenzione collettiva traccia segnali utili. Funziona male quando il prestigio è costruito da meccanismi indipendenti dal merito (celebrità mediatica, posizione ereditata, ottimizzazione algoritmica per engagement).

Per i sistemi AI ci sono due usi diretti dell’idea. Primo: l’imitation learning può essere migliorato pesando le dimostrazioni in base al “prestigio” misurato (qualità documentata dell’esperto), non in modo uniforme. Secondo: i sistemi che apprendono da popolazioni umane miste (utenti generici di una piattaforma) ereditano i bias di prestigio della popolazione, inclusi quelli mal-calibrati. Il modello prodotto ne riflette le preferenze, non necessariamente l’accuratezza. È un meccanismo di propagazione di errore poco discusso ma operativo.

  • Bandura, A. (1977). Social Learning Theory. Prentice Hall. — Il manifesto teorico originale, ancora leggibile e utile.

  • Tomasello, M. (1999). The Cultural Origins of Human Cognition. Harvard University Press. — La traiettoria evolutiva e ontogenetica dell’apprendimento culturale umano.

  • Henrich, J. (2015). The Secret of Our Success. Princeton University Press. — Il framework di evoluzione culturale che inquadra l’apprendimento sociale al livello di specie.

  • Hickok, G. (2014). The Myth of Mirror Neurons. Norton. — Il caso più sistematico di critica al programma mirror, utile per inocularsi contro la divulgazione superficiale.

  • Shumailov, I. et al. (2024). “AI models collapse when trained on recursively generated data”. Nature 631: 755-759. — Il caso paradigmatico di trasmissione fra agenti che fallisce in assenza di ancoraggio al mondo, lettura obbligata per chi disegna pipeline di training.

  • Lyons, D. E., Young, A. G., Keil, F. C. (2007). “The hidden structure of overimitation”. PNAS 104(50): 19751-19756. — L’esperimento canonico sull’over-imitation, da leggere insieme alle repliche cross-culturali successive.

  • Henrich, J., Heine, S. J., Norenzayan, A. (2010). “The weirdest people in the world?”. Behavioral and Brain Sciences 33: 61-83. — La critica WEIRD: lettura ineludibile per chiunque voglia generalizzare risultati di psicologia sperimentale.

  • Tomasello, M., Carpenter, M., Call, J., Behne, T., Moll, H. (2005). “Understanding and sharing intentions”. Behavioral and Brain Sciences 28: 675-735. — Il programma shared intentionality come substrato della cognizione culturale.

  • Hinton, G., Vinyals, O., Dean, J. (2015). “Distilling the knowledge in a neural network”. NeurIPS Workshop. — La formulazione canonica della distillation, utile per vedere come l’idea di teaching si traduca in obiettivo di training.

  • Christiano, P., Leike, J. et al. (2017). “Deep reinforcement learning from human preferences”. NeurIPS. — La formulazione iniziale di RLHF, da leggere insieme alle critiche più recenti su reward hacking e sycophancy.

Il capitolo ha articolato tre tesi operative che tornano nelle parti successive del libro, in particolare nelle parti dedicate al fine-tuning dei modelli, all’addestramento da preferenze e ai sistemi multi-agente. Sono tesi sintetiche, ognuna delle quali apre una linea di approfondimento separata, ma servono come bussola per non perdere il filo quando i dettagli tecnici dei capitoli successivi si moltiplicano.

Prima: la cognizione sociale è un insieme di meccanismi specifici (joint attention, imitation, emulation, teaching), distribuiti gerarchicamente fra le specie, misurabili con paradigmi precisi. Seconda: la cumulatività culturale richiede simultaneamente alta fedeltà di trasmissione, variazione individuale e selezione ancorata al mondo; tutte e tre sono necessarie, nessuna è sufficiente. Terza: i parallelismi con i metodi AI (behavioral cloning, RLHF, distillation) sono utili come filiazioni concettuali, ma vanno marcati esplicitamente per non scivolare in equivalenze ingiustificate. Lo strumento per non scivolare è banale ma efficace: ogni volta che si dice “il modello impara per imitazione come un bambino”, si aggiunge la classe di affermazione (analogia, filiazione, equivalenza) e il vincolo che la giustifica. Senza quel passaggio, la metafora colonizza il pensiero e produce errori ingegneristici.

Livello (dal più povero)Cosa succedeSpecie tipiche
Stimulus enhancementl’osservatore è attratto dallo stimolo manipolato dal modellopiccione, ratto
Local enhancementl’osservatore è attratto dal luogo dell’azione del modellomolti vertebrati
Emulationl’osservatore replica il risultato, non il metodoscimpanzé, corvidi
Goal emulationl’osservatore inferisce lo scopo e lo persegue con mezzi proprigrandi scimmie
Imitationreplica della sequenza motoria, senza comprensione dello scoposcimmie addestrate
True imitation (apprendimento culturale)replica fedele di mezzi e scopibambino umano
Teachingil modello modifica attivamente il proprio comportamento per insegnareumani, alcuni casi in altre specie

Asse verticale: aumento della fedeltà di trasmissione e della complessità cognitiva richiesta.

flowchart LR
    O[Osservazione] --> A[Attenzione<br/>salienza, somiglianza]
    A --> R[Ritenzione<br/>codifica iconica + verbale]
    R --> P[Riproduzione<br/>capacità motoria]
    P --> M[Motivazione<br/>incentivo, rinforzo vicario]
    M --> B[Performance]
    A -.fallisce.-> FA[nessuna codifica]
    R -.fallisce.-> FR[oblio]
    P -.fallisce.-> FP[fallimento motorio]
    M -.fallisce.-> FM[appreso ma non eseguito]

Figura 2 — il modello a quattro processi di Bandura visualizzato come pipeline con possibili punti di rottura ad ogni stadio

flowchart LR
    O[Osservazione] --> A[Attenzione<br/>salienza, somiglianza]
    A --> R[Ritenzione<br/>codifica iconica + verbale]
    R --> P[Riproduzione<br/>capacità motoria]
    P --> M[Motivazione<br/>incentivo, rinforzo vicario]
    M --> B[Performance]
    A -.fallisce.-> FA[nessuna codifica]
    R -.fallisce.-> FR[oblio]
    P -.fallisce.-> FP[fallimento motorio]
    M -.fallisce.-> FM[appreso ma non eseguito]

Figura 2 — model collapse: distribuzione iniziale e progressiva erosione delle code attraverso le generazioni di addestramento ricorsivo

flowchart LR
    O[Osservazione] --> A[Attenzione<br/>salienza, somiglianza]
    A --> R[Ritenzione<br/>codifica iconica + verbale]
    R --> P[Riproduzione<br/>capacità motoria]
    P --> M[Motivazione<br/>incentivo, rinforzo vicario]
    M --> B[Performance]
    A -.fallisce.-> FA[nessuna codifica]
    R -.fallisce.-> FR[oblio]
    P -.fallisce.-> FP[fallimento motorio]
    M -.fallisce.-> FM[appreso ma non eseguito]

Figura 2 — triangolo della joint attention: bambino, adulto, oggetto co-attenduto, con frecce di gaze e consapevolezza reciproca