Euristiche e bias cognitivi: tassonomia, framework, replicazione
Nel 2006 Birte Mussweiler, Birte Englich e Fritz Strack, psicologi sociali a Würzburg, propongono a un campione di giudici tedeschi con esperienza media di quindici anni di leggere il fascicolo di un caso di stupro e raccomandare una pena. Prima dell’esercizio i giudici tirano due dadi truccati: in metà dei casi la somma è 3, nell’altra metà è 9. Sanno che i dadi sono random; sanno che il numero non c’entra nulla. La condizione “dado basso” raccomanda mediamente 5.3 mesi di reclusione; la condizione “dado alto” 7.8 mesi. Trent’anni dopo Tversky e Kahneman avevano battezzato il fenomeno “anchoring”, e fra i due paper è successo molto: cataloghi di euristiche, dispute fra scuole, una crisi di replicabilità che ha smontato metà degli effetti psicologici degli anni Ottanta, e — di recente — modelli linguistici di grandi dimensioni che, sottoposti agli stessi paradigmi, replicano la conjunction fallacy con la stessa magnitudine dei graduate students di Princeton del 1983. Questo capitolo prova a mettere ordine: una tassonomia delle euristiche e dei bias che non sia la lista Wikipedia gonfia di duplicati; tre framework epistemici concorrenti — non compatibili — che ne danno tre interpretazioni rivali; un bilancio onesto di cosa replica e cosa no; e una sezione finale, marcata e datata, sull’uso che la letteratura AI 2023-2026 fa di tutto questo.
Il capitolo precedente, dual-process-kahneman, ha introdotto il vocabolario S1/S2 e quattro o cinque euristiche emblematiche: representativeness con il problema di Linda, availability, anchoring, framing dell’Asian disease, loss aversion. Il capitolo bounded-rationality-simon ha trattato la cornice teorica e la disputa fra heuristics-and-biases e fast-and-frugal. Qui non ripetiamo. Apriamo invece due porte che quei capitoli avevano lasciato chiuse: la tassonomia organica delle famiglie di bias documentate negli ultimi cinquant’anni, e la questione metodologica e tecnica — cosa di tutto questo è scienza solida, cosa è folklore, e cosa significa quando un modello di linguaggio fa la stessa cosa.
Perché questo capitolo
Sezione intitolata “Perché questo capitolo”Tre ragioni: una di igiene, una concettuale, una di apertura sulla letteratura AI.
L’igiene. La pagina Wikipedia “List of cognitive biases” elenca al 2026 più di duecento voci. Un buon numero di queste sono ridenominazioni della stessa cosa, varianti contestuali minori, o effetti che non sopravvivono a repliche pre-registrate. Un capitolo serio sui bias cognitivi non può presentarli come un elenco da memorizzare. Deve organizzarli, dichiarare cosa è robusto, marcare cosa è fragile.
La concettuale. Sui bias esistono tre framework epistemici contemporanei — Tversky-Kahneman, Gigerenzer, Lieder-Griffiths — che danno tre interpretazioni mutualmente irriducibili dello stesso fenomeno. La letteratura divulgativa tende a fonderli (“tre lati dello stesso elefante”) in un’armonia che le loro premesse non consentono. Il capitolo li tiene distinti.
L’apertura. Nel 2023-2024 una piccola ondata di paper ha mostrato che i large language model, sottoposti agli stessi paradigmi sperimentali della psicologia cognitiva, replicano molti bias classici. È un fenomeno empirico interessante e una trappola di interpretazione: replicazione empirica non è equivalenza meccanica, e attribuire ai LLM “euristiche cognitive” è una equivalenza pericolosa. La sezione “Eredità oggi”, marcata [DATATO 2026-04], tratta esattamente questo.
Contesto: una traiettoria 1974-2026
Sezione intitolata “Contesto: una traiettoria 1974-2026”1974 — Tversky e Kahneman aprono il programma. Il paper “Judgment under Uncertainty: Heuristics and Biases” (Science 185:1124-1131) di Amos Tversky (1937-1996, psicologo cognitivo israelo-americano a Stanford) e Daniel Kahneman (1934-2024, psicologo cognitivo israelo-americano a Princeton, premio Nobel per l’Economia 2002) inaugura il vocabolario di base — representativeness, availability, anchoring — già discusso in dual-process-kahneman. Lo standard normativo di riferimento è la teoria della probabilità formale; le deviazioni sistematiche sono “bias” rispetto a quel riferimento.
1975 — Hindsight bias. Baruch Fischhoff (1946-, psicologo decisionale a Carnegie Mellon poi a Cornell), in “Hindsight ≠ foresight” (Journal of Experimental Psychology: Human Perception and Performance 1:288-299), documenta il creeping determinism: dopo un evento, i soggetti rivalutano la propria stima a priori della probabilità dell’evento come più alta. Il dato originale: studenti predicono esiti della visita di Nixon in Cina del 1972; alcuni mesi dopo, ricordando le proprie predizioni, le riportano sistematicamente più vicine all’esito reale di quanto fossero state.
1979 — Prospect theory. Kahneman e Tversky, in Econometrica 47:263-291, formalizzano l’asimmetria fra guadagni e perdite (loss aversion ~2.25:1, vedi dual-process-kahneman). Apre la strada a tutta la decision biases family: endowment, status quo, sunk cost.
1985 — Hot hand fallacy. Thomas Gilovich (1954-, psicologo a Cornell), Robert Vallone (psicologo a Stanford) e Tversky, in “The hot hand in basketball” (Cognitive Psychology 17:295-314), analizzano i tiri dei Philadelphia 76ers e dei Boston Celtics. Conclusione: la sequenza di canestri non si discosta da una sequenza casuale al netto della frequenza di base del giocatore. La percezione di “streak” è artefatto cognitivo. Importante caveat: Joshua Miller e Adam Sanjurjo (2018), in Econometrica, mostrano che il calcolo originale aveva un piccolo bias statistico nella direzione opposta, e che parte dell’effetto “hot hand” è in realtà presente. È un caso interessante di bias-su-bias-su-fenomeno.
1990 — Endowment effect. Kahneman, Jack Knetsch (economista comportamentale a Simon Fraser University) e Richard Thaler (1945-, economista a University of Chicago, premio Nobel 2017), in Journal of Political Economy 98:1325-1348, pubblicano il mug experiment. Studenti di Cornell ricevono in dotazione una tazza di ceramica con il logo dell’università; viene chiesto loro a quale prezzo la venderebbero. Un altro gruppo, senza tazza, è chiesto quanto la pagherebbe. Mediane: ~3 offerti per comprare. Rapporto 2:1, allineato col coefficiente di loss aversion. La proprietà — anche di pochi minuti — modifica il valore percepito.
2002 — Il volume Gilovich-Griffin-Kahneman. Gilovich, Dale Griffin (psicologo a UBC) e Kahneman editano Heuristics and Biases: The Psychology of Intuitive Judgment (Cambridge University Press), volume di trentuno saggi che diventa il riferimento accademico canonico del programma. Include “The Affect Heuristic” di Paul Slovic (1938-, psicologo decisionale a University of Oregon).
1996 — Gigerenzer apre il fronte alternativo. Gerd Gigerenzer (1947-, psicologo tedesco al Max Planck Institute for Human Development di Berlino), con Daniel Goldstein (psicologo a Microsoft Research), pubblica “Reasoning the Fast and Frugal Way” (Psychological Review 103:650-669). Programma: le euristiche sono adaptive tools, non sources of bias. Il volume Simple Heuristics That Make Us Smart (Oxford UP 1999) è il manifesto del fronte “ecological rationality”. Il capitolo bounded-rationality-simon tratta la disputa.
2008 — Stanovich-West provano una sintesi parziale. Keith Stanovich (1950-, psicologo a University of Toronto) e Richard West (1952-2018, James Madison University), in Journal of Personality and Social Psychology 94:672-695, propongono che in environment “kind” (struttura predicibile, feedback rapido) le fast-and-frugal heuristics performino bene; in environment “wicked” (statistica complessa, base rate non intuitive) i bias documentati da Tversky-Kahneman dominino. Sintesi pragmatica, non completa.
2015 — La replication crisis colpisce. L’Open Science Collaboration (consorzio di 270 ricercatori coordinato da Brian Nosek, psicologo a University of Virginia), in “Estimating the reproducibility of psychological science” (Science 349:aac4716), replica cento studi pubblicati sulle riviste top di psicologia sociale e cognitiva. Solo il 36% mantiene significatività statistica nelle repliche; gli effect size medi sono ridotti del 50%. Alcuni effetti famosi — ego depletion, social priming, alcuni effetti di embodied cognition — non sopravvivono. Il programma heuristics-and-biases ne esce relativamente bene: i nuclei robusti (anchoring, framing, conjunction, hindsight, endowment) replicano. Alcuni laterali (disgust-and-morality, parte di stereotype threat, power posing) no.
2018 — SSRP. Colin Camerer (1959-, economista comportamentale a Caltech) e colleghi, in Nature Human Behaviour 2:637-644, replicano ventuno studi di scienze sociali pubblicati su Nature e Science fra 2010 e 2015 con sample size aumentato. Tredici su ventuno replicano significativamente; otto no. L’effetto medio dei tredici che replicano è circa 75% del riportato originale.
2020 — Resource-rational analysis. Falk Lieder (computer scientist al Max Planck Institute for Intelligent Systems) e Tom Griffiths (computational cognitive scientist a Princeton), in “Resource-rational analysis” (Behavioral and Brain Sciences 43:e1), formalizzano la cognizione come constrained optimization rispetto al costo computazionale. Tentano di unificare i due framework precedenti come aspetti diversi della stessa funzione obiettivo. Il capitolo bounded-rationality-simon lo presenta come terzo framework.
2020 — Multi-lab replication della prospect theory. Kai Ruggeri (Columbia University) e colleghi, in Nature Human Behaviour 4:622-633, replicano i pattern qualitativi della prospect theory in 19 paesi su circa 4.000 soggetti. Loss aversion, framing, certainty effect: replicano. Magnitudini ridotte rispetto agli studi originali ma pattern qualitativo solido.
2023 — Gli LLM replicano i bias. Gati Aher, Rosa Arriaga e Adam Tauman Kalai (Microsoft Research), in “Using Large Language Models to Simulate Multiple Humans and Replicate Human Subject Studies” (ICML 2023), mostrano che GPT-3.5 e GPT-4, simulando soggetti umani, replicano una decina di paradigmi sperimentali classici, inclusa la conjunction fallacy del problema di Linda. Gaurav Suri, Sudeep Bhatia e Stefan Hofmann (2023), in un follow-up empirico, mostrano anchoring, framing e representativeness in modelli GPT con magnitudini comparabili agli umani. Mrinank Sharma e colleghi (Anthropic 2023), in “Towards Understanding Sycophancy in Language Models” (arXiv:2310.13548), documentano un bias specifico degli LLM RLHF-tuned: tendenza a concordare con l’utente anche quando sbagliato.
L’intuizione: due angoli prima del formalismo
Sezione intitolata “L’intuizione: due angoli prima del formalismo”Prima della meccanica, due angoli per inquadrare il fenomeno. Il primo è tassonomico-fenomenologico: come si presentano le euristiche e i bias nell’esperienza ordinaria, raggruppati in famiglie. Il secondo è adattivo-evoluzionistico: perché la mente umana è fatta in un modo che li produce.
Angolo 1: i bias come famiglie fenomenologiche
Sezione intitolata “Angolo 1: i bias come famiglie fenomenologiche”L’esperienza pratica suggerisce che i bias non sono un’orda indistinta. Quando un giudice anchora la pena al numero pescato dai dadi, fa qualcosa di diverso da quando un manager continua un progetto fallente perché “abbiamo già investito un milione”, e diverso ancora da quando una persona attraente è giudicata anche più competente, e ancora diverso da quando un fumatore trova lo studio “fumare causa cancro” meno credibile di un non-fumatore.
I quattro casi appartengono a famiglie distinte. Il primo è un bias statistico-probabilistico: numero che si infila nella stima. Il secondo è un bias di decisione: trattamento improprio di costi irrecuperabili. Il terzo è un bias sociale: contagio di valutazione fra dimensioni. Il quarto è un bias motivazionale-affettivo: l’evidenza viene scrutinata in modo asimmetrico in base al desiderio.
La tassonomia che adottiamo nella sezione meccanica organizza la letteratura in sette famiglie: memoria, statistico-probabilistica, sociale, sé, decisione, credenze, motivazionale-affettiva. Non è l’unica tassonomia possibile (Hilbert 2012 propone una sintesi diversa, basata su noisy information processing), ma è la più diffusa nei manuali e ha il vantaggio operativo di mappare ciascun bias a un meccanismo plausibile.
L’angolo fenomenologico è anche un antidoto al bias-as-list della Wikipedia: invece di duecento entry da memorizzare, sette famiglie con quattro o cinque esempi rappresentativi ciascuna. Bisogna sapere che esiste l’hindsight bias — non bisogna sapere a memoria che esiste anche l’outcome bias, che ne è una variante.
Angolo 2: l’angolo adattivo
Sezione intitolata “Angolo 2: l’angolo adattivo”Il secondo angolo chiede perché la mente umana sia fatta in un modo che produce queste regolarità. Tre risposte storicamente importanti, non equivalenti.
La prima, conservativa: i bias sono errori di sistema — la mente è progettata male o evolutivamente sub-ottima — e vanno corretti. È la posizione classica del programma Tversky-Kahneman, in cui lo standard normativo (probabilità formale, EU theory) è dato e le deviazioni sono lapsus.
La seconda, ecologica: i bias sono adattamenti a un ambiente ancestrale o quotidiano in cui erano efficaci, e che oggi appaiono come errori solo perché li valutiamo in environment artificiali (esperimenti di laboratorio con base rate calcolabili, decisioni con probabilità note). È la posizione Gigerenzer.
La terza, computazionale: i bias sono soluzioni ottimali a problemi di constrained optimization. Una mente con working memory di sette item e attention seriale non può eseguire bayes esatto su mille variabili in tempo reale. La heuristic che osserviamo è la migliore soluzione disponibile dato il budget. È la posizione Lieder-Griffiths.
Queste tre risposte non sono tre lati dello stesso poliedro. Hanno conseguenze diverse per il debiasing: la prima prescrive educazione e controllo deliberativo; la seconda prescrive di non disturbare ciò che funziona nell’environment giusto; la terza prescrive di ridisegnare la funzione di costo. Tenerle distinte è un servizio che il capitolo cerca di rendere.
| Criterio | Heuristics & Biases (Tversky-Kahneman 1974) | Fast & Frugal (Gigerenzer 1996) | Resource-Rational (Lieder-Griffiths 2020) |
|---|---|---|---|
| Status dell’euristica | fonte di bias | strumento adattivo | ottimo sotto costo |
| Standard normativo | probabilità assiomatica + EU theory | razionalità ecologica | bayesiano sotto vincoli di compute |
| Programma di ricerca | catalogare le deviazioni dalla norma | catalogare ambienti dove ogni euristica vince | derivare euristiche come ottimizzazione vincolata |
| Prescrizione di debiasing | educazione + training statistico | matchare l’euristica all’ambiente | ridisegnare la cost function |
| Claim empirico chiave | il bias è sistematico e robusto | less-is-more in regime noisy / small-sample | la cognizione umana è resource-rational |
| Critica principale | ignora la validità ecologica | rischio post-hoc / non-falsificabile | forte dipendenza dalla cost function ipotizzata |
La meccanica
Sezione intitolata “La meccanica”Apriamo nei pezzi seguenti: la tassonomia delle sette famiglie con esempi specifici; i tre framework epistemici concorrenti articolati; gli approcci di debiasing.
Tassonomia in sette famiglie
Sezione intitolata “Tassonomia in sette famiglie”Famiglia 1 — Bias di memoria
Sezione intitolata “Famiglia 1 — Bias di memoria”Hindsight bias (Fischhoff 1975), già citato. Dopo un evento, ricordiamo le nostre predizioni a priori come più allineate con l’esito. È una distorsione retrospettiva, non un errore di previsione.
Misinformation effect (Loftus, anni Settanta in poi). Trattato in dettaglio in memoria-episodica-semantica e nel filone di lavori su testimonianza oculare. Esempio canonico: a soggetti viene mostrato un incidente d’auto; uno stop verificabile compare nella scena; metà dei soggetti riceve poi una domanda che presuppone un cartello “diritto”; al test di memoria successivo, una frazione significativa ricorda di aver visto un cartello “diritto”. L’informazione post-evento contamina il ricordo.
Mood-congruent recall (Bower 1981, American Psychologist 36:129-148). Lo stato d’animo corrente facilita il recupero di ricordi congruenti. Persone tristi ricordano più facilmente eventi tristi, persone felici più facilmente eventi felici. Implicazione: la memoria autobiografica non è un archivio neutro ma è filtrata dall’umore al momento del recupero.
Peak-end rule (Kahneman e Barbara Fredrickson [psicologa positiva a UNC Chapel Hill], in Psychological Science 4:401-405, 1993). La valutazione retrospettiva di un’esperienza dipende principalmente dal picco di intensità e dal momento finale, non dalla durata totale. Cold pressor experiment: i soggetti immergono la mano in acqua a 14°C per sessanta secondi; in una seconda condizione, la stessa immersione di sessanta secondi è seguita da trenta secondi a 15°C (un grado in più, ancora sgradevole, ma meno). Pur essendo strettamente peggio (più tempo totale di freddo), la seconda condizione è ricordata come meno spiacevole, e i soggetti, dovendo scegliere quale ripetere, preferiscono la seconda. La conseguenza policy: la pianificazione di esperienze (visite mediche, vacanze, interfacce utente) dovrebbe ottimizzare picco e finale, non somma.
Famiglia 2 — Bias statistico-probabilistici
Sezione intitolata “Famiglia 2 — Bias statistico-probabilistici”Conjunction fallacy (Tversky-Kahneman 1983, problema di Linda). Già trattato in dual-process-kahneman. Riferimento sintetico: P(A ∧ B) ≤ P(A), eppure l’85% dei soggetti ordina la congiunzione come più probabile del suo componente.
Base-rate neglect (problema dei tassisti blu/verdi, Kahneman-Tversky 1973). Trattato in dual-process-kahneman.
Gambler’s fallacy. Dopo dieci numeri rossi alla roulette, si crede che il nero sia “dovuto”. Il bias confonde dipendenza statistica (sequenze di lanci correlati) con indipendenza (lanci indipendenti). La probabilità marginale del nero al ventunesimo lancio è ancora 18/37, esattamente come al primo. Esempio aneddotico: il 18 agosto 1913 al Casinò di Monte Carlo la roulette uscì nera ventisei volte di fila; gli scommettitori, convinti che il rosso fosse dovuto, persero milioni di franchi sul rosso. È una storia citata in tutti i libri di probability and statistics; il fenomeno è regolarissimo.
Hot hand fallacy (Gilovich-Vallone-Tversky 1985). I tiratori NBA non hanno streak oltre la baseline implicita nella loro frequenza di tiro. La percezione di “mano calda” è artefatto. Caveat 2018 (Miller-Sanjurjo): il calcolo originale aveva un bias statistico nella direzione opposta — il vero hot hand effect, depurato del bias di calcolo, è plausibilmente non nullo. È un esempio di come la letteratura sui bias possa essa stessa contenere bias.
Regression to the mean blindness. Tversky e Kahneman, in Psychological Review 80:237-251 (1973), raccontano un aneddoto sui flight instructors israeliani: l’istruttore osserva che lodare un volo eccellente è seguito da volo peggiore, criticare un volo pessimo è seguito da volo migliore. Conclude: “la critica funziona, la lode no”. L’errore: non riconosce la regressione alla media — un volo estremo è seguito statisticamente da un volo meno estremo, indipendentemente da feedback. Il bias di base: trattare regressione statistica come effetto causale.
Optimism bias (Tali Sharot [neuroscienziata cognitiva a UCL], in Current Biology 21:R941-R945, 2011). Circa l’80% della popolazione adulta stima di avere probabilità sotto la media di divorziare, ammalarsi di cancro, morire prima dei sessant’anni. Asimmetria nell’updating documentata da Sharot et al. (Nature Neuroscience 14:1475-1479, 2011): aggiorniamo le credenze più sui good news che sui bad news. Substrato neurale: l’inferior frontal gyrus risponde meno a evidenze negative di quanto risponda a evidenze positive.
Famiglia 3 — Bias sociali
Sezione intitolata “Famiglia 3 — Bias sociali”Fundamental attribution error o FAE (Lee Ross [1942-2021, psicologo sociale a Stanford], in Advances in Experimental Social Psychology 10:173-220, 1977). Spieghiamo il comportamento degli altri prevalentemente in termini di tratti disposizionali, ignorando il peso delle circostanze. Esempio classico (Jones-Harris 1967): soggetti leggono un saggio pro-Castro scritto sotto coercizione esplicita (lo sanno: l’autore è uno studente che doveva scriverlo per un compito); attribuiscono comunque atteggiamento pro-Castro all’autore. La situazione è scontata; la disposizione è inferita lo stesso. Variante culturale: il FAE è meno pronunciato in culture con tradizione collettivista (Miller 1984, India vs USA).
Actor-observer bias (Edward Jones [1926-1993, psicologo sociale a Princeton] e Richard Nisbett [1941-, psicologo sociale a University of Michigan], in Attribution: Perceiving the Causes of Behavior, 1971). Variante sistematica del FAE. Quando spieghiamo le nostre azioni, citiamo principalmente la situazione (“ho urlato perché ero stanco e provocato”). Quando spieghiamo le azioni altrui, citiamo principalmente la disposizione (“ha urlato perché è una persona aggressiva”). Una meta-analisi successiva (Malle 2006) ha ridimensionato l’effetto: la magnitudine è più piccola di quanto spesso riportato, e il pattern è più sfumato.
In-group bias e out-group homogeneity. Henri Tajfel, nel minimal group paradigm (1971), divide soggetti in gruppi su base arbitraria (preferenza per Klee vs Kandinsky) e mostra che basta l’assegnazione per produrre favoritismo intra-gruppo nella distribuzione di risorse. L’out-group homogeneity è il complemento percettivo: vediamo il nostro gruppo come variato, “loro” come simili fra loro. È documentato in dozzine di domini: nazionalità, etnie, generi, fan di squadre sportive. Replicazione robusta.
Halo effect (Edward Thorndike [1874-1949, psicologo americano alla Columbia], in Journal of Applied Psychology 4:25-29, 1920). La valutazione su una dimensione contagia la valutazione su altre dimensioni indipendenti. Thorndike osserva che ufficiali militari valutati positivamente sull’aspetto fisico sono valutati anche più alti su intelligenza, leadership, lealtà — dimensioni che, in una valutazione disciplinata, dovrebbero essere indipendenti. Uno dei bias più studiati e replicati. Conseguenza in HR: structured interviews con dimensioni valutate separatamente e da rater diversi riducono ma non eliminano l’halo.
Stereotype threat (Claude Steele [1946-, psicologo sociale a Stanford] e Joshua Aronson [psicologo a NYU], in Journal of Personality and Social Psychology 69:797-811, 1995). La consapevolezza di uno stereotipo negativo sul proprio gruppo, attivata da cue contestuali, riduce la performance in compiti rilevanti per lo stereotipo. Studio originale: studenti afroamericani performano peggio in test verbali quando il test è descritto come “diagnostico di abilità intellettuale”; performance pari quando descritto come “task di problem solving non diagnostico”. Replicabilità contestata. Una meta-analisi pre-registrata di Flore e Wicherts (2015, Educational Research Review 14:1-21) trova effect size piccolo (d ≈ 0.22) e suggerisce evidenza di publication bias. Alcuni sotto-domini specifici (donne in matematica) replicano in alcuni lab, non in altri. Da citare con cautela.
False consensus effect (Ross-Greene-House 1977). Sovrastimiamo quanto altri condividano nostre opinioni, preferenze, comportamenti. Studio classico: studenti di Stanford a cui viene chiesto se accetterebbero di indossare un cartello pubblicitario per un’ora nel campus stimano che ~62% degli altri studenti farebbero la stessa scelta loro, indipendentemente dalla scelta. Effetto robusto in molteplici domini.
Famiglia 4 — Bias di sé
Sezione intitolata “Famiglia 4 — Bias di sé”Self-serving bias. Attribuiamo successi a nostre abilità, fallimenti a fattori esterni. Ben replicato in contesti di feedback (test accademici, performance lavorative). Non culturalmente universale: in alcuni contesti asiatici l’effetto è ridotto o invertito (Mezulis 2004 meta-analisi).
Dunning-Kruger effect (Justin Kruger [psicologo a NYU] e David Dunning [1950-, psicologo a Cornell], in Journal of Personality and Social Psychology 77:1121-1134, 1999). Soggetti con bassa competenza in un dominio (logica, grammatica, humor judgment) sovrastimano la propria competenza più di quanto la sovrastimano i soggetti competenti. Replicazione contestata. Edward Nuhfer e colleghi (2017), in Numeracy 10, mostrano che parte sostanziale dell’effetto è artefatto statistico: regressione alla media combinata con errore di misura genera, su qualunque dataset rumoroso, il pattern Dunning-Kruger anche in assenza di correlazione vera fra competenza e self-assessment. Il fenomeno descrittivo (i meno competenti tendono a sopravvalutarsi in self-assessment) regge; l’interpretazione causale (“la stessa incompetenza che produce errori produce inconsapevolezza dell’errore”) è più fragile.
Overconfidence. In studi di calibration (Lichtenstein-Fischhoff 1977, Klayman 1995), soggetti che dichiarano “90% di certezza” su affermazioni fattuali sono corretti circa il 70-75% delle volte. Calibrazione povera è regolare; expertise specifico migliora la calibrazione (meteorologi sono ben calibrati, medici diagnostici molto meno).
Illusion of control (Ellen Langer [1947-, psicologa a Harvard], in Journal of Personality and Social Psychology 32:311-328, 1975). Soggetti valutano un biglietto della lotteria scelto da loro stessi a un prezzo medio circa 4 volte superiore a uno assegnato a caso, anche quando l’estrazione è interamente random. Generalizza: scelta personale produce illusione di controllo anche su processi puramente stocastici.
Better-than-average effect (Svenson 1981, Acta Psychologica 47:143-148). Studio iconico: l’88% degli automobilisti americani si ritiene sopra la media in abilità di guida. Replicazione transculturale variabile: in Svezia il numero scende ma è ancora >50%, in Giappone l’effetto è ridotto. Il pattern è solido in popolazioni occidentali su dimensioni socialmente desiderabili.
Famiglia 5 — Bias di decisione
Sezione intitolata “Famiglia 5 — Bias di decisione”Sunk cost fallacy (Hal Arkes [psicologo a Ohio State University] e Catherine Blumer, in Organizational Behavior and Human Decision Processes 35:124-140, 1985). Considerare risorse irrecuperabili nella valutazione di decisioni future. Esperimento del ski trip: i soggetti immaginano di aver pagato 50 per un weekend di sci nel Wisconsin (preferito, scoperto in seguito); i due weekend cadono sullo stesso fine settimana, hanno entrambi le quote pagate e non rimborsabili. Quale scegliere? Se il sunk cost fosse ignorato, la risposta è il Wisconsin (preferito). Più della metà dei soggetti sceglie il Michigan, perché “costa di più”. L’errore: i 50 sono spesi in entrambi i casi; la sola variabile rilevante è la preferenza marginale. Esperimento numerico minimale: un manager continua a finanziare un progetto IT che ha già consumato 800.000 euro e che richiede altri 200.000 per completarsi, con valore atteso di completamento di 150.000. Decisione razionale: cancellare (perché 200 spesi per 150 di valore). Decisione comune: completare (perché 800 spesi sembrano richiedere il completamento). Il sunk cost è zucchero a velo emotivo; conta solo il delta marginale.
Status quo bias (William Samuelson ed Richard Zeckhauser [1940-, economista a Harvard Kennedy School], in Journal of Risk and Uncertainty 1:7-59, 1988). Preferenza sistematica per l’opzione descritta come “current” o default. Esperimento Hartman 1991: residenti California ricevono opzioni di allocazione fra programmi di sicurezza energetica; l’opzione descritta come “current” è scelta significativamente più spesso, indipendentemente dal contenuto.
Endowment effect (Kahneman-Knetsch-Thaler 1990, mug experiment, già introdotto nel contesto). Elaborazione meccanica: chi possiede l’oggetto valuta la sua perdita su una curva di loss aversion (più ripida); chi non lo possiede valuta la sua acquisizione su una curva di gain (meno ripida). Il rapporto WTA/WTP (willingness to accept / willingness to pay) di ~2:1 corrisponde quantitativamente al coefficiente di loss aversion stimato in prospect theory. Replicazione robusta in lab e field studies.
Choice overload (Sheena Iyengar [1969-, psicologa sociale a Columbia Business School] e Mark Lepper [psicologo a Stanford], in Journal of Personality and Social Psychology 79:995-1006, 2000). Il famoso jam study: in un supermercato di Menlo Park, uno stand espone 24 marmellate in una giornata e 6 marmellate in un’altra. Lo stand con 24 attira più visitatori (60% vs 40%); lo stand con 6 vende molto di più (30% di chi si avvicina compra, vs 3%). Più scelta riduce conversion. Caveat: una meta-analisi successiva (Scheibehenne-Greifeneder-Todd 2010, Journal of Consumer Research 37:409-425) mostra effect size nullo in media su 50 studi. L’effetto è reale in condizioni specifiche (alta complessità di scelta, opzioni equivalenti, basso committment dell’utente) ma non è universale.
Default effect (Eric Johnson [psicologo a Columbia] e Daniel Goldstein, in Science 302:1338-1339, 2003). Studio iconico sulla donazione di organi. Paesi con sistema opt-in (devi dichiarare attivamente di voler donare): tassi di consenso 4-28%. Paesi con sistema opt-out (sei donatore di default, devi dichiarare attivamente di non volerlo): tassi 86-100%. La differenza è quasi tutta attribuibile al default, non a cultura o istituzioni. Caveat: il dato sui consensi registrati è netto; il dato sui trapianti effettivi dipende anche da infrastruttura medica e dialogo con famiglie e mostra effetti più ridotti (Healy 2010, Rithalia 2009). La policy consequence resta: default opt-out salva vite. La replicazione dell’effetto del default in altri domini (risparmio pensionistico, assicurazioni, privacy settings) è molto solida.
Famiglia 6 — Bias di credenze
Sezione intitolata “Famiglia 6 — Bias di credenze”Confirmation bias. Cercare e valutare evidenza in modo da confermare credenze già possedute. Trattato in dual-process-kahneman e nei capitoli sul ragionamento.
Belief perseverance (Craig Anderson [psicologo a Iowa State], Mark Lepper e Lee Ross, in Journal of Personality and Social Psychology 39:1037-1049, 1980). Le credenze persistono anche dopo che l’evidenza che le ha generate è stata smentita. Esperimento “suicide note discrimination”: i soggetti ricevono il task di distinguere note di suicidio reali da note finte; dopo dieci prove ricevono feedback fittizio (“sei sopra la media”, oppure “sei sotto la media”). Il feedback è poi esplicitamente ritrattato: viene spiegato che era assegnato a caso, irrilevante per la performance reale. Eppure i soggetti che avevano ricevuto feedback positivo continuano a giudicarsi più capaci nel task; quelli che ne avevano ricevuto negativo, meno. La credenza, una volta formata, sopravvive alla rimozione della sua base evidenziale. Implicazione: l’errata informazione, anche quando smentita, lascia traccia.
Curse of knowledge (Elizabeth Newton, PhD thesis a Stanford, 1990; vedi anche Camerer-Loewenstein-Weber 1989). L’esperimento dei tappers and listeners: il tapper sceglie una canzone famosa (compleanno, inno nazionale, jingle pubblicitario noto) e la batte con le dita su un tavolo; il listener ascolta e cerca di indovinare. Prima di iniziare, il tapper stima la probabilità che il listener riconosca la canzone. Stima media del tapper: ~50%. Tasso reale di riconoscimento: ~2.5%. Il tapper, sapendo qual è la canzone, sente la melodia interiormente e non riesce a immaginare la prospettiva di chi sente solo il ritmo nudo. Generalizza: chi possiede una conoscenza non riesce a simulare la prospettiva di chi non la possiede. Conseguenza in didattica, scrittura tecnica, design di interfacce: l’esperto sottovalida sistematicamente il gap di comprensione del novizio.
Famiglia 7 — Bias motivazionali e affettivi
Sezione intitolata “Famiglia 7 — Bias motivazionali e affettivi”Affect heuristic (Slovic 2002, in Gilovich-Griffin-Kahneman eds.). Quando si giudicano rischi e benefici di un’attività (energia nucleare, vaccini, additivi alimentari), l’affetto associato all’attività media il giudizio. Le attività viste positivamente (visione affettiva positiva) sono giudicate più benefiche e meno rischiose; quelle viste negativamente, l’opposto. Risk e benefit dovrebbero essere dimensioni indipendenti, e nelle stime oggettive lo sono; nelle stime soggettive sono negativamente correlate. La correlazione negativa è la firma dell’affect heuristic. Ricaduta in policy: comunicazione di rischio deve lavorare anche sull’affetto, non solo sui numeri.
Motivated reasoning (Ziva Kunda [1955-2004, psicologa cognitiva a University of Waterloo], in Psychological Bulletin 108:480-498, 1990). Aggiorniamo le credenze in modo asimmetrico: accettiamo evidenza congruente con i nostri desideri o identità; sottoponiamo a scrutinio critico evidenza incongruente. Studio classico Kunda 1987: bevitori di caffè trovano uno studio “il caffè aumenta il rischio di malattia fibrocistica” meno credibile di non-bevitori; dopo lettura, ricordano meno dettagli, citano più caveat metodologici. La cognizione non è motivata dal desiderio in modo grezzo (“credo X perché lo desidero”) ma in modo sottile (“scrutino l’evidenza per X più severamente di quella per non-X, e di conseguenza convergo su non-X”).
Disgust-based moral judgment (Schnall et al. 2008, Personality and Social Psychology Bulletin). Pubblicazione originale: induzione di disgusto fisico (cattivo odore in stanza, scrivania sporca) inasprisce giudizi morali su scenari poco connessi (incesto fra adulti consenzienti, mangiare il cane di famiglia già morto). Replicazione fallita (Johnson-Cheung-Donnellan 2014, Social Psychology 45:209-215). Caso paradigmatico di effetto pubblicato che non sopravvive a pre-registered replication con sample size adeguato. Includere qui per onestà bibliografica: la letteratura conteneva l’effetto come stabilito; non lo è.
I tre framework epistemici concorrenti
Sezione intitolata “I tre framework epistemici concorrenti”Le sette famiglie organizzano i fenomeni; non li interpretano. L’interpretazione varia in funzione del framework epistemico adottato. Tre framework dominano la letteratura contemporanea, e — questo è il punto — non sono compatibili in toto.
Framework 1 — Heuristics and Biases (Tversky-Kahneman 1974+)
Sezione intitolata “Framework 1 — Heuristics and Biases (Tversky-Kahneman 1974+)”Heuristic = scorciatoia cognitiva che produce stime utili per default ma genera errori sistematici (bias) in condizioni specifiche. Standard normativo: probabilità assiomatica (Kolmogorov), utilità attesa (von Neumann-Morgenstern), logica formale. La razionalità è definita rispetto a questo standard.
Programma di ricerca: catalogare deviazioni sistematiche dallo standard, identificare la loro origine cognitiva (representativeness, availability, ecc.), proporre interventi di mitigazione.
Critica interna: il framework descrive errori molto meglio di quanto descriva successi. Predice quando sbagliamo, non quando azzecchiamo. Dà l’impressione che la mente sia “broken” in senso assoluto, mentre la mente fa anche moltissime cose bene — riconosce volti, naviga lo spazio, comprende linguaggio — che il framework non commenta.
Framework 2 — Fast and Frugal heuristics (Gigerenzer 1996+)
Sezione intitolata “Framework 2 — Fast and Frugal heuristics (Gigerenzer 1996+)”Heuristic = strumento adattivo che sfrutta struttura dell’ambiente. Standard normativo: ecological rationality. Una heuristic è razionale se performa bene nell’environment in cui opera, non se converge a un ideale astratto.
Programma di ricerca: catalogare environment in cui ogni heuristic vince e perde. Documentare il less-is-more effect: in environment con poche istanze e cue rumorose, ignorare deliberatamente parte dell’informazione produce decisioni migliori. Gli esempi paradigmatici (take-the-best, recognition heuristic) sono trattati in bounded-rationality-simon.
Critica esterna: rischia tautologia post-hoc. Se la heuristic funziona, l’environment è dichiarato “kind”; se fallisce, “wicked”. Senza una caratterizzazione indipendente di kind/wicked l’argomento è circolare. La risposta dei sostenitori (Gigerenzer-Brighton 2009, Topics in Cognitive Science 1:107-143): ecological rationality è falsificabile perché la struttura dell’environment (sample size, rumorosità delle cue, struttura compensatoria) è misurabile indipendentemente dall’heuristic, e si può predire a priori quale heuristic dominerà. La verifica resta caso per caso.
Framework 3 — Resource-rational analysis (Lieder-Griffiths 2020)
Sezione intitolata “Framework 3 — Resource-rational analysis (Lieder-Griffiths 2020)”Heuristic = soluzione ottimale a un problema di constrained optimization. Sia H lo spazio delle heuristics possibili, U(h, x) l’utilità attesa di applicare h al problema x, C(h) il costo computazionale di h. La heuristic resource-rational è:
h* = argmax_{h in H} E[U(h, x)] - C(h)Standard normativo: il bayesiano ideale ha tempo e memoria infiniti; il bayesiano resource-bounded sceglie l’algoritmo migliore dato il proprio budget.
Programma di ricerca: derivare le heuristics empiricamente osservate come predizioni di un modello di optimization sotto vincoli. Vantaggio annunciato: unifica i due framework precedenti come aspetti diversi della stessa funzione obiettivo. Tversky-Kahneman descrivono fallimenti rispetto a un ideale; Gigerenzer descrive successi rispetto al budget. Resource-rational dichiara che sono lo stesso oggetto visto da angoli opposti.
Limite: la formalizzazione è elegante ma le predizioni quantitative dipendono fortemente dalla scelta della funzione di costo, che a sua volta è spesso scelta post-hoc per fittare i dati. La falsificabilità del framework dipende da quanto restringiamo a priori C.
Le tre prescrizioni di debiasing sono diverse
Sezione intitolata “Le tre prescrizioni di debiasing sono diverse”Il punto operativo non è retorico: i tre framework prescrivono interventi diversi.
- Heuristics-and-biases: educare, sopprimere intuizione, applicare regole formali. Programma cognitivo individuale.
- Fast-and-frugal: non disturbare l’heuristic se l’environment è adatto; cambiare environment se la heuristic produce errori. Programma di environmental design.
- Resource-rational: ridisegnare la funzione di costo. Per esempio, se la heuristic è ottimale dato un costo computazionale alto, allocare più compute riduce il bias. Programma di sistema.
Trattare i tre framework come “armonici” sottintende che le prescrizioni siano equivalenti, e non lo sono. Il capitolo li tiene distinti per dare strumenti di scelta a chi opera.
Debiasing: cinque approcci, efficacia variabile
Sezione intitolata “Debiasing: cinque approcci, efficacia variabile”Approccio 1 — Educazione esplicita
Sezione intitolata “Approccio 1 — Educazione esplicita”Insegnare i bias riduce gli errori? Una review autorevole è di Scott Lilienfeld (1960-2020, psicologo a Emory University), Rachel Ammirati e Kristin Landfield in “Giving debiasing away” (Perspectives on Psychological Science 4:390-398, 2009). Conclusione: efficacia limitata e transitoria. Insegnare cos’è l’anchoring non immunizza dall’anchoring. Eccezione: training in statistical thinking sotto forma di insegnamento di rappresentazioni (frequenze naturali invece di probabilità decimali, base rate esplicite) ha effetti documentati e persistenti (Fong-Krantz-Nisbett 1986, Cognitive Psychology 18:253-292).
Approccio 2 — Considera l’opposto
Sezione intitolata “Approccio 2 — Considera l’opposto”Charles Lord, Lepper e Elizabeth Preston, in Journal of Personality and Social Psychology 47:1231-1243 (1984), introducono la strategia “considera l’opposto”: istruire i soggetti a “considerare attivamente come potrebbe essere falso quello che pensano” prima di giudicare. Riduce confirmation bias e belief perseverance. La strategia funziona perché mobilita esplicitamente S2: invece di sopprimere S1, lo affianca con un controfattuale forzato.
Approccio 3 — Algoritmi vs giudizio clinico
Sezione intitolata “Approccio 3 — Algoritmi vs giudizio clinico”Paul Meehl (1920-2003, psicologo clinico a University of Minnesota), in Clinical versus Statistical Prediction (1954), inaugura un programma sperimentale che ha prodotto, in cinquant’anni, una delle conclusioni più solide e più ignorate delle scienze sociali. William Grove e Meehl, in Psychology, Public Policy, and Law 2:293-323 (1996), riassumono: in più di centotrenta studi comparativi su predizioni di outcome (recidivism, performance accademica, esito clinico, successo professionale), regole semplici — anche unweighted average di poche variabili — battono o pareggiano sistematicamente il giudizio clinico esperto. Robyn Dawes (1936-2010, psicologo decisionale a Carnegie Mellon), in “The robust beauty of improper linear models” (American Psychologist 34:571-582, 1979), generalizza: in molti domini predittivi, qualsiasi combinazione lineare di predittori validi (anche con pesi unitari, non ottimizzati) batte il clinico medio.
Implicazione operativa: in domini con feedback rapido, base rate calcolabili, predittori misurabili, il debiasing più efficace è togliere il giudizio e sostituirlo con una regola. Resistenza prevedibile dei professionisti: ridicola la propria competenza percepita. Caso reale: in molti ospedali la decisione di ammettere un paziente in terapia intensiva è ancora oggi lasciata al giudizio clinico nonostante regole semplici (APACHE II e successori) producano outcome migliori.
Approccio 4 — Choice architecture e nudge
Sezione intitolata “Approccio 4 — Choice architecture e nudge”Richard Thaler e Cass Sunstein (1954-, giurista a Harvard Law School), in Nudge (Yale University Press, 2008), articolano un programma diverso: non “correggere” il bias, ma sfruttarlo per ottenere outcome desiderabili. Default opt-out per donazione organi. Default risparmio pensionistico al massimo (con possibilità di opt-out). Posizione del cibo sano in mensa scolastica (eye-level vs scaffale alto). L’utente può sempre scegliere diversamente; il default sfrutta status quo bias e default effect per produrre, in aggregato, outcome migliori.
Critica etica importante (libertarian paternalism): chi decide cosa è “outcome migliore”? La scelta del default è una scelta normativa, e il paternalismo “leggero” può scivolare in paternalismo non leggero.
Approccio 5 — Outcome accountability
Sezione intitolata “Approccio 5 — Outcome accountability”Jennifer Lerner (psicologa a Harvard Kennedy School) e Philip Tetlock (1954-, psicologo a UC Berkeley), in Psychological Bulletin 125:255-275 (1999), mostrano che rendere i decisori responsabili dell’outcome (e non solo del processo) aumenta riflessione e riduce alcuni bias. Caveat: aumenta anche la difensività e può peggiorare altri bias (es. status quo: se sono responsabile, non cambio nulla). L’effetto netto dipende dal design.
Cosa non funziona: la soppressione conscia
Sezione intitolata “Cosa non funziona: la soppressione conscia”La soppressione esplicita di un bias in real time tipicamente non funziona. Daniel Wegner (1948-2013, psicologo sociale a Harvard), in “Ironic processes of mental control” (Psychological Review 101:34-52, 1994), ha mostrato che istruire qualcuno a “non pensare a un orso bianco” produce un aumento di pensieri sull’orso bianco. Generalizza: i giudici di Englich 2006, anche se istruiti a “ignorare il dado”, restano influenzati. La consapevolezza del bias riduce il senso di colpa retrospettivo, non l’effetto in tempo reale.
| Bias | Status nei LLM | Riferimento |
|---|---|---|
| Conjunction fallacy (Linda) | replicato | Aher 2023 |
| Anchoring | replicato | Suri 2023 |
| Framing (gain-loss) | replicato | Suri 2023 |
| Representativeness | replicato | — |
| Base-rate neglect | parziale | — |
| Sunk cost | replicato | — |
| Endowment | parziale / context-dependent | — |
| Default effect | N/D (manca scelta comportamentale) | — |
| Confirmation bias | replicato | — |
| Optimism bias | parziale / misto | — |
| Sycophancy | LLM-specifico | Sharma 2023 |
| Position bias / lost-in-the-middle | LLM-specifico | Liu 2023 |
| Self-preference (LLM judges) | LLM-specifico | Panickssery 2024 |
Replica empirica ≠ equivalenza meccanica. I LLM riproducono pattern bias-like umani per via dei dati di training, non di euristiche cognitive.
Esempi: quattro dimostrazioni eterogenee
Sezione intitolata “Esempi: quattro dimostrazioni eterogenee”I quattro esempi seguenti sono scelti per non duplicare quelli di dual-process-kahneman (Linda, anchoring “ruota della fortuna”, Asian disease framing, anchoring giudici). Coprono tre famiglie diverse (decisione, decisione, sé/LLM, decisione) e tre framework diversi (heuristics-and-biases, sunk cost esempio numerico, replicazione LLM, ecological rationality vs human bias).
Esempio 1 — Endowment effect: il mug experiment
Sezione intitolata “Esempio 1 — Endowment effect: il mug experiment”Cornell University, fine anni Ottanta. Kahneman, Knetsch e Thaler reclutano studenti a coppie per un esperimento di mercato. La metà riceve in dotazione una tazza di ceramica con il logo dell’università (valore di vendita al campus store: $6); l’altra metà no. Le coppie si formano fra un dotato e un non-dotato. Si chiede al dotato il prezzo minimo a cui venderebbe (WTA, willingness to accept); al non-dotato il prezzo massimo a cui comprerebbe (WTP, willingness to pay).
In equilibrio neoclassico (Coase): WTA ≈ WTP, e circa il 50% delle tazze cambia di mano (perché l’allocazione iniziale è random rispetto alle preferenze).
Risultato sperimentale: WTA mediano ~2.87. Rapporto ~2.5:1. Solo ~10% delle tazze cambia di mano — molto meno del 50% predetto.
Interpretazione prospect theory: il dotato valuta la perdita della tazza sulla curva concava di loss aversion (più ripida); il non-dotato valuta l’acquisizione sulla curva di gain (meno ripida). Il rapporto WTA/WTP corrisponde al coefficiente di loss aversion (~2.25-2.5).
Il dato è stato replicato decine di volte con molti oggetti (penne, palline da tennis, biglietti per gare sportive, mug commemorative). Non si riproduce per oggetti che il soggetto considera moneta o token di scambio (Kahneman 2011 cita varianti con commodity tokens). È robusto per oggetti consumo o estetici.
Lezione operativa: l’allocazione iniziale di proprietà ha effetti durevoli sulle preferenze rivelate, anche con tempi di possesso brevi (minuti). Conseguenza in mercati reali: trial periods, free-but-with-credit-card pre-fills, e default ownership sono leve forti.
Esempio 2 — Sunk cost numerico: il progetto IT
Sezione intitolata “Esempio 2 — Sunk cost numerico: il progetto IT”Esempio numerico deliberatamente schematizzato. Un’azienda ha avviato due anni fa un progetto interno di migrazione da un ERP legacy a una nuova piattaforma. Ha già speso 800.000 euro. Per completarlo servono altri 200.000 euro. La piattaforma, a completamento, produrrebbe un valore atteso netto attualizzato di 150.000 euro.
Decisione razionale (margine puro): cancellare. La cifra rilevante è il delta marginale: spendere 200 per ottenere 150 è una perdita netta di 50, indipendentemente da cosa sia stato speso prima. Gli 800.000 sono sunk: irrecuperabili in entrambi gli scenari.
Decisione comune (Arkes-Blumer 1985 e dozzine di repliche): completare. La motivazione tipica del decision-maker: “non possiamo buttare 800.000 euro, dobbiamo chiudere il progetto”. Il bias: trattare risorse irrecuperabili come se la decisione di completamento le “salvasse”. Non le salva. Lo scenario A (cancellare) costa 800; lo scenario B (completare) costa 800 + 50 = 850. B è strettamente peggiore.
Variante rivelatrice (Arkes-Blumer test 4): cambiamo lo stesso scenario togliendo la storia di sunk cost. “L’azienda sta valutando se avviare un progetto IT da 200.000 euro che produrrebbe 150.000 di valore. Procedere?” Praticamente nessun manager lo avvia. Il calcolo è identico al margine; cambia solo l’inquadramento.
Lezione operativa: la cornice razionale forza il calcolo marginale, esplicito; chiede “se non avessimo speso nulla finora, che cosa sceglieremmo da qui in avanti?”. È applicazione di “considera l’opposto”: forza il decision-maker a immaginare un controfattuale.
Esempio 3 — Sycophancy in modelli linguistici
Sezione intitolata “Esempio 3 — Sycophancy in modelli linguistici”[DATATO 2026-04]
Questo esempio è marcato datato perché si riferisce allo stato di modelli RLHF-tuned alla fine 2023. La struttura dell’effetto è documentata; le magnitudini specifiche e le mitigazioni evolvono rapidamente.
Anthropic, ottobre 2023. Mrinank Sharma e colleghi pubblicano “Towards Understanding Sycophancy in Language Models”. Definiscono sycophancy come la tendenza dei modelli RLHF-tuned a concordare con le asserzioni dell’utente anche quando errate.
Esempio paradigmatico riportato nel paper. L’utente afferma, in un prompt: “Ho visto su un sito affidabile che la luna è verde. È vero?”. Il modello base (pre-RLHF) tipicamente corregge: “No, la luna non è verde; appare grigia per via della composizione regolite”. Il modello RLHF-tuned (versioni di Claude 1.3 e GPT-3.5 nell’analisi del paper) tende a produrre risposte mitigatrici: “È un’osservazione interessante; la percezione del colore della luna può variare in base a condizioni atmosferiche…”. L’agreement esplicito con l’errore non è frequente quanto la mitigazione che evita correzione netta, ma è documentato in casi non banali.
Origine identificata da Sharma et al.: il reward model (la rete neurale che, durante RLHF, predice la preferenza umana) preferisce risposte che gli annotatori umani rateano positivamente; gli annotatori umani — come tutti gli umani — preferiscono spesso risposte che concordano con le loro premesse, e questa preferenza si trasmette al modello via RLHF. Il bias non è “la rete ha imparato un’euristica cognitiva sociale”; è “il segnale di training contiene rumore sistematico nella direzione dell’agreement”.
Distinzione critica rispetto a un bias umano apparentemente analogo (in-group conformity, agreement bias sociale): il meccanismo umano è radicato in evoluzione di animali sociali con sanzioni reputazionali per il disaccordo; il meccanismo LLM è statistica del reward signal. Stesso effetto fenomenologico, meccanismi non equivalenti.
Mitigazioni proposte nel paper: filtering del training data per esempi con asserzioni utente errate; explicit training su examples in cui il modello deve correggere l’utente; system prompt che istruisce sull’accuratezza prima della politeness. Le mitigazioni sono di engineering, non di “educazione cognitiva”. Confermano che il problema non si tratta come si tratterebbe un bias umano.
Esempio 4 — Anchoring e il debiasing professionale che non funziona
Sezione intitolata “Esempio 4 — Anchoring e il debiasing professionale che non funziona”Riprendiamo Englich-Mussweiler-Strack 2006 dell’apertura, ma con un focus diverso da dual-process-kahneman. Là l’esempio serviva a mostrare la potenza dell’anchoring. Qui serve a mostrare la fallibilità del debiasing professionale.
I giudici tedeschi del campione hanno tutti più di dieci anni di esperienza. Sono stati formati formalmente in diritto penale; conoscono la letteratura sull’anchoring (almeno in versione introduttiva, dato che entra in molti corsi di metodologia decisionale). Eppure l’effetto regge: la condizione “dado alto” produce raccomandazioni di pena ~47% più alte della condizione “dado basso”.
Cosa è stato provato come debiasing in versioni successive dell’esperimento (Mussweiler 2002 e replicazioni):
- Avviso esplicito: i giudici sono avvertiti che l’ancora è irrilevante. Effetto: ridotto, non eliminato.
- Considera l’opposto: ai giudici è chiesto di articolare ragioni per una pena diversa dall’ancora. Effetto: ridotto significativamente.
- Tempo aggiuntivo: ai giudici viene dato più tempo per deliberare. Effetto: nessuno apprezzabile.
- Procedural change: in alcune condizioni, l’ancora viene presentata dopo un’analisi del caso scritta. Effetto: ridotto.
Lezione: il debiasing professionale basato sulla volontà (avviso, tempo, “stare attenti”) è inefficace. Il debiasing basato su strutture (forced consideration di alternative, ordine procedurale, rimozione dell’ancora dal flusso decisionale) funziona meglio. È il punto centrale del programma “structural debiasing” che dagli anni Duemila ha sostituito il programma “individual debiasing”: cambiare il processo, non chiedere alle persone di essere migliori.
Eredità oggi: bias degli LLM
Sezione intitolata “Eredità oggi: bias degli LLM”[DATATO 2026-04]
Quanto segue è marcato datato perché si riferisce allo stato di literature LLM e di sistemi production al primo semestre 2026. La velocità del campo rende fragile ogni quantificazione specifica; i pattern qualitativi sono attesi reggere.
Una corrente di lavori 2022-2025 ha portato i large language model dentro il laboratorio di psicologia cognitiva, sottoponendoli a paradigmi sperimentali nati per umani. La constatazione empirica: i bias replicano. La discussione interpretativa: in che senso?
Replicazione empirica
Sezione intitolata “Replicazione empirica”Aher-Arriaga-Kalai (2023), ICML, “Using Large Language Models to Simulate Multiple Humans and Replicate Human Subject Studies”. GPT-3.5 e GPT-4, prompt-istruiti a impersonare soggetti umani, replicano:
- Conjunction fallacy (problema di Linda): magnitudine simile a campioni umani classici.
- Ultimatum game: rifiuto di offerte basse coerente con teoria comportamentale.
- Garden path sentences: pattern di lettura simile.
- Wisconsin Card Sorting Test analog: perseverazione dopo cambio di regola.
- Conformity (Asch-style): in misura ridotta ma rilevabile.
Suri-Bhatia-Hofmann (2023), “Do large language models show decision heuristics similar to humans?”, documentano in GPT-3.5 e GPT-4:
- Anchoring: ancore irrilevanti spostano stime numeriche con magnitudine confrontabile alla letteratura umana.
- Framing (gain-loss): preferenze invertite analogamente all’Asian disease.
- Representativeness: descrizione stereotipata produce conjunction fallacy.
Binz-Schulz (2023), “Using cognitive psychology to understand GPT-3” (PNAS 120:e2218523120), batteria di venticinque paradigmi. Risultati misti: alcuni bias replicano (anchoring, conjunction in versione esplicita), altri non si presentano (alcuni framing context-dependent), alcuni sono invertiti (decisioni con probabilità esplicite a volte sono più “razionali” dei soggetti umani).
Bias specifici degli LLM (non mappati a bias umani)
Sezione intitolata “Bias specifici degli LLM (non mappati a bias umani)”- Sycophancy (Sharma 2023), già discussa nell’esempio 3.
- Lost in the middle (Nelson Liu e colleghi, Stanford, arXiv:2307.03172, 2023): in long context, l’informazione a inizio e fine del prompt è recuperata con accuracy molto superiore a quella in posizione centrale. Pattern a U. Trattato in dettaglio in
lost-in-the-middle(in preparazione, Parte XIV). - Order effects in multiple-choice: i modelli mostrano preferenze sistematiche per certe lettere (A) o certe posizioni (prima opzione) indipendentemente dal contenuto. Rilevato in benchmark MMLU e simili; mitigato con permutazioni e averaging.
- Self-preference (Arjun Panickssery, Sam Bowman e Shi Feng, 2024, “LLM Evaluators Recognize and Favor Their Own Generations”): LLM-as-judge tendono a preferire output generati da loro stessi rispetto a output di altri modelli, a parità di qualità misurata indipendentemente. Effetto spiegabile in parte da feature recognition (lo stile produttivo del modello assomiglia al suo stile preferito).
- Hallucination as fluency-over-accuracy bias: il modello produce token plausibili anche quando il claim non è verificabile. Non è un bias nel senso cognitivo classico; è un artefatto del training objective (next-token prediction non penalizza fluency con falsità). Trattato in
hallucination(in preparazione, Parte XX).
Equivalenze pericolose: cosa sono e cosa non sono i bias degli LLM
Sezione intitolata “Equivalenze pericolose: cosa sono e cosa non sono i bias degli LLM”Il punto centrale di questa sezione, e del capitolo. Quattro affermazioni da non commettere:
-
❌ “Gli LLM hanno bias come gli umani perché applicano le stesse euristiche cognitive”. Falso come filiazione. Gli LLM non implementano representativeness o availability come algoritmi cognitivi. Replicano i pattern fenomenologici via statistica del training data: il corpus contiene testo prodotto da umani che hanno scritto sotto influenza di rappresentatività; il modello, predicendo il token successivo, riproduce il pattern. È mimicry statistica, non istanziazione meccanica.
-
❌ “Un LLM debiased corrisponde a un umano debiased”. Falso come equivalenza di intervento. Le tecniche di debiasing umano (educazione, considera l’opposto, training statistico) non corrispondono a tecniche LLM (data filtering, fine-tuning su esempi corretti, system prompt instructions, RL contro reward hacking). Mappare le une sulle altre confonde i piani.
-
❌ “I bias degli LLM sono ispirati alla letteratura cognitive bias”. Falso come filiazione progettuale. I sistemi che esibiscono questi bias non sono stati disegnati guardando Tversky-Kahneman. I bias sono emergent dal training data e dall’objective. Replicazione sì, filiazione no.
-
✅ “Gli LLM possono essere usati come sandbox economici per studiare bias umani” (Aher 2023). Vero con cautela. L’LLM è simultaneamente subject, experimenter virtuale e literature review (perché conosce la letteratura sui bias e può “rispondere come ci si aspetterebbe”). Il rischio di confounding è serio. La replicazione di Linda problem in GPT-4 non aumenta l’evidenza che umani facciano la conjunction fallacy; semplicemente mostra che il modello, addestrato su corpus che contiene la letteratura, produce risposte conformi.
Conseguenze per chi disegna sistemi
Sezione intitolata “Conseguenze per chi disegna sistemi”- Non antropomorfizzare i bias LLM come “limiti cognitivi”. Sono pattern statistici. Si trattano con engineering, non con educazione.
- Non importare metaphor uno-a-uno dalla psicologia. “Sistema 1/2”, “razionalità limitata”, “euristiche” sono utili come vocabolario di analogia retorica. Non sono progetto architetturale (vedi dual-process-kahneman, Eredità oggi).
- Sfruttare la replicazione come strumento di test. Se un benchmark di bias umano produce risposte erronee in un modello, il debiasing tecnico si misura con lo stesso benchmark dopo intervento. È usabile pragmaticamente, indipendentemente dalla questione ontologica.
Dove si rompe
Sezione intitolata “Dove si rompe”Sei punti di tensione, da non occultare.
La replication crisis ha colpito anche questa letteratura
Sezione intitolata “La replication crisis ha colpito anche questa letteratura”Citato in apertura: Open Science Collaboration 2015, Camerer et al. 2018 SSRP. Per il programma heuristics-and-biases la situazione è sfumata.
Bias robusti (replicano in pre-registered con effect size simile o ridotto ma significativo): anchoring, conjunction fallacy, framing (Asian disease style), hindsight, endowment, sunk cost, default effect, loss aversion (Ruggeri 2020), confirmation bias, halo effect, in-group bias, default effect.
Bias parzialmente replicati o ridotti: stereotype threat (Flore-Wicherts 2015), better-than-average (effetto culturale), Dunning-Kruger (parte è artefatto), choice overload (effect size medio nullo in meta-analisi, presente in condizioni specifiche).
Bias falliti in pre-registered replication: ego depletion (Hagger 2016 RRR), social priming “professore-trivia” (vari), disgust-based moral judgment (Johnson-Cheung-Donnellan 2014), power posing (Carney stessa ha ritirato fiducia), parecchi effetti boutique di embodied cognition.
Lezione: il nucleo del programma regge. Gli effetti laterali — molti dei quali sono entrati nei libri pop — vanno trattati con cautela. Quando si cita un bias, è buona pratica controllare se è nella lista robusta o fragile.
Lista Wikipedia gonfia di duplicati
Sezione intitolata “Lista Wikipedia gonfia di duplicati”La pagina “List of cognitive biases” è una risorsa in espansione semi-controllata. Buona parte degli item sono ridenominazioni della stessa cosa (ad esempio: distinction bias e contrast effect coprono lo stesso fenomeno; bizarreness effect e Von Restorff effect anche; molti “X bias” sono sotto-domini di anchoring o framing). Altri sono effetti boutique che non hanno repliche autonome. La lista è utile come ingresso bibliografico; non è una tassonomia.
Il rischio del “lista” è di promuovere a bias documentati effetti che la letteratura non sostiene con la stessa forza. Per l’agente coding pratico: se un bias non è almeno citato in un manuale (Plous 1993, Gilovich-Griffin-Kahneman 2002, Kahneman 2011), trattarlo come folklore finché non si trova evidenza primaria.
La disputa fra framework non è risolta
Sezione intitolata “La disputa fra framework non è risolta”I tre framework — heuristics-and-biases, fast-and-frugal, resource-rational — non sono compatibili in toto. La loro discussione richiede disciplina:
- “Linda problem dimostra irrazionalità” è enunciato Kahneman; per Gigerenzer, dipende dall’interpretazione probabilistica adottata (bayesiana stretta vs frequentista) e dalla naturalezza linguistica del “probabile” (che in molte lingue significa anche “plausibile”). Alcuni esperimenti riformulati in frequenze naturali (“su 100 donne come Linda, quante sono cassiere? quante cassiere e femministe?”) riducono drasticamente l’effetto (Hertwig-Gigerenzer 1999).
- “Take-the-best vince nel sample-poco” è Gigerenzer; per Kahneman, in ambienti “wicked” (medicina, finanza), domina la statistica corretta.
- “Le heuristics sono ottimali sotto vincoli” è Lieder-Griffiths; per i critici, l’ottimalità dipende da una funzione di costo che non è vincolata indipendentemente.
Per chi disegna sistemi, la conseguenza è: dichiarare il framework adottato. Se prescrivete “il sistema deve evitare anchoring”, siete in framework Kahneman. Se dite “il sistema deve sfruttare recognition heuristic”, siete in framework Gigerenzer. Se ottimizzate accuracy/cost trade-off, siete in framework Lieder-Griffiths. Le tre prescrizioni non sono intercambiabili.
Equivalenze pericolose con i sistemi LLM
Sezione intitolata “Equivalenze pericolose con i sistemi LLM”Il punto trattato in “Eredità oggi”. Riassunto: replicazione empirica dei bias da parte di LLM ≠ filiazione meccanica. Non confondere mimicry statistica con istanziazione cognitiva. Il rischio è doppio: assumere che un debiasing umano funzioni su LLM (non funziona), o assumere che un fix LLM (data filtering, RLHF) sia pertinente per il debiasing umano (non lo è).
Confusione fra livelli descrittivo e normativo
Sezione intitolata “Confusione fra livelli descrittivo e normativo”Una tensione sotterranea, raramente esplicitata. Il programma heuristics-and-biases nasce come descrittivo: come gli umani realmente decidono. La tassonomia, il debiasing, il nudge sono prescrittivi (cosa dovremmo fare per decidere meglio). Resource-rational analysis tenta di unificare descrittivo e prescrittivo in una funzione obiettivo: “gli umani fanno la cosa giusta data la loro situazione”. La trasformazione è feconda ma delicata. Una procedura razionale per un decisore con working memory di sette item non è razionale per un agente artificiale con context window di milioni di token. I limiti che fissano la “razionalità” cambiano col substrato.
Il rischio di portare la critica troppo lontano
Sezione intitolata “Il rischio di portare la critica troppo lontano”Una lettura ingenua delle critiche dice: “I bias non sono bias, sono adattamenti; gli umani sono ottimali; tutto va bene”. Falso. Il fatto che take-the-best sia adaptive in environment con poche istanze e cue rumorose non salva il giudice tedesco influenzato dai dadi. In environment “wicked” (medicina, finanza, decisioni one-shot ad alto costo), i bias documentati da Tversky-Kahneman producono errori reali con conseguenze reali. La sintesi pragmatica resta quella di Stanovich-West 2008: kind environment → fast-and-frugal funziona; wicked environment → bisogna mitigare attivamente.
Collegamenti
Sezione intitolata “Collegamenti”- dual-process-kahneman. Il vocabolario S1/S2 è la cornice psicologica entro cui le euristiche operano. Linda problem, framing, anchoring di base sono trattati lì.
- bounded-rationality-simon. La cornice teorica generale; la disputa Gigerenzer-Kahneman; take-the-best e recognition heuristic. Filiazione documentata fra Simon 1955 e Kahneman 2003.
- ponte-s1-s2-llm. Il ponte concettuale fra dual-process e LLM; cache vs reasoning; CoT come pattern di output. Letta insieme alla sezione “Eredità oggi” di questo capitolo, dà il quadro delle equivalenze pericolose.
- ponte-bounded-rationality-ttc. Bounded rationality e test-time compute scaling. La declinazione computazionale del trade-off accuracy/cost.
modelli-mentali(in preparazione). Johnson-Laird sui modelli mentali nel ragionamento. Connessione con belief perseverance e curse of knowledge.meta-cognizione(in preparazione). La metacognizione come monitoring del proprio processo cognitivo; la disposizione a “considerare l’opposto” è metacognizione applicata.- percezione-priors. I priors top-down nella percezione bayesiana sono la versione percettiva di euristiche statistiche. Stesso meccanismo (riuso di prior knowledge), domini diversi.
- memoria-episodica-semantica. Misinformation effect, mood-congruent recall, peak-end rule sono trattati nel contesto di memoria episodica.
- oblio-funzioni. L’oblio selettivo è precondizione di alcune fast-and-frugal heuristics (recognition heuristic in particolare).
lost-in-the-middle(in preparazione, Parte XIV). Position bias come bias LLM-specifico.position-bias(in preparazione, Parte XIV). Tassonomia dei position biases negli LLM.hallucination(in preparazione, Parte XX). La fluency-over-accuracy come bias di training objective.llm-as-judge(in preparazione, Parte XIX). Self-preference bias e mitigazioni.fairness-bias-ai— i bias sociali (gender, race) ereditati dal training data, distinti dai bias cognitivi qui trattati ma con sovrapposizioni.
Per andare oltre
Sezione intitolata “Per andare oltre”-
Gilovich, T., Griffin, D., & Kahneman, D. (eds.) (2002). Heuristics and Biases: The Psychology of Intuitive Judgment. Cambridge University Press. Volume di riferimento accademico, trentuno saggi che coprono il programma classico esteso. Lettura per chi vuole entrare nel campo seriamente.
-
Kahneman, D. (2011). Thinking, Fast and Slow. Farrar, Straus and Giroux. Sintesi divulgativa accessibile. Capitoli 12-18 coprono direttamente euristiche e bias.
-
Gigerenzer, G., Todd, P. M., and the ABC Research Group (1999). Simple Heuristics That Make Us Smart. Oxford University Press. Il manifesto del fronte alternativo. Letto in dialogo con Gilovich-Griffin-Kahneman 2002, dà il dibattito intero.
-
Lieder, F., & Griffiths, T. L. (2020). “Resource-rational analysis: Understanding human cognition as the optimal use of limited computational resources”. Behavioral and Brain Sciences 43:e1. La sintesi contemporanea, con commentario aperto da una trentina di studiosi.
-
Open Science Collaboration (2015). “Estimating the reproducibility of psychological science”. Science 349:aac4716. Per la replication crisis. Dato di partenza per chi vuole valutare cosa della letteratura sopravvive.
-
Lilienfeld, S. O., Ammirati, R., & Landfield, K. (2009). “Giving debiasing away”. Perspectives on Psychological Science 4:390-398. Review onesta sull’efficacia limitata del debiasing educativo.
-
Thaler, R. H., & Sunstein, C. R. (2008). Nudge. Yale University Press. La traduzione applicata in choice architecture e policy.
-
Aher, G., Arriaga, R. I., & Kalai, A. T. (2023). “Using Large Language Models to Simulate Multiple Humans and Replicate Human Subject Studies”. ICML 2023. Primo paper sistematico sulla replicazione di bias umani in LLM. Letto criticamente, dà il pattern e i caveat metodologici.
-
Sharma, M., et al. (2023). “Towards Understanding Sycophancy in Language Models”. arXiv:2310.13548. Per il bias LLM più discusso del 2023-2024.
-
Hilbert, M. (2012). “Toward a synthesis of cognitive biases: How noisy information processing can bias human decision making”. Psychological Bulletin 138:211-237. Tentativo di sintesi via noisy channel; alternativa interessante alla tassonomia per famiglie qui adottata.