Salta ai contenuti

L'oblio come feature, non bug

Una mente che ricorda tutto smette di pensare. Una mente che dimentica troppo si dissolve. Fra i due estremi vive un sistema regolato di rimozione selettiva, che il Novecento ha letto come decadimento e il Duemila ha riconosciuto come funzione attiva. Non un guasto della macchina della memoria: una sua operazione necessaria.

Un giorno del 1942, in un raccontino di poche pagine, Jorge Luis Borges (1899-1986, scrittore argentino) inventa Ireneo Funes. Il giovane, dopo una caduta da cavallo nei pressi di Fray Bentos, riceve come compenso e come maledizione una memoria perfetta. Ricorda ogni foglia di ogni albero che ha visto, e ricorda di avere ricordato; e tutte le immagini, anche quelle dei sogni, restano nitide al loro posto. La descrizione che Borges sceglie per questa condizione non è di abbondanza ma di paralisi: Pensare è dimenticare differenze, è generalizzare, astrarre. Nel mondo stipato di Funes non c’erano che dettagli, quasi immediati. Funes non riesce a capire che il cane visto di profilo alle tre e quattordici e quello visto di fronte alle tre e quindici siano “lo stesso cane”: sono per lui due immagini diverse, ognuna meritevole del proprio nome. Una cosa è il sintomo curioso di un personaggio letterario; un’altra è il riconoscimento, cinquant’anni prima della letteratura specialistica, di una tesi che diventerà cardine della scienza cognitiva contemporanea: il pensiero richiede dimenticare. La generalizzazione, l’astrazione, la categoria, la decisione — tutte operazioni che usiamo per stare al mondo — comportano cancellazione attiva di ciò che è irrilevante, particolare, datato.

Mezzo secolo prima del racconto, William James (1842-1910, filosofo e psicologo americano alla Harvard) aveva scritto a pagina 680 del primo volume dei Principles of Psychology (1890) una frase che gli storici della memoria citano oggi come incipit del campo: If we remembered everything, we should on most occasions be as ill off as if we remembered nothing. James la formula come paradosso retorico, senza dati a sostegno. Ci vorranno centotrent’anni perché il paradosso riceva una base sperimentale e cellulare. Quando la riceverà — per merito di Mark Anderson e Collin Green a Stanford nel 2001, di Kaori Akers e Paul Frankland a Toronto nel 2014, di Oliver Hardt, Lynn Nadel e Szu-Han Wang nel 2013, di Ronald Davis e Yi Zhong nel 2017 — risulterà che James aveva ragione e che Funes era un esperimento concettuale corretto. L’oblio non è il consumo accidentale dell’archivio: è uno strumento dell’archivista.

Questo capitolo ricostruisce la traiettoria. Non tornerà sui dati di Hermann Ebbinghaus (la curva del 1885 è stata trattata in memoria a lungo termine) se non per discuterne l’interpretazione. Si concentrerà su tre questioni intrecciate: (a) la tassonomia delle cause del dimenticare, ricostruita storicamente e poi presentata come schema; (b) la lettura funzionale-adattiva dell’oblio, da James a Daniel Schacter (1952-, psicologo cognitivo a Harvard) fino al Decay happens di Hardt-Nadel-Wang; (c) la sezione “eredità oggi”, in cui distinguere con cura cosa l’AI contemporanea ha davvero ereditato (poco) da cosa condivide solo per omonimia (molto). Quest’ultima distinzione sarà la spina dorsale dell’ultima parte del capitolo: parole come forgetting, unlearning, knowledge editing indicano in informatica problemi profondamente diversi dall’oblio funzionale umano, e accomunarli è una delle confusioni più comuni della divulgazione AI 2023-2026.

Tre ragioni: storiografica, strutturale, di ponte.

La storiografica. L’oblio è uno dei rari temi di scienza cognitiva in cui la lettura accademica è cambiata di segno nel corso di un secolo e mezzo. Da fenomeno negativo (deficit della macchina mnemonica) a fenomeno positivo (operazione regolata della macchina). Il passaggio non è avvenuto per accumulazione lineare, ma per un’inversione di prospettiva: prima si sono raccolti i dati come se l’oblio fosse perdita; poi qualcuno ha chiesto, riprendendo James, perché un sistema evolutosi per ricordare dovrebbe sistematicamente perdere informazione senza che ci sia un vantaggio. La domanda ha trovato risposta in tre tappe — l’argomento ecologico (forgetting come selezione adattiva), l’argomento neurobiologico (forgetting come processo attivo regolato a livello molecolare), l’argomento computazionale (forgetting come prerequisito per generalizzazione). Raccontare bene questa inversione è didatticamente prezioso: mostra come la scienza non si limita a accumulare fatti ma cambia categorie.

La strutturale. Nei capitoli precedenti di questa Parte abbiamo descritto come la memoria umana si forma (memoria sensoriale, memoria di lavoro), come si stabilizza (consolidamento), come si organizza (dichiarativa-procedurale, episodica-semantica). Manca il complemento: come si sfoltisce. Senza un capitolo sull’oblio, la trattazione della memoria umana resta squilibrata — descritta come archivio in espansione anziché come sistema in equilibrio fra accumulazione e rimozione.

La di ponte. Il rumore terminologico fra “forgetting” umano e “forgetting” AI è particolarmente forte, e particolarmente dannoso. Catastrophic forgetting nelle reti neurali, machine unlearning nei sistemi di compliance GDPR, knowledge editing nei modelli foundation: tre problemi tecnici molto diversi, tutti chiamati con varianti della stessa parola. L’oblio umano funzionale, che è il tema biologico-cognitivo del capitolo, è ancora un quarto problema. Una sezione finale dedicata, marcata come [DATATO 2026-04], mette in fila i quattro problemi e segnala le equivalenze sbagliate.

Le date contano: ognuna aggiunge un livello al modello, e nessuna sostituisce le precedenti.

1885 — Ebbinghaus, Über das Gedächtnis. La curva di oblio è già stata raccontata in memoria a lungo termine. Qui basta ricordare il nucleo: Hermann Ebbinghaus (1850-1909, psicologo tedesco a Berlino) misura su sé stesso il savings nel ri-imparare liste di sillabe senza senso a intervalli crescenti. Ottiene una curva che cala rapidamente nelle prime ore e si appiattisce verso un asintoto a settimane. Dato cardinale; interpretazione lasciata aperta.

1890 — James, The Principles of Psychology, vol. 1, cap. XVI. William James scrive che ricordare tutto sarebbe come non ricordare niente, e formula così il primo argomento adattivo per l’oblio. Non porta dati; porta un’intuizione che resta dormiente per oltre un secolo nei manuali, salvo riemergere ogni volta che qualcuno cita il caso clinico opposto.

1901 — Freud, Zur Psychopathologie des Alltagslebens. Sigmund Freud (1856-1939, neurologo e fondatore della psicoanalisi a Vienna) propone che molti errori quotidiani — lapsus, dimenticanze di nomi, smarrimenti di oggetti — siano motivati: il sistema dimentica attivamente ciò che è in conflitto con desideri o paure inconsci. La tesi è la repressione. Storicamente influente; empiricamente fragile. Studi successivi (in particolare la letteratura sulle false memories di Elizabeth Loftus) hanno ridimensionato la repressione come meccanismo robusto: i traumi reali tendono a essere ricordati troppo, non rimossi. Ma il concetto di motivated forgetting sopravvive, riformulato in modo empiricamente solido nel paradigma think/no-think di Anderson e Green un secolo dopo.

1914 — Thorndike, The Psychology of Learning. Edward Lee Thorndike (1874-1949, psicologo americano alla Columbia) formula la legge del disuso: una connessione che non è esercitata si indebolisce nel tempo. È la prima formulazione esplicita del decay come meccanismo dell’oblio. Tempo che passa, traccia che si attenua. Lettura passiva, intuitiva. Sarà la posizione standard fino agli anni Trenta.

1932 — McGeoch, “Forgetting and the Law of Disuse”, Psychological Review 39:352-370. John McGeoch (1897-1942, psicologo americano allo State College of Iowa) scrive l’articolo che ribalta la posizione di Thorndike. Tesi centrale: il tempo, di per sé, non causa l’oblio. È ciò che si fa nel tempo a causarlo. McGeoch usa una metafora destinata a essere citata: il ferro non si arrugginisce perché passa il tempo, ma perché in quel tempo ha luogo un processo chimico di ossidazione. La domanda perché si dimentica? va riformulata come quale processo, presente nel tempo intercorso, ha causato l’oblio? La risposta che McGeoch fornisce è interferenza: nel tempo si imparano altre cose, e quelle altre cose competono per recupero con la traccia originaria.

1957 — Underwood, “Interference and forgetting”, Psychological Review 64:49-60. Benton Underwood (1915-1994, psicologo americano alla Northwestern University) pubblica una meta-analisi della letteratura ebbinghausiana e mostra un risultato sorprendente: una parte sostanziale del forgetting misurato negli esperimenti di Ebbinghaus è dovuta a interferenza proattiva — sillabe imparate in liste precedenti dello stesso esperimento interferiscono con la lista in test. La curva di oblio non è un fenomeno puro; è confusa con un effetto di trascinamento. Underwood non confuta Ebbinghaus, ma riapre l’interpretazione: il decay puro, se esiste, è più piccolo di quanto si credesse.

1966 — Brown e McNeill, “The ‘tip of the tongue’ phenomenon”, Journal of Verbal Learning and Verbal Behavior 5:325-337. Roger Brown (1925-1997, psicolinguista americano alla Harvard) e David McNeill mostrano che molti casi di “oblio” non sono perdita ma retrieval failure parziale. Soggetti a cui si chiede una parola rara di cui hanno tip-of-the-tongue (TOT) sanno spesso la prima lettera, il numero di sillabe, l’accento: parti dell’informazione sono accessibili, l’integrazione no. L’informazione c’è; il recupero fallisce. È una distinzione che cambierà tutto: oblio come perdita di traccia ≠ oblio come perdita di accesso.

1974 — Tulving, “Cue-Dependent Forgetting”, American Scientist 62:74-82. Endel Tulving (1927-2023, psicologo estone-canadese a Toronto) generalizza l’osservazione di Brown-McNeill. Il ricordo non è una proprietà della traccia in isolamento; è funzione dell’interazione fra traccia e cue di recupero. Cambiare contesto, mood, prompt verbale può rendere recuperabile un ricordo che sembrava perso, e viceversa. Conseguenza: una parte significativa del forgetting osservato nei laboratori è in realtà cue-dependent forgetting, e svanisce con la cue giusta. Non perdita: copertura.

1994 — Anderson, Bjork, Bjork, “Remembering can cause forgetting: Retrieval dynamics in long-term memory”, Journal of Experimental Psychology 20:1063-1087. Michael Anderson (psicologo americano poi a Cambridge UK), Robert Bjork (1939-, psicologo a UCLA) e Elizabeth Bjork (psicologa a UCLA) descrivono il retrieval-induced forgetting (RIF). Il paradigma: i soggetti imparano coppie categoria-esemplare (FRUTTA-mela, FRUTTA-pera, FRUTTA-banana, BEVANDA-vino, BEVANDA-birra). In una fase di pratica selettiva, recuperano alcune coppie ma non altre (es. praticano FRUTTA-mela, ma non FRUTTA-pera). In test finale, la pera è ricordata peggio del baseline non praticato. Recuperare attivamente un membro di una categoria sopprime i competitori. Il forgetting non è laterale alla memoria: è un effetto del funzionamento normale del recupero.

2001 — Schacter, The Seven Sins of Memory. Daniel Schacter pubblica il libro che diventa il riferimento divulgativo. Tassonomia in sette categorie: transience (oblio progressivo nel tempo), absent-mindedness (encoding failure), blocking (retrieval failure tipo TOT), misattribution (confusione di sorgente), suggestibility (false memory implantation, eredità di Loftus), bias (lo stato attuale colora il ricordo del passato), persistence (memorie intrusive). Argomento centrale: ognuna è un sotto-prodotto adattivo di un sistema funzionante, non un difetto da correggere. La transience è il prezzo della generalizzazione; l’absent-mindedness è il prezzo dell’attenzione selettiva; la persistence è il prezzo della rilevanza emotiva. Sette colonne di un tempio funzionale.

2001-2004 — Anderson e Green, Nature 410, e Anderson et al. Science 303. Mark Anderson e Collin Green pubblicano nel 2001 il paradigma think/no-think che riformula empiricamente la nozione freudiana di repressione, depurata dei riferimenti dinamici e ricondotta a controllo esecutivo. Il paradigma è descritto in dettaglio più sotto come esempio. Nel 2004 follow-up con FMRI (Anderson, Ochsner, Kuhl, Cooper, Robertson, Gabrieli, Glover, Gabrieli) mostra che durante la soppressione il prefrontale dorsolaterale aumenta attività e l’ippocampo la diminuisce: meccanismo top-down identificabile.

2013 — Hardt, Nadel, Wang, Trends in Cognitive Sciences 17:111-120. Oliver Hardt (psicologo a McGill), Lynn Nadel (1942-, psicologo a Arizona) e Szu-Han Wang scrivono Decay happens: the role of active forgetting in memory. Tesi: il decay esiste, ma non è passivo. È un processo attivo, regolato da macchinari molecolari dedicati (rimozione di recettori AMPA, turnover di engrammi, neurogenesi). McGeoch aveva ragione contro Thorndike sul fatto che il tempo di per sé non basta come spiegazione; ma il decay c’è, ed è meccanicamente causato da operatori biologici che il sistema usa per gestire il forgetting come funzione.

2014 — Akers et al., Science 344:598-602. Esperimento causale su topi adulti e neonati: la neurogenesi ippocampale — la nascita di nuovi neuroni granulari nel giro dentato, che continua nei mammiferi adulti — causa forgetting di engrammi pre-esistenti. Aumentare la neurogenesi (running, fluoxetine) accelera il forgetting; ridurla (anti-mitotici come temozolomide) lo rallenta. La neurogenesi è il candidato meccanicistico per infantile amnesia: nei neonati la neurogenesi è massima, e i ricordi precoci si cancellano più velocemente. Dimostrazione che il forgetting nei mammiferi è un processo biologico attivo, non semplice usura.

2017 — Davis e Zhong, Neuron 95:490-503. Ronald Davis (neurogenetista al Scripps Research Institute) e Yi Zhong (Cold Spring Harbor) scrivono The biology of forgetting. Review della biologia molecolare dell’active forgetting, da Drosophila ai mammiferi. Risultato chiave precedente, riassunto: in Drosophila l’inibizione di Rac1 (una piccola GTPase del rimodellamento del citoscheletro) nelle cellule del corpo fungiforme previene il forgetting di olfactory conditioning. La memoria persiste molto più a lungo se Rac1 è bloccato. Conclusione: il forgetting non è il default che si accende quando gli altri processi smettono di lavorare; è un processo dedicato, con i suoi macchinari, contemporaneo al consolidamento.

Ebbinghaus forgetting curve and its competing interpretations: decay (Thorndike 1914) vs interference (McGeoch 1932); type=vector-svg

Tredici tappe in centotrent’anni. La traiettoria è chiara: dall’oblio come decay passivo (Ebbinghaus, Thorndike) all’oblio come interferenza (McGeoch, Underwood) all’oblio come retrieval failure (Brown-McNeill, Tulving) all’oblio come effetto del retrieval stesso (RIF) all’oblio come tassonomia di sotto-prodotti adattivi (Schacter) all’oblio come processo molecolare attivo regolato (Hardt-Nadel-Wang, Akers, Davis-Zhong). Ogni tappa è ancora valida nel suo dominio; il quadro complessivo è la composizione di tutte.

Prima della tassonomia, due angoli ortogonali — uno comportamentale-ecologico, uno neurobiologico-cellulare — aiutano a sentire perché l’oblio è funzione e non guasto.

Pensa a un sistema che vive in un mondo non-stazionario. Le regolarità del mondo cambiano. Il tuo numero di telefono di dieci anni fa non è il numero di telefono di oggi. La strada per andare al vecchio ufficio non è la strada per andare al nuovo. I tuoi colleghi del primo lavoro non sono i tuoi colleghi attuali. Se il sistema ricordasse tutto con uguale forza, ogni scelta richiederebbe una disambiguazione fra versioni multiple della stessa informazione, distinguendo per tag temporale (“questo era valido nel 2014”) la versione attuale da quelle obsolete. Costo computazionale crescente.

Una soluzione semplice: lasciare decadere selettivamente le informazioni che il sistema non incontra più. Il forgetting come cache eviction informata dall’utilizzo recente. Il sistema non porta in memoria l’intero passato; porta una versione efficiente, con il presente in primo piano e il passato attenuato. Quando incontri il tuo vecchio numero su una vecchia agenda, lo riconosci ma non ti viene in mente attivo come opzione: è il segnale di un sistema che ha messo in secondo piano informazioni datate.

Aggiungi un secondo argomento: generalizzazione. Ricordi specifici sono utili, ma ricordi specifici al posto di generalizzazioni sono inefficienti. Il bambino che ha visto cento cani non ha bisogno di ricordare tutti e cento gli incontri come episodi distinti per riconoscere il cane numero centouno: gli serve la categoria cane, estratta per cancellazione dei dettagli particolari. La transienza degli episodi specifici a favore della stabilità della categoria semantica è una forma di forgetting selettivo che è anche il meccanismo della categorizzazione. Funes el memorioso non riesce a generalizzare perché ricorda tutti i dettagli, e Borges aveva intuito che pensare implica perdere quei dettagli.

Aggiungi un terzo argomento: wellbeing. Una mente che ricordasse vividamente ogni umiliazione minore, ogni piccola perdita, ogni dispiacere quotidiano sarebbe schiacciata. I traumi reali tendono a essere ricordati troppo (è il problema della persistence di Schacter, ed è la patologia del PTSD). Ma il rumore emotivo della giornata media — la frase brusca del collega, la dimenticanza dell’amico, la critica banale — sbiadisce, e questo sbiadire è funzionale. Resilience emotiva e oblio selettivo del minor sono lo stesso fenomeno visto da angoli diversi.

L’argomento ecologico è quindi: per un sistema che vive in un mondo che cambia, che deve generalizzare, che ha risorse di elaborazione e benessere finite, l’oblio selettivo regolato è una soluzione — non un problema. James 1890 lo aveva detto in una frase. Richards e Frankland (2017) lo hanno formalizzato in un argomento computazionale: c’è un trade-off ottimale fra persistence e transience, e il sistema biologico vi si è probabilmente collocato per pressione selettiva.

Cambia scala. Vai al laboratorio di Susumu Tonegawa al MIT, o di Paul Frankland al SickKids di Toronto, o di Ronald Davis al Scripps. Quello che vedi è l’oblio come operazione molecolare dedicata, non come deperimento passivo della traccia.

Il caso Drosophila è il più chiaro. Il moscerino impara facilmente associazioni odore-shock: presento odore A seguito da scossa elettrica, presento odore B senza scossa, e il moscerino impara a evitare A. La traccia mnemonica decade in giorni. Per anni si è creduto che il decay fosse passivo: la traccia svanisce perché le proteine sinaptiche non vengono rinnovate, perché il signal-to-noise si degrada, perché l’animale fa altre cose. Shuai et al. (2010, Cell 140:579-589, gruppo di Yi Zhong) mostrano che inibendo Rac1 (una GTPase coinvolta nel rimodellamento del citoscheletro neuronale) nei neuroni del corpo fungiforme di Drosophila, il forgetting non avviene. La memoria persiste molto più a lungo. Bloccando un singolo macchinario molecolare si blocca il forgetting: significa che il forgetting era guidato da quel macchinario. Non era assenza di lavoro; era lavoro di un genere specifico.

Estendi ai mammiferi. Migues et al. (2010, lavorando con Karim Nader a McGill) mostrano che la rimozione di recettori AMPA dalle sinapsi attive è regolata; bloccando il macchinario di endocitosi dei recettori, le memorie diventano resistenti al forgetting. Akers et al. (2014) — l’esempio centrale che descriveremo più sotto — mostrano che la neurogenesi adulta del giro dentato è un altro meccanismo di forgetting attivo: nuovi neuroni granulari si integrano nei circuiti esistenti, perturbando engrammi precedenti.

Concentriamo. L’evidenza cellulare degli ultimi quindici anni converge su una conclusione: nei sistemi nervosi studiati — invertebrati e mammiferi — esistono macchinari molecolari dedicati al forgetting, regolati indipendentemente dai macchinari dedicati al consolidamento. Il sistema spende energia per dimenticare. Spendere energia è un indizio molto forte che il fenomeno è funzione, non guasto: l’evoluzione non spende energia per produrre guasti.

Active forgetting molecular machinery: Rac1 in Drosophila mushroom body, AMPA receptor removal in mammals, hippocampal neurogenesis; type=vector-svg

I due angoli si compongono. L’argomento ecologico dice perché un sistema dovrebbe dimenticare. L’evidenza cellulare dice come il sistema fa a dimenticare. Insieme producono la lettura matura: l’oblio è una funzione implementata da macchinari biologici dedicati, evolutasi sotto pressione selettiva per i vantaggi adattivi che fornisce.

La meccanica: tassonomia delle cause e biologia attiva

Sezione intitolata “La meccanica: tassonomia delle cause e biologia attiva”

Ora la trattazione tecnica. Procediamo per sezioni: tassonomia per cause, tassonomia per sintomi (Schacter), biologia dell’active forgetting, distinzione transience/persistence.

Quando un’informazione “manca” al recupero, una di queste cinque famiglie causali è in gioco. Non sono mutuamente esclusive; in qualunque caso reale ne contribuiscono molteplici.

Decay attivo. La traccia si attenua nel tempo per processi biologici regolati: rimozione di recettori AMPA, turnover di proteine sinaptiche, eliminazione di spine dendritiche, integrazione di nuovi neuroni in circuiti esistenti. Differente dal “decay passivo” di Thorndike: il sistema fa qualcosa per attenuare la traccia. Hardt-Nadel-Wang (2013) lo riassumono nel titolo Decay happens: succede, ed è regolato.

Interferenza. Due varietà:

  • Proattiva: vecchio interferisce con nuovo. Esempio: il tuo vecchio numero di telefono continua a venire in mente quando provi a recuperare il nuovo, perché entrambi competono per il cue “il mio numero”.
  • Retroattiva: nuovo interferisce con vecchio. Esempio: la nuova password sostituisce la vecchia nel recupero.

L’interferenza è il meccanismo che McGeoch (1932) e Underwood (1957) propongono come spiegazione principale dell’oblio osservato, contro il decay puro. Empiricamente: una parte sostanziale del forgetting nei laboratori è interference-driven. In contesti reali, dove fra encoding e retrieval passano giorni o settimane di esperienze nuove, l’interferenza è probabilmente il contributo dominante.

Retrieval failure. L’informazione c’è, ma il sistema non la recupera. Il fenomeno tip-of-the-tongue (Brown-McNeill 1966) è la versione paradigmatica: sai quasi la parola, sai sue proprietà parziali, ma il recupero completo fallisce; spesso la parola “torna” minuti o ore dopo, indicando che era stata bloccata, non persa. Il cue-dependent forgetting di Tulving (1974) è la versione più generale: cambiando il cue di recupero, il ricordo che sembrava perso ricompare. Schacter chiama “blocking” la categoria.

Encoding failure. Mai consolidato, mai entrato nel magazzino. L’absent-mindedness di Schacter. L’esempio canonico: chiedi a qualcuno di disegnare il penny americano. Non sa la posizione esatta della testa di Lincoln, l’orientamento, la disposizione delle scritte. L’ha vista mille volte ma non l’ha mai codificata in modo dichiarativo. Non ha dimenticato: non ha mai imparato. Confondere encoding failure con altri tipi di forgetting porta a diagnosi sbagliate (e a domande di test mal calibrate).

Motivated forgetting. Soppressione attiva guidata da meccanismi esecutivi top-down. La nozione freudiana di repressione è la versione classica, empiricamente fragile come modello clinico generale. La sua riformulazione moderna — il paradigma think/no-think di Anderson e Green (2001) — è invece sostenuta da dati comportamentali e neuroimaging: il prefrontale dorsolaterale modula in giù l’attività ippocampale durante soppressione attiva, e il forgetting risultante si misura in test successivi. È una sesta categoria che si interfaccia con le altre: la soppressione esecutiva può causare retrieval failure cronico, che a sua volta innesca decay attivo per non-utilizzo.

A queste si aggiunge un caso speciale che taglia trasversalmente: il retrieval-induced forgetting (RIF) di Anderson-Bjork-Bjork (1994). Recuperare attivamente una parte del materiale causa dimenticare il materiale correlato non recuperato. Il meccanismo proposto è inibizione laterale: durante il retrieval di un item, i competitori vengono attivamente soppressi per ridurre interferenza, e questa soppressione lascia un effetto residuo che si manifesta come forgetting nei test successivi. Il forgetting come prodotto del normale funzionamento del recupero, non come suo fallimento.

Una nota sulla non mutua esclusività delle famiglie. In un caso reale di “non ricordo” — ad esempio, non riesci a recuperare il nome del collega di un vecchio lavoro che hai incontrato per caso — quasi tutte le famiglie sono in gioco simultaneamente. Decay attivo: la traccia originaria si è attenuata in anni di non-utilizzo, con turnover sinaptico effettivo. Interferenza: hai conosciuto altre persone, e i loro nomi competono per il cue “collega”. Retrieval failure: il nome è probabilmente lì, e con il cue giusto (vedere una sua foto, sentire dove è oggi) potrebbe tornare. Encoding failure parziale: forse non hai mai codificato bene il nome perché lo usavi raramente. Il forgetting reale è il vettore di queste cause, non un’unica causa pura. La tassonomia non serve a “diagnosticare” un singolo episodio, ma a costruire ipotesi distinguibili sperimentalmente in laboratorio.

Una seconda nota, sulla direzionalità temporale dell’interferenza. La distinzione proattiva-retroattiva non è simmetrica nei loro effetti. La proattiva è tipicamente più forte per materiale simile (la classica dimostrazione di Underwood: liste di sillabe simili fra loro accumulano interferenza proattiva massiva). La retroattiva è invece più dipendente da quanto il nuovo materiale viene attivamente ripassato. Il sistema mnemonico non tratta il passato e il futuro in modo simmetrico; il forgetting che osserviamo è il prodotto di processi asimmetrici nel tempo.

Tassonomia per sintomi: i sette peccati di Schacter

Sezione intitolata “Tassonomia per sintomi: i sette peccati di Schacter”

Daniel Schacter (2001) propone una tassonomia ortogonale, basata sui sintomi osservati, raggruppandoli in due metà di un asse:

#PeccatoTipoCosa fallisce
1Transiencetransienzaoblio progressivo nel tempo (curva di Ebbinghaus)
2Absent-mindednesstransienzaencoding failure per attenzione divisa
3Blockingtransienzaretrieval failure temporanea (TOT)
4Misattributionpersistenzainformazione corretta, sorgente sbagliata
5Suggestibilitypersistenzafalse memory implantation
6Biaspersistenzalo stato presente colora il ricordo del passato
7Persistencepersistenzamemorie intrusive indesiderate (PTSD)

I primi tre stanno sul polo transienza (la memoria manca); gli ultimi quattro sul polo persistenza (la memoria eccede). Adattivi nel range normale, patologici in eccesso.

Errori di transienza (la memoria manca):

  1. Transience — oblio progressivo nel tempo. La curva di Ebbinghaus.
  2. Absent-mindedness — encoding failure per attenzione divisa. “Dove ho lasciato le chiavi?”
  3. Blocking — retrieval failure temporanea. Il TOT.

Errori di persistenza (la memoria eccede): 4. Misattribution — l’informazione c’è ma è attribuita a fonte sbagliata. Pensi che ti sia stata detta da Carlo, era stata Maria. Ricordi di aver visto un dettaglio, l’hai immaginato. 5. Suggestibility — false memory implantation. La letteratura di Elizabeth Loftus (1944-, psicologa cognitiva americana, Eyewitness Testimony 1979) dimostra che ricordi falsi possono essere indotti da domande suggestive ripetute, con i soggetti che li ricordano poi come reali. 6. Bias — lo stato presente colora il ricordo del passato. Se sei felice ora, ricordi un passato più felice; se sei in lutto, lo ricordi più triste. Il ricordo non è fotografia: è ricostruzione contestuale. 7. Persistence — memorie che insistono quando si vorrebbe non averle. Memorie intrusive del PTSD, ricordi imbarazzanti che rimorchiano per anni.

L’argomento di Schacter è strutturale: ognuno di questi sette è un sotto-prodotto adattivo di un sistema funzionante.

  • La transience è il prezzo dell’efficienza: il sistema dimentica per generalizzare.
  • L’absent-mindedness è il prezzo dell’attenzione selettiva: codifichi cosa stai attendendo, non cosa ti circonda.
  • Il blocking è il prezzo dell’inibizione laterale: il sistema sopprime competitori durante il retrieval, e a volte sopprime quello che ti serve.
  • La misattribution è il prezzo della ricostruzione: ricordare implica integrare frammenti, e l’integrazione introduce errori di sorgente.
  • La suggestibility è il prezzo della plasticità: la memoria si aggiorna, e ciò che si aggiorna può essere falso.
  • Il bias è il prezzo del contesto: il ricordo è funzione del cue presente, e il cue presente include il tuo stato attuale.
  • La persistence è il prezzo della rilevanza emotiva: emozioni forti incentivano consolidamento, e il sistema non può sempre disabilitarlo selettivamente quando l’emozione è negativa.

Letta come tassonomia funzionale, la lista non descrive guasti da riparare ma trade-off da gestire. Patologici quando in eccesso, adattivi nel range normale.

Tre meccanismi convergenti, ciascuno documentato:

Rac1 in Drosophila. Shuai et al. (2010) mostrano che il forgetting di olfactory conditioning in Drosophila è regolato da Rac1 nel corpo fungiforme. Bloccando Rac1 (forma dominant-negative) la memoria persiste 5-10 volte più a lungo. Iperattivando Rac1 il forgetting accelera. Rac1 lavora in parallelo al consolidamento: i due processi sono indipendenti molecolarmente, e il sistema regola la velocità di forgetting modulando Rac1.

AMPA receptor removal nei mammiferi. Migues et al. (2010, Nature Neuroscience 13:630-634) mostrano che la trafficking di recettori AMPA (specificamente la subunità GluA2) dentro e fuori la membrana sinaptica è continuamente regolato. Una volta consolidata, una memoria non resta a costo zero: richiede manutenzione attiva. Il forgetting può avvenire come bilancio negativo fra inserzione e rimozione di recettori.

Neurogenesi ippocampale. Akers et al. (2014, Science 344:598-602): nuovi neuroni granulari del giro dentato si integrano nei circuiti, perturbando engrammi pre-esistenti. È una forma di forgetting strutturale: la rete cambia, e cambiando perde parte di quello che codificava prima. Spiega anche infantile amnesia — il fatto che gli adulti non ricordino esperienze precoci della loro infanzia: nei primi anni la neurogenesi ippocampale è massima, e fa pulizia di engrammi precoci. Manipolando farmacologicamente la neurogenesi nei topi neonati, Akers et al. mostrano che ricordi infantili che normalmente svaniscono in giorni possono essere resi persistenti.

Synaptic homeostasis durante il sonno. Tononi e Cirelli (2014, Neuron 81:12-34) propongono la Synaptic Homeostasis Hypothesis: durante la veglia il cervello fa apprendimento (up-scaling generalizzato delle sinapsi); durante il sonno (slow-wave) fa down-scaling globale, riducendo proporzionalmente tutte le sinapsi. Il segnale forte rimane sopra-soglia, il segnale debole scende sotto-soglia: forgetting selettivo del rumore, conservazione del segnale. Il sonno consolida e dimentica simultaneamente, su sotto-popolazioni diverse di sinapsi. È un esempio di forgetting come operazione regolare del sistema.

Three mechanisms of active forgetting: Rac1 in Drosophila, AMPA endocytosis in mammals, hippocampal neurogenesis as engram clearance; type=vector-svg

Comune a questi quattro meccanismi: il forgetting consuma energia, richiede macchinari proteici dedicati, è regolato indipendentemente dal consolidamento. Sono le tre firme che un fenomeno è funzione e non guasto.

Un’ulteriore distinzione concettuale, sviluppata da Blake Richards e Paul Frankland (2017, Neuron 94:1071-1084) in The Persistence and Transience of Memory: il sistema di memoria opera lungo due assi quasi-ortogonali, non lungo uno solo. La persistenza è la durata di un ricordo specifico nel tempo. La transienza è la velocità con cui ricordi non utili vengono rimossi. Un sistema può essere sia molto persistente (ricorda molto a lungo) sia molto transiente (rimuove velocemente ciò che non serve), perché le due proprietà operano su sotto-popolazioni di engrammi diverse.

L’argomento è computazionale: in un ambiente non-stazionario, la transienza alta è adattiva (rimuovi vecchi pattern non più validi); ma per i pattern ancora validi, la persistenza alta è adattiva (mantieni quello che funziona). Il sistema deve discriminare. Discriminare richiede meccanismi attivi che valutino la rilevanza corrente di ogni traccia e regolino persistenza-transienza di conseguenza. Schacter (2001) aveva già impostato la dialettica con i suoi sette peccati divisi in transience errors e persistence errors; Richards-Frankland la ribaltano in chiave costruttiva: quei “peccati” sono il prezzo di un sistema che lavora sulla giusta combinazione dei due assi.

Conseguenza pratica: chiedere “quanto a lungo dura un ricordo umano?” è una domanda mal posta. La risposta dipende dal tipo di ricordo, dal contesto di codifica, dal pattern di uso successivo, dallo stato emotivo associato, e — se Akers 2014 ha ragione — anche dalla neurogenesi attuale del soggetto. Il sistema non ha una durata di default; ha politiche di persistenza-transienza parametrizzate per categoria di contenuto.

Prima di passare agli esempi, una sezione sintetica sulle funzioni che il forgetting svolge. Sintetizza l’argomento ecologico in cinque categorie distinte e cita per ciascuna l’evidenza supportiva. Le categorie non sono mutuamente esclusive — una stessa istanza di forgetting può servire più funzioni — ma vale la pena distinguerle perché alcune sono dimostrate empiricamente, altre sono inferite, altre sono ancora ipotetiche.

Generalizzazione. Dimenticare i dettagli specifici per estrarre pattern. Il bambino che riconosce un cane numero centouno non ha bisogno di ricordare i cento cani precedenti come istanze separate; gli serve una categoria cane, ed estrarla richiede dimenticare i tratti che differenziavano i singoli incontri. Richards-Frankland (2017) formalizzano questo come argomento computazionale: in un sistema di apprendimento statistico, mantenere troppi esempi specifici riduce la capacità di generalizzazione. Funes el memorioso non riesce a pensare cane perché ricorda troppo bene i cani specifici. Evidenza: simulazioni computazionali, pattern di sviluppo della categorizzazione nel bambino, dissociazioni cliniche fra memoria episodica iperfunzionante e categorizzazione semantica preservata o impoverita.

Update di informazione obsoleta. Vecchi numeri di telefono, vecchi indirizzi, vecchie politiche aziendali, vecchi nomi di colleghi. Un sistema che mantenesse tutte le versioni di queste informazioni dovrebbe disambiguare a ogni recupero quale è la versione corrente, con costo crescente nel tempo. Il forgetting selettivo dell’obsoleto risolve il problema. Evidenza: paradigma di list-method directed forgetting (Bjork 1972, Bjork e Bjork 1996) — soggetti istruiti a “dimenticare” la prima lista e ricordare solo la seconda mostrano effettivamente performance ridotta sulla prima lista, oltre quanto interferenza retroattiva spiegherebbe.

Decisione in ambienti non-stazionari. In ambienti dove la mappa fra azione e conseguenza cambia nel tempo (mercati finanziari, relazioni sociali, contesti professionali), ricordi vecchi possono essere disinformativi: ti ricordi che X funzionava, X non funziona più, e il ricordo ti spinge nella direzione sbagliata. Un sistema che pesi maggiormente esperienze recenti — nei limiti di non perdere l’apprendimento profondo — sarà più robusto. Kraemer e Golding (1997, Memory 5:75-96) discutono il forgetting come “stale data eviction” in questo senso. È un’idea ancora prevalentemente teorica; evidenza empirica diretta limitata.

Wellbeing emotivo. Dimenticare traumi minori. Una mente che ricordasse vividamente ogni umiliazione minore, ogni piccolo dispiacere, ogni critica banale sarebbe schiacciata. La maggior parte di queste memorie sbiadisce naturalmente, e questo sbiadire è costituente della resilienza. Da non confondere con repressione di traumi maggiori (empiricamente fragile come modello). Il pattern empirico è inverso: traumi maggiori tendono ad essere iper-ricordati (PTSD persistence), traumi minori sbiadiscono normalmente. Il forgetting funzionale ha effetto sulla coda lieve dello spettro emotivo, non sul suo nucleo intenso.

Creatività. Storm e Patel (2014, Journal of Experimental Psychology: Learning, Memory, and Cognition 40:1594-1609) mostrano che il retrieval-induced forgetting di soluzioni convenzionali a un problema favorisce la generazione di soluzioni nuove. Il meccanismo proposto: sopprimere le associazioni dominanti riduce la loro interferenza con associazioni meno saliente, lasciando emergere combinazioni non ovvie. È una funzione che si attiva su scala dei minuti-ore (durante una sessione di problem-solving), non sulle scale lunghe del consolidamento. La creatività richiede dimenticare temporaneamente il già-noto.

A queste si aggiungerebbe una sesta funzione, di tipo metabolico: ridurre il costo di mantenimento delle sinapsi. Mantenere una sinapsi potenziata ha costo proteico e energetico continuo. Lasciar decadere sinapsi non utili è risparmio metabolico. La Synaptic Homeostasis Hypothesis di Tononi-Cirelli include questa lettura: il sonno fa down-scaling per ridurre il “carico sinaptico” cumulato dalla veglia. È una funzione poco discussa nella letteratura cognitiva, più in quella biofisica.

Tre esempi eterogenei. Uno comportamentale, uno fisiologico, uno computazionale.

Esempio 0 (preliminare) — DRM e false memories: l’altra faccia della stessa medaglia

Sezione intitolata “Esempio 0 (preliminare) — DRM e false memories: l’altra faccia della stessa medaglia”

Prima di entrare nei tre esempi principali, una parentesi su un fenomeno complementare che illumina la lettura ricostruttiva del sistema mnemonico. Il paradigma DRM (Deese-Roediger-McDermott, formalizzato da Henry Roediger e Kathleen McDermott nel 1995, Journal of Experimental Psychology: Learning, Memory, and Cognition 21:803-814, sulla base di lavori precedenti di James Deese degli anni Cinquanta) funziona come segue.

Soggetti studiano una lista di parole semanticamente associate a una parola “critica” non presentata. Ad esempio: bed, rest, awake, tired, dream, wake, snooze, blanket, doze, slumber, snore, nap, peace, yawn, drowsy. Tutte le parole orbitano semanticamente intorno alla parola critica sleep, che però non compare nella lista. Al test di richiamo libero, e ancora di più al test di riconoscimento, una percentuale alta di soggetti (spesso superiore al cinquanta per cento) include sleep fra le parole “ricordate” — con confidenza pari o superiore alle parole effettivamente presentate. Si tratta di un false memory affidabile, replicabile, robusto.

Il rilievo per il presente capitolo: il sistema di memoria non si limita a perdere informazione (forgetting nei suoi vari sapori). Aggiunge informazione coerente con i pattern semantici già attivi. I due fenomeni — perdita e aggiunta — sono espressioni dello stesso meccanismo di base: la memoria è ricostruzione attiva guidata da schemi, non archivio passivo. Quando i frammenti recuperati attivano un pattern semantico forte, il sistema completa il pattern aggiungendo la parola mancante; quando i frammenti non si compongono, il sistema lascia un buco che chiamiamo forgetting. Sono due modi in cui la ricostruzione può scostarsi dalla traccia originaria.

Frederic Bartlett (1886-1969, psicologo britannico a Cambridge, Remembering, 1932) aveva intuito tutto questo lavorando su racconti folkloristici, prima che la formalizzazione moderna del paradigma DRM lo dimostrasse in modo rigoroso. La sua tesi della ricostruzione attiva guidata da schemi è oggi parte stabile del consenso. Il forgetting funzionale, le false memories, l’effetto di Bartlett, la suggestibility di Loftus sono altrettante manifestazioni di un sistema che non legge un archivio fisso ma costruisce ogni volta una versione coerente dei frammenti disponibili.

Esempio 1 — Think/No-Think: la soppressione che dimentica

Sezione intitolata “Esempio 1 — Think/No-Think: la soppressione che dimentica”

Anderson e Green (2001) reclutano trentadue partecipanti. Fase 1, learning: imparano quaranta coppie parola-parola, dove la prima parola è arbitraria e la seconda è un nome semanticamente lontano (es. ORDEAL-ROACH, JAW-GUM). Imparano le coppie a criterio: vedendo la prima parola, sanno produrre la seconda.

Fase 2, think/no-think: vedono ripetutamente solo la prima parola, in tre condizioni:

  • Baseline: la coppia è imparata in fase 1 ma non riapparire in fase 2. Sedici coppie.
  • Think: la prima parola appare con istruzione “richiama la seconda”. La risposta corretta consolida l’associazione. Sedici coppie.
  • No-think: la prima parola appare con istruzione “NON pensare alla seconda; sopprimi attivamente, blocca”. Sedici coppie.

Le condizioni sono ripetute 0, 1, 8, o 16 volte (per i diversi sottoinsiemi di coppie).

Fase 3, test finale: per tutte e quaranta le coppie (incluse baseline non rivisti), si chiede di richiamare la seconda parola data la prima.

Risultato critico: le coppie no-think 16-trial sono richiamate significativamente meno delle baseline non rivisti. Sopprimere attivamente per sedici trial ha causato forgetting peggiore del semplice non-rivedere. La soppressione non è equivalente a non-utilizzo; è un atto attivo che lascia una traccia di cancellazione.

Anderson et al. (2004, Science 303:232-235) ripetono il paradigma in scanner FMRI. Durante i trial no-think il prefrontale dorsolaterale aumenta significativamente attività, e l’ippocampo diminuisce attività. Inoltre, i soggetti con maggiore modulazione frontale-ippocampale mostrano forgetting maggiore. Il meccanismo è top-down: un controllo esecutivo spegne l’attività ippocampale, e a lungo andare l’ippocampo “lascia decadere” le tracce non-attivate.

Una variante del paradigma chiarisce ulteriormente il meccanismo. Anderson et al. distinguono direct suppression (sopprimi attivamente il pensiero target, “blocca”) da thought substitution (rimpiazza il target con un altro pensiero specifico, “pensa a qualcos’altro che ti viene istruito”). Entrambe le strategie producono forgetting del target, ma con substrati neurali parzialmente diversi: direct suppression coinvolge maggiormente prefrontale dorsolaterale e ridotta attività ippocampale; thought substitution coinvolge regioni di controllo prefrontale mediale e attività ippocampale che si redirige verso il sostituto. Due rotte funzionali per lo stesso esito comportamentale, e una conferma che il sistema esecutivo ha più di un meccanismo per ottenere oblio mirato.

L’esempio mostra che il forgetting motivato esiste come fenomeno empirico misurabile, indipendentemente dalla cornice psicodinamica freudiana. È un’operazione che il sistema compie deliberatamente.

Meta-analisi recenti (Stramaccia et al. 2018, Cortex) suggeriscono che l’effect size del think/no-think sia più piccolo del riportato originariamente, con possibile variabilità individuale alta. Il fenomeno resta robusto, ma conviene leggerlo come effetto reale di taglia moderata, non come dimostrazione spettacolare.

Esempio 2 — Akers 2014: la neurogenesi che cancella

Sezione intitolata “Esempio 2 — Akers 2014: la neurogenesi che cancella”

Kaori Akers, Paul Frankland e collaboratori (2014, Science) lavorano su due gruppi di topi adulti C57BL/6. Tutti i topi vengono sottoposti a contextual fear conditioning: messi in una scatola distintiva, ricevono shock alle zampe; sviluppano associazione contesto-shock, misurabile come freezing (immobilità da paura) quando rimessi nella scatola.

Sei settimane dopo il conditioning, gli animali sono divisi:

  • Gruppo A: messi in gabbie con running wheel. La corsa libera è notoriamente uno dei più potenti stimolatori di neurogenesi ippocampale negli adulti, raddoppiando o triplicando la nascita di nuovi neuroni granulari.
  • Gruppo B: gabbie standard, no running wheel. Neurogenesi basale.
  • Gruppo C: trattamento con temozolomide (TMZ), un agente anti-mitotico che riduce la neurogenesi.

Dopo ulteriori sei settimane, test di richiamo: messi nella scatola del conditioning, quanto freezing producono?

Risultato: gruppo A (running, neurogenesi alta) → freezing significativamente minore. Il ricordo della paura è stato eroso. Gruppo B (basale) → freezing intermedio. Gruppo C (TMZ, neurogenesi bassa) → freezing maggiore, ricordo persistente.

L’inferenza causale è netta: aumentare la neurogenesi ippocampale causa forgetting di engrammi pre-esistenti. Diminuirla previene forgetting. La neurogenesi non è effetto collaterale: è un meccanismo regolare di forgetting.

Estensione cruciale: Akers et al. ripetono in topi neonati. La neurogenesi perinatale è altissima, e i ricordi formati nei primi giorni di vita normalmente svaniscono in settimane (l’analogo di infantile amnesia umana). Bloccando la neurogenesi nei neonati con TMZ, i ricordi precoci persistono. Implicazione: l’infantile amnesia non è un guasto della memoria immatura; è la conseguenza meccanicistica di neurogenesi alta in cervelli ancora in costruzione, ed è parte normale dello sviluppo.

ASSUMPTION: l’estensione del meccanismo a primati e umani è inferenza basata su omologie anatomiche e su evidenza correlazionale; le manipolazioni causali sono in topi. La storia umana dell’infantile amnesia ha probabilmente componenti aggiuntive (sviluppo del linguaggio, sviluppo del concetto di sé) che amplificano il fenomeno.

Lettura concettuale dell’esperimento. Aumentare la neurogenesi non è “sovraccaricare il magazzino”: il giro dentato non si riempie come un disco. È piuttosto ristrutturare il circuito: nuovi neuroni granulari si integrano nei pattern di sinapsi esistenti, e questa integrazione perturba i pattern che codificavano memorie precedenti. Il forgetting che ne risulta è strutturale, non informazionale nel senso shannoniano: la rete cambia, e il cambiamento eredita una storia che non è più letta come prima. Il punto è importante per chiunque voglia trasferire l’idea ad architetture artificiali: il forgetting biologico spesso non è “cancellazione di un dato” ma “modifica del substrato che leggeva quel dato”. Le due cose hanno conseguenze ingegneristiche molto diverse.

Esempio 3 — Eldan-Russinovich 2023: dimenticare Harry Potter

Sezione intitolata “Esempio 3 — Eldan-Russinovich 2023: dimenticare Harry Potter”

Sidebar [DATATO 2026-04]. Esempio AI per illustrare la differenza fra forgetting umano funzionale e machine unlearning ingegnerizzato.

Ronen Eldan e Mark Russinovich (Microsoft Research, Who’s Harry Potter? Approximate Unlearning in LLMs, arXiv:2310.02238, 2023) tentano di far “dimenticare” a Llama-2-7b-chat il contenuto dei libri di Harry Potter — un caso di studio interessante perché HP è notoriamente presente nei training set di molti LLM commerciali e perché il copyright dei libri di Rowling rende la rimozione un esercizio di compliance pertinente.

La procedura ha quattro passi: (a) generano un anchor model facendo fine-tuning aggressivo del modello base su contenuto HP, accentuandone i pattern; (b) per ogni token in testi HP, calcolano la differenza fra logits del modello base e dell’anchor, identificando token “HP-specific” (quelli che l’anchor predice molto meglio); (c) per ogni occorrenza di entità HP nel testo (Harry, Hogwarts, Hermione), generano predizioni “generic” rimpiazzando l’entità con descrittori non-specifici (Harry → “John”, Hogwarts → “the school”); (d) fine-tunano il modello base verso le predizioni generic.

Risultato: il modello fine-tunato non completa più testi HP nei modi caratteristici (chiedendo “Harry Potter è uno…”, non risponde “studente di Hogwarts” ma qualcosa di generico). Però alcuni fatti residui sopravvivono, e prompt più indiretti (chiedendo dei personaggi tramite descrizioni invece dei nomi) recuperano informazione che il modello “doveva” aver dimenticato.

Il punto pedagogico: questo è approssimazione di unlearning, non rimozione genuina. I fatti su Harry Potter sono distribuiti nei pesi in modo non localizzato; rimuoverli completamente senza distruggere conoscenza correlata (su scuole, magia, romanzi inglesi del 2000) è un problema aperto. Confrontare con il forgetting umano: il sistema biologico cancella selettivamente engrammi specifici via meccanismi cellulari dedicati (Rac1, neurogenesi); l’AI non ha analogo, fa approssimazioni statistiche su un substrato non progettato per il forgetting selettivo. Stessa parola, problemi molto diversi.

Una nota di accuratezza tecnica: Eldan e Russinovich riportano che dopo il loro fine-tuning di unlearning il modello mantiene capacità generali (perplexity su benchmark non-HP rimane stabile, performance su MMLU e altri benchmark non degrada significativamente). Questo è un risultato di buon ingegneria, non un’evidenza che il modello “abbia dimenticato” HP nel senso umano del termine. Il modello ha smesso di manifestare certi pattern testuali su prompt diretti; che questo equivalga a “non sapere” HP è una questione filosofica oltre che tecnica. Probing accurato — cercare informazione su HP attraverso prompt indiretti, attivazioni interne, embedding similarity — recupera spesso informazione residua.

SistemaSelettivo?Regolato?Funzionale?Cosa fa davvero
Oblio funzionale umanorimozione attiva di engrammi specifici
Catastrophic forgetting (LLM)nonobuginterferenza non selettiva fra task sequenziali
Machine unlearningsì (forzato)ingegnerizzatostrumentalerimozione approssimata di data point specifici
Knowledge editingsì (mirato)ingegnerizzatostrumentalemodifica chirurgica di fatti specifici

Stessa parola, problemi diversi. Non filiazione, non equivalenza: convergenze parziali per ragioni distinte.

Patologie agli estremi: quando il sistema funzionale rompe

Sezione intitolata “Patologie agli estremi: quando il sistema funzionale rompe”

Tre patologie illuminano per contrasto cosa significhi che l’oblio è funzionale.

HSAM (Highly Superior Autobiographical Memory). Il caso AJ, descritto da Elizabeth Parker, Larry Cahill (neurobiologo americano a UC Irvine) e James McGaugh (1932-, neurobiologo americano a UC Irvine, pioniere dello studio del consolidamento) nel 2006 (Neurocase 12:35-49), è la prima descrizione clinica documentata di una persona che ricorda con dettaglio episodico ogni giorno della sua vita dal 1980. La testimonianza di AJ è in sé clinicamente rivelatrice: descrive la condizione come “non-stop, incontrollabile, completamente esauriente”. Ricorda cosa ha mangiato, cosa è stato in TV, cosa ha indossato, conversazioni in dettaglio, e non riesce a non ricordare. Studiati ulteriori cinquanta-sessanta casi al 2020 da McGaugh e collaboratori, MRI mostra ipertrofia di lobo temporale, caudato, e altre regioni. I soggetti riferiscono difficoltà nel decision-making (troppi precedenti specifici), ruminazione cronica, fatica nel “lasciare andare” episodi negativi. Funes el memorioso clinico. La memoria iperprecisa non è superpotere; è disabilità. Il sistema è funzionale precisamente perché bilancia persistence e transience; sbilanciarlo verso persistence eccessiva produce un sistema che sa molto e funziona male.

Dementia di Alzheimer. Il caso opposto: forgetting eccessivo e non selettivo. Non è il forgetting funzionale di un sistema sano, è degenerazione neurale che cancella indistintamente. Il decorso clinico mostra perdita prima della memoria episodica recente (lobo temporale mediale colpito presto), poi semantica, poi procedurale, poi linguaggio e identità. Il sistema di forgetting attivo descritto in questo capitolo non c’è qui: c’è dissoluzione del substrato. La distinzione è importante: confondere forgetting funzionale con neurodegenerazione produce divulgazione errata, e talvolta produce false rassicurazioni o false allarmi a soggetti normali con cali mnemonici fisiologici dell’invecchiamento.

PTSD e memorie intrusive. Il persistence di Schacter portato a patologia. In PTSD, memorie traumatiche tornano in modo intrusivo, vivido, non controllabile, spesso innescate da cue ambientali apparentemente irrilevanti. Il sistema funzionale dovrebbe permettere soppressione esecutiva (Anderson-Green) o decay attivo nel tempo; in PTSD questi meccanismi sembrano compromessi o sovraccaricati. Letteratura recente (Anderson e Hulbert 2021, Annual Review of Psychology 72:1-36) interpreta PTSD almeno parzialmente come fallimento del sistema di forgetting funzionale: non il problema di “ricordare troppo” in astratto, ma il problema di non riuscire a spegnere il recall di certe memorie quando si vorrebbe. È la stessa machinery del forgetting normale che, quando rotta o sopraffatta, produce sintomi clinici.

Le tre patologie compongono un quadro coerente. Il sistema funzionale di forgetting è regolato in equilibrio fra persistence e transience, fra retention selettiva e clearance selettiva. HSAM è eccesso di persistence, dementia è eccesso di transience non selettiva, PTSD è fallimento mirato del controllo esecutivo del recall. Ognuna mostra che il sistema sano non è “buona memoria”; è “buona regolazione della memoria”.

Eredità oggi: cosa AI ha davvero ereditato e cosa no

Sezione intitolata “Eredità oggi: cosa AI ha davvero ereditato e cosa no”

Sezione [DATATO 2026-04]. Marcata esplicitamente perché questa è la parte di presentismo del capitolo, da rivedere mano a mano che lo stato dell’arte evolve.

L’AI contemporanea ha quattro fenomeni che vengono spesso tutti chiamati “forgetting” o derivati. Non sono lo stesso problema. Mettiamoli in fila.

Definito originariamente da Michael McCloskey e Neal Cohen (1989, Psychology of Learning and Motivation 24:109-165) per reti neurali connessioniste. Una rete addestrata su task A e poi su task B perde quasi completamente le rappresentazioni di A: B sovrascrive A, perché la backpropagation aggiorna pesi globali senza protezione per la conoscenza precedente.

Differenza chiave da forgetting umano: non selettività. L’oblio umano è regolato — il sistema decide cosa lasciar decadere. La catastrophic forgetting sovrascrive in modo non guidato: A sparisce globalmente, non solo le sue parti irrilevanti. È un bug architetturale, non una funzione.

Soluzioni proposte negli ultimi quindici anni: experience replay (filiazione dichiarata dal lavoro di Wilson-McNaughton sul replay biologico, vedi consolidamento), Elastic Weight Consolidation (Kirkpatrick et al. 2017, PNAS 114:3521-3526, che protegge pesi importanti per task precedenti penalizzando il loro cambiamento), Synaptic Intelligence, Progressive Networks, e molte altre. La famiglia delle soluzioni si chiama continual learning; vedi continual-learning (in preparazione).

Non è oblio funzionale. È bug architetturale che si tenta di mitigare.

Yinzhi Cao e Junfeng Yang (2015, IEEE Symposium on Security and Privacy) coniano il termine. Il problema è inverso a quello del continual learning: data una rete addestrata e un sottoinsieme dei dati di training, rimuovere l’effetto di quei dati specifici dai pesi, idealmente in modo che il modello risultante sia equivalente a uno addestrato senza quei dati fin dall’inizio.

Motivazione regolatoria: il GDPR Article 17 (UE 2016, applicato dal 2018) prevede il “diritto all’oblio” — l’interessato può chiedere cancellazione dei propri dati personali. Per un dataset, basta cancellare le righe. Per un modello addestrato su quei dati, i dati stessi sono compressi nei pesi: la cancellazione non è ovvia.

Approcci principali (al 2026):

  • SISA (Sharded, Isolated, Sliced, Aggregated; Bourtoule et al. 2021, IEEE S&P): partizionare il training set in shard, addestrare modelli isolati per shard, aggregare. Per “unlearn” un punto, ri-addestrare solo lo shard che lo conteneva. Costo lineare nel numero di shard, non nella dimensione del dataset.
  • Gradient-based unlearning: stima del contributo di un punto al gradiente cumulato, sottrazione approssimata. Più economico ma meno robusto.
  • Influence functions: stima della derivata della loss rispetto al peso del punto nel training, e correzione locale.
  • Knowledge distillation unlearning: addestrare un modello “studente” a imitare il modello “insegnante” eccetto sul dato da dimenticare.

Per LLM foundation, machine unlearning è particolarmente difficile: i fatti sono distribuiti nei pesi in modo non localizzato, e il costo di re-train è proibitivo. Eldan-Russinovich (2023) — l’esempio precedente — è uno dei tentativi più discussi del 2023-2024.

Non è oblio funzionale. È rimozione forzata, ingegnerizzata, ex post, motivata da compliance regolatoria.

ROME (Meng et al. 2022, NeurIPS), MEMIT (Meng et al. 2023, ICLR), e successori. Anziché rimuovere informazione, modificarla: identificare le sotto-reti che codificano un fatto specifico (“Il presidente USA è X”) e modificarle per codificarne un altro (“Il presidente USA è Y”). Vedi anche memoria episodica-semantica.

Differenza da unlearning: knowledge editing sostituisce, unlearning rimuove. Sostituire è più fattibile (il modello continua a fornire una risposta sensata, solo cambiata); rimuovere lascia un buco potenzialmente colmato in modo imprevedibile dalla rete.

Non è oblio funzionale. È modificazione chirurgica di fatti specifici.

Articolo 17 GDPR (“diritto alla cancellazione”): l’interessato ha il diritto di ottenere dal titolare del trattamento la cancellazione dei dati personali che lo riguardano. Sfida tecnica per LLM: i pesi codificano informazione sui dati di training in modo distribuito, e cancellare il dato dal training set non rimuove la sua impronta dai pesi.

L’EU AI Act 2024 aggiunge requisiti di tracciabilità dei dati per modelli ad alto rischio. La compliance dipende dalla maturità di tecniche di machine unlearning, ed è uno dei driver principali della ricerca in questa area. Vedi eu-ai-act (in preparazione).

Quattro errori comuni nella divulgazione, da evitare:

  1. “Catastrophic forgetting AI = oblio umano”. Errore. L’oblio umano è selettivo, regolato, funzionale; la catastrophic forgetting è non selettiva, non regolata, è un bug.

  2. “Machine unlearning = motivated forgetting (Anderson-Green)”. Analogia debolissima. La soppressione umana è top-down esecutiva durante il retrieval; il machine unlearning è offline, ingegneria sui pesi, motivata da compliance regolatoria. Stesso esito superficiale (qualcosa “non si trova più”), meccanismi totalmente differenti.

  3. “Sleep replay umano = forgetting notturno”. Riduttivo. Il sonno consolida E dimentica selettivamente in popolazioni di sinapsi diverse (Tononi-Cirelli 2014). Una vista sola perde la dialettica del sistema.

  4. “Synaptic Homeostasis = learning rate scheduling”. Analogia molto vaga. SHY agisce come scaling globale di pesi sinaptici regolato omeostaticamente per signal-to-noise; LR scheduling è un decay scalare scelto dall’ingegnere come iperparametro.

Le quattro equivalenze sono utili come mnemonica didattica (richiamano qualcosa di simile, danno un appiglio per ricordare il fenomeno). Sono dannose come modello concettuale (suggeriscono filiazione o equivalenza meccanica dove non c’è). Schedule la tua attenzione di conseguenza.

In una sola frase per ogni categoria:

  • Oblio umano: attivo, selettivo, funzionale, regolato a livello molecolare.
  • AI catastrophic forgetting: passivo, non selettivo, bug architetturale.
  • AI machine unlearning: forzato, ingegnerizzato, ex post, motivato da compliance.
  • AI knowledge editing: chirurgico, mirato, fact-level, sostitutivo.

Quattro fenomeni distinti. La parola “forgetting” che li copre tutti è una trappola lessicale.

[DATATO 2026-04] Lo stato dell’arte AI in questa area sta evolvendo rapidamente: il 2024-2025 ha visto crescita di interesse per LLM unlearning sotto pressione GDPR e AI Act, con nuovi paper trimestrali. La distinzione concettuale “funzionale vs bug vs forzato vs chirurgico” dovrebbe restare stabile; le tecniche specifiche per ognuna no.

Sezione richiesta dalla struttura dei capitoli di contenuto. Cosa nel quadro presentato è fragile, contestato, o suscettibile di abuso?

Cliché 1: “memoria perfetta è ideale”. La cultura popolare tende a presentare la memoria perfetta come superpotere desiderabile (mnemonisti da palcoscenico, casi clinici trattati come curiosità). Il caso AJ — descritto da Parker, Cahill e McGaugh (2006, Neurocase 12:35-49) come prima istanza di Highly Superior Autobiographical Memory (HSAM) — racconta l’opposto: AJ descrive la propria condizione come “una prigione”. Ricorda ogni giorno della sua vita dal 1980 — cosa ha mangiato, cosa è successo nei notiziari, conversazioni — e non riesce a non ricordare. Studiati ulteriori sessanta casi al 2020, MRI mostra ipertrofia di temporale e caudato. La memoria iperprecisa è disfunzionale: i soggetti HSAM riferiscono difficoltà nel decision-making, ruminazione sui dettagli del passato, fatica nel “lasciare andare”. Funes el memorioso, in versione clinica.

Cliché 2: la repressione freudiana come modello generale. Freud aveva ragione che esiste motivated forgetting; aveva torto sul meccanismo. La letteratura empirica del Novecento sulle false memories (Loftus) e sulla resistenza dei traumi reali al forgetting (PTSD persistence) ha mostrato che il modello “rimuovo i traumi che mi danno fastidio” è in larga parte sbagliato come fenomeno robusto. Il think/no-think di Anderson-Green è la riformulazione empiricamente solida: c’è soppressione esecutiva, è misurabile, ma non è la repressione dinamica freudiana. Confondere le due in divulgazione produce divulgazione errata.

Limiti del paradigma think/no-think. Stramaccia et al. (2018, Cortex) e altre meta-analisi suggeriscono che l’effect size sia più piccolo del riportato originariamente, e che ci sia variabilità individuale alta. Il fenomeno è robusto qualitativamente, ma la sua taglia quantitativa resta oggetto di dibattito. Conviene presentarlo come fenomeno reale di taglia modesta, non come dimostrazione spettacolare.

Generalizzabilità di Akers 2014 a umani. La manipolazione causale della neurogenesi è in topi. Negli umani la neurogenesi adulta esiste (Eriksson et al. 1998 Nature Medicine; più recentemente contestata da Sorrells et al. 2018 Nature) ma a tassi molto inferiori. La connessione neurogenesi → forgetting selettivo è plausibile come meccanismo umano, non dimostrata. Trattare l’inferenza come dimostrazione è errore di traduzione interspecie.

Equivalenze AI-umane. Ribadito sopra. Tre o quattro errori di equivalenza, ognuno presente in articoli divulgativi 2023-2026 sulla AI. Distinguere è il lavoro principale del lettore di buona fede.

Active forgetting come narrativa universale? Non tutto il forgetting è attivo. Encoding failure è semplicemente non-codifica; non c’è un macchinario di forgetting che lo produce. Interferenza è competizione fra tracce, non rimozione. Il decay attivo (Hardt-Nadel-Wang) e la neurogenesi (Akers) sono parti del repertorio del forgetting, non l’intero repertorio. Una lettura troppo entusiastica del paradigma dell’active forgetting tende a presentarlo come modello universale; è una componente importante, non l’unica.

Distinzioni interne alla categoria “motivated forgetting”. Anderson-Green distinguono direct suppression (sopprimi attivamente il pensiero target) e thought substitution (rimpiazza il pensiero target con un altro). Producono entrambi forgetting, con substrati neurali parzialmente diversi. La letteratura non sempre li distingue, e talvolta confonde gli effetti.

La replicabilità di Akers 2014. La manipolazione neurogenesi-running è stata replicata in più laboratori, ma non sempre con la stessa magnitudine di effetto. La dipendenza del fenomeno da specifici protocolli di conditioning, da ceppi di topo specifici (C57BL/6 vs altri), e da finestre temporali precise fra training, manipolazione, e test, suggerisce che l’effetto sia robusto qualitativamente ma sensibile ai dettagli. Per un uso divulgativo questo basta: il fenomeno esiste, ma non va trattato come leva causale semplice e universalmente parametrizzata.

False memories come “oblio inverso”. Una categoria che il quadro presentato tocca solo di sfuggita: la suggestibilità (Loftus, Eyewitness Testimony, 1979). Nel paradigma DRM (Deese-Roediger-McDermott, 1995, Journal of Experimental Psychology 21:803-814), soggetti studiano liste di parole semanticamente associate a una parola “critica” non presentata (es. bed, rest, pillow, dream… con la critica sleep assente). Al test, ricordano sleep come se fosse stata nella lista, con confidenza pari o superiore alle parole effettivamente presentate. Il sistema di memoria non solo perde informazione (forgetting); aggiunge informazione coerente con i pattern esistenti (false memory). I due fenomeni sono complementari: entrambi sono prodotti di un sistema che ricostruisce attivamente, non di un sistema che archivia passivamente. La trattazione completa appartiene a un capitolo dedicato sulle distorsioni della memoria, non qui; ma vale la pena segnalare che oblio e false memory sono due facce della stessa medaglia ricostruttiva.

La metafora della “cache eviction” è incompleta. Nel paragrafo dell’argomento ecologico abbiamo usato l’analogia della cache eviction informata dall’utilizzo recente. È utile come prima approssimazione, ma fuorviante in dettaglio. Una vera cache eviction (LRU, LFU, ARC) è agnostica al contenuto: tratta tutti i dati allo stesso modo, decidendo solo in base a frequenza-recenza. Il forgetting umano è invece informato dal contenuto: emozioni forti aumentano persistenza (consolidamento amigdalo-mediato), rilevanza per obiettivi attuali aumenta retrieval, somiglianza semantica con altri ricordi modula interferenza. Il sistema biologico è una cache eviction content-aware, sotto controllo di multiple modulazioni. Le metafore informatiche del Novecento (memoria come archivio, recupero come query, forgetting come delete) sottostimano sistematicamente questa dimensione di regolazione contenutistica.

  • memoria a lungo termine — il complemento necessario: come si forma e si trattiene; qui come e perché si perde. La curva di Ebbinghaus è raccontata lì come dato; qui ne discutiamo le interpretazioni.
  • memoria dichiarativa-procedurale — il forgetting opera molto più sull’asse dichiarativo che procedurale. Mirror drawing in H.M. (vedi capitolo 65) — H.M. impara abilità motorie senza ricordare di averle imparate, e quelle abilità non si dimenticano.
  • memoria episodica-semantica — la semanticization (perdita di dettaglio episodico → fatto semantico) è una forma di forgetting selettivo che è anche generalizzazione utile.
  • consolidamento della memoria — complemento opposto. Consolidamento e forgetting sono due processi attivi che lavorano sullo stesso substrato; uno fissa, l’altro libera. Replay biologico durante il sonno fa entrambi.
  • sleep-cognizione (in preparazione) — il sonno come arena di consolidamento e forgetting selettivi simultanei. Synaptic Homeostasis Hypothesis di Tononi-Cirelli.
  • dual-process-kahneman (in preparazione) — l’oblio supporta l’efficienza di sistema 1: pattern senza dettagli, categorie senza istanze.
  • bounded-rationality-simon (in preparazione) — Herbert Simon e la razionalità limitata. Il forgetting è una delle forze che producono i limiti della razionalità umana, ed è anche una delle ragioni per cui quei limiti sono funzionali anziché solo restrittivi.
  • ponte-memoria-agenti (in preparazione) — capitolo successivo. Cosa di tutto questo trasferiamo agli agenti AI?
  • catastrophic-forgetting (in preparazione) — la trattazione tecnica del bug AI.
  • machine-unlearning (in preparazione) — la trattazione tecnica della rimozione forzata.
  • knowledge-editing-rome (in preparazione) — la trattazione tecnica della modificazione chirurgica.
  • continual-pretraining (in preparazione) — il problema di estendere training senza distruggere capacità precedenti.
  • Schacter, D. L. (2001). The Seven Sins of Memory: How the Mind Forgets and Remembers. Houghton Mifflin. Lettura accessibile, divulgativa, scritta con cura. Il punto di ingresso canonico per il pubblico generale. La tassonomia è ancora valida vent’anni dopo.

  • Hardt, O., Nadel, L., & Wang, S.-H. (2013). “Decay happens: the role of active forgetting in memory”. Trends in Cognitive Sciences 17:111-120. Review concisa che riposiziona il decay come fenomeno attivo regolato. Lettura tecnica ma accessibile per il lettore generale.

  • Davis, R. L., & Zhong, Y. (2017). “The biology of forgetting — A perspective”. Neuron 95:490-503. Per chi vuole la biologia molecolare. Drosophila, mammiferi, Rac1, AMPA receptors.

  • Anderson, M. C., & Hulbert, J. C. (2021). “Active Forgetting: Adaptation of Memory by Prefrontal Control”. Annual Review of Psychology 72:1-36. Review aggiornata sulla soppressione esecutiva dell’oblio. Parte dal think/no-think, lo estende a scenari ecologici.

  • Borges, J. L. (1942). “Funes el memorioso”. In Ficciones, Sur. Sei pagine di letteratura che hanno anticipato di mezzo secolo la lettura funzionale dell’oblio. Lettura non opzionale per chi voglia capire perché pensare è dimenticare differenze.

  • Richards, B. A., & Frankland, P. W. (2017). “The Persistence and Transience of Memory”. Neuron 94:1071-1084. L’argomento computazionale-ecologico in forma compatta. Per il lettore tecnico interessato al collegamento con l’apprendimento statistico in ambienti non-stazionari.

  • Bartlett, F. C. (1932). Remembering: A Study in Experimental and Social Psychology. Cambridge University Press. La fonte storica della tesi della ricostruzione attiva. Lettura non datata, scrittura cristallina, esempio di scienza cognitiva prima della rivoluzione cognitiva degli anni Cinquanta.

  • Anderson, M. C., & Hulbert, J. C. (2021). “Active Forgetting: Adaptation of Memory by Prefrontal Control”. Annual Review of Psychology 72:1-36. Per la sintesi più aggiornata sul forgetting esecutivo, dal think/no-think alle estensioni ecologiche, con discussione della rilevanza clinica per PTSD e disturbi ansiosi.

  • Schacter, D. L., & Addis, D. R. (2007). “The cognitive neuroscience of constructive memory: remembering the past and imagining the future”. Philosophical Transactions of the Royal Society B 362:773-786. Discute il ruolo del sistema mnemonico ricostruttivo non solo per ricordare, ma anche per immaginare il futuro. Argomento collaterale: il forgetting funzionale supporta anche la flessibilità prospettica, non solo l’efficienza retrospettiva.

Una nota finale, fuori dall’eredità AI. Il quadro presentato in questo capitolo — l’oblio come funzione attiva, regolata, selettiva — è ancora oggetto di sviluppo in alcuni dettagli specifici (taglia degli effetti motivati, generalizzabilità di Akers ai primati, ruolo della neurogenesi adulta umana). Lo scheletro concettuale, però, si è stabilizzato fra il 2010 e il 2020 ed è oggi il consenso operativo del campo. Cinquant’anni dopo Funes el memorioso, il sistema cognitivo umano è descritto in termini sorprendentemente vicini a quelli di Borges: pensare è dimenticare differenze, e dimenticare differenze è un’operazione che il cervello compie con macchinari dedicati, sotto pressione selettiva, con conseguenze misurabili. James 1890 aveva visto giusto. Ci sono voluti centotrent’anni per dotare la sua intuizione di basi cellulari.