Memoria a lungo termine: tassonomia, casi clinici, basi cellulari

Il magazzino di ultima istanza della memoria umana — quello che trattiene una vita di episodi, conoscenze, abilità, abitudini, riflessi condizionati. Non è un magazzino unico ma un insieme di sistemi distinguibili clinicamente, anatomicamente, fenomenologicamente. Studiato da Hermann Ebbinghaus a Berlino nel 1885 con sillabe senza senso, ricomposto come ricostruzione attiva da Frederic Bartlett a Cambridge nel 1932, frantumato in moduli dal caso H.M. operato da William Scoville nel 1953, articolato in episodica e semantica da Endel Tulving nel 1972, dotato di una base cellulare candidata dalla scoperta della Long-Term Potentiation di Tim Bliss e Terje Lømo nel 1973, mappato in tassonomia consensuale da Larry Squire e Barbara Knowlton nel 1995, dimostrato causalmente come engramma di cellule specifiche dal laboratorio di Susumu Tonegawa nel 2012. È, fra i temi della memoria umana, quello più frequentemente confuso con i pesi di un LLM, con un vector store RAG, con il fine-tuning. Distinzioni che vanno fatte con cura, perché analogia, filiazione ed equivalenza qui scivolano l’una nell’altra con grande facilità.

Hartford, Connecticut. 25 agosto 1953. Un neurochirurgo di quarantasette anni, William Beecher Scoville (1906-1984), apre la calotta cranica di un paziente di ventisette anni. Henry Molaison (1926-2008), nato a Manchester nel Connecticut, soffre di crisi epilettiche refrattarie da quando, a sette anni, è caduto da una bicicletta. Nessun farmaco ha funzionato. Scoville ha già praticato resezioni del lobo temporale mediale su pazienti psicotici con esiti misti, e propone a Molaison la stessa strada: rimuovere bilateralmente l’ippocampo, l’amigdala, la corteccia entorinale e perirhinale — circa otto centimetri di tessuto per lato. L’operazione dura ore. Molaison sopravvive. Le crisi diminuiscono. Tutto bene, salvo un dettaglio che si manifesta nei giorni successivi: Molaison non riconosce più le persone che ha incontrato il giorno prima. Si presenta ogni mattina al personale come se fosse la prima volta. Saluta sua madre come se non l’avesse vista per anni. Dimentica la propria età. Non sa che giorno è.

Brenda Milner (1918-, neuropsicologa britannica-canadese al Montreal Neurological Institute) viene chiamata. Nei decenni successivi studierà Molaison — anonimizzato in letteratura come H.M. — quasi ogni anno, fino al 2008, anno della morte di Molaison. La diagnosi che emerge è precisa: H.M. ha amnesia anterograda profonda per la memoria dichiarativa (incapacità di formare nuovi ricordi consapevoli), con amnesia retrograda parziale (~11 anni) e gradiente temporale (i ricordi più vecchi conservati meglio). Ma — e qui sta il punto storico — il QI è intatto, il vocabolario è intatto, la memoria di lavoro funziona normalmente (digit span ~6), può tenere una conversazione per minuti finché non è distratto. E nel 1962 Milner pubblica un risultato che fa storia: H.M. migliora giorno dopo giorno nel mirror drawing task — tracciare con la matita il contorno di una stella vista solo riflessa in uno specchio — pur non ricordando, ad ogni nuova sessione, di aver mai fatto quel compito. Il sapere come (procedurale) impara. Il sapere che (dichiarativo) no.

H.M. è la tavola operatoria su cui si rompe l’idea di “memoria” come oggetto unico. La memoria a lungo termine — il magazzino di ultima istanza per i ricordi che durano oltre i pochi secondi della working memory — non è uno; sono sistemi paralleli, dissociabili chirurgicamente, neuralmente diversi. Molaison muore l’8 dicembre 2008 a ottantadue anni, donando il proprio cervello al Brain Observatory di San Diego: cinquantacinque anni vissuti dimenticando ogni giorno, ma ricordando come si scrivono parole, come si fa il conto della spesa, e — per le poche cose imparate prima del 1953 — chi era e da dove veniva.

Questo capitolo ricostruisce la mappa della memoria a lungo termine come la abbiamo capita fra il 1885 e oggi: la curva di oblio di Hermann Ebbinghaus (1850-1909, psicologo tedesco), la ricostruzione attiva di Frederic Bartlett (1886-1969, psicologo britannico a Cambridge), la dissociazione episodica-semantica di Endel Tulving (1927-2023, psicologo estone-canadese alla Toronto), la tassonomia consensuale di Larry Squire (1941-, neuroscienziato americano alla UC San Diego) e Barbara Knowlton (psicologa americana alla UCLA), la base cellulare candidata della Long-Term Potentiation di Tim Bliss (1940-) e Terje Lømo (1935-) nel 1973, la dimostrazione causale dell’engramma cellulare nel laboratorio di Susumu Tonegawa (1939-, biologo giapponese-americano al MIT, Nobel 1987) nel 2012, le distorsioni sistematiche svelate da Elizabeth Loftus (1944-) e dal paradigma DRM di Henry Roediger (1947-) e Kathleen McDermott. Chiudiamo, come per i capitoli vicini, con una sezione cauta sulla “eredità oggi” — dove le tentazioni di equivalenza fra LTM umana e pesi di un LLM, RAG, fine-tuning sono particolarmente forti, e dove distinguere analogia da filiazione da equivalenza è il lavoro decisivo.

Perché questo capitolo

Tre ragioni: storica, strutturale, di ponte.

La storica: la memoria a lungo termine è uno dei pochi temi di scienza cognitiva in cui un singolo caso clinico — H.M. — ha cambiato il campo in modo permanente. L’idea che la memoria sia un sistema unico, presente in molta psicologia pre-1957, è stata smantellata dal contrasto fra ciò che H.M. poteva e non poteva fare. Raccontare il caso bene — non come aneddoto colorito ma come esperimento naturale che ha forzato una distinzione concettuale — è didatticamente utile.

La strutturale: la LTM è il punto in cui la psicologia cognitiva (tassonomia comportamentale), la neuropsicologia clinica (dissociazioni post-lesionali), la neuroanatomia funzionale (mediotemporale vs neocorteccia vs gangli base vs cervelletto) e la neurobiologia molecolare (LTP, NMDA, sintesi proteica, engramma) convergono sullo stesso fenomeno. Mostrare come quattro livelli di descrizione si incontrino è un esercizio formativo per chiunque debba ragionare a più livelli — incluso chi disegna sistemi AI dove componenti psicologici, architetturali e neurali emergono a scale diverse.

La di ponte: i sistemi AI moderni hanno componenti che funzionalmente assomigliano alla LTM. I pesi di un LLM dopo pretraining contengono “conoscenza compressa” che assomiglia a memoria semantica e procedurale. Un sistema RAG con vector store assomiglia a una memoria episodica esterna interrogabile. Il fine-tuning assomiglia a una forma di consolidamento. Tutte queste somiglianze sono analogie didattiche, non filiazioni storiche, non equivalenze meccaniche. Confonderle porta a errori sia nella divulgazione (che promette troppo) sia nell’ingegneria (che progetta partendo da metafore sbagliate). Distinguere, qui, è la differenza fra capire e fraintendere.

Contesto: cinque date che strutturano il campo

1885 — Ebbinghaus, Über das Gedächtnis. Berlino, Università di Berlino. Hermann Ebbinghaus, allora trentaquattrenne, sceglie sé stesso come unico soggetto sperimentale e inventa un metodo: ~2300 sillabe senza senso (nonsense syllables, consonante-vocale-consonante senza significato lessicale, e.g. zof, daus, kel) divise in liste, memorizzate fino al criterio di recall perfetto, ri-testate dopo intervalli variabili. Quello che misura è il savings: quanto tempo serve per ri-imparare la lista, rispetto al tempo originale. Se la prima volta ci sono volute 1000 ripetizioni, e dopo un giorno ne servono 600 per ri-raggiungere il criterio, c’è un savings del 40%: qualcosa è rimasto. Risultati canonizzati: la forgetting curve (perdita rapida nelle prime ore, asintoto a settimane), il spacing effect (ripassi distribuiti nel tempo > massicci a parità di tempo totale), il learning curve logaritmica. Ebbinghaus inaugura la psicologia sperimentale della memoria. Il suo metodo è considerato eroico (e un po’ folle) per l’epoca: tre anni di esperimenti su sé stesso, rigorosamente cronometrati.

1932 — Bartlett, Remembering. Cambridge, Department of Psychology. Frederic Bartlett pubblica un libro di rottura. Il suo paradigma: presentare ai soggetti un racconto folkloristico nativo americano, War of the Ghosts (Kwakiutl, raccolto da Boas), e farlo riraccontare a intervalli — minuti, ore, giorni, mesi, anni. Quello che osserva: il racconto si trasforma sistematicamente. Dettagli “esotici” (canoa, fantasmi, ferita senza sangue) vengono normalizzati verso schemi culturali britannici (canoa diventa barca, fantasmi spariscono, ferita diventa morte). Conclusione: la memoria non è riproduzione fedele; è ricostruzione attiva guidata da schemi preesistenti. Il termine “schema” entra nel vocabolario cognitivo. Tesi antitetica al modello “fotografico” della memoria. Bartlett è ignorato per decenni, riscoperto negli anni 70 con la rivoluzione cognitiva.

1953-1957 — H.M. e Scoville-Milner. Operazione di H.M. il 25 agosto 1953. Il caso viene formalizzato in letteratura nel 1957 con il paper di William Scoville e Brenda Milner, “Loss of recent memory after bilateral hippocampal lesions” (Journal of Neurology, Neurosurgery, and Psychiatry 20:11-21). Per la prima volta, una dissociazione netta fra memoria a breve termine (preservata), memoria dichiarativa a lungo termine (devastata), e memoria procedurale (preservata). Il lobo temporale mediale (MTL) — ippocampo, corteccia entorinale, corteccia perirhinale, amigdala — diventa il candidato anatomico per la formazione di nuovi ricordi dichiarativi. Per la sua eredità duratura, H.M. è il caso clinico più studiato della storia delle scienze cognitive.

1972 — Tulving, “Episodic and Semantic Memory”. Capitolo nel volume Organization of Memory (a cura di Tulving e Donaldson, Academic Press). Endel Tulving propone che la memoria dichiarativa si articoli in due sotto-sistemi qualitativamente distinti. La memoria episodica trattiene eventi situati nel tempo-spazio personale (“ieri sera ho mangiato pasta a casa”); il suo richiamo è autonoetic — comporta un rivivere l’evento da una prospettiva soggettiva (Tulving 1985, “Memory and consciousness”, Canadian Psychology 26:1-12) — e richiede mental time travel, la capacità di proiettarsi mentalmente nel passato (e simmetricamente nel futuro). La memoria semantica trattiene conoscenza generale (“Roma è la capitale d’Italia”), il cui richiamo è noetic — uno sapere senza riviverlo come evento autobiografico. Argomenti per la distinzione: differenze fenomenologiche (autonoetic vs noetic), dissociazioni cliniche (pazienti come K.C., di cui parleremo, con episodica devastata e semantica relativamente conservata), differenze di sviluppo (la episodica matura più tardi della semantica nel bambino).

1995 — Squire-Knowlton e la tassonomia consensuale. Larry Squire e Barbara Knowlton, in “Memory, hippocampus, and brain systems” (capitolo in The Cognitive Neurosciences, MIT Press), formalizzano la mappa della LTM in due grandi famiglie e cinque sotto-categorie. Vedremo la struttura completa nella sezione meccanica. Intanto: questa è la tassonomia che si trova nei manuali, nei review, e — implicitamente — in ogni discussione clinica e sperimentale dal 1995 in poi.

flowchart TD
    LTM["Memoria a lungo termine"]
    LTM --> D["Dichiarativa (esplicita)<br/><i>MTL / dipendente da ippocampo</i>"]
    LTM --> ND["Non-dichiarativa (implicita)<br/><i>sistemi distribuiti</i>"]
    D --> EP["Episodica<br/><i>eventi nel tempo-spazio personale</i>"]
    D --> SE["Semantica<br/><i>conoscenza generale, fatti</i>"]
    ND --> PR["Procedurale (skill, abitudini)<br/><i>gangli della base, cervelletto</i>"]
    ND --> PI["Priming<br/><i>percettivo / concettuale; neocorteccia</i>"]
    ND --> CC["Condizionamento classico<br/><i>cervelletto (motorio); amigdala (paura)</i>"]
    ND --> NA["Non-associativa<br/><i>abituazione, sensitizzazione; circuiti riflessi</i>"]

Figura 1 — Taxonomy of Long-Term Memory (Squire & Knowlton 1995): declarative (episodic, semantic) vs non-declarative (procedural, priming, classical conditioning, non-associative)

A queste cinque date va aggiunta una sesta, di natura biologica: 1973 — Bliss e Lømo, LTP. Vedremo in dettaglio l’esperimento. Tim Bliss, allora postdoc al National Institute for Medical Research di Londra, e Terje Lømo, neurofisiologo norvegese a Oslo, pubblicano sul Journal of Physiology “Long-lasting potentiation of synaptic transmission in the dentate area of the anaesthetized rabbit following stimulation of the perforant path”. Per la prima volta, un correlato cellulare candidato del fenomeno della memoria: una sinapsi che, dopo stimolazione coordinata, resta potenziata per ore-giorni. È la prova diretta più solida che memoria = plasticità sinaptica.

E una settima, di natura cellulare-causale: 2012 — Liu et al., engramma optogenetico. Il laboratorio di Susumu Tonegawa al MIT (Liu, Ramirez, Pang, Puryear, Govindarajan, Deisseroth, Tonegawa, “Optogenetic stimulation of a hippocampal engram activates fear memory recall”, Nature 484:381-385) etichetta cellule specifiche del giro dentato attive durante un fear conditioning, e ne dimostra che la loro riattivazione optogenetica in un contesto neutro fa richiamare la paura. È la prima dimostrazione causale di un engramma cellulare in mammiferi. La memoria è in quelle cellule, lì.

Sette date, dal 1885 al 2012. Centoventisette anni di accumulazione progressiva: prima il fenomeno (Ebbinghaus), poi la struttura ricostruttiva (Bartlett), poi la dissociazione clinica (H.M.), poi la tassonomia (Tulving, Squire-Knowlton), poi la base cellulare (LTP), poi la dimostrazione causale (engramma). Ognuna di queste tappe è ancora attiva, e si compone con le altre nei modelli moderni.

L’intuizione: due angoli prima del formalismo

Prima della tassonomia e dei meccanismi, due angoli aiutano a sentire cosa la LTM fa.

Angolo 1: comportamentale-fenomenologico

Riprendi H.M. da vicino. C’è una qualità fenomenologicamente diversa fra le due cose che sopravvivono e le tante che spariscono. Quello che H.M. perde: la capacità di formare nuovi episodi consapevoli (ieri sera ho cenato con Brenda — no, non se lo ricorda), la capacità di acquisire nuovi fatti dichiarativi (chi è il presidente Reagan? — nel 1985 dirà “Truman”), la capacità di riconoscere persone incontrate dopo il 1953. Quello che H.M. mantiene: la capacità di parlare (linguaggio già consolidato), la capacità di fare aritmetica (procedurale), la capacità di imparare nuove abilità motorie (mirror drawing) — senza ricordare di averle imparate.

La distinzione sapere che / sapere come — che il filosofo Gilbert Ryle (1900-1976, britannico, The Concept of Mind, 1949) aveva proposto su basi puramente filosofiche un decennio prima dell’operazione — riceve in H.M. una conferma empirica netta. Sono due sistemi. Uno richiede MTL; l’altro no. Si possono perdere indipendentemente.

Estendi alla distinzione episodica-semantica. C’è un’altra qualità fenomenologica differenziale: ricordare quando hai imparato che Roma è capitale d’Italia (forse a scuola, in seconda elementare, con la maestra Rossi: episodica) vs sapere che Roma è capitale d’Italia (semantica). La seconda non richiede la prima. Anzi, la prima nei più sbiadisce: sai il fatto, hai perso l’episodio. Sotto la lettura di Tulving, è perché l’episodica è autonoetic (rivivere) e la semantica è noetic (sapere); l’uno può nutrire l’altro al consolidamento, ma in seguito vivono indipendentemente.

Aneddoto utile: chiedi a un adulto come ha imparato a guidare. Risponderà raccontando episodi (la prima lezione con il padre, l’esame). Chiedi come si guida: spiega, ma con difficoltà, e in modo incompleto. La capacità di guidare (procedurale) è esercitabile in modo opaco; gli episodi del suo apprendimento (episodica) sono raccontabili in modo trasparente; la conoscenza dichiarativa di “cosa” è guidare (semantica) è intermedia. Tre sistemi al lavoro, distinguibili nel quotidiano.

Angolo 2: cellulare-LTP

Cambia scala. Da H.M. ai Bell Labs di Lømo a Oslo, settembre 1966. Lømo, dottorando di Per Andersen, anestetizza un coniglio. Inserisce due elettrodi nell’ippocampo: uno stimolante nel perforant path (input dalla corteccia entorinale al giro dentato), uno registrante nel giro dentato (output sui neuroni granulari). Misura l’EPSP (excitatory postsynaptic potential, depolarizzazione del neurone postsinaptico in risposta a un singolo impulso). Baseline: ogni stimolo test produce un EPSP di ampiezza X.

Lømo, per ragioni indipendenti, applica un treno tetanico: ~100 stimoli al secondo per un secondo. Ritorna alla baseline. Ripete lo stimolo test. L’EPSP ora è 2-3 volte X. E resta così per le ore successive. La sinapsi è cambiata: la risposta a uno stesso input è permanentemente aumentata.

Lømo non pubblica subito. Tim Bliss, postdoc al National Institute for Medical Research di Londra, lavora con Lømo a Oslo nel 1968-1969. Insieme replicano e estendono. Il paper esce nel 1973 sul Journal of Physiology (vol. 232, pp. 331-356). Il fenomeno viene battezzato Long-Term Potentiation (LTP). È il candidato più solido per la base cellulare della memoria.

L’intuizione di Donald Hebb (1904-1985, psicologo canadese alla McGill, The Organization of Behavior, 1949) — riassunta nella formula popolare “neurons that fire together, wire together” — riceve una verifica diretta. Quando pre e post si attivano insieme con sufficiente intensità, la sinapsi si rinforza, e il rinforzo persiste.

Negli anni 80-90 il meccanismo molecolare si svela. Il recettore NMDA (N-methyl-D-aspartate, sottotipo di recettore del glutammato) funge da coincidence detector: ha bisogno sia del glutammato rilasciato dal pre, sia della depolarizzazione del post (per espellere lo ione Mg²⁺ che blocca il canale a riposo). Solo quando entrambe le condizioni sono soddisfatte, il canale si apre e Ca²⁺ entra nel neurone postsinaptico. Il calcio innesca una cascata: CaMKII (Calcium/Calmodulin-dependent Kinase II), PKA (Protein Kinase A), MAPK. Il risultato a breve termine: fosforilazione e inserzione di recettori AMPA in membrana — più recettori, risposta più ampia. Il risultato a lungo termine (LTP “tardiva”, ore-giorni-anni): sintesi proteica (la cascata attiva il fattore di trascrizione CREB, che induce trascrizione genica → nuove proteine sinaptiche → crescita di nuove spine dendritiche → consolidamento strutturale).

C’è anche il duale: LTD (Long-Term Depression). Stimolazione a bassa frequenza (~1 Hz prolungato) → riduzione persistente della trasmissione. LTP+LTD insieme permettono regolazione bidirezionale della forza sinaptica.

Eric Kandel (1929-, neuroscienziato austriaco-americano alla Columbia University, Nobel per la Fisiologia o Medicina nel 2000) lavora dalla fine degli anni 60 su Aplysia californica, una lumaca marina con neuroni grandi (fino a 1 mm di diametro), pochi (~20.000), e identificabili individualmente da animale ad animale. Habituation, sensitization, classical conditioning si possono ridurre a cambiamenti misurabili in singole sinapsi identificate. La memoria, almeno in invertebrati, è sinaptica nel senso più letterale possibile.

Conclusione angolo 2: la memoria a lungo termine non è “scritta da qualche parte” come un file su un supporto separato dal computo. È distribuita nei pesi sinaptici della rete. L’engramma non è un oggetto in un magazzino: è un pattern di sinapsi rinforzate. Il richiamo è la riattivazione (parziale) di quel pattern — che, come vedremo, non è lettura passiva ma ricostruzione attiva.

flowchart LR
    E[evento t=0] --> M[minuti]
    M --> H[ore]
    H --> D[giorni]
    D --> W[settimane]
    W --> Y[mesi-anni]
    H1[Binding ippocampale: forte da t=0, decade su settimane-anni] -.coesiste con.-> M
    H2[Rafforzamento corticale: cresce da giorni, plateau a settimane-anni] -.coesiste con.-> D
    H3[Stato della memoria: labile a inizio, consolidata a fine] -.coesiste con.-> W
    R1[Recupero in settimane] -.riconsolidazione.-> H1
    R2[Recupero in mesi-anni] -.riconsolidazione.-> H1

Figura 2 — LTP curve in dentate gyrus (Bliss-Lømo 1973): baseline EPSP, tetanic stimulation arrow at t=0, sustained potentiation over hours

La meccanica: tassonomia, fasi, sistemi

Apriamo il merito tecnico. Procediamo per sezioni: tassonomia, fasi (encoding, storage, retrieval), consolidamento e sonno, reconsolidation, distorsioni, basi neurali e casi clinici.

La tassonomia (Squire-Knowlton 1995)

La struttura consensuale. Memoria a lungo termine si divide in due grandi famiglie e cinque sotto-categorie:

Long-Term Memory
|
+-- Declarative (Explicit)         [MTL / hippocampus-dependent]
|   |
|   +-- Episodic     [eventi nel tempo-spazio personale; autonoetic]
|   +-- Semantic     [conoscenza generale, fatti; noetic]
|
+-- Non-Declarative (Implicit)    [sistemi distribuiti, accesso non cosciente]
    |
    +-- Procedural               [skill, abitudini; gangli base, cervelletto, motor cortex]
    +-- Priming                  [perceptual / conceptual; neocorteccia]
    +-- Classical conditioning   [cervelletto (motor), amigdala (fear)]
    +-- Non-associative          [habituation, sensitization; circuiti riflessi]

Tre criteri per la distinzione:

Accesso cosciente. Dichiarativa = riportabile a parole, con coscienza del contenuto. Non dichiarativa = manifestata in performance senza richiedere coscienza esplicita.
Substrato neurale. Dichiarativa = lobo temporale mediale (ippocampo, entorinale, peri/parahippocampale) per encoding; neocorteccia per storage consolidato. Non dichiarativa = sistemi diversi e distribuiti (gangli base, cervelletto, neocorteccia, amigdala, riflessi spinali).
Tipo di lesione che la danneggia. H.M. e simili pazienti MTL: dichiarativa devastata, non dichiarativa preservata. Pazienti Parkinson e Huntington (gangli base): procedurale degradata, dichiarativa relativamente conservata.

Una nota: la tassonomia è consensuale nel senso che si trova nei manuali, ma non è teoricamente neutra. Squire la difende come gerarchia di sistemi anatomicamente distinti; Tulving preferiva una distinzione più fine fra episodica e semantica come sistemi separati al pari livello di procedurale; alcuni ricercatori vedono continuum più che categorie. Per i nostri scopi: la tassonomia è una mappa utile, non una verità ontologica. Funziona didatticamente e clinicamente; le sue articolazioni interne restano oggetto di dibattito.

Encoding: come l’informazione entra

Cinque effetti robusti che governano quanto bene l’informazione viene memorizzata.

Levels of Processing (Fergus Craik, 1935-, psicologo scozzese-canadese alla Toronto, e Robert Lockhart, allora suo collaboratore — Journal of Verbal Learning and Verbal Behavior 1972, “Levels of processing: A framework for memory research”). Il ricordo non dipende dalla durata dell’esposizione ma dalla profondità dell’elaborazione. Domandare a un soggetto “questa parola è scritta in maiuscolo?” (elaborazione superficiale, visiva) produce ricordo peggiore di “questa parola rima con cane?” (elaborazione fonologica), che a sua volta produce ricordo peggiore di “questa parola si adatta alla frase: Il bambino ha visto un ____?” (elaborazione semantica). Stessa parola, stesso tempo, ricordo molto diverso. Implicazione operativa per chi studia: leggere passivamente è poco efficiente; integrare semanticamente è molto più efficiente.

Encoding specificity (Endel Tulving e Donald Thomson, Psychological Review 1973). Il retrieval è facilitato se il contesto del recall coincide con quello dell’encoding. Studio canonico, divertente quanto rigoroso: Godden e Baddeley 1975 fanno imparare liste di parole a sub-acquei, metà sott’acqua e metà a terra, poi testano metà del recall sott’acqua e metà a terra. Risultato: parole imparate sott’acqua sono ricordate meglio sott’acqua; quelle imparate a terra meglio a terra. Il contesto fa parte della traccia. Generalizzazione: il recall è migliore in stati interni simili a quelli dell’encoding (state-dependent learning: ubriaco-ubriaco, triste-triste).

Generation effect (Norman Slamecka, 1928-, psicologo americano, e Peter Graf — Journal of Experimental Psychology: Human Learning and Memory 1978). Generare attivamente l’item produce ricordo migliore di leggerlo passivamente. Soggetti che leggono “cane” lo ricordano peggio di soggetti che completano “ca__” → “ne”. L’effetto è robusto e ampio. Implicazione: studiare riempiendo i buchi > studiare leggendo testo completo.

Testing effect / retrieval practice (Henry Roediger, 1947-, psicologo americano alla Washington University in St. Louis, e Jeffrey Karpicke — Psychological Science 2006, “Test-enhanced learning”). Riprodurre da memoria è più efficace per la long-term retention che ri-leggere. Studio canonico: tre condizioni — (1) leggi 4 volte; (2) leggi 3 volte + 1 test; (3) leggi 1 volta + 3 test. A 5 minuti: la condizione (1) sembra superiore (illusione di familiarità). A una settimana: la condizione (3) è significativamente superiore. L’atto di richiamare è un atto di consolidamento. Implicazione: flashcard, quiz, recall attivo > rilettura passiva.

Spacing effect (Hermann Ebbinghaus 1885 → moderno). A parità di tempo totale, ripassi distribuiti producono ricordo migliore di massicci. Studiare 4 sessioni di 30 minuti distribuite su 4 giorni > una sessione di 2 ore in un solo giorno. Base degli algoritmi di flashcard moderni (SM-2 di SuperMemo, usato anche da Anki; Leitner box). La “regola del raddoppio degli intervalli” (1 giorno → 2 → 4 → 8 → 16) è una buona prima approssimazione.

Storage e consolidamento

Una volta entrata, una traccia non è subito stabile. Passa per fasi.

Standard consolidation theory (Larry Squire e Pablo Alvarez, Current Opinion in Neurobiology 1995). All’inizio (ore-giorni-settimane) le tracce dichiarative sono ippocampo-dipendenti: l’ippocampo lega insieme i frammenti corticali dell’esperienza (visivo, uditivo, semantico, contestuale). Nel tempo, attraverso un processo lento, le memorie si trasferiscono progressivamente alla neocorteccia, dove formano connessioni intra-corticali stabili indipendenti dall’ippocampo. La predizione clinica: lesioni ippocampali producono amnesia retrograda con gradiente temporale — i ricordi recenti (non ancora consolidati corticalmente) sono persi, i remoti (già consolidati) preservati. È la legge di Ribot (Théodule Ribot, 1839-1916, psicologo francese, Les maladies de la mémoire, 1881), confermata in molti pazienti tra cui H.M.

flowchart LR
    E[evento t=0] --> M[minuti]
    M --> H[ore]
    H --> D[giorni]
    D --> W[settimane]
    W --> Y[mesi-anni]
    H1[Binding ippocampale: forte da t=0, decade su settimane-anni] -.coesiste con.-> M
    H2[Rafforzamento corticale: cresce da giorni, plateau a settimane-anni] -.coesiste con.-> D
    H3[Stato della memoria: labile a inizio, consolidata a fine] -.coesiste con.-> W
    R1[Recupero in settimane] -.riconsolidazione.-> H1
    R2[Recupero in mesi-anni] -.riconsolidazione.-> H1

Figura 2 — Hippocampal consolidation timeline: event, hippocampus binding, gradual cortical strengthening, retrieval-driven reconsolidation loops

Multiple Trace Theory (Lynn Nadel, 1942-, psicologo americano-britannico alla Arizona, e Morris Moscovitch, 1945-, psicologo canadese alla Toronto; Current Opinion in Neurobiology 1997). Posizione alternativa: la episodica resta ippocampo-dipendente per sempre. Ogni volta che richiami un episodio, l’ippocampo crea una nuova traccia (multiple trace). La semantica si consolida nella neocorteccia (concordando con Squire-Alvarez su quel punto), ma la episodica no. La predizione: lesioni ippocampali estese producono amnesia retrograda episodica senza gradiente — anche ricordi remoti sono persi. Casi clinici come K.C. (di cui parleremo) sembrano supportare MTT.

Il dibattito non è chiuso al 2026. Probabilmente verità in entrambe le posizioni, con dipendenza dal tipo di traccia e dalla profondità di integrazione semantica. L’evidenza convergente da neuroimaging suggerisce che la episodica autobiografica con dettagli vividi richiede attivazione ippocampale anche per ricordi remoti, mentre la semantica autobiografica spogliata (la lista dei luoghi dove ho vissuto) è ippocampo-indipendente. La distinzione sensoriale-vivido vs fattuale-secco si sovrappone a quella episodica vs semantica e contribuisce alla dipendenza differenziale.

Sleep-dependent consolidation (Susanne Diekelmann, neuroscienziata tedesca, e Jan Born, 1958-, neuroscienziato tedesco alla Tubinga; review in Nature Reviews Neuroscience 2010, “The memory function of sleep”). Durante il sonno NREM (slow-wave sleep), in particolare nelle prime ore della notte, l’ippocampo replica le sequenze di place cells (cellule di luogo, scoperte da John O’Keefe nel 1971) registrate durante la veglia. Wilson e McNaughton 1994 hanno mostrato in ratti che le sequenze di firing osservate durante l’esplorazione di un ambiente vengono re-eseguite in formato compresso (10-20 volte più veloce) durante il sonno successivo. Le sleep spindles (oscillazioni 11-15 Hz talamo-corticali) e le slow oscillations (~0.75 Hz corticali) coordinano il trasferimento da ippocampo a corteccia. Risultato comportamentale: studio + sonno > studio + veglia di pari durata, per memoria dichiarativa. Risultato pratico: il consiglio “studia prima di dormire” ha base biologica.

Reconsolidation: la traccia che si riapre al richiamo

Karim Nader, Glenn Schafe e Joseph LeDoux (LeDoux 1949-, neuroscienziato americano alla NYU), Nature 2000, “Fear memories require protein synthesis in the amygdala for reconsolidation after retrieval”.

Paradigma. Ratti vengono condizionati: tono → shock al piede. La memoria è amigdala-dipendente. 24 ore dopo il training, è stabile (consolidamento standard avvenuto). Ora si fa una ri-presentazione del tono (richiamo, retrieval), seguita da iniezione locale nell’amigdala di anisomicina (inibitore della sintesi proteica). 24 ore dopo: i ratti non mostrano più paura al tono. La memoria è cancellata.

Controllo cruciale: senza il richiamo, l’anisomicina non ha effetto. È il richiamo che apre la traccia, e il richiamo che richiede sintesi proteica per ri-stabilizzarla.

Conclusione. La memoria, al richiamo, ritorna in uno stato labile. Per essere mantenuta, deve essere ri-consolidata con sintesi proteica, esattamente come al momento della formazione. Il richiamo non è lettura passiva di un file: è ri-scrittura. Ogni volta che ricordi qualcosa, modifichi (potenzialmente) la traccia.

Implicazioni concettuali. Spiega perché i ricordi “sicuri” si modificano nel tempo (un ricordo richiamato spesso è anche un ricordo molto modificato). Spiega perché l’effetto dell’interrogatorio sulla testimonianza (Loftus) è così potente: ogni richiamo guidato è un’occasione di ri-scrittura. Apre prospettive cliniche per disturbi da memoria traumatica: protocolli con riattivazione + propranololo (beta-bloccante) hanno mostrato attenuazione di memorie di paura in PTSD, con risultati misti ma promettenti.

Ed è una buona spiegazione di come la memoria umana, pur instabile, sia funzionalmente adattiva: la possibilità di ri-scrivere al richiamo permette di integrare nuova informazione con la vecchia, mantenendo la traccia aggiornata invece che congelata. Un sistema di file immutabili non avrebbe questa proprietà.

Distorsioni e ricostruttività

Il corollario di Bartlett 1932 e Nader 2000 è che la memoria è ricostruttiva, non riproduttiva. Conseguenze sistematiche.

Forgetting curve (Ebbinghaus 1885). Decadimento rapido nelle prime ore (~50% in un’ora), poi rallentamento, asintoto a settimane. Modificabile da spacing, levels of processing, retrieval practice — ma irriducibile a zero.

Interference. Più che il decadimento puro, la perdita di accesso a una traccia dipende da interferenza con altre tracce. Proattiva: vecchie memorie disturbano l’apprendimento di nuove (chi ha imparato il francese fatica a imparare lo spagnolo perché gli interferiscono i falsi amici). Retroattiva: nuove memorie disturbano il richiamo di vecchie (cambi numero di telefono e dimentichi il vecchio).

Misinformation effect (Elizabeth Loftus, 1944-, psicologa americana alla UC Irvine, e John Palmer; Journal of Verbal Learning and Verbal Behavior 1974, “Reconstruction of automobile destruction”). Soggetti vedono un video di un incidente stradale. Domandati “quanto andavano veloci le auto quando si sono scontrate?” stimano velocità mediamente più alte di quelli domandati “quanto andavano veloci quando si sono toccate?”. Una settimana dopo, domandati “c’era vetro rotto sulla scena?” (non c’era), il primo gruppo risponde “sì” molto più spesso del secondo. La domanda suggestiva ha modificato la traccia. Decenni di lavoro di Loftus su questo tema hanno avuto enorme impatto sulla testimonianza in tribunale (memoria oculare come prova fragile).

DRM paradigm — false memory in laboratorio (Henry Roediger e Kathleen McDermott, Journal of Experimental Psychology: Learning, Memory, and Cognition 1995). Riprende un disegno di James Deese del 1959. Soggetti ascoltano una lista di 15 parole tutte associate semanticamente a un concetto critico mai presentato. Esempio classico: lista bed, rest, awake, tired, dream, wake, snooze, blanket, doze, slumber, snore, nap, peace, yawn, drowsy — tutte legate alla parola critica sleep, che NON è nella lista. Subito dopo, recall libero. Risultato: ~70% dei soggetti riportano “sleep” con confidenza alta, spesso più alta che per parole effettivamente presentate. Falsi ricordi generati in laboratorio in due minuti, con soggetti normali, in condizioni di buona fede. Il DRM è uno strumento standard per studiare la genesi di false memories.

Schema effects (Bartlett 1932). I ricordi si conformano agli schemi culturali. Negli anni successivi una folla di studi ha confermato. Esempio: soggetti in un ufficio universitario per pochi minuti, poi domandati “cosa c’era nell’ufficio?”: riportano cose stereotipate (libri, scrivania, sedia) anche quando non c’erano, e mancano di riportare cose anomale (un teschio sulla mensola).

Flashbulb memories (Roger Brown, 1925-1997, psicologo americano alla Harvard, e James Kulik; Cognition 1977). Ricordi vividi di eventi pubblici scioccanti — l’assassinio di JFK nel 1963, l’esplosione del Challenger nel 1986, l’11 settembre 2001 — vissuti soggettivamente come “fotografici” (ricordi dove eri, con chi, cosa stavi facendo). Studi longitudinali (Neisser-Harsch 1992 sul Challenger; Talarico-Rubin 2003 sull’11 settembre con soggetti testati il 12 e poi a settimane-mesi) mostrano che le flashbulb memories si modificano nel tempo come i ricordi normali, pur mantenendo alta confidenza soggettiva. La vividezza non garantisce accuratezza. Lezione più ampia: la confidenza che hai in un ricordo è scarsamente correlata alla sua fedeltà.

La memoria semantica come rete: Collins-Quillian e spreading activation

Una nota dedicata, perché entra anche nel terzo esempio. Allan Collins e Ross Quillian, Journal of Verbal Learning and Verbal Behavior 1969, “Retrieval time from semantic memory”, propongono un modello gerarchico della memoria semantica: i concetti sono nodi in una rete, organizzati in tassonomia (canarino → uccello → animale → essere vivente), con proprietà attaccate al livello più alto a cui si applicano (gli uccelli volano, attribuito a “uccello”; il canarino è giallo, attribuito a “canarino”). Predizione testabile: il tempo di verifica di “un canarino è un uccello” è più breve di “un canarino è un animale” — perché il secondo richiede di salire due livelli nella gerarchia. Confermato sperimentalmente, con caveat (effetti di tipicità: “un pinguino è un uccello” è più lento di “un canarino è un uccello”, incoerente con la sola gerarchia).

Allan Collins e Elizabeth Loftus, Psychological Review 1975, “A spreading-activation theory of semantic processing”, rivedono il modello sostituendo la gerarchia rigida con una rete pesata. L’attivazione di un nodo (per esempio la parola letto) si diffonde automaticamente ai nodi connessi (sonno, riposo, coperta, materasso) con intensità proporzionale alla forza della connessione e decrescente con la distanza. La somma delle attivazioni in arrivo a un nodo determina la sua attivazione corrente. Se sufficiente, il nodo diventa accessibile alla coscienza. Spiega: priming (parola precedente facilita la successiva), effetti di tipicità, errori prevedibili in DRM (parola critica massivamente attivata da tutte le parole della lista). Il modello a rete con spreading activation è quasi-canonico per la semantica fino agli anni 90, e si vede come antesignano concettuale dei modelli distribuzionali (Firth 1957; word2vec; embeddings) che troviamo oggi negli LLM — un parallelo storico che merita attenzione perché è uno dei pochi casi di filiazione documentata fra psicologia cognitiva e ingegneria AI moderna, non solo analogia (vedi ponte-distribuzionale-embeddings, in preparazione).

Casi clinici: persone come laboratori naturali

H.M. — Henry Molaison (1926-2008). Già discusso in apertura. Studiato da Brenda Milner per oltre 50 anni, poi da Suzanne Corkin (1937-2016, neuropsicologa al MIT) per altrettanti. Descritto in Permanent Present Tense (Corkin 2013). Caso fondante per la distinzione MTL-dipendente vs MTL-indipendente.

K.C. — Kent Cochrane (1951-2014). Canadese, incidente in moto nel 1981, lesione bilaterale ippocampo + parti frontali. Studiato per decenni da Tulving. Episodica devastata: incapace di ricordare qualunque episodio personale specifico, prima o dopo l’incidente. Incapace di proiettarsi nel futuro (mental time travel completamente compromesso, in entrambe le direzioni temporali). Semantica relativamente conservata: sa cosa sia un’auto, sa che ha avuto un incidente, sa fatti del mondo. Caso forte per la dissociazione episodica-semantica e per la connessione episodica ↔ proiezione futura.

Clive Wearing (1938-). Musicologo e direttore di coro britannico. Marzo 1985: encefalite da herpes simplex, danno bilaterale a ippocampo e corteccia temporale. Memoria di pochi secondi. Aggiorna continuamente un diario scrivendo “ora sono vivo per la prima volta”, cancellando ogni voce precedente perché “ovviamente sono inesatte — ora sono davvero vivo”. Conserva: linguaggio, riconoscimento profondo della moglie Deborah (la saluta ogni volta con gioia come se non la vedesse da anni — anche se è uscita dieci minuti prima), memoria procedurale musicale (può dirigere un coro, suonare il piano in modo competente). Documentato in Forever Today (D. Wearing 2005) e in documentari BBC. Caso quasi più dissociante di H.M., perché mostra che persino la memoria di sé come essere persistente nel tempo può essere amputata.

Solomon Shereshevsky (~1886-1958). Il caso opposto: ipermnesia. Mnemonista russo, soggetto unico di studio per Aleksandr Luria (1902-1977, neuropsicologo russo, fondatore della neuropsicologia sovietica) per circa trent’anni. Memoria praticamente illimitata: liste di settanta cifre ricordate dopo quindici anni, parola per parola, a sorpresa. Sinestesia profonda: numeri come colori, suoni come forme tridimensionali, parole come sapori. Documentato in The Mind of a Mnemonist (Luria 1968). Il problema di Shereshevsky era opposto a H.M.: incapacità di astrarre e dimenticare. Ogni dettaglio rimaneva, ogni metafora veniva presa letteralmente, era difficile estrarre il significato perché ogni parola portava con sé tutta la sua storia sensoriale. Caso che ricorda che ipermemoria può essere disabilitante quanto amnesia: l’oblio (vedi oblio-funzioni, in preparazione) è una feature, non un bug.

Korsakoff syndrome. Sindrome neurologica da carenza cronica di tiamina (vitamina B1), tipica di alcolismo cronico avanzato. Lesioni ai corpi mammillari e ai nuclei dorsomediali del talamo. Quadro clinico: amnesia anterograda + retrograda, confabulazione (riempimento spontaneo dei vuoti di memoria con contenuti plausibili ma falsi, raccontati con piena convinzione), apatia, riduzione della consapevolezza del deficit. Descritta da Sergei Korsakov (1854-1900, psichiatra russo) nel 1889. Caratteristica didattica: la confabulazione mostra che il sistema di “narrazione del sé” continua a operare anche quando i dati di base sono assenti, costruendo una storia coerente da ricordi semantici frammentari e inferenze. La memoria, quando non c’è, viene fabbricata.

Aging effects. Nell’invecchiamento normale (non patologico) la memoria episodica declina più della semantica. Anziani sani hanno difficoltà crescenti a ricordare episodi recenti specifici (ieri sera ho mangiato cosa?), conservando relativamente bene la conoscenza generale (cosa significa una parola, fatti del mondo). Spiegazione: l’ippocampo è particolarmente vulnerabile all’invecchiamento; le aree corticali associative meno. La demenza di Alzheimer patologizza questo gradiente: prime perdite a livello mediotemporale (placche e grovigli neurofibrillari di Alzheimer 1907 partono da entorinale e ippocampo), poi diffusione progressiva alla neocorteccia; quadro clinico iniziale dominato da amnesia anterograda episodica, poi degradazione semantica, infine erosione anche di memoria procedurale e linguaggio.

Childhood amnesia. Quasi nessun adulto ricorda eventi prima dei 3-4 anni, e i ricordi fra i 4 e i 7 sono frammentari. Spiegazioni: maturazione tardiva dell’ippocampo, assenza di un self autobiografico prima dello sviluppo del linguaggio narrativo, schemi episodici non ancora formati, alta neurogenesi nell’ippocampo infantile che potrebbe sovrascrivere tracce. È un fenomeno robusto e ben documentato; le cause non sono pienamente accordate.

Basi neurali: una mappa anatomica della LTM

Tre coordinate riassumono dove la LTM “vive” nel cervello.

Lobo temporale mediale (MTL) — ippocampo, corteccia entorinale, peri-rhinale, parahippocampale. Hub di legame multi-modale per nuove memorie dichiarative. Lesioni bilaterali = amnesia dichiarativa anterograda profonda (H.M., Wearing). Funzione computazionale: indicizzazione di pattern corticali distribuiti, pattern completion da indizi parziali (Marr 1971; Treves-Rolls 1994), separazione di tracce simili (pattern separation nel giro dentato). All’interno: il giro dentato riceve dal perforant path e fa pattern separation; CA3 ha autoassociazione (circuiti ricorrenti, pattern completion); CA1 integra e proietta a corteccia entorinale e in via diretta al subiculum. Le place cells di John O’Keefe (1939-, neuroscienziato britannico-americano alla UCL, Nobel 2014) e le grid cells di May-Britt e Edvard Moser (Nobel 2014, NTNU Trondheim) suggeriscono che la stessa macchineria ippocampale che mappa lo spazio mappa anche le sequenze di esperienza — l’ippocampo come cognitive map (O’Keefe-Nadel 1978).

Neocorteccia — sede dello storage consolidato. Memoria semantica distribuita su aree associative (temporale anteriore per concetti generali, temporale-parietale per categorie semantiche). Memoria episodica consolidata coinvolge cortecce di alto livello in interazione con MTL. Lesioni focali (e.g. demenza semantica fronto-temporale, trattata da Hodges et al. 1992) producono perdita selettiva di conoscenza concettuale risparmiando episodi recenti — pattern opposto rispetto ad H.M.

Sistemi non dichiarativi — gangli della base (procedurale, abitudini; lesioni in Parkinson e Huntington degradano selettivamente skill learning); cervelletto (procedurale motoria, classical conditioning di riflessi; eyeblink conditioning di Richard Thompson); amigdala (fear conditioning, memoria emotiva; LeDoux); circuiti riflessi spinali (habituation, sensitization).

La separazione anatomica di questi sistemi è la base biologica della tassonomia di Squire-Knowlton: non è una classificazione per comodità, è una mappa di sistemi con substrati diversi.

Engrammi: dalla metafora alla causalità

Il termine engram è di Richard Semon (1859-1918, biologo tedesco), che nel 1904 propose che ogni esperienza lasciasse una traccia fisica nel cervello. Karl Lashley (1890-1958, psicologo americano) cercò l’engramma per decenni con lesioni sistematiche in roditori, fallendo nel localizzarlo (concluse, scoraggiato, in In Search of the Engram 1950: “memoria non è possibile, ma esiste”). Per ottant’anni l’engramma è stato concetto teorico senza traccia diretta.

2012 cambia. Il laboratorio di Susumu Tonegawa al MIT (Liu et al., Nature 484:381-385, “Optogenetic stimulation of a hippocampal engram activates fear memory recall”) usa una tecnica nuova: etichettatura attività-dipendente. Topi ingegnerizzati esprimono channelrhodopsin (proteina opsina che apre canali ionici quando illuminata da luce blu) sotto il controllo del promotore c-fos (gene attivato durante alta attività neurale) attivabile da un farmaco (doxycycline-off). Il topo è messo in un contesto A neutro mentre il farmaco è presente: niente etichettatura. Si toglie il farmaco. Topo messo in contesto B con shock (fear conditioning): le cellule della dentate gyrus attive in B vengono etichettate con channelrhodopsin. Il topo, riportato in contesto A neutro, è normale. Si illumina con luce blu il giro dentato (riattivando solo le cellule etichettate, cioè quelle dell’engramma di B): il topo freezing — esibisce risposta di paura in un contesto in cui non l’aveva mai sperimentato. La memoria di paura del contesto B è stata richiamata stimolando le cellule che ne portavano la traccia.

Esperimenti successivi (Ramirez et al. 2013, Science) hanno mostrato che si può creare una falsa memoria: etichettare cellule attive in contesto A neutro, poi metterle a riattivare durante shock in contesto B, e il topo svilupperà paura per A pur non avendovi mai ricevuto shock. L’engramma è manipolabile in encoding e in recall.

Implicazione: l’engramma non è una metafora. È un insieme identificabile di cellule la cui ri-attivazione causa il richiamo. Sono passati da Lashley 1950 (“non si trova”) a Tonegawa 2012 (“eccolo, e lo accendo a comando”) in sessantadue anni, grazie a optogenetica + ingegneria genetica + reporter c-fos.

I limiti vanno marcati. Sono esperimenti su roditori, su memoria di paura amigdala-ippocampo-dipendente, in condizioni di laboratorio. L’estensione a memoria episodica umana ricca è inferenziale. Ma il principio — la traccia è in quelle cellule, lì — è un cambio di stato della disciplina.

Esempi concreti

Tre esempi eterogenei.

Esempio 1: H.M. e il mirror drawing

Brenda Milner, 1962. H.M. è seduto a un tavolo con un foglio davanti. Sul foglio una stella a cinque punte, ma deve tracciarne il contorno guardando non la mano ma il riflesso in uno specchio. La mano va a sinistra, lo specchio mostra a destra: cervello e occhi devono ricalibrarsi. Compito difficile per chiunque. H.M. ci prova: il primo giorno, fa una decina di errori (sbordature, scorrette inversioni, tempi lunghi). Secondo giorno: chiama lui Milner per la prima volta in vita sua (no, scherziamo — non la riconosce, è la prima volta ogni giorno). Le si presenta. Le chiede cosa devono fare. Milner ripropone il compito. H.M. dice di non averlo mai fatto. Ma nel farlo, sbaglia meno. Terzo, quarto, quinto, decimo giorno: H.M. nega ogni volta di aver mai fatto il compito; il numero di errori scende dal decino fino a zero. Diventa abile a tracciare la stella riflessa.

Cosa è successo. La memoria dichiarativa (sapere che ho fatto questo compito ieri): bloccata dalla lesione MTL. La memoria procedurale (sapere come coordinare mano e specchio): conservata, dipende dai gangli base e dal cervelletto, intatti. La distinzione non è teorica: è H.M. seduto a un tavolo che migliora un’abilità senza ricordare di averla mai praticata.

L’esempio insegna due cose. Una psicologica: ci sono almeno due sistemi di memoria, dissociabili. Una fenomenologica: avere un’abilità non implica ricordare di averla acquisita; sapere come e sapere che camminano in modo indipendente.

Esempio 2: Bliss e Lømo, il coniglio che impara nelle sinapsi

Oslo, fine anni 60. Lømo nel laboratorio di Per Andersen. Coniglio anestetizzato, immobilizzato, cranio aperto, ippocampo esposto. Stereotassi millimetrica. Elettrodo stimolante posizionato nel perforant path (le fibre che dalla corteccia entorinale arrivano al giro dentato). Elettrodo registrante nel giro dentato, sui neuroni granulari.

Stimolo test: un singolo impulso elettrico al perforante. Risposta: un EPSP (deflessione del potenziale di campo) di ampiezza X. Ripeti ogni 30 secondi per stabilire baseline: X è stabile.

Stimolo tetanico: 100 impulsi al secondo per 1 secondo. Pausa. Stimolo test ripetuto: ampiezza ora 2X. Pausa di 10 minuti. Stimolo test: ancora ~2X. Pausa di un’ora. Ancora ~1.8X. Sei ore. Ancora ~1.6X. La sinapsi è cambiata.

Il dato è stato replicato migliaia di volte da migliaia di laboratori, in fettine di ippocampo ex vivo, in animali in vivo, in colture neurali, con stimolazioni elettriche e farmacologiche. La LTP ha proprietà ben caratterizzate: specificità di input (solo le sinapsi tetanizzate cambiano, non quelle vicine non stimolate), cooperatività (treni più forti producono LTP più ampia), associatività (coincidence di pre e post — base meccanicistica del principio di Hebb), persistenza (ore-giorni in vitro, settimane in vivo, possibilmente anni nei mammiferi).

L’esempio insegna: la memoria a lungo termine ha un substrato cellulare identificato. Non è un’astrazione psicologica. Si misura in millivolt, sintesi proteica, spine dendritiche. Quando il problema è “come fa il sistema a trattenere informazione oltre l’attività transitoria?”, la risposta canonica è “rinforzando sinapsi specifiche in modo persistente”. La meccanica è LTP (e LTD per il duale).

Esempio 3: il DRM in tempo reale

Prendi un foglio. Scrivi questa lista, una parola al secondo, leggendola ad alta voce a un amico:

letto, riposo, sveglio, stanco, sogno, svegliarsi, sonnellino, coperta, dormiente, russare, pisolino, pace, sbadiglio, assonnato, materasso

Aspetta 30 secondi facendo distrarre l’amico (chiedigli di contare alla rovescia da 100 di 7 in 7). Poi: “scrivi tutte le parole che ricordi della lista, in qualsiasi ordine”.

Risultato statisticamente prevedibile: nel ~70% dei casi l’amico scriverà dormire — parola che NON era nella lista. Confidenza alta: dirà “sì, l’ho sentita”. Se gli mostri la lista originale, sarà sorpreso.

Quello che è successo. La lista era costruita perché ogni parola attiva, per via di spreading activation in memoria semantica (Allan Collins e Ross Quillian 1969, “Retrieval time from semantic memory”, JVLVB; Allan Collins e Elizabeth Loftus 1975, “A spreading-activation theory of semantic processing”, Psychological Review), il concetto centrale dormire. Ogni parola della lista contribuisce un po’ di attivazione al nodo dormire. Al recall, dormire è altamente attivato, e il sistema lo riporta come “ricordato” indistinguibilmente da una parola vera. La sensazione fenomenica di “averlo sentito” è generata dalla familiarità di alta attivazione semantica, non dal recupero di una traccia di encoding.

Il DRM è una falsa memoria pulita, riproducibile, generabile in 90 secondi. Il messaggio: la memoria non distingue affidabilmente, in molti casi, fra tracce reali e tracce plausibili. Il sistema costruisce ricordi a partire dal contesto semantico, e molti dei tuoi ricordi quotidiani sono in parte costruiti così. Confidenza soggettiva ≠ accuratezza.

Eredità oggi: cosa c’è (e cosa non c’è) nei sistemi AI moderni

[DATATO 2026-04] Questa sezione mappa il rapporto fra LTM umana e sistemi AI dello stato dell’arte 2026. I dettagli ingegneristici cambieranno; il punto strutturale — dove l’analogia regge e dove crolla — è più stabile.

Per ognuno dei sistemi LTM umani esiste un componente AI che funzionalmente assomiglia. Per nessuno l’analogia è equivalenza. Vediamo uno per uno, marcando con cura dove è analogia, dove è filiazione, dove rischia di scivolare in equivalenza.

Pesi (parameters) di un LLM ↔ memoria semantica + procedurale (analogia didattica)

I pesi di un transformer dopo pretraining contengono, in qualche senso operazionale, “conoscenza compressa” del corpus di training. Fatti del mondo (Roma capitale d’Italia), pattern linguistici (sintassi italiana), abilità procedurali emergenti (eseguire chain-of-thought, completare codice, tradurre). Funzionalmente l’unione di questi assomiglia all’unione di memoria semantica + procedurale umana.

Caveat strutturali — lista delle differenze:

I pesi non distinguono fra “conoscenza certa” e “associazione frequente”. Un fatto raro nel corpus può essere rappresentato debolmente, un’associazione spuria forte può essere rappresentata fortemente.
I pesi non hanno episodica autonoetic. Non c’è “rivivere” un evento di training.
Aggiornamento via gradient descent ≠ consolidamento neurale. Il primo è ottimizzazione sull’errore di predizione; il secondo è una cascata molecolare in sinapsi specifiche.
Il catastrophic forgetting (di cui sotto) mostra che aggiornare i pesi su dominio nuovo cancella il vecchio in modo violento. Il cervello, in condizioni normali, non lo fa nello stesso modo.

Affermazione analogia: i pesi sono una memoria semantica/procedurale debole compressa. Affermazione equivalenza da evitare: “i pesi sono la LTM dell’LLM”. No: assomigliano, didatticamente, ma il meccanismo è diverso e le proprietà differiscono in modi significativi.

RAG (retrieval-augmented generation) ↔ memoria episodica esterna (analogia debole)

Pattern RAG: vector store di documenti, embedding della query, retrieval dei top-k documenti per cosine similarity, contesto al modello, generazione. Funzionalmente: “memoria esterna interrogabile”, che permette al modello di “ricordare” documenti.

Caveat strutturali:

La memoria episodica umana ha indicizzazione spazio-temporale autobiografica. Sai quando è successo, dove eri, con chi. RAG non ha questa struttura nativa: puoi aggiungere metadata temporali, ma è bolt-on, non inerente.
Il recall episodico è autonoetic: rivivi l’evento in prima persona. RAG restituisce documenti come testo, senza prospettiva.
Embedding similarity è similarità semantica in uno spazio appreso. Associative recall umano è multi-modale (immagini, suoni, odori, emozioni associati), contestuale, emotivamente colorato. Non è la stessa cosa, anche se in casi semplici si avvicina.
RAG non ha consolidation: i documenti sono o nello store o no. La episodica umana ha gradienti di consolidamento e una transizione episodico→semantico nel tempo.

Affermazione analogia: RAG è una memoria esterna interrogabile, funzionalmente simile alla nozione folk di “ricordare un documento”. Affermazione equivalenza da evitare: “RAG è la memoria episodica del sistema”. No: è retrieval semantico su documenti.

Fine-tuning ↔ consolidamento (analogia molto debole)

Fine-tuning: aggiornamento dei pesi su un nuovo dataset, tipicamente più piccolo del pretraining, focalizzato. Sleep consolidation: replay ippocampale rinforza pattern corticali, integra nuove tracce con la base di conoscenza esistente. Entrambi “spostano informazione”. Differenze:

Fine-tuning richiede dati esterni e una loss; consolidation è interno e auto-generato.
Fine-tuning aggiorna pesi globali con SGD su batch; consolidation è locale (sinapsi specifiche) e asincrono (durante sonno NREM).
Fine-tuning produce catastrophic forgetting se non controllato; consolidation produce interferenza graduale.

Affermazione analogia: fine-tuning sposta informazione da un set di esempi a parametri stabili, come consolidamento sposta da ippocampo a corteccia. Affermazione equivalenza da evitare: “fine-tuning è il consolidamento del modello”. No: è ottimizzazione vincolata su una loss; il meccanismo non c’entra con CREB e sintesi proteica.

Catastrophic forgetting (McCloskey-Cohen 1989) e EWC (Kirkpatrick et al. 2017)

Michael McCloskey e Neal Cohen, 1989, “Catastrophic interference in connectionist networks: The sequential learning problem”, Psychology of Learning and Motivation 24:109-165. Reti neurali tradizionali: addestrate su task A, poi su task B, perdono performance su A in modo violento. Fenomeno opposto al cervello umano (almeno non così violento): tu impari il francese a 30 anni e il tuo italiano non collassa.

James Kirkpatrick e collaboratori (DeepMind), 2017, “Overcoming catastrophic forgetting in neural networks”, PNAS 114(13):3521-3526. Soluzione proposta: Elastic Weight Consolidation (EWC). Stimano l’importanza di ogni peso per il task A (via diagonal della Fisher information matrix), aggiungono al training su B una penalty quadratica che scoraggia spostare i pesi importanti per A. Risultato: task B imparato con minore degradazione su A.

Il nome Elastic Weight Consolidation rivela un’ispirazione dichiarata: alcune sinapsi nel cervello “si stabilizzano” tramite consolidamento e diventano più resistenti al cambio (Yang, Pan, Gan 2009 hanno mostrato spine dendritiche che persistono per anni). EWC implementa un’analogia funzionale: stabilizza i pesi importanti, lascia plastici i meno importanti.

Caveat:

EWC è analogia funzionale, non filiazione meccanicistica. La penalty quadratica su Fisher info non è una cascata molecolare. È matematica di ottimizzazione vincolata.
Il catastrophic forgetting nelle reti è un problema dell’algoritmo di ottimizzazione (gradient descent globale su tutti i pesi); l’oblio umano è un fenomeno funzionale con ruoli adattivi (vedi oblio-funzioni, in preparazione). Sono analoghi funzionali a livelli diversi: uno è bug, l’altra è feature.

Equivalenza da evitare: “il cervello fa EWC”. No. EWC è ispirato a un fenomeno biologico, ma è una specifica soluzione algoritmica che il cervello non implementa.

Memory layers per agenti: MemGPT, Letta, Zep, CoALA

Charles Packer e collaboratori 2023 (UC Berkeley), MemGPT: un wrapper attorno a un LLM che gestisce una memoria persistente esplicita — riassunti progressivi della chat history, recall via tool, paginazione del contesto. Letta e Zep estendono pattern simili.

CoALA (Theodore Sumers, Shunyu Yao, Karthik Narasimhan, Tom Griffiths, Princeton; 2024 TMLR, “Cognitive Architectures for Language Agents”) propone una mappatura ispirata alla psicologia cognitiva:

working memory ↔ context window
episodic memory ↔ event store / chat history
semantic memory ↔ vector store
procedural memory ↔ skill registry / tool catalog

Status: è una mappatura ispirativa, didatticamente utile per pensare il design di un agente. NON è un’equivalenza che giustifichi affermare “il sistema ha memoria episodica” nel senso pieno (autonoetic, indicizzata spazio-temporalmente, ricostruttiva, soggetta a reconsolidation). È un framing per organizzare componenti ingegneristici, non una implementazione dei sistemi cognitivi.

Errori da evitare — lista compatta

“I pesi di un LLM sono la sua LTM”. Analogia accettabile, equivalenza no. I pesi non distinguono semantic da procedural in modo nativo, non ammettono retrieval cosciente, non sono updateable selettivamente come una traccia umana.
“RAG è memoria episodica”. No. RAG è retrieval semantico su documenti. Manca indicizzazione autobiografica, autonoetic, consolidation.
“Fine-tuning è come il consolidamento del sonno”. No. È ottimizzazione su loss, non replay ippocampale + integrazione corticale.
“Embedding similarity è associative recall”. No. È cosine similarity in uno spazio appreso; recall associativo umano è multi-modale, contestualizzato, emotivamente colorato.
“Catastrophic forgetting nelle ANN equivale all’oblio umano”. Analogo funzionale, meccanismi e funzioni diverse. L’oblio umano è in parte una feature adattiva.

In tutti i cinque casi: l’analogia è didatticamente utile, l’equivalenza è errore. Distinguere è il lavoro che questo capitolo chiede.

Dove si rompe: cliché e raffinamenti

“Il cervello come hard disk”. Metafora popolare e fuorviante. La memoria non è scritta su un supporto separato dal computo: è il computo (pattern di attivazione, pesi sinaptici). Non c’è una “lettura” senza modifica (reconsolidation). Non c’è una “scrittura” passiva: l’encoding richiede attenzione attiva e elaborazione. La metafora regge solo a livello di “cose si conservano”, che è quasi vuota.

“Memoria fotografica”. False per quasi tutti. Anche le flashbulb memories si distorcono. I rari casi documentati di memoria autobiografica eccezionale (HSAM, Highly Superior Autobiographical Memory; Jill Price 2006, sotto pseudonimo AJ) coinvolgono un fenotipo specifico che ricorda date e fatti autobiografici con precisione fuori scala — ma non vedono colori più vividi né dettagli pixel-perfect. La metafora “fotografica” applicata alla memoria normale è marketing. Cf. anche Shereshevsky: ipermnesia con costi.

“Retrieval = lettura di un file”. No. È ricostruzione attiva, e — Nader 2000 — modifica la traccia. Ogni recall è potenzialmente una ri-scrittura. Spiega perché i ricordi raccontati molte volte sono stabili nella forma narrata ma scollegati dall’evento originale; spiega l’effetto enorme dell’interrogatorio suggestivo.

“Episodica e semantica sono sistemi separati.” Affermazione di Tulving forte, contestata. Squire vede un continuum gerarchico, con la episodica come precursore evolutivo e ontogenetico della semantica. La distinzione è chiara nei casi clinici estremi (K.C.) ma sfumata nei normali. Probabilmente è meno utile parlare di due magazzini e più utile parlare di due modalità di richiamo della stessa traccia (autonoetic vs noetic), con bias statistico per certi tipi di contenuti verso una modalità.

“Il consolidamento si esaurisce in poche ore.” Vecchia formulazione. Squire-Alvarez parlano di settimane-anni. Multiple Trace Theory di Nadel-Moscovitch parla di processo senza fine per la episodica. Il consolidamento non è un evento; è un processo continuo modulato da retrieval, sonno, integrazione semantica.

Equivalenze AI pericolose (sopra). Ripetiamo: pesi ≠ LTM, RAG ≠ episodica, fine-tuning ≠ consolidamento, embedding similarity ≠ associative recall, catastrophic forgetting ≠ oblio umano. Tutte analogie didattiche utili, mai equivalenze meccaniche. La differenza fra le due posizioni non è verbale — porta a aspettative diverse sui sistemi, a errori di design, a affermazioni divulgative gonfiate.

Engrammi e ottimismo riduzionista. Tonegawa 2012 è risultato meraviglioso, ma non risolve la memoria umana. Riguarda paura amigdala-ippocampo-dipendente in roditori, in laboratorio, con stimolazione optogenetica di centinaia di cellule. La episodica umana ricca, multimodale, autobiografica, è ordini di grandezza più complessa. Non c’è un cavo che scollega da qui all’engramma “io sotto l’ombrellone in agosto 1995”; l’estensione è inferenziale e parziale. Il principio è solido (la traccia è in cellule); l’estensione no.

Collegamenti

cervello-basi: substrato neurale, ippocampo come struttura, plasticità sinaptica e LTP a livello cellulare.
cervello-vs-rete-neurale: per la categoria delle “analogie ingannevoli”. Pesi di LLM ↔ LTM è un caso da maneggiare con le pinze descritte qui.
architetture-cognitive: SOAR, ACT-R hanno LTM dichiarativa e procedurale come moduli distinti. Common Model 2017 mantiene la divisione.
memoria-sensoriale: primo stadio del pipeline classico Atkinson-Shiffrin.
memoria-working: immediato precedente. WM e LTM interagiscono in encoding (rehearsal elaborativo) e retrieval (focus dell’attenzione su tracce LTM).
memoria-dichiarativa-procedurale (in preparazione): approfondisce la grande dicotomia, con focus su procedurale.
memoria-episodica-semantica (in preparazione): approfondisce dentro la dichiarativa.
consolidamento-memoria (in preparazione): sonno e replay in dettaglio.
oblio-funzioni (in preparazione): l’oblio come feature adattiva.
ponte-memoria-agenti (in preparazione): mappatura completa fra cognitive components e componenti agentici.
attenzione-psicologia (in preparazione): l’attenzione modula l’encoding (selezione di cosa entra nella LTM).
rag-base, long-term-memory, memory-architetture (in preparazione, Parte XIV).
lora-peft, continual-pretraining (in preparazione, Parte XI): tecniche di aggiornamento dei pesi che sollevano problemi di catastrophic forgetting.
memoria-agentica (in preparazione, Parte XVI): tassonomia delle memorie per agenti LLM.

Funzione adattiva: perché un sistema multi-magazzino

Una domanda biologica. Perché evolvere quattro-cinque sistemi distinti invece di uno solo? Tre risposte funzionali coerenti con la divergenza anatomica osservata.

Diversi tempi di apprendimento. Il procedurale richiede ripetizione lenta (decine-centinaia di trial per acquisire un’abilità motoria stabile); il dichiarativo episodico può formarsi in un single trial (l’evento è memorizzato dopo una sola esposizione). Un sistema unico dovrebbe scegliere un compromesso. Sistemi separati ottimizzano ciascuno per la propria dinamica: ippocampo fast learning per episodi unici; corteccia + gangli base slow learning per regolarità statistiche. Il modello complementary learning systems (McClelland, McNaughton, O’Reilly 1995, Psychological Review, “Why there are complementary learning systems in the hippocampus and neocortex”) formalizza questa logica e propone che il replay durante il sonno sia il modo in cui il sistema fast trasferisce informazione al sistema slow senza catastrophic interference. Nota: è uno dei rari casi in cui un’osservazione neuroscientifica ha direttamente ispirato architetture di machine learning — sistemi a memoria duale e replay buffer.

Resistenza a danni focali. Sistemi distribuiti su substrati anatomici diversi sono più robusti di un sistema unico: H.M. perde dichiarativa ma cammina, parla, mangia perché procedurale e linguaggio già consolidato sono altrove. Ridondanza distributiva = robustezza.

Diversi formati per diversi contenuti. Ricordare “come si nuota” (procedurale, opaco al verbale) richiede struttura diversa da “ho nuotato ieri al mare” (episodica, indicizzata spazio-temporalmente) e da “il mare è salato” (semantica, dichiarativa fattuale). Imporre un singolo formato sarebbe come usare il formato JSON per archiviare video: tecnicamente possibile, biologicamente assurdo.

Una sintesi in cinque punti

La LTM non è un magazzino unico. Sistemi distinguibili — dichiarativa (episodica, semantica) vs non dichiarativa (procedurale, priming, conditioning, non-associative) — clinicamente, anatomicamente, fenomenologicamente. Il caso H.M. (Scoville-Milner 1957) è la prova fondante.
Encoding, storage, retrieval sono fasi attive. Levels of processing, encoding specificity, generation effect, testing effect, spacing effect governano l’encoding. Standard consolidation theory e Multiple Trace Theory descrivono lo storage. Reconsolidation (Nader 2000) mostra che il retrieval modifica la traccia.
La base cellulare è la plasticità sinaptica. Long-Term Potentiation (Bliss-Lømo 1973), NMDA come coincidence detector, cascata Ca²⁺-CaMKII-CREB-sintesi proteica, engramma come pattern di sinapsi rinforzate. Tonegawa 2012 lo dimostra causalmente in roditori.
La memoria è ricostruttiva, non riproduttiva. Bartlett 1932, Loftus-Palmer 1974 (misinformation), Roediger-McDermott 1995 (DRM), Brown-Kulik 1977 (flashbulb memories distorte). Confidenza ≠ accuratezza.
Nessun analogo equivalente in AI. Pesi LLM, RAG, fine-tuning, EWC, memory layers per agenti sono analogie didattiche utili. Equivalenze meccaniche no. Confonderle porta a fraintendere sia la cognizione sia l’ingegneria.

Per andare oltre

Scoville, W. B., & Milner, B. (1957), “Loss of recent memory after bilateral hippocampal lesions”, Journal of Neurology, Neurosurgery, and Psychiatry 20(1):11-21. Paper fondante del caso H.M.
Tulving, E. (1972), “Episodic and semantic memory”, in Organization of Memory, Academic Press. Manifesto della distinzione canonica.
Squire, L. R., & Knowlton, B. J. (1995), “Memory, hippocampus, and brain systems”, in The Cognitive Neurosciences, MIT Press. La tassonomia consensuale.
Bliss, T. V. P., & Lømo, T. (1973), “Long-lasting potentiation of synaptic transmission in the dentate area of the anaesthetized rabbit following stimulation of the perforant path”, J. Physiol. 232:331-356. La scoperta di LTP.
Liu, X. et al. (2012), “Optogenetic stimulation of a hippocampal engram activates fear memory recall”, Nature 484:381-385. Engramma optogenetico.
Nader, K., Schafe, G. E., & LeDoux, J. E. (2000), “Fear memories require protein synthesis in the amygdala for reconsolidation after retrieval”, Nature 406:722-726. Reconsolidation.
Diekelmann, S., & Born, J. (2010), “The memory function of sleep”, Nature Reviews Neuroscience 11:114-126. Review autoritativa sul consolidamento durante il sonno.
Corkin, S. (2013), Permanent Present Tense: The Unforgettable Life of the Amnesic Patient, H.M., Basic Books. Biografia scientifica di H.M., divulgativa ma rigorosa.
Luria, A. R. (1968), The Mind of a Mnemonist: A Little Book About a Vast Memory, Harvard University Press. Il caso Shereshevsky, l’anti-H.M.
Kandel, E. R. (2001), “The molecular biology of memory storage: A dialogue between genes and synapses”, Science 294:1030-1038. Nobel lecture, sintesi della meccanica molecolare in Aplysia e mammiferi.
Kirkpatrick, J. et al. (2017), “Overcoming catastrophic forgetting in neural networks”, PNAS 114(13):3521-3526. EWC, ispirazione bio-funzionale per continual learning.
Sumers, T., Yao, S., Narasimhan, K., Griffiths, T. (2024), “Cognitive Architectures for Language Agents” (CoALA), Transactions on Machine Learning Research. Mappatura cognitive ↔ agenti.
McClelland, J. L., McNaughton, B. L., O’Reilly, R. C. (1995), “Why there are complementary learning systems in the hippocampus and neocortex: Insights from the successes and failures of connectionist models of learning and memory”, Psychological Review 102:419-457. Modello complementary learning systems: una delle poche teorie neuro-cognitive che ha direttamente influenzato il design di sistemi AI con memoria duale e replay.
Bartlett, F. C. (1932), Remembering, Cambridge University Press. Memoria come ricostruzione attiva, schemi culturali, “War of the Ghosts”. Ignorato per decenni, fondazionale dopo la rivoluzione cognitiva.
Roediger, H. L., & McDermott, K. B. (1995), “Creating false memories”, J. Exp. Psychol. LMC 21:803-814. Il paradigma DRM in laboratorio.
Loftus, E. F. (1979), Eyewitness Testimony, Harvard University Press. Sintesi del lavoro sul misinformation effect e implicazioni forensi.
Wearing, D. (2005), Forever Today: A Memoir of Love and Amnesia, Doubleday. Caso Clive Wearing raccontato dalla moglie. Letteratura di prima mano che integra la documentazione clinica con l’esperienza vissuta.
Collins, A. M., & Loftus, E. F. (1975), “A spreading-activation theory of semantic processing”, Psychological Review 82(6):407-428. Modello a rete con attivazione diffusa. Antesignano concettuale dei modelli distribuzionali in NLP moderna.
Schacter, D. L. (1996), Searching for Memory: The Brain, the Mind, and the Past, Basic Books. Sintesi divulgativa di alta qualità sui sistemi multipli di memoria; capitoli su false memories e sui legami fra memoria e identità personale.