Salta ai contenuti

La corteccia: strati, colonne, aree

Un mucchio di neuroni plastici non è ancora una mente. La neocorteccia è il foglio di tessuto su cui poggiano percezione, movimento, linguaggio e ragionamento — e la sua organizzazione non è casuale: sei strati, una connettività verticale ricorrente, una mappa di aree specializzate. Questo capitolo descrive quell’architettura, distingue ciò che di essa è stabilito da ciò che è ancora in discussione, e ripercorre con cura la filiazione storica — reale ma spesso esagerata — che lega la gerarchia visiva del cervello alle reti convoluzionali.

Nel 1909 un neurologo tedesco, Korbinian Brodmann, pubblica un atlante della corteccia umana. Non contiene esperimenti, non misura il comportamento, non registra alcun segnale: contiene cinquantadue tavole di tessuto colorato, viste al microscopio, divise in zone numerate da 1 a 52. Brodmann sostiene che quelle zone — distinguibili solo per come i corpi cellulari si addensano e si stratificano — sono regioni funzionalmente diverse del cervello. Nel 1909 è una scommessa. Un secolo dopo, l’area 17 di Brodmann è ancora il nome con cui si chiama la corteccia visiva primaria, e l’area 4 la corteccia motoria primaria. La citoarchitettura — la disposizione delle cellule — aveva predetto la funzione prima che qualcuno potesse misurarla.

Questo capitolo è il quinto della Parte III. I quattro precedenti hanno costruito il cervello dal basso. Neuroni, sinapsi, plasticità ha presentato il cervello in scala. Il potenziale d’azione ha seguito il segnale elettrico lungo un neurone. La sinapsi ha descritto come due neuroni si parlano attraverso un vuoto. La plasticità hebbiana ha mostrato come una sinapsi cambia forza con l’esperienza. Tutto quel quadro, però, riguardava componenti. Qui si passa all’architettura: come quei componenti sono disposti, e cosa di quella disposizione conta.

C’è una domanda che i capitoli precedenti non sanno ancora risolvere. Supponiamo di avere ottantasei miliardi di neuroni, ciascuno capace di generare potenziali d’azione, collegati da sinapsi plastiche. È una mente? No. È, al più, una poltiglia di componenti corretti. Un mucchio di transistor non è un processore: il processore è il layout. Allo stesso modo, la cognizione non sta nel singolo neurone ma nel modo in cui i neuroni sono organizzati — in strati, in moduli ripetuti, in aree con compiti distinti collegate da fasci precisi.

La neocorteccia è dove quell’organizzazione si vede meglio. È un foglio di tessuto sottile — circa due-quattro millimetri di spessore — esteso, nell’uomo, su una superficie di circa duemilacinquecento centimetri quadrati, ripiegato in solchi e circonvoluzioni per stare dentro il cranio. Su questo foglio poggiano la percezione, il movimento volontario, il linguaggio, il ragionamento astratto. È il candidato più naturale per la domanda “dove sta l’intelligenza umana, fisicamente”.

Capire l’architettura corticale serve per tre ragioni che attraversano questa wiki. La prima: è il livello a cui ha senso confrontare cervello e modelli artificiali. Il singolo neurone biologico e il singolo neurone artificiale si assomigliano poco, e un capitolo dedicato lo argomenta in dettaglio; ma a livello di architettura — strati, gerarchia, feature crescenti in astrazione — emerge una somiglianza più interessante, e anche una filiazione storica reale. La seconda: la nozione di “strato” del deep learning e quella di “strato corticale” hanno una storia intrecciata che vale la pena districare, perché la confusione tra le due è frequente. La terza: la corteccia è un caso esemplare di come, in scienza, una buona idea organizzatrice — la “colonna” come unità di calcolo — possa diventare popolare ben oltre l’evidenza che la sostiene. Distinguere ciò che è stabilito da ciò che è modello è metà del mestiere.

La storia dell’architettura corticale comincia da un problema tecnico, ed è bene partire da lì perché spiega molte delle scelte successive. Il tessuto nervoso, al microscopio, è quasi trasparente e impenetrabilmente intricato. Per vederlo serve colorarlo. Tre tecniche, sviluppate tra fine Ottocento e inizio Novecento, hanno aperto tre finestre diverse. La colorazione di Nissl tinge i corpi cellulari: rivela quanto fitti sono i neuroni e come si dispongono in bande, ed è la base della citoarchitettura, lo studio dell’architettura corticale a partire dalla disposizione dei corpi cellulari. La colorazione di Golgi — quella con cui Santiago Ramón y Cajal disegnò il sistema nervoso, raccontata in Neuroni, sinapsi, plasticità — tinge per intero una piccola frazione casuale di neuroni, mostrandone la forma completa. La colorazione per la mielina rivela invece i fasci di assoni: è la base della mieloarchitettura.

Vale la pena soffermarsi un istante sulla colorazione di Golgi, perché è un caso istruttivo. È una tecnica capricciosa: per ragioni mai del tutto chiarite, colora in nero, e per intero, solo una piccola frazione casuale dei neuroni — l’uno-due per cento — lasciando trasparenti tutti gli altri. Questo che sembra un difetto è in realtà ciò che la rende utile: se colorasse tutti i neuroni, il risultato sarebbe una macchia nera impenetrabile, perché il tessuto è troppo fitto. Colorandone pochi, isola le singole cellule e ne mostra la forma completa, dendriti e assone. Fu con il Golgi che Cajal poté disegnare i neuroni uno per uno e fondare la dottrina del neurone. La citoarchitettura di Brodmann, invece, si fonda sul Nissl, che colora tutti i corpi cellulari ma non i prolungamenti: perfetto per vedere le bande di densità, inutile per vedere la forma di una cellula. Due tecniche, due domande, due immagini complementari della stessa corteccia.

Con queste tecniche, tra il 1900 e il 1910, diversi anatomisti — Brodmann in Germania, ma anche Constantin von Economo a Vienna, e altri — fanno la stessa scoperta indipendente: la corteccia non è uniforme. Cambia aspetto da regione a regione, e cambia in modo abbastanza netto da poterci tracciare confini. Da questa constatazione nasce un programma di ricerca: parcellare la corteccia in aree e ipotizzare che ogni area faccia qualcosa di diverso.

Le date che contano in questo capitolo si dispongono lungo poco più di un secolo, e attraversano tre discipline che raramente si parlavano — anatomia, neurofisiologia, informatica. È utile averle in fila prima di entrare nei dettagli, perché il capitolo non segue l’ordine cronologico ma quello concettuale, e una linea del tempo fa da bussola.

1909 — Korbinian Brodmann pubblica Vergleichende Lokalisationslehre der Großhirnrinde (“Anatomia comparata della localizzazione nella corteccia cerebrale”), la mappa in circa quarantasette aree citoarchitettoniche.

Anni ‘30-‘50 — il neurochirurgo canadese Wilder Penfield, operando pazienti epilettici svegli, stimola elettricamente la corteccia e mappa le rappresentazioni sensoriali e motorie del corpo: nascono gli homunculus.

1957 — Vernon Mountcastle, registrando dalla corteccia somatosensoriale del gatto, propone l’organizzazione in colonne verticali.

Anni ‘60 — David Hubel e Torsten Wiesel scoprono nella corteccia visiva le cellule semplici e complesse e le colonne di orientamento e dominanza oculare. Riceveranno il Nobel nel 1981.

1980 — Kunihiko Fukushima, ispirandosi esplicitamente a Hubel e Wiesel, pubblica il Neocognitron.

1989 — Rodney Douglas e Kevan Martin, con David Whitteridge, propongono il microcircuito canonico della neocorteccia. Lo stesso anno, Yann LeCun e colleghi applicano la backpropagation a una rete convoluzionale.

1991 — Daniel Felleman e David Van Essen pubblicano la gerarchia corticale del sistema visivo del macaco.

2005 — Jonathan Horton e Daniel Adams pubblicano una rassegna scettica dal titolo programmatico: “The cortical column: a structure without a function”.

2016 — Matthew Glasser e colleghi pubblicano la parcellazione multimodale della corteccia umana in 180 aree per emisfero.

Da qui il capitolo procede così: prima la citoarchitettura, i sei strati e i tipi cellulari; poi le colonne e il loro lungo dibattito; poi le aree, da Brodmann a Glasser; poi la connettività e la gerarchia corticale; poi il microcircuito canonico; infine, con cura, il confronto con le reti convoluzionali e i limiti dell’intero quadro.

Il prefisso “neo” non è decorativo. La neocorteccia a sei strati è una struttura comparsa con i mammiferi; gli altri vertebrati hanno cortecce più semplici, e l’allocortex a tre strati — l’ippocampo, la corteccia olfattiva — è il residuo, anche nel cervello umano, di un piano più antico. La neocorteccia è la grande novità architettonica del cervello dei mammiferi, e nei primati, e in modo estremo nell’uomo, è esplosa in superficie: il ripiegamento in solchi e circonvoluzioni è il modo di far stare un foglio sempre più ampio in un cranio di volume limitato.

Su questa storia evolutiva poggia una tesi che attraversa tutto il capitolo, e che conviene rendere esplicita. L’idea — sostenuta in forme diverse da Mountcastle e dal neuroscienziato Pasko Rakic — è che la neocorteccia, in tutta la sua estensione e attraverso le specie di mammiferi, sia costruita su un piano largamente uniforme: gli stessi sei strati, gli stessi tipi cellulari, lo stesso microcircuito di base, ripetuti su un foglio che evolutivamente si è semplicemente allargato. Se la tesi è corretta, ne segue qualcosa di forte: una corteccia visiva e una corteccia frontale differiscono non per il circuito ma per gli input che ricevono e per le connessioni che hanno con il resto del cervello. È una tesi attraente — spiegherebbe come l’evoluzione abbia potuto espandere così tanto la corteccia in così poco tempo, senza reinventare un circuito per ogni nuova funzione — ma va presa con la stessa cautela della “colonna”: è un principio organizzatore con molto a favore e diverse eccezioni note, non un dogma. La differenza tra corteccia granulare e agranulare, da sola, basta a ricordare che l‘“uniformità” è uniformità con variazioni.

Prima dei dettagli, conviene afferrare l’oggetto da due angoli distinti. Sono lo stesso foglio di tessuto visto, rispettivamente, di taglio e dall’alto.

Immagina di tagliare la corteccia perpendicolarmente alla superficie e di guardarne la sezione, come si guarda di taglio una torta a strati o la parete di un edificio. Vedi sei bande orizzontali, una sopra l’altra, distinguibili perché i neuroni vi si addensano in modo diverso: bande dense di cellule piccole alternate a bande di cellule grandi e rade. Questa è la stratificazione laminare: la corteccia è un foglio costruito a piani. Ogni piano ha un ruolo nel flusso dell’informazione — alcuni ricevono input, altri spediscono output verso altre aree, altri verso il midollo spinale. Leggere la corteccia “di taglio” significa leggere chi parla con chi lungo l’asse verticale.

Cambia prospettiva. Distendi idealmente il foglio corticale e guardalo dall’alto, come una carta geografica. Non vedi più strati: vedi un mosaico di territori, ciascuno con un compito. Un territorio riceve il segnale degli occhi, un altro quello delle orecchie, un altro comanda i muscoli della mano, un altro ancora — la maggior parte, nell’uomo — non è legato a un senso o a un muscolo specifico ma integra informazioni di provenienze diverse. Leggere la corteccia “dall’alto” significa leggere la parcellazione: dove finisce un’area e ne comincia un’altra, e cosa fa ciascuna.

Le due letture sono complementari e vanno tenute entrambe. La stratificazione è il piano locale, quasi identico ovunque: un campione di corteccia visiva e uno di corteccia frontale hanno, grossomodo, gli stessi sei strati. La parcellazione è il piano globale: cosa rende quel campione di corteccia visiva diverso da quello frontale. Tra le due c’è una terza struttura, la più discussa del capitolo — l’organizzazione in colonne verticali — che pretende di legare il locale al globale. La affronteremo dopo aver fissato i due livelli che la circondano.

Un avvertimento su entrambe le metafore, perché nessuna delle due regge fino in fondo. La torta a strati suggerisce piani separati da pareti: in realtà i sei strati sono gradienti, e — cosa più importante — sono attraversati da connessioni verticali fittissime, quindi “comunicano” continuamente. La carta geografica suggerisce confini netti come quelli tra due Stati: in realtà tra due aree il passaggio è spesso graduale, e il confine non è una linea ma una fascia di transizione. Le metafore servono per entrare; vanno poi corrette con il dettaglio. Il capitolo lo farà.

La neocorteccia — chiamata anche isocortex, “corteccia uguale”, perché ha ovunque lo stesso piano a sei strati — costituisce circa il novanta per cento del mantello corticale umano. Si distingue dall’allocortex, “corteccia diversa”, filogeneticamente più antica e organizzata su tre strati: ne fanno parte l’archicortex dell’ippocampo (di cui si occuperà il capitolo ippocampo-memoria-spaziale (in preparazione)) e la paleocortex olfattiva. Quando in questo capitolo si dice “corteccia” senza altra qualifica, si intende la neocorteccia.

I sei strati si numerano con numeri romani dall’esterno verso l’interno, dalla superficie (strato I, appena sotto le meningi) verso la sostanza bianca (strato VI). Vanno pensati come gradienti, non come ripiani separati da pareti: i confini sono cambi di densità e di taglia cellulare, a volte netti, a volte sfumati. Ecco i sei, ciascuno con la sua funzione nel flusso del segnale.

Strato I — molecolare. Quasi privo di corpi cellulari: contiene pochissimi neuroni sparsi (le rare cellule di Cajal-Retzius) e per il resto è un feltro di dendriti e assoni. È il piano dove arrivano e si integrano i dendriti apicali — i lunghi prolungamenti che salgono dalle cellule degli strati profondi — e dove termina molto del segnale di feedback. Non è uno strato di ingresso sensoriale: è uno strato di integrazione. Vale la pena fissarlo subito perché è controintuitivo: lo strato più superficiale, quello che verrebbe da immaginare come “la porta”, non riceve quasi nulla di nuovo dal mondo; riceve invece il contesto che le aree più alte rimandano indietro. La porta del nuovo è lo strato IV, in profondità. Superficie e profondità, in corteccia, non corrispondono a “vicino all’input” e “lontano dall’input”.

Strato II — granulare esterno. Cellule piccole e fitte, dette granulari per il loro aspetto a granello: per lo più piccole cellule piramidali e interneuroni. Insieme allo strato III forma gli “strati superficiali”, o sopragranulari.

Strato III — piramidale esterno. Cellule piramidali di taglia piccola e media. È un piano di output cortico-corticale: da qui partono gran parte delle proiezioni verso altre aree corticali, comprese quelle che attraversano il corpo calloso per raggiungere l’emisfero opposto. Lo strato III è anche, come si vedrà nella sezione sulla connettività, l’origine prevalente delle proiezioni feedforward, quelle che salgono la gerarchia: tenere a mente questo aggancio aiuterà più avanti.

Strato IV — granulare interno. Cellule stellate spinose, piccole e fittissime. È la stazione di ingresso della corteccia: qui termina la maggior parte degli assoni che arrivano dal talamo — la grande stazione di smistamento sottocorticale che inoltra alla corteccia i segnali dei sensi. Lo strato IV è spesso e ben sviluppato nelle aree sensoriali; al contrario, è ridotto o quasi assente nelle aree motorie. Su questo asimmetria torneremo: è la differenza tra una corteccia che riceve e una che comanda.

Strato V — piramidale interno. Cellule piramidali medie e grandi. Nella corteccia motoria primaria contiene le cellule di Betz, le piramidali più grandi del cervello, dal corpo cellulare visibile quasi a occhio nudo — furono descritte dall’anatomista ucraino Volodymyr Betz nel 1874, e la loro mole è la firma istologica della corteccia motoria primaria. È il piano dell’output sottocorticale, detto corticofugo (“che fugge dalla corteccia”): da qui partono le proiezioni verso il tronco encefalico, i gangli della base, il collicolo e — via tratto corticospinale — il midollo spinale. Quando la corteccia motoria comanda un muscolo, il comando esce dallo strato V.

Strato VI — multiforme. Neuroni di forme eterogenee (da cui il nome). È il piano della proiezione corticotalamica: da qui parte un segnale di ritorno verso il talamo, un feedback che modula ciò che il talamo stesso inoltrerà alla corteccia.

Insieme, gli strati V e VI formano gli “strati profondi”, o infragranulari. La nomenclatura sopra/infra-granulare prende come riferimento lo strato IV, il “granulare” per eccellenza: sopra ci sono gli strati cortico-corticali, sotto gli strati corticofugo e corticotalamico, e in mezzo l’ingresso. Tenere a mente questo schema — ingresso in IV, output cortico-corticale dai superficiali, output sottocorticale e feedback dai profondi — è la chiave per leggere tutto il resto del capitolo.

C’è un modo compatto di trattenere la divisione del lavoro tra strati, ed è pensare in termini di tre destinazioni dell’informazione. Un segnale che entra in corteccia ha tre possibili uscite, e ciascuna ha il suo strato dedicato: può tornare a un’altra area corticale — e allora esce dagli strati superficiali; può scendere verso il resto del cervello e il corpo — e allora esce dallo strato V; può tornare al talamo da cui era venuto — e allora esce dallo strato VI. Tre uscite, tre strati. Lo strato IV è la porta d’ingresso, lo strato I il piano dove si raccoglie il contesto che arriva dall’alto. Una volta interiorizzata questa mappa — ingresso, elaborazione, tre uscite — la sezione di corteccia smette di essere un’illustrazione da memorizzare e diventa un diagramma di flusso leggibile.

Granulare e agranulare: la forma segue la funzione

Sezione intitolata “Granulare e agranulare: la forma segue la funzione”

Lo spessore relativo dei sei strati non è costante: cambia da area ad area, e il modo in cui cambia è informativo. Le aree sensoriali hanno uno strato IV molto sviluppato — devono ricevere molto input — e si dicono di tipo granulare (in casi estremi, come la corteccia visiva primaria, si parla di “koniocorteccia”, corteccia “a polvere”, tanto le cellule granulari sono fitte). Le aree motorie hanno lo strato IV ridotto fin quasi a scomparire, e in compenso uno strato V ricco di grandi piramidali: si dicono agranulari. La logica è diretta: una corteccia sensoriale ha bisogno di una grande porta d’ingresso, una corteccia motoria di un grande condotto d’uscita.

Tra i due estremi — la koniocorteccia visiva tutta strato IV e la corteccia motoria agranulare tutta strato V — non c’è un salto netto ma un gradiente: le aree associative stanno in mezzo, con strati intermedi. L’anatomista Constantin von Economo, contemporaneo di Brodmann, propose proprio una classificazione della corteccia lungo questo gradiente, da un tipo “granulare” a un tipo “agranulare” passando per tipi intermedi. La lezione è che la varietà citoarchitettonica non è un campionario di forme scorrelate: è una sola dimensione — quanto un’area riceve contro quanto comanda — che si dispiega con continuità sulla superficie corticale. La citoarchitettura non è decorazione anatomica: è la funzione resa visibile al microscopio. È esattamente l’intuizione su cui Brodmann aveva scommesso.

Sotto la varietà degli strati, i neuroni corticali si raggruppano in due grandi classi funzionali.

Le cellule piramidali sono i neuroni di proiezione: l’output della corteccia. Costituiscono circa l’ottanta-ottantacinque per cento dei neuroni corticali. Hanno una forma caratteristica — corpo cellulare a piramide, un lungo dendrite apicale che sale verso la superficie ramificandosi nello strato I, dendriti basali che si diramano localmente — e un assone che lascia la zona: scende verso la sostanza bianca per raggiungere un’altra area corticale, l’emisfero opposto, o un bersaglio sottocorticale. Sono cellule eccitatorie: rilasciano glutammato, il principale neurotrasmettitore eccitatorio del sistema nervoso (vedi La sinapsi). Quando una piramidale scarica, spinge le cellule a valle verso la soglia.

Le piramidali non sono tutte uguali tra loro: una piramidale di strato III, una di strato V che proietta al midollo e una di strato VI che proietta al talamo differiscono per dimensione, per forma del dendrite e soprattutto per destinazione dell’assone. È utile pensare alle cellule piramidali non come a un tipo unico ma come a una famiglia di sottotipi, ciascuno specializzato per un canale di output. Detto questo, le accomuna lo stesso piano costruttivo, ed è quello che conta per il quadro generale.

Vale la pena soffermarsi sul dendrite apicale, perché è una particolarità funzionale, non solo una descrizione di forma. Una cellula piramidale dello strato V ha il corpo in profondità ma il ciuffo apicale lassù nello strato I, dove arriva il feedback dalle aree più alte. La stessa cellula, quindi, “ascolta” su due piani diversi: i dendriti basali raccolgono input locali e feedforward vicino al corpo, il ciuffo apicale raccolge il feedback in superficie. Si è proposto — e resta materia di ricerca attiva, va detto come ipotesi — che la coincidenza tra un input basale e un input apicale possa funzionare da segnale speciale, una sorta di “questo input locale è coerente con ciò che le aree alte si aspettavano”. Comunque sia, il punto strutturale è chiaro: un singolo neurone piramidale è un dispositivo che integra informazione proveniente da strati diversi, e la sua forma allungata è ciò che glielo permette.

Gli interneuroni sono i neuroni locali: il loro assone non lascia la zona, resta a regolare il circuito intorno. Costituiscono il quindici-venti per cento restante. La grande maggioranza è inibitoria: rilascia GABA, il principale neurotrasmettitore inibitorio. Gli interneuroni non sono un dettaglio di rifinitura — sono ciò che impedisce alla corteccia, una rete densamente eccitatoria e ricorrente, di degenerare in una scarica epilettica. Regolano il timing (decidono quando una piramidale può scaricare), il guadagno (quanto forte) e la selettività (quali input passano).

La letteratura recente li classifica in famiglie distinte per la proteina che esprimono e il bersaglio che inibiscono. Gli interneuroni a parvalbumina (PV), fast-spiking, includono le cellule a canestro, che avvolgono il corpo cellulare delle piramidali con una rete di terminali, e le cellule a candeliere, che agiscono in modo ancora più chirurgico sul segmento iniziale dell’assone — proprio il punto in cui il potenziale d’azione nasce: inibire lì significa poter zittire una piramidale con la massima efficacia. Gli interneuroni a somatostatina (SST) bersagliano invece i dendriti delle piramidali, regolando quali input dendritici contano. Gli interneuroni a VIP bersagliano altri interneuroni, soprattutto gli SST: inibire un inibitore produce una disinibizione, cioè un’eccitazione indiretta — un meccanismo con cui un segnale di contesto può “aprire le porte” a un certo circuito. Tre famiglie, tre bersagli, tre ruoli: la corteccia non ha un solo tipo di freno, ne ha un assortimento, ciascuno che agisce su un punto diverso della piramidale. Questa varietà di inibizione strutturata è una delle differenze meno appariscenti, ma più sostanziali, tra un circuito corticale e uno strato di una rete artificiale.

Un caso a parte sono le cellule stellate spinose dello strato IV: sono eccitatorie come le piramidali, ma con assone locale come gli interneuroni. Il loro compito è ricevere l’ingresso talamico e ridistribuirlo dentro la corteccia. Sono la prima tappa corticale di ogni segnale sensoriale.

Una nota sullo sviluppo: perché gli strati esistono

Sezione intitolata “Una nota sullo sviluppo: perché gli strati esistono”

Da dove vengono i sei strati? Non sono incisi nel tessuto da un disegno preordinato: emergono da un processo di sviluppo. Durante la formazione della corteccia, i neuroni nascono in una zona proliferativa profonda — la zona ventricolare — e migrano verso la superficie arrampicandosi lungo le fibre verticali della glia radiale. La migrazione segue un ordine particolare, detto inside-out: i neuroni nati prima si fermano negli strati profondi, quelli nati dopo li sorpassano e si fermano più in superficie. Lo strato VI si forma per primo, lo strato II per ultimo. Una proteina di segnale, la reelina, secreta nello strato I, fa da riferimento di arresto.

Questo dettaglio dello sviluppo conta per due ragioni che riguardano l’intero capitolo. Primo: i sei strati sono omologhi in tutta la neocorteccia perché derivano dallo stesso programma di migrazione — è questa la base materiale del fatto che un campione di corteccia visiva e uno di corteccia frontale abbiano lo stesso piano laminare. Secondo: la minicolonna, di cui si parlerà a breve, è esattamente l’insieme dei neuroni saliti lungo la stessa fibra di glia radiale; nasce come fatto dello sviluppo, non come scelta funzionale. Questa distinzione — struttura dovuta allo sviluppo contro struttura dovuta alla funzione — sarà il cuore del dibattito sulla colonna. Una struttura può essere reale e visibile al microscopio senza per questo essere un’unità di calcolo: può essere semplicemente la traccia lasciata dal modo in cui il tessuto si è costruito. Distinguere “esiste come oggetto anatomico” da “fa qualcosa come unità funzionale” è una delle discipline concettuali che questo capitolo chiede di esercitare.

La meccanica: il viaggio di un segnale attraverso gli strati

Sezione intitolata “La meccanica: il viaggio di un segnale attraverso gli strati”

Prima di salire alle colonne e alle aree, conviene rendere concreto lo schema laminare seguendo un singolo segnale dal suo ingresso alla sua uscita. Prendiamo il caso più studiato: un bordo luminoso che attraversa una piccola porzione del campo visivo, e il pezzetto di corteccia visiva primaria (V1) che gli corrisponde.

Conviene scegliere un esempio concreto perché lo schema laminare, enunciato in astratto, resta una lista di nomi; seguito su un segnale reale, diventa un meccanismo.

Passo 1 — ingresso. Il segnale arriva dalla retina al corpo genicolato laterale del talamo, e da lì gli assoni talamocorticali lo portano alla corteccia. Terminano in maggioranza nello strato IV di V1, sulle cellule stellate spinose. A questo punto il segnale corticale è ancora “grezzo”: riflette grossomodo punti luminosi, non ancora bordi orientati.

Passo 2 — prima trasformazione. Le cellule stellate dello strato IV proiettano agli strati superficiali II/III. È qui — nella combinazione di molti input convergenti — che, secondo il modello di Hubel e Wiesel, nascono le cellule sintonizzate sull’orientamento: una cellula di II/III risponde a un bordo inclinato in un certo modo, perché riceve input da una fila di cellule di IV allineate. La feature è diventata più astratta di un passo.

Passo 3 — amplificazione ricorrente. Qui entra il fatto centrale del microcircuito canonico, e va sottolineato perché contraddice l’immagine ingenua. Il neurone di II/III non riceve la sua attivazione solo dallo strato IV. La riceve, in larga parte, da altri neuroni di II/III vicini: il circuito è ricorrente. L’input di IV è una scintilla; la fiamma è la rete locale che si auto-eccita e, simultaneamente, è tenuta a freno dagli interneuroni inibitori. Il segnale che esce da II/III non è l’input “trasmesso”, è l’input ricostruito e amplificato da una dinamica locale.

Passo 4 — biforcazione dell’output. Gli strati superficiali proiettano in due direzioni. Verso l’esterno: l’output cortico-corticale feedforward parte da II/III e va a colpire lo strato IV dell’area visiva successiva nella gerarchia, dove il ciclo ricomincia con feature ancora più astratte. Verso il basso: II/III proietta agli strati profondi V/VI.

Passo 5 — uscita e ritorno. Lo strato V genera l’output corticofugo verso bersagli sottocorticali (nel caso visivo, per esempio, il collicolo superiore, coinvolto nei movimenti oculari). Lo strato VI genera la proiezione corticotalamica che torna al corpo genicolato laterale: un feedback che modula ciò che il talamo inoltrerà al prossimo ciclo.

Lo schema in forma compatta — IV riceve → II/III trasforma e amplifica → II/III biforca verso l’area successiva e verso V/VI → V esce sottocorticale, VI torna al talamo — è il microcircuito canonico in azione, e lo si ritroverà formalizzato più avanti. Il punto da trattenere: in nessun passo il segnale è semplicemente “passato avanti”. Ogni strato lo trasforma, e il passo 3 mostra che la trasformazione è soprattutto opera della ricorrenza locale, non dell’input.

Conviene anche dare un ordine di grandezza alla convergenza e alla divergenza del segnale, perché numeri concreti rendono il quadro meno astratto. Un singolo neurone corticale riceve, mediamente, dell’ordine di alcune migliaia-decine di migliaia di sinapsi; e a sua volta proietta su un numero comparabile di bersagli. Lungo la via visiva la convergenza ha un effetto misurabile e ben documentato: il campo recettivo — la porzione di mondo a cui una cellula risponde — cresce di area da uno stadio gerarchico al successivo. Una cellula di V1 risponde a un frammento minuscolo del campo visivo; salendo verso le aree del lobo temporale, le cellule rispondono a porzioni via via più ampie, fino ad arrivare a cellule che rispondono a un oggetto o a un volto indipendentemente da dove cade nel campo. Questa progressione — campi recettivi che si allargano e selettività che si astraggono salendo la gerarchia — è uno dei fatti più solidi della neuroscienza visiva, e non a caso è proprio il fatto che le reti convoluzionali, di cui si dirà, riproducono meglio.

Le colonne corticali: una buona idea sotto processo

Sezione intitolata “Le colonne corticali: una buona idea sotto processo”

Fissati gli strati (il piano locale lungo l’asse verticale) e anticipata la parcellazione (il piano globale), resta la struttura intermedia, la più influente e la più contesa: la colonna corticale. L’idea è che la corteccia, oltre a essere stratificata orizzontalmente, sia anche modularizzata verticalmente — divisa in tante piccole unità a forma di colonna, ciascuna che attraversa tutti e sei gli strati e funziona come un mattone elementare di calcolo, ripetuto milioni di volte.

Questa è la sezione in cui il capitolo chiede più attenzione al lettore, perché è quella in cui un’idea elegante e popolare va misurata con l’evidenza che la sostiene — e l’evidenza, qui, è più sottile di quanto la popolarità dell’idea lasci credere. Si procederà per gradi: prima la scoperta da cui l’idea nasce, poi le scale a cui si applica, poi il dibattito su quanto sia davvero un’unità di calcolo, e infine un caso — i barili del roditore — che funziona da pietra di paragone.

L’idea della colonna nasce da un esperimento singolo, ed è raro che un’intera tradizione di pensiero si possa far risalire a un’osservazione così netta.

Nel 1957 Vernon Mountcastle, neurofisiologo statunitense alla Johns Hopkins, fa un esperimento concettualmente semplice. Infila un microelettrodo nella corteccia somatosensoriale di un gatto, perpendicolarmente alla superficie, e lo fa scendere registrando le cellule che incontra. Osservazione: tutte le cellule lungo quella penetrazione verticale rispondono alla stessa modalità — per esempio tutte a un tocco superficiale della pelle, oppure tutte a uno stimolo profondo di un’articolazione — e tutte allo stesso campo recettivo, la stessa porzione di corpo. Sposta l’elettrodo di mezzo millimetro in direzione tangenziale e la proprietà cambia di colpo.

Mountcastle interpreta: la corteccia è organizzata in colonne verticali, ciascuna un’unità funzionale elementare che processa una specifica combinazione di proprietà. Lungo la verticale, omogeneità; lungo l’orizzontale, cambiamento. È un’idea potente, perché promette di ridurre la complessità sterminata della corteccia a un solo mattone ripetuto: capisci una colonna, e hai capito il principio.

Vale la pena notare perché l’idea ebbe tanta presa. Negli anni ‘50 la corteccia appariva come un groviglio di miliardi di cellule senza un piano leggibile. La colonna offriva un’uscita: se la corteccia fosse fatta di tante copie di un’unica unità, allora capirla non significherebbe mappare miliardi di cellule, ma capire una colonna e poi capire come le colonne si dispongono e si parlano. È lo stesso tipo di sollievo concettuale che, in un altro dominio, dà sapere che un cristallo è fatto di una cella elementare ripetuta. La colonna prometteva alla corteccia una “cella elementare”. Questa promessa spiega l’entusiasmo — e spiega anche perché il dibattito su quanto sia vera, che vedremo, abbia tanto peso.

Negli anni ‘60 l’idea riceve una conferma spettacolare dalla corteccia visiva. David Hubel e Torsten Wiesel — di cui La plasticità hebbiana racconta gli esperimenti di deprivazione — trovano nella corteccia visiva primaria due tipi di organizzazione colonnare: le colonne di dominanza oculare, gruppi di cellule che rispondono preferenzialmente all’occhio destro o al sinistro, e le colonne di orientamento, ciascuna sintonizzata su una specifica inclinazione di una barra luminosa. Definiscono ipercolonna un blocco di corteccia che contiene un giro completo di orientamenti più entrambe le dominanze oculari: un’unità che “vede” tutto ciò che si può vedere in una piccola porzione del campo visivo.

La conferma visiva fu spettacolare anche per ragioni di immagine: le colonne di dominanza oculare si possono rendere visibili, con tecniche che marcano la corteccia di un occhio, come una trama di strisce alternate — un disegno regolare, quasi grafico, sulla superficie di V1. Quella trama, riprodotta in innumerevoli libri di testo, ha fatto più di mille argomenti per radicare l’idea che la corteccia sia organizzata in moduli. È bene ricordare, anticipando il dibattito, che proprio quelle strisce così convincenti sono tra le strutture la cui necessità funzionale è stata poi messa in discussione: esistono in alcune specie e non in altre. Una struttura può essere visivamente eclatante e funzionalmente non essenziale.

La parola “colonna” indica, nell’uso, almeno due scale diverse, e confonderle genera equivoci. La minicolonna — un termine che Mountcastle stesso introduce in una riformulazione successiva — è la scala fine: un cordone verticale strettissimo, circa trenta-cinquanta micrometri di diametro, contenente dell’ordine di ottanta-centoventi neuroni. La sua origine è dello sviluppo: durante la formazione della corteccia i neuroni nascono in profondità e migrano verso la superficie lungo le fibre della glia radiale, come arrampicandosi su funi verticali; i neuroni saliti lungo la stessa fune restano allineati, e quell’allineamento è la minicolonna. La colonna funzionale è la scala più grossa — dell’ordine di trecento-seicento micrometri — e raggrupperebbe molte minicolonne con proprietà affini, come la colonna di orientamento di Hubel e Wiesel.

Le cifre complessive sono incerte ma danno l’ordine di grandezza: si stima che la corteccia umana contenga qualcosa come duecento milioni di minicolonne e tra uno e qualche milione di colonne funzionali. Sono stime con barre d’errore larghe — vanno prese come “molte” e “moltissime”, non come misure.

Una sottigliezza terminologica, perché qui la letteratura non è del tutto coerente e un lettore che vada alle fonti se ne accorgerà. “Minicolonna” è il termine più stabile, e indica la struttura anatomica fine legata alla glia radiale. “Colonna” e “ipercolonna” vengono usati in modo più fluttuante da autore ad autore — a volte come sinonimi, a volte con accezioni leggermente diverse. La cosa importante non è memorizzare un glossario rigido, ma tenere ferma la distinzione di scala: c’è una struttura fine, larga decine di micrometri, di origine evidente nello sviluppo; e c’è una struttura più grossa, larga qualche centinaio di micrometri, definita su base funzionale. Quando una fonte dice “colonna”, conviene chiedersi sempre quale delle due scale intende.

Qui serve cautela, ed è uno dei punti in cui questo capitolo distingue ciò che è stabilito da ciò che è modello. La colonna è una struttura anatomica reale, oppure è un’unità funzionale di calcolo? Le due cose non coincidono.

Che ci sia una forte organizzazione verticale della connettività è solido: l’ingresso talamico entra nello strato IV e sale ai superficiali in modo prevalentemente verticale, l’accoppiamento eccitatorio tra strati lungo l’asse radiale è molto più forte di quello tangenziale a parità di distanza. La “colonna di connettività” — l’idea che un neurone parli soprattutto con i neuroni sopra e sotto di sé — è ben sostenuta dai dati.

Che esista una “colonna” come modulo computazionale uniforme e universale, lo stesso mattone ripetuto identico in tutta la corteccia, è molto più dubbio. Nel 2005 Jonathan Horton e Daniel Adams pubblicano sulle Philosophical Transactions of the Royal Society B una rassegna influente dal titolo che è già una tesi: “The cortical column: a structure without a function”. I loro argomenti: le colonne di dominanza oculare esistono in alcune specie di primati e mancano in altre senza che la funzione visiva ne risenta — il che è difficile da spiegare se la colonna fosse l’unità di calcolo necessaria; nessuna proprietà di stimolo è mai stata mostrata rappresentata in modo discreto, a scatti, sulla scala fine della minicolonna; i fasci di dendriti che si vedono al microscopio non coincidono con le colonne funzionali misurate elettrofisiologicamente.

La posizione moderata, oggi prevalente, è una via di mezzo. La colonna come organizzazione di connettività verticale è reale e canonica. La colonna come modulo di calcolo discreto e uniforme è una semplificazione utile per pensare ma che non regge come fatto universale: le proprietà nella corteccia variano spesso in modo continuo, non a moduli netti, e il grado di organizzazione colonnare cambia da area ad area e da specie a specie. La colonna è un’ottima idea organizzatrice — e questo capitolo la usa come tale — non un fatto anatomico al pari dei sei strati.

C’è un caso, però, in cui la colonna è quanto di più vicino a un fatto anatomico netto si conosca, ed è istruttivo proprio perché è l’eccezione. Nella corteccia somatosensoriale del roditore — topo, ratto — la rappresentazione delle vibrisse, i lunghi peli sensoriali del muso, è organizzata in barili (barrels): aggregati di cellule, visibili a occhio nudo dopo opportuna colorazione, in cui ogni barile corrisponde a una singola vibrissa. Toccare una vibrissa attiva un barile preciso; il barile accanto risponde a un’altra vibrissa. Qui la corrispondenza tra una struttura anatomica discreta e una funzione discreta è quasi perfetta, e il “barile” è davvero un modulo. Ma proprio questo caso fa da contrappeso all’entusiasmo: i barili esistono perché le vibrisse sono già discrete — sono peli separati — e la corteccia si limita a mappare una discretezza che le arriva dalla periferia. Là dove lo stimolo è continuo, come l’orientamento di un bordo in V1, la corteccia lo rappresenta in modo continuo, non a moduli. Il barile non dimostra che la corteccia “è fatta di colonne”: dimostra che la corteccia può organizzarsi a moduli quando l’input lo è, e non lo fa quando l’input non lo è.

Torniamo alla lettura dall’alto: il mosaico di territori. La domanda è dove finisce un’area e ne comincia un’altra, e come lo si stabilisce.

Prima di Brodmann: la disputa sulla localizzazione

Sezione intitolata “Prima di Brodmann: la disputa sulla localizzazione”

L’idea che funzioni mentali diverse risiedano in posti diversi della corteccia non era affatto ovvia, e per buona parte dell’Ottocento fu materia di disputa. All’inizio del secolo l’anatomista tedesco Franz Joseph Gall aveva proposto la frenologia: la mente sarebbe un insieme di facoltà distinte, ciascuna con la sua sede corticale, e lo sviluppo di una facoltà si leggerebbe dai rilievi del cranio. La frenologia conteneva un’intuizione corretta — la localizzazione — avvolta in un metodo del tutto privo di valore: la forma del cranio non dice nulla della corteccia sottostante. La reazione fu altrettanto estrema: il fisiologo francese Pierre Flourens, rimuovendo porzioni di corteccia in animali, concluse che la corteccia agisce come un tutto indifferenziato, senza sedi specializzate. La questione si sbloccò nel 1861, quando il medico francese Paul Broca descrisse un paziente che aveva perso la capacità di parlare in seguito a una lesione circoscritta del lobo frontale sinistro: una funzione precisa, persa per una lesione precisa. Era la prima prova solida di localizzazione. La mappa di Brodmann del 1909 arriva quindi in un terreno già preparato: dà alla localizzazione un fondamento anatomico sistematico, sostituendo la pseudoscienza del cranio con la microscopia del tessuto.

La risposta di Brodmann è guardare la citoarchitettura. Dove lo spessore relativo dei sei strati, la densità e la taglia delle cellule cambiano in modo netto, lì passa un confine. Con questo criterio Brodmann, nel 1909, divide la corteccia umana in circa quarantasette aree, numerate — le aree di Brodmann, abbreviate “BA”. La mappa è puramente anatomica: Brodmann guarda tessuto colorato, non comportamento. Eppure molte delle sue aree si sono rivelate, decenni dopo, regioni funzionalmente distinte. L’area 17 di Brodmann è la corteccia visiva primaria; l’area 4 è la corteccia motoria primaria; le aree 3, 1 e 2 sono la corteccia somatosensoriale primaria; le aree 41 e 42 la corteccia uditiva primaria; le aree 44 e 45 corrispondono all’area di Broca, coinvolta nella produzione del linguaggio. La nomenclatura di Brodmann è ancora oggi il vocabolario di base della neuroanatomia: dire “BA 17” è dire “V1”.

Un secolo dopo, gli strumenti sono cambiati. Nel 2016 Matthew Glasser e colleghi pubblicano su Nature “A multi-modal parcellation of human cerebral cortex”. Invece di guardare solo i corpi cellulari di un cervello post mortem, usano dati del Human Connectome Project raccolti in vivo con risonanza magnetica su duecentodieci soggetti, e li combinano: architettura del tessuto (stimata dalla mielinizzazione), attività funzionale misurata con fMRI durante compiti, connettività, topografia. Dove più di questi segnali cambiano insieme, lì passa un confine. Il risultato è una parcellazione in centottanta aree per emisfero — di cui novantasette mai descritte prima, e ottantatré corrispondenti a regioni già note dalla microscopia.

La parcellazione moderna non rottama Brodmann: lo raffina. Conferma che molti dei confini di Brodmann erano reali, ne sposta alcuni, ne aggiunge molti che la sola citoarchitettura non poteva vedere — perché due aree possono avere cellule disposte in modo simile e fare cose diverse, e questo si vede solo aggiungendo funzione e connettività al criterio anatomico. È il programma di Brodmann portato avanti con un secolo di strumenti in più.

Due osservazioni completano il quadro. La prima riguarda la variabilità individuale: una parcellazione come quella di Glasser è costruita su una media di molti cervelli, ma le aree, nelle posizioni e nelle estensioni, variano da persona a persona. Per questo i metodi più recenti includono un passo che adatta la mappa di gruppo al singolo individuo. Una mappa corticale “universale” è un’astrazione comoda; il cervello concreto di una persona è una sua variante. La seconda osservazione è di metodo, e tocca un punto su cui questo capitolo insiste: che cosa significa tracciare un confine dipende dal criterio. Brodmann definiva un confine come un cambio di citoarchitettura; Glasser come un cambio multimodale. Sono definizioni diverse di “area”, e nulla garantisce a priori che coincidano. Che spesso coincidano è un risultato — incoraggiante — non un presupposto. La corteccia è parcellata; come la si parcella dipende anche da cosa si decide di misurare.

Al di là dei numeri — quarantasette di Brodmann, centottanta di Glasser — le aree corticali si raggruppano in tre famiglie funzionali, ed è questa classificazione grossolana, più che il numero esatto di aree, ciò che conviene avere in testa.

Le aree sensoriali primarie ricevono il segnale dei sensi con poche tappe di intermedi: la corteccia visiva primaria (V1, nel lobo occipitale), la somatosensoriale primaria (S1, sul giro postcentrale), la uditiva primaria (A1, nel lobo temporale). Sono di tipo granulare, con lo strato IV ben sviluppato.

Le aree motorie comandano il movimento: la corteccia motoria primaria (M1, sul giro precentrale, appena davanti al solco centrale), la premotoria, l’area motoria supplementare. Sono di tipo agranulare, con lo strato V ricco di grandi piramidali.

Le aree associative sono tutto il resto — e nell’uomo sono la maggior parte della corteccia. Non sono legate a un singolo senso né a un singolo muscolo: integrano informazioni di provenienze diverse. La corteccia prefrontale, la parietale posteriore, la temporale inferiore appartengono a questa famiglia. È nelle aree associative che si svolge gran parte di ciò che chiamiamo pensiero, e la loro espansione sproporzionata è una delle differenze più marcate tra il cervello umano e quello di altri mammiferi.

Una nota di orientamento utile: a un livello più grossolano di quello delle aree, la superficie corticale di ciascun emisfero si divide in quattro lobi, delimitati da solchi maggiori. Il lobo occipitale, in fondo, ospita la corteccia visiva. Il lobo parietale, dietro il solco centrale, ospita la somatosensoriale primaria e ampie aree associative per l’integrazione spaziale. Il lobo temporale, ai lati, ospita la corteccia uditiva e aree per il riconoscimento di oggetti e volti. Il lobo frontale, davanti, ospita le aree motorie e — nella sua porzione più anteriore, la corteccia prefrontale — il substrato di pianificazione, controllo e ragionamento. I lobi sono utili come indirizzo postale grossolano; le aree di Brodmann e la parcellazione di Glasser sono l’indirizzo preciso. Il confine tra lobo frontale e parietale, il solco centrale, è anche il confine tra la corteccia motoria primaria (davanti) e la somatosensoriale primaria (dietro): da un lato si comanda, dall’altro si sente.

Nelle aree sensoriali e motorie primarie la rappresentazione è topografica: punti vicini nel mondo (o sul corpo) corrispondono a punti vicini sulla corteccia. V1 è organizzata retinotopicamente — la mappa della retina è proiettata, deformata ma continua, sulla corteccia. A1 è organizzata tonotopicamente — le frequenze acustiche, dal grave all’acuto, si dispongono in ordine lungo la corteccia. S1 e M1 sono organizzate somatotopicamente — ogni parte del corpo ha la sua zona, e l’ordine delle zone segue grossomodo l’ordine del corpo.

La mappa somatotopica ha un nome celebre: l’homunculus, l‘“omino” corticale. Fu disegnata negli anni ‘30-‘50 dal neurochirurgo canadese Wilder Penfield, che — operando pazienti epilettici svegli, con il cervello esposto e in anestesia solo locale — stimolava elettricamente la corteccia e annotava cosa il paziente sentiva o quale muscolo si contraeva. Lavorando su oltre un centinaio di pazienti operati tra la fine degli anni ‘20 e gli anni ‘50, Penfield e i suoi collaboratori, Edwin Boldrey e Theodore Rasmussen, accumularono una mole di osservazioni da cui emerse una mappa coerente — anzi due, perché distinsero un homunculus sensoriale, sul giro postcentrale, e uno motorio, sul giro precentrale.

La mappa è vistosamente distorta: la superficie corticale dedicata a una parte del corpo non è proporzionale alla dimensione di quella parte, ma alla densità della sua innervazione, cioè alla precisione con cui la usiamo. L’homunculus ha mani enormi, labbra e lingua enormi, e un tronco minuscolo. La corteccia non rappresenta il corpo in scala: lo rappresenta in proporzione a quanto fine controllo o quanta fine sensibilità gli serve. È un principio che ricorre — lo stesso che governa la cortical magnification della fovea in V1, discusso più avanti negli esempi: la corteccia alloca tessuto in base al fabbisogno computazionale, non alla geometria. Va aggiunta una precisazione che la ricerca moderna ha reso necessaria: la versione popolare dell’homunculus, l’omino disegnato disteso sulla corteccia, è una semplificazione didattica. Le mappe reali sono meno ordinate di quel disegno — ci sono discontinuità, sovrapposizioni, rappresentazioni multiple — e studi recenti hanno mostrato che intercalate alle zone “del corpo” della corteccia motoria ci sono zone che controllano l’azione in modo più integrato, non parte per parte. L’homunculus resta un’ottima prima approssimazione; non è l’ultima parola.

Primario, secondario, associativo: la profondità delle aree

Sezione intitolata “Primario, secondario, associativo: la profondità delle aree”

Le aree non si dispongono solo sul piano; si dispongono anche in profondità di elaborazione, e questo anticipa la gerarchia corticale della sezione seguente. Prendiamo di nuovo la vista. V1, la corteccia visiva primaria, è solo la prima stazione corticale: da lì il segnale prosegue verso aree visive secondarie e di ordine superiore (V2, V4, l’area MT, le aree del lobo temporale inferiore), ciascuna che estrae proprietà più astratte. È in queste aree, e non in V1, che si trovano cellule selettive per forme complesse, per il movimento coerente, per categorie di oggetti.

Da decenni si descrivono due grandi flussi lungo cui questa elaborazione si organizza: un flusso ventrale, che dal lobo occipitale scende verso il temporale e costruisce il riconoscimento — “cosa” è l’oggetto — e un flusso dorsale, che sale verso il parietale e tratta la posizione e l’azione — “dove” è, e come interagirci. La distinzione cosa/dove è una semplificazione utile, e come tutte le semplificazioni di questo capitolo va presa per quello che è: i due flussi non sono separati a tenuta stagna, comunicano fittamente. Ma il punto vale: una “area visiva” non è un’entità unica, è una catena di aree a profondità crescente. Ed è proprio la catena ventrale del riconoscimento di oggetti — non V1 da sola — l’oggetto che i modelli artificiali della visione, dal Neocognitron alle reti profonde recenti, hanno cercato di catturare.

Le aree non sono isole. Sono fittamente collegate, e il modo in cui sono collegate ha una struttura leggibile — al punto da poterci ricavare una gerarchia.

Finora il capitolo ha trattato la corteccia quasi come un oggetto statico: strati, tipi cellulari, colonne, territori. Ma una mappa di territori senza le strade che li collegano non dice nulla su come l’informazione viaggia. Questa sezione aggiunge le strade. E la scoperta centrale — che sarà la chiave della gerarchia corticale — è che le strade non sono tutte uguali: hanno un verso, e il verso è scritto nel modo in cui la connessione si dispone nei sei strati. È qui che il piano locale (gli strati) e il piano globale (le aree) finalmente si saldano.

Il segnale dei sensi non entra nella corteccia direttamente: passa quasi sempre dal talamo. Il talamo è una struttura sottocorticale che funge da stazione di smistamento: ha nuclei distinti per le diverse modalità — il corpo genicolato laterale per la vista, il mediale per l’udito, i nuclei ventrali posteriori per la somestesi — e ciascun nucleo inoltra il suo segnale all’area corticale primaria corrispondente. Le fibre che fanno questo viaggio, le afferenze talamocorticali di tipo “core”, terminano in maggioranza nello strato IV (con terminazioni minori nello strato III profondo e nello strato VI). Ecco perché lo strato IV è la stazione d’ingresso, ed ecco perché è così spesso nelle cortecce sensoriali.

Un dettaglio che vale la pena aggiungere, perché complica utilmente l’immagine del “talamo come semplice cavo d’ingresso”. Le fibre talamocorticali non sono tutte dello stesso tipo. Accanto a quelle “core”, che terminano in modo focale nello strato IV e portano il segnale sensoriale specifico, esiste un sistema “matrix” più diffuso, che termina prevalentemente nello strato I e attraversa più aree senza rispettare i confini netti delle aree primarie. Inoltre il talamo non riceve solo dai sensi: riceve anche, in massa, dalla corteccia stessa — è la proiezione corticotalamica dello strato VI. E alcuni nuclei talamici (i cosiddetti “higher-order”, come il pulvinar) ricevono il loro input principale da una area corticale e lo reinviano a un’altra area corticale. In quei casi il talamo non è una porta d’ingresso ma una stazione di transito tra aree corticali: una specie di centralino che la corteccia usa per parlare con sé stessa passando per l’esterno. Il rapporto corteccia-talamo è quindi un anello, non una freccia.

Feedforward e feedback: la direzione nei pattern laminari

Sezione intitolata “Feedforward e feedback: la direzione nei pattern laminari”

Le connessioni tra aree corticali — le proiezioni cortico-corticali — non sono tutte uguali. Hanno due pattern laminari distinti, e proprio il pattern rivela la direzione del flusso di informazione.

Una proiezione feedforward, che porta il segnale verso aree gerarchicamente “più alte”, origina prevalentemente dagli strati superficiali (II/III) dell’area di partenza e termina nello strato IV dell’area di arrivo — lo stesso strato in cui arriva l’input talamico. È come se l’area ricevente trattasse il messaggio dell’area precedente alla stregua di un ingresso “sensoriale”.

Una proiezione feedback, che porta il segnale verso aree “più basse”, origina prevalentemente dagli strati profondi (V/VI) e termina evitando lo strato IV — termina invece nello strato I e nello strato VI. È un canale separato, anatomicamente distinguibile, che porta informazione “dall’alto verso il basso”: aspettative, contesto, predizioni. Il capitolo predictive-processing-neuroscienze (in preparazione) farà di questo canale di feedback il perno di una teoria generale del funzionamento corticale.

Il punto da non perdere è che questa asimmetria si vede al microscopio. Non bisogna sapere a priori quale area sta “sopra” e quale “sotto” per poi dedurne il tipo di connessione: è il contrario. Si guarda dove una proiezione origina e dove termina nei sei strati, e da quel pattern laminare si legge la direzione. Lo strato di una corteccia, in altre parole, porta scritto in che senso scorre l’informazione. È un fatto sorprendente e potente — la struttura locale codifica la posizione gerarchica — ed è esattamente la chiave che permette il passo successivo.

Nel 1991 Daniel Felleman e David Van Essen pubblicano su Cerebral Cortex “Distributed hierarchical processing in the primate cerebral cortex”. L’idea è sfruttare proprio quell’asimmetria laminare come un segno della direzione. Raccolgono dalla letteratura circa trecentocinque connessioni tra trentadue aree visive e visive-associative del macaco; per ciascuna connessione guardano il pattern laminare e ne deducono se è feedforward o feedback; e poi ordinano le aree in modo che le connessioni feedforward vadano sempre “verso l’alto” e quelle feedback “verso il basso”. Il risultato è una gerarchia corticale a circa dieci livelli: dalla corteccia visiva primaria in basso, su per le aree extrastriate, fino alle aree associative del lobo temporale inferiore e parietale.

Il metodo merita una nota, perché è un bell’esempio di inferenza indiretta. Felleman e Van Essen non hanno misurato una “altezza gerarchica” di nessuna area: una tale grandezza non si misura. Hanno raccolto un grande numero di vincoli locali — questa connessione è feedforward, quest’altra è feedback — e hanno cercato un ordinamento globale che li soddisfacesse tutti insieme. È lo stesso tipo di ragionamento con cui, da molti vincoli “A viene prima di B”, si ricostruisce una sequenza. La gerarchia corticale, in questo senso, non è un dato osservato: è la soluzione di un problema di vincoli. Ed è proprio questa natura a spiegare perché, come si dirà, le soluzioni siano molte e non una.

Due avvertenze sono parte integrante del risultato. La prima: non è una gerarchia rigida. Ci sono moltissime connessioni laterali, tra aree dello stesso livello; analisi successive hanno mostrato che, in assenza di un vincolo aggiuntivo, i dati di Felleman e Van Essen ammettono dell’ordine di centocinquantamila ordinamenti gerarchici diversi tutti compatibili. La gerarchia è un’utile ossatura, non una catena di montaggio univoca. La seconda: è una gerarchia distribuita, e per giunta percorsa in entrambe le direzioni — il feedback non è un dettaglio, è metà del traffico. Il cervello non elabora il visivo come una pipeline che va sempre in avanti. Tenere a mente queste due avvertenze sarà decisivo nel confronto con le reti convoluzionali.

Vale la pena rendere concreto dove, anatomicamente, viaggiano le connessioni tra aree. Sotto il foglio corticale grigio — la sostanza grigia, fatta di corpi cellulari — c’è la sostanza bianca: un volume occupato quasi interamente da assoni rivestiti di mielina, la guaina isolante che ne accelera la conduzione (vedi Il potenziale d’azione). È bianca proprio per la mielina. Le fibre della sostanza bianca si dividono in tre famiglie. Le fibre di associazione collegano aree diverse dello stesso emisfero — sono il cablaggio della gerarchia corticale appena descritta. Le fibre commissurali collegano i due emisferi: il fascio più grande è il corpo calloso, circa duecento milioni di assoni, e la maggior parte delle proiezioni callosali origina dalle cellule piramidali dello strato III. Le fibre di proiezione collegano la corteccia alle strutture sottocorticali e al midollo: portano l’input talamico verso l’alto e l’output corticofugo dello strato V verso il basso.

La mappatura di queste fibre su scala dell’intero cervello — il connettoma — è oggi un campo di ricerca attivo: tecniche di risonanza magnetica come la trattografia da diffusione ricostruiscono i grandi fasci nel cervello umano vivo, e proprio i dati del Human Connectome Project hanno alimentato la parcellazione di Glasser. Va detto con onestà il limite: la trattografia in vivo ricostruisce i grandi fasci, non le singole sinapsi, e ha noti errori sistematici; il connettoma sinaptico completo è disponibile, al momento, solo per organismi minuscoli o per piccoli volumi di tessuto. Sapere quali aree sono collegate è una cosa; sapere neurone per neurone come, è ancora un’altra.

C’è un’ultima struttura da introdurre, e chiude il cerchio tra il piano locale e il piano della connettività. Finora il capitolo ha descritto gli strati come “chi parla con chi” e le aree come “chi sta sopra chi”. Manca un pezzo: il motivo di circuito che si ripete sotto ogni area, lo schema preciso di come i sei strati si connettono tra loro. Quel motivo ha un nome. Negli anni ‘80 Rodney Douglas e Kevan Martin, con David Whitteridge, registrando intracellularmente dalla corteccia visiva del gatto, notano che il modo in cui un segnale si propaga dentro un pezzetto di corteccia segue sempre lo stesso schema. Nel 1989, sulla rivista Neural Computation, lo formalizzano come microcircuito canonico della neocorteccia: un motivo di connettività ricorrente che — questa è l’ipotesi forte — si ripete con piccole variazioni in tutta la corteccia, sotto ogni area. Lo ridefiniranno e amplieranno in una rassegna del 2004 sull’Annual Review of Neuroscience.

Lo schema, semplificato, è quello che il capitolo ha già montato pezzo per pezzo. Conviene enunciarlo come una sequenza di regole di connessione, perché è in questa forma — un piccolo insieme di regole ripetute — che il “canonico” prende senso:

  1. L’input — dal talamo, oppure feedforward da un’area gerarchicamente più bassa — colpisce in maggioranza lo strato IV.
  2. Lo strato IV proietta in alto, agli strati superficiali II/III.
  3. Gli strati II/III sono fittamente ricorrenti: si eccitano a vicenda, e questa ricorrenza è la sede dell’amplificazione e dell’elaborazione.
  4. Gli strati II/III proiettano in due direzioni: verso l’esterno (output cortico-corticale feedforward, che colpirà lo strato IV dell’area successiva) e verso il basso, agli strati profondi.
  5. Lo strato V genera l’output sottocorticale (corticofugo); lo strato VI genera il feedback verso il talamo.
  6. A ogni stadio, una popolazione di interneuroni inibitori scala con l’eccitazione e tiene il circuito in equilibrio.

È, in piccolo, l’architettura laminare in azione: lo stesso insieme di sei regole, sotto ogni millimetro quadrato di corteccia.

Ma il microcircuito canonico ha un punto centrale che è anche la sua lezione più importante, e che vale la pena enunciare per intero. L’input talamico, su un tipico neurone dello strato IV, è una minoranza delle sinapsi eccitatorie che quel neurone riceve — spesso meno del dieci-venti per cento. La grande maggioranza delle sinapsi eccitatorie su quel neurone proviene da altri neuroni corticali vicini: è connettività ricorrente intracorticale. Detto altrimenti: la corteccia non si limita a trasmettere in avanti un input. Lo riceve debole e lo amplifica, lo modella, lo mantiene tramite un’enorme rete di feedback locale. Il calcolo corticale è fatto soprattutto di ricorrenza, non di passaggio.

Cosa significa “amplificare” in concreto? Significa che un input debole — poche fibre talamiche attive — viene raccolto da una popolazione di neuroni corticali che si ri-eccitano a vicenda, facendo crescere la risposta ben oltre ciò che l’input da solo produrrebbe. Senza un freno, una rete che si auto-eccita esploderebbe; il freno sono gli interneuroni inibitori, che crescono in attività di pari passo con l’eccitazione e la tengono entro limiti. La corteccia opera quindi in un regime di equilibrio dinamico tra eccitazione ricorrente e inibizione — un equilibrio che le permette di essere insieme sensibile (un input piccolo produce una risposta apprezzabile) e stabile (la risposta non diverge). Questo regime spiega anche perché la corteccia possa mantenere un’attività dopo che l’input è cessato: la ricorrenza fa da memoria a breve termine del circuito, un’idea che Architetture cognitive e Working memory riprenderanno.

Conviene anche inquadrare il microcircuito canonico per quello che è, dal punto di vista di chi progetta sistemi: è un design pattern. La natura ha trovato un motivo di circuito che funziona — ingresso in IV, elaborazione e amplificazione nei superficiali, biforcazione dell’output nei profondi — e lo ha replicato, con variazioni locali, sotto ogni area corticale, lasciando che fossero le connessioni tra le aree e gli input a specializzare ciascuna copia per il suo compito. Lo stesso mattone, parametri diversi. È una strategia di progettazione potente: invece di disegnare da zero un circuito per la vista, uno per l’udito, uno per il movimento, si disegna un circuito generico e lo si specializza per cablaggio. Questa idea — un substrato uniforme reso versatile dal contesto — è forse l’eredità concettuale più interessante che lo studio della corteccia consegna a chi pensa architetture, ben più della filiazione specifica verso le CNN.

Questo fatto — la dominanza della ricorrenza sull’input — è la differenza più profonda tra la corteccia e l’oggetto a cui sta per essere paragonata. Conviene fissarlo prima di fare il paragone.

Tre esempi eterogenei, scelti per fissare i concetti del capitolo da angoli diversi: uno quantitativo, uno clinico, uno di anatomia comparata. Hanno in comune un solo bersaglio — mostrare che la struttura corticale descritta nelle sezioni precedenti non è un’astrazione da atlante, ma qualcosa che si misura, si vede e, quando si rompe, si sente.

L’homunculus dice che la corteccia alloca superficie in base al fabbisogno, non alla geometria del corpo. Mettiamoci un numero, anche grossolano, per sentirne la forza. Il polpastrello di un dito e la pelle della schiena hanno densità di recettori tattili molto diverse: sul polpastrello la soglia di discriminazione tra due punti — la distanza minima a cui due tocchi vengono ancora percepiti come distinti — è dell’ordine di due-tre millimetri; sulla schiena può superare i quattro centimetri. È una differenza di più di un ordine di grandezza nella risoluzione spaziale. Coerentemente, la corteccia somatosensoriale primaria dedica al singolo dito una porzione di superficie sproporzionatamente grande rispetto a quella dedicata a un’area di pelle dorsale equivalente per estensione fisica. Il principio è lo stesso che governa la retinotopia di V1: la fovea — il centro ad alta risoluzione della retina — occupa una frazione minima della retina ma si proietta su una frazione enorme di V1, fenomeno noto come cortical magnification. La lezione, generalizzabile: una mappa corticale non rappresenta lo spazio fisico in scala uniforme, ma in proporzione a quanta capacità di elaborazione quel pezzo di spazio richiede. È una scelta di allocazione di risorse — e in questo, ma solo in questo senso astratto, ricorda il modo in cui una rete artificiale dedica più parametri alle regioni dell’input statisticamente più informative; va detto come analogia, non come meccanismo condiviso.

Un caso clinico: cosa rivela una lesione di un’area

Sezione intitolata “Un caso clinico: cosa rivela una lesione di un’area”

La parcellazione in aree funzionali non è un’astrazione da atlante: si manifesta, drammaticamente, quando un’area smette di funzionare. Una lesione circoscritta della corteccia visiva primaria — per esempio per un ictus nel territorio dell’arteria cerebrale posteriore — produce uno scotoma: una zona cieca nel campo visivo, di posizione e forma prevedibili dalla retinotopia di V1. Il paziente non vede, in quella porzione di campo, pur avendo occhi, retina e nervo ottico intatti. Una lesione dell’area di Broca (BA 44/45) produce un quadro diverso: l’afasia di Broca, in cui la comprensione resta relativamente preservata ma la produzione del linguaggio diventa faticosa, telegrafica. Due lesioni, due deficit specifici, due aree distinte: è la conferma clinica più diretta che la corteccia è davvero parcellata in territori con compiti diversi — e che la mappa di Brodmann, nata dalla sola citoarchitettura, aveva colto qualcosa di reale. Va però aggiunta la riserva della sezione “Dove si rompe”: le mappe si riorganizzano, e il recupero parziale dopo una lesione mostra che i confini funzionali hanno un margine di plasticità.

Anatomia comparata: la corteccia agranulare del motorio

Sezione intitolata “Anatomia comparata: la corteccia agranulare del motorio”

Un campione di corteccia motoria primaria e uno di corteccia visiva primaria, visti al microscopio dopo colorazione di Nissl, sono riconoscibili a colpo d’occhio anche da uno studente alle prime armi. Nella corteccia visiva lo strato IV è una banda spessa, scura, fittissima di piccole cellule granulari — la “koniocorteccia”. Nella corteccia motoria lo strato IV è così ridotto da essere quasi invisibile, e domina lo strato V con le sue grandi piramidali, comprese le cellule di Betz. Lo stesso piano a sei strati, ma due profili opposti: una corteccia costruita per ricevere e una costruita per comandare. Questo esempio rende concreta la tesi di Brodmann — la citoarchitettura predice la funzione — e mostra perché il “microcircuito canonico”, che assume uno strato IV come stazione d’ingresso, vada applicato con cautela a una corteccia agranulare che quello strato quasi non ce l’ha.

I tre esempi, presi insieme, illustrano un’unica idea da angoli diversi: la struttura corticale si lega alla funzione, e il legame si manifesta sia nei numeri (la cortical magnification), sia nei deficit clinici (le lesioni d’area), sia all’occhio del microscopista (granulare contro agranulare). Ma in tutti e tre i casi è comparsa anche la riserva: la magnificazione è una somiglianza solo astratta con le reti artificiali, le mappe lesionate hanno margini di plasticità, il microcircuito “canonico” non si applica identico ovunque. Struttura e funzione sono legate — e il legame va sempre qualificato.

Applicazioni pratiche: la corteccia come riferimento progettuale

Sezione intitolata “Applicazioni pratiche: la corteccia come riferimento progettuale”

L’architettura corticale non è solo un oggetto di studio biologico: è stata, ed è, un riferimento per chi progetta sistemi artificiali — a volte come fonte di ispirazione esplicita, a volte come banco di prova per capire quanto un’architettura artificiale “assomigli” al cervello.

Conviene distinguere subito due modi in cui la corteccia entra nel lavoro di chi costruisce sistemi artificiali, perché si confondono di continuo. Il primo è la fonte di ispirazione: un principio osservato nel cervello viene preso a prestito e adattato in un’architettura artificiale — è il caso, documentato, della gerarchia visiva. Il secondo è il banco di prova: un’architettura artificiale, nata per ragioni sue, viene confrontata con dati neurali per misurare quanto le assomigli — è il caso dei confronti recenti tra reti profonde e flusso ventrale. Sono due relazioni diverse: nella prima il cervello viene prima e l’artificio dopo; nella seconda corrono in parallelo e si misura la distanza. Tenerle separate evita gran parte delle affermazioni confuse sul rapporto tra cervello e AI.

Il caso storico più chiaro è la visione artificiale, trattato nella sezione seguente come filiazione documentata. Ma l’idea di gerarchia corticale ha avuto risonanze più ampie. Il progetto di Jeff Hawkins e dell’azienda Numenta, per esempio, ha esplicitamente cercato di costruire algoritmi a partire dall’organizzazione laminare e colonnare della neocorteccia — un programma di ricerca interessante, ma minoritario rispetto al deep learning mainstream, e i cui risultati pratici restano limitati. Più in generale, la nozione che l’elaborazione corticale combini un canale feedforward e un canale feedback strutturato ha alimentato l’interesse per le architetture artificiali ricorrenti e per i modelli di predictive coding, di cui si occuperà il capitolo predictive-processing-neuroscienze (in preparazione).

Va detto con franchezza qual è oggi lo stato delle cose: i sistemi di intelligenza artificiale che dominano la scena — i transformer in particolare — non sono progettati a partire dall’anatomia corticale, e la maggior parte delle loro scelte architetturali nasce da considerazioni di efficienza computazionale e di addestrabilità, non di plausibilità biologica. La corteccia resta un riferimento utile per porre domande (“questa architettura ha un canale di feedback? processa in modo gerarchico?”), non un blueprint da copiare.

Una nota sul transformer, dato che è l’architettura di riferimento dell’epoca in cui questa wiki viene scritta. È istruttivo confrontarlo con la corteccia evitando la trappola dell’equivalenza. Un transformer è una pila di blocchi identici, e questa ripetizione di un motivo uniforme ricorda — come analogia, non come filiazione — la tesi dell’uniformità corticale e il microcircuito canonico replicato sotto ogni area. Ma le differenze pesano più della somiglianza. Un transformer, durante l’inferenza, è essenzialmente feedforward: i blocchi si attraversano una volta sola; non c’è un canale di feedback dai blocchi alti a quelli bassi paragonabile alle proiezioni corticali discendenti. La parola “attention” del transformer non discende dai modelli psicologici dell’attenzione né dalla neuroanatomia — è un nome dato a un’operazione algebrica, e il capitolo Il nome “attention” nei transformer dedica spazio proprio a quanta eredità ci sia, e quanta no. E l’addestramento per backpropagation su grandi corpora non ha equivalente noto nella corteccia. Il transformer non è un modello del cervello; è un’architettura che, per ragioni indipendenti, ha riscoperto un paio di principi — un substrato uniforme e ripetuto, un’elaborazione che integra informazione da molte fonti — che la corteccia esibisce per ragioni sue. Riconoscere la somiglianza e fermarla alla classe “analogia” è esattamente il tipo di disciplina che questo capitolo chiede.

La corteccia e le reti convoluzionali: una filiazione reale, e i suoi limiti

Sezione intitolata “La corteccia e le reti convoluzionali: una filiazione reale, e i suoi limiti”

Veniamo al confronto più atteso, e più frainteso. Qui la regola editoriale della wiki sulle classi di affermazioni — analogia, filiazione, equivalenza — va applicata con il bisturi, perché in questo legame c’è di tutto: un pezzo di filiazione genuina e documentata, e molta analogia che spesso viene spacciata per identità.

La sezione è divisa in due metà esattamente per questo: la prima isola e dimostra il pezzo di filiazione reale, con i documenti che lo attestano; la seconda traccia con precisione il confine oltre il quale la filiazione finisce e comincia un’analogia debole. Tenere separate le due metà è il punto dell’intera sezione.

Conviene tornare un momento alla scoperta da cui tutto parte, perché è il fatto che la filiazione preleva.

Negli anni ‘60 David Hubel e Torsten Wiesel, registrando dalla corteccia visiva del gatto, scoprono due tipi di cellule. Le cellule semplici rispondono a una barra luminosa di una specifica orientazione in una specifica posizione del campo visivo: spostala, e la cellula tace. Le cellule complesse rispondono alla stessa orientazione ma indipendentemente dalla posizione esatta entro una certa regione: hanno acquisito un’invarianza alla traslazione. Hubel e Wiesel propongono che le complesse nascano combinando l’output di molte semplici, e che, salendo lungo la gerarchia visiva, si possano costruire selettività via via più astratte e più invarianti.

Questa intuizione — gerarchia di feature, da semplici e locali ad astratte e invarianti, costruita alternando un passo di selettività e un passo di invarianza — è il punto in cui comincia la filiazione, ed è una filiazione genuina perché c’è un documento che la attesta. Nel 1980 l’ingegnere giapponese Kunihiko Fukushima pubblica su Biological Cybernetics il Neocognitron, una rete neurale per il riconoscimento di pattern. Fukushima dichiara esplicitamente nel paper di essersi ispirato a Hubel e Wiesel: la rete alterna strati di “S-cell”, che Fukushima identifica con le cellule semplici, e strati di “C-cell”, che identifica con le complesse. Le S-cell estraggono feature locali, le C-cell le rendono invarianti alla posizione raggruppandole. Nel 1989 Yann LeCun e colleghi aggiungono a un’architettura di questa famiglia l’addestramento per backpropagation — l’algoritmo che propaga l’errore all’indietro per aggiustare i pesi — e nasce la rete neurale convoluzionale (CNN) nella forma che diventerà standard: strati di convoluzione (estrazione di feature, eredi delle S-cell) alternati a strati di pooling (invarianza, eredi delle C-cell).

La catena gerarchia visiva di Hubel e Wiesel → Neocognitron di Fukushima → CNN di LeCun è quindi una filiazione storica documentata, non un’analogia: ci sono paper che citano paper, c’è un’ispirazione dichiarata per iscritto, c’è un lineage tracciabile. Su questo si può dire, senza esagerare, che la corteccia visiva ha ispirato le CNN.

Conviene rendere esplicito cosa esattamente è stato preso, perché è un nucleo preciso e piccolo. Il meccanismo proposto da Hubel e Wiesel per costruire una cellula complessa è: prendi molte cellule semplici sintonizzate sullo stesso orientamento ma in posizioni leggermente diverse, e fanne una somma soglia. Il risultato risponde a quell’orientamento ovunque cada entro la regione coperta — è diventato invariante alla posizione. Questa è, struttura per struttura, l’operazione di pooling di una CNN: prendi le attivazioni di un rivelatore di feature in posizioni vicine e combinale (con un massimo, o una media) in un’unica uscita più robusta allo spostamento. E lo strato di convoluzione — lo stesso piccolo rivelatore applicato in ogni punto dell’immagine — è la versione artificiale dell’osservazione che la corteccia ripete lo stesso tipo di cellula semplice attraverso tutta la mappa retinotopica. Un’altra linea di lavoro, il modello HMAX di Riesenhuber e Poggio (1999), ha formalizzato la stessa gerarchia semplici/complesse in modo dichiaratamente ispirato al flusso ventrale — la via corticale, dal lobo occipitale al temporale inferiore, lungo cui si costruisce il riconoscimento di oggetti. La filiazione, insomma, riguarda due idee precise: pesi condivisi attraverso la posizione (convoluzione) e alternanza selettività/invarianza (conv/pooling). Tutto il resto dell’architettura di una CNN moderna — la profondità, le funzioni di attivazione, la normalizzazione, e soprattutto il modo in cui viene addestrata — non viene dalla corteccia.

La parte di analogia: dove la somiglianza si ferma

Sezione intitolata “La parte di analogia: dove la somiglianza si ferma”

Detto questo, e detto con precisione, va detto altrettanto chiaramente dove la filiazione finisce e comincia un’analogia molto più debole — perché è proprio qui che il discorso pubblico scivola di continuo, presentando il cervello e una CNN come “la stessa cosa”. Il punto non è essere puntigliosi: è che la confusione fa danni reali. Chi crede che una CNN “sia” la corteccia visiva ne trae inferenze sbagliate in entrambe le direzioni — usa la CNN per spiegare il cervello dove non può, e usa il cervello per giustificare scelte progettuali che reggono o cadono per ragioni loro. Le divergenze che seguono non sono cavilli: sono i punti in cui le due cose fanno cose diverse.

La corteccia è massicciamente ricorrente. Lo ha detto il microcircuito canonico: su un neurone dello strato IV, l’input è una minoranza delle sinapsi, e la maggioranza è ricorrenza locale. Una CNN classica è feedforward: il segnale attraversa gli strati una volta sola, dall’input all’output, senza che uno strato successivo retroagisca su uno precedente. Sono due regimi di calcolo diversi alla radice.

La corteccia ha un canale di feedback laminare strutturato — le proiezioni che originano dagli strati profondi ed evitano lo strato IV, la metà “discendente” della gerarchia di Felleman e Van Essen. Una CNN classica non ha nulla di simile: non c’è un canale per cui gli strati alti spediscono predizioni o contesto agli strati bassi durante l’elaborazione.

La corteccia non usa la backpropagation globale. La backpropagation richiede di propagare all’indietro un segnale di errore lungo le stesse connessioni usate in avanti, con accesso preciso ai pesi: come il cervello potrebbe fare qualcosa di equivalente — il problema del credit assignment biologico — è una questione di ricerca tuttora aperta, non un fatto acquisito. L’apprendimento corticale che conosciamo meglio è quello locale della plasticità hebbiana, che è un’altra cosa.

La corteccia ha sei strati con tipi cellulari distinti e un’inibizione strutturata — piramidali, stellate, famiglie di interneuroni — non strati omogenei di unità identiche. E la sua gerarchia, quella di Felleman e Van Essen, è distribuita, bidirezionale, percorsa da feedforward e feedback insieme, non una pila lineare di strati.

C’è poi una differenza che riguarda le parole stesse, e merita una riga perché genera confusione. Lo “strato” di una CNN e lo “strato” della corteccia sono cose diverse. Lo strato di una rete artificiale è uno stadio di elaborazione: l’input lo attraversa, ne esce trasformato, passa al successivo. Lo strato corticale è una banda di tessuto a una certa profondità: l’elaborazione gerarchica del cervello non avviene salendo dallo strato I allo strato VI, avviene passando da un’area alla successiva, e dentro ciascuna area tutti e sei gli strati partecipano insieme. Detto in breve: lo “strato” della CNN corrisponde semmai all’area corticale, non allo strato corticale. È un omonimo, non un sinonimo — e scambiarlo è uno degli errori più comuni quando si racconta questo confronto.

C’è anche un verso inverso del rapporto che vale la pena nominare, perché si è sviluppato in anni recenti e tiene insieme onestamente la filiazione e la sua misura. Una linea di ricerca confronta le rappresentazioni interne delle reti convoluzionali profonde con le risposte registrate nelle aree del flusso ventrale dei primati, e trova che — fino a un certo punto — gli strati bassi di una rete profonda assomigliano alle aree visive basse e gli strati alti alle aree alte: la rete profonda è, ad oggi, tra i migliori modelli predittivi disponibili delle risposte di quelle aree. È un risultato interessante, e va riportato per quello che è: una somiglianza funzionale parziale e misurata statisticamente, non una dimostrazione che il cervello “sia” una rete profonda. La rete profonda è uno strumento che predice bene certe risposte; questo la rende un buon modello in senso ingegneristico, non un’identità anatomica.

La conclusione, formulata nella classe corretta: tra corteccia e CNN c’è una filiazione storica reale e documentata limitata all’idea di gerarchia di feature crescenti in astrazione, costruita alternando selettività e invarianza. Oltre quel nucleo, c’è analogia — somiglianza utile per pensare, niente di più — e diverse divergenze profonde che escludono l’equivalenza. La CNN non è un modello della corteccia visiva, e la corteccia visiva non è una CNN biologica: la prima discende, per un tratto del suo albero genealogico, da ciò che si era capito della seconda intorno al 1965. Il rapporto tra cervello e reti artificiali in generale — al di là di questo caso specifico — è il tema di Cervello e rete neurale: somiglianze reali e analogie ingannevoli.

L’architettura corticale, per quanto elegante nello schema canonico, va presa con diverse riserve. Elencarle non è un disclaimer di cortesia: è parte di una descrizione onesta.

Un filo unisce quasi tutte le riserve che seguono, e conviene enunciarlo prima. Lo schema che il capitolo ha costruito — sei strati, colonne, microcircuito canonico, gerarchia — è in larga parte un insieme di idealizzazioni: regolarità vere, ma ripulite, mediate, semplificate per essere insegnabili. La corteccia reale è più disordinata, più variabile, meno modulare. Le idealizzazioni restano preziose — senza un modello pulito non si capisce nulla — ma vanno tenute come modelli, non scambiate per la cosa. Le riserve seguenti sono altrettanti modi in cui il modello pulito e la corteccia disordinata divergono.

La “colonna” come unità di calcolo è un modello contestato. Lo si è già detto, ma vale ripeterlo perché è il punto su cui la divulgazione semplifica di più. La colonna di connettività verticale è solida; la colonna come modulo computazionale uniforme e universale — lo stesso mattone identico ripetuto ovunque — non ha l’evidenza che le si attribuisce spesso (Horton & Adams, 2005). Trattarla come un fatto al pari dei sei strati è un errore.

Il “microcircuito canonico” è uno schema, non una fotografia. È stato ricavato in larga parte dalla corteccia visiva del gatto, e l’ipotesi che si ripeta identico sotto ogni area è appunto un’ipotesi. Le aree differiscono: una corteccia agranulare motoria, priva di un vero strato IV, non può avere lo stesso microcircuito di una corteccia visiva granulare. “Canonico” significa “tema con variazioni”, non “invariante”.

La gerarchia corticale non è un ordine totale. I dati di Felleman e Van Essen ammettono un’enormità di ordinamenti compatibili; le connessioni laterali sono moltissime; il feedback è abbondante quanto il feedforward. Disegnare la corteccia come una scala lineare di livelli è una comodità grafica che tradisce la struttura reale, che è una rete densa e bidirezionale.

Quasi tutto viene da pochi sistemi modello. La corteccia visiva del gatto e del macaco, la corteccia somatosensoriale del roditore: è da lì che proviene la maggior parte di ciò che il capitolo ha raccontato. Estendere quelle conclusioni alla corteccia prefrontale umana, alle aree associative, al linguaggio, richiede un salto induttivo che non sempre è giustificato. La corteccia associativa umana — la parte più interessante per chi studia la cognizione — è anche la meno caratterizzata a livello di microcircuito.

Le mappe statiche nascondono un sistema dinamico. Le aree di Brodmann, gli homunculus, la parcellazione di Glasser: sono fotografie. Ma le mappe corticali si riorganizzano — durante lo sviluppo, dopo una lesione, con l’apprendimento intenso (un musicista, un lettore Braille). I confini tra aree non sono cuciture immutabili. Una mappa è una media su una popolazione, non un destino cablato.

“Un’area, una funzione” è una semplificazione. La tentazione, davanti a una mappa parcellata, è leggere ogni area come la sede di una funzione ben definita. La realtà è più sfumata: la maggior parte delle funzioni cognitive complesse — il linguaggio, la memoria, la decisione — emerge dall’attività coordinata di reti distribuite su molte aree, non da una singola regione. Una lesione di Broca compromette la produzione del linguaggio, ma il linguaggio non “sta” nell’area di Broca come un file in una cartella. Anche la nitidezza dei confini va presa con misura: tra due aree adiacenti il passaggio è spesso graduale, e la posizione esatta di un confine varia da individuo a individuo.

La descrizione anatomica non è una spiegazione del calcolo. Conoscere strati, colonne, aree e gerarchia dice come è cablata la corteccia, non quale algoritmo esegue. Il microcircuito canonico è una mappa del circuito; cosa quel circuito calcoli — quale funzione implementi, con quale codice — resta in larga parte una questione aperta. È la differenza tra avere lo schema elettrico di un dispositivo e saperne leggere il programma. Questo capitolo ha descritto l’hardware; la sua semantica computazionale è materia di teoria, e i capitoli predictive-processing-neuroscienze (in preparazione) e Cervello e rete neurale ne raccolgono alcuni tentativi.

Nessuna di queste riserve toglie valore al quadro. Lo ridimensiona al suo statuto corretto: una descrizione anatomica solida e in larga parte verificata, una serie di modelli organizzatori utili ma di portata variabile, e una sola questione computazionale grande e aperta — cosa la corteccia faccia, oltre a come è fatta. È onesto chiudere il capitolo lasciando quella domanda esplicitamente aperta, invece di mascherarla con un’analogia rassicurante.

L’analogia con il deep learning è precisa solo in un punto e pericolosa altrove. È stata sezionata nella sezione precedente. Va riconosciuta la filiazione genuina — gerarchia visiva → Neocognitron → CNN — e respinta la deriva verso l’equivalenza: la corteccia ricorrente, con feedback laminare e senza backpropagation globale, non è una rete feedforward addestrata a gradiente.

  • Mountcastle, V. B. (1957). “Modality and topographic properties of single neurons of cat’s somatic sensory cortex.” Journal of Neurophysiology, 20(4), 408-434. Lo studio fondante dell’organizzazione colonnare. Da leggere per vedere l’osservazione originale prima delle interpretazioni successive.
  • Felleman, D. J. & Van Essen, D. C. (1991). “Distributed hierarchical processing in the primate cerebral cortex.” Cerebral Cortex, 1(1), 1-47. La gerarchia corticale del sistema visivo del macaco, con il famoso diagramma a livelli. Lungo e tecnico, ma il capostipite di un modo di pensare la corteccia.
  • Douglas, R. J. & Martin, K. A. C. (2004). “Neuronal circuits of the neocortex.” Annual Review of Neuroscience, 27, 419-451. La rassegna che ridefinisce il microcircuito canonico e argomenta la predominanza della ricorrenza intracorticale. La sintesi più chiara dello “schema” corticale.
  • Horton, J. C. & Adams, D. L. (2005). “The cortical column: a structure without a function.” Philosophical Transactions of the Royal Society B, 360(1456), 837-862. La rassegna scettica sulla colonna. Indispensabile per non prendere la colonna come un fatto acquisito.
  • Glasser, M. F., et al. (2016). “A multi-modal parcellation of human cerebral cortex.” Nature, 536(7615), 171-178. La parcellazione moderna in 180 aree per emisfero: come si traccia oggi una mappa della corteccia combinando architettura, funzione e connettività.