Salta ai contenuti

Cognitivismo ecologico: la mente che esce dalla testa

Cornell, fine anni Quaranta. Un uomo torna dalla guerra avendo passato quattro anni a studiare come i piloti riescono ad atterrare. Ha capito qualcosa che cambierà la psicologia per cinquant’anni: il pilota non ricostruisce il mondo dentro la testa, lo legge già strutturato nel flusso ottico. Si chiama James Gibson. Trent’anni dopo, MIT, un giovane australiano costruisce un robot a sei zampe che cammina senza un modello interno del mondo. Si chiama Rodney Brooks e nel 1991 dichiara che l’intelligenza non richiede rappresentazioni. Negli stessi anni un biologo cileno con due colleghi pubblica un libro che propone che la mente non sia testa che computa modello, ma corpo che fa emergere mondo. Sono Varela, Thompson e Rosch. Tre programmi distinti, una stessa intuizione: il cognitivismo classico ha sbagliato la domanda.

Per quasi cinquant’anni il cognitivismo classico (vedi computazionalismo) è stato la cornice tacita di gran parte delle scienze cognitive e dell’intelligenza artificiale. La sua tesi base — la cognizione è computazione su rappresentazioni interne — ha animato l’AI simbolica degli anni Sessanta, la psicologia cognitiva post-comportamentista, le neuroscienze cognitive computazionali, e in versione estesa lo stesso deep learning. Ma fin dall’inizio una corrente alternativa ha contestato non un dettaglio ma la posa fondamentale del programma: l’idea che la mente “stia in testa” e che il suo lavoro sia rappresentare un mondo.

Questa corrente si articola in famiglie distinte. La ecological psychology di James Gibson nega che la percezione sia ricostruzione di un input povero: l’informazione è già strutturata nell’ambiente. L’enactivism di Francisco Varela, Evan Thompson ed Eleanor Rosch nega che la cognizione sia rappresentazione: è accoppiamento dinamico organismo-ambiente. La subsumption robotics di Rodney Brooks nega che il robot intelligente abbia bisogno di un modello centrale del mondo. Il dynamicism di Tim van Gelder nega che la cognizione sia computazione discreta su simboli: è sistema dinamico continuo. La embodied cognition di George Lakoff sostiene che anche i concetti astratti sono ancorati a schemi sensorimotori del corpo. La critica heideggeriana di Hubert Dreyfus, parallela e indipendente, attacca le assunzioni filosofiche dell’AI simbolica fin dal 1972.

Capire queste alternative non è nostalgia accademica. Chiarisce cosa il cognitivismo presupponga implicitamente, mostra dove il programma classico ha effettivamente fallito (planning generale, common sense, robotica deliberativa fuori da domini formalizzati), e prepara il terreno per leggere fenomeni contemporanei senza ingenuita: la wave dei robotic foundation models del 2024, la critica embodied agli LLM puramente testuali, il predictive processing come tentativo di sintesi. Il capitolo presuppone la lettura di computazionalismo (il bersaglio) e si appoggia a symbol-grounding (dove Brooks compare già) e mente-estesa (extended mind come parente affine).

Il cognitivismo classico domina le scienze cognitive e l’AI dagli anni Sessanta agli anni Novanta. Nello stesso periodo emergono filiere alternative, ciascuna con genealogia propria.

Maurice Merleau-Ponty (filosofo francese, 1908-1961), in Phenomenologie de la perception (Gallimard, Parigi, 1945), sviluppa la fenomenologia del corpo vissuto. La mente percepisce attraverso il corpo, e il corpo si estende negli strumenti usati abitualmente. Antecedente fondamentale per tutte le posizioni embodied/enactive.

Martin Heidegger (filosofo tedesco, 1889-1976), in Sein und Zeit (1927), descrive l’essere-nel-mondo come modo di esistenza più fondamentale della rappresentazione cognitiva. Il martello “in mano” (zuhanden) precede ontologicamente il martello “osservato” (vorhanden). Da qui partirà Dreyfus.

Gregory Bateson (antropologo e cibernetico britannico, 1904-1980), in Steps to an Ecology of Mind (Chandler, 1972), formula in modo aforistico l’idea che oggi chiameremmo extended/distributed: “the unit of mind is broader than the human skin”. Esempio canonico: un cieco con il bastone — dove finisce il sistema cognitivo del cieco?

William James (filosofo e psicologo americano, 1842-1910), il radical empiricism: le relazioni sono percepite direttamente come i termini, non costruite a partire da sensazioni atomiche. Influenza diretta su Gibson via la tradizione neorealista americana del primo Novecento (Holt, Marvin, Montague, Perry).

Norbert Wiener (matematico americano, 1894-1964), in Cybernetics (MIT Press, 1948), introduce feedback, controllo, accoppiamento sensori-attuatori come categorie ontologiche. La cibernetica influenzerà più il dynamicism e l’embodied robotics che il cognitivismo classico.

Negli anni Sessanta-Novanta cinque/sei programmi emergono in parallelo, con poca comunicazione fra loro all’inizio. Ricostruirli in ordine cronologico aiuta.

1966: James Gibson pubblica The Senses Considered as Perceptual Systems (Houghton Mifflin, Boston). Primo libro maturo della ecological psychology. I sensi non sono canali passivi, sono sistemi attivi che cercano informazione strutturata.

1972: Hubert Dreyfus pubblica What Computers Can’t Do: A Critique of Artificial Reason (Harper & Row, New York). Critica heideggeriana radicale all’AI simbolica del MIT. Prevista la maggior parte dei limiti che l’AI simbolica incontrera nei decenni successivi.

1972: Humberto Maturana e Francisco Varela formulano l’autopoiesis (in spagnolo prima, poi in inglese in Autopoiesis and Cognition, Reidel, 1980): sistemi viventi come sistemi auto-produttivi. Base biologica del futuro enactivism.

1979: James Gibson pubblica The Ecological Approach to Visual Perception (Houghton Mifflin, Boston). Manifesto maturo del programma ecologico. Concetto di affordance esplicitato. Muore nel dicembre dello stesso anno.

1980: George Lakoff e Mark Johnson pubblicano Metaphors We Live By (University of Chicago Press). Le metafore concettuali come strutture costitutive del pensiero, ancorate al corpo.

1986: Rodney Brooks pubblica “A Robust Layered Control System for a Mobile Robot” (IEEE Journal of Robotics and Automation 2:1, marzo 1986, pp. 14-23). Subsumption architecture al MIT AI Lab. Robot Allen come dimostratore.

1991: Brooks pubblica “Intelligence Without Representation” (Artificial Intelligence Journal 47, pp. 139-159). Manifesto filosofico anti-rappresentazionalista. Frase chiave: “the world is its own best model”.

1991: Francisco Varela, Evan Thompson ed Eleanor Rosch pubblicano The Embodied Mind: Cognitive Science and Human Experience (MIT Press, Cambridge MA). Manifesto dell’embodied/enactive cognition. Connessione con phenomenology e Madhyamaka buddhista.

1995: Tim van Gelder pubblica “What Might Cognition Be, If Not Computation?” (The Journal of Philosophy 92:7, luglio 1995, pp. 345-381). Manifesto del dynamicism. Esempio canonico: il governatore centrifugo di Watt come metafora ontologica.

1995: Edwin Hutchins pubblica Cognition in the Wild (MIT Press, Cambridge MA). Distributed cognition: studio etnografico-cognitivo della navigazione di una nave militare USA.

1998: Andy Clark e David Chalmers pubblicano “The Extended Mind” (Analysis 58:1, gennaio 1998, pp. 7-19). Extended mind come variante che porta il funzionalismo oltre i confini biologici. Trattato in mente-estesa.

2018: Albert Newen, Leon De Bruin, Shaun Gallagher curano The Oxford Handbook of 4E Cognition (Oxford University Press). 4E (Embodied, Embedded, Extended, Enactive) come bandiera contemporanea del fronte alternativo.

I programmi sono distinti per genealogia, vocabolario, metodi sperimentali. Ma condividono un nucleo:

  • Anti-internalismo: la mente non è “tutta nella testa”. L’ambiente non è fondale neutro, è costitutivo del processo cognitivo. Vale per Gibson (informazione ecologica), Varela (accoppiamento), Brooks (mondo come modello), Hutchins (cognizione distribuita).
  • Anti-rappresentazione astratta: le rappresentazioni interne disembodied del cognitivismo classico sono o inutili (Brooks), o derivate dall’azione (Varela), o ancorate al corpo (Lakoff), o sostituite da accoppiamento dinamico (van Gelder), o assenti per costruzione del compito percettivo (Gibson).
  • Centralità di corpo e azione: la cognizione non si studia astraendo dal corpo che la realizza e dall’azione che la genera. Vale in modi diversi per tutti.

Il fronte non è unitario in tesi positive. Lo è nel rifiuto della posa fondamentale del cognitivismo classico.

Due angoli per il programma alternativo, complementari ma con accenti diversi.

Angolo 1 — Filosofico: la mente non è nella testa che computa modello del mondo

Sezione intitolata “Angolo 1 — Filosofico: la mente non è nella testa che computa modello del mondo”

Cognitivismo classico, formulazione minima: ricevi input dai sensori, costruisci modello interno del mondo, manipoli il modello (computi), produci comportamento. Il mondo entra nella testa attraverso input, viene rappresentato, viene processato, esce attraverso output. La mente è un sistema di elaborazione di rappresentazioni che sta dentro confini biologici precisi (cervello, eventualmente corpo).

Programma alternativo, formulazione minima: organismo e ambiente formano un sistema accoppiato. L’organismo agisce nel mondo e il mondo offre opportunità di azione (affordances). Il significato emerge da questo accoppiamento, non dalla manipolazione interna di rappresentazioni. Cervello, corpo, ambiente sono parti di un unico sistema cognitivo distribuito; tagliarli arbitrariamente al confine del cranio è una mossa filosofica, non un dato di fatto.

L’angolo filosofico si vede meglio nel contrasto con il funzionalismo computazionale (vedi funzionalismo). Per il funzionalismo, la mente è organizzazione funzionale, sostrato-indipendente: lo stesso “programma” può girare su silicio, neuroni, popolazioni di formiche. Per il programma embodied (in particolare enactivism, ecological psychology), questa astrazione è falsa: la mente è del corpo specifico che la realizza, e cambia con esso. Un cervello senza corpo non avrebbe gli stessi pensieri di un cervello con corpo. Una specie animale con sistema visivo diverso vede categorie cromatiche diverse. La mente non si esporta su sostrati arbitrari senza perdere la propria struttura.

Va marcato il registro: questa è una tesi filosofica, non un teorema. Il cognitivismo classico non è “falsificato” dalla sua negazione embodied; le due posizioni offrono ontologie alternative della mente, e la scelta fra esse dipende da quali fenomeni si vuole spiegare meglio (la cognizione astratta avvantaggia il cognitivismo, l’azione situata avvantaggia l’embodied).

Angolo 2 — Operativo: per fare cose intelligenti, spesso non servono rappresentazioni

Sezione intitolata “Angolo 2 — Operativo: per fare cose intelligenti, spesso non servono rappresentazioni”

Considera tre task pratici che richiedono “intelligenza”.

Camminare in un corridoio evitando ostacoli. Approccio cognitivista: percepisci ostacoli, costruisci mappa interna del corridoio, pianifica percorso ottimale, esegui. Approccio Brooks (subsumption): un layer reattivo “evita ostacoli” che gira sempre, un layer “wander” che muove in direzione libera. Niente mappa, niente piano. Funziona robustamente, e in tempo reale (cosa che il pianificatore fa fatica).

Riconoscere un volto familiare. Approccio cognitivista (anni Settanta-Ottanta): estrai feature (occhi, naso, bocca), costruisci rappresentazione strutturata, confronta con prototipi memorizzati. Approccio gibsoniano: il pattern visivo del volto è direttamente percepito come pattern, non come somma di feature ricostruita.

Stimare il time-to-contact con un oggetto in avvicinamento (per evitarlo, prenderlo al volo, atterrare). Approccio cognitivista: misura distanza, misura velocità, calcola tempo. Approccio gibsoniano: il pattern di espansione dell’immagine retinica (variabile tau) codifica direttamente il tempo all’impatto. Nessun calcolo, solo lettura di un invariante.

In tutti e tre i casi l’approccio alternativo non aggiunge nulla di magico: il cervello continua a fare il suo lavoro neurale. Cambia cosa “deve fare” il cervello. Per il cognitivismo deve costruire modelli e calcolare; per l’alternativa deve estrarre invarianti dall’accoppiamento sensorimotorio. La differenza è di carico computazionale e di natura del processo: meno lavoro interno, più lavoro nell’accoppiamento al mondo.

L’angolo operativo è importante perché mostra che il programma alternativo non è solo critica: ha proposte costruttive (subsumption funziona, robotic foundation models contemporanei integrano embodiment, decisione percettiva è modellata bene dal drift-diffusion dynamicist). Non è filosofia analitica disincarnata: ha programmi di ricerca attivi.

I due angoli convergono. Il primo dice perché il cognitivismo classico potrebbe essere ontologicamente sbagliato. Il secondo dice come si fa AI/cognitive science alternativa che produce risultati concreti.

Sei sotto-sezioni, una per ciascuno dei programmi principali, più la critica heideggeriana di Dreyfus come trasversale, e una sintesi 4E come framework contemporaneo. Per orientamento preliminare: i programmi attaccano selettivamente diverse tesi del cognitivismo classico. La tabella sotto mappa il fronte.

TradizioneAttacca rappresentazioni interneAttacca sostrato-indipendenzaAttacca internalismo
Ecological psychology (Gibson)si (percezione diretta)parzialmente (info nel mondo)si (info ecologica)
Enactivism (Varela-Thompson-Rosch)si (no rappr. astratte)si (mente del corpo specifico)si (accoppiamento)
Subsumption (Brooks)si (no modello centrale)no (silicio va bene)si (mondo come modello)
Dynamicism (van Gelder)parzialmente (no simboli discreti)parzialmente (sistema continuo)parzialmente
Embodied (Lakoff)parzialmente (rappr. corporee)si (mente del corpo)parzialmente
Embeddedno (rappr. ridotte)nosi (ambiente strutturato)
Extended (Clark-Chalmers)nonosi (oltre cranio)

Embedded ed extended sono trattati in mente-estesa. Il capitolo qui copre le altre famiglie + le critiche convergenti (Dreyfus heideggeriana). Va tenuta ferma una distinzione chiave: il fronte è alleato anti-cognitivismo, non programma unitario. Le critiche dei programmi a vicenda sono spesso più forti delle critiche al bersaglio comune.

James Jerome Gibson nasce a McConnelsville, Ohio, nel 1904. Smith College 1928-1949, poi Cornell fino alla morte nel 1979. La svolta arriva durante la seconda guerra mondiale, quando Gibson lavora alla Air Forces Aviation Psychology Program studiando il problema dell’atterraggio degli aerei. Il pilota deve giudicare distanze e velocità per atterrare in modo sicuro. Domanda standard cognitivista: come ricostruisce il mondo 3D dall’immagine 2D povera? Conclusione gibsoniana: non lo ricostruisce. Legge direttamente strutture invarianti del flusso ottico durante il movimento (velocità di espansione dell’immagine retinica codifica time-to-contact, pattern radiale del flow codifica direzione di movimento).

Tesi della percezione diretta. La retina che riceve immagine statica povera è artefatto del laboratorio. Nel mondo reale l’osservatore si muove e l’optic array si modifica nel tempo. Il flusso ottico (optic flow) — il pattern di cambiamento dell’array ottico durante il movimento dell’osservatore — contiene direttamente l’informazione che il cervello cognitivista doveva ricostruire: profondita, struttura, distanza, time-to-contact. Il sistema percettivo non costruisce, “risuona” con l’informazione strutturata nell’array. Il termine usato da Gibson, mutuato dalla cibernetica: resonance.

Va marcato il registro: percezione diretta non significa percezione magica. Il sistema nervoso processa l’input. Ma il processamento non costruisce rappresentazioni intermedie del mondo: estrae invarianti dal flusso e li usa per guidare l’azione. La differenza con il cognitivismo non è meccanica (entrambi processano), è ontologica: per Gibson l’informazione è nell’ambiente, non nella testa.

Affordances. Concetto più famoso di Gibson, introdotto in The Senses Considered as Perceptual Systems (1966) e maturato in The Ecological Approach (1979 cap 8). Definizione canonica (Gibson 1979 p. 127):

“The affordances of the environment are what it offers the animal, what it provides or furnishes, either for good or ill. The verb to afford is found in the dictionary, but the noun affordance is not. I have made it up.”

Un’affordance è una possibilità di azione che l’ambiente offre all’agente specifico. Una sedia offre il sedersi a un umano adulto: ha l’altezza giusta (una sedia da bar non offre il sedersi a un bambino piccolo), una superficie piana, regge il peso. La stessa sedia non offre il sedersi a un cavallo (troppo piccola), né ad un atomo. Le affordances non sono né proprietà intrinseche dell’oggetto né stati interni dell’agente: sono proprietà relazionali agente-ambiente.

Punto sottile e centrale per la critica al cognitivismo: per percepire una sedia come “sedibile” non serve costruire una rappresentazione interna “sedia + concetto del sedersi + inferenza causale”. Si percepisce direttamente l’affordance del sedersi. Vedere e fare sono accoppiati alla radice — la percezione è “for action”, non “for representation”.

Bill Warren (Brown University), in “Perceiving affordances: visual guidance of stair climbing” (Journal of Experimental Psychology: Human Perception and Performance, 1984), ha mostrato sperimentalmente che le persone percepiscono affordances “stair-climbability” in funzione del rapporto fra altezza del gradino e lunghezza della propria gamba, con un rapporto critico di 0.88. E’ uno dei pochi paper sperimentali che misura affordances quantitativamente.

Critica al cognitivismo. Gibson ha tre critiche specifiche al cognitivismo classico. Primo, presuppone input povero; ma l’optic array dinamico è ricco di invarianti, basta saperli rilevare. La povertà dell’input è artefatto del laboratorio. Secondo, separa percezione e azione; per Gibson sono due lati della stessa cosa (percepiamo per agire, agiamo per percepire). Terzo, astrae il soggetto dall’ambiente; lo studia in laboratorio in isolamento. Gibson insiste sulla ecological scale: l’organismo si studia nella sua nicchia ecologica.

Influenze e seguito. Eleanor Jack Gibson (1910-2002), sua moglie e collega, sviluppa indipendentemente “perceptual learning” (libro omonimo del 1969) ed è figura paritaria nel programma, anche se la storiografia tradizionale la subordina. Eredità di Gibson nella linea diretta: Edward Reed (1954-1997, biografo intellettuale, James J. Gibson and the Psychology of Perception 1988), Michael Turvey (1942-2023, ecological dynamics, applicazione a controllo motorio), Bill Warren (Brown University, sperimentazione su affordances quantitative), Anthony Chemero (Radical Embodied Cognitive Science, MIT Press 2009, sintesi gibsoniana + dynamicism), Karen Adolph (NYU, ecological psychology applicata a sviluppo infantile: camminare, gattonare, cadere).

Va marcata una distinzione storiografica: “ecological psychology” gibsoniana e “ecological cognitive science” contemporanea sono parente ma non sovrapponibili. Chemero 2009 sostiene che ecological psychology gibsoniana puramente intesa rifiuti tutte le rappresentazioni; la cognitive science contemporanea inclusiva di affordances spesso le accoglie come stati neurali distribuiti. La tensione fra purismo gibsoniano e pragmatismo contemporaneo attraversa il campo da decenni.

Tre autori, tre profili distinti.

Francisco Varela (1946-2001), biologo e neuroscienziato cileno. Lavora con Maturana a Santiago dal 1968, sviluppano insieme l’autopoiesis (concetto formulato in spagnolo nel 1972, in inglese in Autopoiesis and Cognition, Reidel 1980): un sistema autopoietico è organizzato in modo da produrre continuamente i propri componenti. Una cellula è autopoietica: produce le proprie membrane, enzimi, organelli. Un cristallo non lo è. L’autopoiesis sarà la base biologica del futuro enactivism. Varela esiliato dal Cile dopo il colpo di stato di Pinochet (1973), passa per USA, poi Parigi (CNRS, dal 1986). Influenza importante sul Mind and Life Institute (dialoghi con il Dalai Lama). Muore di cancro al fegato a 54 anni nel 2001.

Evan Thompson (filosofo canadese, 1962-), figlio di William Irwin Thompson. PhD a Toronto, cattedra alla University of British Columbia. Dopo il libro del 1991, svilupperà la posizione enactivist in solitaria con Mind in Life (Harvard UP, 2007) e Waking, Dreaming, Being (Columbia UP, 2015).

Eleanor Rosch (psicologa americana, 1938-), UC Berkeley. Famosa indipendentemente per la prototype theory (anni Settanta): le categorie cognitive non sono insiemi nettamente definiti da condizioni necessarie e sufficienti (visione classica aristotelica), ma centrate su prototipi con confini sfumati. Pratica buddhista da decenni, porta nel libro la connessione con Madhyamaka.

Il libro del 1991. The Embodied Mind: Cognitive Science and Human Experience (MIT Press, Cambridge MA, 1991) è organizzato in tre parti. Parte I: critica del cognitivismo computazionale. La mente non è un sistema astratto manipolatore di simboli; mancano corpo (embodiment) e situatedness. Parte II: esposizione dell’enaction. La cognizione è “messa in atto” attraverso accoppiamento dinamico organismo-ambiente. Slogan poetico (mutuato da Antonio Machado): “we lay down a path in walking”. Parte III: connessione con phenomenology (Husserl, Merleau-Ponty) e con Madhyamaka buddhista; via per una “groundlessness” senza nichilismo.

Tre concetti chiave. Enaction: termine nuovo (Varela conia il neologismo). Enaction = “bringing forth” attraverso l’azione. La cognizione non è rappresentazione di un mondo pre-dato, è messa in atto di un mondo attraverso la storia di accoppiamento sensorimotorio. Sense-making: la cognizione è costruzione attiva di significato. Per un batterio, il glucosio non è “una molecola di certa formula” ma “il significato di andare avanti” (verso una concentrazione maggiore). Il significato emerge dalla relazione fra struttura del batterio (chemiotassi) e struttura dell’ambiente (gradienti chimici). Autopoiesis: dove c’e vita c’e cognizione minimale. Posizione poi rivista da Thompson 2007 (“life-mind continuity thesis”): cognizione è continuum dalla vita batterica fino alla mente umana.

L’enactivism va distinto da varianti deboli dell’embodied. Lakoff-Johnson accettano rappresentazioni interne, le considerano corporee. Enactivism rifiuta le rappresentazioni in toto: non ci sono modelli interni del mondo, solo accoppiamento dinamico. Nel libro stesso Rosch è meno radicale (mantiene rilevanza dei concetti come categorie); Varela e Thompson tirano più forte.

Sviluppi 2000-2025. L’enactivism si articola in tre filoni. Sensorimotor enactivism: Kevin O’Regan (psicologo francese) e Alva Noe (filosofo americano, 1964-), “A Sensorimotor Account of Vision and Visual Consciousness” (BBS 2001) e Noe Action in Perception (MIT Press, 2004). La percezione visiva è costituita dalla padronanza implicita di “regolarità sensorimotorie”: vedere rosso è “il modo in cui un certo pattern di stimolazione retinica varia rispetto al mio movimento”. Empiricamente più trattabile dell’autopoietic. Autopoietic enactivism: Ezequiel Di Paolo (filosofo argentino, allora Sussex), Hanne De Jaegher, Tom Froese. Sviluppano la linea fedele a Varela; “participatory sense-making” (De Jaegher-Di Paolo 2007, Phenomenology and the Cognitive Sciences) per cognizione sociale. Radical enactivism: Daniel Hutto e Erik Myin, Radicalizing Enactivism: Basic Minds Without Content (MIT Press, 2013). La cognizione di base (percezione, emozione, azione) non coinvolge alcuna rappresentazione contentful. Solo le forme superiori (linguaggio, narrazione) usano contenuti, e questi sono pubblici, sociali, non interni.

Critiche all’enactivism. Eliminativismo eccessivo: rifiutare le rappresentazioni in toto sembra escludere capacità cognitive di alto livello (matematica, pianificazione, immaginazione off-line). Critici: Clark 1997, Rowlands 2010. Vaghezza del concetto di sense-making: come si misura, come si testa empiricamente? Adams 2010. Connessione buddhista controversa: alcuni critici (Smith 1991 in BBS commentary) considerano la connessione Madhyamaka una sovrapposizione esoterica non costitutiva. Generalizzazione life-mind problematica: dire che un batterio “fa cognizione” perché fa sense-making (chemiotassi) sembra abusare del termine. Il dibattito interno enactivism — tra autopoietic e sensorimotor, tra radical e moderato — è ancora vivo nel 2026.

Rodney Allen Brooks nasce ad Adelaide, Australia, nel 1954. PhD a Stanford con J.A. Robinson sulla logica (1981). Carriera al MIT dal 1984, dirige il MIT AI Lab dal 1997 al 2007. Co-fondatore di iRobot (1990), Rethink Robotics (2008), Robust.AI (2018). Roomba (2002), il primo aspirapolvere robot di massa, è iRobot ed è figlio dei principi della subsumption.

Negli anni Ottanta lavora al MIT AI Lab quando il lab è dominato dalla GOFAI di Patrick Henry Winston, Marvin Minsky, ecc. Brooks fa esplicita opposizione: i suoi robot sono il manifesto di una via alternativa. Carattere combattivo, prosa polemica.

La subsumption architecture (1986). Brooks A.R., “A Robust Layered Control System for a Mobile Robot”, IEEE Journal of Robotics and Automation 2:1, marzo 1986, pp. 14-23. Problema: costruire un robot mobile che si muove robustamente in un ambiente d’ufficio. Approccio standard GOFAI (sense-model-plan-act): percepisci, costruisci/aggiorna mappa, pianifica percorso, esegui. La pipeline è fragile, lenta, fatica con ambienti dinamici. Approccio Brooks: niente modello centrale, niente planner. Solo livelli di moduli sensorimotori reattivi, ognuno specializzato in un comportamento competente.

Architettura a livelli orizzontali. Layer 0 (livello base): “avoid obstacles”. Sensori a infrarossi misurano distanza, attuatori muovono il robot in direzione di minor ostacolo. Modulo che gira sempre, in tempo reale. Layer 1: “wander”. Sceglie direzioni casuali quando non c’e nulla da evitare. Costruito sopra Layer 0 ma non lo modifica direttamente: invia segnali agli stessi attuatori, e quando c’e conflitto Layer 0 vince. Layer 2: “explore”. Sceglie destinazioni e cerca di raggiungerle. Quando vuole muovere in una direzione, “subsume” l’output del Layer 1 (sostituisce il segnale random con un segnale orientato). Layer 0 può ancora interrompere se c’e ostacolo immediato.

Concetto chiave, il subsumption: un livello superiore può “sussumere” un livello inferiore, cioe sostituirne l’output quando vuole. Non sostituisce il livello inferiore: lo prende in prestito temporaneamente. Ogni livello è completo da solo (può funzionare anche senza livelli sopra), e i livelli aggiunti sono incrementi.

Robot dimostratori. Allen (MIT 1985), naviga robustamente in ambiente d’ufficio con tre layer. Herbert (1989), raccoglie lattine vuote da un piano e le porta a un cestino. Genghis (1989), robot a sei zampe che cammina su terreno irregolare; ogni zampa ha controllo semi-autonomo, il camminare emerge da accoppiamento dei moduli. Toto (1990), mappa spaziale topologica.

Il manifesto: “Intelligence Without Representation” (1991). Brooks R.A., “Intelligence without representation”, Artificial Intelligence 47, 1991, pp. 139-159. Il paper filosofico che esplicita il manifesto. Tesi centrale: l’intelligenza non richiede rappresentazioni interne complesse del mondo. L’AI simbolica ha sbagliato bersaglio. La cognizione è costruita “bottom-up” dall’accoppiamento diretto sensori-attuatori, e i comportamenti competenti emergono senza bisogno di un modello centrale.

Tre slogan canonici. “The world is its own best model”: invece di costruire e mantenere un modello interno del mondo (sempre incompleto, sempre obsoleto), accedi al mondo direttamente attraverso i sensori (sempre aggiornato). “Intelligence without reason” (titolo del paper Brooks 1991 IJCAI): la “ragionamento” non è componente centrale dell’intelligenza. La ragione è tarda nell’evoluzione, l’intelligenza percettivo-motoria è antica e fondamentale. “Elephants don’t play chess” (titolo Brooks 1990, Robotics and Autonomous Systems 6, pp. 3-15): gli elefanti sono intelligenti (riconoscono parenti, usano strumenti, ricordano percorsi per decenni) e non giocano a scacchi. L’intelligenza scacchistica simbolica formale che Newell-Simon e Deep Blue hanno perseguito non è centrale per intelligenza generale.

Limiti. L’approccio funziona molto bene per behavior reattivo (navigazione, avoidance, manipolazione semplice). Funziona molto meno bene per task che richiedono planning a lungo termine, ragionamento astratto, comunicazione linguistica. Costruire una casa richiede un piano (non solo riflessi). Risolvere un problema matematico richiede manipolazione astratta di simboli. Tenere conversazione su argomento generale richiede struttura linguistica composizionale. Brooks negli anni Duemila integra subsumption con elementi più ricchi: Cog (1993-2001) e Kismet (1998-2000), robot umanoidi con apprendimento, interazione sociale, attenzione. Brooks stesso riconosce in interviste che l’estremismo del 1991 era “polemica retorica utile per smuovere il campo”, non programma definitivo.

Filiazione: Heidegger via Dreyfus? Connessione concettuale: la critica di Brooks alla rappresentazione centrale è strutturalmente simile alla critica heideggeriana di Dreyfus (vedi sotto). Brooks ha frequentato Dreyfus al MIT? La risposta non è chiara. Letteratura informale (Anderson 2003, “Embodied Cognition: A Field Guide”) suggerisce filiazione indiretta. Dreyfus stesso in On the Internet (2001) accenna a influenza della sua critica sui roboticisti del MIT. Brooks nei suoi paper non cita Heidegger né Dreyfus. Disciplina storiografica: chiamare la connessione “convergenza concettuale”, non “filiazione documentata”. Brooks arriva alla critica della rappresentazione per via ingegneristica (frustrazione con la pipeline GOFAI), Dreyfus per via filosofica (lettura di Heidegger). I due punti di arrivo somigliano, ma il percorso è diverso.

Il caso Roomba. iRobot Roomba (2002 in poi) implementa subsumption in versione consumer. Versioni iniziali: layer reattivo “evita ostacolo”, layer “copri pavimento” via random walk + spirale. Niente mappa. Versioni successive (Roomba i7, j7, dal 2018) integrano SLAM completa per ottimizzare percorso, riconoscimento ostacoli con vision deep learning, integrazione cloud per scheduling. La subsumption pura è nicchia, l’integrazione con elementi più ricchi è la regola. Storia istruttiva: il Brooks puro del 1991 era polemica utile, l’ingegneria reale ibridizza.

Tim van Gelder, filosofo australiano, nato nel 1962. PhD a Pittsburgh nel 1989 sotto John Haugeland. Carriera all’University of Melbourne. Paper centrale: “What Might Cognition Be, If Not Computation?”, The Journal of Philosophy 92:7, luglio 1995, pp. 345-381. Co-autore (con Robert Port) dell’antologia Mind as Motion: Explorations in the Dynamics of Cognition (MIT Press, 1995).

Tesi. Cognitivismo classico: la cognizione è computazione discreta su stati simbolici discreti, scandita da passi successivi. Il modello è la macchina di Turing, il programma su computer digitale. Dynamicism: la cognizione è un sistema dinamico continuo che evolve nel tempo. Lo stato cognitivo è un punto in uno spazio degli stati continuo, e la sua evoluzione è descritta da equazioni differenziali (che dicono come lo stato cambia nel tempo). Il modello formale è la teoria dei sistemi dinamici.

Il dynamicism non rifiuta le rappresentazioni in toto come l’enactivism puro. Le considera come stati transitori del sistema dinamico, traiettorie nello spazio degli stati. Ma rifiuta la rappresentazione discreta-simbolica come modello giusto.

Il governatore di Watt: la metafora ontologica. Esempio canonico di van Gelder. Considera il problema di regolare la velocità di una macchina a vapore (mantenerla costante nonostante carichi variabili).

Soluzione computazionale: un dispositivo computazionale misura la velocità corrente, calcola la differenza dalla velocità target, calcola di quanto aprire/chiudere la valvola del vapore in proporzione, invia il comando. Algoritmo discreto: misura, calcola, agisci. E’ il PID controller standard.

Soluzione dynamicist: il governatore centrifugo di James Watt (1788) è un dispositivo meccanico che fa la stessa cosa senza calcolo. Due sfere ruotano attorno a un asse verticale, collegate al motore. Quando la velocità aumenta, le sfere si alzano per forza centrifuga, sollevano un manicotto che chiude parzialmente la valvola. Quando la velocità cala, le sfere ricadono, riaprono la valvola. La regolazione è continua, fisica, senza misurazione discreta o calcolo simbolico.

Van Gelder usa il governatore di Watt non come analogia retorica ma come metafora ontologica della cognizione. Punto chiave: il governatore non rappresenta la velocità, né calcola la differenza dalla velocità target. La regolazione è implementata nella struttura fisica del dispositivo, in modo continuo. Variabili rilevanti (velocità, posizione delle sfere, angolo della valvola) sono accoppiate da relazioni differenziali fisiche, non da computazioni.

Tesi van Gelder: la cognizione naturale (umano, animale) è molto più simile al governatore di Watt che al PID controller. Riflessi, controllo motorio, decisione percettiva sono tutti continui-dinamici, non discreti-computazionali. Il modello computazionale è una caricatura digitalizzata di un fenomeno analogico.

Esempi e applicazioni. Tre esempi standard del dynamicism. Decisione percettiva: il drift-diffusion model (Roger Ratcliff 1978) descrive la decisione fra due alternative come accumulo continuo di evidence finche supera una soglia. Modello empiricamente verificato in psicologia sperimentale. Controllo motorio: raggiungere un oggetto con la mano. Il braccio non esegue una traiettoria pre-pianificata, la aggiusta dinamicamente in funzione di feedback continuo. Modelli da Bernstein (anni Trenta) a Kelso (anni Ottanta-Novanta). Sviluppo cognitivo: Esther Thelen (1941-2004) e Linda B. Smith, A Dynamic Systems Approach to the Development of Cognition and Action (MIT Press, 1994). Camminare emerge da accoppiamento dinamico fra sistema neuromuscolare in maturazione e gravità; l’A-not-B error nei bambini di 8 mesi è effetto della dinamica continua del sistema motorio + memoria, non errore concettuale.

Critiche. Critiche al dynamicism. Primo: tutti i sistemi possono essere descritti come sistemi dinamici, anche un computer digitale (con stato discreto e transizioni discrete formalmente sono sistemi dinamici). La distinzione “continuo vs discreto” non taglia profondamente. Critica di Chris Eliasmith 1996, “The third contender: a critical examination of the dynamicist theory of cognition”, Philosophical Psychology. Secondo: dove si fermano le rappresentazioni? Se il sistema dinamico non rappresenta nulla, come spiega la pianificazione, l’immaginazione, il ragionamento controfattuale? Il dynamicism puro fatica con cognizione “off-line”. Terzo: per molti task, il modello computazionale e quello dinamico sono empiricamente equivalenti. La scelta diventa estetica/metodologica più che ontologica. Risposta dynamicist: la differenza non è meramente descrittiva. La struttura matematica usata (equazioni differenziali continue vs algoritmi discreti) suggerisce esperimenti diversi e cattura fenomeni diversi (multistabilità, biforcazioni, attrattori, fenomeni di sincronizzazione fra oscillatori neurali) che il computazionalismo non vede. Esempio concreto: Scott Kelso Dynamic Patterns (MIT Press, 1995) modella le transizioni di fase nel coordinamento bimanuale (chiedi a una persona di muovere indici alternati, accelerale il ritmo: a una certa frequenza critica scattano in fase) come biforcazione classica, fenomeno che cattura aspetti che un modello discreto non vedrebbe.

George Lakoff (linguista cognitivo americano, 1941-, UC Berkeley) e Mark Johnson (filosofo americano, 1949-, University of Oregon) sviluppano negli anni 1980-2000 il programma della conceptual metaphor.

Il programma. Tre libri. Metaphors We Live By (University of Chicago Press, 1980): le metafore non sono ornamenti retorici, sono strutture concettuali costitutive del pensiero. Esempi canonici: “ARGOMENTO E’ GUERRA” (“hai vinto la discussione”, “ha attaccato la mia tesi”); “TEMPO E’ DENARO” (“spendere tempo”, “investire tempo”); “AMORE E’ UN VIAGGIO” (“la nostra relazione è a un bivio”). Philosophy in the Flesh (Basic Books, 1999): manifesto applicato alla filosofia. Where Mathematics Comes From (con Rafael Núñez, Basic Books, 2000): l’embodied applicato alla matematica.

Tesi. Il pensiero astratto non è indipendente dal corpo. E’ costruito da metafore concettuali ancorate a schemi sensorimotori (image schemas) come CONTAINER, PATH, SOURCE-PATH-GOAL, FORCE, BALANCE, UP-DOWN. Esempio: il concetto astratto di “categoria” è costruito sulla metafora CATEGORIA E’ CONTENITORE (gli oggetti sono “dentro” o “fuori” la categoria). Lo schema CONTAINER deriva da esperienza corporea diretta. Il pensiero astratto eredità la struttura logica dello schema corporeo.

Implicazioni: i concetti non sono sostrato-indipendenti; cambiare il corpo cambia i concetti accessibili. La logica formale è un caso particolare, non il modello universale del pensiero. Il dualismo cartesiano è falso anche al livello dei concetti: mente e corpo sono inseparabili anche per il pensiero astratto.

Esperimenti embodiment. La ricerca sperimentale anni Duemila ha prodotto esperimenti notevoli, alcuni successivamente in crisi di replicazione. Lapis tra i denti (Strack-Martin-Stepper 1988, Journal of Personality and Social Psychology): tenere un lapis fra i denti orizzontalmente attiva muscoli del sorriso e produce stato emotivo più positivo. Wagenmakers et al. 2016 multilab fallisce a replicare. Calore fisico/sociale (Williams-Bargh 2008, Science): tenere una tazza calda induce a giudicare le persone come “calde”. Replicazione controversa.

Critiche. Replication crisis post-2015 ha messo in dubbio molti effetti embodied. Critiche linguistiche (Pinker 2007, The Stuff of Thought) considerano la conceptual metaphor sopravvalutata: dire “ARGOMENTO E’ GUERRA” descrive il modo di parlare, non dimostra che il pensiero usi la struttura metaforica. Estremismo: ridurre matematica avanzata a metafore corporee (Lakoff-Núñez 2000) sembra forzare; critiche da matematici (Reuben Hersh) e filosofi della matematica.

Hubert Lederer Dreyfus (1929-2017), filosofo americano, UC Berkeley dal 1968. PhD a Harvard 1964 (Husserl). MIT 1960-68 (l’ambiente che attaccava). Specialista di Heidegger. Fratello Stuart Dreyfus (matematico Berkeley, co-autore di alcuni libri).

Il libro: What Computers Can’t Do (1972). Hubert Dreyfus, What Computers Can’t Do: A Critique of Artificial Reason, Harper & Row, New York, 1972 (seconda edizione 1979 con prefazione che risponde alle critiche; terza edizione What Computers Still Can’t Do, MIT Press, 1992). Origine: rapporto RAND del 1965 (“Alchemy and Artificial Intelligence”) commissionato a Dreyfus per valutare lo stato dell’AI, pubblicato come libro.

Tesi centrale: l’AI simbolica fraintende la natura dell’intelligenza umana. Gli umani agiscono nel mondo non per applicazione di regole esplicite ma per coping pratico (Heidegger: zuhanden, ready-to-hand), un modo di essere-nel-mondo che precede ogni rappresentazione. Il background implicito di significati, abitudini, contesto culturale non è formalizzabile in regole esplicite. Quindi l’AI simbolica, che assume che l’intelligenza si possa codificare in regole, sbaglia bersaglio.

Quattro assunzioni che Dreyfus attribuisce all’AI simbolica e che critica. Assunzione biologica: il cervello processa informazione in modo discreto come un computer; criticata perché i neuroni sono dispositivi analogici. Assunzione psicologica: la cognizione umana è computazione su rappresentazioni mentali simboliche; criticata perché l’esperienza fenomenologica non rivela rappresentazioni interne, rivela un essere-nel-mondo coinvolto in attività. Assunzione epistemologica: la conoscenza umana può essere formalizzata in regole esplicite; criticata perché il background implicito che rende possibile l’applicazione di qualsiasi regola è a sua volta non formalizzabile (regresso delle regole). Assunzione ontologica: il mondo può essere descritto come insieme di fatti atomici determinati indipendenti dal soggetto; criticata heideggerianamente perché il mondo non è un insieme di fatti ma un campo di significati pratici relativi a forme di vita.

Phronesis e expertise. Dreyfus sviluppa con il fratello Stuart il Dreyfus model of skill acquisition (1980): l’apprendimento di una competenza passa da fasi novice (regole esplicite) a fasi expert (intuizione situata, no regole). Esempi: guidare l’auto, scacchi, decisione clinica medica, decisione militare. L’expert non applica regole. Ha sviluppato una sensibilità situata (phronesis aristotelica + know-how heideggeriano) che gli fa “vedere” cosa fare in un contesto. Questa sensibilità non è formalizzabile: se la chiedi all’expert, lui produce una razionalizzazione post-hoc che è meno della sua competenza.

Recezione. Reazione iniziale dell’AI mainstream (1972): liquidatoria. Recensioni vetrioliche. Dreyfus diventa bete noire del MIT AI Lab. Eppure molte previsioni di Dreyfus si sono avverate: l’AI simbolica ha effettivamente fallito sui task generali (vedi secondo-inverno-ai). Il problema del common sense reasoning, che Dreyfus aveva indicato come insormontabile per l’approccio simbolico, ha effettivamente bloccato CYC e progetti simili. Negli anni Duemila Dreyfus stesso è più cauto. In On the Internet (2001) apprezza il connessionismo come più vicino alla sua visione, ma resta critico sui limiti del deep learning per cognizione di alto livello. Brooks 1991 lo cita esplicitamente. Va marcata la classe di affermazioni: la connessione Heidegger-Dreyfus-Brooks è convergenza concettuale (i programmi arrivano a critiche simili), non filiazione documentata (Brooks non cita Heidegger nei paper tecnici).

Negli anni Duemila il fronte anti-cognitivista classico si organizza sotto la sigla 4E: Embodied, Embedded, Extended, Enactive. Riferimento: Albert Newen, Leon De Bruin, Shaun Gallagher (eds.), The Oxford Handbook of 4E Cognition (Oxford University Press, Oxford, 2018).

Le quattro E. Embodied: la mente è del corpo (Lakoff, Gallagher How the Body Shapes the Mind 2005). Embedded: la mente dipende dal contesto, ma resta interna all’agente (Rupert 2004 HEMC). Extended: la mente si estende in strumenti (Clark-Chalmers 1998, vedi mente-estesa). Enactive: la mente emerge da accoppiamento dinamico (Varela-Thompson-Rosch 1991, Di Paolo).

Critiche al 4E come marketing: le quattro E coprono posizioni filosoficamente eterogenee, mescolarle oscura più di chiarire (Aizawa 2018). Difesa: il 4E è utile come bandiera anti-cognitivismo, riconosce parentela tra famiglie distinte, mantiene la distinzione interna senza disperdere il fronte comune. Ogni “E” ha propri sostenitori e critici; il movimento 4E le tratta come famiglia opposta al cognitivismo classico (mente come elaborazione di rappresentazioni interne nel cervello individuale).

Tre esempi concreti, eterogenei, ciascuno illustra un programma diverso del fronte alternativo.

Un adulto entra in una stanza con tre oggetti: una sedia da cucina, una mensola alta due metri, una porta aperta. Senza pensarci esplicitamente, percepisce la sedia come “sedibile”, la mensola come “non raggiungibile a mano”, la porta come “passabile”. Le tre percezioni guidano direttamente le opzioni di azione disponibili.

Cognitivismo classico spiegherebbe così: il sistema visivo riceve immagini retiniche, le elabora attraverso primal sketch, 2.5D sketch, 3D model (Marr 1982). Costruisce rappresentazioni degli oggetti. Confronta le rappresentazioni con prototipi memorizzati (“sedia”, “mensola”, “porta”). Inferisce da queste categorie le azioni possibili usando conoscenza pregressa (“le sedie servono per sedersi”). Decide.

Spiegazione gibsoniana: la sedia è percepita direttamente come “sedibile” perché le sue proprietà fisiche (altezza, superficie piana, capacità di sostenere peso) si combinano con le proprietà corporee dell’agente (altezza dell’anca, peso, schema corporeo) per costituire l’affordance “sit-on-able”. L’agente non costruisce una rappresentazione interna “sedia”; rileva l’affordance dall’optic array. Stessa storia per “mensola troppo alta” (relazione altezza mensola/altezza braccio) e “porta passabile” (relazione larghezza porta/larghezza spalle). Tre affordances, tre opzioni di azione, percezione diretta.

Cosa cambia operativamente: l’esperimento di Warren 1984 mostra che umani giudicano “stair-climbability” in funzione del rapporto altezza gradino/lunghezza gamba con valore critico 0.88, indipendentemente dall’altezza assoluta del gradino o dalle istruzioni esplicite ricevute. La percezione dell’affordance è calibrata sul corpo specifico, automaticamente, senza inferenza cosciente. Esattamente ciò che Gibson predice e che il cognitivismo classico non spiega senza aggiungere meccanismi ad hoc.

Genghis è un robot a sei zampe costruito al MIT AI Lab nel 1989 da Brooks e Mataric. Pesa circa 1 kg, ha sensori a infrarossi su ogni zampa per rilevare contatto col terreno, e nessun computer centrale che pianifichi il camminare. Ogni zampa ha la sua microcontrol unit. Il camminare emerge da accoppiamento dei sei moduli, con regole locali del tipo “se tutte le altre zampe toccano terrà, posso alzare la mia”; “se la mia zampa è alzata, deve scendere e toccare terrà”; “se sento contatto con terrà, riferisco al modulo del peso”.

Risultato: Genghis cammina su terreno irregolare, supera piccoli ostacoli, recupera se cade su un fianco. Il comportamento “camminare in modo coordinato” non è programmato esplicitamente da nessuna parte: emerge dall’interazione locale dei sei moduli e dell’ambiente fisico.

Confronto con approccio tradizionale: un robot a sei zampe deliberativo costruirebbe modello cinematico interno, calcolerebbe sequenza ottimale di movimenti zampa, eseguirebbe. Approccio più pulito teoricamente, più fragile nella pratica (caduta = ricalcolo da capo, terreno imprevisto = pianificatore fallisce). Genghis è robusto perché non pianifica: reagisce.

Brooks 1991 usa Genghis come argomento concreto: l’intelligenza percettivo-motoria (camminare) non richiede modello centrale del mondo. Si può costruire bottom-up a partire da accoppiamento sensori-attuatori. La robotica deliberativa GOFAI parte dall’alto e fatica; la subsumption parte dal basso e funziona.

Caveat onesto: Genghis cammina, non risolve problemi di alto livello. La subsumption funziona per behavior reattivo, fatica con planning a lungo termine. La traiettoria della robotica post-Brooks (2000-2025) è stata di integrazione: subsumption per i moduli reattivi di basso livello + planner deliberativo + apprendimento (deep RL, behavior cloning, foundation models) per i livelli superiori. Roomba contemporaneo (i7, j7) è esattamente questa ibridazione.

Una macchina a vapore industriale (fine Settecento) deve mantenere velocità costante nonostante carichi variabili (telaio che lavora, treno che sale una salita). James Watt nel 1788 inventa il governatore centrifugo: due sfere metalliche montate su un albero verticale che ruota in solidale con il motore. Quando la velocità aumenta, le sfere si alzano per forza centrifuga. Le sfere sono collegate meccanicamente alla valvola del vapore: quando si alzano, chiudono parzialmente la valvola, riducendo l’apporto di vapore al motore, che rallenta. Quando le sfere ricadono (velocità bassa), riaprono la valvola. Sistema autoregolante puramente meccanico.

Domanda van Gelder: il governatore di Watt rappresenta la velocità del motore? Calcola la differenza dalla velocità target? Risposta: no. La velocità del motore non è rappresentata da nessuno stato interno discreto del governatore. La regolazione è implementata nella struttura fisica del dispositivo, in modo continuo. Le variabili rilevanti (velocità angolare, posizione delle sfere, angolo della valvola) sono accoppiate da relazioni differenziali fisiche (forza centrifuga proporzionale al quadrato della velocità angolare, posizione del manicotto proporzionale alla forza centrifuga, ecc.).

Confronto con un PID controller digitale moderno: il PID controller misura velocità (sample), confronta con target (sottrazione), calcola contributo proporzionale-integrale-derivativo (operazioni aritmetiche), invia comando alla valvola (output). Sequenza discreta di passi computazionali su rappresentazioni numeriche.

Tesi van Gelder: il governatore di Watt e il PID controller risolvono lo stesso problema in modi ontologicamente diversi. Il governatore è un sistema dinamico continuo. Il PID è un computer digitale. Per van Gelder, la cognizione naturale (umano, animale) è molto più simile al governatore che al PID. Il modello computazionale è una caricatura digitalizzata di un fenomeno analogico.

Esempio applicato: la decisione fra due opzioni in un esperimento di psicologia (es. schiacciare bottone rosso o verde quando vedi uno stimolo). Il drift-diffusion model (Ratcliff 1978) descrive il processo come accumulo continuo di evidence, con stato cognitivo che deriva nello spazio degli stati finche non supera una soglia che determina la scelta. Modello empiricamente verificato, predice tempi di reazione, errori, effetti di prior. Modello computazionale alternativo (Bayesian inference discreto) predice approssimativamente la stessa cosa, ma il drift-diffusion cattura meglio la dinamica temporale fine-grained. Empiricamente, il dynamicism segna un punto.

[DATATO 2026-04] Le sezioni qui sotto descrivono lo stato delle linee di ricerca contemporanee al momento di scrittura. La filiazione fra le critiche embodied del Novecento e le linee attuali di robotic foundation models, embodied AI, predictive processing è analogia funzionale convergente, non filiazione storica documentata caso per caso. Cito i nomi specifici dove esiste citazione esplicita; altrove marco la connessione come parentela concettuale.

Il 2024-2026 ha visto la wave dei robotic foundation models: Tesla Optimus (versioni v1-v3 2022-2024), Figure 02 (2024), Boston Dynamics Atlas elettrico (2024), 1X Neo (2024), Physical Intelligence pi-zero (2024), Google DeepMind RT-2 (2023) e SIMA (2024), OpenVLA (2024). Sistemi che integrano language models / vision-language models con embodiment fisico, controllo motorio, sim-to-real transfer.

Disciplina storiografica: questi sistemi non citano Brooks 1991, Varela 1991, Gibson 1979 esplicitamente. La connessione con il programma embodied del Novecento è analogia funzionale, non filiazione documentata. Il ritorno dell’embodiment come tema centrale dell’AI nel 2024-2026 è fenomeno parallelo, non discendenza diretta. Cio detto, la convergenza concettuale è notevole: dopo decenni di “AI nel cloud” (LLM puramente testuali), il pendolo torna verso il corpo. Le intuizioni che Brooks martellava nel 1991 (“camminare prima di ragionare”, “il mondo è il modello”) tornano sotto altre forme nei robot generalisti contemporanei.

La posizione embodied/enactivist contemporanea ha una critica precisa agli LLM puramente testuali: mancano embodiment. Sono pure-text systems, addestrati su corpus testuali, senza accoppiamento sensorimotorio diretto al mondo. Per la critica embodied, questo significa che gli LLM non possono avere vera cognizione, vera comprensione, vero common sense.

Voci principali. Yann LeCun (Meta AI Chief Scientist): da anni sostiene che gli LLM autoregressivi sono approccio sbagliato per AGI. Manca world model embodied. Propone JEPA (Joint Embedding Predictive Architecture) come alternativa che impara world model senza generation autoregressiva pura. Position paper “A Path Towards Autonomous Machine Intelligence” (2022) è il riferimento. Emily Bender, Timnit Gebru e altri in “On the Dangers of Stochastic Parrots” (FAccT 2021): gli LLM sono pappagalli stocastici, riproducono pattern statistici senza comprensione. La critica è affine all’embodied (manca grounding) ma di radici diverse (linguistica, fairness). Gary Marcus (Robust.AI): da decenni critica i limiti del deep learning su composizionalità, common sense, planning. Propone neuro-simbolico come integrazione.

Counter-critica. LLM multimodali (GPT-4o, Gemini, Claude 3.5/4, ecc.) integrano vision, audio, parziale embodiment. Robotic foundation models (RT-2, OpenVLA) integrano LLM con sensori-attuatori. Andy Clark in lavori recenti sostiene posizione mediata: LLM hanno qualche grounding (via training su dati multimodali), non hanno l’embodiment fisico, ma la divisione binaria “embodied o no” è sbagliata, è un continuum.

Nota di disciplina: la critica embodied agli LLM si appoggia su intuizioni filosofiche (Varela, Lakoff) ma raramente le cita esplicitamente. La convergenza fra “manca grounding sensoriale” (Harnad 1990, vedi symbol-grounding) e “manca embodiment” (Varela, Brooks) è parentela concettuale, non identità: Harnad accetterebbe LLM multimodali grounded come parziale soluzione del symbol grounding; un enactivist più radicale negherebbe che multimodalità basti.

Andy Clark Surfing Uncertainty: Prediction, Action, and the Embodied Mind (Oxford UP, 2016), Karl Friston The Free-Energy Principle (vari paper 2005-presente), Jakob Hohwy The Predictive Mind (Oxford UP, 2013).

Tesi del predictive processing: il cervello è una macchina predittiva che minimizza l’errore di predizione fra modello generativo interno e input sensoriali. Il modello genera predizioni top-down; le aree sensoriali confrontano con input e calcolano errore; l’errore aggiorna il modello — oppure l’azione modifica l’input per ridurre errore (active inference).

Predictive processing si presenta come integrazione di embodied + computazionalismo: c’e modello generativo (computazionale), ma è costantemente accoppiato all’ambiente via active inference (embodied). La letteratura contemporanea è divisa su quanto PP sia internalist o embodied. Clark 2016 sostiene compatibilita con embodied/extended; Hohwy 2013 è più scettico, perché PP chiude i confini dell’agente al “Markov blanket” dell’organismo. Comunque sia, PP è diventato uno dei framework più influenti in cognitive science contemporanea, percepito come ponte fra le due famiglie.

Il termine “affordance” è diventato standard in HCI (Human-Computer Interaction) dopo Donald Norman, The Design of Everyday Things (Basic Books, 1988). Norman ha pero modificato il concetto rispetto a Gibson: parla di “perceived affordances”, Gibson le considera reali indipendenti dalla percezione. Il design contemporaneo di interfacce parla di affordances in senso normaniano (cosa il design comunica come “facibile”); la psicologia ecologica resta fedele a Gibson (cosa l’ambiente offre realmente).

In robotica e AI, paper recenti su “affordance learning” (cosa offre ogni oggetto a un robot in termini di azioni), “language-conditioned affordances”, “vision-language-action models” come RT-2 e OpenVLA implementano implicitamente principi gibsoniani. E’ uno dei punti dove la tradizione gibsoniana è implicitamente operativa nei sistemi contemporanei, anche senza citazione diretta.

Una connessione conclusiva con mente-estesa e con la pratica dell’agent coding contemporaneo. Quando un agente LLM moderno (Claude Code, Cursor agent, OpenAI Operator) usa tool — filesystem come memoria, browser per navigare il web, code execution per eseguire test, sub-agent per delegare — istituisce un accoppiamento dinamico fra modello interno e ambiente. Il modello non risolve un problema di programmazione costruendo internamente un modello completo del codebase: legge file, esegue, osserva, riadatta. Il codebase è “il suo modello migliore” (Brooks 1991), il filesystem è “ancoraggio per cognizione” (Hutchins 1995, Clark-Chalmers 1998).

Disciplina storiografica esplicita: nessuno dei progettisti di Claude Code, Cursor, ecc. cita Brooks o Varela o Gibson. La connessione è parentela concettuale e analogia funzionale, non filiazione documentata. Ma la struttura è notevole: il pattern di tool use agentico assomiglia molto più a accoppiamento embodied/extended che a cognizione cognitivista internalista. Quando uno sviluppatore osserva Claude Code che modifica un file, esegue test, legge il fallimento, modifica di nuovo, sta osservando qualcosa di strutturalmente simile al governatore di Watt: accoppiamento continuo fra agente e ambiente, dove la cognizione vive nell’interazione, non nello stato interno isolato.

Riassumendo lo stato del fronte alternativo nel momento di scrittura. Cognitivismo classico in pure form (Fodor LOT, Newell-Simon PSSH) è marginalizzato. Le sue intuizioni metodologiche (livelli di Marr, importanza della rappresentazione per cognizione di alto livello) sono assorbite. 4E cognition è movimento crescente in cognitive science contemporanea, con istituzioni proprie (riviste, conferenze, handbook OUP). Embodied cognition è diffuso in psicologia, neuroscience, AI robotica. Predictive processing è framework integrativo dominante post-2015, percepito come ponte fra computazionalismo e embodied. Ecological psychology gibsoniana resta vitale in psicologia della percezione e azione (sport science, motor control), implicitamente operativa in robotic foundation models. Subsumption robotics in pure form è nicchia (Roomba primitivo); le sue intuizioni sono assorbite in robotica deliberativa-reattiva ibrida. Dynamicism resta corrente teorica ma non ha vinto contro computazionalismo: predictive processing copre molto del territorio in modo più integrato. La critica heideggeriana di Dreyfus è rivalutata storicamente; Brooks 1991 lo cita esplicitamente; il deep learning è visto da alcuni come vendetta postuma di Dreyfus, anche se Dreyfus stesso restava cauto sui limiti del deep learning per cognizione di alto livello.

Il programma alternativo non è privo di difficolta. Cinque limiti strutturali e tre miti da smontare.

Limite 1 — Cognizione astratta. Come spiega l’embodied il pensiero astratto (matematica avanzata, logica formale, filosofia)? Lakoff-Núñez 2000 forzano embodiment anche per matematica: insiemi come contenitori, infinito come limite di processi corporei iterabili. Critiche da matematici (Reuben Hersh) e filosofi della matematica (Voorhees 2004): la matematica avanzata sembra trascendere il livello sensorimotorio in modi che la riduzione embodied non cattura. Il computazionalismo classico (Fodor) ha qui un argomento residuo forte: la sistematicità e composizionalità del pensiero matematico richiedono strutture simboliche.

Limite 2 — Cognizione off-line. Immaginazione, pianificazione, ragionamento controfattuale. Tutti task che si svolgono “in assenza” del mondo. Embodied/enactive faticano a spiegarli senza importare rappresentazioni. Quando immagino il mio appartamento non sono accoppiato dinamicamente ad esso. Quando pianifico un viaggio non sto interagendo con la destinazione. Le critiche enactivist alla rappresentazione faticano qui: o ammettono qualche forma di rappresentazione interna (e si avvicinano al cognitivismo), o spiegano l’immaginazione come “simulazione sensorimotoria off-line” (proposta di Barsalou, Hesslow), che è tesi più specifica e più fragile.

Limite 3 — Composizionalita (Fodor-Pylyshyn 1988). Argomento Fodor-Pylyshyn “Connectionism and Cognitive Architecture: A Critical Analysis” (Cognition 28, 1988): il pensiero è produttivo (infinite combinazioni) e sistematico (chi pensa “John ama Mary” può pensare “Mary ama John”). Sembra richiedere strutture composizionali simboliche. Connessionismo, dynamicism, embodied faticano a spiegare composizionalità pulita. Va detto: gli LLM contemporanei mostrano composizionalità emergente parziale dai pattern statistici, complicando il quadro; ma l’argomento canonico Fodor-Pylyshyn resta serio.

Limite 4 — Replication crisis (per embodied empirico). Molti effetti embodied (lapis-sorriso, calore-amicalità, altezza-potere) non replicano in studi multilab post-2015. Letteratura più cauta. Alcune metafore concettuali (categoria-contenitore, tempo-spazio) restano solide; altre sono più fragili. Il programma embodied empirico ha dovuto ricalibrare ambizioni.

Limite 5 — Brooks anti-rappresentazione: nicchia, non rivoluzione. La robotica reattiva pura ha nicchie applicative (Roomba primitivo), ma fuori da li la deliberative AI con world model (SLAM, planner, knowledge graph) è viva e domina robotica industriale, autonomous driving (LiDAR + mappe HD), ecc. La filosofia anti-rappresentazione di Brooks 1991 era polemica utile, non programma definitivo. La storia successiva è di ibridazione: subsumption per i livelli reattivi, deliberative per i livelli alti, deep learning per percezione. Brooks stesso lo riconosce.

Mito 1: “embodied risolve tutti i problemi del cognitivismo”. No: sostituisce alcuni problemi con altri. Risolve il symbol grounding (vedi symbol-grounding) ma fatica con composizionalità, cognizione astratta, off-line. Il dibattito è aperto, non chiuso.

Mito 2: “Brooks ha ucciso AI simbolica”. No: l’AI simbolica è marginalizzata dal deep learning, non da Brooks. La robotica reattiva è nicchia. La deliberative AI (planner, KR, ontologie) sopravvive in domini specializzati (industrial automation, supply chain, taxonomic systems). Brooks ha aperto una via, non chiuso l’altra.

Mito 3: “embodied = enactive = ecologico = subsumption”. No: sono famiglie distinte con tesi diverse. Ecological psychology accetta processamento neurale (lo decentra dal cervello individuale al sistema organismo-ambiente); enactivism rifiuta rappresentazioni più radicalmente; subsumption è ingegneria robotica con polemica filosofica annessa; embodied alla Lakoff accetta rappresentazioni (corporee). Il fronte è alleato anti-cognitivismo, non programma unitario. Confondere le posizioni produce critiche che colpiscono uno dei programmi ma falliscono contro gli altri (esempio: la critica “ma chi può negare le rappresentazioni interne?” colpisce Brooks-Varela radicale, ma non Lakoff o ecological psychology pragmatista).

Mito 4: “il cognitivismo classico è falsificato dall’embodied”. No. Il cognitivismo classico è marginalizzato come programma di ricerca AI (in favore del deep learning) e ridimensionato in cognitive science (in favore di posizioni più integrate). Non è “falsificato” in senso popperiano: continua a essere una cornice utile per certi fenomeni (cognizione astratta, planning esplicito, ragionamento simbolico). La transizione da cognitivismo a embodied/4E nelle scienze cognitive è shift di paradigma in senso kuhniano, non confutazione netta.

Mito 5: “se il cervello è continuo, allora il cognitivismo digitale è sbagliato per principio”. No, l’argomento è più sottile. Anche un computer digitale è costruito di transistor analogici; ciò che conta è a quale livello di descrizione il fenomeno cognitivo si lascia spiegare meglio. Per alcuni fenomeni (decisione percettiva, controllo motorio) il livello continuo è più naturale; per altri (manipolazione di concetti astratti, ragionamento logico) il livello simbolico-discreto è più trattabile. La scelta del livello di descrizione è una decisione metodologica, non solo un fatto ontologico.

Mito 6: “embodied AI nei robot moderni dimostra Brooks aveva ragione”. No, è lettura troppo veloce. I robotic foundation models del 2024-2026 (RT-2, OpenVLA, Optimus, Figure 02) integrano deep learning + embodiment + qualche elemento di ragionamento simbolico/linguistico via VLM. Non sono né pure-subsumption Brooks 1986 né pure-deliberative GOFAI. Sono ibridazioni che ereditano da entrambe le tradizioni più il deep learning. L’embodiment torna centrale, ma il quadro filosofico non è Brooks puro.

Tre letture distinte del programma alternativo che il capitolo ha presentato.

Lettura “convergenza”: un fronte comune anti-cognitivismo classico. Questa è la lettura del 4E movement contemporaneo (Newen-De Bruin-Gallagher 2018). Le diverse famiglie (ecological, enactive, subsumption, dynamicism, embodied, embedded, extended) sono varianti di una stessa rivolta contro il cognitivismo classico. Vantaggio: organizza una bibliografia eterogenea sotto bandiera comune. Svantaggio: appiattisce differenze interne sostantive.

Lettura “famiglie distinte”: ognuna con tesi e metodi propri. Lettura preferita da chi lavora dentro una specifica tradizione. Gibson e Brooks non condividono molto se non l’attacco al modello centrale. Varela e van Gelder hanno ontologie diverse. Lakoff e Hutto si scontrano sulla rappresentazione. Vantaggio: rispetta le specificità dei programmi. Svantaggio: rende difficile parlare del “fronte alternativo” come categoria utile.

Lettura “integrativa contemporanea”: predictive processing come sintesi. Lettura di Clark 2016, Friston, parte della cognitive science contemporanea. Embodied e computazionalismo non sono alternativi: si integrano via active inference. Il cervello calcola modelli, ma li accoppia all’azione e all’ambiente in modo continuo. Vantaggio: supera la disputa anni Novanta. Svantaggio: alcuni embodied/enactive radicali contestano che PP catturi la loro posizione, e alcuni computazionalisti lo leggono come ritorno camuffato del modello interno.

Il capitolo non sceglie fra le tre letture. Le presenta perché il lettore conosca lo stato del campo nel 2026 e possa orientarsi.

  • computazionalismo — il bersaglio principale di tutte le critiche raccolte qui. Capirlo a fondo è prerequisito per apprezzare le alternative, perché le alternative sono definite per opposizione.
  • funzionalismo — tesi presupposta dal computazionalismo classico. Embodied/enactive contestano la sostrato-indipendenza più profondamente del cognitivismo: non solo “il sostrato deve realizzare la funzione” ma “la funzione è del sostrato specifico (corpo)”.
  • symbol-grounding — Harnad 1990 è la versione interna del problema (un computazionalista preoccupato del grounding); Brooks 1991 è la versione esterna (un anti-rappresentazionalista che dissolve il problema). Il capitolo qui chiarisce la posizione esterna in dettaglio.
  • stanza-cinese-searle — Searle e Brooks/Dreyfus convergono nel rifiuto della sintassi pura, ma divergono sulla soluzione: Searle vuole “i giusti poteri causali biologici”, Brooks vuole “abolire il livello simbolico”, Dreyfus vuole “riconoscere il background non formalizzabile”.
  • mente-estesa — extended mind è parente affine al programma embodied/enactive, anzi è una delle quattro E del 4E. Andy Clark è figura ponte. Il capitolo qui copre le altre tre E (embodied, embedded, enactive) e i programmi storici (subsumption, dynamicism, ecological) che le precedono.
  • intenzionalita — l’intenzionalità per enactivist è enacted (sense-making), non intrinseca a stati interni. Posizione alternativa sia all’intenzionalità intrinseca di Searle sia a quella derivata di Dennett.
  • hard-problem-chalmers — l’hard problem non si risolve con embodied (Chalmers stesso, The Conscious Mind 1996, lo ammette esplicitamente): cambia il livello di descrizione, non risolve la coscienza fenomenica. Embodied è relevant per cognizione, neutrale per coscienza fenomenica.
  • ai-forte-ai-debole — la critica embodied a LLM si inserisce qui: per molti embodied/enactive, gli LLM sono “weak AI” (manca embodiment per “strong AI” embodied). LeCun, Bender e altri.
  • Slug futuri Parte III: cognizione-embodied svilupperà in dettaglio cognitive science contemporanea sulla corporeità; ponte-embodied-tool-use collega esplicitamente al tool use agentico moderno; percezione-priors confronta percezione bayesiana e gibsoniana; cervello-vs-rete-neurale discute rapporto fra modelli neurali e cervello biologico embodied.
  • Slug futuri Parte VII: neuro-simbolico come approccio integrativo che cerca di unire tradizioni separate.

Cinque fonti curate per chi vuole entrare nel programma alternativo.

  • Gibson J. J., The Ecological Approach to Visual Perception, Houghton Mifflin, Boston, 1979 (ristampa Psychology Press 2014). Il manifesto maturo della ecological psychology. Capitolo 8 (“The Theory of Affordances”) è il riferimento canonico per affordances. Capitolo 13 (“Ecological Optics”) espone optic flow. Lettura impegnativa ma ricompensante: cambia il modo di vedere la percezione.

  • Varela F. J., Thompson E., Rosch E., The Embodied Mind: Cognitive Science and Human Experience, MIT Press, Cambridge MA, 1991. Il manifesto enactivist. Tre parti: critica del cognitivismo, esposizione dell’enaction, connessione con phenomenology e Madhyamaka. La terza parte (buddhista) è opzionale per chi cerca solo la teoria; le prime due sono il cuore.

  • Brooks R. A., “Intelligence Without Representation”, Artificial Intelligence Journal 47, 1991, pp. 139-159. Il manifesto filosofico di Brooks. Venti pagine, polemico, leggibile. Introduce “the world is its own best model”. Da leggere insieme al paper tecnico Brooks 1986 (subsumption architecture) per vedere come l’ingegneria sostiene la filosofia.

  • Dreyfus H., What Computers Still Can’t Do: A Critique of Artificial Reason, MIT Press, Cambridge MA, 1992 (terza edizione del libro 1972). La critica heideggeriana più sviluppata. La lunga introduzione del 1992 risponde alle critiche e inquadra il libro nella storia dell’AI. Resta leggibile e attuale, anche se alcuni esempi (sistemi esperti anni Settanta) sono datati.

  • Newen A., De Bruin L., Gallagher S. (eds.), The Oxford Handbook of 4E Cognition, Oxford University Press, Oxford, 2018. Riferimento contemporaneo. Trentotto capitoli, le diverse famiglie (embodied, embedded, extended, enactive) presentate da specialisti, con confronti incrociati. Capitolo 1 di Newen-De Bruin-Gallagher introduce la tassonomia. Buon punto di partenza per chi vuole una visione panoramica del 2018, ancora attuale al 2026.

  • Chemero A., Radical Embodied Cognitive Science, MIT Press, Cambridge MA, 2009. Sintesi contemporanea di ecological psychology gibsoniana e dynamicism. Difesa di una versione “radicale” che rifiuta integralmente le rappresentazioni. Buon complemento al 4E Handbook per la posizione più intransigente del fronte; mostra fino a dove si può spingere il programma anti-rappresentazionalista in versione filosoficamente sviluppata.

  • van Gelder T., “What Might Cognition Be, If Not Computation?”, The Journal of Philosophy 92:7, 1995, pp. 345-381. Il manifesto dynamicist. Trentasei pagine, leggibili. L’esempio del governatore di Watt è presentato in dettaglio. Il paper è ancora citato ovunque come riferimento canonico per chi voglia capire il dynamicism nella sua forma più chiara.

  • Lakoff G., Johnson M., Philosophy in the Flesh: The Embodied Mind and Its Challenge to Western Thought, Basic Books, New York, 1999. Sequel sviluppato di Metaphors We Live By (1980). Programma embodied applicato sistematicamente alla filosofia: tempo come spazio, causa come forza fisica, moralità come bilancia. Riferimento per la versione del programma embodied più accessibile e influente sul mainstream culturale.

  • Thompson E., Mind in Life: Biology, Phenomenology, and the Sciences of Mind, Harvard University Press, Cambridge MA, 2007. Sviluppo solitario dell’enactivism dopo The Embodied Mind. Sintesi più sistematica con biologia (autopoiesis), phenomenology (Husserl, Merleau-Ponty), neuroscience cognitiva. Il libro di riferimento per la “life-mind continuity thesis”.