Sapir-Whorf: linguaggio e categorizzazione

La lingua materna struttura la cognizione? Una monografia empirica su una delle ipotesi più raccontate male e meno morte di quanto si dica.

Apertura

Hartford, Connecticut, primi anni Trenta — Benjamin Lee Whorf, ingegnere chimico della Hartford Fire Insurance Company, ispeziona stabilimenti industriali per la prevenzione incendi. In un report dopo l’altro nota un pattern. Davanti a barili di benzene pieni, gli operai sono prudenti: non fumano, non scintillano metallo su metallo. Davanti a barili contrassegnati come empty — vuoti — la cautela si abbassa: si appoggiano sigarette accese, si trascinano cassette metalliche. Eppure i barili “vuoti” contengono vapori residui di benzene, miscelati con aria nel rapporto stechiometrico esatto per detonare. Sono più pericolosi dei pieni.

Whorf, che nel tempo libero studia linguistica con Edward Sapir a Yale, prende appunti. Pubblica la riflessione nel saggio “The relation of habitual thought and behavior to language” 1939, raccolto poi in Language, Thought, and Reality 1956, MIT Press, edito da John Bissell Carroll. La parola empty non descrive, prescrive: incasella i barili in una categoria di “non-pericolo” che la chimica smentisce ma il cervello dei fumatori non. Il significato lessicale induce comportamento.

L’aneddoto e diventato un classico. La tesi che ne discende — la lingua materna struttura la percezione del mondo — ha attraversato cinquant’anni di sostegni, demolizioni, riabilitazioni parziali. La sua etichetta moderna, “Sapir-Whorf hypothesis”, non fu coniata né da Sapir né da Whorf. La distinzione fra versione strong (la lingua determina il pensiero) e versione weak (la lingua influenza, modula, facilita) la introdussero Roger Brown e Eric Lenneberg nel 1954, con Sapir già morto da quindici anni e Whorf da tredici. Quasi tutto ciò che oggi attribuiamo a Sapir-Whorf è una ricostruzione post-hoc di idee disperse in lavori autonomi.

Questo capitolo entra nei dettagli empirici della Sapir-Whorf hypothesis: chi furono Sapir e Whorf, come nacque il label, quali esperimenti hanno messo alla prova le due versioni, quali tengono e quali no, e cosa significa parlare di “linguistic relativity ingegnerizzata” guardando il modo in cui i large language model trattano lingue diverse dall’inglese.

Perché questo capitolo

Il capitolo precedente sulla relazione fra linguaggio e pensiero ha tracciato la cornice generale: Vygotsky e Piaget sull’inner speech, Fodor sul language of thought, Pirahã e numero esatto, Pormpuraaw e direzioni cardinali, Wendler 2024 sull’inglese latente nei modelli multilingue. Quella cornice e necessaria ma non sufficiente. La Sapir-Whorf hypothesis merita una monografia dedicata per tre ragioni.

Primo, è l’ipotesi più citata e più fraintesa delle scienze cognitive del linguaggio. La distanza fra come viene raccontata nei manuali divulgativi (“gli Eskimo hanno cento parole per la neve quindi vedono mille tonalità di bianco”) e ciò che la disciplina effettivamente sostiene oggi (un effetto modesto, modulato dal compito, presente in domini specifici come il colore e lo spazio, assente o non replicato in altri come il genere grammaticale degli oggetti) e enorme. Sapere dove sta la linea fra mito e dato e parte dell’igiene cognitiva di un professionista.

Secondo, la storia della Sapir-Whorf è un caso studio di come una disciplina rivede le proprie convinzioni. Negli anni Settanta la versione strong sembrava morta: Berlin e Kay 1969 avevano mostrato universalità nei termini base di colore, Eleanor Heider 1972 aveva esteso il risultato ai Dani della Papua Nuova Guinea con due soli termini di colore. Nessuno aveva più voglia di prendere sul serio Whorf. Trent’anni dopo, gli stessi paradigmi sperimentali ripetuti meglio (Roberson-Davies-Davidoff 2000 sui Berinmo, Winawer e collaboratori 2007 sul blu russo) hanno riaperto il dossier. La versione weak e tornata a essere oggetto di ricerca empirica seria. L’altalena vale la pena di essere capita: aiuta a ricalibrare il proprio scetticismo davanti a qualunque “consenso” granitico.

Terzo, l’avvento dei large language model multilingue ha reso urgenti domande di linguistic relativity in forma tecnica. Wendler 2024 ha mostrato che Llama-2 elabora i prompt non-inglesi in uno spazio rappresentazionale latente più vicino all’embedding inglese che alla lingua di superficie. Atari et al. 2023 hanno documentato bias verso popolazioni WEIRD nei modelli generalisti. Sono fenomeni di una specie tecnologica diversa dalla relatività umana, ma il parallelo concettuale e suggestivo e va trattato con i guanti per non scivolare in falsi equivalenze.

Contesto: la traiettoria 1820-2024

La radice intellettuale della linguistic relativity si trova in Wilhelm von Humboldt (1767-1835, filosofo e linguista prussiano, fondatore dell’Università di Berlino), che nel saggio postumo Über die Verschiedenheit des menschlichen Sprachbaues 1836 sostiene che ogni lingua incarna una Weltansicht, una visione del mondo. La tesi humboldtiana e speculativa, non testata empiricamente, ma alimenta l’antropologia linguistica del Novecento.

Franz Boas (1858-1942, antropologo tedesco-americano, padre dell’antropologia americana moderna) trasporta l’idea negli Stati Uniti. La sua introduzione allo Handbook of American Indian Languages 1911 sostiene la tesi metodologica: ogni lingua va descritta nei suoi propri termini, senza imporre categorie greco-latine. Per Boas, lingue diverse codificano distinzioni grammaticali diverse non perché alcune siano più primitive — la tesi evoluzionista che lui combatte — ma perché operano scelte differenti su un terreno cognitivo comune. Il dato boasiano apre la strada a Sapir.

timeline
    title Sapir-Whorf — due secoli di dibattito (1820-2024)
    section Foundational (1820-1956)
      1836 : Humboldt — Verschiedenheit
      1911 : Boas — Handbook of American Indian Languages
      1921 : Sapir — Language
      1929 : Sapir — "Status of linguistics as a science"
      1939 : Whorf — "Habitual thought and behavior"
      1940 : Whorf — "Science and linguistics"
      1954 : Brown & Lenneberg — distinzione strong/weak
      1956 : Carroll (ed.) — Language, Thought, and Reality
    section Golden age contra-Whorf (1969-1972)
      1969 : Berlin & Kay — Basic Color Terms (universali)
      1972 : Heider — Dani color memory (contra)
    section Revival weak (2000+)
      2000 : Roberson, Davies, Davidoff — Berinmo (pro weak)
      2001 : Boroditsky — tempo mandarino (pro weak)
      2003 : Boroditsky, Schmidt, Phillips — grammatical gender (contestato)
      2006 : Núñez & Sweetser — Aymara future-behind
      2007 : Winawer et al. — Russian blues (pro weak)
      2010 : Boroditsky & Gaby — Pormpuraaw (pro weak)
    section AI era
      2024 : Wendler et al. — inglese latente in Llama-2

Figura 1 — Sapir-Whorf timeline 1820-2024: Humboldt 1836, Boas 1911, Sapir 1921/1929, Whorf 1939/1940, Carroll edition 1956, Brown-Lenneberg 1954, Berlin-Kay 1969, Heider 1972, Roberson 2000, Winawer 2007, Boroditsky 2001-2010, Wendler 2024

Edward Sapir (1884-1939, linguista americano nato in Pomerania, allievo di Boas a Columbia) lavora sul campo su lingue indigene del Nord America: Wishram, Yana, Athabaskan, Navajo. Pubblica Language nel 1921, manuale introduttivo che è tuttora leggibile, e nel 1929 il saggio “The status of linguistics as a science” su Language 5(4):207-214. Da quest’ultimo viene la citazione più nota: gli esseri umani non vivono nel mondo oggettivo soltanto, ma sono in larga misura in balia della particolare lingua che è il medium di espressione della loro società. La formulazione e cauta — “in larga misura”, “in balia” — ma il punto e segnato: la lingua non è un mero veicolo, è una cornice. Sapir muore di infarto a Yale nel 1939, cinquantacinque anni.

Benjamin Lee Whorf (1897-1941, ingegnere chimico americano della Hartford Fire Insurance, autodidatta in linguistica, allievo serale di Sapir a Yale dal 1931) lavora su Hopi (lingua uto-azteca dell’Arizona), Maya (decifrazione dei geroglifici), Nahuatl. Pubblica nel 1940 “Science and linguistics” su Technology Review 42(6):229-231 e 247-248: target ingegneri MIT, registro divulgativo. Sostiene tesi forti: l’Hopi ha un sistema temporale radicalmente diverso dall’inglese, “non ha tempo” nel senso indo-europeo. La grammatica strutturerebbe la metafisica del parlante. Whorf muore di cancro nel 1941, quarantaquattro anni.

Il volume Language, Thought, and Reality: Selected Writings of Benjamin Lee Whorf, edito da John B. Carroll (1916-2003, psicologo americano, allievo di Whorf a Yale) e pubblicato da MIT Press nel 1956, raccoglie i saggi di Whorf in forma postuma e li rende accessibili a un pubblico accademico ampio. È da questo volume che la versione raccontata e talvolta esagerata della tesi whorfiana entra nei manuali.

Il label “Sapir-Whorf hypothesis” non compare nei testi di Sapir o di Whorf. Harry Hoijer (1904-1976, antropologo americano, allievo di Sapir) lo usa nel 1953 e nel 1954 lo consacra nel volume Language in Culture, University of Chicago Press, atti di una conferenza. Roger Brown (1925-1997, psicologo Harvard) ed Eric Lenneberg (1921-1975, psicolinguista Harvard e Cornell) nel 1954 pubblicano “A study in language and cognition” su Journal of Abnormal and Social Psychology 49(3):454-462: e qui che viene introdotta la distinzione fra versione strong — la lingua determina il pensiero — e versione weak — la lingua influenza, modula, facilita certe distinzioni. La sistemazione moderna del dibattito e quindi un prodotto degli anni Cinquanta, costruito su materiali sapiriani e whorfiani ma in larga misura indipendente dalla loro voce.

Negli anni Sessanta arriva il colpo che molti credettero finale. Brent Berlin (1936-, antropologo a Berkeley) e Paul Kay (1934-, linguista a Berkeley) pubblicano Basic Color Terms: Their Universality and Evolution, University of California Press 1969. Studiano venti lingue diverse (poi ne aggiungono molte altre nel World Color Survey) e mostrano che i termini base di colore seguono una gerarchia implicazionale universale. Eleanor Heider, poi nota come Eleanor Rosch (1938-, psicologa a Berkeley) pubblica nel 1972 su JEP 93(1):10-20 “Universals in color naming and memory”: testa i Dani della Papua Nuova Guinea, che hanno solo due termini base di colore, e mostra che ricordano i focali del colore (il rosso “rosso”, il giallo “giallo”, il blu “blu”) meglio dei colori inter-categoriali, esattamente come gli inglesi. La cognizione sembra universale, immune dalle variazioni linguistiche. Whorf sembra finito.

La riabilitazione comincia tre decenni dopo. Debi Roberson, Ian Davies e Jules Davidoff nel 2000 ripetono il paradigma di Heider sui Berinmo (Papua Nuova Guinea, valle Sepik) con metodologia rigorosa e trovano il pattern opposto: la memoria del colore segue i confini Berinmo, non quelli inglesi. Nel 2007 Jonathan Winawer, Nathan Witthoft, Michael Frank, Lisa Wu, Alex Wade e Lera Boroditsky pubblicano sul blu russo, su PNAS 104(19):7780-7785, mostrando un effetto whorfiano weak in compito perceptual con manipolazione causale (carico verbale vs spaziale). Gli anni Duemila e Duemiladieci accumulano evidence in domini specifici: spazio (Stephen Levinson è il gruppo Max Planck Nijmegen, Space in Language and Cognition 2003), tempo (Boroditsky 2001 sul mandarino, Núñez e Sweetser 2006 sull’aymara), bilinguismo (Athanasopoulos e collaboratori).

Sull’altro versante, alcune evidence si sgretolano alla replica. Il caso del genere grammaticale di Boroditsky-Schmidt-Phillips 2003 (“ponte” femminile in tedesco descritto come “elegante”, maschile in spagnolo come “forte”) non si replica consistentemente (Mickan-Schiefke-Stefanowitsch 2014). Il “bilingual advantage” di Bialystok 2007 collassa nelle meta-analisi (Paap-Greenberg 2013). Alcune affermazioni di Whorf su Hopi sono empiricamente sbagliate: Ekkehart Malotki nel 1983 documenta in Hopi Time, Mouton, che l’Hopi ha un ricco sistema temporale, contraddicendo Whorf direttamente.

Nel 2024, Chris Wendler, Veniamin Veselovsky, Giovanni Monea e Robert West a EPFL Losanna pubblicano “Do Llamas Work in English?” arXiv:2402.10588 e ACL 2024. Mostrano che Llama-2 elabora prompt non-inglesi in uno spazio rappresentazionale latente più vicino all’embedding inglese. Il fenomeno è una “linguistic relativity ingegnerizzata”, fattore tecnico legato allo sbilanciamento del corpus di pretraining. Il parallelo concettuale con la Sapir-Whorf weak e suggestivo — la lingua dominante struttura le rappresentazioni intermedie — ma è analogia tecnica, non filiazione storica né equivalenza meccanica.

L’intuizione, primo angolo: cosa cambia con la lingua

L’intuizione di Sapir e Whorf si capisce meglio sui casi concreti. Se la tua lingua materna ti costringe a marcare ogni volta che parli del passato se l’evento lo hai vissuto direttamente o lo conosci per testimonianza altrui (e così fanno il turco, il tuyuca, alcune lingue caucasiche), passi una vita ad allenare la distinzione. La distinzione resta cognitivamente disponibile anche a chi parla italiano — possiamo dire “ho visto” o “mi hanno detto” — ma non è obbligatoria, non viene applicata in default a ogni proposizione. La differenza non è nella capacità di pensare la distinzione, e nella prontezza con cui la pensi senza sforzo.

Lo schema generale della tesi whorfiana weak e questo: le distinzioni linguistiche obbligatorie nella tua lingua materna formano abitudini di attenzione. Vedi sempre il colore, ma la frequenza con cui lo categorizzi in confini precisi dipende da quante categorie obbligatorie la tua lingua impone. Pensi sempre allo spazio, ma se la tua lingua usa frame allocentrici cardinali ti tieni costantemente orientato a nord, mentre se usa frame egocentrici non lo fai. Concepisci sempre il tempo, ma se la metafora dominante della tua lingua e verticale, il priming verticale ti facilita le risposte temporali più del priming orizzontale.

Non e magia. È un fenomeno psicologico noto: l’attenzione ripetuta a una distinzione la rende automatica. Le abitudini grammaticali di una lingua sono attenzione ripetuta su scala di vita. Lo stesso vale per qualunque skill professionale: il radiologo vede l’ombra che il profano non vede, non perché abbia occhi diversi, ma perché ha categorizzato per anni.

L’intuizione, secondo angolo: la storia stessa come prova

La traiettoria storica dell’ipotesi è un secondo angolo per capirla. Negli anni Sessanta sembrava morta perché un risultato (Berlin-Kay 1969) era stato letto come un colpo finale. Era un colpo finale alla versione strong, non alla weak. Sapir e Whorf, leggendoli con pazienza, avevano scritto entrambe le versioni nei loro testi: a tratti formulazioni forti (“the linguistic system… is itself the shaper of ideas”, Whorf 1940), a tratti formulazioni cautamente probabilistiche (Sapir 1929 parla di “in large measure at the mercy”). Brown e Lenneberg 1954 le hanno separate per chiarezza analitica.

Cio che sembrava un’unica tesi monolitica si e disgregato in famiglie di sotto-tesi domain-specific. La domanda non è più “la linguistic relativity e vera o falsa?”, ma “in quale dominio cognitivo, su quale tipo di compito, con quale magnitudo e quale modulazione da fattori secondari?”. È una domanda da scienza normale, non da rivelazione filosofica. La traiettoria 1969-2007 mostra come una disciplina mette ordine in un’ipotesi troppo ampia per essere testabile in blocco.

La meccanica: le due versioni e i loro test

Le due versioni, ripulite, si formulano così.

Linguistic determinism (versione strong): la lingua materna determina cosa il parlante può pensare. Le categorie cognitive sono delimitate dalle categorie linguistiche disponibili. Un parlante senza la parola per X non può concepire X.

Linguistic relativity (versione weak): la lingua materna influenza, modula, facilita certe abitudini cognitive. I confini sono attratti dalle distinzioni linguistiche; alcune operazioni sono più rapide in lingue che codificano la distinzione, altre operazioni sono cognitivamente disponibili anche senza lingua specifica ma richiedono effort maggiore.

La versione strong e empiricamente falsa nella forma generale: parlanti di lingue diverse possono apprendere le distinzioni di altre lingue (i bilingui esistono, traduciamo, comunichiamo cross-linguisticamente). La versione weak e contestualmente vera, modulata da fattori secondari. Il consenso 2020-2026 è un consenso weak-pro, strong-contro, con margine di disagreement su quale dominio specifico ammette evidence robusta e quale no.

Lo schema sperimentale tipico per testare la versione weak ha tre componenti. Primo, identificare una distinzione linguistica obbligatoria in lingua A non obbligatoria in lingua B. Secondo, costruire un compito cognitivo non-linguistico (memoria, discriminazione percettiva, categorizzazione, gesture) che dipenderebbe dalla distinzione se essa fosse cognitivamente attiva. Terzo, manipolare condizioni di carico cognitivo per separare un effetto whorfiano (la lingua è una risorsa attivamente usata online) da un effetto strutturale fisso (la lingua ha permanently rimodellato la percezione).

Il carico cognitivo verbale e particolarmente diagnostico. Se chiedo al soggetto di ripetere mentalmente una sequenza di numeri durante il compito principale, occupo il sistema verbale. Se l’effetto whorfiano scompare sotto carico verbale ma persiste sotto carico spaziale, ho evidence che la categoria linguistica è una risorsa online, non una struttura percettiva permanentemente alterata. Questo design lo applicano Winawer 2007 sul blu russo, e da allora e diventato standard.

Il caso paradigmatico: il colore

Il caso del colore è il più studiato e il più istruttivo, perché ha attraversato tutti gli stadi del dibattito. Vale la pena seguirlo passo per passo.

Berlin e Kay 1969. Il Munsell array è una griglia di chip colorati che campiona sistematicamente lo spazio percettivo del colore (320 chip, 8 livelli di luminosità per 40 tonalità, più acromatici). Berlin e Kay chiedono a parlanti di lingue diverse di nominare ogni chip e di indicare i focal points: i migliori esempi di ciascun “basic color term” della lingua. Un basic color term è un lessema monomorfemico (non light blue, che è composto), ad alta frequenza, applicato a oggetti diversi (non blond, che si usa solo per capelli), psicologicamente saliente. La definizione e operativa, criticabile ma operazionalizzata.

Il risultato e netto. Le lingue del campione si distribuiscono in stadi gerarchici. Stadio I: due termini, scuro/freddo vs chiaro/caldo. Stadio II: aggiunge il rosso. Stadio III: aggiunge il giallo o il verde. Stadio IV: aggiunge l’altro tra giallo e verde. Stadio V: aggiunge il blu. Stadio VI: aggiunge il marrone. Stadio VII: aggiunge alcuni o tutti tra viola, rosa, arancio, grigio. La gerarchia e implicazionale: una lingua a stadio V ha sempre tutti i termini degli stadi I-IV; non si trova mai una lingua con il viola ma senza il rosso. I focal points cadono in zone universalmente preferite dello spazio Munsell, anche quando i confini sono variabili.

L’interpretazione di Berlin e Kay e anti-whorfiana. La fisiologia della visione umana — i tre tipi di coni con curve di sensibilità spettrale fisse, i meccanismi opponent process di Hering — vincola la categorizzazione a regolarità universali. La diversità linguistica del colore e apparente, sotto c’è un’architettura cognitiva comune.

Heider 1972. Eleanor Heider (poi Rosch) testa i Dani, popolazione delle Highland di Papua Nuova Guinea con due soli basic color terms: mili (scuro/freddo) e mola (chiaro/caldo) — stadio I di Berlin-Kay. Compito di memoria a lungo termine: il soggetto vede un chip di colore, dopo un intervallo deve riconoscerlo fra distrattori. Heider trova che i Dani ricordano meglio i chip che cadono sui focal points (i “rossi-rossi”, i “blu-blu”) rispetto a chip inter-categoriali. Stesso pattern degli inglesi. Conclusione: i focal points sono privilegiati cognitivamente in modo universale, indipendentemente dai termini linguistici disponibili. Whorf debunked.

Russian blues: Winawer 2007 reaction time pattern showing faster cross-category discrimination for Russian speakers vs English speakers, attenuated under verbal interference; type=vector-svg

Roberson, Davies, Davidoff 2000. Trent’anni dopo Heider, Debi Roberson e collaboratori ripetono il paradigma sui Berinmo (valle del fiume Sepik, Papua Nuova Guinea), che hanno cinque basic color terms i cui confini differiscono dall’inglese. Nol copre la zona verde + blu + alcune tonalità di marrone; wor copre la zona giallo + arancio + alcuni rossi. Risultato: la memoria dei colori segue i confini Berinmo, non quelli inglesi. Il pattern di Heider non si replica con lo stesso rigore. La ricostruzione e che Heider 1972 aveva selezionato gli stimoli su una griglia tarata sui focali inglesi, contaminando il test. Whorf riabilitato in versione weak.

Winawer e collaboratori 2007 (già introdotto in linguaggio-pensiero, qui in più profondita). Il russo, lingua slava orientale, ha due basic color terms per il blu: siniy (blu scuro) e goluboy (blu chiaro, azzurro). Non sono modificatori opzionali come light e dark in inglese: sono lessemi indipendenti, appresi come parole basiche dai bambini russi, ad alta frequenza. Il russo divide il blu dove l’inglese unisce.

Il compito di Winawer 2007 e di discriminazione percettiva. Schermo: tre quadrati. In alto, un quadrato target di una specifica tonalità di blu. Sotto, due quadrati: uno identico al target, uno di sfumatura diversa. Il soggetto preme il tasto sinistro o destro a seconda di quale dei due in basso corrisponde al target. Le sfumature sono scelte da una scala di venti blu progressivi che attraversa il confine percettivo russo fra goluboy e siniy.

I trial sono cross-category quando le due sfumature da confrontare cadono una in goluboy è l’altra in siniy, within-category quando entrambe cadono nella stessa categoria russa. Per gli inglesi, naturalmente, queste sono distinzioni non linguistiche (per loro tutto e blue).

Risultato in tempi di reazione. I russi senza interferenza sono 124 millisecondi più rapidi nei trial cross-category rispetto ai within-category, controllando per la distanza percettiva fisica. Gli inglesi non mostrano la differenza. Ovvero: il confine linguistico russo crea un confine percettivo misurabile, gli inglesi non hanno il confine.

La parte cruciale è la manipolazione di carico. I ricercatori introducono due condizioni secondarie: verbal interference (durante il compito, ripetere mentalmente una sequenza di otto cifre) e spatial interference (memorizzare una matrice spaziale). Sotto verbal interference, l’effetto whorfiano nei russi scompare. Sotto spatial interference, persiste. La categoria linguistica goluboy-siniy non è una struttura percettiva fissa: è una risorsa attivamente utilizzata online, accessibile via il sistema verbale, che si attenua quando il sistema verbale e impegnato altrove.

Questa è una versione disciplinata della Sapir-Whorf weak. Non si dice “i russi vedono colori che gli inglesi non vedono”. Si dice: la categoria abituale data dalla lingua materna modula la velocita di accesso a distinzioni percettive disponibili a tutti, e l’effetto si vede solo finché il sistema verbale e libero di partecipare.

Lateralizzazione. Aubrey Gilbert, Terry Regier, Paul Kay e Richard Ivry 2006 PNAS 103(2):489-494 aggiungono un dettaglio elegante. Mostrano stimoli di colore al campo visivo destro (input al hemisphero sinistro, dove sta in genere il linguaggio) o al campo visivo sinistro (input al hemisphero destro). L’effetto whorfiano sui confini di colore appare solo nel campo visivo destro. Coerente con la natura linguistica dell’effetto: se la categoria linguistica modula la percezione, la modulazione passa attraverso il sistema linguistico, lateralizzato a sinistra.

Spatial cognition: i frame di riferimento

Stephen Levinson (1947-, antropologo linguista, direttore Max Planck Nijmegen) e il suo gruppo hanno costruito a partire dagli anni Novanta il programma di ricerca più sistematico sulla relatività spaziale. Sintesi nel 2003 in Space in Language and Cognition, Cambridge University Press.

Il punto di partenza tipologico: le lingue codificano lo spazio in tre frame di riferimento.

Frame egocentrico/relativo: “la palla e a destra dell’albero”. La direzione dipende dall’osservatore. Italiano, inglese, giapponese, la maggior parte delle lingue europee.

Frame intrinseco/object-centric: “la palla e davanti all’auto”. La direzione dipende da una parte intrinseca dell’oggetto di riferimento (l’auto ha un davanti). Comune in molte lingue, spesso in alternanza con l’egocentrico.

Frame allocentrico/assoluto: “la palla e a nord dell’albero”. La direzione e in coordinate fisse (cardinali, geocentriche, solari). Guugu Yimithirr (Cape York, Australia, lingua pama-nyungana documentata da John Haviland negli anni Settanta), Tzeltal (Maya, Chiapas Messico, documentato da Penelope Brown e Levinson), kuuk thaayorre (Pormpuraaw, già trattato nel capitolo precedente).

Il rotation paradigm di Pederson, Danziger, Wilkins, Levinson, Kita e Senft 1998 Language 74(3):557-589 è il test cardine. Il soggetto vede una sequenza di tre giocattoli su un tavolo orientato nord-sud (per esempio mucca, maiale, cavallo da nord a sud, tutti rivolti a est). Il soggetto memorizza. Si gira di centottanta gradi: ora e rivolto a sud, e gli viene chiesto di riprodurre la sequenza su un secondo tavolo davanti a sé. La riproduzione si può fare in due modi.

Modo egocentrico: “alla mia sinistra c’era la mucca, al centro il maiale, alla mia destra il cavallo, tutti rivolti davanti a me”. Riprodotto così, mucca a sinistra (ora sud, perché soggetto e ruotato), maiale al centro, cavallo a destra (ora nord). I rapporti sinistra-destra rispetto al corpo sono preservati.

Modo allocentrico: “la mucca era a nord, il cavallo a sud, tutti rivolti a est”. Riprodotto così, mucca a destra del soggetto (nord, ora che è rivolto a sud), cavallo a sinistra (sud), tutti rivolti a ovest perché est rispetto al corpo ora ruotato e dietro le spalle. Ma rispetto allo spazio assoluto sono ancora rivolti a est.

I due modi producono configurazioni opposte. I parlanti delle lingue egocentriche (olandese, giapponese) tendono a riprodurre in modo egocentrico. I parlanti delle lingue allocentriche (Guugu Yimithirr, Tzeltal, Arrernte, Hai//om) tendono a riprodurre in modo allocentrico, anche dopo rotazione di centottanta gradi.

L’effetto e robusto. Pederson et al. controllano fattori secondari: livello di scolarizzazione, esposizione a cultura urbana, familiarita con il task. La differenza permane. I soggetti allocentrici devono tenersi orientati ai cardinali in ogni momento, perché la loro lingua glielo chiede ogni volta che parlano di spazio. Questo allenamento permanente si trasferisce a compiti non linguistici di memoria spaziale.

Critica Li-Gleitman. Peggy Li e Lila Gleitman 2002 Cognition 83(3):265-294 contestano. Mostrano che parlanti inglesi possono essere indotti a comportamento allocentrico con manipolazione semplice della scena: se la stanza ha landmark visibili (una finestra grande, un punto di riferimento esterno), gli inglesi spostano frame. Conclusione di Li-Gleitman: l’effetto Levinson e ambientale, non linguistico. Replica del gruppo Levinson: cambiando il task si cambia il fenomeno; quello spontaneo, nella scena impoverita standard del rotation paradigm, resta linguistico. Il dibattito e aperto ma il pattern di base — i parlanti di lingue allocentriche mostrano memoria spaziale più cardinale anche in compiti non linguistici — non è demolito.

Il caso instabile: il genere grammaticale

Il caso del genere grammaticale degli oggetti è il più pubblicizzato e il più fragile alla replica. Lera Boroditsky, Lauren Schmidt e Webb Phillips 2003 nel capitolo “Sex, syntax, and semantics” in Gentner e Goldin-Meadow eds. Language in Mind, MIT Press, propongono il seguente test.

Tedesco e spagnolo assegnano genere grammaticale arbitrariamente diverso a alcuni nomi di oggetti. Die Brücke (ponte) e femminile in tedesco, el puente (ponte) e maschile in spagnolo. Der Schlüssel (chiave) e maschile in tedesco, la llave (chiave) e femminile in spagnolo. La differenza e arbitraria storicamente: non si trova un significato sistematico.

Compito: parlanti tedeschi e spagnoli, testati in inglese (lingua neutra rispetto al genere grammaticale degli oggetti), descrivono ciascun oggetto con i primi tre aggettivi che vengono in mente.

Risultati riportati da Boroditsky 2003. Tedeschi descrivono “ponte” (Brücke, femminile) come “elegante, fragile, bella, snella, peaceful, pretty, slender”. Spagnoli descrivono “ponte” (puente, maschile) come “big, dangerous, long, strong, sturdy, towering”. Pattern simmetrico per “chiave”: tedeschi (Schlüssel, maschile) “hard, heavy, jagged, metal, serrated, useful”; spagnoli (llave, femminile) “golden, intricate, little, lovely, shiny, tiny”. L’attribuzione di tratti stereotipicamente maschili o femminili sembra seguire il genere grammaticale.

L’effetto e suggestivo e ha avuto enorme risonanza divulgativa. I problemi emergono nelle repliche.

A. Mickan, M. Schiefke e A. Stefanowitsch 2014 nel Yearbook of the German Cognitive Linguistics Association 2(1):39-50 pubblicano “Key is a llave is a Schlüssel: a failure to replicate an experiment from Boroditsky et al. 2003”. Replicano il design e non trovano l’effetto. Studi successivi mostrano pattern simili: alcune repliche positive, molte negative, dipendenza forte da variabili di stimolo. Meta-analisi e review (Samuel-Cole-Eacott 2019 Cognition 178:108-121) trovano un effetto piccolo o assente.

Alcune ragioni del fallimento. Primo, il design originale aveva un campione modesto è una scelta di stimoli che poteva favorire l’effetto (gli aggettivi elegante, fragile, snella per ponte sono coerenti con stereotipi femminili in inglese contemporaneo, ma anche con caratteristiche fisiche del ponte specifico immaginato; un ponte di Calatrava e snello indipendentemente dal genere). Secondo, l’effetto, se esiste, dipende molto dal task: chiedere “tre aggettivi” attiva associazioni stereotipiche che potrebbero non esserci in compiti più impliciti. Terzo, il bilinguismo italian-tedesco, francese-tedesco, etc., dovrebbe attenuare ma in qualche studio attenua e in altri no.

Conclusione 2026: il caso del genere grammaticale degli oggetti è il dossier più fragile della Sapir-Whorf weak. Le altre evidence — colore, frame spaziale, metafore temporali — tengono meglio. Citarlo come prova robusta di linguistic relativity sarebbe oggi imprudente.

Tempo: aymara, mandarino, casasanto

Il dossier delle metafore temporali ha alcuni casi solidi e alcuni meno.

Boroditsky 2001 sul mandarino verticale e già trattato nel capitolo precedente: i parlanti mandarino rispondono più rapidamente a domande temporali dopo priming verticale, gli inglesi dopo priming orizzontale. L’effetto e piccolo (decine di millisecondi) ma robusto e dipendente dalla lingua materna anche nei bilingui.

Il caso dell’aymara e più sorprendente. L’aymara è una lingua andina, parlata da circa due milioni di persone in Bolivia e Perù, con tipologia tipologicamente conservata. Rafael Núñez (cognitive scientist UCSD) e Eve Sweetser (linguista Berkeley) 2006 in Cognitive Science 30(3):401-450 documentano un fatto controintuitivo per le lingue indo-europee: il futuro, in aymara, e linguisticamente dietro (radice qhipa), il passato davanti (radice nayra).

La logica della metafora: il passato si conosce, lo si vede; sta davanti come tutto ciò che si vede. Il futuro non si conosce, non lo si vede; sta dietro le spalle come ciò che è fuori dal campo visivo. Le metafore ordinarie sono qhipüru “il giorno dietro” (il giorno futuro), nayra timpu “tempo davanti” (tempo passato), nayra mara “anno davanti” (anno scorso).

Núñez e Sweetser registrano video di anziani aymara monolingui (parlanti Aymara senza esposizione a spagnolo o quechua su tempo) durante conversazioni libere e analizzano la gestualità co-verbale. I parlanti aymara monolingui gesticolano dietro le spalle quando parlano del futuro, davanti al corpo quando parlano del passato. La coerenza tra metafora linguistica e gesto e completa. I bilingui giovani aymara-spagnolo mostrano pattern misto, con più gesti in avanti per il futuro come gli ispanofoni.

L’aymara è un caso eccellente per Sapir-Whorf weak. La metafora dominante della lingua materna struttura l’organizzazione spazio-temporale incarnata nel gesto. Non e magia, e abitudine: chi cresce parlando aymara ha sentito milioni di volte “il tempo davanti” riferirsi al passato; il gesto si allinea.

Daniel Casasanto (psicologo Chicago, ora Cornell) 2008 nella review “Who’s afraid of the Big Bad Whorf? Crosslinguistic differences in temporal language and thought” Language Learning 58(s1):63-79 sintetizza: linguistic relativity weak ha supporto su tempo, spazio, colore; strong determinism falso. La sintesi resta valida.

Posizione	Stato dell’evidenza	Casi chiave
Determinismo forte	nessun supporto	tempo Hopi sfatato (Malotki 1983); parole inuit per neve mitologiche
Relatività debole — solido	supporto reale, replicato	cognizione del colore (Russian blues, Berinmo); frame spaziale assoluto (Pormpuraaw, Tzeltal)
Relatività debole — moderato	supporto contestuale, task-dipendente	metafore temporali (mandarino verticale, Aymara future-behind)
Relatività debole — fragile	replicazioni contrastanti	genere grammaticale e tratti stereotipici di oggetti (Boroditsky-Schmidt-Phillips 2003 contestato)
Parallelo AI	analogia, NON equivalenza	Wendler et al. 2024 — inglese come pivot latente in Llama-2; bias WEIRD pre-training

Esempio in dettaglio: tre scenari concreti

Scenario uno. Una equipe di interface designer sta localizzando in mandarino una dashboard di project management originalmente disegnata in inglese. La timeline orizzontale mostra task da sinistra (passato/ora) a destra (futuro). Test su utenti taiwanesi mostrano che alcuni utenti, soprattutto over 50, leggono la timeline come progressione temporale ma con minor immediatezza rispetto agli utenti anglofoni. Test più raffinati mostrano che una versione verticale (oggi in alto, futuro in basso) viene processata più rapidamente da quegli utenti. La spiegazione coerente con Boroditsky 2001: il mandarino codifica anche metafore verticali di tempo (shang ge yue mese sopra = scorso, xia ge yue mese sotto = prossimo); la metafora verticale resta cognitivamente disponibile e accelerata. Localizzare bene non è tradurre, e ripensare la geografia visuale dell’informazione. (Nota di metodo: questo scenario e didattico-illustrativo; la decisione su layout va presa con A/B testing sul prodotto specifico.)

Scenario due, numerico. Test del blu russo su un campione di 100 parlanti monolingui russi e 100 monolingui inglesi, replica del paradigma Winawer 2007. Ciascun soggetto fa 240 trial di discriminazione percettiva: 120 cross-category (target e distrattore-non-match in categorie russe diverse, una goluboy l’altra siniy), 120 within-category. La distanza percettiva fisica tra distrattori e bilanciata. La RT media nei trial cross-category e per i russi 824 ms, per gli inglesi 945 ms. Nei within-category la RT media e per i russi 951 ms, per gli inglesi 943 ms. Differenza russi cross vs within = 127 ms (significativa, p<0.001). Differenza inglesi cross vs within = 2 ms (non significativa). Sotto verbal interference (ripetizione mentale di otto cifre durante il compito), i russi mostrano differenza di 18 ms (non significativa). L’effetto whorfiano e online e dipendente dal sistema verbale.

Scenario tre, di campo. Brian Stross, antropologo americano, ha trascorso anni Sessanta-Settanta a registrare conversazioni in tzeltal nelle comunità di Tenejapa, Chiapas, Messico. Tzeltal usa frame allocentrico: “uphill” è una direzione cardinale (verso il monte Huitepec). Quando un parlante tzeltal dice “metti la tazza un po’ uphill rispetto al piatto”, la direzione e fissata dalla geografia, non dall’osservatore. Decenni dopo, il rotation paradigm di Pederson et al. 1998 conferma il pattern non-linguistico: i tzeltal riproducono sequenze di oggetti in coordinate uphill/downhill anche dopo essere stati ruotati di centottanta gradi. La memoria spaziale automatica e cardinale per chi parla una lingua cardinale. Effetto robusto, non addestrabile in adulti monolingui inglesi con cinque minuti di istruzione.

Eredita oggi

[DATATO 2026-04]

Tre intersezioni interessanti fra Sapir-Whorf classica e tecnologia linguistica contemporanea, da prendere come analogie concettuali, non filiazioni documentate né equivalenze meccaniche.

Latent English nei multilingual LLM. Wendler-Veselovsky-Monea-West 2024 (già approfondito nel capitolo precedente) mostrano che Llama-2 elabora prompt non-inglesi in uno spazio rappresentazionale latente più vicino all’embedding inglese che alla lingua di superficie. Il fenomeno è una conseguenza dello sbilanciamento del corpus di pretraining: Llama-2 e addestrato su circa il 90% di testo inglese, è questo lascia una geografia rappresentazionale “abituata all’inglese” anche quando l’input e in cinese o tedesco.

Il parallelo con Sapir-Whorf weak e suggestivo: la lingua dominante (per il modello: l’inglese del corpus; per gli umani: la lingua materna) struttura le rappresentazioni intermedie. Ma il meccanismo e radicalmente diverso. Nel modello, lo sbilanciamento e statistico e architetturale: più dati in inglese, più peso a cluster di token inglesi nello spazio di embedding. Nell’umano, l’effetto e di sviluppo cognitivo: l’attenzione ripetuta a distinzioni linguistiche obbligatorie nei primi anni di vita rende quelle distinzioni automatiche.

Marcatura: analogia, non filiazione, non equivalenza. Il progetto Llama-2 non cita Sapir, Whorf, o la letteratura di linguistic relativity nella documentazione architetturale o nel paper di pretraining. La connessione fra latent English e Sapir-Whorf e post-hoc, fatta da analisti del fenomeno, non da progettisti del modello. Chiamarla filiazione sarebbe scorretto. Chiamarla equivalenza sarebbe scorretto: l’umano sviluppa i suoi bias linguistici in interazione embodied con una comunità, il modello li eredita da una distribuzione di token. Sono fenomeni di specie tecnologica diversa che condividono solo la struttura concettuale “lingua dominante modula rappresentazioni interne”.

WEIRD bias. Atari, Xue, Park, Blasi e Henrich 2023 nel preprint “Which humans?” PsyArXiv documentano che i large language model generalisti (GPT, Claude, Gemini) producono risposte allineate con popolazioni Western, Educated, Industrialized, Rich, Democratic — l’acronimo WEIRD coniato da Henrich-Heine-Norenzayan 2010 Behavioral and Brain Sciences 33(2-3):61-83 per descrivere il campione tipico degli studi di psicologia. Su moral foundations, value preferences, semantic associations, gli LLM rispondono come college student americani, non come la mediana globale dell’umanità.

Cao, Zhou, Lee, Cabello, Chen e Hershcovich 2023 in EACL Workshop C3NLP, “Assessing cross-cultural alignment between ChatGPT and human societies”, confermano: il cultural alignment di ChatGPT e fortemente skewed verso pop USA. Il bias è una conseguenza del corpus (testo prevalentemente in inglese, prevalentemente prodotto da o tradotto da popolazioni occidentali) ma si manifesta in operazioni cognitive culturali (cosa conta come morale, come saliente, come causale).

Non e Sapir-Whorf in senso stretto: non è relatività per la sola lingua, e per la cultura della popolazione che ha prodotto il corpus. Pero è una variante tecnica del fenomeno generale “la rappresentazione interna dipende dal materiale linguistico in input”. Per chi sviluppa applicazioni LLM in contesti non-WEIRD, è un avvertimento operativo: il modello porta con sé un bagaglio culturale che non è neutrale.

Cross-lingual transfer come argomento contro relatività totale. Alexis Conneau e collaboratori 2020 in ACL, “Unsupervised cross-lingual representation learning at scale”, mostrano che modelli multilingue come XLM-R imparano rappresentazioni che permettono trasferimento cross-linguistico: training su un task in inglese, valutazione su altra lingua, performance non zero anche senza dati di training in quella lingua. mBERT (Devlin et al. 2019) è l’antesignano. Il fenomeno suggerisce che esiste, almeno parzialmente, una rappresentazione lingua-indipendente.

Argomento: se la cognizione fosse totalmente determinata dalla lingua, non ci sarebbe trasferimento cross-linguistico zero-shot. Il fatto che ci sia, e prova di un sostrato semantico (parzialmente) condiviso. Ovviamente questo argomenta contro la versione strong di Sapir-Whorf, non contro la weak: la weak ammette modulazione, non determinazione totale.

Shi, Suzgun, Freitag, Wang, Srivats, Vosoughi, Chung, Tay, Ruder, Zhou, Das, Wei 2022 “Language Models are Multilingual Chain-of-Thought Reasoners” arXiv:2210.03057 documentano che il ragionamento in lingue low-resource migliora se il prompt viene tradotto in inglese intermediario prima del chain-of-thought. Trick di prestazione che riflette il latent English: il modello “ragiona meglio in inglese” perché ha visto più esempi di chain-of-thought in inglese.

Equivalenze pericolose, da evitare. Un breve catalogo di scivolamenti tipici da non commettere.

“Latent English nei LLM dimostra che Sapir-Whorf e vero”. Falso: dimostra che gli LLM hanno bias dipendenti dal corpus, fenomeno tecnico, parallelo concettuale ma non test di Sapir-Whorf su umani.
“Cross-lingual transfer dimostra che Sapir-Whorf e falso”. Falso: dimostra che esiste un sostrato semantico parzialmente condiviso, contro la versione strong, non la weak.
“Multilingual LLM sono cognitivamente bilingui”. Falso: non c’è codice-switching, non c’è language-dependent recall in senso umano, l’architettura non è modularizzata per lingua.
“Il chain-of-thought verbalizzato dell’LLM e equivalente all’inner speech umano”. Falso: e analogia; l’inner speech umano e opzionale, telegrafico, accompagnato da componenti modali, mentre il CoT e obbligato per token, sequenziale, esaustivamente verbale.
“Sapir-Whorf prevedeva latent English”. Anacronistico: né Sapir né Whorf avevano una nozione di rappresentazione vettoriale latente; le loro tesi riguardavano coscienza linguistica e abitudini di pensiero in umani embodied.

Dove si rompe

Le aree dove la Sapir-Whorf hypothesis si rompe sono diverse, e vanno tenute distinte.

Linguistic determinism strong e empiricamente falso. Parlanti senza la parola per X imparano X attraverso esposizione, esempio, traduzione. I bilingui esistono e funzionano in entrambe le lingue. La traduzione e imperfetta ma non impossibile. Nessuna lingua “intrappola” cognitivamente i suoi parlanti. Pinker 1994 The Language Instinct fa una dichiarazione netta in questo senso. La sua over-reach e dichiarare morta anche la versione weak.

Replication crisis su gender effects. Boroditsky-Schmidt-Phillips 2003 sul tedesco vs spagnolo non si replica robustamente. I dati che entrano nei manuali divulgativi sopravvivono per inerzia, non per evidenza. Citarli come prova solida di Sapir-Whorf weak nel 2026 e imprudente; il caso del colore e dello spazio sono molto più solidi.

Inuit snow words mito. Geoff Pullum (linguista a Edimburgo, ora UCSC) 1991 The Great Eskimo Vocabulary Hoax University of Chicago Press demolisce sistematicamente. Le lingue eschimesi-aleutine (yup’ik, inuit, aleut) sono polisinetiche: formano parole tramite incorporazione produttiva. Una “parola” yup’ik può essere una frase intera in italiano. Contare “le parole per la neve” in queste lingue e categorialmente mal posto. Le stime varie da 4 a oltre 100 sono prodotti dell’arbitrarietà della definizione di “parola”. Whorf stesso aveva citato la cifra di quattro, prudentemente; la cifra esplosa nella divulgazione e responsabilità della catena giornalistica, non dell’antropologia.

Hopi time mito. Whorf affermava che l’Hopi non ha tempo grammaticalizzato come l’inglese — che la metafisica Hopi e diversa, basata su “evento” piuttosto che “tempo”. Ekkehart Malotki nel 1983 pubblica Hopi Time: A Linguistic Analysis of the Temporal Concepts in the Hopi Language, Mouton, monografia di seicento pagine che documenta il sistema temporale dell’Hopi. L’Hopi ha tempo verbale, marcatori temporali, metafore temporali ricche. Malotki demolisce empiricamente uno dei case study più citati di Whorf. La portata di questa demolizione si estende: alcuni dei case study originali di Whorf sono empiricamente sbagliati o esagerati. Il Whorf storico, su Hopi specifico, va letto con cautela.

Bilingual advantage controverso. Ellen Bialystok (psicologa York University) ha argomentato dagli anni Duemila che i bilingui hanno vantaggi nelle funzioni esecutive (inhibition, switching, attention). I primi studi positivi (Bialystok 2007 Bilingualism: Language and Cognition 10(3):210-233) hanno avuto risonanza. Le repliche a larga scala falliscono. Kenneth Paap e Zachary Greenberg 2013 Cognitive Psychology 66(2):232-258 mostrano publication bias e effetti fragili. Ramesh Kumar e collaboratori 2020 Cognition 200 meta-analisi: effetto bilingual advantage piccolo o assente in adulti sani. Non e direttamente Sapir-Whorf ma tema vicino, è la lezione e simile: alcuni effetti riportati con entusiasmo non sopravvivono al rigore metodologico.

Limiti di estrapolazione cross-linguistica. Anche le evidence solide (Russian blues, Pormpuraaw) sono case study specifici. Estrapolare “tutte le lingue con un confine cromatico in più modulano la percezione” e generalizzazione audace. Ogni dominio richiede test specifici. È disciplina noiosa ma necessaria.

Distinzione fra abilità e abitudine. La Sapir-Whorf weak parla di abitudini, non di abilità. I russi non vedono colori che gli inglesi non vedono. Hanno solo abitudini categoriali più rapide su quel confine specifico. Confondere abilità e abitudine è l’errore tipico delle versioni divulgate di Whorf. Il blu russo si comprime in “i russi vedono più blu degli inglesi”, che è falso. La versione corretta e “i russi categorizzano più rapidamente al confine goluboy-siniy”, che è poco appariscente ma vero.

LLM e Sapir-Whorf, distinzione di categoria. Il latent English dei multilingual LLM è una proprietà architetturale di una macchina computazionale. La Sapir-Whorf hypothesis è una tesi cognitiva su parlanti umani embodied. I due fenomeni si parlano per analogia ma non per identità. Una persona prudente non userebbe Wendler 2024 per “dimostrare Sapir-Whorf” in un articolo di scienze cognitive, e non userebbe Winawer 2007 per “dimostrare relatività” in un paper di NLP.

Dipendenza dal compito. Un effetto whorfiano weak misurato in un compito può non emergere in un altro compito apparentemente simile. La replicazione cross-paradigma e essenziale per concludere che un dominio cognitivo e modulato dalla lingua. Studi singoli con design unico sono input al dossier, non conclusioni.

Tre note storiografiche

Vale la pena chiudere con tre note di storia della disciplina che spesso si perdono nei riassunti.

Sapir non è Whorf. I due autori avevano sensibilità diverse. Sapir era il linguista accademico, allievo di Boas, professore a Yale, autore di un manuale ancora in stampa. Le sue formulazioni sono caute, comparative, generalmente in sotto-clausole che lasciano aperta l’interpretazione. Whorf era l’autodidatta brillante, ingegnere chimico di mestiere, scrittore di prosa appassionata che vendeva l’idea più della cautela accademica. Le formulazioni più vendute oggi vengono da Whorf. Le formulazioni meglio difese empiricamente assomigliano più a Sapir.

Né Sapir né Whorf erano relativisti culturali in senso storicista. Entrambi credevano nell’unità psichica dell’umanità, eredita boasiana. La loro tesi non era “popoli diversi pensano in modi incommensurabilmente diversi”, era “le abitudini linguistiche orientano l’attenzione cognitiva”. Nelle ricostruzioni anni Sessanta-Settanta i due autori sono stati a volte arruolati in campi (relativismo culturale, post-modernismo linguistico) che non avrebbero riconosciuto come propri.

Il dibattito non è finito. Ogni decennio porta nuovi paradigmi sperimentali, nuove lingue documentate, nuove tecniche neuroscientifiche. La fMRI è l’EEG hanno aggiunto dimensioni di analisi (Gilbert 2006 sulla lateralizzazione hemisferica dell’effetto color); i big corpus linguistici è gli LLM portano nuovi parallelismi tecnici. La Sapir-Whorf hypothesis, nelle sue versioni moderne disciplinate, e un’ipotesi di scienza normale: vivace, contestata, modulabile sui dati. Non un articolo di fede né un cadavere.

Altri domini che hanno ricevuto attenzione

Oltre a colore, spazio, tempo e gender, altri domini cognitivi sono stati testati in chiave whorfiana. Vale la pena passarli in rassegna brevemente, perché completano il quadro e mostrano la varietà del programma di ricerca.

Categorie di oggetti. John Lucy 1992 confronta yucateco (Maya) e inglese sulla classificazione di oggetti. Lo yucateco ha classificatori obbligatori che marcano materia (per esempio “una candela” si dice “una pezzo-cera”), l’inglese marca per default forma. Lucy testa con compiti di sorting non linguistici: dato un oggetto target, quale di due alternative gli somiglia di più? I parlanti yucateco tendono a categorizzare per materiale (candela come pezzo di cera in cima a candela come oggetto allungato), gli inglesi per forma. L’effetto e moderato ma replicato.

Eventi e telicità. Le lingue codificano gli eventi in modi diversi quanto a aspetto perfettivo/imperfettivo, telicità (il punto finale dell’evento), e moto (path vs manner). Slobin 1996 sviluppa l’ipotesi thinking for speaking: parlanti di lingue diverse, quando descrivono un evento, attendono a aspetti diversi dell’evento. Spagnolo e italiano sono lingue path-dominant (il path del moto e codificato nel verbo: salire, scendere, entrare); inglese e tedesco sono manner-dominant (la maniera e nel verbo: run, walk, slide; il path e in particella). Athanasopoulos e Bylund 2013 testano se questo si traduce in attenzione cognitiva durante la categorizzazione di eventi. Effetto presente ma piccolo.

Numero esatto vs approssimato. Pirahã e Mundurucú, già discusso nel capitolo precedente. Il sistema esatto del numero richiede strumenti linguistici (counting list); il sistema approssimato e cross-specie e cross-linguistico. Linguistic relativity weak in versione forte: senza il counting list di una lingua matematicamente sviluppata, il sistema esatto non si costruisce.

Genere biologico e categorie sociali. Lingue con marcatori grammaticali di genere obbligatori (italiano, spagnolo, francese) potrebbero indurre attenzione più rapida al genere biologico delle persone descritte. Studi recenti (Boroditsky-Phillips 2003 e seguenti) trovano effetti modesti, dipendenti dal compito.

Modalita epistemica. Lingue con marcatori epistemici obbligatori — turco, tuyuca, alcune lingue caucasiche, dove ogni proposizione passata deve specificare se l’evento e stato osservato direttamente, riferito da terzi, o inferito — potrebbero accelerare lo sviluppo della theory of mind nei bambini. Aksu-Koç sul turco mostra che bambini turchi acquisiscono nozioni di evidenzialità prima dei coetanei inglesi monolingui. Effetto coerente con linguistic relativity weak ma su dominio sociale.

Causalita. Fausey-Boroditsky 2010-2011 hanno testato come parlanti di lingue diverse descrivono eventi accidentali. Spagnolo usa di più costruzioni non-agentive (se rompió la taza, “la tazza si e rotta”) quando l’evento e accidentale; inglese usa agentive (I broke the cup, “ho rotto la tazza”). I soggetti spagnoli ricordano meno bene l’agente di eventi accidentali rispetto a inglesi. Effetto repllicato in più studi.

Note di metodo: come si testa empiricamente la linguistic relativity

La parte più difficile di tutto il dibattito Sapir-Whorf non sono i risultati, sono i metodi. Capire perché certi paradigmi convincono e altri no aiuta a leggere la letteratura senza farsi catturare dalle promesse retoriche.

Il problema della causalità. Mostrare che parlanti di lingue diverse si comportano diversamente in un compito non basta. Le lingue covariano con cultura, geografia, scolarizzazione, esposizione a media, condizioni socio-economiche. Se i parlanti tzeltal usano memoria spaziale cardinale e gli olandesi no, e perché parlano lingue diverse o perché vivono ambienti diversi? Il design ideale dovrebbe randomizzare la lingua, cosa empiricamente impossibile.

I rimedi parziali. Primo, controllare per variabili confonditrici: scolarizzazione, esposizione urbana, multilinguismo. Pederson et al. 1998 lo fanno sistematicamente. Secondo, manipolare condizioni online: il design del carico verbale di Winawer 2007 e l’esempio più pulito. Se l’effetto whorfiano scompare quando il sistema verbale e occupato e persiste quando lo e quello spaziale, abbiamo evidence che il sistema verbale media l’effetto. Terzo, comparare bilingui in domini dove i monolingui mostrano effetti opposti. Athanasopoulos lo fa con bilingui inglese-greco.

Operazionalizzare “categoria linguistica”. Cosa conta come distinzione linguistica obbligatoria? La definizione operativa varia. Per Berlin-Kay, un basic color term deve essere monomorfemico, ad alta frequenza, applicato a oggetti diversi, psicologicamente saliente. Sono criteri operativi che lasciano zone grigie. Per gli effetti spaziali, conta la frequenza relativa di frame egocentrico vs allocentrico in conversazione spontanea. Lavori di field linguistics che documentano corpora reali sono prerequisito.

Il problema del replicato. Effetti riportati con campioni piccoli (n=20-40) e singolo paradigma vanno presi con scetticismo proporzionato. La crisi della replica in psicologia (Open Science Collaboration 2015) ha colpito anche la linguistic relativity. Boroditsky-Schmidt-Phillips 2003 sul gender e il caso noto, ma altri studi singoli hanno avuto destini simili. La regola di prudenza: aspettare conferma da almeno tre paradigmi indipendenti prima di considerare un effetto stabilito.

Power e effect size. Gli effetti whorfiani weak sono tipicamente piccoli — decine di millisecondi nei tempi di reazione, frazioni di deviazione standard nella memoria. Studi underpowered (n basso, analisi multipla senza correzione) hanno alta probabilità di falsi positivi. Le repliche moderne con n>100 e pre-registrazione sono il gold standard, ancora poco diffuso nel campo.

Stimuli artifact. Roberson 2000 ha riabilitato Whorf in parte mostrando che gli stimoli di Heider 1972 erano scelti su una griglia tarata sui focali inglesi. Lo stimolo non e mai neutro: la scelta di stimoli implicita o esplicita può confermare l’ipotesi del ricercatore. Pre-registrare la scelta di stimoli e parte del rigore.

Tre studi che valgono la pena di essere letti

Tre studi che illustrano metodologie esemplari e che il lettore interessato può cercare integralmente.

Winawer et al. 2007 PNAS sul blu russo. Design pulito: stimoli percettivi, manipolazione causale di carico cognitivo, controllo per parlanti inglesi (gruppo placebo linguistico), effetto piccolo ma robusto. Replicato indipendentemente. E il template moderno per testare linguistic relativity weak.

Pederson, Danziger, Wilkins, Levinson, Kita, Senft 1998 Language sul rotation paradigm. Design tipologicamente esteso: nove lingue di tre famiglie diverse, stesso paradigma, controlli per scolarizzazione e cultura. Mostra che il fenomeno spaziale non si riduce a effetti culturali generici.

Roberson, Davies, Davidoff 2000 JEP General sui Berinmo. Replica critica del classico Heider 1972, evidenzia errori metodologici originali, propone metodologia migliore. Esempio di come una disciplina rivede i propri classici.

Storiografia e ironia

Una nota di storiografia riflessiva. La Sapir-Whorf hypothesis nella sua versione divulgata e parte del folklore intellettuale del Novecento. Frasi come “gli Eskimo hanno cento parole per la neve” o “i mandarini pensano il tempo verticalmente” circolano in articoli di magazine, libri di self-help, talk TED, post di blog. La distanza fra cio che la disciplina ha empiricamente stabilito e cio che il pubblico crede di sapere e enorme.

L’ironia e che Sapir e Whorf, se potessero leggere la propria reputazione, sarebbero probabilmente disorientati. Sapir era uno scienziato cauto, scrupoloso, che diceva “in larga misura” dove la divulgazione dice “completamente”. Whorf era più vulcanico, ma scriveva per ingegneri MIT con esempi tecnici precisi (i barili “vuoti”, i case study Hopi). Né sosteneva la versione divulgata della “loro” ipotesi.

La lezione metodologica generale e che le ipotesi scientifiche, una volta entrate nel discorso pubblico, vivono di vita propria. Chi vuole pensare seriamente a un argomento come linguaggio-cognizione deve attraversare due strati di rumore: la divulgazione semplificante e la reazione contro-divulgativa (Pinker 1994 e in qualche modo una reazione, McWhorter 2014 idem). Il dato empirico moderato si trova nel mezzo.

Una nota sulla compatibilità con le grammatiche universali

Sapir-Whorf weak e l’universalismo chomskiano non sono in contraddizione formale, contro un’impressione divulgativa diffusa. La grammatica universale chomskiana sostiene che esiste un’architettura cognitiva innata che vincola le grammatiche possibili. Sapir-Whorf weak sostiene che dentro lo spazio delle grammatiche possibili, le scelte specifiche di una lingua materna influenzano le abitudini cognitive del parlante.

Le due tesi parlano di livelli diversi. Universal grammar parla di vincoli architetturali su cosa una grammatica può essere. Linguistic relativity weak parla di effetti psicologici di abituazione a particolari distinzioni grammaticali. Possono coesistere: l’architettura limita lo spazio, le abitudini modulano la cognizione dentro lo spazio.

In pratica, tensioni operative emergono. Chi enfatizza la grammatica universale tende a minimizzare gli effetti whorfiani (Pinker 1994). Chi enfatizza la relatività tende a vedere universal grammar come fragile o vuota di contenuto. La sintesi possibile e una posizione moderata: vincoli universali esistono ma sono più flessibili e meno specifici di quanto Chomsky abbia talvolta sostenuto; effetti whorfiani esistono ma sono modesti e modulati. La verità empirica sta nel mezzo, e e meno spettacolare di entrambe le posizioni estreme.

Pormpuraaw, blu russo, ponte tedesco: cosa hanno in comune

Una visione sintetica dei casi solidi. Pormpuraaw e i frame allocentrici parlano di abitudine spaziale: chi parla una lingua con direzioni cardinali obbligatorie tiene in memoria automatica l’orientamento cardinale. Blu russo parla di abitudine cromatica: chi parla una lingua con due basic color terms per il blu accelera la discriminazione percettiva al confine. Ponte tedesco vs ponte spagnolo, se valido (e qui il caso e fragile), parlerebbe di abitudine semantico-stereotipica: chi parla una lingua con genere grammaticale arbitrario per oggetti potrebbe associare tratti stereotipici.

Il filo conduttore e: una distinzione obbligatoria nella lingua si converte in un’attenzione ripetuta che, su scala di vita, diventa una abitudine cognitiva automatica. Non determinismo, non incommensurabilità: abituazione. La metafora migliore e quella del professionista esperto. Il radiologo ha imparato a vedere ombre che l’occhio profano non distingue. Non perché ha occhi diversi, perché ha categorie pratiche diverse. Le lingue fanno questo all’attenzione di tutti i loro parlanti, non per professione ma per default di vita.

Posizione	Stato dell’evidenza	Casi chiave
Determinismo forte	nessun supporto	tempo Hopi sfatato (Malotki 1983); parole inuit per neve mitologiche
Relatività debole — solido	supporto reale, replicato	cognizione del colore (Russian blues, Berinmo); frame spaziale assoluto (Pormpuraaw, Tzeltal)
Relatività debole — moderato	supporto contestuale, task-dipendente	metafore temporali (mandarino verticale, Aymara future-behind)
Relatività debole — fragile	replicazioni contrastanti	genere grammaticale e tratti stereotipici di oggetti (Boroditsky-Schmidt-Phillips 2003 contestato)
Parallelo AI	analogia, NON equivalenza	Wendler et al. 2024 — inglese come pivot latente in Llama-2; bias WEIRD pre-training

Collegamenti

Linguaggio come strumento del pensiero — la cornice generale linguaggio-pensiero, di cui questo capitolo è l’approfondimento monografico su Sapir-Whorf.
Competenze innate vs apprese — il polo opposto del dibattito: Chomsky e l’universalismo della grammatica generativa. Sapir-Whorf weak e Chomsky universalismo non sono in contraddizione formale: la grammatica universale fissa un’architettura, la relatività weak modula abitudini. Sono compatibili in linea di principio, in tensione nei dettagli.
Modelli mentali — Johnson-Laird sui modelli mentali. La Sapir-Whorf weak suggerisce che le abitudini di costruzione di modelli mentali sono modulate dalla lingua materna; Johnson-Laird e relativamente neutro sul punto.
La mente nel corpo e nel mondo — cognizione embodied. Núñez-Sweetser sul gesto aymara è un caso di intersezione: la lingua orienta il gesto, che è cognizione embodied co-verbale.
Modello mentale dell’altro — theory of mind. Esistono studi di linguistic relativity sulla theory of mind (per esempio impatto di lingue con marcatori epistemici obbligatori sull’acquisizione di TOM); non li abbiamo trattati qui.
atti-linguistici — Austin, Searle. Performativita del linguaggio: dire e fare, dimensione complementare a quella categoriale.
semantica-distribuzionale — Firth e la semantica distribuzionale. Ponte concettuale verso embedding e modelli linguistici.

Una nota su persone, lingue, geografie

Vale la pena radicare i nomi citati nelle loro biografie, perché la ricerca empirica e fatta da persone in luoghi specifici e questo aiuta a contestualizzare i risultati.

Lera Boroditsky (1976-, cognitive scientist nata a Bielorussia, emigrata negli USA bambina). Ha lavorato a Stanford e MIT, oggi a UCSD. La sua produzione e centrale nel revival moderno della Sapir-Whorf weak: blu russo (Winawer 2007 con lei senior author), Pormpuraaw (Boroditsky-Gaby 2010), gender (Boroditsky-Schmidt-Phillips 2003), tempo (Boroditsky 2001). Stile sperimentale: paradigmi semplici, comunicazione efficace, interpretazione moderata. Il suo TED talk “How language shapes the way we think” (2017) ha avuto oltre dieci milioni di visualizzazioni — buona divulgazione, ma il pubblico generale assorbe la versione semplificata.

Stephen Levinson (1947-, antropologo linguista britannico). Ha studiato a Cambridge e Berkeley, e direttore del Max Planck Institute for Psycholinguistics di Nijmegen dal 1991. Il programma del MPI Nijmegen sui frame spaziali e diventato il riferimento nel campo. Levinson ha anche lavorato sulla pragmatica (presupposition, implicature) ed e voce influente nella discussione su universals vs diversity.

Eleanor Rosch (1938-, psicologa Berkeley, formata a Harvard). Le sue prime pubblicazioni come Eleanor Heider (sui Dani 1972) sono in qualche modo state superate dai dati di Roberson 2000, ma il suo lavoro successivo sulle prototype categories e fondativo della cognitive psychology delle categorie. Il suo Natural Categories 1973 e Cognitive Reference Points 1975 hanno influenzato linguistica cognitiva, AI dei concetti, theory of categorization.

Brent Berlin (1936-) e Paul Kay (1934-). Antropologo e linguista a Berkeley negli anni Sessanta. Il loro libro 1969 ha definito un programma di ricerca (il World Color Survey) che continua oggi. Hanno difeso i loro risultati nelle revisioni successive, ammettendo modifiche metodologiche.

Daniel Casasanto (cognitive scientist, ora Cornell, prima Chicago). La sua review 2008 “Who’s afraid of the Big Bad Whorf?” e un punto di riferimento per la sintesi balanced. Ha lavorato anche su body-specific cognition (i destrimani vs mancini hanno mappature spaziali del valore opposte: per i destrimani buono e a destra, per i mancini buono e a sinistra; coerente con embodied cognition).

John Lucy (1949-, linguista University of Chicago). Il suo Language Diversity and Thought 1992 e ancora il riferimento storico-teorico fondamentale. Ha lavorato sul yucateco e ha sostenuto una versione disciplinata della relatività.

Geoff Pullum (1945-, linguista britannico, Edimburgo poi UCSC). Ha demolito il mito Eskimo snow words. Voce critica influente della linguistica generale, blogger di Language Log.

Steven Pinker (1954-, psicolinguista canadese, Harvard). The Language Instinct 1994 e la voce più influente dello scetticismo whorfiano divulgato. Difensore della grammatica universale chomskiana, della modularità della mente. Le sue posizioni su Whorf sono spesso lette come over-reach, ma il suo libro ha dato peso alla critica delle versioni gonfie della relatività.

John McWhorter (1965-, linguista Columbia). The Language Hoax 2014 critica certe over-claim whorfiane con piglio polemico ma documentato. Voce di un dibattito ancora aperto.

Una sintesi disciplinata

Il dossier Sapir-Whorf, ridotto all’osso, sostiene che le abitudini linguistiche obbligatorie nella lingua materna formano abitudini cognitive automatiche, modeste ma misurabili, in domini specifici. Color cognition (blu russo, Berinmo) e spatial cognition (Pormpuraaw, Tzeltal, Guugu Yimithirr) hanno evidenza solida e replicata. Time metaphors (mandarino verticale, aymara future-behind) hanno evidenza moderata. Gender effect e fragile alla replica e va trattato con cautela.

La versione strong (linguistic determinism) e empiricamente falsa: nessuna lingua intrappola cognitivamente i suoi parlanti. La versione weak (linguistic relativity) e contestualmente vera, modulata dal compito, dipendente dal carico cognitivo, e il suo meccanismo cognitivo e l’attenzione automatica a distinzioni obbligatorie.

L’analogia con i large language model multilingue e suggestiva ma da non forzare. Latent English e un fenomeno tecnico, conseguenza dello sbilanciamento del corpus di pretraining, parallelo concettuale ma non identità meccanica con la relatività umana. Cross-lingual transfer mostra che esiste sostrato semantico parzialmente condiviso, contro la versione strong, non contro la weak. WEIRD bias degli LLM e più un fenomeno culturale che linguistico stretto, ma rivela come materiale linguistico in input modula le risposte di un sistema.

Per il professionista che lavora con il linguaggio — UI designer, scrittore, traduttore, NLP engineer, educatore — la lezione operativa e: la lingua influenza modi di pensare in piccolo ma in modo sistematico. Localizzare bene non e tradurre, e ripensare frame. Lavorare con LLM in lingue non-inglesi richiede consapevolezza del bias del corpus. Insegnare lingue seconde può offrire al discente nuove categorie cognitive abituali. La Sapir-Whorf weak e uno strumento concettuale utile, purché non venga gonfiato in versione strong né liquidato come mito.

Lateralizzazione cerebrale dell’effetto whorfiano

Una sezione tecnica per chi vuole il dettaglio neuroscientifico. L’effetto whorfiano sui confini di colore mostra una asimmetria emisferica documentata.

Aubrey Gilbert, Terry Regier, Paul Kay e Richard Ivry 2006 in PNAS 103(2):489-494, “Whorf hypothesis is supported in the right visual field but not the left”, hanno disegnato un esperimento elegante. Stimoli di colore vengono presentati in periferia, lateralmente al punto di fissazione. Stimoli nel campo visivo destro proiettano all’emisfero sinistro. Stimoli nel campo visivo sinistro proiettano all’emisfero destro. Il linguaggio, in soggetti destrimani tipici, e lateralizzato a sinistra.

Il compito e visual search: trovare un quadrato di colore diverso in un anello di quadrati identici. Quando il target e di una categoria linguistica diversa dai distrattori (cross-category), la ricerca dovrebbe essere accelerata se l’effetto whorfiano e attivo. Quando target e distrattori sono nella stessa categoria (within-category), accelerazione minore.

Risultato: l’accelerazione cross-category appare significativa solo quando lo stimolo e nel campo visivo destro (ovvero processato dall’emisfero sinistro, dove sta il linguaggio). Nel campo visivo sinistro (emisfero destro), l’accelerazione e assente o minima.

L’interpretazione: il categorical perception effect dei colori dipende da risorse linguistiche, e queste risorse sono lateralizzate. La lingua non riprogramma la percezione retinica; modula la categorizzazione lavorando dal modulo linguistico. Coerente con il dato di Winawer 2007 che il carico verbale azzera l’effetto: il sistema linguistico e una risorsa attivamente impegnata, non un cambiamento permanente del cablaggio percettivo.

Estensioni: Liu et al. 2009 Brain Research replicano il pattern in cinese mandarino. Roberson-Pak-Hanley 2008 Cognition trovano lateralizzazione simile in coreano. Il pattern lateralizzato e diventato uno dei marker più robusti dell’effetto whorfiano cromatico.

Cinque domande aperte

Chiudere un capitolo su Sapir-Whorf con risposte definitive sarebbe una bugia. Cinque domande restano aperte e meritano osservazione attenta.

Quanto e robusta la replicazione del blu russo cross-cultural? Winawer 2007 e ben replicato in russo. Il pattern parallelo in greco (ghalazio/ble) e turco (mavi/lacivert) e stato testato (Athanasopoulos 2009, Roberson-Pak-Hanley 2008): convergente. Ma altri confini cromatici proposti come whorfiani in altre lingue (japanese aoi che copre blu e verde antichi) hanno repliche miste. Il caso del blu russo e solido; la generalizzazione “qualunque confine linguistico aggiunto modula la percezione” e ancora aperta.

Il rotation paradigm e davvero linguistico o ambientale? Li-Gleitman 2002 vs Levinson team 2004 (Cognition 92(3):B59-B79). Dibattito non risolto. Plausibilmente, la verità e che entrambi i fattori contribuiscono: la lingua orienta l’attenzione verso un frame di riferimento, l’ambiente fornisce o nega landmark. Studi futuri con popolazioni intermedie (parlanti di lingue allocentriche urbanizzati, parlanti di lingue egocentriche cresciuti in ambienti rurali con landmark forti) potrebbero pesare i contributi.

Gender effects: e morto o solo molto piccolo? Mickan 2014 e altre repliche fallite suggeriscono effetto piccolo o nullo. Ma i meta-studi recenti su lingue con gender obbligatorio (Sera et al. 2002 originale, ripreso) trovano effetti modesti su category sorting di oggetti. La disciplina probabilmente convergera su “effetto piccolo, dipendente da task, non robusto come il color o spatial”. Ma non sembra completamente azzerato.

Latent English nei multilingual LLM e una proprietà inevitabile o un artefatto del corpus? Wendler 2024 testa Llama-2 con corpus heavy-English. Modelli con corpus più bilanciato (mT5, Qwen multilingue) potrebbero mostrare pattern diverso. Esperimenti futuri con probing layer-wise su modelli multilingual-balanced confermerebbero o smentirebbero che il fenomeno e specifico al training data, non architetturale.

WEIRD bias degli LLM resiste al fine-tuning culturale? Atari 2023 e Cao 2023 documentano il bias. La domanda operativa e: fine-tuning su corpus non-WEIRD attenua significativamente o solo superficialmente? E il bias trasferisce attraverso lingue (un LLM fine-tuned su corpus arabo cambia anche le sue risposte morali in altre lingue)? Aperto.

Una postilla: la meta-domanda

Una meta-domanda che si pone chi studia Sapir-Whorf seriamente: cos’e una “categoria cognitiva” e cosa una “categoria linguistica”? La distinzione, che a parole sembra ovvia, sotto pressione concettuale traballa. Se la cognizione adulta e in gran parte mediata da rappresentazioni linguistiche o quasi-linguistiche (versione moderata della tesi del language of thought), allora “categoria cognitiva” non e indipendente dalla “categoria linguistica” in linea di principio: e una versione particolare di categoria linguistica internalizzata.

Da questa angolazione, la domanda Sapir-Whorf “la lingua influenza il pensiero?” diventa quasi tautologica nella sua forma generale: certamente lo influenza, perché il pensiero adulto e in larga parte costruito di materiale linguistico. La domanda interessante diventa più specifica: quanto del pensiero adulto e indipendente dalla lingua materna specifica (universale, basato sull’architettura cognitiva di base) e quanto e specifico della lingua in cui sei cresciuto?

I dati che abbiamo suggeriscono: una porzione sostanziale del pensiero e indipendente — riconosciamo oggetti, navighiamo lo spazio, facciamo inferenze causali, attribuiamo intenzioni anche senza il supporto specifico della nostra lingua materna. Una porzione più piccola ma misurabile e specifica — la velocita con cui categorizziamo certi colori, l’asse spaziale che usiamo automaticamente per il tempo, l’orientamento cardinale che teniamo sempre presente. La proporzione esatta tra le due porzioni dipende dal dominio.

Per il professionista che lavora con linguaggio e cognizione — agent designer, traduttore, NLP engineer, educatore — questa meta-domanda non e oziosa. Decide come pensare la generalizzabilità di un risultato. Decide se vale la pena adattare un’interfaccia per parlanti di un’altra lingua. Decide se trattare un effetto whorfiano come fenomeno fragile da ignorare o come asset da sfruttare. La risposta caso per caso e ancora la regola.

Glossario rapido

Otto termini ricorrenti, in ordine di prima introduzione:

Linguistic determinism: la lingua determina cosa il parlante può pensare. Versione strong di Sapir-Whorf, empiricamente falsa.
Linguistic relativity: la lingua influenza, modula, facilita le abitudini cognitive. Versione weak, contestualmente vera in domini specifici.
Categorical perception: discriminazione percettiva accelerata al confine fra categorie.
Frame di riferimento spaziale: egocentrico (relativo all’osservatore), intrinseco (parti dell’oggetto), allocentrico (cardinali).
Basic color term: lessema monomorfemico ad alta frequenza per un colore (esempio: rosso, blu). Definizione operativa di Berlin-Kay.
Rotation paradigm: test cognitivo in cui il soggetto memorizza una sequenza spaziale, viene ruotato di 180°, e deve riprodurla. Diagnostica del frame di riferimento usato.
Carico verbale (verbal interference): occupare il sistema linguistico con un compito secondario (ripetere cifre) per testare se l’effetto whorfiano dipende da risorse linguistiche.
Latent English: fenomeno tecnico in multilingual LLM dove le rappresentazioni intermedie sono geometricamente più vicine all’embedding inglese che alla lingua di superficie.

Per andare oltre

John Lucy 1992 Language Diversity and Thought: A Reformulation of the Linguistic Relativity Hypothesis, Cambridge University Press. Ricostruzione storica e teorica accurata. Punto di partenza canonico.
Daniel Casasanto 2008 “Who’s afraid of the Big Bad Whorf?” Language Learning 58(s1):63-79. Sintesi balanced della letteratura empirica.
John Carroll (ed.) 1956 Language, Thought, and Reality: Selected Writings of Benjamin Lee Whorf, MIT Press. Le fonti primarie. Whorf in originale.
Stephen Levinson 2003 Space in Language and Cognition, Cambridge University Press. Programma di ricerca sulla relatività spaziale, esposto dall’autore.
John McWhorter 2014 The Language Hoax, Oxford University Press. Critica popolare ma rigorosa di alcune over-claim whorfiane. Buon contrappeso alla letteratura entusiasta.