Il secondo inverno dell'AI: costi, hype, crollo

Tra il 1987 e il 1993 l’industria commerciale dell’AI costruita intorno ai sistemi esperti collassa in pochi anni: Lisp Machines vanno in bancarotta, il Fifth Generation Project chiude senza risultati, DARPA cambia direzione, AAAI dimezza le presenze e il termine “AI” diventa per oltre un decennio un marker di hype da evitare. Sotto il livello del rumore mediatico, intanto, maturano i paradigmi che tornaranno a vincere: reti neurali, statistical learning, reti bayesiane, robotica reattiva.

Perché questo capitolo

Tre numeri scattano la cornice. Symbolics: revenue di $114 milioni nel 1986, bancarotta tecnica nel 1987, sopravvissuta come ombra fino al 1996. AAAI: 5500 attendees nel 1986, meno di 2000 nel 1991. DARPA Strategic Computing Initiative: tagli del 50% in due anni di budget AI a partire dal 1988. In sei anni, fra il 1987 e il 1993, l’industria commerciale dell’AI costruita intorno ai sistemi esperti non si ridimensiona: collassa. Il Fifth Generation Project giapponese — il più grande programma pubblico di AI mai lanciato — chiude nel 1992 senza i risultati promessi. Il termine “AI” diventa per oltre un decennio un marker di hype da evitare nei pitch e nei paper.

Sotto il rumore mediatico, intanto, maturano i paradigmi che vinceranno la fase successiva: backpropagation usata in produzione (LeNet-5 di Yann LeCun a Bell Labs nel 1989, in lettura automatica di assegni dal 1995), convolutional networks per visione, hidden Markov models per parlato, reti bayesiane per inferenza con incertezza, support vector machines (Vapnik 1995), reinforcement learning con temporal difference, robotica reattiva di Brooks. L’inverno non è un buco nero: è un periodo in cui muore una narrativa generalista e si stabilizzano molte tecniche solide sotto altri nomi. Capire l’inverno serve a leggere correttamente i decenni successivi.

C’è una terza linea di interesse, comparativa: il secondo inverno è il primo caso di studio ben documentato del pattern hype-disillusione-collasso applicato a una tecnologia digitale. Le sue lezioni operative — scegliere casi d’uso narrow con metriche verificabili, separare R&D da produzione, distinguere benchmark da deployment — sono ricorrenti in ogni ondata successiva. Il confronto con il presente è discusso nelle “Applicazioni pratiche”.

Contesto

Questo capitolo prende il filo dalla fine di sistemi-esperti. Tra il 1980 e il 1986 era nata un’intera industria intorno alla AI commerciale.

Spin-off accademici emergono dai grandi laboratori: IntelliCorp (1980, Menlo Park, spin-off Stanford), Teknowledge (1981, Palo Alto, anch’essa Stanford), Inference Corporation (1979, Los Angeles, da MIT/USC), Carnegie Group (1983, Pittsburgh, da CMU). Produttori di workstation specializzate dominano l’hardware: Symbolics (1980, Cambridge MA, dal MIT AI Lab) e Lisp Machines Inc o LMI (1979, anche dal MIT AI Lab). Fornitori di hardware general-purpose con linee dedicate: Xerox con la serie 1108 Dandelion, Texas Instruments con la serie Explorer.

Il mercato totale, contando hardware Lisp Machines, software shell e servizi di consulenza, era stimato intorno a 4-5 miliardi di dollari annui nel 1986-87. Per contesto: una mid-cap industry, comparabile in dollari nominali al mercato delle workstation Unix dello stesso periodo.

Su questo sfondo entrano in scena diversi attori che incontreremo. Symbolics era il marchio più visibile: workstation 3600 series e Ivory series specializzate per Lisp, prezzi tra 50.000 e 200.000 dollari a unita, status symbol del laboratorio AI ben finanziato. Le sue revenue raggiungono un picco di circa 110 milioni di dollari nel 1986.

Sun Microsystems, fondata nel 1982 a Mountain View da Andy Bechtolsheim, Vinod Khosla, Scott McNealy e Bill Joy, produceva workstation Unix general-purpose. La Sun-3 (1985, basata su Motorola 68020) costava intorno a 25.000 dollari. Con Common Lisp standardizzato nel 1984 (poi formalizzato come ANSI X3.226 nel 1994) eseguiva Lisp ad accettabile velocità. La Sun-4 (1987) introduce l’architettura SPARC (Scalable Processor Architecture, RISC), che sposta ulteriormente il rapporto prezzo/performance.

Sul piano dei progetti pubblici, due grandi iniziative hanno fissato il livello di ambizione del decennio.

Il Fifth Generation Computer System Project (FGCS) è lanciato nel 1981 dal MITI giapponese (Ministry of International Trade and Industry, oggi METI) con un budget di circa 57 miliardi di yen (nell’ordine di 400-850 milioni di dollari ai tassi di cambio dell’epoca, a seconda del periodo). Direzione: ICOT (Institute for New Generation Computer Technology) a Tokyo, guidato da Kazuhiro Fuchi (informatico giapponese, 1936-2006). Obiettivo: hardware parallelo dedicato all’esecuzione di Prolog (linguaggio di programmazione logica, Alain Colmerauer e Philippe Roussel, Marsiglia 1972), knowledge bases massive, interfacce in linguaggio naturale, “macchine che ragionano” alla velocità di centinaia di milioni di logical inferences per second (LIPS).

La risposta USA arriva con la Strategic Computing Initiative di DARPA (Defense Advanced Research Projects Agency), lanciata nel 1983 con budget di circa 1 miliardo di dollari su dieci anni. Tre prototipi dichiarati: smart vehicle (un veicolo terrestre autonomo per uso militare), pilot’s associate (un assistente AI per piloti di caccia), battle management (supporto alle decisioni in scenari di combattimento). La risposta britannica è l’Alvey Programme (1983-1990), e quella europea l’ESPRIT (European Strategic Programme for Research in Information Technology). Negli USA viene anche fondato MCC (Microelectronics and Computer Technology Corporation), consorzio industriale di ricerca pre-competitiva (1983, Austin Texas), in parte come risposta al sospetto di un sorpasso giapponese.

Le date che inquadrano l’inverno sono indicative ma utili come scheletro.

Il 1986 è l’anno di picco: AAAI conference a Philadelphia con circa 6.000 attendees, expo industriale con oltre 100 espositori, Symbolics in massima espansione. Il 1987 segna la prima crepa: licenziamenti a Symbolics, Sun lancia SPARC, NIPS (Neural Information Processing Systems, oggi NeurIPS) tiene la sua prima conferenza a Denver. Tra il 1988 e il 1990 crolla l’hardware: LMI in bancarotta (1988), Symbolics esce gradualmente dal mercato hardware nuovo (1988-1990), TI Explorer line discontinuata (1990), Xerox 1108 successor discontinuati.

Nel 1992 il NYT titola “Fifth Generation Became Japan’s Lost Generation” (Andrew Pollack, 5 giugno) e ICOT chiude ufficialmente il progetto. Nel 1993 Symbolics file Chapter 11 (sopravvivera in forma ridotta come azienda software) e Strategic Computing termina senza i successi promessi. Daniel Crevier pubblica nello stesso 1993 “AI: The Tumultuous History of the Search for Artificial Intelligence” (Basic Books), che diventa la prima storia organica del campo scritta a caldo dopo il crollo.

Vale la pena fissare un dato sociologico. L’AI commerciale del 1986 era piccola: poche aziende quotate, poche centinaia di knowledge engineer, poche migliaia di ricercatori accademici attivi. Quando il pendolo dell’attenzione e dei finanziamenti si gira, non c’è una massa critica di attori indipendenti a cui appellarsi. La fragilita istituzionale dell’industria — concentrata in pochi spin-off di pochi laboratori — è parte del meccanismo del crollo, esattamente come era stato per il primo inverno (vedi primo-inverno-ai).

L’intuizione

Angolo sociologico-economico: come muore una industria tecnologica matura

Una industria tecnologica matura non muore per un singolo evento: muore per accumulo di crepe. Il modello mentale più utile è quello di un palazzo costruito su quattro pilastri: una promessa di valore credibile, clienti che pagano per quel valore, fornitori che producono al costo previsto, una narrativa pubblica che giustifica gli investimenti continui. Quando uno dei quattro pilastri inizia a cedere, gli altri tre devono compensare; se cedono due o più, il palazzo crolla.

L’industria dei sistemi esperti aveva tutti e quattro i pilastri solidi nel 1985. La promessa di valore: “automatizzare la conoscenza esperta in domini ad alto valore”. I clienti che pagavano: Fortune 500 in finanza, manifattura, farmaceutica, difesa. I fornitori: aziende quotate con prodotti spedibili. La narrativa pubblica: cover stories di BusinessWeek, Fortune, Newsweek; libri come “The Fifth Generation” di Edward Feigenbaum e Pamela McCorduck (1983, Addison-Wesley) che agitavano lo spettro di un sorpasso giapponese; conferenze AAAI con espositori che riempivano padiglioni.

Tre anni dopo, nel 1988-89, tutti e quattro i pilastri hanno crepe visibili. La promessa è contestata dai primi clienti scottati. I clienti riducono i contratti. I fornitori licenziano. La narrativa pubblica diventa scettica. Quando si tenta di compensare la crepa di un pilastro con risorse degli altri, si scopre che le risorse degli altri sono finite.

La dinamica è fragile in modo specifico. Una bolla industriale tecnologica costruita su fiducia (e non su lock-in tecnologico forte) può collassare in modo non lineare: i clienti che cancellano i contratti non sono trattenuti da costi di switching elevati, perché i sistemi esperti rule-based sono per loro natura modulari e sostituibili da soluzioni alternative (un assemblatore VAX può tornare a fare a mano, un risk officer può tornare a Excel). La velocità del crollo riflette questa fragilita: tra il picco del 1986 e il punto più basso del 1992 passano meno di sei anni, durante i quali l’industria dei sistemi esperti perde l’80-90% del suo valore di mercato.

È lo stesso pattern che si vede in altri collassi tecnologici successivi: il dot-com crash, il crash dei primi smartphone non-iPhone non-Android, il ridimensionamento di Web3 e crypto. Quando la promessa di valore è contestata e il lock-in è debole, l’erosione è rapida. Le ricadute pratiche di questa osservazione sono in “Applicazioni pratiche”.

Angolo tecnico: i limiti irrisolvibili e il paradigma in attesa

Il secondo angolo è tecnico ed è meno raccontato. I sistemi esperti non sono crollati solo per ragioni economiche: avevano limiti tecnici intrinseci che, dato il livello di compute e di teoria del 1985, erano impossibili da risolvere all’interno del paradigma simbolico. Vediamoli per categoria, prima di tornarci nel dettaglio nella sezione sulla meccanica.

Il knowledge acquisition bottleneck — il fatto che estrarre regole esplicite da esperti umani è lento, costoso e produce sempre una caricatura della competenza tacita — non aveva soluzioni tecnologiche all’orizzonte. Tentativi di automazione (Meta-DENDRAL, ROGET di William van Melle, induzione di regole da casi storici) erano embrionali.

Il filosofo Michael Polanyi (chimico-fisico ungherese-britannico, 1891-1976) aveva diagnosticato il problema in chiave filosofica nel libro “The Tacit Dimension” (1966): we know more than we can tell. Una porzione della competenza esperta è tacita, gestaltica, non riducibile a regole esplicite enumerabili.

Una via per superare il bottleneck esisteva, in linea di principio: imparare automaticamente dai dati invece di estrarre regole. Ma richiedeva grandi quantità di dati etichettati, compute per addestrare modelli, e algoritmi di machine learning maturi. Nessuna delle tre cose era disponibile nel 1985.

La brittleness — il fatto che un sistema rule-based fallisce silenziosamente sui casi non previsti dalla KB — era un sintomo di un’assenza più profonda di common sense reasoning. Il progetto Cyc di Doug Lenat (informatico statunitense, 1950-2023), avviato nel 1984 a MCC e poi spin-off in Cycorp, voleva risolvere il problema codificando a mano milioni di assiomi di common sense. Cyc resta in attività per decenni con risultati discussi. Nel 1985 una via alternativa basata sull’apprendimento statistico da grandi corpora non era nemmeno immaginabile come opzione industriale: hardware, dati e teoria non erano pronti.

L’assenza di apprendimento nei sistemi esperti classici era un limite strutturale. Una KB del 1985 era un fossile nel 1990: nessun adattamento ai casi nuovi, nessun drift detection, nessun online learning. La via per integrare apprendimento esisteva: connectionism (reti neurali con backpropagation, riscoperto da Rumelhart-Hinton-Williams nel 1986), statistical learning (SVM e VC theory di Vapnik dagli anni 70 ma maturi solo a metà anni 90), reinforcement learning (Sutton-Barto, formalizzato negli anni 80 ma textbook solo nel 1998). Tutti e tre i filoni erano vivi nei laboratori durante l’inverno, ma non maturi industrialmente.

Il paradigma sostitutivo — statistical/connectionist machine learning — stava maturando sotto la superficie del rumore mediatico, ma non era pronto per essere prodotto.

Il backpropagation era stato rilanciato nel paper “Learning Representations by Back-propagating Errors” di David Rumelhart, Geoffrey Hinton e Ronald Williams (Nature, ottobre 1986), ma servivano dataset etichettati grandi e compute che semplicemente non c’erano.

Le convolutional neural networks di Yann LeCun (informatico francese, 1960-) per il riconoscimento di codici postali (paper “Backpropagation Applied to Handwritten Zip Code Recognition”, Neural Computation 1989) funzionavano in nicchia ai Bell Labs, ma scalare a domini visuali più ampi richiedeva un ordine di grandezza in più di compute.

Le support vector machines di Vladimir Vapnik (matematico russo-statunitense, 1936-) sarebbero arrivate alla forma moderna solo nel 1995 con il paper “Support-Vector Networks” (Cortes-Vapnik, Machine Learning). Le Bayesian networks di Judea Pearl (informatico israeliano-statunitense, 1936-, premio Turing 2011) erano formalizzate nel libro “Probabilistic Reasoning in Intelligent Systems” (Morgan Kaufmann, 1988), ma non ancora integrate in prodotti commerciali. Il reinforcement learning sarebbe diventato un campo coerente solo con il textbook di Sutton-Barto (MIT Press, 1998).

Il punto è importante: il secondo inverno è un periodo di vuoto industriale in cui la vecchia AI muore prima che la nuova sia pronta. Tra il crollo dei sistemi esperti (1987-1993) e i primi successi visibili del deep learning (2012) passano vent’anni. La transizione è lenta. Per chi era in quegli anni un giovane ricercatore che aveva scelto AI come campo, l’inverno significava trovare lavoro altrove, cambiare bandiera, accettare di essere marginale.

La meccanica

Il crollo di Symbolics e LMI (1987-1989)

Symbolics era stata fondata nel 1980 a Cambridge MA come spin-off del MIT AI Lab, su iniziativa di Russell Noftsker e con la partecipazione di alcuni dei principali sviluppatori del Lisp Machine project del MIT.

Il prodotto era una workstation specializzata per l’esecuzione di Lisp: tag bits in hardware, garbage collection assistito da microcodice, memory protection per oggetti Lisp, microcode programmabile, schermi ad alta risoluzione, mouse a tre pulsanti.

Le serie principali furono la 3600 (1983) e la successiva Ivory (1987, basata sul chip MicroIvory). I prezzi andavano da circa 50.000 dollari per la configurazione base a oltre 200.000 dollari per le configurazioni complete con disk drive, memoria espansa, software commerciale. Le revenue della compagnia raggiungono un picco di circa 110 milioni di dollari nel fiscal year 1986.

LMI (Lisp Machines Inc), fondata anch’essa nel 1979 a Cambridge come spin-off MIT, era il principale concorrente diretto. Hardware analogo, prezzi analoghi, base clienti sovrapposta. Tra le due aziende c’era una rivalita personale tra fondatori (alcuni provenienti dalla stessa squadra MIT che si era divisa), che non aiutava nessuno dei due in fase difensiva.

Il problema arriva da fuori. Sun Microsystems lancia nel 1985 la Sun-3 basata su Motorola 68020, una workstation Unix general-purpose con prezzo di circa 25.000 dollari per la configurazione tipica. Performance Lisp inizialmente inferiori a una Symbolics 3600, ma in rapido miglioramento.

Nel 1987 Sun introduce l’architettura SPARC (Scalable Processor Architecture), un design RISC sviluppato internamente. La Sun-4 SPARCstation (1989) raggiunge performance Lisp comparabili o superiori a una Symbolics 3600, a un quarto del prezzo. Apollo (acquisita da HP nel 1989), MIPS, e poi DEC con la propria linea Alpha si aggiungono alla pressione.

Il vantaggio architetturale delle Lisp Machines viene mangiato da due fattori.

Primo: Common Lisp standardizzato nel 1984 (la specifica di Guy Steele in “Common Lisp: The Language”, Digital Press) consolida i dialetti Lisp in un linguaggio portabile e permette implementazioni efficienti su CPU general-purpose. Allegro Common Lisp di Franz Inc, Lucid Common Lisp, KCL e successori girano su Sun, Apollo, DEC.

Secondo: la velocità bruta dei processori RISC general-purpose cresce più rapidamente di quanto le Lisp Machines specializzate riescano a tenere il passo. Il microcodice programmabile di Symbolics, che era un vantaggio nel 1983, diventa un peso nel 1988: ogni nuovo CPU general-purpose della concorrenza arriva con più MIPS, e la specializzazione hardware non riesce più a compensare.

La timeline del declino:

1986: Symbolics revenue picco ~110M USD. Negli ultimi mesi dell’anno, primi segnali di rallentamento ordini.
Ottobre 1987: il Black Monday (19 ottobre 1987, crollo del 22% del Dow Jones in un giorno) è uno shock macroeconomico. Le aziende clienti rivedono budget capex. Symbolics e LMI sono particolarmente vulnerabili perché vendono hardware costoso a budget discrezionari.
1987-1988: prima ondata di layoff a Symbolics. LMI in difficoltà finanziaria seria.
1988: LMI bankruptcy. Symbolics inizia downsizing pesante.
1989: Symbolics esce dal mercato hardware per nuovi sistemi (continua a supportare la base installata). Si concentra sul business software: il sistema operativo Genera, l’IDE Symbolics Common Lisp, applicazioni dedicate.
1990-1992: Texas Instruments discontinua la linea Explorer. Xerox discontinua i successori della 1108. Tutto l’hardware Lisp Machines come categoria sparisce dal mercato.
1993: Symbolics file Chapter 11 bankruptcy protection. L’azienda continua a esistere in forme ristrutturate.

Symbolics esiste ancora oggi come entita aziendale (symbolics.com). Vende ancora supporto per Open Genera, una versione del sistema operativo Genera eseguibile su VLM (Virtual Lisp Machine) emulator su Linux x86. È un fossile vivente, mantenuto da una piccola comunità di hobbisti e da nicchie professionali (alcuni hedge fund, alcune NASA mission che ereditano codice Lisp legacy). È il caso più visibile di una tecnologia che muore commercialmente ma non scompare biologicamente.

DARPA Strategic Computing Initiative (1983-1993)

La Strategic Computing Initiative è lanciata da DARPA nel 1983 con un budget complessivo previsto di circa un miliardo di dollari su dieci anni. Direttore iniziale: Robert Kahn (informatico statunitense, 1938-, co-inventore con Vint Cerf del protocollo TCP/IP). L’obiettivo dichiarato era costruire una nuova generazione di tecnologie AI applicabili in scenari militari, attraverso tre prototipi flagship.

Smart vehicle (Autonomous Land Vehicle, ALV): un veicolo terrestre autonomo per uso militare, capace di navigare terreno aperto con riconoscimento visivo e planning. I lavori sono concentrati al Martin Marietta e alla CMU (gruppo di Red Whittaker e poi gruppo NavLab).

I risultati raggiunti entro il 1991: il NavLab di CMU completa percorrenze di chilometri a velocità basse (circa 30 km/h) su strade reali con condizioni controllate. Niente di simile a un veicolo militare deployable.

Pilot’s associate: un assistente AI nel cockpit di un caccia, che monitorasse situazione tattica, suggerisse manovre, gestisse subsistemi. Lavori al Lockheed e al Boeing. I risultati: prototipi di UI con suggerimenti rule-based, integrazione mai oltre il dimostratore.

Il programma scopre che il cockpit di un caccia è un dominio dove la latenza e l’affidabilità sono critiche, e dove un “consiglio sbagliato” può essere letale. Il rule-based approach con certainty factors ad hoc non offriva garanzie di safety sufficienti per un sistema di sicurezza critico.

Battle management: supporto alle decisioni tattiche e strategiche in scenari di combattimento. Lavori a SAIC, BBN, MITRE. Il risultato concreto più citato è DART (Dynamic Analysis and Replanning Tool), un sistema di logistic planning usato dalla US Army durante la Guerra del Golfo (1990-1991) per pianificare trasporti militari.

DART è considerato uno dei pochi successi industriali di Strategic Computing: secondo stime DARPA, ha “ripagato” il programma ($1B over 10 years) in efficienza logistica durante una sola operazione. La cifra è contestata, ma il valore tattico è riconosciuto.

Il bilancio complessivo di Strategic Computing è largamente fallimentare rispetto agli obiettivi iniziali. Nel 1989-1991 DARPA ridimensiona drasticamente il programma. La gestione cambia direzione: dalla AI applicata militare diretta a investimenti più generici in computing infrastructure (parallel computing, networking) e a programmi mirati più piccoli. La lezione interna a DARPA: i prototipi flagship verticali di AI militare sono stati troppo ambiziosi rispetto alla maturità della tecnologia.

È istruttivo notare che DARPA non chiude i finanziamenti AI: li ridireziona.

Negli anni 90 nasce HPCC (High Performance Computing and Communications), che porta a investimenti in networking che diventeranno Internet. Nasce il programma Genoa sulla intelligence analysis. Nasce poi nei primi 2000 il programma PAL (Personalized Assistant that Learns) che produrrà CALO al SRI International, da cui spin-off l’azienda Siri (acquisita da Apple nel 2010). La continuita di DARPA nel finanziare AI è costante: cambia il framing, non l’investimento totale.

Fifth Generation Computer System Project (1981-1992)

Il FGCS giapponese è il caso di studio più didattico di megaprogetto top-down con obiettivi sbagliati. Lanciato nel 1981 dal MITI con budget di circa 57 miliardi di yen (400-850 milioni di dollari) su dieci anni. ICOT, l’istituto di ricerca dedicato, viene fondato a Tokyo con direzione di Kazuhiro Fuchi e con personale staccato dalle principali aziende giapponesi (Fujitsu, Hitachi, NEC, Toshiba, Mitsubishi).

L’idea fondamentale era sostituire la “quarta generazione” di computer (microprocessori von Neumann general-purpose, dominati da USA con Intel e Motorola) con una “quinta generazione” basata su un paradigma radicalmente diverso: computing orientato alla logical inference invece che alla arithmetic computation, con hardware parallelo dedicato all’esecuzione di linguaggi logici come Prolog, e knowledge bases massive come repository di conoscenza strutturata. L’unita di performance non sarebbe stata MIPS (milioni di istruzioni per secondo) ma LIPS (logical inferences per second).

Il progetto produce hardware e software reali. Le Personal Inference Machines (PIM) sono workstation parallele dedicate all’esecuzione del linguaggio KL1 (Kernel Language 1, una variante di Concurrent Prolog). Si arrivano a costruire macchine PIM con centinaia di processori e performance dichiarate intorno a centinaia di megaLIPS. Software base, knowledge representation tools, prototipi di applicazioni in domini medico, legale, manifatturiero.

Il problema non è che il progetto non produca tecnologia: produce tecnologia reale. Il problema è che la tecnologia è nicchia e non ha mercato.

Tre fattori convergono.

Primo: il computing parallelo non si sviluppa, nel mondo reale, attraverso linguaggi logici. Si sviluppa attraverso framework imperativi (MPI per HPC, poi MapReduce per il big data computing nel 2004 con il paper di Jeff Dean e Sanjay Ghemawat a Google). Il pattern di parallelismo che funziona industrialmente è “molti processori che lavorano su shard dei dati”, non “molti processori che eseguono logical inference in parallelo”.

Secondo: l’idea di “knowledge-based reasoning come strada all’AGI” non scala. Le knowledge bases massive che il progetto immaginava — milioni di assiomi che permettessero a una macchina di “ragionare” su domini aperti — soffrono degli stessi problemi che Cyc avrebbe esposto in scala: knowledge acquisition bottleneck, brittleness, no learning.

Il problema non è Prolog vs Lisp; il problema è “rappresentazione esplicita di conoscenza” come paradigma fondante di AI generale. Quel paradigma non funziona, in nessun linguaggio.

Terzo: il gap di performance tra hardware specializzato e general-purpose si chiude esattamente come per le Lisp Machines. Le PIM vengono progettate quando una CPU general-purpose era nell’ordine di pochi MIPS; quando vengono spedite, le CPU Intel e i RISC commerciali sono ad ordini di magnitudo superiori. Il vantaggio architetturale è eroso prima che il prodotto arrivi al mercato.

Nel 1992 ICOT chiude ufficialmente il progetto. Andrew Pollack scrive sul New York Times del 5 giugno 1992 l’articolo “Fifth Generation Became Japan’s Lost Generation”, che diventa il titolo canonico per riferirsi al fallimento. Il giudizio storico è che FGCS abbia fornito formazione a una generazione di ricercatori giapponesi (molti dei quali poi attivi in altre aree) e abbia prodotto qualche idea utile su programmazione logica concorrente, ma sia stato un fallimento commerciale e strategico.

È importante notare due cose. Primo: il consorzio occidentale di risposta (MCC negli USA, Alvey nel Regno Unito) non ha prodotto risultati sostanzialmente migliori. Alvey chiude come previsto nel 1990 senza follow-on. MCC entra in declino dal 1990 e chiude nel 2000. Anche le risposte difensive sono state in larga misura inefficaci. Secondo: l’allarme di Feigenbaum-McCorduck nel 1983, che agitava lo spettro di un sorpasso giapponese, si rivela retrospettivamente sovrastimato. Il Giappone non ha mai sorpassato gli USA nell’AI, e il fallimento del FGCS è parte della spiegazione del perché.

Crollo del mercato dei sistemi esperti

Il mercato totale dei sistemi esperti — hardware Lisp Machines + software shell + servizi di knowledge engineering — passa da un picco stimato di 4-5 miliardi di dollari annui nel 1986-87 a una frazione molto piccola di quel valore nei primi anni 90 (stime industria riportate in Crevier 1993 e in successive analisi storiografiche concordano su un calo dell’ordine del 90% in cinque-sei anni; la cifra puntuale del 1992 varia tra le fonti).

Le aziende dell’industria seguono traiettorie diverse, ma quasi tutte declinano:

IntelliCorp: revenue da circa 30 milioni nel 1986 a meno di 10 milioni nel 1990. Riconverte verso database tools. Acquisita poi da Vitria nel 2003.
Teknowledge: stesso pattern di declino. Riconvertita in consulenza generica e poi defense contracting.
Inference Corporation: declino, prodotto ART perde mercato. Acquisita da Vignette nel 1999.
Carnegie Group: declino, acquisita da Logica nel 1995.
Symbolics: come già descritto, layoff dal 1987, exit hardware 1988-1990, Chapter 11 nel 1993, sopravvivenza ridotta come azienda software.
LMI: bankruptcy 1988.
Texas Instruments Explorer line: discontinuata 1990. TI continua come azienda ma chiude la linea AI.
Xerox 1108 Dandelion e successori: discontinuati nei primi anni 90.

I clienti enterprise dei sistemi esperti seguono pattern simili. Le AI initiative interne vengono ridimensionate o chiuse. DEC smantella XCON gradualmente tra 1991 e 1995, riassorbendo le funzioni in sistemi più generici di product configuration. La Schlumberger chiude il suo Applied Research lab dedicato all’AI nel petrolio. Le major banche di Wall Street (Salomon Brothers, Goldman Sachs) ridimensionano i progetti di trading rule-based. Aerospace (Boeing, Lockheed) rallenta i sistemi esperti per design e diagnostica.

Il pattern del cliente tipico è: pilot di sei mesi che funziona bene, deployment di un anno che scala male, secondo anno in cui i costi di manutenzione superano i benefici, terzo anno in cui il sistema viene silenziosamente decommissionato o riassorbito. La narrativa interna che giustifica il decommissionamento è spesso evasiva (“riallineamento strategico”, “riorganizzazione IT”), perché dichiarare apertamente “abbiamo speso milioni in AI che non funziona” sarebbe imbarazzante.

Cause profonde: cinque-sei ragioni con esempi concreti

Le cause del crollo non sono opinioni: sono fenomeni misurabili. Le elenchiamo nella sequenza in cui si sono manifestate.

Maintenance explosion. Una KB di rule-based cresce in complessità di mantenimento in modo super-lineare con il numero di regole, perché le interazioni tra regole crescono fino a $O(R^2)$ nel caso peggiore.

XCON di DEC parte con 750 regole nel 1979, arriva a 8.000 nel 1986, e supera 17.000 verso fine vita. Il team di knowledge engineer dedicato cresce in parallelo, fino a circa 50 persone. Ogni nuova regola richiede regression testing su tutti i casi storici, perché può entrare in conflitto con regole esistenti in modi non ovvi. Il costo per nuova regola, marginale all’inizio, diventa proibitivo dopo qualche migliaio.

Brittleness e silent failure. Un sistema esperto produce risposte sbagliate con apparente sicurezza sui casi non previsti dalla KB. Esempio: un MYCIN-class deployato su un paziente pediatrico risponde con regole calibrate sull’adulto, senza accorgersi della mancata applicabilità. Un XCON-class su un componente non in catalogo produce configurazioni assurde. Il fallimento non è “lascia il problema irrisolto” ma “produce risposte sbagliate con sicurezza”, che è molto più pericoloso perché difficile da rilevare in produzione. È un pattern strutturale di ogni sistema senza meccanismo di astensione esplicito, indipendente dal paradigma di base.

No learning. I sistemi esperti classici non imparano dai casi nuovi. Una KB del 1985 è un fossile nel 1990: nessun adattamento, nessun drift detection, nessun feedback loop con i casi reali deployati. Il dominio reale evolve (nuove patologie, nuovi prodotti, nuovi pattern di frode) e la KB fissa diventa progressivamente obsoleta. Il tentativo Meta-DENDRAL di Buchanan e Mitchell, che imparava regole da casi spettroscopici, era stato un esperimento isolato che non si era generalizzato ad altri domini.

Hardware obsolescence. Le Lisp Machines (Symbolics, LMI, Xerox, TI) erano state una scommessa hardware sull’idea che eseguire Lisp in hardware specializzato fosse intrinsecamente più efficiente che eseguirlo su CPU general-purpose.

La scommessa era sensata nel 1983 quando i CPU general-purpose erano lenti. Diventa perdente nel 1987-89 quando i CPU RISC general-purpose superano in performance bruta la specializzazione hardware. È lo stesso pattern di disruptive innovation che si vede in molti altri casi: una piattaforma specializzata viene mangiata da una piattaforma general-purpose che cresce più in fretta.

La parallela storica con GPU vs ASIC dell’AI moderna (NVIDIA general-purpose vs Google TPU vs Cerebras vs Groq) è istruttiva: quando la performance general-purpose è “abbastanza”, la specializzazione hardware perde il suo vantaggio.

ROI gap vs promesse. Le promesse del 1983-86 erano enormi. Feigenbaum-McCorduck “The Fifth Generation” agitava il sorpasso giapponese. Cover stories di BusinessWeek e Fortune annunciavano la rivoluzione AI imminente. I CEO Fortune 500 venivano convinti che senza una “AI initiative” la loro azienda sarebbe stata obsoleta.

Quando i deployment reali producevano valore aggiunto modesto rispetto al TCO, il gap tra promessa e realtà diventava intollerabile. La fiducia, una volta persa, non si recupera in fretta.

Fragility verso il dominio. Un sistema esperto è progettato per un dominio specifico. Cambiare azienda, cambiare prodotto, cambiare contesto operativo richiede ricostruire una porzione significativa della KB. La portabilita inter-dominio è bassa.

Per un fornitore commerciale questo significa che ogni nuovo cliente è essenzialmente un nuovo progetto di knowledge engineering, con costi di setup elevati e margini bassi. Il modello di business “shell + servizi” funziona finché il mercato cresce; quando si contrae, i fornitori non hanno asset riutilizzabili da spostare ad altri clienti.

Cosa sopravvive

Mentre l’industria visibile crolla, sotto la superficie maturano i paradigmi che torneranno a vincere. La distinzione “sopra/sotto la superficie” è importante: l’attenzione mediatica si concentra sull’industria che muore, ma la ricerca continua nei laboratori con piccoli budget e poco rumore.

Reti neurali. Geoffrey Hinton (informatico britannico-canadese, 1947-, premio Turing 2018) si trasferisce all’Università di Toronto e continua a pubblicare su backpropagation, restricted Boltzmann machines, deep belief networks.

Yann LeCun ai Bell Labs (poi a NYU dal 2003) sviluppa convolutional neural networks per riconoscimento di codici postali (1989) e cheque reading (LeNet-5, paper “Gradient-Based Learning Applied to Document Recognition”, Proceedings of the IEEE 1998). LeNet-5 è deployata in produzione bancaria negli USA e processa una percentuale significativa degli assegni statunitensi negli anni 90-2000.

Yoshua Bengio (informatico canadese, 1964-, premio Turing 2018) a Montreal lavora su language models neurali e su recurrent networks. Sepp Hochreiter e Jurgen Schmidhuber in Germania pubblicano nel 1997 (Neural Computation) “Long Short-Term Memory”, che risolve il problema dei vanishing gradients nelle RNN e diventerà la base delle architetture sequence-to-sequence pre-Transformer.

Statistical learning. Vladimir Vapnik ai Bell Labs (poi a Facebook AI Research dal 2014) sviluppa il framework SVM (Support Vector Machines) e la teoria della VC dimension.

Il paper canonico è “Support-Vector Networks” di Corinna Cortes e Vapnik (Machine Learning, 1995), che introduce la SVM con soft margin. Il libro “Statistical Learning Theory” (Wiley, 1998) consolida il framework. Gli SVM dominano la classificazione tabulare e testuale per circa quindici anni, fino all’arrivo del deep learning.

Decision trees: Leo Breiman et al. pubblicano CART nel 1984, Ross Quinlan pubblica C4.5 nel 1993. Random Forests di Breiman nel 2001. Gradient boosting di Friedman nel 2001. La famiglia tree-based diventa, insieme agli SVM, la spina dorsale del ML applicato per due decenni.

Reti bayesiane. Judea Pearl pubblica nel 1988 “Probabilistic Reasoning in Intelligent Systems” (Morgan Kaufmann), che introduce il framework moderno delle reti bayesiane: rappresentazione grafica delle dipendenze condizionali, d-separation come criterio di indipendenza, algoritmi di inferenza esatta (variable elimination) e approssimata (belief propagation, MCMC).

Il framework risolve in modo principled il problema dell’incertezza che i certainty factors di MYCIN avevano risolto in modo ad hoc. Pearl vincerà il premio Turing 2011 proprio per questo lavoro. Le reti bayesiane diventano standard in domini specifici (medical decision support, fault diagnosis, computational biology) ma non producono mai un’industria commerciale paragonabile a quella dei sistemi esperti.

Hidden Markov Models per speech recognition. I HMM erano usati in speech fin dagli anni 70 (lavori di Jim Baker, Fred Jelinek a IBM). Maturano negli anni 90 con i sistemi di IBM (ViaVoice), Dragon Systems (NaturallySpeaking, 1997), e Microsoft.

Sono il primo grande successo commerciale di ML statistico applicato a un dominio difficile. Quando l’azienda Dragon Systems lancia NaturallySpeaking nel 1997 — il primo software di dictation continuo di successo commerciale — segna che la statistica funziona dove le rule-based avevano fallito.

Robotica reattiva. Rodney Brooks (informatico australiano-statunitense, 1954-) al MIT pubblica nel 1991 sulla rivista Artificial Intelligence il paper “Intelligence without representation”, che diventa manifesto della robotica reattiva.

La tesi è radicale: invece di rappresentare il mondo internamente con modelli simbolici, il robot dovrebbe sentire e agire direttamente sull’ambiente, con architetture a layer (subsumption architecture). “The world is its own best model”.

Brooks fonda iRobot nel 1990, che commercializzerà il robot domestico Roomba dal 2002, primo robot consumer di successo. La sua critica radicale all’AI simbolica viene da dentro la comunità robotica e contribuisce al cambiamento di paradigma.

Reinforcement learning. Richard Sutton e Andrew Barto, attivi fin dagli anni 80 sui temi di temporal difference learning e actor-critic, pubblicano la prima edizione del textbook “Reinforcement Learning: An Introduction” (MIT Press) nel 1998. Il framework MDP-based diventa la base di tutto il RL successivo.

Gerald Tesauro (IBM) pubblica nel 1992 TD-Gammon, un programma che gioca a backgammon a livello world-class usando temporal difference learning. È uno dei primi successi visibili di RL applicato.

Genetic algorithms ed evolutionary computation. John Holland aveva pubblicato “Adaptation in Natural and Artificial Systems” nel 1975. David Goldberg pubblica nel 1989 “Genetic Algorithms in Search, Optimization, and Machine Learning” (Addison-Wesley), il textbook di riferimento. John Koza estende a Genetic Programming nel 1992. Il filone resta nicchia ma sopravvive con conferenze dedicate e applicazioni industriali in ottimizzazione.

Cyc. Doug Lenat continua il progetto di knowledge engineering più visionario della storia. Cycorp viene fondata nel 1994 come spin-off di MCC. Cyc accumula milioni di assiomi di common sense durante l’inverno e oltre, producendo un asset intellettuale unico. Lenat muore nel 2023 e Cycorp viene smantellata lo stesso anno: una traiettoria parallela quasi quarantennale al mainstream AI.

Il rebranding

Negli anni 1990-2005 il termine “AI” è associato a hype fallito. Ricercatori e aziende lo evitano sistematicamente. La scelta non è cosmetica: è una questione di sopravvivenza nel sistema dei finanziamenti. Un grant proposal NSF o NSERC che usava “artificial intelligence” nel titolo aveva tasso di accettazione misurabilmente più basso di uno equivalente che usava “machine learning” o “computational intelligence”. Geoffrey Hinton ha raccontato in molte interviste come a Toronto avesse smesso di scrivere “neural network” o “AI” nelle proposals, sostituendolo con termini più neutri come “statistical learning” o “computational vision”.

I termini di sostituzione si stratificano per nicchia.

Machine learning diventa il termine di scelta per algoritmi statistici di apprendimento. Il textbook di Tom Mitchell “Machine Learning” (McGraw-Hill, 1997) cementa l’identità del campo. La conferenza ICML (International Conference on Machine Learning), nata come workshop nel 1980 e formalizzata nel 1988, cresce parallelamente.

Data mining prende il filone applicato commerciale. Il termine viene reso popolare dal libro di Usama Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth, Ramasamy Uthurusamy “Advances in Knowledge Discovery and Data Mining” (AAAI Press / MIT Press, 1996). La conferenza KDD (ACM SIGKDD Conference on Knowledge Discovery and Data Mining), fondata nel 1995, diventa la venue commerciale dominante per il settore.

Computational intelligence raggruppa neural networks, fuzzy logic, evolutionary computation. La rivista IEEE Transactions on Neural Networks viene fondata nel 1990. Lotfi Zadeh (informatico iraniano-statunitense, 1921-2017) propone “soft computing” come ombrello per l’AI non-simbolica.

Intelligent systems come ombrello industriale generale. Decision support, intelligent agents, expert systems “in versione modesta” vivono sotto questa etichetta per applicazioni enterprise.

Pattern recognition per visione artificiale e signal processing. La conferenza CVPR (Computer Vision and Pattern Recognition) cresce in importanza durante questo periodo.

Nelle conferenze accademiche, il pattern è visibile nei numeri di attendance.

AAAI cala da picco ~6.000 nel 1985-86 a circa 2.500 nei primi anni 90. NIPS, fondata a Denver nel 1987 con circa 600 attendees, cresce silenziosamente diventando venue per neural networks e statistical ML. ICML stabilizza dal 1988. KDD parte forte nel 1995 con focus commerciale.

La sostanza intellettuale dell’AI si sposta dalle conferenze “vecchie” alle nuove. Le persone bravo restano, cambiano solo bandiera.

Solo dal 2006-2010 in poi, con i primi successi visibili di deep learning (Hinton “deep belief networks” 2006, Krizhevsky-Sutskever-Hinton AlexNet 2012), il termine “AI” torna prestigioso. La svolta narrativa coincide con i successi tecnici.

L’industria ricomincia a parlare di “AI” senza imbarazzo dal 2015 circa, con DeepMind acquisita da Google (2014), Tesla che annuncia Autopilot (2014), Watson di IBM ribrandato come AI platform (2014). Il pieno ritorno mediatico arriva con ChatGPT nel novembre 2022.

Esempi

Esempio 1 — Caso DEC: dal successo XCON al ridimensionamento AI

DEC (Digital Equipment Corporation) era stata il più grande caso di successo industriale dei sistemi esperti. XCON, in produzione dal 1980, configurava ordini VAX risparmiando a DEC tra 25 e 40 milioni di dollari l’anno (stime ufficiali). Negli anni 1985-87 DEC investiva pesantemente in AI: oltre 50 knowledge engineer dedicati a XCON e a sistemi correlati, una “AI Technology Center” interna ad Hudson MA, partnership con Symbolics per workstation, contratti di consulenza con IntelliCorp e Teknowledge, un programma interno di formazione per knowledge engineering.

Tra il 1989 e il 1991 due fattori si combinano per ridurre l’investimento. Primo: la manutenzione di XCON diventa proibitiva. La KB ha superato 17.000 regole. Ogni nuova famiglia di prodotti VAX (DEC ne introduceva diverse all’anno) richiede mesi di knowledge engineering per essere integrata. Il team di 50 persone produce sempre meno valore marginale rispetto al suo costo. Secondo: il mercato dei minicomputer VAX si sta restringendo. I PC Intel-based con DOS e poi Windows mangiano la fascia bassa. Le workstation Sun Unix mangiano la fascia tecnica. DEC inizia un downsizing generale che colpisce duramente l’AI Technology Center: cancellati progetti speculativi, ridotti contratti esterni, riassorbiti knowledge engineer in altre aree IT.

Tra il 1991 e il 1995 XCON viene gradualmente smantellato. Le sue funzioni vengono riassorbite in sistemi più generici di product configuration, scritti in linguaggi mainstream invece che in OPS5. I knowledge engineer di DEC che non vengono licenziati si riconvertono in software engineer su altre tecnologie. La narrativa interna evita di dichiarare apertamente “abbiamo deciso che l’AI non funziona”: parla di “modernizzazione delle piattaforme”, “consolidamento dei sistemi configurazione”. Il decommissionamento è silenzioso.

DEC stessa entra in declino strutturale per ragioni indipendenti dall’AI. Viene acquisita da Compaq nel 1998, e poi da HP nel 2002. Quando HP eredità gli asset DEC, l’AI Technology Center è già chiuso da anni e XCON non esiste più come sistema attivo.

La lezione è istruttiva: anche il caso commerciale di maggior successo del paradigma rule-based non è sopravvissuto al cambio del contesto industriale. Il problema non era “XCON funziona o no” — funzionava bene fino alla fine — ma “il TCO di XCON è giustificabile in un’azienda in declino?”. La risposta nel 1992 era no.

Esempio 2 — Una conferenza AAAI 1985 vs 1992

AAAI (Association for the Advancement of Artificial Intelligence, in origine American Association for Artificial Intelligence) è la principale conferenza accademica AI degli USA. Confrontare due edizioni a sette anni di distanza mostra l’inverno con dati concreti.

AAAI 1985 a Philadelphia. Circa 6.000 attendees, picco assoluto nella storia della conferenza. Expo industriale con oltre 100 espositori commerciali: Symbolics e Lisp Machines occupavano padiglioni grossi con dimostrazioni delle workstation; IntelliCorp dimostrava KEE su Symbolics 3600; Inference Corp dimostrava ART; Xerox aveva una postazione sulla 1108; TI Explorer; vendor di hardware ausiliario; case editrici che vendevano libri sulla AI a tirature alte; agenzie di recruitment per knowledge engineer (con stipendi annunciati intorno a 70-90K USD, alti per l’epoca). Tono dei keynote: trionfalistico. Edward Feigenbaum apre con considerazioni sulla “knowledge revolution”. I panel discutono come scalare l’industria: standardizzazione delle KB, certificazione dei knowledge engineer, integrazione enterprise. La parola “winter” non viene mai pronunciata.

AAAI 1992 a San Jose. Circa 2.500 attendees, meno della meta del picco. Expo ridotto: la maggior parte degli espositori commerciali ha cambiato business o è fallita. Qualche shell vendor sopravvive in nicchia (Inference, IntelliCorp ridimensionate). Spazio significativo per editori accademici (Morgan Kaufmann, MIT Press) e per software open-source (CLIPS della NASA, Soar della University of Michigan).

Tono dei keynote: difensivo. James Hendler e altri parlano apertamente di “AI Winter” come categoria storica. I panel discutono “Re-engaging with industry” e “Beyond the rule-based paradigm”. Workshop dedicati a neural networks, machine learning, qualitative reasoning, planning under uncertainty (i precursori delle Bayesian networks applicate). È la conferenza in cui la comunità interiorizza la fine dell’era e inizia a parlare con altri vocabolari.

Tra il 1985 e il 1992 le presenze si dimezzano e la composizione cambia: meno industria, più accademia, più venue per nuove direzioni. È il pattern visibile in dati di tutte le grandi conferenze AI dell’epoca.

È utile aggiungere il contrasto con NIPS nello stesso periodo. NIPS 1987 a Denver: prima edizione, circa 600 attendees, mostra di reti neurali e modelli neurali biologici. NIPS 1992: circa 1.000 attendees, paper su backpropagation, reinforcement learning, statistical learning theory. NIPS 2000: ~1.500 attendees. NIPS 2010: ~1.800 attendees. NIPS 2017: oltre 8.000 attendees, supera AAAI. NeurIPS 2022: oltre 13.000 attendees. La curva è un esponenziale lento per vent’anni, poi un’esplosione con il deep learning.

Esempio 3 — Una vacatura accademica tipica nel rebranding

Per cogliere il rebranding al livello micro, immaginiamo una vacatura accademica tipica del 1995. Un dipartimento di informatica di una buona università ha un posto da assistant professor e vuole assumere qualcuno che lavori su quello che venti anni dopo chiameremmo “intelligenza artificiale”. Come scrive l’annuncio?

Versione 1985 (pre-inverno): “The Department of Computer Science seeks a tenure-track Assistant Professor in Artificial Intelligence. Areas of interest include knowledge representation, expert systems, planning, natural language understanding, qualitative reasoning. Applicants should have experience with Lisp or Prolog and with rule-based or frame-based systems.”

Versione 1995 (in inverno): “The Department of Computer Science seeks a tenure-track Assistant Professor in Statistical Learning, Pattern Recognition, or Intelligent Systems. Areas of interest include machine learning, neural networks, computer vision, speech processing, knowledge discovery in databases, decision support. Applicants should have strong mathematical background and experience with empirical methodology.”

Il candidato che oggi chiameremmo “AI researcher” del 1995 si identifica come “machine learning researcher”, “computer vision researcher”, “speech processing researcher”, “data mining researcher”. Mette nel CV i paper a NIPS, ICML, CVPR, KDD invece che a AAAI o IJCAI. Cita Vapnik e Hinton invece che Feigenbaum e Minsky. Fa fund-raising su grant per “intelligent systems” o “computational intelligence” invece che per “AI”.

La sostanza tecnica è continua — molti di questi ricercatori avevano fatto PhD su sistemi esperti e poi avevano cambiato campo — ma l’identità pubblica è diversa. La lezione di sopravvivenza è che la sostanza conta più del nome: chi lavorava bene su problemi reali ha continuato a fare carriera, anche se ha dovuto cambiare bandiera tre volte in dieci anni.

Applicazioni pratiche

Le lezioni del secondo inverno sono usabili oggi nel design di prodotti AI e nella valutazione di iniziative aziendali. Le elenchiamo come pattern riconoscibili.

Pattern hype-bust riconoscibile. Ogni nuovo boom AI riproduce alcuni segnali del boom dei sistemi esperti del 1983-86. Magazine cover stories sulla rivoluzione imminente. CEO Fortune 500 che lanciano “AI initiatives” senza caso d’uso definito. Consulenti che vendono integrazioni a clienti che non sanno usarle. Stipendi inflazionati per role specifici (knowledge engineer allora, prompt engineer e ML engineer oggi). Conferenze che esplodono in attendance e prezzi. Quando vedi questi segnali tutti insieme, sei probabilmente nella fase ascendente del ciclo, e il punto di inflessione è più vicino di quanto sembra. Non significa che il boom sia “tutto fuffa”: significa che parte del valore atteso non si realizzerà, e che ci sarà una fase di disillusione e ridimensionamento. Il pattern si è visto in Web3 e crypto (boom 2020-2021, bust 2022), nel metaverso (boom 2021-2022, bust 2022-2023), e va monitorato per il boom LLM enterprise corrente (2023-2026).

Importanza di benchmark realistici e ROI concreti. Il problema dei sistemi esperti enterprise non era che non funzionassero in lab: era che il valore reale in produzione era inferiore al TCO. La distanza tra benchmark e produzione era sottostimata. Per chi oggi valuta un progetto LLM in azienda, la lezione è: non basarsi su demo o su benchmark accademici (MMLU, HumanEval, ecc.), ma costruire eval dedicati al caso d’uso specifico, misurati in produzione su dati reali, con metriche di ROI in unita aziendali (dollari risparmiati, ore di personale liberate, errori ridotti). Una eval homegrown calibrata sul tuo workflow vale più di mille benchmark generici.

I sistemi che sopravvivono agli inverni. Guardando ai sistemi che sono sopravvissuti al secondo inverno e sono ancora produttivi oggi, il pattern è chiaro: producono valore misurabile in domini specifici e ristretti, non promettono trasformazione totale. CLIPS della NASA (rule-based reasoning embedded in spacecraft control). Drools come business rules engine in finanza e assicurazioni. Speech recognition (Dragon, poi Apple/Google/Amazon) per dictation e voice assistants. CAD configurators per industria manifatturiera (eredi di XCON). Decision support medico (UpToDate, Isabel) come consulto consultativo per medici reali. Tutti dominio chiuso, ROI misurabile, integrazione profonda nei workflow esistenti. La controversia “general AI vs specialized agents” che vediamo oggi nel mondo LLM ha precedenti: i sistemi specialized hanno una storia di sopravvivenza molto migliore.

Lezione di rebranding. La sostanza tecnica conta più del nome. Chi lavorava bene su problemi reali nel 1990 ha continuato a fare carriera anche cambiando bandiera (da “AI researcher” a “machine learning researcher” a “data scientist”). Per chi oggi sceglie un campo di specializzazione, la lezione è di scegliere tecniche con applicabilita ampia (statistica, ottimizzazione, sistemi distribuiti, visualizzazione, data engineering) piuttosto che tecnologie singolari (un framework specifico, un tool specifico, una buzzword specifica). Le tecnologie passano, le competenze fondamentali restano.

Lezione di research vs business. L’AI sopravvive nei lab e nei dataset accumulati anche quando il mercato muore. Bell Labs di LeCun, Toronto di Hinton, UCLA di Pearl, MIT di Brooks: tutti laboratori che hanno mantenuto budget piccoli ma costanti durante l’inverno e che hanno prodotto le tecniche del rilancio. Per chi oggi gestisce R&D AI in un’azienda, la lezione è: mantenere un baseline di investimento nella ricerca anche quando il business va male, perché le idee che funzioneranno tra dieci anni stanno maturando ora. Tagliare R&D al primo segnale di ridimensionamento è la mossa che lascia un’azienda fuori dal prossimo ciclo.

Pattern del cliente bruciato. Il ciclo classico del cliente enterprise nei sistemi esperti — pilot di sei mesi che funziona, deployment di un anno che scala male, secondo anno con costi di manutenzione fuori controllo, terzo anno di decommissionamento silenzioso — è un pattern che si riproduce oggi nei progetti LLM enterprise. Per il fornitore (consulenza, prodotto SaaS), la lezione è progettare il pilot pensando già alla scala: includere nelle metriche del pilot il TCO proiettato a tre anni, non solo le metriche di funzionalita iniziale. Per il cliente, la lezione è chiedere al fornitore proiezioni di scale e maintenance, e validare con clienti già in produzione da 2+ anni, non solo con case study di pilot.

Dove si rompe

Le interpretazioni semplicistiche del secondo inverno sono comuni e fuorvianti. Le elenchiamo per smontarle.

“Tutto era hype, niente valore reale.” Falso. I sistemi esperti hanno generato miliardi di valore reale prima del crollo.

XCON da solo ha risparmiato a DEC stime cumulative intorno ai 250 milioni di dollari nei suoi anni di vita. PROSPECTOR ha contribuito alla scoperta di un giacimento di molibdeno da 100 milioni a Mount Tolman. CLIPS della NASA è deployato in sistemi reali da decenni. Banking rule engines (poi Drools) processano miliardi di transazioni.

Il valore prodotto è stato reale. Il problema è che il valore reale era inferiore al valore promesso, non che fosse zero. Distinguere “promessa eccessiva” da “valore zero” è importante per non liquidare un’epoca con uno slogan.

“L’AI mori nei 90s.” Falso. La ricerca continuo con vigore, ma sotto altri nomi: machine learning, data mining, statistical learning, computational intelligence, pattern recognition, decision support.

I dataset si accumulavano (UCI Machine Learning Repository fondato nel 1987 e ancora attivo, MNIST 1998, vari corpora linguistici). Le conferenze NIPS, ICML, KDD crescevano. I prodotti commerciali maturavano in nicchia (speech recognition, OCR, fraud detection, recommendation systems).

Quando si dice “l’AI è morta nei 90s” si commette l’errore di confondere “il marchio AI” con “il campo tecnico AI”. Il marchio era radioattivo; il campo era vivo.

“Internet ha salvato l’AI.” Parziale. Internet ha contribuito fornendo dati abbondanti (web scraping, log di transazioni, e-commerce, social media), che sono stati condizione necessaria per il training di modelli ML moderni.

Ma il rilancio richiese anche altre componenti, ognuna indipendente: GPU programmabili (NVIDIA fondata 1993, CUDA 2007), algoritmi nuovi (ReLU, dropout, batch norm, residual connections, attention), benchmark standard (ImageNet 2009), risorse cloud (AWS 2006). Attribuire il rilancio solo a internet sottostima la pluralità di fattori che hanno reso possibile il deep learning del 2012 e i transformer del 2017.

“Il Fifth Generation fallisce per la scelta sbagliata di Prolog.” Semplicistico. Il problema era più profondo: l’idea di “knowledge-based reasoning come strada all’AGI” non scalava in nessun linguaggio. Lisp avrebbe avuto gli stessi problemi. C++ avrebbe avuto gli stessi problemi.

La scelta del linguaggio è un dettaglio implementativo; la scelta del paradigma (“rappresentazione esplicita di conoscenza come fondamento dell’intelligenza”) è la decisione strategica che si è rivelata sbagliata. Il fallimento del FGCS è parallelo al fallimento del progetto Cyc di Lenat: entrambi puntano sul paradigma “knowledge as base of intelligence” e entrambi falliscono nel produrre AGI utile, indipendentemente dal linguaggio scelto.

“Symbolics è fallita nel 1987.” Impreciso. Symbolics ha fatto layoff massicci dal 1987, ha lasciato il mercato hardware nuovo tra 1988 e 1990, ha file Chapter 11 nel 1993, esiste ancora oggi come entita software.

La cronologia esatta è importante perché illustra che il collasso di un’industria non è un evento puntuale ma un processo che dura anni. Le aziende non muoiono quando si dice popolarmente che muoiono: muoiono in lenta agonia, con ristrutturazioni, riconversioni, vendite di asset, sopravvivenza in nicchia.

“Il secondo inverno è stato peggiore del primo.” Dipende dalla metrica. Economicamente si: il primo inverno (1973-1980) coinvolgeva grant pubblici relativamente piccoli, mentre il secondo coinvolgeva un’industria multimiliardaria con migliaia di posti di lavoro persi. Accademicamente no: durante il secondo inverno la ricerca era più robusta e distribuita di quanto fosse stata negli anni 60-70, con più lab attivi, più paper pubblicati anche durante il declino, e una transizione più fluida verso paradigmi successivi. Il primo inverno aveva azzerato comunità; il secondo le aveva solo ribrandate.

“L’AI è tornata a essere prestigiosa solo con ChatGPT.” Impreciso. La transizione del termine “AI” da radioattivo a prestigioso è stata graduale. Inizia intorno al 2006-2010 con i primi successi deep learning. Si consolida con AlexNet (2012), DeepMind acquisita da Google (2014), Tesla Autopilot (2014), Watson ribrandato (2014). Continua con AlphaGo (2016), GPT-2 (2019), GPT-3 (2020). ChatGPT (novembre 2022) è il momento del riconoscimento di massa, ma il prestige del termine era già tornato negli ambienti tecnici da quasi un decennio.

“Gli investimenti DARPA in AI sono scesi durante l’inverno.” Impreciso. DARPA ha ridimensionato Strategic Computing nel 1989-1993, ma ha continuato a finanziare AI sotto altri nomi: HPCC negli anni 90 ha finanziato infrastruttura di computing che si è rivelata utile per ML; Genoa per intelligence analysis; PAL/CALO nei primi 2000 per personal assistants (da cui Siri). Gli investimenti governativi USA in AI sono stati più costanti di quanto la narrativa “inverno” suggerisca.

Una nota sul confronto con il presente. Quando si applica il pattern del secondo inverno al boom LLM corrente, va riconosciuto che ci sono differenze strutturali importanti.

Gli LLM apprendono dai dati, i sistemi esperti no: la fragilita verso il dominio è minore. I costi unitari di deployment (per chiamata API) sono in calo costante invece che in crescita, l’opposto della maintenance explosion dei sistemi esperti. La base utenti è di ordini di grandezza superiore (centinaia di milioni di utenti ChatGPT vs migliaia di seat di sistemi esperti).

Il pattern hype-bust può replicarsi a livello di “AI initiatives” enterprise specifiche, ma è improbabile che si ripeta nello stesso modo a livello di intera industria. La lezione del secondo inverno non è “ci sarà un AI winter LLM identico”, ma “ci saranno cicli di disillusione localizzati su use case specifici, e la differenza tra chi sopravvive e chi non sopravvive sarà la qualità del fit tra tecnologia e problema”.

Collegamenti

sistemi-esperti — l’industria che collassa nel secondo inverno. Capire il pattern di crescita dei sistemi esperti tra 1980 e 1986 è prerequisito per capire il crollo successivo. La maintenance explosion di XCON è il caso paradigmatico.
primo-inverno-ai — pattern hype-disillusione-collasso, prima edizione (1973-1980). Il secondo inverno replica il template a scala industriale. Confrontare i due inverni mostra cosa cambia (scala, attori) e cosa si ripete (dinamica sociologica).
ai-simbolica-anni-60 — radici intellettuali dei sistemi esperti. Il paradigma “rappresentazione esplicita di conoscenza” che fallisce nel secondo inverno nasce qui con Newell, Simon, McCarthy, Minsky.
dartmouth-1956 — Feigenbaum, McCarthy, Minsky e altri protagonisti del paradigma simbolico vengono dalla generazione Dartmouth. La traiettoria personale del crollo va indietro fino a li.
storia-sintesi — il teaser narrativo della storia AI in dieci minuti, di cui questo capitolo è il dettaglio per il decennio 1987-1993.
rinascita-statistica-90 (Parte I, futuro) — cosa emerge come paradigma sostitutivo durante e dopo l’inverno: HMM in speech, statistical ML, Bayesian networks come continuazione di Pearl 1988.
reti-neurali-80-90 (Parte I, futuro) — la sopravvivenza connessionista durante l’inverno: backprop di Rumelhart-Hinton-Williams 1986, CNN di LeCun, RNN di Elman, LSTM di Hochreiter-Schmidhuber.
svm-era-2000 (Parte I, futuro) — l’emergenza degli SVM come tecnica dominante negli anni 2000, conseguenza diretta della maturazione di Vapnik durante l’inverno.
imagenet-alexnet-2012 (Parte I, futuro) — il momento della “fine ufficiale” del clima invernale e dell’inizio del rilancio deep learning.
[mlp-backprop] (Parte VIII, futuro) — il backpropagation che sopravvive in lab durante l’inverno e poi torna centrale con AlexNet.
[svm] (Parte VIII, futuro) — la teoria SVM che si sviluppa proprio negli anni inverno (Cortes-Vapnik 1995).
[bayesian-networks] (Parte VII, futuro) — il paradigma probabilistico di Pearl (1988) che matura come alternativa principled ai certainty factors di MYCIN.

Per andare oltre

Crevier, Daniel. “AI: The Tumultuous History of the Search for Artificial Intelligence”. Basic Books, 1993. Storia narrativa scritta a caldo subito dopo il crollo, con interviste a protagonisti. Capitoli 9-11 coprono Symbolics, Fifth Generation, e il collasso. Lettura obbligatoria per chi vuole catturare il tono dell’epoca.
Russell, Stuart & Norvig, Peter. “Artificial Intelligence: A Modern Approach”, 4a ed. Pearson, 2020. Sezione storica del capitolo 1 e capitoli sui paradigmi sostitutivi (knowledge representation, probabilistic reasoning, machine learning) coprono autorevolmente l’era. Riferimento standard moderno.
Nilsson, Nils J. “The Quest for Artificial Intelligence: A History of Ideas and Achievements”. Cambridge University Press, 2009. Storia ampia con prospettiva di un protagonista (Nilsson era a SRI International). Capitoli 25-26 sull’inverno. Disponibile gratuitamente come PDF dall’autore.
Hendler, James. “Avoiding Another AI Winter”. IEEE Intelligent Systems, vol. 23, n. 2, marzo-aprile 2008, pp. 2-4. Editoriale retrospettivo con lezioni concrete per evitare cicli futuri. Breve, denso, prezioso.
Pearl, Judea. “Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference”. Morgan Kaufmann, 1988. Fonte primaria del paradigma sostitutivo bayesiano. Pubblicato nel pieno della transizione, è il libro che cambia direzione al ragionamento sotto incertezza.
Brooks, Rodney A. “Cambrian Intelligence: The Early History of the New AI”. MIT Press, 1999. Raccolta dei paper di Brooks inclusi “Elephants Don’t Play Chess” (1990) e “Intelligence without representation” (1991). Critica radicale al paradigma simbolico dall’interno della comunità robotica.
Pollack, Andrew. “‘Fifth Generation’ Became Japan’s Lost Generation”. The New York Times, 5 giugno 1992. Articolo giornalistico breve ma canonico, fissa il giudizio storico sul fallimento del FGCS. Disponibile nell’archivio NYT.