Salta ai contenuti

Cosa verrà: speculazioni informate su direzioni future

Questo capitolo è dichiaratamente speculativo. Niente qui sono predizioni: sono trend visibili a inizio 2026, estrapolati con onestà sull’incertezza, e con il pattern hype-bust della storia dell’AI come guardia contro l’oracolarità.

Nel 1957 John McCarthy (informatico americano, 1927-2011, padre del termine “intelligenza artificiale”, già decoder cap dartmouth-1956) dichiara che entro dieci anni una macchina sarà campione del mondo di scacchi. Realtà: quarant’anni, Deep Blue contro Kasparov nel 1997 (cfr. cap deep-blue-1997). Nel 1965 Herbert Simon (economista e informatico americano, 1916-2001, premio Nobel per l’Economia 1978, già decoder cap ai-simbolica-anni-60) dichiara che entro vent’anni una macchina sarà capace di fare qualunque lavoro un uomo possa fare. Realtà: sessant’anni dopo, ancora aperta. Nel 2016 Demis Hassabis (CEO Google DeepMind, già decoder cap alphago-2016) dichiara, post-AlphaGo, che AGI è “questione di una decade”. Realtà: ad aprile 2026 ancora aperta.

Il pattern non è incidentale. È il pattern. Le predizioni AI specifiche sono quasi sempre sbagliate sui tempi, anche quando puntano nella direzione qualitativamente giusta. Questo capitolo, l’ultimo della Parte I, è il tentativo onesto di guardare al futuro dell’AI senza pretendere di averlo visto. Non predizioni: estrapolazioni di trend visibili, con marcatura epistemica esplicita, e con l’ammissione frequente di cosa non sappiamo.

C’è una ragione per cui questo capitolo chiude la Parte I e non apre la Parte II. La Parte I ha raccontato settant’anni di entusiasmi, fallimenti, svolte e inverni. Ha mostrato due bolle che sono scoppiate (cap primo-inverno-ai, cap secondo-inverno-ai) e una stagione di crescita continua dal 2012 in avanti che non ha ancora visto un suo inverno definitivo. Quando si guarda avanti, è la conoscenza di quei pattern — non l’ottimismo del momento, non il pessimismo dei critici — che permette di calibrare lo sguardo. Il presente capitolo eredità quella disciplina e la applica al futuro prossimo.

Il punto di osservazione è aprile 2026. Il capitolo precedente, mondo-post-2026, ha fotografato lo stato dell’arte: i frontier model, i paradigmi consolidati, i benchmark, il mercato, la regolamentazione, l’hardware. Quel capitolo è il presente; questo capitolo è ciò che potrebbe succedere a partire dal presente.

[DATATO 2026-04] Tutte le valutazioni di “stato presente” usate in questo capitolo come base per estrapolare provengono dallo snapshot ad aprile 2026 e sono soggette al medesimo invecchiamento. Quando si parla di “frontier Google nella fascia 1M-2M di context” o “SWE-bench Verified al settantatré per cento” si intende lo stato a quella data.

La letteratura di riferimento è frammentata. Da un lato, i tecnologi futuristi: Ray Kurzweil (inventore e futurista americano, 1948-, già Director of Engineering a Google 2012-2021), che in “The Singularity is Near” (Viking 2005) prevede AGI entro 2029 e singularity entro 2045. Nick Bostrom (filosofo svedese, 1973-, fondatore del Future of Humanity Institute Oxford, chiuso nel 2024), che in “Superintelligence” (Oxford UP 2014) costruisce un frame analitico per scenari di AI super-umana. Dall’altro lato, i critici: Gary Marcus (psicologo cognitivo americano, 1970-, NYU professor), che in “Deep Learning Is Hitting a Wall” (Nautilus, marzo 2022) sostiene che lo scaling non porta ad AGI senza salto qualitativo. Eliezer Yudkowsky (ricercatore americano, 1979-, fondatore Machine Intelligence Research Institute), che in “AGI Ruin: A List of Lethalities” (LessWrong, giugno 2022) elenca 43 ragioni per cui l’allineamento di sistemi super-umani sarebbe quasi impossibile. In mezzo, i CEO frontier che pubblicano visioni: Dario Amodei (CEO Anthropic, già decoder cap era-agenti-2024) con “Machines of Loving Grace” (anthropic.com, 11 ottobre 2024), che immagina una “powerful AI” entro 2026-2030 con beneficio enorme su biologia, neuroscienze, sviluppo economico. Paul Christiano (ricercatore americano, ex OpenAI safety, fondatore Alignment Research Center 2021) con “What failure looks like” (LessWrong, marzo 2019), che descrive scenari di slow-takeoff failure.

Nessuno di questi autori ha track record predittivo verificato su orizzonte 5-10 anni. Nessuno. Il capitolo non li adotta come oracoli; li usa come decoder rigoroso per le linee di pensiero che dominano il dibattito a inizio 2026.

Per orientare la lettura del capitolo conviene tenere insieme due angoli. Il primo è epistemico: distinguere classi di previsione e marcarle esplicitamente. Il secondo è storico: riconoscere che il pattern hype-bust è ricorrente, e che la calibratura dei propri claim sul futuro deve fare i conti con quel pattern.

Mescolare classi di previsione senza marcarle è l’errore tipico delle “AI predictions” giornalistiche. Una stessa frase può scivolare da un trend osservabile a un wild scenario in tre proposizioni, senza che il lettore se ne accorga. La disciplina minimale è marcare ogni claim significativo con il suo grado di confidenza.

Il capitolo adotta tre marcatori inline, da intendere come scelte epistemiche, non come decorazione retorica.

[ESTRAPOLAZIONE] — orizzonte uno-due anni, alta confidenza. Trend già in corso che continueranno almeno nel breve termine. Esempio: “quasi tutti i frontier LLM avranno modalità thinking di default entro fine 2026”. Per fare questo claim basta osservare che a inizio 2026 la maggior parte dei laboratori frontier ha già una modalità thinking o un equivalente deliberativo esplicito, che i restanti stanno convergendo nella stessa direzione, e che il pricing differenziato è consolidato. È estrapolazione di pochi mesi su una traiettoria visibile.

[SCENARIO] — orizzonte due-cinque anni, media confidenza. Cose plausibili che potrebbero succedere, basate su segnali deboli. Esempio: “robotic foundation models integrati con LLM frontier raggiungeranno deploy commerciale ristretto in warehouse e manufacturing entro 2028-2030”. Qui ci sono segnali (Tesla Optimus in scaling, Figure deploy in BMW pilot, 1X NEO in pilot famiglia, Physical Intelligence pi-zero), ma la traiettoria è soggetta a bottleneck reali (sim-to-real gap, dexterity hardware, safety), e la timeline può slittare di anni.

[SPECULATION] — orizzonte cinque o più anni, bassa confidenza. Scenari di rottura, dichiarati come tali. Esempio: “almeno un laboratorio frontier annuncia claim AGI-level credibili, validati o contestati, entro 2032”. Qui non c’è estrapolazione: c’è ragionamento su cosa è plausibile dati i trend, sapendo che la traiettoria può deviare drasticamente.

Angolo storico: pattern hype-bust e track record degli esperti

Sezione intitolata “Angolo storico: pattern hype-bust e track record degli esperti”

Il secondo angolo richiede di guardare la curva. La storia dell’AI raccontata nei trentaquattro capitoli precedenti mostra due inverni espliciti. Primo inverno, 1974-1980: pubblicazione di “Perceptrons” (Minsky e Papert 1969), Lighthill report (1973), tagli ai finanziamenti DARPA e governo UK (cfr. cap primo-inverno-ai). Secondo inverno, 1987-1993: collasso del mercato delle Lisp machines, fallimento di molti expert system, ridimensionamento dei finanziamenti DARPA Strategic Computing Initiative (cfr. cap secondo-inverno-ai). Entrambi gli inverni erano stati preceduti da predizioni eccessivamente ottimiste — Simon 1965 prima del primo, “expert systems sostituiranno i professionisti entro un decennio” prima del secondo.

Il pattern non è “ogni hype porta a un bust simmetrico”; è “ogni hype che eccede il valore misurabile crea le condizioni per un bust”. Le tecnologie sopravvissute agli inverni sono quelle con valore misurabile in domini specifici: backpropagation è sopravvissuta al primo inverno perché applicabile, anche se solo per task piccoli; expert system architecture è sopravvissuta al secondo inverno nei verticals dove il knowledge engineering pagava (medicina, configurazione hardware, diagnostica industriale, cfr. cap sistemi-esperti). Le tecnologie che promettevano trasformazione totale e non avevano valore misurabile sono evaporate.

Marcatura di classe: questa è una constatazione storiografica, non una filiazione. Non sto dicendo che la generative AI di oggi è “lo stesso” degli expert system degli anni Ottanta. Sto dicendo che il pattern di valutazione (cosa sopravvive, cosa evapora) è ricorrente e merita di essere preso sul serio quando si guarda al futuro.

Il track record degli esperti è altrettanto importante. AI Impacts (Katja Grace, ricercatrice indipendente, autrice di survey ricorrenti) ha pubblicato dal 2016 in avanti survey di centinaia di AI researchers su timeline di “high-level machine intelligence”. L’edizione 2022 ha trovato median 50% di probabilità di HLMI entro il 2059, ma con varianza enorme: il quartile inferiore mette HLMI entro il 2031, il quartile superiore lo spinge oltre il 2100. L’aggregato Metaculus, comunità di forecasting collaborativo, oscilla nella stessa range con riallineamenti significativi a ogni release frontier. L’unico fatto solido sui forecast AI a 10+ anni è che gli esperti non concordano e che la storia dei survey precedenti li ha smentiti spesso.

Sezione articolata in sette sotto-sezioni. Ognuna usa i marker [ESTRAPOLAZIONE], [SCENARIO], [SPECULATION] esplicitamente per ogni claim significativo. Le sotto-sezioni vanno dal più solido (estrapolazioni) al più speculativo (wild speculations), per accompagnare il lettore lungo una graduale assunzione di incertezza.

[DATATO 2026-04] La sezione che segue parte dallo snapshot del cap mondo-post-2026 e proietta. Ogni “trend visibile” lo è ad aprile 2026.

Trend visibili a inizio 2026 che proseguiranno con alta probabilità entro orizzonte di un-due anni.

Reasoning models pervasivi. [ESTRAPOLAZIONE] A inizio 2026 la maggior parte dei frontier ha già modalità thinking o un equivalente deliberativo esplicito (cfr. cap ragionamento-2024-2026). Pricing differenziato fast vs thinking è consolidato. La modalità thinking diventa default per tier alto, eventualmente integrata e non più come tier separato (come già rumored per GPT-5). Il “thinking budget” diventa parametro tunable in API, esplicitamente dichiarabile per query (Anthropic ha già “extended thinking” parametrico in Claude 3.7). Implicazione: pricing potrebbe semplificarsi ma cost per query in salita per use case high-stakes; use case ad alto volume e bassa stakes resta su tier fast.

Multimodalità native maturata. [ESTRAPOLAZIONE] Testo + immagine + audio + video integrati nello stesso vocabolario sono già standard frontier ad aprile 2026 (GPT-4o, Gemini 2.0). Video generation Veo/Sora-tier diventa accessibile a basso costo entro 2027. Image generation entra nel default API senza endpoint separato (già OpenAI gpt-image-1 in produzione). Real-time voice agents diventano commodity, non differenziatore. L’interfaccia multimodale (camera + microfono + schermo) sostituisce il prompt testuale per molti use case consumer; per developer l’API multimodale è default.

Agentic standardization su MCP. [ESTRAPOLAZIONE] MCP è stato rilasciato da Anthropic in novembre 2024 e durante il 2025 è stato adottato in modo crescente da OpenAI, Google e dall’ecosistema tool (cfr. cap era-agenti-2024). MCP diventa lo strato standardizzato che permette interoperabilità cross-vendor, in modo analogo a HTTP per il web. Multi-agent orchestration come pattern di base, non come architettura esotica. Agent registry pubblici crescono (Anthropic ha già pubblicato un registry, GitHub ecosystem in espansione). Tool authors pubblicano server MCP come oggi pubblicano librerie npm o PyPI.

Long context oltre dieci milioni di token. [ESTRAPOLAZIONE] Google ha già portato il long context frontier nella fascia 1M-2M a inizio 2026, a seconda della variante di modello. Dieci milioni o più entro 2027-2028 plausibile, con tecniche di RoPE scaling avanzato, sparse attention production-grade, KV cache compression aggressiva, ring attention production-deploy. Caveat importante: “context lungo” e “comprensione effettiva del context lungo” non scalano insieme. La saturazione perceptuale sui benchmark più facili (Needle in a Haystack) è già visibile, ma RULER e LongBench mostrano che la capacità reasoning effettiva su context molto lungo resta bottleneck. Implicazione: RAG come pattern non scompare, ma per molti use case diventa “preprocessing per context window” non “retrieval per knowledge base esterna”.

Test-time compute come parametro tunable. [ESTRAPOLAZIONE] Già parzialmente: o-series ha tier o3-mini/o3, Anthropic ha thinking budget configurabile. Il “thinking depth” diventa slider esplicito in tooling consumer (Cursor permette già di scegliere reasoning effort), API gestisce automaticamente il trade-off accuracy/latency/cost in base alla difficulty della query.

Open weights chiudono il gap su benchmark mainstream. [ESTRAPOLAZIONE] DeepSeek-V3 / R1 hanno mostrato che efficiency democratizza pretraining grande (cfr. cap open-weights-2023-2024). Il gap closed-vs-open su MMLU, HumanEval, AIME, SWE-bench si chiude entro 2027-2028. Closed mantiene leadership su edge: multimodalità estrema, computer use, long context, reasoning più complesso. Open domina in privacy-sensitive, on-prem, edge, customizzazione.

Specialized vertical AI matura. [ESTRAPOLAZIONE] Legal (Harvey AI, Hebbia, EvenUp), medical (Hippocratic AI, OpenEvidence, Glass Health), customer support (Sierra, Decagon), recruiting (Mercor) sono già deployati a inizio 2026. Ogni vertical professionale matura significativamente entro 2027-2028. “Co-pilot per X” come categoria di prodotto consolidata, non più novità. Forma più frequente: SaaS verticale + LLM frontier + RAG + tooling specifico + workflow integrato.

AI software engineering oltre il settantacinque per cento SWE-bench. [ESTRAPOLAZIONE] SWE-bench Verified era al settantatré per cento con Claude 3.7 in febbraio 2025 (cfr. cap mondo-post-2026); oltre l’ottanta per cento è plausibile entro fine 2026. “AI engineer” come ruolo aziendale standard, distinto da “ML engineer” tradizionale. La categoria “junior developer” probabilmente assorbe parte significativa del lavoro AI assistito; senior developer si focalizza su architecture, design, code review AI-augmented, debugging complesso. Caveat: il jump SWE-bench non implica che AI possa scrivere applicazioni intere autonomamente. Implica che bug fix, feature implementation isolata, refactor mirato sono robustamente automatizzabili.

Compute investment continuato nell’ordine delle centinaia di miliardi annui. [ESTRAPOLAZIONE] Stargate dichiara cinquecento miliardi su quattro anni (gennaio 2025), Microsoft ottanta miliardi di capex AI per il 2025, Meta Hyperion datacenter Louisiana. Un ordine di grandezza da alte decine a centinaia di miliardi annui in data center AI appare plausibile almeno nel triennio 2026-2028. Constraint reali: energy (grid, baseload, renewable scaling), cooling water, permitting locale, possibile backlash su sostenibilità.

Regolamentazione applicata, non solo emanata. [ESTRAPOLAZIONE] EU AI Act GPAI obligations entrano in vigore in agosto 2025; enforcement vero (multe, sanzioni) si materializza nel 2026-2027. US federale resta deregolamentato sotto Trump, ma stati come California e New York introducono regolamentazioni proprie. Brazil, Canada, Korea convergono verso framework simili a EU AI Act. Compliance officer AI come ruolo aziendale standard.

Cose che potrebbero succedere, segnali deboli ma concreti, orizzonte due-cinque anni.

Robotic foundation models breakthrough. [SCENARIO] Tesla Optimus, Figure 02, 1X NEO, Boston Dynamics Atlas Electric, Physical Intelligence pi-zero in scaling ad aprile 2026. Demo deploy già visibili (Figure in BMW, 1X in pilot famiglia). Integrazione tra LLM frontier e embodied control raggiunge maturità per deploy commerciale ristretto (warehouse, manufacturing repetitivo, alcuni servizi domestici) entro 2028-2030. NON: robot domestici universali. NON: AGI embodied. Bottleneck reali: dati di training fisici (no internet-equivalent per movement), sim-to-real gap, energy density e dexterity hardware, safety in human-robot proximity.

Continual learning operativo. [SCENARIO] Ad aprile 2026 i modelli sono congelati al training cutoff. Continual learning controllato (aggiornamento weights post-deployment, segregato per dominio o tenant) raggiunge deploy enterprise entro 2028-2029. Test-time training come direzione attiva di ricerca 2024-2025. Possibile breakthrough, possibile no — la difficoltà tecnica è significativa: catastrophic forgetting, alignment drift, data poisoning ampliato.

AI-driven scientific discovery oltre AlphaFold-class. [SCENARIO] AlphaFold (DeepMind 2018, 2020, v3 nel 2024) è precedente. AlphaFold-class breakthrough in altre discipline diventa plausibile in chemistry beyond protein, materials science (con GNoME estensioni), fusion plasma control (già esplorato DeepMind 2022), drug discovery genomic, climate modeling, mathematics formal proof (DeepMind AlphaProof come segnale early). Caveat: “scientific discovery” è parola inflazionata. Discovery ha significato preciso (insight nuovo, validato, replicato, accettato dalla comunità). Strumenti AI accelerano, non sostituiscono il processo scientifico.

Genuinely novel architectures oltre Transformer. [SCENARIO] Transformer entrenchment è forte ad aprile 2026. Mamba (Tri Dao, informatico vietnamita-americano, autore Mamba paper 2023, Mamba-2 maggio 2024 a Princeton), RWKV, Hyena come SSM/linear-attention. Una nuova architettura raggiunge frontier production entro 2028-2030 ha probabilità bassa-media. Pattern storico: una volta che un’architettura ha attractor di scale, sostituirla richiede o un breakthrough fondamentale o un constraint nuovo (energy, hardware shift).

Decentralized training maturo per medium-scale. [SCENARIO] Bittensor (2021), Petals (2022), gensyn protocols come precursori. Training distribuito su nodi indipendenti raggiunge maturità produttiva per modelli small/medium entro 2028. Probabilmente NON sostituisce centralized training per frontier, dove latency e bandwidth sono bottleneck, ma allarga la base di chi può addestrare modelli di qualità.

Brain-computer interface early commercial per disability assistance. [SCENARIO] Neuralink (impianti pochi, paralizzati ad aprile 2026), Synchron (deploy commerciale ristretto), Precision Neuroscience. Early commercial per disability assistance (paralisi, blind) entro 2030. NON consumer BCI mass-market entro la finestra del capitolo. Capitolo dedicato a BCI è esplicitamente fuori-scope dell’outline (cfr. outline.md sezione “Aree dichiarate fuori scope”), citato qui come segnale.

Synthetic data dominance nei training pipeline. [SCENARIO] Web data ha plateau (la “data wall” discussa già nel 2024). Training data prevalentemente synthetic per LLM nuovi entro 2027 plausibile. Già Anthropic Constitutional AI, OpenAI usa pipeline synthetic significative. Caveat: model collapse (Shumailov et al., “The Curse of Recursion: Training on Generated Data Makes Models Forget”, Nature, luglio 2024) è rischio reale se synthetic non è gestita con cura. Il bilancio fra augmentation e collapse è il problema operativo aperto.

AI-powered creative tools mainstream. [SCENARIO] Veo 3, Sora 2, Suno per la musica, Runway Gen-4 per il video, Midjourney v7 per l’immagine sono già deployati ad aprile 2026. Musica, film, game design AI-augmented dominante entro 2028. NON: AI sostituisce la creatività umana. SI: workflow ibridi diventano default, con conseguenze legali, contrattuali e di credito (sceneggiatori, musicisti, illustratori) ancora in negoziazione.

Reliability breakthrough per task definiti. [SCENARIO] Hallucination rate misurato dall’1 al 10% ad aprile 2026 (Vectara Hallucination Leaderboard). Drop sotto l’1% per task definiti (summarization, structured extraction, retrieval-grounded QA) plausibile entro 2028. NOT: hallucination scompare. NON: AI diventa “affidabile come un calcolo deterministico”. Ma per categorie specifiche di task la barriera della reliability viene attraversata.

Scenari di rottura, esplicitamente dichiarati come speculation, orizzonte cinque o più anni.

AGI claims credibili da almeno un laboratorio frontier. [SPECULATION] Definizioni AGI sono contese (cfr. slug futuro agi-definizioni Parte II). Almeno un laboratorio frontier (OpenAI, Anthropic, Google DeepMind, xAI, Safe Superintelligence Inc. di Sutskever) annuncia entro 2032 un claim AGI-level su task economically valuable, dove la definizione operativa OpenAI 2024-2025 è “highly autonomous systems that outperform humans at most economically valuable work”. Validazione contestata, definizione contestata, ma il claim diventa pubblico e la società deve decidere che farsene. Caveat fortissimo: il pattern Simon 1965, McCarthy 1957, Hassabis 2016 tutti hanno predetto AGI in decadi. Questo capitolo NON predice AGI. Riconosce che il claim diventerà comune, e che il dibattito su cosa significhi davvero AGI dovrà uscire dai tweet e diventare definizione operativa.

Recursive self-improvement parziale. [SPECULATION] AI che migliora se stessa significativamente. Foom scenarios discussi da Yudkowsky (LessWrong 2008-2022) e Bostrom (Superintelligence 2014). Alcune componenti del workflow AI dev (architecture search, reward model design, training data curation, hyperparameter tuning) sono fatte da AI autonomamente entro 2030. NON: takeoff esponenziale verso superintelligence in poche settimane. Ma ricursività parziale è plausibile, e già parzialmente in atto in pipeline industriali interne dei frontier lab.

Superintelligence shadows in narrow domain. [SPECULATION] Alcuni narrow domain (math formal, code in linguaggi specifici, parts di scientific discovery) vedono sistemi che superano esperti umani consistentemente entro 2032. NON: superintelligence generale. Già a inizio 2026 ci sono segnali (AlphaProof silver medal IMO 2024, FrontierMath che attraversa la soglia), ma la generalizzazione cross-domain resta speculation.

AI-driven economic transformation di portata storica. [SPECULATION] Trenta per cento o più dei jobs trasformati (NON necessariamente eliminati) entro 2035. “Trasformati” significa che il lavoro quotidiano cambia significativamente nei tools, nei workflow, nelle output expectations. L’eliminazione netta di occupazioni intere è storicamente molto più rara di “transformation in place”. Caveat: Daron Acemoglu (economista turco-americano, MIT, premio Nobel per l’Economia 2024 con Simon Johnson e James Robinson), Erik Brynjolfsson (economista americano, Stanford), Pascual Restrepo hanno track record di stime variabile. Le stime disponibili (Goldman Sachs marzo 2023 stima trecento milioni di jobs exposed; McKinsey luglio 2023 stima dodici-venticinque milioni di occupational shifts US entro 2030; IMF gennaio 2024 stima quaranta per cento dei jobs globali esposti) hanno range enorme. Il capitolo segnala l’incertezza, non la nasconde.

AI consciousness debate genuinamente scientifico. [SPECULATION] Oltre il dibattito filosofico, evidenze empiriche di functional aspects della consciousness (global workspace integration, recurrent self-modeling) emergono in sistemi AI in modo sufficientemente chiaro da spostare il dibattito da filosofico a scientifico entro 2032. NON: AI consapevole. SI: debate scientifico vero, con metodi empirici riproducibili. Riferimenti: Anil Seth (neuroscienziato britannico, Sussex University), Christof Koch (neuroscienziato tedesco-americano, ex Allen Institute), Susan Schneider (filosofa americana, FAU) lavori 2020-2026. Il tema è oggetto di Parte II della wiki (cfr. slug futuri coscienza-access-phenomenal, hard-problem-chalmers, qualia).

Existential risk framework operativo. [SPECULATION] Governance internazionale AI come per nucleare (un’entità IAEA-like) entro 2035. Segnali deboli: AI Safety Institutes UK + US + Japan + Korea + Singapore + EU AI Office sono già attivi ad aprile 2026. International AI Safety Report 2025 (chair Yoshua Bengio, già decoder cap mondo-post-2026, pubblicato gennaio 2025) come precedente. AI summits (Bletchley Park novembre 2023, Seoul maggio 2024, Paris febbraio 2025) come embryonic governance. Pattern storico: governance internazionale per technologies dual-use richiede tempo. Il NPT è del 1968, l’IAEA del 1957, l’enforcement effettivo è variabile. Per AI il tempo di costruzione di un framework comparabile è probabilmente analogo: decadi, non anni.

Una sezione dedicata alla dimensione geopolitica, perché è probabilmente il singolo fattore meno tecnico e più strutturale per il futuro dell’AI.

Rivalità US-Cina come asse principale. [ESTRAPOLAZIONE per il triennio 2026-2028] Chip export controls iniziati ottobre 2023 e aggiornati 2024-2025 continuano e si stringono. Cina lavora su substitutes domestici (Huawei Ascend serie 910, SMIC processi 7nm e 5nm). DeepSeek-V3 ha mostrato che efficiency può compensare hardware constraint. L’asse US-Cina resta il singolo fattore strutturale più importante. [SCENARIO 2028-2030] Una “AI Cold War” con duplicazione di stack (frontier model, hardware, regulatory framework) si consolida, con limited knowledge transfer cross-blocco e talent restrictions sempre più severe.

EU come terzo polo regolatorio. [ESTRAPOLAZIONE] EU AI Act enforcement maturo nel 2026-2027, citato come modello globalmente (Brazil, Canada, Korea hanno proposte simili in lavorazione). Mistral come campione di “sovranità digitale”. La narrativa “EU non innova ma regola” è disputata; il fatto è che l’EU resta market significativo e regulatory standard-setter per technologies che vogliono operare globalmente.

Indo-Pacific in ascesa. [SCENARIO] India con investimenti nazionali (IndiaAI Mission 2024, Sarvam AI, Krutrim), Singapore AISI come hub regolatorio influente, Japan e Korea come hub tecnici. UAE (G42, Falcon, Microsoft partnership 1.5B),SaudiArabia(HUMAIN,1.5B), Saudi Arabia (HUMAIN, 100B sovereign AI plan) come investitori massivi. Entro 2030 il quartile non-US/non-Cina/non-EU potrebbe diventare quarto polo significativo, con gravitational center distribuita Bangalore-Singapore-Abu Dhabi.

Cosa farebbe collassare la frammentazione. [SCENARIO] Un breakthrough scientifico AI-mediato di portata globale (cure cancer, fusion energy commercial, space exploration breakthrough) potrebbe forzare cooperation cross-blocco, come la pandemia COVID-19 ha forzato (parzialmente) cooperation in vaccine development. O un incidente AI catastrofico potrebbe spingere governance cooperativa, come Three Mile Island e Chernobyl hanno modellato regulation nucleare. Probabilità: bassa-media in entrambi i casi, ma non zero.

Aree dove il prossimo breakthrough ridisegnerebbe la mappa.

Architecture: oltre Transformer? Mamba, RWKV, Hyena vs Transformer entrenchment. [SCENARIO] Constraint che potrebbe forzare cambio: long context efficiency (Transformer attention quadratico vs linear), energy efficiency (constraint su data center growth). Wildcard: photonic computing (Lightmatter, Ayar Labs), neuromorphic chip. Probabilità transition entro 2030: media, dipende da hardware roadmap.

Training: reasoning self-play e oversight scalable. [ESTRAPOLAZIONE] DeepSeek-R1 ha mostrato che pure-RL su reasoning (R1-Zero) genera capacità di pensiero senza SFT iniziale (cfr. cap ragionamento-2024-2026). Self-play su reasoning esteso a domain oltre math/code è direzione attiva. Constitutional AI evolution come template per oversight scalable. Open question: come scalare oversight quando il sistema supera capacità umane di valutarne l’output (cfr. slug futuro superallineamento-concetto Parte II).

Inference: efficiency continua. [ESTRAPOLAZIONE] FlashAttention generations, speculative decoding evolution, KV cache optimization. Costo per token in calo strutturale, anche se costo per query (con thinking) sale. Un pattern ricorrente: ogni due-tre anni un’innovazione di sistemi (FlashAttention, PagedAttention, speculative decoding, draft model architectures) muove di un ordine di grandezza il costo di inference per token.

Hardware: post-NVIDIA dominance? [SCENARIO] NVIDIA Blackwell standard 2024-2025, Rubin 2026 annunciato. Constraint: TSMC capacity, HBM memory. Sfidanti: AMD MI355, Google TPU v6 (Trillium), Microsoft Maia, AWS Trainium 3. Cina: Huawei Ascend 910 series, SMIC 7nm e 5nm. Photonic computing (Lightmatter, Ayar Labs) ancora early. Quantum computing per AI molto speculativo, fuori-scope outline. Probabilità di displacement NVIDIA entro 2030: bassa per training frontier, media per inference enterprise.

Energy: efficiency or wall? [SCENARIO] Stima 50-200 MWh per training run frontier ad aprile 2026 (Epoch AI). Data center AI growth 2025-2026 ha innescato moratorie (Irlanda, alcune utility US). Constraint potenziale: grid baseload non scala alla velocità di GPU procurement. Soluzioni in esplorazione: nuclear small modular reactor (Microsoft Three Mile Island restart 2024, Amazon Talen Energy nuclear deal 2024), gas baseload temporaneo, geothermal (Fervo Energy partnership Google 2024). Wildcard pessimista: energia diventa il vero collo di bottiglia 2027-2030.

Constraint reali che potrebbero rallentare o invertire la traiettoria.

Dati. Web data esauriti? Common Crawl ha plateau, qualità in declino (slop AI-generated re-scraped). Synthetic data quality è open question, model collapse risk (Shumailov 2024). Il bilancio fra augmentation e collapse è il problema operativo aperto.

Compute. Capital constraints (anche cinquecento miliardi Stargate non sono infiniti), energy constraints (grid e baseload), talent constraints (numero di ML researchers genuinamente frontier-capable è bottleneck reale).

Algorithms. Lo scaling continua a pagare? Diminishing returns già visibili tra GPT-4 e GPT-4 Turbo, gain marginale. Il reasoning paradigm (cfr. cap ragionamento-2024-2026) ha riacceso la curva, ma su una nuova dimensione (test-time compute) che ha i suoi propri limiti. Quando questa curva piegherà, non è chiaro.

Society. Backlash possibile (artisti contro AI image gen, sceneggiatori contro AI script, layoff narrative). Regulation freeze possibile: un incidente serio (deepfake elettorale di alto impatto, attacco AI-mediato a infrastruttura critica) potrebbe innescare risposte rapide. Public mistrust crescente è documentato dall’Edelman Trust Barometer 2025.

Geopolitica. US-Cina rivalità come constraint strutturale. Chip export controls, restrizioni su modelli, brain drain bidirezionale, dual standard regolamentari sono già fatti ad aprile 2026. [SCENARIO] Una frammentazione più decisa dell’ecosistema AI in tre-quattro blocchi (Nord America, EU, Cina, India/MENA come quarto polo emergente) entro 2030 è plausibile. La conseguenza tecnica sarebbe duplicazione di stack (frontier model, hardware, cloud, regulatory framework) e rallentamento di knowledge transfer cross-blocco. Pattern storico: la frammentazione tecnologica in blocchi (telecom standard, internet routing, payment systems) è più frequente della convergenza globale, anche per technologies inizialmente universali.

L’onestà richiede una sezione che enumera ciò che non sappiamo. Non come retorica modesta, ma come dato.

  • Se il reasoning generalizza oltre formal domain (math, code) a real-world task. SOTA su domain reali ancora limitato ad aprile 2026.
  • Se AGI come definito accademicamente sarà raggiunto. Quando, se sì.
  • Se l’alignment scala a sistemi super-umani. Linee teoriche disponibili (Constitutional AI, debate, RLAIF, weak-to-strong supervision di OpenAI), ma nessuna è stata testata at scale su sistemi che superano la valutazione umana.
  • Se l’industria si consoliderà (3-5 lab globali) o frammenterà (10+ player regionali).
  • Quanto job displacement sarà reale vs transformation. Range stime troppo grande per essere informativo.
  • Quale architettura dominerà tra 5 anni. Transformer probabile, ma non certo.
  • Se ci sarà un terzo inverno AI, e quando.
  • Se BCI, quantum computing, robotics integrato saranno mainstream entro 2035.
  • Se il modello di business “API a token” continuerà a dominare o se altri modelli (subscription unlimited, per-task pricing, gain-sharing con enterprise customer) prenderanno piede.
  • Se la categoria “consumer chat assistant” si consoliderà su 1-2 player o resterà frammentata su 5+ player con switching cost basso.
  • Se l’ecosistema open weights riuscirà a sostenere economicamente lo sviluppo di frontier model (DeepSeek ha mostrato che è possibile, ma il modello finanziario è opaco e potrebbe non scalare).
  • Se la ricerca AI accademica resterà rilevante o sarà definitivamente assorbita dai laboratori industriali (trend visibile dal 2018 in avanti, accelerato 2023-2026).
  • Se le AI Safety Institutes nazionali avranno autorità reale (budget, expertise, enforcement) o resteranno bodies advisory senza teeth.
  • Se il paradigma “modello unico per tutto” (general-purpose foundation model) continuerà a dominare o se vedremo specializzazione architetturale per dominio.

L’elenco non è esaustivo. È rappresentativo del livello di incertezza onesto. Chi pretende di sapere come si risolveranno questi punti sta vendendo qualcosa, non analizzando.

Il pattern storico va riconosciuto, non solo accennato.

Predizioni eccessivamente ottimiste hanno preceduto entrambi gli inverni AI (cfr. cap primo-inverno-ai, cap secondo-inverno-ai). Pattern hype-bust ricorrente: percettrone 1958-1969, expert system 1980-1992, deep learning + generative AI 2012 in poi (siamo dentro la curva, non sappiamo a che punto). Le tecnologie sopravvissute agli inverni sono quelle con valore misurabile in domini specifici: backpropagation è sopravvissuta perché applicabile su task piccoli, expert system architecture è sopravvissuta nei verticals dove il knowledge engineering pagava (medicina, configurazione hardware, diagnostica industriale). Le tecnologie che promettevano trasformazione totale e non avevano valore misurabile sono evaporate.

Prudence: Simon nel 1965 ha sbagliato di decadi. Non c’è ragione strutturale per pensare che le predizioni del 2026 siano più affidabili di quelle del 1965, anche se c’è una differenza qualitativa: oggi abbiamo benchmark misurabili e prodotti deployati con utenti reali, non solo demo accademiche. Ma la traiettoria 5-10 anni resta opaca.

Pattern del bust: come riconoscere un terzo inverno se arriva

Sezione intitolata “Pattern del bust: come riconoscere un terzo inverno se arriva”

Per disciplina utile, vale la pena di chiedersi: come riconosceremmo un terzo inverno AI se cominciasse ad aprile 2027 o nel 2028? I trigger storici dei due inverni precedenti suggeriscono una checklist.

Trigger del primo inverno (1974): un report autorevole (Lighthill 1973) che documenta non-delivery delle promesse, taglio finanziamenti governativi (DARPA, UK), pubblicazione critica disciplinare (Minsky-Papert “Perceptrons” 1969) che chiude una linea di ricerca. Trigger del secondo inverno (1987): collasso commerciale di un mercato specifico (Lisp machines 1987-1988), fallimento di expert system installati che non scalano (XCON difficoltà di manutenzione), retrenchment di vendor specializzati (Symbolics, Lisp Machines Inc.).

Trigger plausibili di un terzo inverno (se accade, [SCENARIO]): bolla finanziaria che scoppia su valutazioni private dei frontier lab (oggi $300B+ rumored OpenAI), un incidente AI di alto profilo (deepfake elettorale di rottura, errore medico fatale di un sistema autonomo, attacco AI-mediato a infrastruttura critica), un grande customer enterprise che pubblica risultati negativi su ROI di adoption, un layoff round documentato che venga ricondotto a AI senza compensazione di nuovi job (narrative shift), oppure semplicemente diminishing returns di scaling che diventano visibili e narrabili.

Cosa NON sarebbe un trigger sufficiente: un singolo modello deludente (è capitato e si è recuperato), un singolo benchmark saturato (si crea il successivo), una predizione fallita (gli esperti predicono male da decadi). I trigger reali sono sistemic, non aneddotici.

Cosa sopravvivrebbe a un terzo inverno: probabilmente i prodotti deployati con valore enterprise misurabile (coding assistants, customer support automation, vertical AI con ROI documentato), la categoria foundation model open weights per casi on-prem, l’ecosistema MCP e i tool standardizzati, una parte dell’investment in compute infrastructure (data center sono asset fisici riusabili). Cosa evaporerebbe: parte delle valutazioni private, una parte dei consumer chat product non differenziati, la categoria “AI startup wrapper” senza moat, parte del talent flux (i ricercatori restano, gli opportunisti se ne vanno).

Marcatura di classe: questa è una constatazione strutturale sul pattern storico applicato come framework di lettura, NON una previsione che un terzo inverno accadrà. La probabilità è genuinamente incerta: i fundamentals AI 2026 sono molto più solidi di quelli 1969 o 1986 (revenue, utenti reali, prodotti che funzionano), ma il pattern hype-bust ricorrente non si lascia liquidare con argomenti di questo tipo.

Tre esempi concreti per fissare il punto. Il primo è un caso storico di predizione fallita. Il secondo è un’estrapolazione attuale con base solida. Il terzo è uno scenario possibile, marcato come tale. La scelta degli esempi non è casuale: ognuno illustra un tipo di ragionamento epistemico diverso che il capitolo cerca di rendere esplicito.

Gli esempi sono volutamente eterogenei sull’asse temporale (uno guarda al passato, uno al presente che si estende, uno al futuro plausibile) e sull’asse del dominio (uno cognitivo-strategico, uno economico-prodotto, uno embodied-fisico). Una rassegna più ampia non aggiungerebbe nuovo tipo di ragionamento; aggiungerebbe solo varianti dello stesso pattern.

A proposito del numero di esempi: ne diamo quattro (con un esempio 2-bis aggiuntivo), uno per categoria epistemica. McCarthy 1957 è l’esempio storico per illustrare la difficoltà predittiva. Thinking models pricing trajectory è l’estrapolazione plausibile. AI software engineering trajectory è un’estrapolazione con segnali deboli incorporati. Robotic foundation model integration è lo scenario possibile. Nessun esempio di wild speculation, perché non si possono fare esempi convincenti di wild speculation: qualunque esempio di wild speculation è o piattamente fantascientifico (e quindi non istruttivo) o speculation già addomesticata in scenario.

Nel 1957 John McCarthy, intervistato dopo Dartmouth, dichiara che entro dieci anni una macchina sarà campione del mondo di scacchi. La predizione è registrata in fonti dell’epoca, citata negli annali dell’AI come archetipo di sotto-stima della difficoltà.

Cosa è successo davvero. Nel 1967 (la deadline McCarthy) i programmi di scacchi giocano a livello di un dilettante medio. Negli anni Settanta arrivano ai migliori amatori. Nel 1989 Deep Thought batte un grandmaster (David Levy). Nel 1996 Deep Blue perde 4-2 contro Kasparov. Nel 1997 Deep Blue vince 3.5-2.5 contro Kasparov, primo computer a battere il campione del mondo in regular tournament conditions (cfr. cap deep-blue-1997). Quarant’anni esatti dopo la predizione di McCarthy, non dieci.

La lezione metodologica: la predizione era qualitativamente corretta (le macchine avrebbero battuto l’umano), ma sbagliata di un fattore quattro sulla scala temporale. Il pattern è ricorrente in tutta la storia delle predizioni AI. Il nostro capitolo, applicando questo pattern a se stesso, dovrebbe assumere che le proprie estrapolazioni di orizzonte 1-2 anni sono ragionevolmente affidabili, gli scenari 2-5 anni sono soggetti a slittamenti significativi, le speculazioni 5+ anni sono soggette a errori di un fattore 2-4 sulla scala temporale, anche quando la direzione qualitativa è corretta.

Esempio 2: Thinking models pricing trajectory 2024-2025 (estrapolazione)

Sezione intitolata “Esempio 2: Thinking models pricing trajectory 2024-2025 (estrapolazione)”

[ESTRAPOLAZIONE] Cosa è successo ad aprile 2026 nel pricing dei thinking models, e cosa estrapolare per fine 2026.

Stato dicembre 2024 al rilascio o1: ricavi per thinking premium tier circa 200/mese(ChatGPTPro,OpenAIdicembre2024).PricingAPIo1:200/mese (ChatGPT Pro, OpenAI dicembre 2024). Pricing API o1: 15/M input, 60/Moutput.Statofebbraio2025alrilascioClaude3.7conextendedthinking:stessoprezzopertokendelSonnetbase(60/M output. Stato febbraio 2025 al rilascio Claude 3.7 con extended thinking: stesso prezzo per token del Sonnet base (3/15),macontunablethinkingbudgetchepuoˋconsumaremigliaiaditokenaggiuntiviperquery.Statogennaioaprile2025pero3mini:15), ma con tunable thinking budget che può consumare migliaia di token aggiuntivi per query. Stato gennaio-aprile 2025 per o3-mini: 1.10/$4.40 per token, primo thinking model accessibile a basso costo. Stato aprile 2026: GPT-5 rumored con thinking nativo, probabile pricing intermedio tra o3-mini e o3 full, integrazione modalità unica.

Estrapolazione per fine 2026: thinking come modalità default per tier high di ogni frontier; pricing differenziato sostituito da pricing variabile per query in base a “reasoning effort”; cost per query mediano in salita di 3-10x rispetto al pre-thinking standard, ma con offset di accuracy che compensa per use case high-stakes. La traiettoria è solida perché ogni laboratorio frontier sta convergendo sulla stessa architettura prodotto.

Cosa NON è estrapolazione: che il rapporto fra cost e accuracy sarà lineare, che il “thinking tax” sarà uniformemente accettato dal mercato, che non ci sarà segmento “fast first, thinking on demand” come UX standard. Sono possibilità, non certezze.

Esempio 2-bis: AI software engineering trajectory (estrapolazione + segnali deboli)

Sezione intitolata “Esempio 2-bis: AI software engineering trajectory (estrapolazione + segnali deboli)”

[ESTRAPOLAZIONE su SWE-bench Verified] Cifre a confronto, per fissare la traiettoria.

  • Ottobre 2023: GPT-4 base + simple harness, success rate ~10% su SWE-bench Verified.
  • Settembre 2024: Claude 3.5 Sonnet + Anthropic agentic harness, ~49%.
  • Dicembre 2024: OpenAI o3, ~71%.
  • Febbraio 2025: Claude 3.7 Sonnet + extended thinking, ~73%.
  • Aprile 2026 (stimato): top frontier nella fascia alta dei settanta, con soglia dell’ottanta come ordine di grandezza plausibile ma non ancora stabilizzato.

Il salto da 10% a 73% in 16 mesi è uno dei segnali più netti del progresso aggregato (architettura + training + agentic harness + reasoning + tool use). Estrapolazione: 80%+ entro fine 2026, 85-90% plausibile entro 2027. Il benchmark satura prima della “AI software engineer competente in produzione”. Il jump SWE-bench non implica capacità di scrivere applicazioni intere autonomamente: copre bug fix isolato e feature implementation localizzata, NON architettura sistema, NON debugging produzione, NON integration con stakeholder.

Cosa potrebbe succedere ai ruoli developer 2026-2030. [SCENARIO] La distribuzione del lavoro developer si riallinea. Junior developer absorption rate da parte di tool AI: significativa, ma con apprendistato che cambia natura. Senior developer focus shift verso architecture, design system, code review AI-augmented, debugging complesso, integration. Il ruolo “AI engineer” come distinto da “ML engineer” si consolida (già visibile in job posting 2025). Productivity gain documentati 2024-2025 sono variabili (GitHub Survey 2024 cita 20-50% gain su task subset; METR luglio 2025 ha pubblicato uno studio su senior open source developer che mostra 20% slowdown contro aspettativa). Il dibattito su long-term effect di cognitive offloading e code quality drift è attivo.

Esempio 3: Robotic foundation model integration (scenario)

Sezione intitolata “Esempio 3: Robotic foundation model integration (scenario)”

[SCENARIO] Uno scenario plausibile per il triennio 2026-2029 nell’integrazione fra LLM frontier e embodied control.

A inizio 2026: Tesla Optimus dichiara produzione 2025 (cifre Musk, da verificare), Figure 02 in pilot BMW manufacturing, 1X NEO in pilot famiglia, Boston Dynamics Atlas Electric in showcase, Physical Intelligence pi-zero come “robotic foundation model” dichiarato, NVIDIA GR00T come piattaforma humanoid foundation model annunciata.

Scenario 2026-2029: integrazione fra un LLM frontier (per planning, dialogue, task decomposition) e un robotic foundation model (per perception, motor control, grasping, locomotion) raggiunge maturità per deploy commerciale ristretto. Setting plausibili: warehouse picking and packing (Amazon, Ocado), manufacturing tasks ripetitivi (BMW, Mercedes pilot), alcuni servizi domestici per disability assistance (1X NEO target market). Scale: migliaia di unità deployate, non milioni; vertical specifici, non general purpose.

Cosa farebbe slittare lo scenario di anni. Sim-to-real gap che resiste; dexterity hardware (mani robotiche) che non scala in cost; safety (interazione con umani in proximity) che genera incidenti pubblici e backlash regolatorio; energy density delle batterie che limita autonomy operativa.

Cosa accelererebbe lo scenario. Un breakthrough in robotic foundation model (analogo a Transformer per LLM) che dia un jump di order-of-magnitude in sample efficiency. Una crisi di labor market in settori specifici (warehouse, elderly care) che spinga adoption rapida. Investment shift di un frontier lab che dedichi risorse paragonabili a LLM frontier (ad oggi, no lab AI dedica capex paragonabile al ramo LLM).

Lo scenario rimane scenario, non estrapolazione, perché i bottleneck reali sono fuori dal controllo del software.

Sezione esplicita che pone una linea epistemica.

SI (confidenza alta, da considerare quasi certo entro 2028)

Sezione intitolata “SI (confidenza alta, da considerare quasi certo entro 2028)”
  • Trend di scaling compute, reasoning research, agentic productization continueranno almeno fino al 2028.
  • Regulatory landscape continuerà a maturare (EU enforcement, state-level US, multilateral frameworks).
  • Multimodale + long context + tool use diventeranno default per ogni frontier, non più tier separati.
  • Open weights e closed continueranno coesistenza, non sostituzione di un campo sull’altro.
  • Vertical AI maturerà in legal, medical, customer support, recruiting, design.
  • Cost per token continuerà in calo strutturale; cost per query (con thinking) potrebbe non calare.
  • Investimento in compute si manterrà nell’ordine di centinaia di miliardi annui, salvo recessione macro.
  • AI Safety Institutes coalition continuerà a esistere e a pubblicare report.
  • Timeline AGI specifica.
  • Vincitori del mercato consolidato (chi sarà “Apple/Microsoft del 2030”). Pattern storico: chi domina early non sempre domina mature market.
  • Salto qualitativo da “tool” a “autonomous agent generale”.
  • Impatto economico quantificato del job displacement.
  • Quale architettura dominerà nel 2030.
  • Se ci sarà un terzo inverno AI, e quando.
  • Se BCI, quantum computing, robotics integrato saranno mainstream entro 2035.
  • Se l’allineamento di sistemi super-umani sarà risolto prima che diventi necessario.

Sezione meta: i limiti del capitolo stesso. Ogni esercizio di estrapolazione del futuro ha modi caratteristici in cui si rompe, e dichiararli è parte dell’onestà richiesta.

Recency bias. Il capitolo è scritto in aprile 2026. Sovrastima inevitabilmente i trend visibili adesso e sottostima i trend non ancora visibili. Pattern storico: i breakthrough più importanti sono spesso non visti dai contemporanei. AlexNet nel 2012 non era stato anticipato dalla maggior parte dei ricercatori AI. Transformer nel 2017 era una proposta fra molte. ChatGPT nel 2022 ha sorpreso anche dentro OpenAI. Cosa stiamo non vedendo ad aprile 2026? Per definizione, non lo sappiamo.

Trend possono invertire. Ogni [ESTRAPOLAZIONE] assume che il trend continui; ma i trend tecnologici possono saturare, invertire, biforcarsi. Il caso classico è la legge di Moore: estrapolata linearmente per decenni, ha rallentato sensibilmente dal 2010 in poi.

Black swan eventi possibili. Guerra con conseguenze su supply chain semiconduttori (Taiwan), cambio climatico con impatto su data center cooling, regolamentazione di rottura post-incidente serio, scientific breakthrough imprevisto. Un singolo evento con impatto strutturale può ridisegnare la mappa più di un anno di trend.

Mito: “futurologia AI seria”. Quasi nessun futurologo AI ha track record verificato su orizzonte 5-10 anni. Ray Kurzweil ha track record misto. Bostrom ha frame analitico, non predizioni quantitative. Marcus, Yudkowsky, Christiano hanno previsto direzioni diverse, alcune si sono avverate altre no. Il dato meta è che la futurologia AI come disciplina rigorosa non esiste con calibratura predittiva verificata. Questo capitolo eredità il limite della disciplina.

Mito: “gli esperti sanno”. Douglas Hubbard (consulente americano, autore di “How to Measure Anything”, Wiley 2014) documenta che gli esperti hanno calibratura predittiva sistematicamente sopra-confidente quasi in ogni dominio studiato. Tetlock e Gardner (Philip Tetlock, psicologo canadese-americano, UPenn; Dan Gardner, giornalista canadese) in “Superforecasting” (Crown 2015) dimostrano che la calibratura predittiva è una skill, non una conseguenza dell’expertise. Gli esperti AI non sono eccezione: il survey AI Impacts 2022 (Katja Grace e collaboratori) mostra wide variance fra esperti su timeline AGI, e i survey precedenti hanno spesso sbagliato.

Mito: “predizioni timeline-AGI affidabili”. Survey AI researchers (Grace et al. 2022) hanno median 50% probability di HLMI entro il 2059, con quartile inferiore 2031 e quartile superiore oltre 2100. La spread è tale che la “previsione mediana” è quasi non informativa. Aschenbrenner (Leopold Aschenbrenner, ricercatore tedesco-americano, ex OpenAI Superalignment, autore “Situational Awareness” giugno 2024) prevede AGI entro 2027 con grande sicurezza; il consensus di Metaculus è significativamente più cauto. Le posizioni divergono di una decade o più.

Mito: “questa volta è diverso”. Il bias verso “questa volta è diverso” si applica in entrambe le direzioni. Chi crede che lo scaling abbia ormai cambiato natura della partita ha argomenti, ma anche pattern storico contro (gli expert system erano “questa volta è diverso” negli anni Ottanta). Chi crede che siamo a un plateau ha argomenti, ma il pattern degli ultimi tre anni li ha smentiti più di una volta. La risposta saggia è probabilmente “in parte sì, in parte no”, che è meno citabile ma più calibrata.

Mito: “il futuro dell’AI è una questione tecnica”. Il futuro dell’AI è almeno tanto questione politica, economica, regolatoria, sociale quanto tecnica. Le predizioni puramente tecniche (quale architettura, quale benchmark, quale capability) ignorano che i bottleneck reali del prossimo decennio potrebbero essere energy grid, public trust, regulatory landscape, geopolitical fragmentation. Un capitolo che pretendesse di predire il futuro AI guardando solo ai paper recenti sarebbe fuori bersaglio anche se i paper fossero perfettamente compresi.

Mito: “predizioni richiedono modelli quantitativi”. I modelli quantitativi (Cotra biological anchors, Davidson takeoff models, AI Impacts forecasting infrastructure) hanno valore come framework analitico, non come oracoli. Le loro assumptions sono spesso indistinguibili da intuizioni qualitative codificate in formule. Trattarli come “scientifici” perché producono numeri è una forma di feticismo del quantitativo che il capitolo evita esplicitamente.

Un esercizio utile è guardare le previsioni AI più citate degli ultimi vent’anni e valutare il loro track record ad aprile 2026. Non per smontarle (alcune erano qualitativamente buone), ma per calibrare quanto pesare le previsioni attuali.

Kurzweil 2005, “The Singularity is Near”. Ray Kurzweil prevede AGI entro 2029, singularity entro 2045. Frame: legge dei rendimenti accelerati, exponentially advancing tech across multiple domains. Stato ad aprile 2026: 3 anni alla prima predizione, esito open. Il consensus della comunità AI non considera AGI 2029 probabile in senso forte; survey AI Impacts 2022 mette median 50% HLMI al 2059, trent’anni dopo. Kurzweil ha argomentato che il pubblico (e la comunità AI) sistematicamente sotto-stima curve esponenziali, e che le release 2022-2025 (ChatGPT, GPT-4, o-series) confermano la sua traiettoria. La discussione resta aperta. Il giudizio finale sarà possibile solo nel 2029, e dipenderà da come si sceglie di definire AGI.

Bostrom 2014, “Superintelligence”. Frame analitico: orthogonality thesis, instrumental convergence, takeoff scenarios. NON predizione timeline-specifica. Il frame ha shaped il dibattito AI safety per un decennio, è stato adottato da OpenAI Charter (2018), Anthropic Responsible Scaling Policy (2023), DeepMind safety teams. Ad aprile 2026 il frame è maturato: alcuni concetti (instrumental convergence per goal-directed sistemi avanzati, mesa-optimization, reward hacking) sono empiricamente osservati in piccolo (paper di Anthropic, OpenAI, Apollo Research 2024-2025). Altri (orthogonality thesis come prerequisito per “alignment è separato da intelligence”) restano dibattuti. Il libro non ha previsioni quantitative da valutare, ma il frame è probabilmente il singolo testo più influente del decennio nel discorso AI safety.

FLI Pause Letter, marzo 2023. Lettera aperta firmata da Musk, Wozniak, Bengio, Marcus, Tegmark e altri 30000+ co-firmatari, propone moratoria di sei mesi su training di modelli oltre GPT-4. Realtà: nessun frontier lab ha pausato. Trend continuato e anzi accelerato (GPT-4 Turbo, Claude 2 e 3, Gemini, Llama 2 e 3, o1, R1, o3, Claude 3.7 sono tutti rilasciati nei due anni successivi). Lezione: coordinated stop in ambiente competitivo multipolar è quasi impossibile senza enforcement state-level. La lettera ha avuto effetto di agenda-setting (alcuni governi e AISI hanno citato la lettera come parte del razionale per AI summits Bletchley/Seoul/Paris), ma non l’effetto operativo richiesto.

AI Winter advocates 2022-2023. Gary Marcus in “Deep Learning Is Hitting a Wall” (Nautilus marzo 2022) argomenta plateau strutturale di deep learning come strada per AGI, chiama a hybrid neuro-symbolic. Yann LeCun (già decoder cap resnet-2015) ha ripetutamente argomentato che LLM non sono la strada per AGI (“auto-regressive LLM sono off-ramp per AGI”, varie interviste 2023-2024). Realtà ad aprile 2026: scaling ha continuato a pagare (GPT-4 a o3 mostra progressi misurabili), reasoning paradigm ha riacceso la curva. La predizione di plateau è stata smentita su orizzonte 2-3 anni; può essere ancora corretta su orizzonte 5-10 anni. Lezione: predizioni di plateau hanno track record peggiore di quanto comunemente percepito sull’orizzonte breve, ma gli scaling skeptics hanno argomenti seri da non liquidare.

Scaling believers 2019-2024. Ilya Sutskever (già decoder cap ragionamento-2024-2026), Sam Altman, Dario Amodei hanno ripetutamente predetto continuità dello scaling come strada principale, con sub-tema reasoning come continuazione naturale. Richard Sutton (informatico canadese, ricercatore RL fondatore della disciplina, premio Turing 2024 con Andrew Barto) in “The Bitter Lesson” (incompleteideas.net, marzo 2019) ha articolato il principio: “i metodi general che leverage computation sono in ultima analisi i più effective”. Realtà ad aprile 2026: i scaling believers hanno vinto la scommessa finora. Non hanno necessariamente vinto la scommessa per i prossimi 5 anni — il Bitter Lesson non garantisce che ogni scaling continuerà — ma il loro track record predittivo è meglio dei plateau advocates sull’orizzonte 2019-2025.

Aschenbrenner 2024, “Situational Awareness”. Leopold Aschenbrenner (ricercatore tedesco-americano, ex OpenAI Superalignment, dimissionario insieme a Leike e Sutskever in maggio 2024) pubblica in giugno 2024 saggio influente che predice AGI entro 2027, superintelligence shortly after, e propone US-led project Manhattan-style per costruire AGI prima della Cina. Stato ad aprile 2026: la traiettoria 2024-2026 (o3, R1, Claude 3.7) è compatibile con la traiettoria di Aschenbrenner ma non la prova; 2027 è ancora un anno e mezzo nel futuro. La proposta Manhattan-style ha shaped parte del razionale per Stargate (gennaio 2025). Il saggio è esempio di estrapolazione aggressiva da trend visibili: se ha ragione, sarà retrospettivamente “ovvio”; se ha torto, sarà retrospettivamente “ottimismo eccessivo da insider che vedeva solo il proprio pezzo”.

Lezione meta da questi sei casi: le predizioni quantitative timeline-specifiche hanno track record peggiore delle predizioni qualitative direction-specifiche. Bostrom non aveva timeline e il suo frame è invecchiato meglio di Kurzweil. La FLI Pause è stata smentita perché chiedeva azione coordinata in setting non-cooperativo. Marcus ha ragione qualitativamente che LLM hanno limiti, ma sui tempi è stato troppo aggressivo. Aschenbrenner sta scommettendo più aggressivamente di quanto i pattern storici suggerirebbero prudente. La risposta calibrata, che questo capitolo cerca di adottare, è: predizioni qualitative con marker epistemico esplicito, non predizioni quantitative con falsa precisione.

Tre aneddoti per chiudere la sezione storica.

Turing 1950, l’imitazione game. Alan Turing (matematico britannico, 1912-1954, già decoder cap turing-macchina-mente) in “Computing Machinery and Intelligence” (Mind 1950) stima che entro fine secolo macchine al 70% supereranno il test in un setting di 5 minuti con 30% di interrogatori ingannati. Esito ad aprile 2026: i LLM moderni sembrano superare versioni informali del Turing test ma il setting rigoroso non è mai stato veramente eseguito a scala. La predizione è qualitativamente vicina al vero (le macchine sono diventate molto brave a passare per umane in conversazione testuale), ma il setting rigoroso che misurerebbe Turing 1950 propriamente non è mai stato chiuso.

Sutskever 2015, “deep learning rivoluzionera ricerca”. Ilya Sutskever in interview del 2015 (con Andrew Ng, in occasione di reinforcement learning workshop NeurIPS) prevede che deep learning rivoluzionera la ricerca scientifica. Esito: qualitativamente giusto (AlphaFold 2020, GNoME 2023, AlphaProof 2024 sono in linea con la predizione). Ma Sutskever non aveva preview di GPT-3 (2020), GPT-4 (2023), o-series (2024-2025): la rivoluzione è arrivata con un’ampiezza che lui stesso non aveva descritto. Lezione: anche i ricercatori al frontier sotto-stimano dove arrivera la propria field.

Hassabis 2016, post-AlphaGo. Demis Hassabis, intervistato post-AlphaGo Lee Sedol match, dichiara che AGI è “questione di decadi”. Vago abbastanza da essere quasi non falsificabile. Ad aprile 2026, una decade dopo, AGI resta open. Lezione: predizioni vaghe sono difficili da smentire ma sono anche poco informative. Predizioni precise sono falsificabili ma più spesso sbagliate. La calibratura sta nel mezzo: precisione massima compatibile con onestà sull’incertezza.

Una frase di sintesi prima della chiusura.

Ogni capitolo precedente di questa storia mostra che le predizioni AI specifiche sono quasi sempre sbagliate sui tempi. Predizioni qualitative (paradigm shift) sono più robuste di quantitative (timeline). Una visione equilibrata, calibrata sul pattern storico, dice questo: lo scaling continua a pagare, il reasoning espande l’applicabilità, l’agentic matura, ma i salti qualitativi (AGI, robotica integrata, superintelligence) restano incerti su orizzonte 5-10 anni. Il prossimo decennio probabilmente non sarà nessuno dei due estremi (né AGI domani né plateau immediato): sarà progresso continuo su molti fronti, con sorprese probabilmente sia nella direzione “più veloce del previsto” sia in quella “più lento del previsto”, su sotto-domini diversi.

Chi legge questo capitolo nel 2030 o nel 2035 troverà claim sbagliati. Alcuni sbagliati per ottimismo, altri per pessimismo, altri ancora per non aver visto cose che oggi non vediamo. È nella natura del capitolo. La disciplina che proviamo qui non è prevedere correttamente, ma sbagliare in modo onesto e tracciabile, in modo che chi legge dopo possa capire dove abbiamo sbagliato e perché.

C’e’ una asimmetria importante che vale la pena nominare. Le predizioni “scaling continuerà” e “reasoning maturerà” rischiano relativamente poco: anche se sbagliate, le conseguenze del crederci sono moderate (investimenti continuati, talent allocation continuato, prodotti che si evolvono). Le predizioni “AGI nel 2027” o “superintelligence prima del 2030” rischiano molto di più: se vere e prese sul serio, dovrebbero forzare cambiamenti drastici di policy, governance, allocazione risorse, persino strategia geopolitica. Se false e prese sul serio, distorcono decisioni materiali per anni. La calibratura predittiva non è solo questione epistemica: è questione di asymmetric stakes. Per questo, predizioni con stakes alti vanno marcate con confidenza più bassa di default, non più alta. La nostra inclinazione a marcare AGI come [SPECULATION] e non [ESTRAPOLAZIONE] non è modestia: è calibratura che tiene conto del costo dell’errore.

Una breve nota meta sul registro adottato. Questo capitolo, ultimo della Parte I, si scosta dal registro storico standard per esplicita necessità: il soggetto non è un evento del passato ma una proiezione del futuro. La disciplina applicata è diversa: invece di rigore documentale (date, paper, attori), il capitolo applica rigore epistemico (marker di confidenza, ammissione del non-sapere, riferimento al pattern storico come guardia). Le sezioni “L’intuizione” e “La meccanica”, che in capitoli storici raccontano il funzionamento di un’idea, qui raccontano come ragionare sul futuro. La sezione “Esempi” qui non illustra un concetto ma illustra un tipo di ragionamento.

Il lettore che cerca contenuti scientifici densi su singoli topic (transformer architecture, RLHF, MCP, agentic patterns) non li troverà in questo capitolo. Li troverà nelle Parti X-XVIII (anatomia LLM, training, reasoning, inferenza, context engineering, prompt, agenti, harness, agent coding). Questo capitolo è un’orientation per leggere quelle parti con consapevolezza dei limiti della propria epoca.

  • mondo-post-2026 — la baseline da cui questo capitolo estrapola; ogni “stato presente” qui è quel snapshot.
  • ragionamento-2024-2026 — il paradigma reasoning model che è oggetto di estrapolazione centrale per il triennio 2026-2028.
  • era-agenti-2024 — agentic standardization e MCP come trend in estrapolazione.
  • open-weights-2023-2024 — il fenomeno open weights e la traiettoria di chiusura del gap su benchmark mainstream.
  • scaling-era-2023 — la curva di scaling che continua e si biforca su nuove dimensioni (test-time compute).
  • ai-simbolica-anni-60 — Simon 1965 e le predizioni eccessivamente ottimiste pre-primo-inverno.
  • primo-inverno-ai — il pattern hype-bust come monito storico per le estrapolazioni di questo capitolo.
  • secondo-inverno-ai — il secondo bust, e cosa sopravvisse (vertical, valore misurabile).
  • deep-blue-1997 — McCarthy 1957 e il quarantennio fra predizione e realtà sui scacchi.
  • agi-definizioni (Parte II, slug futuro) — il dibattito su cosa significhi davvero AGI, prerequisito per parlare di “AGI claims credibili”.
  • asi-singolarita (Parte II, slug futuro) — superintelligenza, scenari Bostrom.
  • superallineamento-concetto (Parte II, slug futuro) — alignment scalable a sistemi super-umani.
  • governance-compliance (Parte XXI, slug futuro) — l’AI come oggetto regolato, EU AI Act enforcement, governance internazionale.
  • agent-compromesso (Parte XX, slug futuro) — blast radius e contenimento, rilevanti per scenari di rottura.
  • Bostrom N., “Superintelligence: Paths, Dangers, Strategies”, Oxford UP 2014. Frame analitico per superintelligenza, ancora il riferimento standard per scenario building, anche se quantitativi datati.
  • Amodei D., “Machines of Loving Grace: How AI Could Transform the World for the Better”, essay anthropic.com, 11 ottobre 2024. https://darioamodei.com/machines-of-loving-grace La visione ottimista controllata di un CEO frontier corrente. Lettura per capire come pensa chi costruisce.
  • Yudkowsky E., “AGI Ruin: A List of Lethalities”, LessWrong 5 giugno 2022. https://www.lesswrong.com/posts/uMQ3cqWDPHhjtiesc/agi-ruin-a-list-of-lethalities Posizione pessimistica articolata in 43 punti. Lettura per capire l’estremo opposto del dibattito.
  • Stanford HAI, “AI Index Report 2025”, aprile 2025. https://aiindex.stanford.edu/report/ Riferimento standard per metriche aggregate (capability, investimento, regolamentazione, opinione pubblica). Aggiornato annualmente.
  • Bengio Y. et al., “International AI Safety Report 2025”, AI Safety Institutes coalition, gennaio 2025. https://www.gov.uk/government/publications/international-ai-safety-report-2025 Primo report multilaterale ufficiale sullo stato AI safety. Lettura obbligata per capire il consensus emergente fra AISI nazionali.
  • Tetlock P., Gardner D., “Superforecasting: The Art and Science of Prediction”, Crown 2015. Non specifico AI, ma metodologia rigorosa per pensare al futuro con disciplina. Antidoto utile contro l’oracolarità.
  • Aschenbrenner L., “Situational Awareness: The Decade Ahead”, giugno 2024. https://situational-awareness.ai/ Saggio influente di ex OpenAI Superalignment con visione molto ottimistica timeline AGI (entro 2027). Posizione contestata ma articulata, utile per capire il punto di vista insider scaling-believer aggressivo.
  • Marcus G., “Deep Learning Is Hitting a Wall”, Nautilus, 10 marzo 2022. https://nautil.us/deep-learning-is-hitting-a-wall-238440/ Posizione scaling-skeptic, parzialmente smentita 2024-2026 ma ancora rilevante per capire i limiti strutturali argomentati.
  • Sutton R., “The Bitter Lesson”, incompleteideas.net, 13 marzo 2019. http://www.incompleteideas.net/IncIdeas/BitterLesson.html Manifesto del scaling-believer camp in 2 pagine. Il singolo testo breve più citato del decennio in AI strategy.
  • Grace K. et al., “Forecasting AI Progress: Evidence from a Survey of Machine Learning Researchers”, AI Impacts, 2022 e iterazioni successive. https://aiimpacts.org/2022-expert-survey-on-progress-in-ai/ Survey di centinaia di AI researchers su timeline HLMI. Per capire la wide variance del consensus expert.

Se stai leggendo questo capitolo nel 2030, nel 2035, nel 2040, sapendo come è andata: alcune cose qui dette si sono avverate, altre no, alcune sono state superate da eventi che non avevamo nemmeno nominato. La cornice epistemica (tre classi di affermazioni, marker espliciti, ammissione del non-sapere) è invecchiata meglio dei contenuti specifici. Questo era prevedibile e dichiarato.

Quello che speriamo sia invecchiato bene è la disciplina del capitolo, non i suoi specifici claim. La disciplina di distinguere estrapolazione da scenario da speculation. La disciplina di marcare cosa SI può dire vs cosa NO con confidenza. La disciplina di guardare il pattern hype-bust della storia AI come guardia contro l’oracolarità. La disciplina di ammettere le limitazioni del capitolo stesso. Se anche solo uno di questi pezzi ti è stato utile per pensare al tuo presente (che è il nostro futuro), il capitolo ha fatto il suo lavoro.

Se invece tutti i nostri claim sono stati smentiti, sappi che lo abbiamo previsto come probabile. Se tutti sono stati confermati, sappi che siamo stati fortunati più che bravi. La predizione AI è quasi sempre sbagliata, e questo capitolo non aspirava a fare eccezione. Aspirava a sbagliare in modo onesto e tracciabile.

Con questo capitolo si chiude la Parte I — Storia dell’AI. Settant’anni di tentativi, fallimenti, svolte: dalle macchine logiche di Leibniz e Babbage e dalla macchina di Turing degli anni Trenta-Quaranta, attraverso la nascita del campo a Dartmouth nel 1956, i due inverni AI degli anni Settanta e Ottanta-Novanta, la rinascita statistica degli anni Novanta, il momento deep learning del 2012 con AlexNet su ImageNet, il decennio di consolidamento 2012-2022 con Transformer e GPT-3, il momento pubblico di ChatGPT a fine 2022, l’era scaling e agenti del 2023-2025, e la convergenza del paradigma reasoning a inizio 2026. La Parte I ha raccontato come siamo arrivati a quel punto e perché, e ha tentato in questo capitolo finale di guardare avanti senza pretendere oracolarità.

Il libro continua con la Parte II — Filosofia della mente e dell’intelligenza, per chiedersi cosa significhi davvero “pensare”, “comprendere”, “essere coscienti” — domande che la Parte I ha lasciato sullo sfondo ma che diventano centrali quando si parla di AGI, allineamento, superintelligenza. E con la Parte III — Intelligenza umana e scienze cognitive, per esaminare ciò che sappiamo della cognizione umana (memoria, attenzione, percezione, linguaggio, ragionamento, apprendimento), perché è solo conoscendo la cognizione che abbiamo davvero studiato che possiamo leggere criticamente ciò che chiamiamo “intelligenza artificiale” oggi e nei prossimi anni. Le due parti sono prerequisiti concettuali per leggere il resto della wiki, non semplici interludi: senza un decoder rigoroso di cosa intendiamo per “mente” e per “cognizione”, il termine “intelligenza artificiale” resta un’etichetta di marketing, non una categoria operativa.