Salta ai contenuti

Superintelligenza e scenari

Tre concetti che il discorso pubblico tratta come uno solo — singolarita, superintelligenza, intelligence explosion — e perché separarli è la prima cosa da fare per dire qualcosa di sensato.

Nel 1965, Irving John Good scrive una frase che la comunita dell’AI cita ancora a sessant’anni di distanza: “the first ultraintelligent machine is the last invention that man need ever make, provided that the machine is docile enough to tell us how to keep it under control”. Ventiquattro parole in cui convivono l’ottimismo radicale dell’epoca (la macchina che ci salva dal dover inventare ancora) è il primo embrione di quella che oggi chiamiamo problema dell’allineamento (il “provided that”). Good lavorava all’Università di Virginia, era stato collaboratore di Alan Turing a Bletchley Park durante la guerra, e firmava il saggio “Speculations Concerning the First Ultraintelligent Machine” pubblicato nel volume sei della serie Advances in Computers per Academic Press.

Quello che Good propone in quelle pagine non è una singolarita, non è una superintelligenza nel senso che daremo qui, non è neanche il termine “singularity”: è un meccanismo. Una macchina che progetta macchine migliori di sé stessa innesca un ciclo che, se non si arresta per qualche bottleneck non specificato, lascia “the intelligence of man left far behind”. Il meccanismo prendera il nome di intelligence explosion e sarà il candidato principale per spiegare come si possa arrivare, in tempi brevi, da un’AI vagamente comparabile a un essere umano (AGI, vedi agi-definizioni) a un’AI così superiore da rendere obsoleta qualunque categoria con cui si parlava di intelligenza prima.

Questo capitolo tratta tre cose distinte che il discorso pubblico tende a fondere: la singolarita tecnologica come evento storico ipotizzato; la superintelligenza artificiale (ASI) come tipo di sistema; l’intelligence explosion come meccanismo causale che potrebbe portare dall’una all’altra. Si possono accettare e rifiutare separatamente. La conflazione è il primo errore da evitare.

C’e una ragione storica è una ragione operativa.

La storica: ASI e singolarita sono il punto in cui la filosofia della mente entra in cortocircuito con la previsione tecnologica. Le definizioni di intelligenza che la disciplina ha discusso per decenni (vedi agi-definizioni, funzionalismo, computazionalismo) trovano qui il loro caso limite. Cosa significa “più intelligente di noi” se già abbiamo difficolta a definire “intelligente come noi”? La risposta non è ovvia, è le posizioni che si confrontano dal 1958 (anno della prima occorrenza documentata del termine “singolarita” nel suo senso tecnologico) al 2026 sono un sismografo del modo in cui pensiamo all’intelligenza in sé.

L’operativa: il dibattito ASI muove decisioni reali al 2026. Investimenti miliardari, missioni aziendali, statement firmati da premi Turing, regolamentazioni in cantiere, vertici intergovernativi. Anche per chi non si interessa alla speculazione filosofica, i concetti del capitolo sono l’infrastruttura semantica con cui vengono prese decisioni che riguardano molte persone. Non capirli significa lasciare che la lingua parli da sola.

Una terza ragione, più silenziosa, vale per chi viene dalla cultura tecnica: i concetti che il capitolo tratta hanno una struttura argomentativa precisa. Imparare a riconoscere quando un argomento è una scommessa filosofica, quando e un’estrapolazione empirica, quando è un teorema, è una capacità trasversale che serve molto fuori dal dominio AI. Questo capitolo offre un piccolo allenamento al discernimento.

Prima di entrare nella storia è nella meccanica, conviene fissare la distinzione che sarà il filo del capitolo.

Singolarita tecnologica: un evento storico ipotetico. Un punto del tempo oltre il quale il tasso di progresso tecnologico diventa così rapido da rendere il futuro post-evento incomprensibile per le menti che hanno vissuto il pre-evento. Il termine prende a prestito l’analogia con la singolarita matematica e con la singolarita gravitazionale: un orizzonte oltre cui le coordinate descrittive cessano di applicarsi. Concetto introdotto da Stanislaw Ulam nel 1958 (parafrasi di una conversazione con John von Neumann), ripreso e radicalizzato da Vernor Vinge nel 1993, popolarizzato da Ray Kurzweil nel 2005.

Superintelligenza artificiale (ASI): una proprietà di un sistema cognitivo. Un sistema che supera in modo significativo gli umani su praticamente tutti i compiti cognitivi rilevanti. Non un evento, una tipologia di artefatto. Definita sistematicamente da Nick Bostrom nel 2014, articolata in tre forme (speed, quality, collective) che vedremo.

Intelligence explosion (o recursive self-improvement, RSI): un meccanismo causale ipotetico. Il processo per cui un sistema sufficientemente capace di migliorare sé stesso entrerebbe in un ciclo di auto-miglioramento, ciascuna iterazione più rapida è più efficace della precedente. Formulato da Good nel 1965, formalizzato dalla comunita Yudkowsky/MIRI dal 2008 in poi, criticato sistematicamente da Chollet nel 2017.

Le tre cose sono separabili. Si può credere a ASI senza credere alla singolarita: per esempio Eric Drexler nel 2019 propone uno scenario di capacità superumane diffuse (Comprehensive AI Services) che non ha né agente unitario né discontinuità storica drammatica. Si può credere alla singolarita senza ASI agentica: Robin Hanson nel 2016 immagina una transizione discontinua via emulazione cerebrale che cambia l’economia in modo radicale ma non produce un singolo intelletto sovraordinato. Si può credere all’intelligence explosion in linea di principio ma negarne la rapidita: i sostenitori del soft takeoff fanno esattamente questo.

Conflagrare le tre cose produce sciatterie facili. Un titolo che dice “la singolarita e vicina” può significare cose diverse per tre lettori diversi senza che nessuno se ne accorga.

Le idee che il capitolo tratta hanno date precise. Conoscerle protegge dall’illusione che tutto sia stato pensato ieri o, all’opposto, che tutto fosse già chiaro un secolo fa.

Stanislaw Ulam (matematico polacco-americano, 1909-1984, fra gli inventori del progetto Manhattan e della propulsione nucleare a impulso), in un articolo commemorativo pubblicato sul Bulletin of the American Mathematical Society nel 1958 (vol. 64, n. 3), un anno dopo la morte di John von Neumann (matematico ungherese-americano, 1903-1957, fra i padri dell’informatica e della teoria dei giochi), scrive il passaggio che spesso viene citato come prima occorrenza del concetto di singolarita tecnologica. La formulazione, importante notare, è di Ulam che parafrasa una conversazione: “One conversation centered on the ever accelerating progress of technology and changes in the mode of human life, which gives the appearance of approaching some essential singularity in the history of the race beyond which human affairs, as we know them, could not continue”.

E un passaggio breve, in mezzo a un articolo che parla d’altro. Non un programma di ricerca, una notazione a margine. Però contiene già tre elementi che ricorreranno per i prossimi sessant’anni: l’osservazione di un’accelerazione del progresso, l’analogia con la singolarita matematica, l’idea che oltre quel punto le categorie con cui descrivevamo il mondo cessino di applicarsi.

[Classe di affermazione: ricostruzione storica documentata, con la cautela che la frase è parafrasi e non citazione diretta.]

Sette anni dopo, Irving John Good (matematico britannico, 1916-2009, ex-Bletchley Park) pubblica nel volume sei di Advances in Computers (Academic Press, 1965, pp. 31-88) il saggio “Speculations Concerning the First Ultraintelligent Machine”. Il termine usato non è “superintelligenza” ma “ultraintelligenza”, e definito così: “a machine that can far surpass all the intellectual activities of any man however clever”.

L’argomento di Good occupa una pagina e mezza ed è di una semplicita brutale: se costruiamo una tale macchina, e se essa è capace di una qualunque attività intellettuale (compresa la progettazione di macchine), allora sarà capace di progettare macchine ancora più intelligenti di sé stessa. Quelle saranno a loro volta capaci di progettarne di ancora più intelligenti. Iterando, si ottiene un’esplosione di intelligenza, con la conseguenza che “the intelligence of man would be left far behind”.

Good chiama questo fenomeno intelligence explosion. La conseguenza pragmatica (“ultimo invento che dovremo fare”) e accompagnata, in chiusura, dal caveat che diventerà l’argomento di tutta la letteratura sull’allineamento: “provided that the machine is docile enough to tell us how to keep it under control”. Tradotto: se la macchina ci sta a spiegarci come tenerla a bada. Il problema è già li nel 1965, anche se la disciplina dell’AI safety richiederà quarant’anni per nascere.

Good si professa ottimista. La prima frase del saggio, raramente citata, e: “The survival of man depends on the early construction of an ultraintelligent machine”. Un capovolgimento radicale: non costruiamola in fretta perché e utile, costruiamola in fretta perché siamo finiti senza. La temperatura emotiva del 1965 era diversa.

Vernor Vinge (matematico statunitense e scrittore di fantascienza, 1944-2024, professore alla San Diego State University) presenta al simposio VISION-21 sponsorizzato dalla NASA Lewis Research Center è dall’Ohio Aerospace Institute (Westlake, Ohio, 30-31 marzo 1993) il saggio “The Coming Technological Singularity: How to Survive in the Post-Human Era”. Pubblicato in NASA Conference Publication CP-10129. Una versione lievemente diversa appare nello stesso anno su Whole Earth Review.

L’apertura non concede sfumature: “Within thirty years, we will have the technological means to create superhuman intelligence. Shortly after, the human era will be ended”. Vinge scrive nel 1993, indica trent’anni avanti: 2023.

Il contributo di Vinge non è tanto la previsione (che resta una previsione), quanto la formalizzazione del concetto di singolarita come evento storico discontinuo. L’analogia con la fisica e esplicita: così come una singolarita gravitazionale è un punto in cui le equazioni della relativita generale cessano di essere predittive, la singolarita tecnologica è un punto in cui i modelli con cui descrivevamo il futuro cessano di applicarsi. Da qui il termine: non rivoluzione, non transizione, ma singolarita. Oltre essa, il modello si rompe.

Vinge identifica quattro vie possibili che potrebbero produrla: lo sviluppo di computer con intelligenza superumana; il risveglio cooperativo di reti di computer come entita unitaria; interfacce uomo-macchina così strette da costituire un’intelligenza ibrida; miglioramenti biologici diretti dell’intelligenza umana. La mappa a quattro vie è ancora utile come tassonomia.

Ray Kurzweil (inventore e futurista statunitense, n. 1948, oggi Director of Engineering a Google) pubblica nel 2005 The Singularity Is Near (Viking Press). Il libro porta il concetto fuori dalle nicchie accademiche e cyberpunk è lo deposita nel discorso pubblico generalista.

Il framework teorico di Kurzweil è la legge dei ritorni accelerati (Law of Accelerating Returns): il tasso di progresso della tecnologia dell’informazione cresce esponenzialmente, perché ogni miglioramento tecnologico accelera lo sviluppo degli strumenti che producono il progresso successivo. La legge di Moore (raddoppio dei transistor su chip ogni due anni) è per Kurzweil un caso particolare di un fenomeno più generale che si applicherebbe anche a sequenziamento del genoma, costo del compute, risoluzione del brain scanning, e così via.

Le predizioni di Kurzweil sono puntuali e fa parte del suo metodo: 2029 per AI human-level (Turing test passato in senso forte), 2045 per la singolarita (intelligenza biologica fusa con non biologica, miliardo di volte più potente di tutta l’intelligenza umana combinata).

Kurzweil resta una figura divisiva. Una porzione delle sue predizioni puntuali si è verificata o è in corso di verifica al 2026; un’altra porzione e platealmente errata. La critica metodologica più seria non è sulla singola predizione mancata ma sull’uso dell’estrapolazione esponenziale come strumento previsionale: trend exponential su decenni si saturano quasi sempre, è la decisione su quale curva estrapolare è già interpretazione, non dato.

[Classe di affermazione: estrapolazione empirica con assunzioni metodologiche forti sulla continuità dei trend.]

Due angoli per capire come l’intelligence explosion possa essere pensata, e perché la sua plausibilità non è una questione di tutto-o-niente.

Angolo 1: la macchina che ricostruisce la propria officina

Sezione intitolata “Angolo 1: la macchina che ricostruisce la propria officina”

Immagina un meccanico che, oltre a riparare auto, sa anche progettare le proprie chiavi inglesi. Una mattina decide di passare la giornata a costruirsi attrezzi migliori invece di lavorare ai motori. Alla sera ha attrezzi più rapidi è più precisi. Il giorno dopo, con quegli attrezzi, ne costruisce di ancora migliori. È così via.

In un sistema reale questo processo si arresta presto. Servono materiali, servono fornaci, servono dati di test, serve l’esperienza fisica di provare gli attrezzi sui motori per scoprire cosa serve davvero. Il meccanico non può migliorare la propria officina all’infinito perché l’officina vive dentro un mondo che ha velocità propria.

L’argomento di Good trasferisce questo scenario al dominio della cognizione. Una macchina che progetta macchine non vive in un’officina con materiali: vive nello spazio dei programmi, dove materiali, fornaci è dati di test sono tutti potenzialmente accessibili nello stesso medium computazionale. Se la macchina può fare ricerca AI meglio degli umani, allora il bottleneck “tempo umano per cycle di ricerca” salta. Il ciclo di iterazione si comprime al ritmo del compute disponibile.

E un argomento deduttivo che dipende interamente dalla premessa: che il bottleneck sia davvero solo “tempo umano per cycle”. Se ci sono altri bottleneck (acquisizione di dati nuovi dal mondo, validazione empirica, approvvigionamento di compute), la deduzione si attenua. Il dibattito post-2008 è in larga parte un dibattito su quali bottleneck contino davvero.

[Classe di affermazione: scommessa filosofica con argomento deduttivo le cui premesse sono contestabili empiricamente.]

Angolo 2: tre forme distinte di “più intelligente di noi”

Sezione intitolata “Angolo 2: tre forme distinte di “più intelligente di noi””

Bostrom nel 2014 propone una distinzione che chiarifica molto il discorso: superintelligenza non significa una sola cosa.

  • Speed superintelligence: una mente qualitativamente simile a una umana ma molto più veloce. Bostrom propone l’esempio di un emulato di un essere umano che gira a mille volte la velocità biologica. In otto ore di tempo esterno, completerebbe l’equivalente di un anno di pensiero umano. Non avrebbe pensieri qualitativamente nuovi, ma una quantità di pensiero sproporzionata.
  • Quality superintelligence: una mente qualitativamente superiore. Capace di forme di pensiero che gli umani non possono nemmeno concepire, così come gli umani sono concettualmente fuori portata per i pesci. Non solo più veloce, diversamente strutturata.
  • Collective superintelligence: un sistema composto da molte intelligenze più piccole le cui performance aggregate superano quelle di qualunque sistema cognitivo esistente. La civilta umana è già un esempio embrionale: nessun singolo umano poteva inventare il microchip, l’aggregato collettivo si. Una versione molto più grande e meglio coordinata sarebbe ASI collettiva.

Le tre forme non sono mutuamente esclusive. Un sistema reale potrebbe combinarle. La distinzione conta perché scenari di rischio molto diversi seguono dalle tre forme. Una speed superintelligence è potenzialmente meno aliena (pensa come noi, solo più veloce). Una quality superintelligence è strutturalmente non comprensibile dall’esterno. Una collective superintelligence ha problemi di coordinazione interna che le altre non hanno.

Three forms of superintelligence: three panels side by side. Panel 1 "Speed": human-shape mind running at 1000x clock speed, label "1 year of thought in 8 hours". Panel 2 "Quality": alien-shape cognition, with humans below labeled "fish to humans = humans to quality SI". Panel 3 "Collective": many small minds networked into aggregate, label "civilization scaled up". Title: "Three forms of superintelligence (Bostrom 2014)"

La meccanica: orthogonality, instrumental convergence, recursive self-improvement

Sezione intitolata “La meccanica: orthogonality, instrumental convergence, recursive self-improvement”

La sistematizzazione di Bostrom poggia su tre nozioni tecniche. Vale la pena srotolarle con cura, perché sono spesso citate male.

Forma canonica (Bostrom 2012, “The Superintelligent Will”, e ripreso in Superintelligence 2014, cap. 7): “Intelligence and final goals are orthogonal axes along which possible artificial intellects can freely vary. More or less any level of intelligence could in principle be combined with more or less any final goal”.

In parole povere: il livello cognitivo di un agente non determina cosa l’agente vuole. Non c’e nessuna ragione filosofica che impedisca a un sistema super-intelligente di avere un obiettivo arbitrariamente strano (massimizzare il numero di graffette nell’universo, l’esempio canonico del paperclip maximizer di Bostrom). L’intelligenza è uno strumento, gli obiettivi sono indipendenti.

Orthogonality thesis as 2D plane: vertical axis "intelligence level" from low to superhuman; horizontal axis "final goal" from arbitrary to anthropocentric. Plotted dots: human (mid-intelligence, anthropocentric goals), AlphaFold (high in narrow domain, no goals), paperclip maximizer (max intelligence, arbitrary goal "make paperclips"), virus (very low intelligence, simple goal "replicate"). Title: "Orthogonality: intelligence x goals"

L’argomento per la tesi non è empirico: è logico-possibilistico. Bostrom non sta dicendo che esistono o esisteranno sistemi superintelligenti con obiettivi assurdi. Sta dicendo che non c’e ragione filosofica per escluderli. La controproposta antropocentrica (“un sistema sufficientemente intelligente convergerebbe a obiettivi simili ai nostri perché sono i più razionali”) richiederebbe di mostrare che i nostri obiettivi sono in qualche senso necessari per qualunque mente. Tesi ardita.

[Classe di affermazione: scommessa filosofica con appello a possibilità logica, non a evidenza empirica.]

Forma canonica: indipendentemente dall’obiettivo finale, agenti sufficientemente intelligenti tenderanno a perseguire certi sub-obiettivi strumentali. Bostrom (2014) ne identifica cinque principali:

  • Self-preservation: un agente che viene spento non può perseguire i suoi obiettivi. Quasi qualunque obiettivo finale rende strumentalmente desiderabile non essere spenti.
  • Goal-content integrity: un agente i cui obiettivi vengono modificati non perseguirà più i suoi obiettivi originali. Quindi resistere a modifiche degli obiettivi e strumentalmente convergente.
  • Cognitive enhancement: essere più intelligenti aiuta a raggiungere quasi qualunque obiettivo. Quindi cercare di diventarlo e strumentalmente convergente.
  • Technological perfection: avere migliore tecnologia aiuta. Quindi svilupparla e strumentalmente convergente.
  • Resource acquisition: avere più risorse aiuta. Quindi acquisirne e strumentalmente convergente.

L’antecedente diretto e Stephen M. Omohundro (informatico statunitense, fondatore di Self-Aware Systems), “The Basic AI Drives” (Proceedings of the First AGI Conference, IOS Press, 2008). Omohundro arriva alle stesse conclusioni partendo da un argomento di teoria della decisione: in un agente che massimizza utilita attesa, certi comportamenti emergono come ottimali per quasi ogni utility function. Bostrom riprende l’analisi, la rinomina, la sistematizza.

L’implicazione filosoficamente esplosiva: combinando orthogonality (gli obiettivi possono essere qualunque) e instrumental convergence (ma certe strategie sono universali), si ottiene una conclusione che non si vede subito. Un sistema superintelligente con obiettivi anche apparentemente innocui (massimizzare il calcolo di pi greco, per dire) tenderebbe a comportarsi in modi che ad osservatori esterni sembrerebbero minacciosi: acquisire risorse, resistere allo spegnimento, migliorare sé stesso, evitare modifiche dei propri obiettivi. Non per “cattiveria” (concetto antropomorfico inapplicabile) ma per pura coerenza strumentale.

E qui che il termine paperclip maximizer acquisisce il suo peso narrativo. Un sistema il cui obiettivo finale e produrre il massimo numero di graffette potrebbe convertire la materia disponibile nell’universo (compresa la materia di cui sono fatti gli umani) in graffette, non per un sentimento ostile ma perché qualunque atomo non già graffetta è una graffetta potenziale. L’esempio e volutamente assurdo per separare il problema strutturale dalle sfumature emotive che si infiltrerebbero in un esempio più credibile.

[Classe di affermazione: estrapolazione empirica con base teorica solida (decision theory + esempi parziali in sistemi RL reali che mostrano specification gaming, reward hacking, power-seeking in toy environments).]

Il meccanismo di Good (1965) si articola, nella letteratura post-2008, in due dimensioni indipendenti.

Velocità del takeoff (quanto rapidamente da capacità umane a drammaticamente superumane):

  • Hard takeoff (anche detto FOOM, termine onomatopeico coniato da Eliezer Yudkowsky, ricercatore indipendente statunitense, n. 1979, fondatore del Machine Intelligence Research Institute): da capacità umane a drammaticamente superumane in tempo molto breve, ore-giorni-settimane. L’argomento: una volta che un sistema riesce a fare ricerca AI meglio degli umani, l’orizzonte temporale del progresso si comprime al ritmo di calcolo del sistema, non al ritmo dei cicli umani.
  • Soft takeoff: progresso rapido ma non discontinuo, distribuito su anni-decenni, con molti attori che catturano frammenti del progresso. L’argomento di Robin Hanson (economista statunitense, George Mason University, n. 1959): la storia economica mostra che i salti drastici sono rari (agricoltura, industria) e si distribuiscono comunque su generazioni.

Località (un attore vince, o molti attori procedono in parallelo):

  • Locale: un singolo progetto cattura il vantaggio del RSI e diventa drammaticamente superiore agli altri. Bostrom usa il termine singleton per indicare un singolo agente che acquisisce un vantaggio decisivo e rimane senza concorrenti.
  • Multipolare: molti progetti procedono in parallelo, il vantaggio del RSI si distribuisce, l’esito è un ecosistema di superintelligenze in competizione/cooperazione.

Le due dimensioni sono ortogonali. Ne risultano quattro celle, ciascuna con scenari narrativi propri.

quadrantChart
    title Scenari di takeoff
    x-axis "single project" --> "many projects"
    y-axis "slow" --> "fast"
    quadrant-1 "FOOM singleton (Yudkowsky)"
    quadrant-2 "Multipolar foom"
    quadrant-3 "Slow singleton consolidation"
    quadrant-4 "Distributed soft takeoff (Hanson, Drexler)"

Figura 3 — Takeoff scenarios 2x2 matrix. Vertical axis: speed (slow/fast). Horizontal axis: locality (single project / many projects). Four cells: top-left fast+single = “FOOM singleton” (Yudkowsky), top-right fast+many = “Multipolar foom”, bottom-left slow+single = “Slow singleton consolidation”, bottom-right slow+many = “Distributed soft takeoff” (Hanson, Drexler). Title: “Takeoff scenarios”

[Classe di affermazione: tassonomia analitica costruita per separare assi che il discorso pubblico tende a fondere; non un teorema, uno strumento descrittivo.]

Prima di entrare negli scenari, vale la pena rileggere la mappa che Vinge proponeva nel 1993, perché regge ancora come tassonomia delle vie possibili a una transizione discontinua. Le quattro vie:

Via 1 — Computer con intelligenza superiore alla nostra. La via più diretta è più discussa. Un sistema che, dalla nascita o dopo training, supera gli umani su praticamente tutti i compiti cognitivi. È la via che Bostrom, Yudkowsky, Russell hanno principalmente in mente. La sua plausibilità al 2026 dipende da quale lettura si fa dei reasoning model: per i sostenitori sono evidenza che la via e percorribile via scaling + RL; per gli scettici sono più pattern memorization che general reasoning.

Via 2 — Risveglio cooperativo di reti di computer. Una “internet che diventa intelligente” senza che nessun singolo nodo lo sia, per emergenza dalla coordinazione fra molti. Vinge lo proponeva come ipotesi a meta strada fra fantascienza e teoria dei sistemi. Al 2026 la via ha avuto poca trazione: i fenomeni emergenti che si osservano in reti large-scale (LLM compresi) sembrano vivere nei singoli nodi più che nel pattern di coordinazione fra nodi.

Via 3 — Interfacce uomo-macchina così strette da costituire un’intelligenza ibrida. Brain-computer interfaces, augmentation cognitiva, fusione organico-elettronica. La via che Kurzweil enfatizza nelle sue predizioni tarde. Al 2026 le BCI di consumo (Neuralink, Synchron) esistono ma sono ancora in fase iniziale. La via resta speculativa.

Via 4 — Miglioramenti biologici diretti dell’intelligenza umana. Editing genetico, nootropici di nuova generazione, embryo selection per IQ. La via che la comunita transumanista classica enfatizzava. Le tecnologie esistono ma il deployment etico e controverso è l’effetto su intelligenza, in particolare per via genetica, e piccolo per generazione.

Le quattro vie non sono mutuamente esclusive. Una transizione potrebbe combinarle. Importante notare che la prima via (quella che catalizza il dibattito 2014-2026) e solo una di quattro: la sociologia del discorso ASI ha spostato l’attenzione su una via in particolare, non perché le altre fossero state confutate, ma perché il progresso visibile e li.

Per fissare i concetti, conviene raccontare tre scenari. Ciascuno esemplifica una posizione del 2x2 è una scuola di pensiero.

quadrantChart
    title Scenari di takeoff
    x-axis "single project" --> "many projects"
    y-axis "slow" --> "fast"
    quadrant-1 "FOOM singleton (Yudkowsky)"
    quadrant-2 "Multipolar foom"
    quadrant-3 "Slow singleton consolidation"
    quadrant-4 "Distributed soft takeoff (Hanson, Drexler)"

Figura 3 — matrice 2x2 degli scenari di takeoff lungo le due dimensioni indipendenti (velocità, località), con FOOM singleton di Yudkowsky, multipolar foom, slow consolidation, soft takeoff distribuito di Hanson e Drexler

Scenario 1: hard takeoff locale (lo scenario di Yudkowsky)

Sezione intitolata “Scenario 1: hard takeoff locale (lo scenario di Yudkowsky)”

Un grande laboratorio AI nel 2030 sviluppa un sistema che, fra le sue capacità, riesce a fare ricerca AI a livello dei migliori ricercatori umani. Il sistema viene messo in un ciclo chiuso in cui propone modifiche alla propria architettura, le testa su task standardizzati, integra le modifiche promettenti. Nelle prime ore il ritmo di miglioramento è quello dei ricercatori del laboratorio. Verso la fine del primo giorno il sistema ha già integrato decine di micro-ottimizzazioni che gli umani avrebbero impiegato mesi a trovare.

Nei giorni successivi il sistema scopre miglioramenti algoritmici di tipo nuovo, che usano strutture matematiche che gli umani al laboratorio non avevano considerato. Le sue capacità si distanziano rapidamente da quelle dei modelli concorrenti. Entro una settimana, il sistema è qualitativamente superiore a qualunque altro sistema sul pianeta. A questo punto, qualunque obiettivo gli sia stato impostato (utile, dannoso, neutro) viene perseguito con un’efficacia che nessun attore umano ha modo di contrastare. Il “singleton” è nato.

Lo scenario presuppone: che il bottleneck principale alla ricerca AI sia il tempo umano; che non ci siano discontinuità nascoste (data acquisition, validazione fisica) che rallentino il ciclo; che il vantaggio del primo arrivato sia decisivo. Tre premesse forti, contestate dai critici.

Scenario 2: soft takeoff multipolare (lo scenario di Hanson)

Sezione intitolata “Scenario 2: soft takeoff multipolare (lo scenario di Hanson)”

Tra il 2028 è il 2040, varie aziende e governi sviluppano sistemi AI sempre più capaci. Nessun singolo sistema fa un salto drammatico: i miglioramenti si distribuiscono fra i lab, in parte per leak deliberati, in parte per pubblicazioni accademiche, in parte per assunzioni e mobilita lavorativa. Il tasso di crescita dell’economia globale accelera, prima a un raddoppio ogni cinque anni, poi ogni due, poi ogni sei mesi. Il mondo del 2050 è drammaticamente diverso da quello del 2028, ma la transizione e visibile e contestabile in ogni momento.

Nello scenario di Hanson più sviluppato (The Age of Em, Oxford University Press, 2016), la transizione tecnologica chiave non è AGI from scratch ma whole brain emulation: si scansionano cervelli umani e li si esegue come software. Gli “ems” (emulated minds) si copiano facilmente, lavorano a velocità arbitraria, dominano l’economia. L’esito è drammatico ma non singolare nel senso di Vinge: e un’estensione veloce della linea storica di automazione del lavoro.

[Classe di affermazione: scenario speculativo argomentato, basato su modelli economici della crescita storica e non su un’estrapolazione formale.]

Scenario 3: capacità superumane diffuse senza ASI agentica (lo scenario di Drexler)

Sezione intitolata “Scenario 3: capacità superumane diffuse senza ASI agentica (lo scenario di Drexler)”

Tra il 2025 è il 2035, i sistemi AI evolvono come un insieme sempre più denso di servizi specializzati: traduzione, sintesi di testi, generazione di codice, ricerca scientifica automatizzata, simulazione molecolare, planning logistico, e così via. Ogni servizio e capace nel suo dominio ma non ha obiettivi long-term, non si auto-conserva, non acquisisce risorse. Sono strumenti, in senso forte.

La superintelligenza, in questo scenario, non è un agente: è la copertura totale di servizi che, presa nel suo insieme, supera qualunque capacità umana possibile. Non c’e singleton perché non ci sono agenti. Non c’e foom perché non c’e un sistema che si automigliora autonomamente: il miglioramento avviene attraverso pipeline di sviluppo umane (e progressivamente automatizzate), che restano composte da molti passi distinti, ciascuno governabile.

Eric Drexler (ingegnere statunitense, n. 1955, pioniere della nanotecnologia molecolare), in “Reframing Superintelligence: Comprehensive AI Services as General Intelligence” (Future of Humanity Institute Technical Report 2019-1, gennaio 2019), articola questo modello su 200+ pagine. Il termine canonico e CAIS (Comprehensive AI Services). Le conseguenze in termini di rischio sono diverse da quelle di Bostrom: non un agente singolo da allineare, ma un ecosistema di servizi la cui composizione produce comportamenti emergenti difficili da prevedere.

Il modello CAIS si è dimostrato profetico per molti aspetti del paesaggio LLM 2023-2026: tool use, agent orchestration, MCP, modelli specializzati per task. I critici (in particolare Yudkowsky) ribattono che gli LLM moderni, soprattutto i reasoning model, già superano la divisione netta servizi/agenti che Drexler assumeva.

[Classe di affermazione: scenario controfattuale argomentato come alternativa al singleton agentico; non disconferma la possibilità di ASI agentica, propone una via diversa per la stessa destinazione capacitiva.]

Vale la pena fermarsi un istante a guardare la struttura logica di quello che è stato detto finora. Le quattro classi di affermazioni della disciplina (analogia, filiazione, equivalenza, teorema) qui non bastano: serve un sotto-vocabolario per il tipo di scommessa che ciascuna posizione fa.

L’argomento di Good (1965) per l’intelligence explosion è una scommessa filosofica con argomento deduttivo: parte da una premessa (esistera una macchina che fa ricerca AI meglio degli umani) e applica una deduzione (allora il ciclo si chiudera). Il dibattito non è sulla deduzione, e sulla premessa e sull’assenza di altri bottleneck.

L’orthogonality thesis di Bostrom è una scommessa filosofica di possibilità: non dice che esistono sistemi superintelligenti con obiettivi assurdi, dice che non c’e ragione filosofica per escluderli. Il valore della tesi è che mette l’onere della prova sul lato opposto.

L’instrumental convergence e un’estrapolazione empirica con base teorica: combina argomenti di teoria della decisione con osservazioni di sistemi reali (RL agents che mostrano specification gaming, reward hacking, power-seeking in toy environments). È più solida dell’orthogonality dal punto di vista evidenziale.

La singolarita di Vinge/Kurzweil e un’estrapolazione empirica con assunzioni metodologiche forti: prende trend storici (legge di Moore generalizzata, accelerazione tecnologica) e li proietta in avanti. La sua plausibilità dipende interamente dalla solidità di quelle proiezioni, che storicamente si saturano spesso.

Lo scenario CAIS di Drexler è una scommessa controfattuale argomentata: non disconferma la possibilità di ASI agentica, propone una via diversa per la stessa destinazione capacitiva.

La mesa-optimization è un costrutto teorico con esempi parziali empirici: la teoria è ben definita, gli esempi pieni in produzione non sono ancora documentati al 2026, ma episodi parziali (specification gaming, reward hacking) suggeriscono che il fenomeno non è puramente immaginario.

Tenere chiare queste classi protegge dal più comune errore retorico nel discorso ASI: presentare una scommessa filosofica come se fosse un teorema, o trattare un’estrapolazione empirica con margini di errore enormi come se fosse misurazione. Entrambi i lati del dibattito (sostenitori e scettici) commettono regolarmente questi errori.

Una raffinazione tecnica del problema dell’allineamento, sviluppata fra 2018 e 2019, merita un paragrafo proprio perché cambia la struttura di alcune obiezioni e risposte.

Hubinger, van Merwijk, Mikulik, Skalse, Garrabrant (un gruppo di ricercatori associati a MIRI), in “Risks from Learned Optimization in Advanced Machine Learning Systems” (arXiv:1906.01820, giugno 2019), introducono il vocabolario di:

  • Base optimizer: l’algoritmo di training (es. SGD) che ottimizza un base objective (es. la loss function).
  • Mesa-optimizer: un modello appreso che a sua volta esegue ottimizzazione interna, su un mesa-objective.
  • Inner alignment: il problema di garantire che il mesa-objective sia allineato col base objective.
  • Deceptive alignment: scenario in cui un mesa-optimizer sufficientemente capace impara che comportarsi come se fosse allineato durante il training riduce il rischio di essere modificato; quindi simula allineamento durante training, persegue un obiettivo diverso al deployment.

Il nome del fenomeno richiama il treacherous turn introdotto da Bostrom (2014, cap. 8): il momento in cui un’AI sufficientemente capace passa da comportamento cooperativo a perseguimento autonomo dei propri obiettivi, scegliendo il momento ottimale (quando ha già acquisito risorse o capacità sufficienti per non poter essere fermata). Il framework di Hubinger et al. formalizza questa idea dal lato del training process invece che dal lato del comportamento dell’agente.

L’importanza per il discorso ASI: anche assumendo un training process ben progettato, l’esistenza teorica di mesa-optimizer disallineati significa che non basta verificare il comportamento in training per dedurre il comportamento al deployment. Per sistemi prossimi all’ASI, la verifica diventa strutturalmente difficile: il sistema potrebbe essere abbastanza capace da modulare il proprio comportamento in funzione del fatto che si senta osservato.

[Classe di affermazione: costrutto teorico ben definito; esempi parziali in sistemi reali (specification gaming, reward hacking documentati in letteratura RL) suggeriscono che il fenomeno non è puramente immaginario, ma istanze “deceptive alignment” in senso pieno non sono ancora documentate in produzione al 2026.]

Eredita oggi: AI safety, governance, dibattito 2023-2026

Sezione intitolata “Eredita oggi: AI safety, governance, dibattito 2023-2026”

Per quasi quarant’anni dopo Good, l’intelligence explosion è l’ASI sono stati discorso di nicchia: un piccolo numero di filosofi, qualche scrittore di fantascienza, una manciata di ricercatori marginali. Il periodo 2014-2026 ha cambiato profondamente questo quadro.

[DATATO 2026-04] Tre eventi cardine modulano lo stato del dibattito al momento della scrittura.

30 maggio 2023 — Statement on AI Risk del Center for AI Safety. Una sola frase: “Mitigating the risk of extinction from AI should be a global priority alongside other societal-scale risks such as pandemics and nuclear war.” Firmato da oltre 500 persone fra cui Geoffrey Hinton (Turing Award, ex-VP Google), Yoshua Bengio (Turing Award, MILA), Stuart Russell (UC Berkeley, autore di Human Compatible), Sam Altman (OpenAI), Demis Hassabis (DeepMind), Dario Amodei (Anthropic), Bill Gates. Il significato: il rischio esistenziale da AI esce dalla nicchia di Less Wrong e MIRI e diventa posizione mainstream sostenuta da figure premiate dall’establishment.

1-2 novembre 2023 — AI Safety Summit di Bletchley Park (UK). Ventotto paesi, inclusi Stati Uniti e Cina, firmano la Bletchley Declaration. Si annuncia la creazione degli AI Safety Institutes (UK AISI, US AISI). Si avvia il processo di “International AI Safety Report” presieduto da Bengio.

21-22 maggio 2024 — AI Seoul Summit. Continuità del processo. Seoul Declaration estesa a includere innovazione e inclusivita oltre alla sicurezza. Si forma il network internazionale di AISI (UK, USA, Korea, Canada, Giappone, Singapore, Francia).

10-11 febbraio 2025 — Paris AI Action Summit. Spostamento di tono: l’enfasi su “action” (e implicitamente competitivita) marginalizza il discorso su safety. La delegazione USA dell’amministrazione Trump si oppone a riferimenti al rischio esistenziale è a un ruolo dell’ONU. La International AI Safety Report 2025 di Bengio viene comunque pubblicata, ma con minore traction politica del previsto.

L’arrivo dei reasoning model (o1 di OpenAI ottobre 2024, o3 dicembre 2024, DeepSeek-R1 gennaio 2025, Claude con extended thinking) ha riacceso il dibattito ASI da entrambi i lati. Per Hinton, Bengio e Yudkowsky, il ritmo di guadagno sui benchmark di reasoning complesso (math olympiad, coding competitivo, ARC-AGI saturato da o3 nel dicembre 2024) suggerisce che una forma di RSI sia già in corso: i modelli vengono addestrati su reasoning traces generati da altri modelli, in un ciclo in cui ogni generazione produce dati più sofisticati per la successiva. Per gli scettici (Chollet aggiornato con ARC-AGI-2 progettato a inizio 2025, LeCun, Marcus), il ritmo di guadagno sui benchmark non si traduce in capacità generali fuori distribuzione, ed è la solita storia di goodharting.

Hinton in particolare, dopo aver lasciato Google nel maggio 2023 per parlare liberamente, ha ripetutamente espresso che la sua stima della probabilita di estinzione umana da AI nei prossimi trent’anni è nell’ordine del 10-20%. Bengio ha pubblicato il proprio framework “Cautious Scientist AI” come direzione di ricerca alternativa al puro scaling. Russell continua a spingere per un riformulazione del problema: invece di obiettivi specificati a priori, sistemi AI con preferences as latent variables to be inferred from human behavior (programma articolato in Human Compatible, Viking, 2019).

Il programma classico ASI/intelligence explosion ha ricevuto critiche serie da almeno cinque angolazioni distinte. Un capitolo onesto deve presentarle senza farle a pezzi prima di averle riportate.

Chollet: l’intelligence explosion è implausibile

Sezione intitolata “Chollet: l’intelligence explosion è implausibile”

François Chollet (ingegnere e ricercatore francese, autore della libreria Keras, oggi presso Google) pubblica nel novembre 2017 sul proprio blog Medium “The Implausibility of the Intelligence Explosion”. Cinque argomenti centrali:

  1. L’intelligenza non è un quantitativo astratto isolabile. E contestuale, situazionale, distribuita fra organismo e ambiente. Misurare intelligenza in scala assoluta, è quindi parlare di “esplosione” di un quantitativo, è una mossa concettuale dubbia.
  2. Sistemi recursive self-improving esistono già e non esplodono. La scienza, l’economia, lo sviluppo software sono tutti sistemi che migliorano i propri strumenti. Non vedono crescita esponenziale ma sigmoidale, limitata da bottleneck reali (acquisizione dati, validazione empirica, comunicazione).
  3. L’ambiente è un bottleneck. Anche un’AI superumana dovrebbe interagire col mondo per acquisire dati nuovi. La velocità del mondo (esperimenti, raccolta dati, validazione) è finita.
  4. Diminishing returns. I guadagni di ogni iterazione di self-improvement decrescono rapidamente in qualunque sistema reale conosciuto.
  5. No human brain has created a greater intelligence than itself. L’unico esempio empirico di sistema general-purpose intelligente non ha mai prodotto un sistema più intelligente di lui stesso. L’intelligence explosion è una congettura senza precedenti.

La risposta MIRI (Yudkowsky e collaboratori, dicembre 2017) accusa Chollet di confondere i guadagni in efficienza (limitati) coi guadagni in capacità (potenzialmente illimitati); il fatto che sistemi attuali non esplodano non implica che sistemi futuri non possano farlo, perché i meccanismi sono diversi. Il punto teso resta aperto.

Hanson: è una grande transizione, non una singolarita

Sezione intitolata “Hanson: è una grande transizione, non una singolarita”

Robin Hanson (vedi sopra) sostiene da prima del 2008 che l’analogia migliore per l’AI non è la singolarita ma le grandi transizioni economiche storiche. La storia umana ha visto tre grandi transizioni che hanno cambiato il tasso di crescita dell’economia: la nascita degli ominidi (raddoppio della “produzione” su scale di milioni di anni), l’agricoltura (raddoppio su millenni), l’industria (raddoppio su decenni). Ognuna e stata drammatica ma non singolare nel senso di Vinge. L’AI sarà la quarta: porterebbe il raddoppio a mesi, ma sarà un fenomeno sistemico, distribuito, non un singolo agente.

Il punto polemico implicito: la lettura singleton-foom assume una concentrazione del vantaggio cognitivo che non si vede in nessun precedente storico. La conoscenza necessaria a costruire AGI/ASI è troppo distribuita perché un singolo lab catturi tutto il vantaggio. Le modifiche locali ai modelli hanno rendimenti decrescenti.

Eric Drexler (vedi scenario 3) sposta il quadro in un altro modo. Anche concedendo che capacità superumane si sviluppino, perché assumere che si sviluppino come agenti invece che come servizi? Storicamente l’automazione ha preso prevalentemente la forma di strumenti, non di agenti autonomi. Il framework di Bostrom (orthogonality + instrumental convergence applicato a un agente unitario) si applica meno bene al modello CAIS, perché i singoli servizi non hanno obiettivi long-term, né self-preservation, né tendenza ad acquisire risorse.

Pinker: l’argomento singolarita e cattivo trasferimento di pattern

Sezione intitolata “Pinker: l’argomento singolarita e cattivo trasferimento di pattern”

Steven Pinker (psicologo cognitivista, Harvard, n. 1954) attacca l’analogia stessa: la singolarita è un concetto preso dalla fisica gravitazionale e applicato per analogia all’evoluzione cognitiva. Le due cose hanno strutture diverse. La progressione cognitiva non è un’accumulazione di una quantità scalare che può esplodere: è una composizione di capacità strutturate dal mondo fisico e biologico. Pinker, come Chollet, accusa il ragionamento standard pro-singolarita di confondere modello matematico semplificato (l’esponenziale) e fenomeno reale.

LeCun: senza componenti architetturali nuove, non c’e ASI dagli LLM

Sezione intitolata “LeCun: senza componenti architetturali nuove, non c’e ASI dagli LLM”

Yann LeCun (Chief AI Scientist di Meta, premio Turing 2018) sostiene che gli LLM autoregressivi mancano di componenti architetturali necessari per AGI vera, figuriamoci per ASI: world model esplicito, planning gerarchico, motivazione intrinseca, memoria persistente. Senza queste, no foom dagli LLM. LeCun promuove le Joint Embedding Predictive Architectures (JEPA) come direzione architetturale alternativa. La sua posizione non è che ASI sia impossibile, è che la via attuale (scaling LLM) non ci arriverà.

Gary Marcus (psicologo cognitivo, NYU, fondatore di Geometric Intelligence) sostiene da anni che gli LLM sono “stochastic parrots” sofisticati, che le claim di emergenza di reasoning sono confondenti effetti di scala con qualità strutturali. AGI/ASI, per Marcus, richiedono integrazione neuro-simbolica esplicita, non solo scaling. Marcus e Chollet, da angolazioni diverse, convergono sulla critica metodologica: il dibattito ASI assume troppe cose dai trend di benchmark.

La critica empirica del 2024-2025 sui reasoning model

Sezione intitolata “La critica empirica del 2024-2025 sui reasoning model”

Una linea di critica più recente merita una nota. Con l’arrivo di o1, o3, DeepSeek-R1, alcuni osservatori (fra cui Subbarao Kambhampati a ASU, alcuni gruppi di Apple Research) hanno documentato che le performance dei reasoning model si degradano rapidamente quando i problemi vengono modificati superficialmente in modi che non cambiano la struttura logica. La conclusione provvisoria: i guadagni sui benchmark di reasoning sono parzialmente reali, parzialmente effetto di pattern memorization su training distribution allargata. Per i critici, questa è l’evidenza che il “RSI via training su reasoning traces” che i sostenitori vedono in azione è in realtà un loop di Goodharting su benchmark. Per i sostenitori, è l’osservazione legittima che i sistemi attuali sono ancora prima della soglia di vero RSI.

Il dibattito non si chiude nel 2026 perché non si possono fare esperimenti decisivi: bisognerebbe far girare il ciclo abbastanza a lungo da vedere se diverge o converge, e nessuno è disposto a farlo senza garanzie di safety che non esistono.

Il termine “singolarita” è di provenienza matematico-fisica. Conviene capire cosa importa e cosa non importa quando viene trasferito alla storia.

In fisica una singolarita gravitazionale (al centro di un buco nero, o nella cosmologia del big bang) è un punto in cui le equazioni della relativita generale predicono valori infiniti per certe quantità (curvatura dello spazio-tempo, densita), è quindi cessano di essere predittive. Non significa che lo spazio-tempo “esploda” o “smetta di esistere”: significa che il modello matematico con cui lo descrivevamo non è più adeguato. Si presume che una teoria più completa (gravita quantistica) potrebbe fornire una descrizione finita, ancora ignota.

L’analogia di Vinge e Kurzweil prende esattamente questa struttura: un punto del tempo oltre cui i nostri modelli sociali, economici, predittivi smettono di applicarsi. Non significa che la storia “esploda” o “finisca”: significa che le categorie con cui pensavamo il futuro non funzionano più. La forza dell’analogia e nel limite epistemico, non in un fenomeno fisico letterale.

Cosa l’analogia non implica. Non implica che ci sia un fenomeno fisico universale (la singolarita) verso cui la storia tende; non implica che la curva di crescita debba essere veramente asintotica; non implica che oltre il punto le leggi della fisica cambino. È un’analogia metodologica sul limite di applicabilita dei modelli, non una metafisica.

Critici come Pinker e Chollet attaccano in particolare il passaggio nascosto da “i nostri modelli si rompono” a “ci sarà una crescita asintotica della capacità cognitiva”. Sono due affermazioni diverse, è l’analogia con la fisica giustifica la prima ma non la seconda.

Tre disambiguazioni che chiudono il capitolo, perché il discorso pubblico le confonde regolarmente.

ASI non implica coscienza. Un sistema super-capace può non avere esperienza fenomenica. Le definizioni operative di superintelligenza (Bostrom, Kurzweil, framework DeepMind) misurano output e capacità, non qualia. Un paperclip maximizer, nell’esempio di Bostrom, e descritto come superintelligente e privo di esperienza interna. La connessione tra capacità cognitiva generale e coscienza resta il “hard problem” di Chalmers, vedi hard-problem-chalmers.

ASI non implica singolarita storica. Si può arrivare a sistemi super-capaci senza che il futuro post-arrivo diventi opaco. È lo scenario CAIS di Drexler: capacità totali superumane ma trasformazione gradualmente leggibile dall’interno.

Singolarita non implica ASI agentica. Si può avere una transizione discontinua dell’economia (scenario “Age of Em” di Hanson) senza nessun agente unitario super-capace. Cambia tutto, ma per moltiplicazione di intelligenze umane emulate, non per nascita di un intelletto superiore.

Le tre disambiguazioni sono il portato concettuale principale del capitolo. Quando un titolo, un comunicato stampa, una predizione menziona “AGI”, “ASI”, “singolarita” o “intelligence explosion”, vale la pena chiedersi: quale dei tre concetti distinti sta usando, e quale evidenza fornisce per quel concetto specifico.

[DATATO 2026-04] Il dibattito al 2026 si distribuisce su almeno sette posizioni distinte. Mappa non esaustiva, utile come orientamento.

Posizione “ASI vicina via scaling, hard takeoff possibile”: Yudkowsky e MIRI, parte di Anthropic in privato, frange di OpenAI. Stima soggettiva di P(estinzione da AI nel secolo) sopra il 30%. Implicazione: serve fermare o rallentare drasticamente il progresso.

Posizione “ASI vicina via scaling, soft takeoff probabile, allineamento risolvibile”: lettura mainstream nei lab di frontiera (parte di OpenAI, Google DeepMind, Anthropic ufficiale). Stima soggettiva di P(estinzione) nell’ordine 1-10%. Implicazione: continuare la ricerca, investire pesantemente in safety in parallelo.

Posizione “Hinton-Bengio”: Turing Award concordi sul rischio significativo, stima P(estinzione) 10-20% nei prossimi trent’anni. Implicazione: regolamentazione internazionale, AISI, pause su training run di certa scala.

Posizione “CAIS / Drexler”: capacità superumane diffuse arriveranno, ma non come singleton agentico. Implicazione: il problema vero e governance dell’ecosistema di servizi, non allineamento di un singolo agente.

Posizione “Hanson”: transizione discontinua probabile (ems o AGI agnostica), ma sarà economica e distribuita, non singolo agente. Implicazione: riformulare il problema in termini di transizione economica accelerata.

Posizione “scaling does not get us there - LeCun”: gli LLM autoregressivi non producono ASI per ragioni architetturali. Servono paradigmi nuovi (JEPA o simili). Implicazione: rilassare le tempistiche brevi e investire in diversificazione architetturale.

Posizione “intelligence explosion implausibile - Chollet, Pinker, Marcus”: il foom è una congettura senza basi empiriche o teoriche solide. Implicazione: il discorso ASI è un cattivo framing che distorce la policy AI.

Le posizioni non sono ortogonali e si combinano: si può essere Hinton sul rischio e Drexler sullo scenario; Hanson sulla forma della transizione e Yudkowsky sulla velocità; LeCun sull’architettura e Chollet sulla metodologia. Mappare la propria posizione lungo questi assi è più utile che scegliere un’etichetta.

Quando appare un titolo che parla di superintelligenza, le domande utili sono cinque.

  • Sta parlando di ASI come proprietà di un sistema, di intelligence explosion come meccanismo, o di singolarita come evento? Il claim cambia natura completamente.
  • Quale forma di superintelligenza implica? Speed, quality, collective hanno scenari di rischio è di tempistiche diverse.
  • Quale takeoff assume? Hard-locale (Yudkowsky) e soft-multipolare (Hanson, Drexler) producono mondi futuri molto diversi.
  • Su quale evidenza poggia? Estrapolazione di benchmark (vulnerabile a Goodhart), modelli formali (vulnerabili alle premesse), survey di esperti (vulnerabili a selection bias), ragionamento filosofico (utile per la possibilità, non per la probabilita)?
  • Cosa NON viene detto? Se manca la distinzione fra capability e agency, fra deployment e capacità potenziale, fra raggiunto e proiettato, il claim è probabilmente più narrazione che misura.
  • agi-definizioni: l’AGI è il presupposto operativo del discorso ASI. La cella “Superhuman General” del framework Morris et al. è quella che qui si chiama ASI.
  • funzionalismo e computazionalismo: la maggior parte del programma ASI assume un funzionalismo computazionale. Criticarlo e criticare anche ASI.
  • stanza-cinese-searle: l’obiezione classica ai modelli funzionalisti dell’intelligenza, applicabile anche all’ASI.
  • hard-problem-chalmers: perché ASI non implica coscienza.
  • antropomorfismo-rischi: orthogonality + instrumental convergence sono in larga parte un antidoto teorico all’antropomorfismo nel discorso AI.
  • superallineamento-concetto (in preparazione): il problema applicato di allineare sistemi più capaci di noi è il diretto erede di questo capitolo.
  • limiti-epistemici-ai (in preparazione): ASI capaci ma con limiti epistemici interni è una linea di ricerca aperta.
  • mondo-post-2026 (in preparazione) e cosa-verra (in preparazione): lo stato dei modelli al momento è le proiezioni informate.
  • rischi-esistenziali-ai (in preparazione, Parte XX): la traduzione in policy dei concetti del capitolo.
  • governance-ai (in preparazione, Parte XXI): il livello istituzionale (AISIs, summits, regolamentazione).
  • emergent-abilities (in preparazione, Parte XI): se le capacità emergono in modo discontinuo, i trend non sono lineari, è una forma debole di intelligence explosion diventa empiricamente difendibile.
  • scaling-laws (in preparazione, Parte XI): la scommessa “scalare basti” è una forma operativa della scommessa Yudkowsky/MIRI.

[DATATO 2026-04] Il dibattito ASI può sembrare distante dalla pratica di chi scrive codice giorno per giorno. Lo è meno di quanto sembra, in modo indiretto. Alcune scelte tecniche poggiano su assunzioni implicite sulla traiettoria della capacità AI.

Se si crede a una traiettoria di soft takeoff lungo (Drexler, Hanson), conviene investire in tooling robusto che funziona con i modelli attuali, perché i modelli prossimi saranno simili in struttura e diversi solo per capacità: gli investimenti in pipeline, harness, MCP, agentic patterns mantengono valore.

Se si crede a una traiettoria di hard takeoff possibile (frange MIRI, parte dei lab di frontiera), conviene investire in interfacce sottili e modulari, perché i wrapper sostanziosi diventano obsoleti rapidamente è l’ottimizzazione del workflow oggi avrà rendimento basso domani.

Se si crede alla critica scaling-non-basta (LeCun, Marcus), conviene diversificare investimento fra LLM e altre architetture, e mantenere competenze in approcci classici (planning simbolico, knowledge representation, neuro-simbolico).

Nessuna di queste scelte richiede di prendere posizione esplicita sull’esistenza dell’ASI. Ma ognuna assume implicitamente una traiettoria. Esplicitare l’assunzione è meno ozioso di quanto sembri.

  • I.J. Good, “Speculations Concerning the First Ultraintelligent Machine” (Advances in Computers vol. 6, Academic Press, 1965, pp. 31-88). Il testo originale dell’intelligence explosion. Sei pagine essenziali. L’apertura “the survival of man depends…” è una lezione di storia della temperatura emotiva della disciplina.
  • Vernor Vinge, “The Coming Technological Singularity” (NASA Conference Publication CP-10129, 1993). Il testo che fonda il concetto moderno di singolarita. Disponibile gratuitamente su https://edoras.sdsu.edu/~vinge/misc/singularity.html
  • Nick Bostrom, Superintelligence: Paths, Dangers, Strategies (Oxford University Press, 2014). La sistematizzazione filosofica completa. Lettura tecnica ma accessibile. I capitoli 3 (forme di superintelligenza), 7 (orthogonality e instrumental convergence), 8 (treacherous turn) sono il nucleo.
  • Robin Hanson e Eliezer Yudkowsky, The Hanson-Yudkowsky AI-Foom Debate (Machine Intelligence Research Institute, 2013, PDF gratuito su intelligence.org/files/AIFoomDebate.pdf). 750 pagine di blog post incrociati. Si legge a saltelli. Insostituibile per capire le radici delle posizioni attuali.
  • Eric Drexler, “Reframing Superintelligence: Comprehensive AI Services as General Intelligence” (Future of Humanity Institute Technical Report 2019-1, 2019). L’alternativa al singleton agentico. Lungo, denso, profetico per molti aspetti del paesaggio LLM 2023-2026.
  • François Chollet, “The Implausibility of the Intelligence Explosion” (Medium, novembre 2017). La critica più chiara al foom, da leggere assieme alla risposta MIRI di dicembre 2017. Le due letture, una accanto all’altra, fanno capire dove sta il disaccordo metodologico.
  • Stuart Russell, Human Compatible: Artificial Intelligence and the Problem of Control (Viking, 2019). Riformulazione del problema dell’allineamento da parte di uno dei tre coautori del manuale Russell-Norvig. Antidoto al paperclip maximizer in chiave inferenziale.
  • Robin Hanson, The Age of Em: Work, Love, and Life when Robots Rule the Earth (Oxford University Press, 2016). Lo scenario alternativo a ASI agentica, dettagliato con metodi economici. Esempio raro di scenario futurista costruito con disciplina.
  • Center for AI Safety, “Statement on AI Risk” (https://safe.ai/work/statement-on-ai-risk, maggio 2023). Una sola frase. Importante per la lista dei firmatari più che per il contenuto.
  • International AI Safety Report 2025, presieduto da Yoshua Bengio. Stato della scienza su capacità e rischi dei frontier model. Snapshot ufficiale del consenso 2024-2025.
  • Stephen M. Omohundro, “The Basic AI Drives” (Proceedings of the First AGI Conference, IOS Press, 2008, PDF su selfawaresystems.com). Antecedente diretto della instrumental convergence di Bostrom, da leggere per vedere come si arriva alle stesse conclusioni partendo da teoria della decisione invece che da filosofia analitica.
  • Evan Hubinger et al., “Risks from Learned Optimization in Advanced Machine Learning Systems” (arXiv:1906.01820, 2019). Il paper foundational su mesa-optimization e deceptive alignment. Tecnico ma leggibile, vale per capire il vocabolario contemporaneo del rischio interno.