Equilibrio, stabilità, attrattori

Un sistema lasciato a sé stesso non vaga a caso: tende verso certi stati e ne evita altri. Questo capitolo dà un nome a quegli stati — equilibri — e una misura alla domanda che conta davvero: cosa succede se li disturbi.

Perché questo capitolo

Nel 1788 James Watt mette in commercio un regolatore a sfere — il governor — che mantiene costante la velocità delle sue macchine a vapore. Funziona così: due masse rotanti si sollevano quando la macchina accelera e, sollevandosi, chiudono una valvola che riduce il vapore. È un anello di controllo elegante, e per decenni nessuno lo studia matematicamente: funziona, basta.

Poi, con l’aumentare della potenza delle macchine, alcuni governor cominciano a comportarsi male. Invece di stabilizzare la velocità, la fanno oscillare: la macchina accelera, il governor corregge troppo, rallenta troppo, il governor corregge di nuovo, e l’oscillazione cresce. Il dispositivo che doveva dare stabilità la toglie.

La domanda “perché un meccanismo di stabilizzazione a volte destabilizza” non è risolvibile guardando le sue parti. Le sfere sono fatte bene, la valvola è fatta bene. Il problema è nel modo in cui le parti si rimandano segnali nel tempo — è un problema di sistema, e di un aspetto preciso del sistema: la sua stabilità.

I capitoli precedenti della Parte IX hanno costruito gli attrezzi per arrivarci. Sai cos’è uno stato, sai che la dinamica è una regola che muove un punto in uno spazio, sai che una traiettoria è il percorso che ne risulta. Restava una domanda aperta: dove finiscono le traiettorie.

Quasi tutte non finiscono ovunque. Tendono verso un piccolo insieme di stati privilegiati, e quel comportamento ha una struttura. Lo stato verso cui un sistema tende, e da cui poi non si muove, è un equilibrio. La domanda se quell’equilibrio regge un disturbo o crolla è la domanda sulla stabilità. Sono due concetti distinti, e tenerli separati è metà del lavoro di questo capitolo.

C’è un motivo per cui questo vale la pena impararlo bene se costruisci sistemi AI. La parola “convergenza” che usi quando dici “l’addestramento è convergito” significa, alla lettera, che un sistema dinamico ha raggiunto un equilibrio. La parola “instabilità” che usi quando il training diverge — loss che esplode, valori che diventano NaN — significa, alla lettera, che quell’equilibrio ha perso stabilità o che il sistema sta attraversando una regione che amplifica invece di smorzare.

E non finisce con il training. L’equazione di Bellman nel reinforcement learning ha una soluzione che è il punto fisso di un operatore. L’equilibrio di Nash è un punto fisso. Un agente che entra in un loop ripetitivo è caduto in un attrattore da cui non riesce a uscire. Senza il concetto di stabilità questi sono aneddoti scollegati; con esso sono istanze di un’unica struttura, e una struttura che si capisce si sa anche diagnosticare.

Contesto

Il concetto di stabilità nasce due volte quasi nello stesso quarto di secolo, da un problema ingegneristico e da un problema teorico, e le due nascite si completano.

Il problema ingegneristico è quello di Watt. A risolverlo è James Clerk Maxwell (fisico scozzese, 1831-1879, lo stesso delle equazioni dell’elettromagnetismo), che nel 1868 pubblica sui Proceedings of the Royal Society of London un articolo intitolato “On Governors”. È la prima analisi matematica rigorosa di un sistema a feedback.

La mossa di Maxwell è quella che diventerà standard: prende le equazioni del governor — complicate, non lineari — e le linearizza attorno alla condizione di funzionamento, cioè le sostituisce con la loro approssimazione più semplice valida lì vicino. Da quelle equazioni semplificate ricava un polinomio, l’equazione caratteristica, e dimostra che il sistema è stabile se e solo se le radici di quel polinomio hanno tutte parte reale negativa.

Per la prima volta la stabilità di un meccanismo diventa una proprietà calcolabile da un’equazione. L’articolo viene ignorato a lungo — è considerato difficile — finché nel 1948 Norbert Wiener lo riscopre e lo cita in “Cybernetics”; da allora Maxwell è considerato il padre della teoria del controllo.

Il problema teorico è il problema dei tre corpi: prevedere il moto di tre masse che si attraggono per gravità. Henri Poincaré (matematico francese, 1854-1912), lavorandoci intorno al 1890, scopre che le equazioni non hanno una soluzione esprimibile con una formula.

Di fronte a quel muro fa una mossa che cambia la matematica: se non puoi calcolare la traiettoria esatta, smetti di cercarla e studia la geometria qualitativa dell’insieme di tutte le traiettorie possibili. Non “dove sarà il pianeta”, ma “le traiettorie vicine restano vicine o divergono? ci sono orbite chiuse? ci sono punti di quiete?”. È la nascita del pensiero per ritratto di fase, e Poincaré introduce in questo contesto il concetto di ciclo limite, su cui torneremo.

A dare al concetto la sua forma definitiva è Aleksandr Lyapunov (matematico russo, 1857-1918, allievo della scuola di Pafnuty Chebyshev a San Pietroburgo). Nel 1892 difende a Mosca la tesi di dottorato “The General Problem of the Stability of Motion” — in russo, tradotta in francese solo nel 1907 e in inglese molto più tardi.

In quella tesi Lyapunov definisce con precisione cosa significa stabile, instabile, asintoticamente stabile, e introduce i due metodi per verificarlo che ancora oggi portano il suo nome. Il suo lavoro resta poco letto per decenni; quando la teoria del controllo del Novecento lo riscopre, diventa il fondamento dell’intera disciplina.

Il filo che lega le tre figure: Poincaré dà il modo di pensare — la geometria nello spazio degli stati — Maxwell dà il primo strumento di calcolo applicato a un caso reale, Lyapunov dà la teoria generale. I capitoli precedenti della Parte IX — Stato, transizione, traiettoria in particolare — hanno già usato le parole “equilibrio” e “attrattore” in modo informale, parlando della pallina che si ferma in fondo a una valle. Qui le rendiamo precise.

L’intuizione

Prima di qualsiasi formula, conviene afferrare due cose separate: cos’è un equilibrio, e cosa significa che è stabile. Sono due idee distinte, e l’errore più comune è fonderle. Useremo tre angoli: il primo definisce l’equilibrio, il secondo la stabilità con la metafora canonica della pallina, il terzo dà la lettura geometrica che porta verso il formalismo.

Primo angolo: l’equilibrio è uno stato che il sistema non lascia

Riprendi l’immagine dello spazio degli stati: ogni stato possibile è un punto, la dinamica è una regola che, dato un punto, dice dove il sistema si sposterà subito dopo. Un equilibrio è un punto speciale: la regola, applicata lì, dice “non ti spostare”. Il sistema, se ci si trova esattamente, ci resta.

È utile renderlo concreto con un termostato. Lo stato è la temperatura della stanza. La regola: se la temperatura è sotto il valore impostato, accendi il riscaldamento; se è sopra, spegnilo. L’equilibrio è la temperatura impostata: lì il sistema non ha motivo di muoversi. Qualsiasi altra temperatura non è un equilibrio, perché la regola spinge a cambiarla.

Va sciolto subito un malinteso, perché è il più frequente. Equilibrio non vuol dire “stato buono” né “stato di pace”. Vuol dire solo: stato che il sistema non lascia, se nulla lo disturba. Una pallina appoggiata esattamente sulla cima di una collina è in equilibrio quanto una nel fondo di una valle — in entrambi i casi, se non la tocchi, resta dov’è.

Un agente AI bloccato in un loop che ripete la stessa azione all’infinito è in un equilibrio: proprio per questo è un problema, perché il sistema ci resta. “Equilibrio” è una categoria neutra. Tutto il giudizio — questo equilibrio è desiderabile? è raggiungibile? regge i disturbi? — vive nella seconda idea, la stabilità.

In termini di dinamica, la definizione è secca. Se il sistema è a tempo discreto, cioè evolve a passi — stato al passo successivo $= g($ stato attuale $)$ — allora un equilibrio è un punto $x^*$ tale che $g(x^*) = x^*$ : la regola lo manda in sé stesso. Per questo si chiama anche punto fisso della mappa $g$ : è fisso perché applicarvi la regola non lo muove. Se il sistema è a tempo continuo, descritto da come lo stato cambia istante per istante, un equilibrio è un punto dove la velocità di cambiamento è zero: nessuna spinta in nessuna direzione.

Secondo angolo: la pallina, la valle, la cima, il piano

L’equilibrio è dove il sistema sta fermo. La stabilità è cosa succede quando lo disturbi un po’. È una domanda diversa, e si afferra meglio con una metafora che è la metafora canonica di tutta la teoria: una pallina su un paesaggio.

Immagina una superficie con valli e colline. La pallina, lasciata libera, rotola in discesa secondo la pendenza. Gli stati in cui la pallina sta ferma sono quelli a pendenza nulla: il fondo di una valle, la cima di una collina, un tratto di piano orizzontale. Tutti e tre sono equilibri. Ma rispondono in modo completamente diverso a una spinta.

Stabile — la pallina nel fondo di una valle. Dalle un colpetto: risale un po’ il versante, poi ricade verso il fondo. Una piccola perturbazione produce un piccolo allontanamento, e il sistema non si allontana mai arbitrariamente. Questo è l’equilibrio stabile.

Asintoticamente stabile — la stessa valle, ma con attrito. Dalle un colpetto: oscilla avanti e indietro, ogni oscillazione un po’ più piccola della precedente, e dopo un po’ si ferma di nuovo esattamente sul fondo. Non solo resta vicina: ci ritorna. L’attrito ha riassorbito l’energia della spinta. Questa è la versione forte della stabilità, ed è quella che di solito si intende quando si dice, con leggerezza, “il sistema è stabile”.

Instabile — la pallina in bilico sulla cima di una collina. La cima è un equilibrio: se posi la pallina esattamente lì e l’aria è ferma, resta. Ma il minimo soffio — una perturbazione arbitrariamente piccola — la fa precipitare lungo un versante, e non torna più. Una perturbazione piccola produce un allontanamento illimitato. Questo è l’equilibrio instabile.

Marginalmente stabile — la pallina su un tratto di piano orizzontale. Dalle un colpetto: rotola, rallenta per l’eventuale attrito, e si ferma altrove. Non torna al punto di partenza, ma nemmeno se ne allontana indefinitamente. La perturbazione non viene né amplificata né riassorbita: il sistema si assesta su un nuovo equilibrio vicino. Il caso al confine fra stabile e instabile.

Questi quattro casi sono l’intero vocabolario qualitativo della stabilità, e la metafora della pallina li tiene tutti insieme. Vale la pena notare la differenza fra il primo e il secondo, perché è sottile e i testi divulgativi la nascondono: stabile dice “resta vicino”, asintoticamente stabile dice “torna esattamente”.

Un pendolo ideale senza attrito, spinto, oscilla per sempre con la nuova ampiezza: è stabile — l’ampiezza non cresce — ma non asintoticamente stabile, perché non torna mai alla quiete. La distinzione non è pedanteria: vedremo che il caso marginale è esattamente quello in cui i metodi di calcolo più comodi smettono di funzionare.

Terzo angolo: bacini, attrattori e il paesaggio come campo di pendenze

C’è un terzo modo di guardare la stessa scena, che è il ponte verso il formalismo. Finora abbiamo guardato la pallina vicino a un singolo equilibrio. Allarga lo sguardo a tutto il paesaggio.

Un paesaggio reale ha più valli. Ogni valle ha il suo fondo, e ogni fondo è un equilibrio asintoticamente stabile: un attrattore, uno stato che attira a sé le traiettorie vicine. Ma “vicine” fin dove? Ogni valle raccoglie le palline che partono dai suoi versanti, e quell’insieme di punti di partenza si chiama bacino di attrazione dell’attrattore.

I bacini sono separati da crinali: posa la pallina da un lato del crinale e finisce in una valle, posala dall’altro e finisce in un’altra. Il crinale stesso è fatto di equilibri instabili — la cima — più precisamente di una struttura di stati da cui le traiettorie scivolano via verso l’una o l’altra valle.

Questa vista d’insieme dice una cosa che la singola pallina non diceva: la stabilità è un fatto locale. Un equilibrio è stabile rispetto a perturbazioni abbastanza piccole da non scavalcare il crinale. Se la spinta è grande abbastanza da portare la pallina oltre il crinale, l’equilibrio “stabile” non la riprende: la pallina finisce in un altro bacino. La domanda “quanto grande può essere la perturbazione” è la domanda sull’ampiezza del bacino, e torneremo su di essa quando distingueremo robustezza e resilienza.

C’è poi il passo che porta al calcolo. Il paesaggio non è solo un’immagine: è un modo di codificare la dinamica. In ogni punto, la pendenza del terreno dice in che direzione e con quanta forza la pallina si muoverà. Il paesaggio è la regola di transizione, disegnata come altezza di un terreno. E un equilibrio è un punto a pendenza nulla.

Questo suggerisce due strade per studiare la stabilità, ed entrambe vengono da Lyapunov. La prima: guarda la forma del terreno vicino all’equilibrio — è una conca, una cima, una sella? La seconda: trova una funzione che misuri “quanto in alto” sei sul terreno e dimostra che lungo le traiettorie quella funzione non può che scendere. La sezione seguente trasforma entrambe in strumenti.

La meccanica

Mettiamo il formalismo, un passo alla volta, tenendo la pallina come traduzione costante.

Lo scenario e i due tempi

Un sistema dinamico ha uno stato, che chiamiamo $x$ — in generale un vettore, cioè una lista di numeri, perché lo stato di solito ha più componenti (per il pendolo: angolo e velocità angolare). La dinamica viene in due varianti.

A tempo continuo, lo stato cambia istante per istante e la dinamica si scrive

$\dot{x} = f(x)$

dove $\dot{x}$ è la velocità di cambiamento dello stato — quanto e in che direzione $x$ si muove adesso — e $f$ è la funzione che, dato lo stato, restituisce quella velocità. In parole povere: $f$ è il campo di pendenze del paesaggio. Questo tipo di equazione si chiama equazione differenziale ordinaria, ed è trattato in ODE a intuizione per dinamiche e controllo.

A tempo discreto, lo stato avanza a passi e la dinamica si scrive

$x_{t+1} = g(x_t)$

dove $x_t$ è lo stato al passo $t$ e $g$ è la regola che produce lo stato successivo. Questa è la forma rilevante per l’AI: un passo di addestramento, un’iterazione di un algoritmo, un giro del loop di un agente sono tutti passi discreti.

Un equilibrio $x^*$ è, nei due casi rispettivamente, un punto dove $f(x^*) = 0$ (velocità nulla, nessuna spinta) o dove $g(x^*) = x^*$ (la regola lo manda in sé stesso, punto fisso). In parole povere, in entrambi i casi: applicare la dinamica lì non muove il sistema.

Definizione di Lyapunov: ogni perturbazione piccola resta piccola

Lyapunov, nel 1892, dà alla parola “stabile” una definizione che non richiede di risolvere le equazioni. La parafrasiamo prima a parole, poi la guardiamo da vicino.

A parole: un equilibrio è stabile se, per quanto stretta tu voglia la “gabbia” attorno all’equilibrio in cui il sistema deve restare per sempre, esiste un raggio di partenza tale che, se parti entro quel raggio dall’equilibrio, non esci mai dalla gabbia.

In simboli, la stessa frase: per ogni $\varepsilon > 0$ (la gabbia, la tolleranza che fissi) esiste un $\delta > 0$ (la precisione di partenza) tale che, se la distanza iniziale dall’equilibrio è minore di $\delta$ , la distanza resta minore di $\varepsilon$ per ogni istante futuro. Il punto cruciale è l’ordine dei quantificatori: prima fissi tu la tolleranza $\varepsilon$ , poi il sistema deve garantirti un $\delta$ che funziona. Più stretta vuoi la gabbia, più piccolo dovrà essere il raggio di partenza — ma un raggio che funziona deve sempre esistere.

L’equilibrio è asintoticamente stabile se in più, partendo abbastanza vicino, la distanza non solo resta piccola ma tende a zero quando il tempo va all’infinito: il sistema ritorna all’equilibrio. È instabile se non è stabile: esiste una tolleranza $\varepsilon$ per cui nessun raggio di partenza $\delta$ , per quanto piccolo, tiene il sistema dentro la gabbia.

Questa definizione è preziosa perché è un criterio puro: dice cosa deve valere per ogni traiettoria, senza dire come calcolarla. Ma per applicarla servono strumenti che non chiedano di seguire ogni traiettoria a mano. Lyapunov ne dà due.

Il ritratto di fase: tre tipi di equilibrio da guardare

Prima dei metodi conviene fissare un’immagine, perché renderà concrete le formule che seguono. Per un sistema con due variabili di stato — il caso più piccolo che mostra tutto — lo spazio degli stati è un piano, e la dinamica disegna su quel piano un campo di frecce: in ogni punto, una freccia che indica dove il sistema si muove subito dopo. Le traiettorie sono le curve che seguono le frecce. Questo disegno si chiama ritratto di fase, ed è lo strumento che Poincaré inventò per il problema dei tre corpi.

Vicino a un equilibrio, il ritratto di fase ha solo poche forme possibili, e ognuna corrisponde a un caso della pallina. Vale la pena nominarle, perché sono il vocabolario visivo della stabilità.

Un equilibrio dove tutte le frecce puntano verso il centro, e le traiettorie ci cadono dentro, si chiama nodo stabile o pozzo: è la valle con attrito, asintoticamente stabile. Se le traiettorie ci cadono dentro avvitandosi a spirale, è un fuoco stabile: la stessa stabilità asintotica, ma con oscillazione mentre converge — il pendolo con attrito che oscilla sempre meno.

Se le traiettorie girano attorno al centro in cerchi chiusi senza né avvicinarsi né allontanarsi, è un centro: l’equilibrio è stabile ma non asintoticamente — il pendolo ideale senza attrito. Se tutte le frecce puntano via dal centro, è un nodo instabile o sorgente: la cima della collina.

E c’è una forma che la metafora della pallina nasconde: la sella, dove le traiettorie si avvicinano lungo una direzione e si allontanano lungo un’altra. Una sella è instabile — basta che la perturbazione abbia una componente lungo la direzione che espande — ma è instabile in modo particolare, perché esiste un’intera direzione lungo cui il sistema, se ci parte esattamente, scivola verso l’equilibrio. È il crinale fra due bacini visto da vicino.

Il punto di questa galleria: i metodi di Lyapunov non fanno altro che dirti, senza disegnare il ritratto di fase intero, in quale di queste forme ricade un dato equilibrio. Il primo metodo lo deduce dagli autovalori; il secondo, dall’esistenza di una funzione che scende.

Primo metodo: linearizza e guarda gli autovalori

L’idea è la stessa di Maxwell nel 1868: vicino a un equilibrio, un sistema “abbastanza liscio” si comporta quasi come la sua approssimazione lineare. Linearizzare significa sostituire la dinamica vera $f(x)$ con la sua approssimazione del primo ordine attorno a $x^*$ .

Il termine che governa quell’approssimazione è la matrice Jacobiana $J$ di $f$ valutata in $x^*$ : la matrice che raccoglie tutte le derivate parziali di ogni componente di $f$ rispetto a ogni componente di $x$ (vedi Derivate parziali, gradienti, Jacobiani). La Jacobiana è la pendenza locale del campo dinamico: dice come la spinta cambia se ti sposti di poco dall’equilibrio.

Vicino a $x^*$ , scrivendo la perturbazione $\Delta x = x - x^*$ , la dinamica linearizzata è

$\dot{\Delta x} \approx J \, \Delta x$

In parole povere: la perturbazione evolve, in prima approssimazione, moltiplicata dalla matrice $J$ . E il comportamento di una perturbazione che viene ripetutamente trasformata da una matrice si legge dai suoi autovalori — i numeri che dicono di quanto la matrice allunga o accorcia lungo le sue direzioni privilegiate (vedi Autovalori e autovettori a intuizione).

Un autovalore è in generale un numero complesso: la sua parte reale dice se la componente lungo quella direzione cresce o decresce esponenzialmente nel tempo, la parte immaginaria dice se c’è rotazione, cioè oscillazione.

La regola, per un sistema a tempo continuo:

tutte le parti reali strettamente negative -> equilibrio asintoticamente stabile. Ogni direzione contrae: qualunque perturbazione decade.
almeno una parte reale strettamente positiva -> instabile. Quella direzione espande: la perturbazione esplode.
parti reali tutte $\le 0$ ma almeno una esattamente zero -> caso critico. La linearizzazione non decide: i termini non lineari che l’approssimazione ha buttato via determinano l’esito.

Per un sistema a tempo discreto la soglia non è la parte reale ma il modulo dell’autovalore — la sua “lunghezza” come numero complesso. Stabile se tutti i moduli sono $< 1$ (a ogni passo la perturbazione si accorcia: contrazione), instabile se almeno un modulo è $> 1$ (a ogni passo si allunga), critico se qualche modulo è esattamente $1$ . La soglia 1 per il tempo discreto, e la soglia 0 sulla parte reale per il tempo continuo, sono la stessa frontiera vista in due coordinate diverse.

Il caso critico non è un dettaglio da pedanti. È esattamente la pallina sul piano orizzontale: la linearizzazione vede terreno piatto e non sa dire se, scostandosi un po’, la pallina trova una conca o un dosso. Per quel caso serve il secondo metodo.

Conviene legare gli autovalori al ritratto di fase, perché è lì che la regola diventa intuizione. In due dimensioni la Jacobiana ha due autovalori, e le forme della galleria di prima si leggono dalla coppia.

Due autovalori reali entrambi negativi: nodo stabile, le traiettorie cadono dentro dritte. Due reali di segno opposto, uno positivo e uno negativo: sella — la direzione dell’autovalore negativo è quella lungo cui il sistema scivola verso l’equilibrio, quella del positivo è la fuga. Due autovalori complessi coniugati con parte reale negativa: fuoco stabile, le traiettorie ci si avvitano dentro, perché la parte immaginaria è la rotazione e la parte reale negativa è la convergenza.

Due complessi con parte reale esattamente zero, puramente immaginari: centro, traiettorie chiuse, stabile ma non asintoticamente — ed è proprio il caso critico in cui la linearizzazione smette di garantire l’esito per il sistema non lineare. Due reali entrambi positivi, o complessi a parte reale positiva: nodo o fuoco instabile. La regola “parti reali negative uguale stabile” è, vista così, semplicemente la descrizione di quando tutte le frecce del ritratto di fase puntano verso casa.

Secondo metodo: la funzione di Lyapunov, energia generalizzata che scende

Il metodo diretto — il contributo più originale di Lyapunov — parte da un’osservazione fisica. Prendi un sistema meccanico con attrito: un pendolo che oscilla in aria, un peso su una molla con un ammortizzatore. La sua energia meccanica totale non può che diminuire, perché l’attrito la dissipa in calore. E l’energia ha il suo minimo nello stato di quiete.

Conclusione: il sistema è obbligato a scivolare verso lo stato di minima energia, perché l’unica cosa che l’energia può fare è scendere verso il suo minimo. Non serve risolvere le equazioni del moto per saperlo: basta sapere che esiste questa “energia” e che decresce.

Lyapunov generalizza. Definisce una funzione di Lyapunov $V(x)$ : una funzione scalare dello stato — un solo numero per ogni stato — con due proprietà.

La prima: $V$ è definita positiva attorno all’equilibrio. Vale zero in $x^*$ e un valore positivo in ogni altro stato vicino. Geometricamente: $V$ è una ciotola, una conca con il fondo esattamente sull’equilibrio. La condizione che $x^*$ sia un minimo di $V$ è la stessa che incontri in Hessiana, curvatura, condizionamento: gradiente nullo nel punto e hessiana definita positiva, cioè curvatura verso l’alto in ogni direzione.

La seconda: $V$ non cresce mai lungo le traiettorie del sistema. Se segui il sistema mentre evolve e misuri $V$ a ogni istante, quel numero non aumenta mai. In termini di derivata: la derivata di $V$ rispetto al tempo, calcolata lungo la dinamica, è $\le 0$ . Tecnicamente questa derivata si ottiene combinando il gradiente di $V$ con il campo $f$ della dinamica: $\dot V = \nabla V \cdot f(x)$ , il prodotto scalare fra la direzione di salita di $V$ e la direzione in cui il sistema si muove. Chiedere $\dot V \le 0$ significa chiedere che il sistema non punti mai “in salita” sulla ciotola.

Il risultato di Lyapunov: se esiste una funzione $V$ con queste due proprietà, l’equilibrio è stabile. Se in più $\dot V$ è strettamente negativa fuori dall’equilibrio — $V$ scende davvero, non solo “non sale” — allora l’equilibrio è asintoticamente stabile.

La logica è la stessa della pallina nella ciotola: se sei dentro una conca e la tua quota non può che scendere, sei intrappolato, e se scende davvero finisci sul fondo.

Il colpo di genio è duplice. Primo: non serve risolvere le equazioni del sistema — basta esibire una funzione con le due proprietà e leggere il segno di una derivata. Secondo: $V$ non deve essere l’energia fisica vera. Per i sistemi che un’energia fisica non ce l’hanno — un algoritmo, un loop di feedback astratto — $V$ è una funzione qualsiasi che tu costruisci, purché definita positiva e non crescente lungo la dinamica.

C’è un parallelo che vale la pena rendere esplicito. Il metodo diretto è il rovescio della medaglia di ciò che fai con la discesa del gradiente: lì costruisci una dinamica perché scenda lungo una funzione data, la loss; qui ti viene data una dinamica e trovi una funzione che essa fa scendere. La stessa figura — un paesaggio a conca e qualcosa che ci scivola dentro — letta nelle due direzioni.

Vale la pena vedere il metodo in azione su un caso minuscolo, perché la prima volta sembra magia e non lo è. Prendi un sistema a una variabile $\dot x = -x^3$ : la velocità di cambiamento è meno il cubo dello stato. L’unico equilibrio è $x^* = 0$ .

La linearizzazione qui non aiuta: la Jacobiana è la derivata di $-x^3$ valutata in zero, che vale zero — caso critico, autovalore nullo, la regola degli autovalori non decide. Prova allora il metodo diretto. Scegli come candidata $V(x) = x^2$ : vale zero in $x^* = 0$ e positivo ovunque altrove, quindi è definita positiva — la ciotola c’è.

Ora calcola come $V$ cambia lungo la dinamica: la sua derivata temporale è $\dot V = 2x \cdot \dot x = 2x \cdot (-x^3) = -2x^4$ . Questo numero è strettamente negativo per ogni $x \ne 0$ . Conclusione: $V$ scende davvero lungo ogni traiettoria, quindi l’equilibrio è asintoticamente stabile — e l’abbiamo stabilito senza risolvere l’equazione e senza che la linearizzazione servisse a niente.

La candidata $V = x^2$ qui non è un’energia fisica: è semplicemente la prima ciotola ragionevole che si prova, e ha funzionato. Quando non funziona, se ne prova un’altra; e quando nessuna prova ovvia funziona, ricomincia il limite del metodo che diciamo ora.

C’è un limite onesto da dichiarare subito, perché pesa nella pratica. Il metodo diretto è una condizione sufficiente ma non necessaria. Se trovi una funzione di Lyapunov, hai dimostrato la stabilità. Se non la trovi, non hai dimostrato niente: forse l’equilibrio è stabile e la funzione esiste, semplicemente non l’hai vista. Non esiste una ricetta generale per costruire $V$ . Per i sistemi lineari la si sa costruire sempre; per i non lineari è in parte un’arte.

Contrazione: la stabilità a tempo discreto vista da vicino

C’è un caso particolare di equilibrio a tempo discreto che merita una sezione propria, perché è quello che torna più spesso nell’AI. Una mappa $g$ si dice contrazione se applicarla avvicina sempre fra loro due punti qualsiasi: la distanza fra $g(a)$ e $g(b)$ è minore della distanza fra $a$ e $b$ , e lo è di un fattore fisso $\lambda < 1$ . In parole povere, ogni passo della dinamica rimpicciolisce le distanze.

Per una contrazione la storia della stabilità è particolarmente pulita, e la racconta un teorema — il teorema di punto fisso di Banach, dal matematico polacco Stefan Banach (1892-1945). Il teorema dice tre cose insieme: una contrazione ha esattamente un punto fisso, quel punto fisso è unico, e iterando la mappa da qualunque punto di partenza si converge a quel punto fisso.

Tradotto nel vocabolario di questo capitolo: una contrazione ha un solo equilibrio, è asintoticamente stabile, e il suo bacino di attrazione è l’intero spazio. Non ci sono altri equilibri in cui cadere, non c’è uno stato iniziale sbagliato. È la situazione più benevola che un sistema dinamico possa offrire.

Il legame con gli autovalori è diretto. Se $g$ è lineare, dire che è una contrazione equivale a dire che tutti gli autovalori hanno modulo minore di 1 — il caso “stabile” della regola del tempo discreto. La contrazione è quella regola, vista come una proprietà globale invece che locale: non “le distanze si riducono vicino all’equilibrio” ma “le distanze si riducono ovunque”. Per questo la convergenza è garantita da ogni punto e non solo da vicino.

Questa è la ragione per cui il reinforcement learning converge, e lo vedremo nelle applicazioni: l’operatore di Bellman è una contrazione, e il teorema di Banach fa il resto.

Cicli limite: attrattori che non sono punti

Tutto finora ha un sottinteso: che l’attrattore sia un punto, uno stato di quiete. Non è sempre così. Un ciclo limite è una traiettoria chiusa e isolata verso cui le traiettorie vicine convergono. Il sistema lasciato a sé non si ferma: finisce per percorrere all’infinito un anello, sempre lo stesso. È un attrattore — attira le traiettorie vicine — ma non un equilibrio, perché il sistema in moto non sta fermo da nessuna parte.

Esempi reali: il battito di un cuore, l’oscillazione regolare di un orologio, certi circuiti elettronici come l’oscillatore di van der Pol. La metafora della pallina che rotola fino in fondo a una valle non copre questo caso: qui la pallina, lasciata libera, percorre per sempre un anello a quota costante. Poincaré introdusse il concetto; il fisico russo Aleksandr Andronov (1901-1952) nel 1929 lo collegò alle oscillazioni autosostenute reali — quelle di un governor mal regolato, per esempio.

Accanto al ciclo limite va nominata la stabilità strutturale, che è un’idea di livello diverso. Tutte le stabilità viste finora chiedono: cosa succede se perturbo lo stato? La stabilità strutturale chiede una cosa diversa: cosa succede se perturbo la regola stessa — i parametri del sistema, la forma della dinamica?

Un sistema è strutturalmente stabile se una piccola modifica della dinamica produce solo una piccola modifica del ritratto qualitativo: stesso numero di equilibri, stessi tipi, stessi cicli. Un sistema strutturalmente instabile è fragile rispetto alla propria descrizione: cambi un parametro di pochissimo e la struttura cambia di colpo. Andronov, con il matematico Lev Pontryagin, formalizzò questo concetto negli anni ‘30 sotto il nome di “sistema rough”, robusto.

Biforcazioni: la stabilità persa al girare di una manopola

La stabilità strutturale ha un opposto, e quell’opposto è il fenomeno più interessante per chi vuole capire i salti di comportamento. Una biforcazione è il momento in cui, variando con continuità un parametro del sistema, la struttura qualitativa cambia di colpo: un equilibrio appare o scompare, oppure cambia tipo di stabilità. Il valore del parametro a cui questo accade è il punto in cui il sistema non è strutturalmente stabile.

Il caso che lega tutto è un equilibrio asintoticamente stabile che, al crescere di un parametro, perde stabilità. Nella biforcazione di Andronov-Hopf una coppia di autovalori complessi della Jacobiana attraversa l’asse immaginario: la loro parte reale passa da negativa a positiva. Nell’istante in cui la parte reale è zero siamo nel caso critico; subito oltre, l’equilibrio è instabile, e da esso nasce un ciclo limite. Il sistema smette di fermarsi e comincia a oscillare, con un’oscillazione che parte di ampiezza piccola e cresce man mano che il parametro si allontana dalla soglia.

Questa è, alla lettera, la storia del governor di Watt che apre il capitolo. C’è un parametro — chiamalo il guadagno del meccanismo, quanto energicamente il governor corregge — e sotto una certa soglia l’equilibrio di velocità costante è stabile: la macchina gira regolare. Sopra la soglia quell’equilibrio perde stabilità, nasce un ciclo limite, e la macchina entra nell’oscillazione che faceva impazzire gli ingegneri. La biforcazione è il punto preciso, sul giro della manopola, in cui un sistema che si stabilizzava comincia a oscillare.

Le biforcazioni sono il linguaggio formale dei “tipping point”, i punti di non ritorno: piccoli cambiamenti di un parametro che producono salti qualitativi di comportamento. Il tema torna nella Parte XV sui sistemi complessi, con nonlinearita-tipping-points (in preparazione).

Robustezza e resilienza: due parole da non confondere

Restano due termini che il linguaggio comune tratta da sinonimi e che la teoria dei sistemi tiene separati.

La robustezza è la capacità di un sistema di mantenere la sua funzione e il suo stato qualitativo nonostante perturbazioni e incertezza, senza spostarsi in modo apprezzabile. Un equilibrio robusto resta tale anche se la dinamica o gli input variano un po’; è imparentata con la stabilità strutturale e con l’avere autovalori non solo a parte reale negativa, ma abbastanza negativa da lasciare un margine.

La resilienza è la capacità di un sistema di tornare a un buon stato dopo essere stato spinto via, anche lontano. Geometricamente è l’ampiezza del bacino di attrazione: quanto può essere grande la perturbazione e ancora finire nella valle giusta. La stabilità di Lyapunov, ricordi, è locale — parla di perturbazioni abbastanza piccole. La resilienza parla della taglia del bacino: di quanto grande può essere il colpo.

In una formula sola: robustezza è resistere senza spostarsi, resilienza è essere spinti via e tornare. I due si possono avere separatamente. Un equilibrio può essere robusto e poco resiliente — regge benissimo i colpetti, ma se lo spingi oltre il crinale del bacino crolla in un altro stato senza recupero. O viceversa: poco robusto, sensibile a ogni disturbo, ma con un bacino così ampio da riportarlo sempre indietro. Progettare un sistema vuol dire scegliere quale dei due ti serve di più.

Esempi

Esempio 1 — numerico: il pendolo, con e senza attrito

Un pendolo è il banco di prova classico. Lo stato è la coppia (angolo rispetto alla verticale, velocità angolare). Ha due equilibri: pendolo fermo in basso, pendolo fermo in alto, capovolto in equilibrio precario.

L’equilibrio in basso, con attrito dell’aria, è asintoticamente stabile. Sposta il pendolo e lascialo: oscilla con ampiezza calante e si ferma di nuovo in basso. La funzione di Lyapunov c’è ed è onesta: l’energia meccanica totale, somma di cinetica e potenziale, vale zero nello stato di quiete in basso ed è positiva attorno (definita positiva), e l’attrito la fa decrescere lungo ogni traiettoria ( $\dot V < 0$ ). Lyapunov certifica la stabilità senza bisogno di risolvere l’equazione del moto. La Jacobiana in basso ha due autovalori con parte reale negativa.

Lo stesso equilibrio in basso, senza attrito — un pendolo ideale — è solo stabile, non asintoticamente. L’energia meccanica si conserva: $\dot V = 0$ , non $< 0$ . Sposta il pendolo e oscilla per sempre con l’ampiezza data dalla spinta. Resta vicino, non torna mai. La Jacobiana ha due autovalori puramente immaginari, parte reale zero: il caso critico. La linearizzazione da sola non basterebbe a concludere; è la funzione di Lyapunov (energia costante) a dire che siamo nel caso marginale.

L’equilibrio in alto è instabile in entrambi i casi. La Jacobiana ha un autovalore reale positivo: una direzione di perturbazione che esplode. Basta un soffio e il pendolo cade.

Tre comportamenti diversi — torna, oscilla per sempre, precipita — letti da un unico schema: segno della derivata della funzione di Lyapunov, parte reale degli autovalori.

Esempio 2 — codice: la mappa logistica e una biforcazione che si vede girare

La mappa logistica è un sistema dinamico a tempo discreto di una sola variabile, abbastanza semplice da stare in poche righe e abbastanza ricco da mostrare equilibrio, stabilità, biforcazione e perdita di stabilità tutti insieme.

def passo(x, r):
    return r * x * (1 - x)

def itera(x0, r, n):
    x = x0
    for _ in range(n):
        x = passo(x, r)
    return x

La regola è $x_{t+1} = r\,x_t(1 - x_t)$ , con $r$ un parametro. Cerchiamo gli equilibri: i punti fissi, dove $g(x^*) = x^*$ . Oltre a $x^* = 0$ c’è l’equilibrio non banale $x^* = 1 - 1/r$ .

Per la stabilità serve l’analogo scalare dell’autovalore: la derivata della mappa nell’equilibrio. Per la mappa logistica vale $g'(x^*) = 2 - r$ . La regola del tempo discreto dice che l’equilibrio è stabile se il modulo è minore di 1, cioè se $|2 - r| < 1$ , cioè per $1 < r < 3$ .

Provalo. Con $r = 2.5$ , da qualunque $x_0$ ragionevole, itera converge a $x^* = 0{,}6$ : equilibrio stabile, le iterazioni cadono nel punto fisso. Con $r = 2{,}9$ converge ancora, più lentamente — siamo vicini alla soglia, il modulo $|2 - r| = 0{,}9$ è vicino a 1, la contrazione è debole.

A $r = 3$ il modulo tocca esattamente 1: il caso critico. Appena oltre, per $r$ poco sopra 3, l’equilibrio ha perso stabilità: le iterazioni non convergono più a un punto, ma a un’oscillazione fra due valori. È una biforcazione — qui detta period-doubling, raddoppio di periodo. Continuando ad aumentare $r$ le oscillazioni raddoppiano ancora, e oltre $r \approx 3{,}57$ si entra nel caos. Una manopola, $r$ , e girandola si attraversa dal vivo: equilibrio stabile, soglia critica, perdita di stabilità, oscillazione.

Esempio 3 — scenario reale: la convergenza e la divergenza del training

L’addestramento di una rete neurale è un sistema dinamico a tempo discreto, e vale la pena prendere l’affermazione alla lettera invece che come immagine. Lo stato è il vettore dei pesi del modello. La regola di transizione $g$ è un passo dell’ottimizzatore: prendi i pesi attuali, calcola il gradiente della loss, aggiorna i pesi. La “convergenza” dell’addestramento è, in senso formale stretto, l’arrivo del sistema a un equilibrio: un punto fisso di $g$ , che è un minimo della loss, dove il gradiente è nullo e quindi l’update non muove più i pesi.

Letta così, l’instabilità del training smette di essere un mistero. Quando la loss oscilla — sale e scende senza assestarsi — il sistema si comporta come un’iterazione con autovalori vicini al bordo del disco unitario, modulo prossimo a 1: il learning rate è al limite, ogni passo corregge ma quasi non smorza. Quando la loss diverge — esplode, fino a produrre NaN — il sistema sta attraversando una regione dove la mappa dell’update ha modulo $> 1$ : invece di contrarre, espande, e la perturbazione cresce a ogni passo.

Non è un fenomeno raro. Nei run di addestramento di modelli da centinaia di miliardi di parametri questi episodi sono documentati e frequenti: un report su un modello da 540 miliardi di parametri descrive oltre venti loss spike in un singolo run, ciascuno gestito tornando a un checkpoint precedente e saltando alcune centinaia di batch.

Le contromisure standard sono, in questa lettura, modi di tenere la dinamica dentro la regione stabile. Il gradient clipping limita la lunghezza del passo perché un gradiente troppo grande non spinga i pesi in una regione che espande.

Il learning rate warmup — partire con passi piccoli e crescere gradualmente — evita che i primissimi passi, quando la curvatura della loss è mal condizionata, mandino i pesi fuori rotta. Il decay del learning rate verso fine addestramento riduce il passo man mano che ci si avvicina al minimo, perché un passo grande vicino all’equilibrio rischia di scavalcarlo e innescare oscillazione.

Sono tecniche di stabilizzazione di un sistema dinamico, ed è esattamente così che conviene ragionarci sopra quando un training va male. Il legame con la geometria della loss è in SGD, momentum, Adam.

Esempio 4 — scenario reale: l’agente che oscilla, si blocca, o entra in loop

Un agente che gira in un loop percezione-azione è un sistema dinamico, e i suoi modi di fallimento si leggono nel vocabolario di questo capitolo — con una cautela sulla classe di affermazione, che diremo fra poco.

Il primo modo: l’agente che si blocca, ripetendo all’infinito la stessa azione che non porta avanti il compito. È caduto in un equilibrio — un attrattore — che è stabile e indesiderato insieme. Stabile perché il sistema ci resta; indesiderato perché non è il completamento del task. Ricorda l’avvertimento del primo angolo: equilibrio non vuol dire buono.

Il secondo modo: l’agente che oscilla, alternando due azioni o ripercorrendo un ciclo di passi — apre un file, lo chiude, lo riapre — senza progredire. È l’analogo di un ciclo limite: una traiettoria chiusa nello spazio degli stati dell’agente, percorsa all’infinito.

Il terzo modo: la generazione ripetitiva di un modello di linguaggio, quando l’output entra in un loop di token o frasi identiche. Lo si può descrivere come un attrattore nello spazio delle sequenze, indotto da una strategia di decoding — decoding greedy, o una repetition penalty mal tarata.

Qui va marcata la classe dell’affermazione, perché il capitolo lo esige. Per i primi due modi e per il training dell’Esempio 3, l’inquadramento come sistema dinamico è un’identità formale legittima: c’è una mappa di transizione esplicita e l’equilibrio è il suo punto fisso.

Per il loop di un LLM, invece, parlare di “attrattore” è soprattutto un’analogia descrittiva utile: lo spazio delle sequenze generate non è uno spazio degli stati con una dinamica liscia su cui valgano i teoremi di Lyapunov, e chiamare “ciclo limite” un loop di testo prende a prestito un’immagine senza il teorema che la sosterrebbe. L’analogia aiuta a vedere il fenomeno; non va spacciata per il risultato matematico.

Esempio 5 — un sistema che non si ferma mai: prede e predatori

Gli esempi finora suggeriscono che ogni sistema “ragionevole”, lasciato in pace, si assesti. È falso, e un esempio dall’ecologia lo mostra senza bisogno di matematica avanzata.

Considera due popolazioni che vivono nello stesso ambiente, prede e predatori — conigli e volpi. Lo stato è la coppia (numero di conigli, numero di volpi). La dinamica, nel modello classico di Lotka e Volterra (gli scienziati che lo formularono indipendentemente negli anni ‘20), è semplice da raccontare: i conigli si moltiplicano se ci sono; le volpi mangiano conigli e si moltiplicano in proporzione a quanti ne mangiano; le volpi senza conigli muoiono di fame.

Questo sistema ha un equilibrio: una certa coppia di numeri (tanti conigli, tante volpi) in cui le nascite e le morti si bilanciano esattamente per entrambe le specie, e le popolazioni restano costanti. Ma quell’equilibrio non è un attrattore. È un centro: le traiettorie gli girano attorno in cicli chiusi e non vi cadono dentro.

Se parti fuori dall’equilibrio, le popolazioni oscillano per sempre — tanti conigli, le volpi prosperano, troppe volpi, i conigli crollano, le volpi muoiono di fame, i conigli ripartono — e l’oscillazione non si smorza e non cresce. È l’equilibrio stabile-non-asintotico, lo stesso del pendolo ideale, ma su un sistema che non ha niente di meccanico.

L’esempio insegna due cose. La prima: l’esistenza di un equilibrio non implica che il sistema lo raggiunga; questo qui non lo raggiunge mai, salvo partirci esattamente sopra.

La seconda: oscillazione permanente non è sinonimo di malfunzionamento — è il comportamento normale di un’intera classe di sistemi, e va riconosciuto come tale invece di scambiarlo per instabilità. Un sistema multi-agente che oscilla con ampiezza costante non sta necessariamente fallendo: potrebbe essere semplicemente un centro, e la domanda giusta non è “perché non converge” ma “questa oscillazione è quella che voglio”.

Applicazioni pratiche

Diagnosticare l’instabilità del training. Inquadrare l’update dell’ottimizzatore come sistema dinamico discreto, come nell’Esempio 3, rende leggibili i sintomi e suggerisce le cure. Ci sono tre quadri distinti, e la cura cambia a seconda di quale si vede.

Loss che oscilla senza assestarsi: stai vicino alla soglia critica, il learning rate è troppo alto per la curvatura locale — riducilo o accelera il decay. Loss che diverge di colpo a NaN: il sistema ha incontrato una regione che espande — il gradient clipping serve proprio a impedire che un gradiente anomalo ti ci spinga.

Loss che scende ma lentissima: la contrazione è troppo debole, gli autovalori effettivi sono vicini al bordo — qui il problema non è instabilità ma condizionamento, e tocca l’ottimizzatore o la normalizzazione. La diagnosi cambia a seconda di quale dei tre quadri vedi.

Capire perché il reinforcement learning converge. Value iteration e policy evaluation convergono per una ragione che è esattamente la stabilità di una mappa a tempo discreto. L’operatore di Bellman — la regola che, data una stima della value function, ne produce una migliore — è una contrazione con fattore $\gamma$ , il discount factor del problema. “Contrazione” significa che a ogni applicazione la distanza fra due stime qualsiasi si accorcia di un fattore $\gamma < 1$ : è la condizione “modulo minore di 1” del tempo discreto, in versione astratta.

Il teorema di punto fisso di Banach garantisce allora che esiste un unico punto fisso — la value function ottima — e che l’iterazione vi converge da qualunque punto di partenza. Iterare l’operatore di Bellman è far evolvere un sistema dinamico verso il suo unico equilibrio asintoticamente stabile.

Una conseguenza pratica: quando $\gamma$ si avvicina a 1, la contrazione si indebolisce e la convergenza rallenta — il sistema si avvicina al caso marginale. Il legame è con Bellman e programmazione dinamica e Iterazione del valore e della policy.

Leggere la convergenza di una catena di Markov. Una catena di Markov — un sistema che salta fra stati con probabilità fissate — è un sistema dinamico il cui stato è una distribuzione di probabilità. La sua distribuzione stazionaria è un punto fisso dell’operatore di transizione: applicare un passo della catena a quella distribuzione la lascia invariata.

La domanda “la catena converge alla stazionaria, e da quale punto di partenza?” è la domanda di stabilità di questo capitolo. La velocità di convergenza — il mixing time — è governata dal secondo autovalore più grande della matrice di transizione: più è lontano da 1, più la contrazione è forte e la catena raggiunge in fretta il suo equilibrio. È lo stesso schema dell’operatore di Bellman, applicato a un oggetto diverso.

Progettare loop di feedback e sistemi multi-agente che non oscillano. Un agente in un loop di feedback con il suo ambiente, o un insieme di agenti che si influenzano a vicenda, può convergere a un equilibrio, oscillare o divergere — esattamente come il governor di Watt.

I parametri di progetto — con quale frequenza l’agente interviene, quanto energicamente corregge, quanto ritardo c’è fra azione ed effetto osservato — sono le manopole che decidono da che parte della biforcazione ti trovi. Troppo guadagno nella correzione, o troppo ritardo nell’osservare l’effetto, e il loop oscilla invece di stabilizzarsi: è la stessa storia del governor, su un sistema fatto di software. Le Parti X (cibernetica) e XI (control theory operativa) sviluppano questo punto.

Valutare la stabilità di un equilibrio di incentivi. Negli scenari multi-agente con incentivi, un equilibrio di Nash è un punto fisso: nessun agente guadagna a deviare da solo. Ma esistenza e stabilità sono domande separate.

Un equilibrio di Nash può essere stabile — piccole deviazioni vengono riassorbite, il sistema ci ritorna — o fragile, un punto in bilico da cui il sistema scivola via al primo disturbo. Molti casi di reward hacking e specification gaming sono, in questa luce, il sistema che lascia l’equilibrio previsto dal progettista e scivola verso un altro attrattore, non previsto, che ottimizza la metrica scritta invece dell’intento.

Dove si rompe

La teoria della stabilità è uno degli strumenti più solidi della matematica applicata, ma ha confini netti, e diversi modi di essere fraintesa. Vale la pena passarli in rassegna, perché ciascuno corrisponde a un errore concreto.

Il metodo diretto non dà mai una risposta negativa. È il limite strutturale del secondo metodo di Lyapunov: trovare una funzione di Lyapunov dimostra la stabilità, ma non trovarla non dimostra l’instabilità. La funzione potrebbe esistere e averti solo eluso. Non c’è un algoritmo generale per costruirla: per i sistemi lineari sì, per i non lineari è in parte un’arte.

Conseguenza pratica: se stai cercando una funzione di Lyapunov per un sistema e non la trovi, non hai imparato niente sul sistema — hai imparato qualcosa sulla tua capacità di indovinare la funzione. È una condizione sufficiente, mai necessaria.

La linearizzazione fallisce esattamente sul caso critico. La regola degli autovalori della Jacobiana è comoda e meccanica, ma è onesta solo quando le parti reali sono strettamente diverse da zero, o i moduli strettamente diversi da 1 nel tempo discreto. Quando un autovalore cade sull’asse immaginario — parte reale esattamente zero — la linearizzazione vede terreno piatto e non sa dire se appena più in là c’è una conca o un dosso: i termini non lineari che ha buttato via decidono l’esito, e lei non li vede più.

È il caso marginale, ed è proprio dove servono il metodo diretto o un’analisi non lineare. L’errore tipico è applicare la regola degli autovalori, vedere “parte reale zero” e concludere “stabile”: non si può concludere niente.

Tutta la teoria di Lyapunov è locale. Stabilità, asintotica stabilità, analisi della Jacobiana parlano di perturbazioni abbastanza piccole. Un equilibrio asintoticamente stabile riprende il sistema solo se la spinta non lo porta fuori dal bacino di attrazione.

Una perturbazione grande può scavalcare il crinale e finire in un altro bacino, e la teoria locale non lo prevede: l’equilibrio “stabile” semplicemente non riprende quel sistema. È la differenza fra stabilità e resilienza, ed è il motivo per cui “il sistema è stabile” non è una garanzia sufficiente per un sistema che subisce disturbi di ampiezza ignota. Va sempre chiesto: stabile rispetto a perturbazioni quanto grandi?

Non tutti gli attrattori sono punti, e la metafora della pallina lo nasconde. L’immagine della pallina che rotola fino in fondo a una valle è fedele per i sistemi dissipativi — quelli che perdono energia e si calmano, trattati in Sistemi aperti, chiusi, dissipativi. Ma esistono cicli limite, su cui il sistema gira per sempre senza fermarsi, e attrattori ancora più complessi, gli attrattori strani dei sistemi caotici, su cui la traiettoria non si ripete mai pur restando confinata.

Per questi la parola “equilibrio” inteso come stato di quiete non si applica, e la metafora della pallina che si ferma in fondo va abbandonata. Il trattamento pieno del caos appartiene alla Parte XV.

Equilibrio non implica raggiungibilità. Un sistema può avere un equilibrio asintoticamente stabile e non raggiungerlo mai, perché parte fuori dal suo bacino o perché un disturbo continuo lo tiene lontano. L’esistenza di un buon equilibrio sulla carta non garantisce che il sistema reale ci finisca. Per un addestramento: il fatto che esista un minimo della loss non garantisce che l’ottimizzatore ce lo porti, se l’inizializzazione o il learning rate lo collocano sulla traiettoria sbagliata.

Il ponte con l’AI mescola facilmente analogia e teorema, e i due non si equivalgono. Questo è il fraintendimento più insidioso, perché è seducente. Le quattro affermazioni-ponte di questo capitolo non hanno lo stesso statuto, e vale la pena metterle in fila.

“La convergenza del training è il raggiungimento di un equilibrio” è un’identità formale legittima — c’è una mappa di transizione esplicita, l’update dell’ottimizzatore, e l’equilibrio è il suo punto fisso.

“L’operatore di Bellman ha un punto fisso unico” è un teorema, dimostrato via contrazione di Banach. “L’equilibrio di Nash è un punto fisso” è anch’esso un teorema: Nash lo dimostrò con il teorema di punto fisso di Kakutani.

Ma “il loop ripetitivo di un LLM è un attrattore” è, allo stato, soprattutto un’analogia descrittiva: lo spazio delle sequenze generate non è uno spazio degli stati con una dinamica liscia su cui valgano i teoremi di stabilità. Usare la stessa parola — “equilibrio”, “attrattore”, “punto fisso” — per tutti e quattro i casi è comodo e legittimo, ma chi scrive e chi legge deve sapere, caso per caso, se sta maneggiando un teorema o una metafora. Scambiare l’analogia per il teorema è il modo più rapido per costruire un’argomentazione che sembra rigorosa e non lo è.

Collegamenti

Stato, transizione, traiettoria — fornisce stato, traiettoria, attrattore e bacino di attrazione. Questo capitolo prende quegli oggetti e li classifica per stabilità: dice quali attrattori reggono un disturbo e quali no.
Sistemi aperti, chiusi, dissipativi — i sistemi dissipativi, che perdono energia, sono quelli per cui la metafora della pallina che scende è fedele e per cui gli equilibri asintoticamente stabili sono tipici. La distinzione spiega anche dove la metafora si rompe.
Sistema, ambiente, confine, stato: il vocabolario di base — il vocabolario di sistema, stato e processo su cui poggia tutto il capitolo.
ODE a intuizione per dinamiche e controllo — le equazioni differenziali ordinarie sono il linguaggio in cui equilibri e stabilità si formulano per i sistemi a tempo continuo.
Hessiana, curvatura, condizionamento — la funzione di Lyapunov definita positiva è una conca; la condizione che l’equilibrio ne sia il minimo è gradiente nullo più hessiana definita positiva.
Derivate parziali, gradienti, Jacobiani — la Jacobiana della dinamica valutata all’equilibrio è l’oggetto su cui si fa l’analisi degli autovalori del primo metodo.
Autovalori e autovettori a intuizione — la parte reale (tempo continuo) o il modulo (tempo discreto) degli autovalori della Jacobiana decide la stabilità del sistema linearizzato.
SGD, momentum, Adam — la loss landscape e la convergenza o divergenza dell’ottimizzatore sono un sistema dinamico la cui stabilità è il tema di questo capitolo.
Bellman e programmazione dinamica e Iterazione del valore e della policy — la value function ottima è il punto fisso dell’operatore di Bellman; la convergenza dell’iterazione è stabilità garantita per teorema di Banach.
L’equilibrio di Nash e la sua intuizione — l’equilibrio di Nash è un punto fisso; la sua stabilità è una domanda distinta dalla sua esistenza, e questo capitolo dà gli strumenti per porla.
Catene di Markov, stazionarietà, mixing — la distribuzione stazionaria di una catena è un punto fisso dell’operatore di transizione, e la velocità di mixing è la velocità di convergenza a quell’equilibrio.
nonlinearita-tipping-points (in preparazione) — le biforcazioni di questo capitolo sono il linguaggio formale dei tipping point dei sistemi complessi.

Per andare oltre

A. M. Lyapunov, The General Problem of the Stability of Motion (1892). Tradotto in inglese da A. T. Fuller per l’International Journal of Control (1992, edizione del centenario). La fonte originale: la definizione di stabilità e i due metodi, dalla penna di chi li ha inventati.
J. C. Maxwell, On Governors, Proceedings of the Royal Society of London, vol. 16 (1868). Disponibile sul sito della Clerk Maxwell Foundation. Breve, storicamente decisivo: la prima analisi di stabilità di un sistema a feedback.
S. H. Strogatz, Nonlinear Dynamics and Chaos (2a ed., 2015). Il testo introduttivo di riferimento su equilibri, stabilità, cicli limite, biforcazioni e caos, scritto con un’attenzione rara all’intuizione geometrica.
P. C. Parks, “A. M. Lyapunov’s stability theory — 100 years on”, IMA Journal of Mathematical Control and Information, vol. 9 (1992). Rassegna del centenario: contesto storico della tesi e sviluppo dei due metodi.
“Bellman operator convergence enhancements in reinforcement learning algorithms”, arXiv:2505.14564 (2025). Per il ponte verso l’AI: l’operatore di Bellman come contrazione e la convergenza del reinforcement learning letta come stabilità di un’iterazione.