Osservabilità e controllabilità: cosa posso misurare, cosa posso governare

Due domande gemelle su un sistema: con le leve che ho, posso portarlo dove voglio? E guardando solo quello che mostra, posso sapere com’è fatto dentro? Questo capitolo dà a entrambe una risposta strutturale — e mostra che sono la stessa domanda letta in due direzioni.

Perché questo capitolo

Nel 1960, al primo congresso della International Federation of Automatic Control a Mosca, un ingegnere trentenne presenta un articolo che sposta il baricentro di una disciplina. Rudolf Emil Kalman (ingegnere e matematico ungherese-statunitense, 1930-2016) non propone un nuovo regolatore né un nuovo filtro: propone due domande che, prima di lui, nessuno aveva posto bene.

La prima: dato un sistema su cui posso agire, posso portarlo da qualsiasi configurazione interna a qualsiasi altra, in tempo finito? La seconda: dato un sistema di cui vedo solo le uscite, posso ricostruire la sua configurazione interna che non misuro direttamente? La prima domanda riguarda il governo, la seconda la conoscenza. Kalman le chiama controllabilità e osservabilità.

Quello che colpisce non è la difficoltà delle domande, ma il fatto che fino a quel momento non avessero una forma precisa. La teoria del controllo degli anni ‘50 lavorava quasi tutta sul legame ingresso-uscita: davi un segnale a una scatola, guardavi cosa ne usciva, e studiavi quel legame. In quel mondo, “lo stato interno” non era nemmeno un oggetto di cui si potesse parlare con rigore, e quindi non si poteva chiedere se fosse raggiungibile o ricostruibile.

Questo capitolo conta per chi costruisce sistemi AI per due motivi, uno solido e uno analogico, e li teniamo separati per onestà. Il motivo solido: controllabilità e osservabilità sono test di fattibilità. Prima di provare a controllare o a monitorare qualsiasi cosa, dicono se il problema ha soluzione in linea di principio. È una disciplina mentale preziosa — chiedersi “è possibile?” prima di chiedersi “come?”.

Il motivo analogico: le due domande di Kalman hanno la stessa forma logica di due problemi centrali dell’AI di oggi. Capire lo stato interno di un modello guardando solo i suoi token — l’interpretabilità — è un problema di tipo osservabilità. Portare un modello dove vogliamo con prompt, fine-tuning o activation steering — lo steering — è un problema di tipo controllabilità. Sono analogie, non teoremi, e le marcheremo come tali. Ma sono analogie che danno una grammatica per pensare, e quella grammatica vale il capitolo.

C’è una terza ragione, più sottile, e riguarda il modo di ragionare. Chi costruisce sistemi tende a saltare subito al “come”: come faccio a controllare questa cosa, come faccio a monitorare quell’altra. Controllabilità e osservabilità impongono una pausa prima di quel salto, e fanno la domanda giusta: è possibile? Se un componente del sistema è strutturalmente fuori dalle leve, nessuno sforzo implementativo lo renderà governabile; se uno stato non lascia traccia nelle uscite, nessun logging più fitto lo renderà visibile. Spostare il problema da “non ci sono ancora riuscito” a “non è possibile per come è fatto il sistema” cambia cosa si fa dopo: non si itera sull’algoritmo, si cambia il sistema. È una distinzione che vale ben oltre la teoria del controllo, e questo capitolo la insegna nel suo caso più pulito.

Contesto

Per capire perché le domande di Kalman erano nuove, serve sapere da dove veniva la teoria del controllo.

Negli anni ‘30 e ‘40 il controllo era nato come ingegneria degli amplificatori e dei servomeccanismi, e il suo linguaggio era il dominio della frequenza. Si rappresentava un sistema con la sua funzione di trasferimento: una formula che dice come il sistema amplifica o attenua un segnale di ingresso a seconda della sua frequenza. Strumenti come i diagrammi di Bode (Hendrik Bode, ingegnere statunitense dei Bell Labs) e il criterio di Nyquist (Harry Nyquist, ingegnere svedese-statunitense, stessi Bell Labs) erano potenti e maturi.

Quel linguaggio aveva un limite preciso. Funzionava benissimo per sistemi con un ingresso e un’uscita, ma diventava goffo per sistemi con molti ingressi e molte uscite, e non sapeva trattare bene il controllo ottimo — il problema di controllare un sistema minimizzando un costo. Servivano la guida missilistica, i programmi spaziali, i processi industriali complessi: tutti sistemi con molte variabili intrecciate.

La mossa di Kalman, alla fine degli anni ‘50, è cambiare l’oggetto di studio. Invece della funzione di trasferimento, mette al centro lo stato: il vettore di numeri che riassume tutto ciò che serve sapere del passato del sistema per predirne il futuro. È il concetto sviluppato in Stato, transizione, traiettoria. La rappresentazione che ne deriva — la rappresentazione in spazio di stato — descrive il sistema con due equazioni: una per come lo stato evolve, una per come lo stato si traduce in uscita misurabile.

È solo dopo questo spostamento che le due domande diventano ponibili. Se “lo stato” è un oggetto matematico esplicito, ha senso chiedersi se posso raggiungerne ogni valore (controllabilità) e se posso dedurlo dalle uscite (osservabilità). Nel mondo della funzione di trasferimento queste domande non avevano nemmeno una sede.

Lo spostamento non era solo di notazione. La funzione di trasferimento è una vista esterna del sistema: registra come l’ingresso si traduce in uscita, e niente altro. Lo spazio di stato è una vista interna: nomina esplicitamente le variabili che vivono dentro la scatola. Due sistemi con dinamiche interne diverse possono avere la stessa identica funzione di trasferimento — sono indistinguibili da fuori, ma non sono lo stesso sistema. Kalman mostra che proprio questa differenza, invisibile alla vecchia teoria, è dove vivono controllabilità e osservabilità. La decomposizione di cui parleremo alla fine della prossima sezione rende la cosa precisa: la funzione di trasferimento vede solo un quarto del sistema.

Kalman le formalizza in una raffica di lavori. Nel 1960, oltre all’articolo IFAC, pubblica “A New Approach to Linear Filtering and Prediction Problems” sul Journal of Basic Engineering — il paper del filtro di Kalman, di cui parleremo più avanti. Nel 1963, sulla SIAM Journal on Control, l’articolo “Mathematical Description of Linear Dynamical Systems” dà alla teoria la sua forma matura, inclusa la decomposizione di un sistema in parti controllabili e osservabili. Tre pilastri della teoria moderna del controllo, concentrati in pochi anni.

C’è anche un contesto di urgenza pratica, ed è il programma spaziale. Alla fine degli anni ‘50, controllare la traiettoria di un missile o di una capsula è un problema con molte variabili intrecciate — posizione, velocità, assetto su tre assi — e con misure rumorose e parziali da sensori inerziali. Il vecchio armamentario nel dominio della frequenza non basta. Non è un caso che il filtro di Kalman trovi una delle sue prime applicazioni serie nel programma Apollo, nel sistema di navigazione che stima posizione e velocità della capsula durante il volo verso la Luna. La teoria nasce astratta, ma le domande che la spingono — posso governare questo veicolo? posso sapere dov’è? — sono concretissime.

Una nota di parentela con i capitoli vicini. La stabilità, trattata in Equilibrio, stabilità, attrattori, risponde alla domanda “dove va il sistema se lo lascio a sé stesso”. Controllabilità e osservabilità rispondono a domande diverse: non dove va da solo, ma dove posso portarlo e cosa riesco a sapere di lui. Sono tre proprietà strutturali distinte dello stesso oggetto, e confonderle è l’errore più frequente. Un sistema instabile può benissimo essere controllabile — anzi, meglio così, perché allora lo posso stabilizzare.

L’intuizione

Prima di qualsiasi matrice, conviene afferrare le due proprietà da angoli diversi. Useremo due angoli distinti: il primo è una metafora meccanica concreta, il secondo è una lettura geometrica che porta direttamente al formalismo.

Primo angolo: le leve e gli oblò

Immagina una macchina industriale chiusa dentro un armadio di metallo. Non puoi aprirlo. Hai due tipi di accesso al suo interno.

Sul fianco dell’armadio ci sono alcune leve: le puoi spingere e tirare. Sono gli ingressi del sistema, ciò su cui puoi agire. Sul fronte ci sono alcuni oblò di vetro: puoi guardarci dentro, ma vedi solo quello che capita di fronte all’oblò. Sono le uscite, ciò che riesci a misurare.

Dentro l’armadio, la macchina ha decine di ingranaggi che si muovono. La loro configurazione complessiva — la posizione di ogni ingranaggio — è lo stato del sistema. Tu non lo vedi tutto, e non lo tocchi tutto: lo raggiungi solo attraverso le leve e lo osservi solo attraverso gli oblò.

La controllabilità è una domanda sulle leve. Con queste leve, posso portare ogni singolo ingranaggio in qualsiasi posizione io voglia? Attenzione: non serve che una leva sia collegata direttamente a ogni ingranaggio. Basta che lo sia attraverso la catena cinematica — gli ingranaggi si trasmettono il movimento l’uno all’altro. Se però c’è un ingranaggio che nessuna leva può raggiungere, né direttamente né tramite la catena, allora quel pezzo della macchina è fuori dal tuo controllo. Puoi muovere tutto il resto come vuoi, ma quello no, mai.

L’osservabilità è la domanda gemella, sugli oblò. Guardando solo quello che si vede dagli oblò, mentre la macchina lavora, riesco a dedurre la posizione di ogni ingranaggio, anche di quelli che non vedo direttamente? Anche qui non serve un oblò di fronte a ogni ingranaggio: se un ingranaggio nascosto fa muovere, prima o poi, qualcosa che è visibile, allora la sua posizione lascia una traccia osservabile. Se però esistono due configurazioni interne diverse che danno esattamente la stessa vista da tutti gli oblò, in ogni istante, allora non potrai mai distinguerle. Per te, dall’esterno, sono lo stesso stato.

Il punto da portare via da questa metafora è che le due proprietà sono indipendenti. Una macchina può essere controllabile ma non osservabile: governi ogni ingranaggio, ma non sai bene cosa stai facendo perché gli oblò non ti mostrano tutto. Può essere osservabile ma non controllabile: vedi perfettamente ogni ingranaggio, ma alcuni non li puoi toccare. Può essere entrambe, o nessuna delle due. Sono quattro casi, e tornano nella decomposizione di Kalman alla fine della prossima sezione.

Secondo angolo: coprire lo spazio applicando la dinamica

C’è un secondo modo di vedere la coppia, più astratto ma più vicino al formalismo, ed è una questione di sottospazi — di porzioni dello spazio di stato.

Ricorda dallo spazio degli stati che ogni configurazione del sistema è un punto, e la dinamica è una regola che muove quel punto. Le leve, gli ingressi, sono spinte che puoi applicare al punto. Gli oblò, le uscite, sono proiezioni del punto: ti mostrano solo alcune coordinate, o alcune combinazioni di coordinate.

Per la controllabilità, parti dall’origine dello spazio di stato e chiediti: dove posso arrivare? Le leve ti danno alcune direzioni di spinta dirette — chiamiamole le direzioni di partenza. Ma c’è di più: una direzione che spingi adesso viene presa dalla dinamica e trasportata altrove al passo successivo. Quindi le direzioni che puoi davvero raggiungere sono le direzioni di partenza, più dove la dinamica le porta dopo un passo, più dove le porta dopo due passi, e così via. L’insieme di tutto questo è un sottospazio: il sottospazio controllabile. Se questo sottospazio riempie l’intero spazio di stato, sei controllabile. Se è più piccolo, c’è una parte di spazio fuori portata: nessuna sequenza di spinte ti ci porta.

Per l’osservabilità, il ragionamento è il duale esatto. Chiediti: quali stati iniziali distinti producono uscite distinte? L’uscita di adesso ti fa vedere lo stato attraverso una certa proiezione — gli oblò. L’uscita un istante dopo ti fa vedere lo stato attraverso la proiezione composta con un passo di dinamica. L’uscita due istanti dopo, con due passi di dinamica. Se l’insieme di tutti questi “punti di vista nel tempo” è abbastanza ricco da distinguere ogni coppia di stati, sei osservabile. Se invece esistono due stati che cadono nello stesso valore sotto tutti questi punti di vista, sono indistinguibili: la loro differenza vive in un sottospazio che le uscite non vedono mai, il sottospazio non osservabile.

L’intuizione che unifica i due casi: in entrambi guardi se, applicando ripetutamente la dinamica, riesci a “coprire” tutto lo spazio. Nel caso del controllo spingi in avanti le direzioni delle leve. Nel caso dell’osservazione propaghi nel tempo i punti di vista degli oblò. Stessa struttura — applicare la dinamica più volte e vedere se si copre tutto — letta in due direzioni temporali opposte. Il controllo guarda avanti, verso dove posso andare. L’osservazione ricostruisce indietro, verso da dove sono partito.

Questa simmetria non è una coincidenza estetica. È la dualità, e la sezione seguente la rende precisa.

Terzo angolo: l’informazione che entra e l’informazione che esce

C’è un terzo modo di guardare la coppia, ed è quello che la lega più strettamente al pensiero sull’AI: pensarle come due bilanci di informazione.

La controllabilità è un bilancio sull’informazione che entra. Ogni ingresso che applichi è un atto: porta nello stato del sistema una certa quantità di “scelta tua”. Se gli ingressi, propagati dalla dinamica, riescono a iniettare scelta in ogni direzione dello spazio di stato, allora ogni coordinata dello stato porta la tua impronta — sei controllabile. Se invece esiste una direzione in cui la tua scelta non arriva mai, quella coordinata evolve indipendentemente da te: il sistema, lungo quella direzione, fa quello che vuole lui.

L’osservabilità è il bilancio opposto, sull’informazione che esce. Ogni uscita che leggi è un’osservazione: estrae dallo stato una certa quantità di “informazione su com’è fatto dentro”. Se le uscite, accumulate nel tempo, riescono a estrarre informazione su ogni direzione dello spazio di stato, allora ogni coordinata lascia una traccia leggibile — sei osservabile. Se esiste una direzione lungo cui nessuna uscita, in nessun istante, porta informazione, quella coordinata resta un segreto: il sistema la tiene per sé.

Questo terzo angolo chiarisce perché le due proprietà siano davvero gemelle e non semplicemente “due cose della teoria del controllo”. Sono due conti sulla stessa moneta — l’informazione — fatti nei due versi: quanto del tuo arbitrio entra nello stato, quanto dello stato esce verso di te. È anche l’angolo che rende meno sorprendente il ponte verso l’AI: l’interpretabilità chiede quanta informazione sul modello esce nei suoi token; lo steering chiede quanta della tua intenzione entra nel suo comportamento. Le stesse due domande, su un sistema che non è lineare e su cui i teoremi non valgono — ma le domande, come domande, sono identiche.

La meccanica

Mettiamo il formalismo, un passo alla volta, restando sul caso più semplice e più studiato: i sistemi lineari tempo-invarianti.

Lo scenario lineare

Un sistema lineare tempo-invariante — abbreviato LTI — con n variabili di stato si descrive con due equazioni:

$\dot{x} = A x + B u$ $y = C x + D u$

Sciogliamo ogni simbolo, perché tutto il resto ci si appoggia.

$x$ è lo stato: un vettore di $n$ numeri, la configurazione interna del sistema.
$\dot{x}$ è la velocità con cui lo stato cambia: dove e quanto si muove $x$ adesso.
$u$ è l’ingresso: un vettore di $m$ numeri, le leve su cui puoi agire.
$y$ è l’uscita: un vettore di $p$ numeri, gli oblò, ciò che misuri.
$A$ è una matrice $n \times n$ , la dinamica interna: dice come lo stato evolve da solo, senza ingressi.
$B$ è una matrice $n \times m$ : dice come gli ingressi entrano nello stato — quali leve toccano quali variabili.
$C$ è una matrice $p \times n$ : dice come lo stato si proietta nelle uscite — quali oblò mostrano quali variabili.
$D$ è una matrice $p \times m$ , il collegamento diretto ingresso-uscita; spesso è zero e nelle prossime righe lo ignoriamo.

In parole povere: la prima equazione dice come la macchina si muove, la seconda dice cosa se ne vede da fuori. “Lineare” significa che le equazioni non hanno potenze, prodotti o funzioni storte delle variabili — solo somme pesate. “Tempo-invariante” significa che le matrici $A, B, C, D$ non cambiano nel tempo. È un caso particolare, ma è quello dove la teoria è più pulita, ed è la base da cui partono tutte le estensioni.

Il criterio di controllabilità di Kalman

La domanda della controllabilità — posso portare lo stato ovunque agendo su $u$ ? — diventa, per un sistema LTI, una domanda su una sola matrice.

Si costruisce la matrice di controllabilità, affiancando colonne:

$\mathcal{C} = \begin{bmatrix} B & AB & A^2 B & \cdots & A^{n-1}B \end{bmatrix}$

Leggiamola pezzo per pezzo, riprendendo il secondo angolo dell’intuizione. Il blocco $B$ sono le direzioni che le leve toccano direttamente, subito. Il blocco $AB$ sono quelle stesse direzioni dopo che la dinamica le ha trasportate di un passo: $A$ applicata a $B$ . Il blocco $A^2 B$ dopo due passi. E così via.

Perché ci si ferma a $A^{n-1}B$ e non si continua? Per un risultato di algebra lineare, il teorema di Cayley-Hamilton: ogni matrice $n \times n$ soddisfa la propria equazione caratteristica, e da questo segue che $A^n$ e tutte le potenze più alte si possono scrivere come combinazioni lineari di $A^0, A^1, \dots, A^{n-1}$ . Aggiungere $A^n B$ alla matrice non porterebbe nessuna direzione nuova. Le direzioni raggiungibili si esauriscono dopo $n-1$ passi.

Il criterio è secco:

$\text{il sistema è controllabile} \iff \operatorname{rank}(\mathcal{C}) = n$

Il rango di una matrice è il numero di direzioni indipendenti che le sue colonne generano. Se le colonne di $\mathcal{C}$ generano tutte e $n$ le direzioni dello spazio di stato, allora ogni stato è raggiungibile: il sistema è controllabile. Se invece $\operatorname{rank}(\mathcal{C}) = r < n$ , le colonne coprono solo un sottospazio di dimensione $r$ — il sottospazio controllabile — e restano $n - r$ direzioni che nessun ingresso può raggiungere. Quelle direzioni sono la “stanza chiusa” dello spazio di stato.

In parole povere: costruisci una matrice impilando le potenze della dinamica applicate alle leve, e conti quante direzioni indipendenti vengono fuori. Se sono tutte, governi tutto.

Vale la pena vedere il criterio su un sistema minuscolo, per toccare con mano cosa significa “il rango cade”. Prendi un sistema a due stati con dinamica $A = \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix}$ e una sola leva che entra solo nel secondo stato, $B = \begin{bmatrix} 0 \\ 1 \end{bmatrix}$ . Calcoli $AB$ : la dinamica prende la leva e la trasporta. $AB = \begin{bmatrix} 1 \\ 0 \end{bmatrix}$ . La matrice di controllabilità è $\mathcal{C} = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix}$ : le sue due colonne puntano in direzioni diverse, il rango è 2, il sistema è controllabile. La leva tocca direttamente il secondo stato; la dinamica $A$ , che lega il primo stato al secondo, propaga quella spinta anche al primo. Una leva sola, ma la dinamica fa da staffetta.

Cambia ora $A$ in $\begin{bmatrix} 0 & 0 \\ 0 & 0 \end{bmatrix}$ — nessuna dinamica interna — con la stessa $B$ . Adesso $AB = \begin{bmatrix} 0 \\ 0 \end{bmatrix}$ , e la matrice di controllabilità ha una colonna intera di zeri: rango 1, non 2. Il primo stato è irraggiungibile, perché la leva non lo tocca e non c’è dinamica che faccia da staffetta. Stessa leva, dinamica diversa, verdetto opposto: la conferma numerica di quanto detto a parole, la controllabilità è un fatto sulla coppia $(A, B)$ , mai su $B$ da sola.

Il criterio di osservabilità di Kalman

Per l’osservabilità — posso ricostruire lo stato guardando solo $y$ ? — la costruzione è speculare. Si impila la matrice di osservabilità, stavolta in verticale:

$\mathcal{O} = \begin{bmatrix} C \\ CA \\ CA^2 \\ \vdots \\ CA^{n-1} \end{bmatrix}$

Riga per riga, di nuovo seguendo l’intuizione. Il blocco $C$ è come gli oblò vedono lo stato adesso. Il blocco $CA$ è come l’uscita all’istante successivo dipende dallo stato di adesso — la proiezione $C$ composta con un passo di dinamica $A$ . Il blocco $CA^2$ è due istanti dopo. E Cayley-Hamilton ferma di nuovo la costruzione a $n-1$ : nessun punto di vista oltre quello aggiunge informazione.

Il criterio:

$\text{il sistema è osservabile} \iff \operatorname{rank}(\mathcal{O}) = n$

Se il rango è pieno, i punti di vista accumulati nel tempo distinguono ogni coppia di stati: lo storico dell’uscita determina univocamente lo stato. Se $\operatorname{rank}(\mathcal{O}) = q < n$ , c’è un sottospazio non osservabile di dimensione $n - q$ : due stati che differiscono per un vettore in quel sottospazio producono la stessa identica uscita per ogni tempo futuro. Sono, dall’esterno, indistinguibili.

Un caso minuscolo rende concreto il “non osservabile”. Riprendi i due carrelli disaccoppiati dell’intuizione: dinamica $A$ diagonale, nessun legame tra $x_1$ e $x_2$ . Supponi di avere un sensore che misura solo la posizione del primo carrello, $C = \begin{bmatrix} 1 & 0 \end{bmatrix}$ . Calcoli $CA$ : ancora una riga con la seconda componente nulla. La matrice di osservabilità $\mathcal{O} = \begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix}$ ha rango 1, non 2. Il sistema non è osservabile, e si vede perché: la posizione del secondo carrello non compare in nessuna uscita, né adesso né mai. Due situazioni che differiscono solo per dove si trova il carrello 2 danno esattamente la stessa lettura del sensore per sempre. Quella differenza è un vettore del sottospazio non osservabile. Esattamente come per la controllabilità, basta accoppiare i due carrelli con una molla — rendere $A$ non diagonale — perché $CA$ acquisti una seconda componente, il rango salga a 2, e il segreto del carrello 2 finisca, prima o poi, dentro l’uscita.

Perché serve il tempo: ricostruire lo stato da una sola uscita

Un punto della matrice di osservabilità merita di essere reso esplicito, perché è controintuitivo. Si può ricostruire uno stato di molte dimensioni avendo a disposizione una sola uscita scalare — un solo numero misurato. A prima vista sembra impossibile: un numero solo contro molte variabili.

La chiave è il tempo. Non hai un solo numero: hai una sequenza di numeri, l’uscita campionata istante dopo istante. La misura di adesso vincola lo stato in un modo; la misura dell’istante dopo lo vincola in un altro, perché nel frattempo la dinamica ha mosso lo stato e l’uscita ne riflette una combinazione diversa. Ogni nuovo campione è una nuova equazione.

Accumulando $n$ campioni accumuli $n$ vincoli, e se quei vincoli sono indipendenti — è esattamente ciò che il rango pieno di $\mathcal{O}$ garantisce — bastano a fissare univocamente le $n$ componenti dello stato iniziale. Una sola uscita, osservata abbastanza a lungo, vale come $n$ misure simultanee. È il motivo per cui un sistema con un solo sensore può essere pienamente osservabile, e per cui l’osservabilità è una proprietà del sistema nel tempo, non di un singolo istante.

Specularmente, per la controllabilità è il tempo a permettere a una sola leva di governare molte variabili: applichi un ingresso adesso che muove certe direzioni, poi un ingresso dopo che, grazie alla dinamica che ha ruotato la scena, ne muove altre. Una leva nel tempo vale come molte leve simultanee. Il tempo è la risorsa che entrambe le proprietà sfruttano.

La dualità

Ora il fatto elegante, quello che giustifica il titolo doppio del capitolo. Mettiamo le due matrici una accanto all’altra e guardiamole.

$\mathcal{C}(A,B) = \begin{bmatrix} B & AB & \cdots & A^{n-1}B \end{bmatrix} \qquad \mathcal{O}(A,C) = \begin{bmatrix} C \\ CA \\ \vdots \\ CA^{n-1} \end{bmatrix}$

La matrice di osservabilità del sistema $(A, C)$ , se la trasponi — la ribalti scambiando righe e colonne — è la matrice di controllabilità di un altro sistema, quello con dinamica $A^T$ e leve $C^T$ :

$\mathcal{O}(A,C)^T = \mathcal{C}(A^T, C^T)$

Da questa identità di matrici segue un’identità di proprietà, e questo è il principio di dualità:

$\text{il sistema } (A,B,C) \text{ è osservabile} \iff \text{il sistema duale } (A^T, C^T, B^T) \text{ è controllabile}$

Osservare un sistema è la stessa cosa che controllare il suo sistema trasposto. La frase merita di essere fermata un momento. Non stiamo dicendo che osservabilità e controllabilità si somigliano: stiamo dicendo che sono lo stesso teorema, applicato a due sistemi legati dalla trasposizione. È un’equivalenza in senso forte, dimostrabile — la classe di affermazione più alta, non un’analogia didattica.

La conseguenza pratica è che la teoria si dimezza. Ogni risultato sulla controllabilità — un criterio, un teorema di esistenza, una costruzione — ha un gemello sull’osservabilità, ottenuto trasponendo. Si dimostra una volta, si ottiene l’altro gratis. Quando più avanti diremo che la controllabilità garantisce l’esistenza di un regolatore, la dualità ci dirà subito che l’osservabilità garantisce l’esistenza di un osservatore. Non serve una seconda dimostrazione.

Vale la pena dire perché la dualità è “profonda” e non solo “comoda”. Comoda lo è di sicuro — dimezza le dimostrazioni. Ma dice anche qualcosa di concettuale: governare e conoscere, che sembrano attività di natura opposta, sono in realtà lo stesso problema matematico visto da due lati. L’azione che spinge lo stato in avanti nel tempo e l’osservazione che lo ricostruisce all’indietro sono legate da una trasposizione, cioè da un’operazione perfettamente simmetrica. Non è ovvio a priori che debba essere così; è un fatto, e una volta visto cambia il modo di pensare alla coppia azione-percezione, dentro e fuori la teoria del controllo.

C’è una formulazione alternativa della stessa simmetria, il criterio PBH (dai nomi di Vasile Popov, Vitold Belevitch e Malo Hautus, ingegneri che lo elaborarono indipendentemente). In quella forma, il sistema è controllabile se e solo se nessun autovettore sinistro della dinamica $A$ è ortogonale a tutte le colonne di $B$ ; ed è osservabile se e solo se nessun autovettore destro di $A$ vive nel nucleo di $C$ . La simmetria sinistra-destra degli autovettori è la dualità riscritta con un altro alfabeto.

Dal sì/no al quanto: i gramiani

Il criterio di rango ha un difetto che la pratica sente subito: è binario. Dice “controllabile” o “non controllabile”, e basta. Ma due sistemi entrambi controllabili possono essere governabili in modi molto diversi: in uno raggiungi ogni stato con ingressi modesti, nell’altro certi stati richiedono spinte enormi. Il rango non li distingue.

Lo strumento che misura il grado si chiama gramiano. Senza entrare nella sua costruzione — è un integrale, e la sua trattazione completa appartiene a un corso di controllo — basta sapere cosa fa: il gramiano di controllabilità è una matrice che, lungo ogni direzione dello spazio di stato, dice quanta “energia di ingresso” serve per raggiungere quella direzione.

Le direzioni facili da raggiungere corrispondono ai valori grandi del gramiano; quelle quasi irraggiungibili ai valori piccolissimi. Un sistema formalmente controllabile ma con un gramiano molto sbilanciato — alcune direzioni enormemente più costose di altre — è quello che si chiama mal condizionato: controllabile sulla carta, fragile nella pratica.

Per dualità esiste il gramiano di osservabilità, che misura quanta informazione ogni direzione dello stato versa nelle uscite. Le direzioni con valore piccolo sono quelle quasi nascoste: il plateau della batteria, nell’Esempio 3, è esattamente una direzione di gramiano di osservabilità piccolo. I gramiani sono anche la base dei metodi numerici robusti citati nell’Esempio 2 e della riduzione di modello.

La decomposizione di Kalman

L’ultima tessera della meccanica. Abbiamo detto che controllabilità e osservabilità sono indipendenti: quattro combinazioni possibili. Kalman, nel 1963, mostra che questo non è solo un elenco di casi, ma una struttura.

Ogni sistema LTI, con un opportuno cambio di coordinate, si scompone in quattro sottosistemi: la parte controllabile e osservabile, la parte controllabile e non osservabile, la parte non controllabile e osservabile, la parte non controllabile e non osservabile. È la decomposizione di Kalman.

Il fatto che dà il senso a tutta la decomposizione: solo il sottosistema controllabile e osservabile compare nella funzione di trasferimento ingresso-uscita. Le altre tre parti sono invisibili al legame ingresso-uscita. Una parte non controllabile non risponde all’ingresso; una parte non osservabile non si manifesta nell’uscita; in entrambi i casi, guardando solo come l’ingresso si traduce in uscita, quei pezzi di sistema non li vedi.

È la spiegazione precisa di una cosa detta nel “Contesto”: la rappresentazione in spazio di stato è più informativa di quella ingresso-uscita. La funzione di trasferimento è una vista parziale, che cancella tutto ciò che non è insieme controllabile e osservabile. Lo spazio di stato vede anche il resto. Per chi costruisce sistemi, la lezione è generale: un sistema può avere dinamiche interne che il suo comportamento esterno non rivela. Giudicare un sistema solo da ciò che entra e ciò che esce significa, letteralmente, ignorarne tre quarti.

La decomposizione spiega anche un fenomeno apparentemente paradossale, la cancellazione polo-zero. Quando in un sistema un polo e uno zero si cancellano nella funzione di trasferimento, non significa che la dinamica corrispondente sia sparita: significa che è finita in una delle tre parti invisibili — non controllabile o non osservabile. È ancora lì dentro, evolve, e se è instabile può far esplodere il sistema senza che il legame ingresso-uscita ne mostri il minimo segnale fino al disastro. È uno dei motivi storici per cui la teoria in spazio di stato ha soppiantato l’analisi puramente ingresso-uscita per i sistemi critici.

Esempi

Tre esempi eterogenei: uno numerico per vedere il criterio di rango all’opera, uno in codice, due scenari reali — uno di stima fisica, uno che chiarisce un equivoco terminologico.

Esempio 1 — due carrelli, una leva (numerico)

Immagina due carrelli, ciascuno sul proprio binario, senza alcun collegamento tra loro. Lo stato è la coppia delle due posizioni, $x = (x_1, x_2)$ . C’è una sola leva, e spinge solo il carrello 1. La dinamica non accoppia i due carrelli.

In termini di matrici, con uno stato a due dimensioni, la cosa che conta è che la matrice $B$ ha la seconda componente nulla — la leva non tocca il carrello 2 — e la matrice $A$ è diagonale, non mescola le due posizioni. La matrice di controllabilità $\mathcal{C} = [B \;\; AB]$ ha allora entrambe le colonne con seconda componente zero. Il suo rango è 1, non 2.

Il criterio dice: $\operatorname{rank}(\mathcal{C}) = 1 < 2 = n$ , il sistema non è controllabile. E si vede a occhio perché: il carrello 2 non è raggiungibile da nessun ingresso. La sua posizione è la “stanza chiusa”.

Ora cambia una cosa sola: metti una molla che collega i due carrelli. La dinamica $A$ ora accoppia $x_1$ e $x_2$ — muovere il carrello 1 trascina il carrello 2 attraverso la molla. Il blocco $AB$ acquista una seconda componente diversa da zero: la dinamica trasporta la spinta della leva fino al secondo carrello. Il rango di $\mathcal{C}$ sale a 2, e il sistema diventa controllabile.

La lezione numerica è precisa: la controllabilità non dipende solo da dove agisci — la matrice $B$ — ma da come la dinamica $A$ propaga la tua azione. Una leva su un solo componente basta a controllare tutto il sistema, purché la dinamica colleghi quel componente a tutti gli altri.

Esempio 2 — il test di rango in codice

Il criterio di Kalman è direttamente eseguibile. Bastano la costruzione della matrice e una funzione di rango.

import numpy as np

def controllabilita(A, B):
    n = A.shape[0]
    blocchi = [B]
    potenza = np.eye(n)
    for _ in range(1, n):
        potenza = potenza @ A
        blocchi.append(potenza @ B)
    Co = np.hstack(blocchi)
    return np.linalg.matrix_rank(Co), n

def osservabilita(A, C):
    n = A.shape[0]
    blocchi = [C]
    potenza = np.eye(n)
    for _ in range(1, n):
        potenza = potenza @ A
        blocchi.append(C @ potenza)
    Ob = np.vstack(blocchi)
    return np.linalg.matrix_rank(Ob), n

Le due funzioni costruiscono la matrice di Kalman impilando le potenze della dinamica — affiancate per la controllabilità, sovrapposte per l’osservabilità — e ne misurano il rango. Se il rango torna uguale a $n$ , la proprietà è piena.

Vale la pena guardare la simmetria del codice. Le due funzioni differiscono per np.hstack contro np.vstack e per l’ordine del prodotto matriciale (potenza @ B contro C @ potenza). È la dualità resa codice: trasporre l’una dà l’altra. Anzi, la dualità dà un test gratuito di correttezza — osservabilita(A, C) deve restituire lo stesso rango di controllabilita(A.T, C.T).

Un avvertimento pratico. Il test di rango diretto è didatticamente limpido ma numericamente fragile: per sistemi grandi, costruire $A^{n-1}$ amplifica gli errori di arrotondamento, e decidere se il rango è “pieno” diventa una scelta di soglia. Le librerie di controllo serie evitano questa strada e usano i gramiani di controllabilità e osservabilità — matrici costruite per integrazione che danno lo stesso verdetto in modo numericamente stabile, e che in più misurano quanto un sistema è controllabile, non solo se lo è.

Esempio 3 — la carica di una batteria (scenario reale)

Lo stato di carica di una batteria al litio — la sua “percentuale” — non è una quantità che si misuri direttamente. Non esiste un sensore di carica. Quello che si misura è la tensione ai morsetti e la corrente che entra ed esce.

La domanda è di osservabilità pura: la tensione e la corrente, osservate nel tempo, contengono abbastanza informazione per ricostruire lo stato di carica che non vedo? Per buona parte della curva di scarica la risposta è sì, e il battery management system di ogni veicolo elettrico e di ogni laptop fa esattamente questo: stima la carica da tensione e corrente, tipicamente con un filtro di Kalman esteso — la versione del filtro per sistemi non lineari.

Ma c’è una regione dove l’osservabilità si degrada. Molte chimiche al litio hanno un lungo plateau nella curva tensione-carica: un tratto in cui la tensione cambia pochissimo mentre la carica varia molto. In quel tratto due stati di carica diversi producono quasi la stessa tensione. La proiezione $C$ — come lo stato si vede nell’uscita — diventa quasi cieca lungo quella direzione. Il sistema non è formalmente non osservabile, ma è “quasi” non osservabile, e la stima della carica diventa incerta proprio lì. È il motivo per cui l’indicatore di batteria di molti dispositivi resta inchiodato a una percentuale per ore e poi crolla in fretta: nel plateau la stima fatica.

Questo esempio mostra che l’osservabilità nella pratica non è sempre un sì/no netto. Esiste un grado: quanto bene l’uscita distingue gli stati. Il criterio di rango dà la versione binaria; i gramiani danno la versione graduata.

C’è anche un risvolto di progetto, che è il motivo per cui la teoria di Kalman conta in pratica e non solo in teoria. Sapendo che il plateau della curva tensione-carica degrada l’osservabilità, un progettista ha due scelte. Può aggiungere una grandezza misurata che lì è informativa — per esempio integrare la corrente nel tempo, il cosiddetto coulomb counting, che non si appiattisce nel plateau. Oppure può scegliere una chimica di batteria con una curva tensione-carica più ripida, più osservabile per costruzione. La teoria non risolve il problema da sola: dice dove il problema è, e questo orienta la soluzione fisica.

Esempio 4 — il pendolo invertito su carrello (scenario reale)

Il pendolo invertito su carrello è l’esempio canonico della teoria del controllo: un’asta incernierata su un carrello, da tenere dritta verso l’alto spostando il carrello avanti e indietro. È un giocattolo da laboratorio, ma è anche il modello-base di tutto ciò che deve restare in equilibrio governando una base mobile — dai razzi che atterrano in verticale ai robot bipedi.

Lo stato ha quattro componenti: posizione del carrello, velocità del carrello, angolo dell’asta, velocità angolare dell’asta. L’unica leva è la forza applicata al carrello. La domanda di controllabilità: con quella sola forza orizzontale posso governare tutte e quattro le variabili, inclusa l’inclinazione dell’asta che la forza non tocca direttamente? La risposta, per il pendolo invertito attorno alla posizione verticale, è sì: il sistema linearizzato è controllabile. La forza sposta il carrello, il carrello in movimento trascina la base dell’asta, e la dinamica accoppia base e inclinazione. La staffetta della dinamica arriva a tutte e quattro le coordinate — è esattamente il fenomeno dell’Esempio 1, con quattro stati invece di due.

La domanda di osservabilità dipende da cosa si misura. Se il sensore dà solo la posizione del carrello, il sistema è comunque osservabile: dalla posizione nel tempo si ricostruiscono velocità, angolo e velocità angolare, perché la dinamica le lega tutte. Ma è osservabilità “debole”: ricostruire l’angolo da sole posizioni del carrello è un calcolo sensibile al rumore. In pratica si mette anche un sensore d’angolo, e l’osservabilità diventa robusta. È lo stesso messaggio della batteria: il rango dice sì/no, la pratica chiede quanto bene — e spesso conviene strumentare di più di quanto il criterio minimo richieda.

Esempio 5 — “observability” nel software non è l’osservabilità di Kalman (scenario reale)

In ingegneria del software, da circa la metà degli anni 2010, “observability” è una parola molto usata: indica la pratica di strumentare un sistema con logging, tracing distribuito e metriche, per poter capire cosa succede dentro un servizio in produzione partendo dai segnali che emette.

Il prestito del termine dalla teoria del controllo è dichiarato: figure di riferimento del settore, come Charity Majors di Honeycomb, citano esplicitamente la definizione di Kalman come origine della parola. Questo è un legame reale, ed è una filiazione terminologica documentata: la parola viene da lì.

Ma la filiazione è solo terminologica, e va detto chiaramente per non scivolare in un’equivalenza falsa. L’osservabilità di Kalman è una proprietà strutturale e binaria: dato un sistema, le sue equazioni determinano se è osservabile, e la risposta è sì o no — non la si “migliora” aggiungendo strumenti. L’observability del software è una proprietà graduale e progettabile: più strumenti il sistema, meglio lo osservi; è una qualità che si costruisce, non un teorema che si verifica.

Tenere distinti i due sensi è importante perché in questa wiki ricorrono entrambi. Quando, nei capitoli sugli agenti, si parla di “osservabilità di un agente” — trace delle decisioni, log degli eventi, eventi strutturati — si intende il senso ingegneristico del software. Quando in questo capitolo si parla di osservabilità, si intende il senso di Kalman. Sono parenti di nome, non la stessa cosa.

Applicazioni pratiche

L’uso classico, nel mondo da cui i concetti vengono, è il progetto di sistemi di controllo. Prima di disegnare un regolatore o un osservatore per un aereo, un processo chimico, un braccio robotico, si verifica controllabilità e osservabilità. Sono test di fattibilità: se la controllabilità fallisce, nessun algoritmo di controllo, per quanto sofisticato, potrà mai portare il sistema dove serve — va cambiata la disposizione fisica degli attuatori. Se fallisce l’osservabilità, nessuno stimatore potrà ricostruire lo stato — vanno aggiunti o spostati i sensori. Il verdetto arriva prima di scrivere una riga di algoritmo.

Da qui il secondo uso: il posizionamento di sensori e attuatori. La teoria non dice solo “sì/no”, dice anche dove intervenire. In una rete elettrica con migliaia di nodi, quali e quante misure di tensione rendono lo stato della rete osservabile? Dove vanno messi gli attuatori perché la rete sia governabile? Sono domande di progetto su cui la decomposizione di Kalman dà risposte operative.

Questo uso ha un risvolto economico spesso decisivo. I sensori costano, e in molti sistemi — un aereo, un impianto chimico, una rete di distribuzione — costano molto. Sapere che l’osservabilità non richiede un sensore per ogni variabile, ma solo un insieme di misure i cui punti di vista, propagati dalla dinamica, coprono tutto lo spazio di stato, permette di strumentare il sistema al minimo necessario invece che al massimo possibile. La teoria, qui, è direttamente un risparmio: dice qual è il numero minimo di sensori sotto il quale lo stato diventa irrecuperabile, e dove vanno collocati perché quel minimo basti.

Il terzo uso è la stima dello stato in tempo reale, e qui entra il filtro di Kalman, di cui parliamo tra poco con più calma. Ovunque ci sia uno stato nascosto da ricostruire da misure rumorose — la posizione di un veicolo da GPS e sensori inerziali, la carica di una batteria, l’assetto di un satellite, la posa di un robot — c’è un osservatore o un filtro che lavora, e c’è a monte una verifica di osservabilità che ne garantisce la possibilità.

C’è poi un uso meno celebrato ma quotidiano: la riduzione di modello. La decomposizione di Kalman dice che le parti né controllabili né osservabili non influenzano il legame ingresso-uscita. Se quelle parti sono anche stabili — non causano guai da sole — si possono semplicemente eliminare dal modello senza cambiare il comportamento esterno. Per un ingegnere che deve simulare o controllare un sistema con centinaia di variabili di stato, questo è oro: la teoria identifica con precisione quali variabili tenere e quali buttare. Un modello più piccolo si simula più in fretta, si controlla meglio, si capisce di più.

Per l’AI e gli agenti l’applicazione è in chiave analogica, e la trattiamo con onestà nella sezione “Dove si rompe” e nei “Collegamenti”: le due domande di Kalman danno una grammatica per pensare l’interpretabilità (di tipo osservabilità) e lo steering (di tipo controllabilità), senza però essere teoremi che si applicano ai transformer. Vale però già qui un’osservazione pratica per chi progetta agenti. Quando disegni un agente, stai implicitamente scegliendo le sue leve — quali tool, quali parametri, quale prompt — e i suoi oblò — quali eventi vengono registrati nei trace, quali stati intermedi vengono esposti. La teoria di Kalman, anche solo come metafora, suggerisce di porsi le due domande durante il progetto, non a posteriori: con queste leve, l’agente può raggiungere i comportamenti che mi servono? Con questi oblò, riuscirò a capire perché ha fatto quello che ha fatto quando qualcosa andrà storto? Un agente progettato senza queste domande tende a essere insieme poco governabile e poco diagnosticabile — e te ne accorgi solo al primo incidente.

Osservatore di stato, regolatore, filtro di Kalman

Controllabilità e osservabilità sono condizioni di possibilità. Le costruzioni che le sfruttano sono il regolatore e l’osservatore. Vale la pena vederle, perché chiudono il cerchio e perché il filtro di Kalman è un antenato concettuale di idee ricorrenti nell’AI.

L’osservatore di stato sfrutta l’osservabilità. È un secondo sistema dinamico, che gira in parallelo a quello vero. Riceve gli stessi ingressi $u$ e legge le stesse uscite $y$ misurate, e produce una stima $\hat{x}$ dello stato che non si misura. La sua equazione è una copia del modello, più un termine di correzione:

$\dot{\hat{x}} = A\hat{x} + Bu + L(y - C\hat{x})$

Il termine $L(y - C\hat{x})$ è il cuore della costruzione. La quantità $C\hat{x}$ è l’uscita che il modello prevede, dato lo stato stimato. La quantità $y$ è l’uscita vera, misurata. La loro differenza è l’errore di predizione: se la stima fosse perfetta, sarebbe zero. Quando non lo è, quell’errore viene moltiplicato per una matrice di guadagno $L$ e ributtato dentro a correggere la stima. La stima si autocorregge inseguendo l’uscita reale.

Si dimostra — e qui la dualità lavora — che si può scegliere $L$ in modo da far convergere a zero l’errore di stima, e farlo arbitrariamente veloce, se e solo se il sistema è osservabile. L’osservabilità non è un dettaglio: è la condizione esatta che rende possibile l’osservatore. Questa costruzione deterministica è dovuta a David Luenberger (ingegnere statunitense), che la introduce nel 1964 nell’articolo “Observing the State of a Linear System” — da cui il nome osservatore di Luenberger.

Il regolatore è il duale costruttivo, e sfrutta la controllabilità. Se il sistema è controllabile, esiste una legge di retroazione $u = -Kx$ — l’ingresso è una combinazione pesata dello stato — che permette di collocare gli autovalori del sistema in ciclo chiuso dove si vuole. È il pole placement: poter scegliere la dinamica del sistema controllato, renderlo stabile e con la velocità di risposta desiderata. Controllabilità garantisce un regolatore; osservabilità garantisce un osservatore — ed è la dualità a dire che le due affermazioni sono lo stesso teorema.

I due si combinano. Spesso non si misura lo stato $x$ , quindi non si può applicare $u = -Kx$ direttamente. La soluzione è elegante: si stima lo stato con l’osservatore e si retroaziona la stima, $u = -K\hat{x}$ . Il principio di separazione garantisce che si possono progettare i due pezzi — il guadagno $K$ del regolatore e il guadagno $L$ dell’osservatore — in modo indipendente, e che il sistema combinato funziona. Regolatore più osservatore formano quello che si chiama un compensatore.

Il principio di separazione non è ovvio, e merita un momento di stupore. Stai facendo due cose intrecciate — stimi lo stato, e su quella stima imperfetta basi le tue azioni di controllo — e ci si potrebbe aspettare che gli errori dell’una avvelenino l’altra. Invece, per i sistemi lineari, i due problemi si lasciano separare nettamente: progetti l’osservatore migliore possibile come se dovessi solo stimare, progetti il regolatore migliore possibile come se conoscessi lo stato, e li metti insieme senza ricalcolare nulla. È un altro regalo della linearità, e un altro esempio di una garanzia pulita che, fuori dal caso lineare, va riconquistata caso per caso.

Resta il filtro di Kalman. È l’osservatore di stato quando si prende sul serio il rumore. Nel mondo reale le misure sono rumorose e la dinamica stessa è disturbata da perturbazioni casuali. Il filtro di Kalman — lo stesso Kalman, 1960 — è l’osservatore ottimo in questo scenario probabilistico. Invece di una stima puntuale dello stato, mantiene una stima dello stato e della sua incertezza. A ogni passo fa due mosse: una predizione, che propaga in avanti stima e incertezza usando il modello; e un aggiornamento, che corregge con la nuova misura, pesando modello e misura in proporzione inversa alle rispettive incertezze. Il guadagno di Kalman è esattamente quel peso ottimo.

Concettualmente, l’osservatore di Luenberger e il filtro di Kalman risolvono lo stesso problema — ricostruire lo stato $x$ dalle uscite $y$ — uno in chiave deterministica, l’altro in chiave statistica. Il filtro di Kalman ha una vita propria amplissima e una sua trattazione dedicata nella wiki: vedi kalman-filter-intuizione (in preparazione), nella Parte sulla control theory.

Vale la pena fermarsi un momento sul perché l’osservatore funziona, perché contiene un’idea che torna ovunque. L’osservatore non misura lo stato: lo ipotizza con il modello e poi corregge l’ipotesi confrontandola con la realtà osservabile. Finché la stima è sbagliata, l’uscita predetta $C\hat{x}$ diverge dall’uscita vera $y$ , e quella divergenza è un segnale che dice “stai sbagliando, e in che direzione”. Il guadagno $L$ traduce quel segnale in una correzione dello stato stimato. Se il sistema è osservabile, ogni errore di stima — in qualunque direzione dello spazio di stato — prima o poi si manifesta nell’uscita, e quindi prima o poi viene corretto. Se il sistema non è osservabile, gli errori che vivono nel sottospazio non osservabile non si manifestano mai, e l’osservatore non li corregge mai: la stima resta sbagliata, in silenzio, lungo quelle direzioni. È il motivo strutturale per cui l’osservabilità è la condizione esatta per l’esistenza di un buon osservatore — non una richiesta tecnica, ma il cuore della faccenda. Modello, predizione, errore osservabile, correzione: questo schema è il nucleo di tutta la stima dello stato, e lo si ritrova, in forme molto diverse, dal filtro di Kalman fino al modo in cui un agente aggiorna la sua idea del mondo dopo ogni tool result.

Dove si rompe

La teoria di Kalman è limpida, ma proprio per questo è facile usarla oltre i suoi confini. Questa sezione è la più importante per chi vuole portarla nel pensiero sull’AI.

È una teoria del caso lineare

Tutto quello che abbiamo costruito — la matrice di controllabilità, il criterio di rango, la dualità — vale per sistemi lineari tempo-invarianti. La dinamica reale è quasi sempre non lineare. Esistono estensioni al caso non lineare — la controllabilità si studia con strumenti di geometria differenziale, le distribuzioni e le parentesi di Lie — ma sono molto più delicate, e perdono parte della pulizia. La controllabilità di un sistema non lineare può essere locale e non globale, può dipendere dal punto. Il caso lineare è la base solida; non è il caso generale.

Una conseguenza pratica di questa perdita di pulizia: nel caso non lineare anche la dualità tra controllabilità e osservabilità si indebolisce. Quella simmetria perfetta tra azione e osservazione, esatta come una trasposizione di matrici nel mondo lineare, nel mondo non lineare diventa approssimata o vale solo localmente. È un buon promemoria: i fatti più eleganti di una teoria sono spesso anche i più fragili rispetto alle ipotesi. La dualità di Kalman è bellissima precisamente perché vive nel caso lineare, dove la matematica è generosa. Portata fuori, va maneggiata con prudenza — il che vale a maggior ragione quando la si usa come metafora per gli LLM, che lineari non sono affatto.

Il sì/no nasconde un “quanto”

Il criterio di rango dà un verdetto binario: controllabile o no, osservabile o no. Ma un sistema può essere formalmente controllabile e in pratica quasi ingovernabile, perché raggiungere certi stati richiede ingressi enormi o tempi lunghissimi. È la differenza tra controllabilità e controllabilità pratica, e si misura con il condizionamento del gramiano. L’esempio della batteria nel plateau è la stessa storia per l’osservabilità: formalmente osservabile, in pratica quasi cieca lungo una direzione. Il rango da solo non lo dice; serve la versione graduata.

Controllabilità e raggiungibilità non sono sempre la stessa cosa

Lungo il capitolo abbiamo usato “controllabile” e “raggiungibile” quasi come sinonimi. Per i sistemi lineari tempo-continuo lo sono davvero: poter andare ovunque equivale a poter venire da ovunque. Ma la distinzione esiste e per i sistemi a tempo discreto può mordere.

La raggiungibilità chiede: partendo dall’origine, quali stati posso raggiungere? La controllabilità nella sua forma più debole chiede: da quali stati posso tornare all’origine? Se la dinamica a tempo discreto ha una matrice $A$ singolare — non invertibile — ci possono essere stati che sono controllabili-a-zero (li posso portare all’origine) senza essere raggiungibili (non posso arrivarci partendo dall’origine).

Per i loop di un agente, che sono tempo-discreto, la sfumatura non è oziosa: “posso riportare il sistema a uno stato pulito” e “posso portarlo a qualsiasi stato” sono affermazioni diverse, e a volte si ha la prima senza la seconda. La pratica didattica le fonde; un progetto attento le tiene separate.

Confondere le tre proprietà strutturali

Controllabilità, osservabilità e stabilità sono tre proprietà distinte, e l’errore più comune è fonderle. La controllabilità non dice nulla su dove il sistema va da solo: dice dove posso portarlo io. La stabilità — vedi Equilibrio, stabilità, attrattori — dice dove va se non lo tocco. Un sistema instabile può essere perfettamente controllabile, e un sistema stabile può non esserlo. Allo stesso modo, osservabilità non significa “avere un sensore per ogni variabile”: si può essere osservabili con un solo sensore se la dinamica spalma l’informazione, e si può avere molti sensori e restare non osservabili se misurano direzioni ridondanti.

C’è una sfumatura che ammorbidisce il sì/no e che vale la pena conoscere, perché in pratica è quella che si usa. Non sempre serve poter raggiungere ogni stato: spesso basta poter stabilizzare il sistema, cioè poter spegnere le direzioni instabili. La proprietà più debole che serve davvero si chiama stabilizzabilità: un sistema è stabilizzabile se la parte non controllabile, quella fuori dalle leve, è almeno già stabile per conto suo. Se la stanza chiusa dello spazio di stato contiene solo dinamiche che si smorzano da sole, il fatto di non poterle toccare non è un problema. Specularmente, la proprietà più debole dell’osservabilità si chiama rilevabilità (detectability): basta che la parte non osservabile sia già stabile, così l’errore di stima lungo quelle direzioni non vede svanisce comunque. Nella pratica del progetto si verifica spesso stabilizzabilità e rilevabilità, non controllabilità e osservabilità piene: sono il minimo sindacale perché regolatore e osservatore funzionino.

Il tempo finito può essere un tempo lunghissimo

La definizione di controllabilità chiede di raggiungere lo stato bersaglio in tempo finito. “Finito” non vuol dire “breve”. Un sistema può essere controllabile e richiedere, per raggiungere certi stati, intervalli di tempo enormi o ingressi di ampiezza tale da essere fisicamente impossibili. Il criterio di rango è insensibile a tutto questo: registra solo che la cosa è possibile, non a che prezzo. È la ragione per cui, nei sistemi reali, alla domanda binaria “è controllabile?” si affianca sempre quella quantitativa “è controllabile a un costo accettabile?”, e la seconda è quella che decide se il progetto sta in piedi.

Il criterio ignora i vincoli sugli ingressi

C’è un’assunzione nascosta nella teoria che vale la pena portare alla luce: il criterio di Kalman suppone che l’ingresso possa assumere qualsiasi valore. Nessun limite di ampiezza, nessun segno obbligato, nessuna saturazione. Nella realtà gli attuatori hanno limiti: un motore eroga al massimo una certa coppia, una valvola si apre al massimo del tutto, un razzo non spinge all’indietro.

Quando si aggiungono vincoli sugli ingressi, la controllabilità nel senso di Kalman non basta più. Un sistema può essere controllabile secondo il criterio di rango e tuttavia avere stati che, con ingressi limitati, restano fuori portata. La regione davvero raggiungibile diventa più piccola del previsto. Il criterio di rango è una condizione necessaria — se fallisce, niente è raggiungibile nemmeno con ingressi illimitati — ma con vincoli realistici non è più sufficiente. È un altro caso in cui il sì/no della teoria va integrato con un’analisi quantitativa.

Il ponte verso gli LLM è analogia, non teorema

Veniamo al punto che richiede più disciplina. Le due domande di Kalman hanno la stessa forma logica di due problemi centrali dell’AI di oggi. Ma la somiglianza è un’analogia — somiglianza utile per pensare, niente di più — e va marcata come tale ogni volta, perché è facilissimo scivolare verso una filiazione o un’equivalenza che non reggono.

Cominciamo dall’osservabilità. Capire lo stato interno di un modello linguistico guardando solo i token che emette è il problema dell’interpretabilità. Ha la forma dell’osservabilità: ricostruire l’interno dall’esterno. E c’è un riflesso preciso del caso “non osservabile”: due configurazioni interne diverse del modello — due pattern di attivazioni — possono produrre lo stesso token in uscita. Sono, da quel singolo output, indistinguibili. È esattamente il motivo per cui l’interpretabilità meccanicistica guarda le attivazioni interne e non solo gli output: gli output, da soli, collassano stati distinti. Ma — e qui sta la disciplina — questa è un’analogia strutturale. Un transformer non ha una matrice $A$ , non ha un criterio di rango, e non esiste un teorema di osservabilità per gli LLM. La forma del problema si somiglia; la matematica no.

Vale la pena spingere l’analogia dell’osservabilità un passo oltre, perché illumina una pratica concreta. Se un singolo token in uscita collassa stati interni distinti, allora — come per il sistema con una sola uscita scalare — l’informazione sullo stato interno va recuperata nel tempo: osservando molti token, molte risposte, il comportamento del modello su molti prompt. Una valutazione fatta su un solo esempio è come leggere l’uscita di un sistema in un solo istante: insufficiente per principio. È un argomento, in chiave analogica, a favore delle suite di valutazione ampie e degli studi comportamentali sistematici contro le impressioni aneddotiche. La forma del problema lo suggerisce; resta un’analogia, ma è un’analogia che orienta bene la pratica.

Poi la controllabilità. Fino a che punto possiamo portare un modello dove vogliamo? Con i prompt, con il system message, con il fine-tuning, con l’activation steering — l’aggiunta di vettori direttamente alle attivazioni interne per spostarne il comportamento. È la domanda della controllabilità: quali comportamenti sono raggiungibili con le leve che ho? E la risposta empirica somiglia in modo sorprendente al “sottospazio controllabile più piccolo dello spazio di stato”. Un lavoro del 2026, “Steered LLM Activations are Non-Surjective”, mostra che lo steering delle attivazioni non è suriettivo: non copre tutto lo spazio dei comportamenti possibili. Esistono stati comportamentali che quella leva non raggiunge. È l’eco empirica del sistema non controllabile. E un secondo lavoro dello stesso periodo mostra che i vettori di steering sono non-identificabili — esistono intere classi di interventi diversi che producono comportamenti indistinguibili — il che somiglia molto al sottospazio non osservabile, dove stati distinti collassano. Ma di nuovo: analogie. Lo steering non ha un teorema di rango; “non suriettivo” è un risultato empirico su modelli specifici, non un fatto strutturale dimostrato come quello di Kalman.

Infine, il filtro di Kalman come antenato concettuale. Un agente che mantiene un modello del mondo e lo aggiorna a ogni risultato di un tool sta facendo, in forma molto più lasca e senza nessuna ottimalità garantita, ciò che fa un filtro di Kalman: tenere una stima dello stato e correggerla con ogni nuova osservazione. Anche questa è un’analogia concettuale, non una filiazione: nessuno ha progettato i loop agentici a partire dal filtro di Kalman, e l’agente non calcola covarianze né guadagni ottimi. La somiglianza è nella struttura del problema — stima, osserva, correggi — non in una discendenza storica.

Un esempio concreto di dove l’analogia aiuta e dove va lasciata andare. Immagina di voler far sì che un assistente rifiuti una certa categoria di richieste. Hai più leve: il system prompt, il fine-tuning, un classificatore esterno, l’activation steering. Pensare in termini di controllabilità ti fa porre la domanda giusta — quali di queste leve raggiunge davvero il comportamento voluto, e quali lo raggiungono solo in apparenza, lasciando il comportamento riattivabile con un prompt avversario? Questo è uso lecito dell’analogia: la teoria ti dà una check-list mentale.

Dove va lasciata andare: non esiste una matrice di controllabilità dell’assistente, non puoi calcolare un rango, non c’è un teorema che ti dica se il comportamento è “raggiungibile”. La verifica resta empirica — provi, misuri, fai red-teaming. L’analogia ti dice cosa chiedere; non ti dà uno strumento per rispondere. Confondere le due cose porta a un overclaim pericoloso: “ho dimostrato che il modello è controllabile” è una frase che, nel senso di Kalman, non si può dire di un LLM.

La regola pratica per non sbagliare: ogni volta che usi controllabilità o osservabilità parlando di un LLM, chiediti se stai dicendo “ha la stessa forma di” (analogia, lecita) o “è un caso di” (equivalenza, quasi sempre falsa). La prima illumina; la seconda inganna.

Collegamenti

Stato, transizione, traiettoria — la rappresentazione in spazio di stato è il prerequisito diretto: controllabilità e osservabilità sono proprietà di quello spazio, non hanno senso senza di esso.
Equilibrio, stabilità, attrattori — la terza proprietà strutturale; tenerla distinta dalle altre due è metà del capitolo, e il regolatore serve proprio a stabilizzare un sistema controllabile.
feedback-feedforward (in preparazione) — l’osservatore e il regolatore sono anelli di feedback; il termine di correzione sull’errore di uscita è feedback nel senso più puro.
Autovalori e autovettori a intuizione — il pole placement sposta gli autovalori del sistema in ciclo chiuso, e il criterio PBH è formulato in termini di autovettori.
kalman-filter-intuizione (in preparazione) — il filtro come versione probabilistica dell’osservatore di stato; l’osservabilità ne è la condizione di possibilità.
control-theory-intro (in preparazione) — regolatore, principio di separazione, il quadro generale del controllo in spazio di stato.
mech-interp-intro (in preparazione) e probing (in preparazione) — l’interpretabilità come problema con la forma logica dell’osservabilità: ricostruire lo stato interno di un modello dai suoi segnali esterni.
steering-vectors (in preparazione) — lo steering come problema con la forma della controllabilità, inclusa la non-suriettività delle attivazioni guidate.
agent-observability (in preparazione) — l’osservabilità degli agenti nel senso ingegneristico del software (trace, eventi, log): un senso parente di nome ma distinto da quello di Kalman.
black-box-sistemi (in preparazione) — identificazione del sistema e black box: cosa si può sapere di un sistema accessibile solo da fuori.

Per andare oltre

R. E. Kalman, “On the General Theory of Control Systems”, Proceedings of the First IFAC Congress, Mosca, 1960. Il lavoro fondativo che introduce controllabilità e osservabilità come oggetti di ricerca matematica.
R. E. Kalman, “Mathematical Description of Linear Dynamical Systems”, SIAM Journal on Control, 1(2), 1963. La forma matura della teoria in spazio di stato, con la decomposizione canonica.
D. G. Luenberger, “Observing the State of a Linear System”, IEEE Transactions on Military Electronics, 8(2), 1964. L’articolo che introduce l’osservatore di stato deterministico.
K. Ogata, Modern Control Engineering, Pearson. Un testo standard che tratta controllabilità, osservabilità, dualità e progetto di osservatori a livello introduttivo, con molti esempi numerici.
“Steered LLM Activations are Non-Surjective”, arXiv, 2026. Risultato empirico sulla non-suriettività dello steering delle attivazioni: la versione AI, e analogica, del sistema non completamente controllabile.