Parte V — Statistica, inferenza e incertezza
Ogni numero che descrive un sistema AI — l’accuratezza di un modello, il tasso di conversione di un A/B test, il punteggio su un benchmark — viene da una parte della realtà, non dal tutto. La statistica è la disciplina che dice quanto fidarsi di quei numeri: distingue ciò che i dati osservati affermano con certezza da ciò che, sui dati non osservati, resta una stima incerta ma quantificabile. Questa Parte costruisce, dall’intuizione al formalismo, la logica dell’inferenza: popolazione e campione, parametro e stimatore, variabilità campionaria e distribuzione campionaria, legge dei grandi numeri e teorema del limite centrale, intervalli di confidenza e test di ipotesi, fino al legame stretto con il machine learning. Il filo conduttore è che ogni claim su un sistema AI — ogni eval, ogni benchmark, ogni metrica di produzione — è un atto di inferenza statistica, e che ignorarlo porta sistematicamente all’overclaim. Niente prerequisiti oltre le basi di probabilità della Parte IV: ogni concetto è introdotto con un’intuizione prima della formula.
Stato della Parte: 15 di 15 capitoli scritti.
- Popolazione, campione, stimatore: la logica dell’incertezza —
statistica-intro - Le distribuzioni comuni: Bernoulli, binomiale, normale, Poisson, esponenziale —
distribuzioni-comuni - Campionamento: come si sceglie la parte che racconta il tutto —
campionamento - Legge dei grandi numeri e teorema del limite centrale —
legge-grandi-numeri-clt - Stima puntuale: dare un numero al parametro ignoto —
stima-puntuale - Intervalli di confidenza: cosa dicono davvero e cosa no —
intervalli-confidenza - Test di ipotesi: p-value, potenza, errori di tipo I e II —
test-ipotesi - Test multipli: quando cercare abbastanza garantisce di trovare —
multiple-testing - Correlazione e causalità: vedere non è fare —
correlazione-causalita - Regressione: la retta come modello statistico —
regressione-statistica - Massima verosimiglianza: fittare modelli massimizzando la probabilità —
maximum-likelihood - Stima MAP: il prior come regolarizzatore —
map-bayesiano - Bootstrap: stimare l’incertezza ricampionando i dati —
bootstrap - Calibrazione: quando un 70% vale davvero 70% —
calibrazione-statistica - Statistica e machine learning: perché ML senza statistica produce overclaim —
statistica-e-ml