Parte V — Statistica, inferenza e incertezza

Ogni numero che descrive un sistema AI — l’accuratezza di un modello, il tasso di conversione di un A/B test, il punteggio su un benchmark — viene da una parte della realtà, non dal tutto. La statistica è la disciplina che dice quanto fidarsi di quei numeri: distingue ciò che i dati osservati affermano con certezza da ciò che, sui dati non osservati, resta una stima incerta ma quantificabile. Questa Parte costruisce, dall’intuizione al formalismo, la logica dell’inferenza: popolazione e campione, parametro e stimatore, variabilità campionaria e distribuzione campionaria, legge dei grandi numeri e teorema del limite centrale, intervalli di confidenza e test di ipotesi, fino al legame stretto con il machine learning. Il filo conduttore è che ogni claim su un sistema AI — ogni eval, ogni benchmark, ogni metrica di produzione — è un atto di inferenza statistica, e che ignorarlo porta sistematicamente all’overclaim. Niente prerequisiti oltre le basi di probabilità della Parte IV: ogni concetto è introdotto con un’intuizione prima della formula.

Stato della Parte: 15 di 15 capitoli scritti.

Indice

Popolazione, campione, stimatore: la logica dell’incertezza — statistica-intro
Le distribuzioni comuni: Bernoulli, binomiale, normale, Poisson, esponenziale — distribuzioni-comuni
Campionamento: come si sceglie la parte che racconta il tutto — campionamento
Legge dei grandi numeri e teorema del limite centrale — legge-grandi-numeri-clt
Stima puntuale: dare un numero al parametro ignoto — stima-puntuale
Intervalli di confidenza: cosa dicono davvero e cosa no — intervalli-confidenza
Test di ipotesi: p-value, potenza, errori di tipo I e II — test-ipotesi
Test multipli: quando cercare abbastanza garantisce di trovare — multiple-testing
Correlazione e causalità: vedere non è fare — correlazione-causalita
Regressione: la retta come modello statistico — regressione-statistica
Massima verosimiglianza: fittare modelli massimizzando la probabilità — maximum-likelihood
Stima MAP: il prior come regolarizzatore — map-bayesiano
Bootstrap: stimare l’incertezza ricampionando i dati — bootstrap
Calibrazione: quando un 70% vale davvero 70% — calibrazione-statistica
Statistica e machine learning: perché ML senza statistica produce overclaim — statistica-e-ml

← Torna all’indice generale