Salta ai contenuti

Parte V — Statistica, inferenza e incertezza

Ogni numero che descrive un sistema AI — l’accuratezza di un modello, il tasso di conversione di un A/B test, il punteggio su un benchmark — viene da una parte della realtà, non dal tutto. La statistica è la disciplina che dice quanto fidarsi di quei numeri: distingue ciò che i dati osservati affermano con certezza da ciò che, sui dati non osservati, resta una stima incerta ma quantificabile. Questa Parte costruisce, dall’intuizione al formalismo, la logica dell’inferenza: popolazione e campione, parametro e stimatore, variabilità campionaria e distribuzione campionaria, legge dei grandi numeri e teorema del limite centrale, intervalli di confidenza e test di ipotesi, fino al legame stretto con il machine learning. Il filo conduttore è che ogni claim su un sistema AI — ogni eval, ogni benchmark, ogni metrica di produzione — è un atto di inferenza statistica, e che ignorarlo porta sistematicamente all’overclaim. Niente prerequisiti oltre le basi di probabilità della Parte IV: ogni concetto è introdotto con un’intuizione prima della formula.

Stato della Parte: 15 di 15 capitoli scritti.

  1. Popolazione, campione, stimatore: la logica dell’incertezzastatistica-intro
  2. Le distribuzioni comuni: Bernoulli, binomiale, normale, Poisson, esponenzialedistribuzioni-comuni
  3. Campionamento: come si sceglie la parte che racconta il tuttocampionamento
  4. Legge dei grandi numeri e teorema del limite centralelegge-grandi-numeri-clt
  5. Stima puntuale: dare un numero al parametro ignotostima-puntuale
  6. Intervalli di confidenza: cosa dicono davvero e cosa nointervalli-confidenza
  7. Test di ipotesi: p-value, potenza, errori di tipo I e IItest-ipotesi
  8. Test multipli: quando cercare abbastanza garantisce di trovaremultiple-testing
  9. Correlazione e causalità: vedere non è farecorrelazione-causalita
  10. Regressione: la retta come modello statisticoregressione-statistica
  11. Massima verosimiglianza: fittare modelli massimizzando la probabilitàmaximum-likelihood
  12. Stima MAP: il prior come regolarizzatoremap-bayesiano
  13. Bootstrap: stimare l’incertezza ricampionando i datibootstrap
  14. Calibrazione: quando un 70% vale davvero 70%calibrazione-statistica
  15. Statistica e machine learning: perché ML senza statistica produce overclaimstatistica-e-ml

← Torna all’indice generale