Corso di Probabilità Statistica e Teoria degli Errori: 3 Statistica Descrittiva
Statistica Descrittiva
Obiettivi: raccogliere, organizzare e descrivere dati reali; rappresentare informazioni tramite grafici e misure riassuntive.
1. Obiettivi formativi
Il modulo intende sviluppare competenze pratiche e interpretative: saper raccogliere dati, costruire tabelle di frequenza, calcolare misure di posizione e di dispersione (media, mediana, moda, range, varianza, deviazione standard) e rappresentare i dati con grafici (diagrammi a barre, istogrammi, boxplot). Sono previste attività pratiche con strumenti digitali (Excel, Google Sheets, Python).
2. Raccolta e organizzazione dei dati
I dati si raccolgono tramite osservazione, misurazione o rilevazione. Dopo la raccolta si costruisce la tabella di frequenza che elenca i valori (o classi) e quante volte si presentano. Per dati continui si raggruppano i valori in classi di ampiezza opportuna.
Esempio di tabella (dati discreti): valori = {2,3,3,4,5,3,2} → tabella
| Valore | Frequenza |
|---|---|
| 2 | 2 |
| 3 | 3 |
| 4 | 1 |
| 5 | 1 |
3. Misure di posizione: media, mediana, moda
Media aritmetica (per dati \(x_1,\dots,x_n\)) è la somma divisa per n:
mean = (Σ x_i) / n. È sensibile agli outlier.
Mediana è il valore centrale dopo aver ordinato i dati. Se n è pari è la media dei due centrali. È robusta agli outlier.
Moda è il valore (o valori) con frequenza massima; per dati continui si parla di classe modale.
Esempio: dati = {2,3,3,4,5,3,2}
Media = (2+3+3+4+5+3+2)/7 = 22/7 ≈ 3.1429.
Mediana: ordine {2,2,3,3,3,4,5} → valore centrale = 3.
Moda = 3 (frequenza 3).
4. Misure di dispersione: range, varianza, deviazione standard
Range = max − min. Fornisce indicazione grossolana della dispersione.
Varianza campionaria (stima della popolazione):
s^2 = \frac{1}{n-1}\sum_{i=1}^n (x_i-\bar{x})^2
Deviazione standard è la radice quadrata della varianza: s = sqrt(s^2). Fornisce la dispersione nello stesso ordine di grandezza delle osservazioni.
Esempio: calcolo varianza e deviazione per i dati {2,3,3,4,5,3,2}
Media ≈ 3.1429. Scarti al quadrato: (1.306), (0.020), ... (calcolo dettagliato). Varianza campionaria s^2 ≈ 0.9524 (esempio), deviazione s ≈ 0.976.
5. Distribuzioni di frequenza e rappresentazioni grafiche
Per dati discreti si usano diagrammi a barre; per dati raggruppati in classi si usa l’istogramma. Il boxplot (diagramma a scatola) mostra mediana, quartili e outlier, utile per confronti tra gruppi.
Regole pratiche per l’istogramma: scegliere numero di classi k (ad es. regola di Sturges k ≈ 1 + log2 n), costruire classi di ampiezza uniforme e disegnare barre adiacenti la cui altezza rappresenta la frequenza o la densità.
6. Attività pratiche consigliate
Raccogli dati quotidiani (tempi di studio, ore di sonno, consumo di energia, passi giornalieri). Costruisci tabelle di frequenza, calcola le misure sintetiche e confronta gruppi con boxplot. Utilizza Excel/Google Sheets o Python (pandas/matplotlib) per produrre grafici e verificare la presenza di outlier.
7. Strumenti interattivi: calcolatore statistico e istogramma
Inserisci una serie di numeri separati da virgola
Istogramma (semplice)
8. Esempi guidati ed esercizi (con soluzioni)
Esercizio 1 — Calcolo delle misure
Data la serie {10, 12, 8, 9, 15, 12, 11}, calcola media, mediana, moda, range, varianza campionaria e deviazione standard.
Soluzione sintetica: media = 11, mediana = 11, moda = 12, range = 7, s^2 ≈ 6.6667, s ≈ 2.582.
Esercizio 2 — Costruzione tabella e istogramma
Raccogli i tempi (in minuti) che impieghi per fare i compiti in 30 giorni e costruisci una tabella con classi di ampiezza 5 minuti. Disegna l’istogramma e commenta la forma della distribuzione (simmetrica, asimmetria, multimodalità).
Soluzione (metodo): definire min e max, scegliere k classi, contare frequenze, disegnare barre; osservare la forma e la posizione centrale rispetto alla media e mediana.
9. Suggerimenti per l’uso di software
Excel/Google Sheets: usa funzioni =AVERAGE(range), =MEDIAN(range), =MODE.SNGL(range), =VAR.S(range), =STDEV.S(range). Per istogrammi usa il grafico 'Istogramma' o il componente aggiuntivo 'Analisi dati'.
Python (pandas/matplotlib): leggere i dati con pandas.Series, usare .mean(), .median(), .mode(), .var(ddof=1), .std(ddof=1); usare matplotlib.pyplot.hist() per istogrammi e seaborn.boxplot() per boxplot.
10. Risorse e bibliografia
- Luigi Solari, Elementi di Statistica
- David Freedman, Robert Pisani, Roger Purves, Statistics
- John Tukey, Exploratory Data Analysis
- Documentazione pandas e matplotlib (online)

Commenti
Posta un commento