Corso di Probabilità Statistica e Teoria degli Errori: 3 Statistica Descrittiva

Statistica Descrittiva

Obiettivi: raccogliere, organizzare e descrivere dati reali; rappresentare informazioni tramite grafici e misure riassuntive.

1. Obiettivi formativi

Il modulo intende sviluppare competenze pratiche e interpretative: saper raccogliere dati, costruire tabelle di frequenza, calcolare misure di posizione e di dispersione (media, mediana, moda, range, varianza, deviazione standard) e rappresentare i dati con grafici (diagrammi a barre, istogrammi, boxplot). Sono previste attività pratiche con strumenti digitali (Excel, Google Sheets, Python).

2. Raccolta e organizzazione dei dati

I dati si raccolgono tramite osservazione, misurazione o rilevazione. Dopo la raccolta si costruisce la tabella di frequenza che elenca i valori (o classi) e quante volte si presentano. Per dati continui si raggruppano i valori in classi di ampiezza opportuna.

Esempio di tabella (dati discreti): valori = {2,3,3,4,5,3,2} → tabella

ValoreFrequenza
22
33
41
51

3. Misure di posizione: media, mediana, moda

Media aritmetica (per dati \(x_1,\dots,x_n\)) è la somma divisa per n: mean = (Σ x_i) / n. È sensibile agli outlier.

Mediana è il valore centrale dopo aver ordinato i dati. Se n è pari è la media dei due centrali. È robusta agli outlier.

Moda è il valore (o valori) con frequenza massima; per dati continui si parla di classe modale.

Esempio: dati = {2,3,3,4,5,3,2}

Media = (2+3+3+4+5+3+2)/7 = 22/7 ≈ 3.1429.

Mediana: ordine {2,2,3,3,3,4,5} → valore centrale = 3.

Moda = 3 (frequenza 3).

4. Misure di dispersione: range, varianza, deviazione standard

Range = max − min. Fornisce indicazione grossolana della dispersione.

Varianza campionaria (stima della popolazione):

s^2 = \frac{1}{n-1}\sum_{i=1}^n (x_i-\bar{x})^2

Deviazione standard è la radice quadrata della varianza: s = sqrt(s^2). Fornisce la dispersione nello stesso ordine di grandezza delle osservazioni.

Esempio: calcolo varianza e deviazione per i dati {2,3,3,4,5,3,2}

Media ≈ 3.1429. Scarti al quadrato: (1.306), (0.020), ... (calcolo dettagliato). Varianza campionaria s^2 ≈ 0.9524 (esempio), deviazione s ≈ 0.976.

5. Distribuzioni di frequenza e rappresentazioni grafiche

Per dati discreti si usano diagrammi a barre; per dati raggruppati in classi si usa l’istogramma. Il boxplot (diagramma a scatola) mostra mediana, quartili e outlier, utile per confronti tra gruppi.

Regole pratiche per l’istogramma: scegliere numero di classi k (ad es. regola di Sturges k ≈ 1 + log2 n), costruire classi di ampiezza uniforme e disegnare barre adiacenti la cui altezza rappresenta la frequenza o la densità.

6. Attività pratiche consigliate

Raccogli dati quotidiani (tempi di studio, ore di sonno, consumo di energia, passi giornalieri). Costruisci tabelle di frequenza, calcola le misure sintetiche e confronta gruppi con boxplot. Utilizza Excel/Google Sheets o Python (pandas/matplotlib) per produrre grafici e verificare la presenza di outlier.

7. Strumenti interattivi: calcolatore statistico e istogramma

Inserisci una serie di numeri separati da virgola

Risultati: -

Istogramma (semplice)

Nota: istogramma semplificato; per produzioni di qualità usa Excel o Python.

8. Esempi guidati ed esercizi (con soluzioni)

Esercizio 1 — Calcolo delle misure

Data la serie {10, 12, 8, 9, 15, 12, 11}, calcola media, mediana, moda, range, varianza campionaria e deviazione standard.

Soluzione sintetica: media = 11, mediana = 11, moda = 12, range = 7, s^2 ≈ 6.6667, s ≈ 2.582.

Esercizio 2 — Costruzione tabella e istogramma

Raccogli i tempi (in minuti) che impieghi per fare i compiti in 30 giorni e costruisci una tabella con classi di ampiezza 5 minuti. Disegna l’istogramma e commenta la forma della distribuzione (simmetrica, asimmetria, multimodalità).

Soluzione (metodo): definire min e max, scegliere k classi, contare frequenze, disegnare barre; osservare la forma e la posizione centrale rispetto alla media e mediana.

9. Suggerimenti per l’uso di software

Excel/Google Sheets: usa funzioni =AVERAGE(range), =MEDIAN(range), =MODE.SNGL(range), =VAR.S(range), =STDEV.S(range). Per istogrammi usa il grafico 'Istogramma' o il componente aggiuntivo 'Analisi dati'.

Python (pandas/matplotlib): leggere i dati con pandas.Series, usare .mean(), .median(), .mode(), .var(ddof=1), .std(ddof=1); usare matplotlib.pyplot.hist() per istogrammi e seaborn.boxplot() per boxplot.

10. Risorse e bibliografia

  • Luigi Solari, Elementi di Statistica
  • David Freedman, Robert Pisani, Roger Purves, Statistics
  • John Tukey, Exploratory Data Analysis
  • Documentazione pandas e matplotlib (online)


Commenti

Post popolari in questo blog

La scienza delle piccole grandi cose: Teoria della doppia copia: gravità e gauge a confronto

Corso di Algebra Elementare e Strutture Algebriche: 1 Polinomi

CORSO DI MECCANICA QUANTISTICA: 2 Misura Quantistica Sovrapposizione e Spin