Teoria dei Codici

Obiettivi

Fornire i fondamenti matematici dei codici per la correzione d’errori.
Mostrare come costruire codici lineari, codici ciclici e codici di Hamming.
Presentare metodi pratici di codifica e decodifica (sindrome, correzione).
Eseguire esercizi numerici e simulazioni a mano per comprendere i meccanismi.

1. Concetti fondamentali e notazioni

Lavoriamo su vettori binari $\mathbb{F}_2^n$ (campo finito con due elementi: $0,1$ ; operazioni modulo 2).
Un codice $C$ è un sottoinsieme non vuoto di $\mathbb{F}_2^n$ .
Un codice lineare $C$ di lunghezza $n$ e dimensione $k$ è un sottospazio vettoriale di $\mathbb{F}_2^n$ di dimensione $k$ ; si indica come $[n,k]$ (talvolta $[n,k,d]$ includendo distanza minima $d$ ).
Peso $w(v)$ di un vettore $v$ = numero di componenti uguali a 1.
Distanza di Hamming $d(u,v)$ = peso di $u-v$ (operazione in $\mathbb{F}_2$ ); per un codice lineare la distanza minima $d$ è il minimo peso non nullo tra i codici: $d=\min\{w(c)\;|\;c\in C, c\neq 0\}$ .

Proprietà utili: per un codice lineare $[n,k,d]$ vale che può correggere fino a $t=\left\lfloor\frac{d-1}{2}\right\rfloor$ errori (decodifica hard-decision minimum-distance).

2. Codici lineari: generatori e controllo di parità

Matrice generatrice $G$

Se $C$ è un sottospazio $k$ -dimensionale, esiste una matrice $G$ $k\times n$ (righe linearmente indipendenti) tale che ogni parola codice $c\in C$ si esprime come

c = u G,\qquad u\in\mathbb{F}_2^k,

dove $u$ è il vettore di informazione (message). Si parla di codifica sistematica se $G$ è della forma $G = [I_k \;|\; P]$ (identità $k\times k$ seguita da una matrice $P$ $k\times (n-k)$ ): allora il codiceword contiene i bit informazione nei primi $k$ posti seguiti dai bit di parità.

Matrice di controllo $H$

Per un codice lineare $C$ esiste una matrice di controllo $H$ $(n-k)\times n$ tale che

C = \{ c \in \mathbb{F}_2^n \;|\; H c^T = 0 \}.

Le righe di $H$ generano lo spazio ortogonale $C^\perp$ . Se $G=[I_k \;|\; P]$ allora una scelta convenzionale è

H = \begin{bmatrix} -P^T & I_{n-k} \end{bmatrix}

(con operazioni in $\mathbb{F}_2$ , dunque il segno meno è identico al plus).

Encoding e verifica

Codifica: dato $u\in\mathbb{F}_2^k$ , calcoli $c = uG$ .
Verifica: dati $r\in\mathbb{F}_2^n$ (ricevuto), calcoli la sindrome

s = H r^T.

Se $s=0$ allora $r$ è un codiceword (o c’è un errore appartenente al codice nullo); altrimenti $s$ identifica il cosiddetto coset di errore.

3. Distanza minima, bound fondamentali

Bound di Hamming (sfera di Hamming) per codici binari: per correggere $t$ errori, si deve avere

\sum_{i=0}^{t} \binom{n}{i} \le 2^{n-k}.

Singleton bound: $d \le n-k+1$ . Un codice che raggiunge $d=n-k+1$ è MDS (maximally distance separable).
Bound di Gilbert–Varshamov e altri forniscono limiti esistenziali (non approfonditi qui).

4. Codice di Hamming: struttura e decodifica

Costruzione del codice di Hamming $(7,4)$

Il codice di Hamming a singola correzione con parametro $[7,4]$ è uno degli esempi base.

Dimensione $k=4$ , lunghezza $n=7$ , controllo $n-k=3$ .
Si costruisce spesso in forma sistematica $G=[I_4 \;|\; P]$ e $H=[-P^T \;|\; I_3]$ .

Una scelta comune (matrici su $\mathbb{F}_2$ ) è:

G = \begin{pmatrix} 1&0&0&0 & 1&1&0\\ 0&1&0&0 & 1&0&1\\ 0&0&1&0 & 1&0&0\\ 0&0&0&1 & 0&1&1 \end{pmatrix} \quad H = \begin{pmatrix} 1&1&1&1&1&0&0\\ 1&0&0&1&0&1&0\\ 0&1&0&1&0&0&1 \end{pmatrix}.

(Esistono molte rappresentazioni equivalenti via operazioni elementari sulle colonne; l’importante è che le colonne di $H$ siano tutte le diverse $\neq 0$ vettori in $\mathbb{F}_2^3$ .)

Le colonne di $H$ generalmente corrispondono all’indirizzo binario (1..7):

\text{colonne } H = \{ (0\,0\,1)^T,(0\,1\,0)^T,(0\,1\,1)^T,(1\,0\,0)^T,(1\,0\,1)^T,(1\,1\,0)^T,(1\,1\,1)^T\}

(alcune convenzioni usano ordine diverso).

Proprietà

Distanza minima $d=3$ → può correggere $t=1$ errore e rilevare fino a 2 errori.
Decodifica tramite sindrome: la sindrome $s=Hr^T$ (3 bit) indica la posizione dell’errore (se $s\neq 0$ ); per il $(7,4)$ la sindrome non nulla corrisponde esattamente al vettore colonna di $H$ che indica il bit errato.

Esempio numerico (Hamming (7,4))

Scegliamo il messaggio $u=(1\;0\;1\;1)$ . Codifichiamo $c=uG$ (operazioni mod 2):

Dalla riga di $G$ , calcoli a mano:

$u$ moltiplicato per $G$ :
$c = (1,0,1,1) \cdot \begin{pmatrix} 1&0&0&0 & 1&1&0\\ 0&1&0&0 & 1&0&1\\ 0&0&1&0 & 1&0&0\\ 0&0&0&1 & 0&1&1 \end{pmatrix}$
componendo:
$c = (1,0,1,1)_{\text{info}} \;|\; \text{parity}$
Calcoliamo le colonne dei bit di parità:
- prima colonna di parità (col 5) = somma mod2 delle colonne P corrispondenti ai bit info attivi: per brevità: otteniamo
$c = (1,0,1,1, \; p_1, p_2, p_3).$
Procedendo si trova (con i valori di $G$ sopra) $c=(1,0,1,1,0,0,0)$ oppure altro a seconda della versione di $G$ ; l’importante è seguire i calcoli con la matrice effettiva scelta. (Nella pratica si usano generatori standard; qui l’esempio è didattico: nella decodifica seguente useremo un codiceword numerico definito.)

Supponiamo che il codiceword trasmesso sia $c=(1,0,1,1,0,0,0)$ . Durante la trasmissione si verifica un errore in posizione 3 (contiamo da 1 a 7), il vettore ricevuto è

r = (1,0,\underline{0},1,0,0,0).

Calcoliamo la sindrome

s = H r^T,

operando modulo 2. Se $s$ coincide con la colonna di $H$ corrispondente alla posizione 3, allora si corregge invertendo quel bit. Dopo la correzione si ottiene il codiceword corretto $c$ .

(Per chiarezza: nei materiali didattici si riporta passo passo il calcolo numerico della sindrome, colonna per colonna. Qui per brevità abbiamo descritto il metodo: se desideri, scrivo il calcolo bit-per-bit seguendo la matrice specifica.)

5. Decodifica per sindrome (algoritmo)

Algoritmo (hard-decision, correzione fino a t errori con tabella sindrome):

Ricevi $r\in\mathbb{F}_2^n$ .
Calcola $s = H r^T$ .
Se $s=0$ → output $\hat c = r$ (nessun errore rilevato).
Altrimenti cerca in una tabella precalcolata che mappa ogni possibile sindrome $s$ al più probabile pattern di errore $e$ (per Hamming è il singolo bit con quella sindrome).
Correggi $\hat c = r - e$ (equiv. $r + e$ in $\mathbb{F}_2$ ), quindi estrai l’informazione $u$ da $\hat c$ .

Complessità: calcolo sindrome $O(n(n-k))$ , con tabella sindrome l’operazione è O(n) per applicare la correzione.

6. Codici ciclici: rappresentazione polinomiale

Un codice ciclico $C$ di lunghezza $n$ è un codice lineare tale che se $c=(c_0,c_1,\dots,c_{n-1})\in C$ allora la rotazione ciclica $(c_{n-1},c_0,\dots,c_{n-2})$ è ancora in $C$ .

Rappresentazione

Associamo a un vettore $c$ il polinomio

c(x) = c_0 + c_1 x + \dots + c_{n-1} x^{n-1}

in $\mathbb{F}_2[x]$ modulo $x^n-1$ . Un codice $C$ è ciclico ⇔ esiste un polinomio $g(x)$ divisore di $x^n-1$ tale che

C = \{ c(x) = m(x) g(x) \;|\; m(x) \in \mathbb{F}_2[x],\ \deg m < k \},

dove $g(x)$ è il polinomio generatore di grado $n-k$ .

Proprietà

$g(x)$ è monico e di grado $n-k$ .
$x^n-1 = g(x) h(x)$ per qualche polinomio $h(x)$ .
Parità e controllo si esprimono via polinomi: la condizione $h(x) c(x) \equiv 0 \pmod{x^n-1}$ .

Esempio: CRC semplificato

La CRC è un codice ciclico di tipo rilevazione: dato un messaggio $m(x)$ , si calcola $t(x)=x^{r} m(x) \bmod g(x)$ e si invia $c(x)=x^{r} m(x) - t(x)$ , dove $g(x)$ è il polinomio generatore di grado $r$ . In ricezione si verifica $c(x) \bmod g(x)=0$ per determinare errori rilevabili.

7. Codici più avanzati: BCH e Reed–Solomon (cenni)

BCH codes: codici ciclici costruiti su estensioni dei campi finiti $\mathbb{F}_{2^m}$ ; permettono correzione di più errori con costruzione parametrica.
Reed–Solomon: codici su $\mathbb{F}_{q}$ (con $q$ grande), sono MDS e molto usati (CD, DVD, comunicazioni satellitari).

8. Correzione vs. rilevazione, canale e criteri di decodifica

Hard-decision decoding: lavoriamo con simboli binari discreti (0/1). Decodifica minima distanza è ottima per canali simmetrici a memoria nulla.
Soft-decision decoding: sfrutta informazioni di affidabilità (es. valori reali). Algoritmi come Viterbi/BCJR o il decoding soft per Reed–Solomon/BCH sono più potenti ma più costosi.
Canale binario simmetrico (BSC): modello comune, probabilità di bit-flip $p$ . Massimizzazione della probabilità a posteriori (MAP) coincide con decodifica a minima distanza per canale simmetrico.

9. Attività pratiche e esercizi svolti

Esercizio 1 — Costruzione di un codice di Hamming (7,4) e decodifica

Obiettivo: costruire $G, H$ , codificare $u=(1,0,1,1)$ , introdurre errore in posizione 3, calcolare sindrome e correggere.

Soluzione passo-passo:

Prendiamo $G$ e $H$ come nella sezione 4 (o una delle forme canoniche).
Codifica $u$ con $c = uG$ . Calcoliamo esplicitamente ogni prodotto riga-colonna modulo 2. (Operazioni bitwise XOR).
Introduciamo errore $e$ con 1 nella posizione 3: $r = c + e$ .
Calcoliamo $s = H r^T = H(c^T + e^T) = Hc^T + He^T = 0 + He^T = He^T$ . Poiché $e$ ha un unico 1 in posizione 3, $s$ sarà la colonna 3 di $H$ .
Troviamo che tale sindrome identifica la posizione 3 → inverto il bit 3 in $r$ → otteniamo $\hat c = r + e$ = c.

(Se vuoi, incollo qui i calcoli numerici riga-per-riga con numeri. Basta dirmelo e li sviluppo esplicitamente per la matrice scelta.)

Esercizio 2 — Simulazione di Hamming su più messaggi

Costruisci tutti i codiciword per i 16 messaggi di 4 bit, genera tutti i possibili vettori di errore a singolo bit e verifica la correzione automatica tramite sindrome per ciascuna possibile ricezione (dimostrazione esaustiva che Hamming(7,4) corregge 1 errore).

Esercizio 3 — Codice ciclico semplice e CRC

Sia $n=7$ , $g(x)=x^3+x+1$ (esempio). Dato $m=(1,0,1,1)$ rappresentato da $m(x)=1+x^2+x^3$ (con grado < k), calcola il codeword $c(x)=m(x)g(x) \bmod (x^7-1)$ .
Esegui una simulazione di errore (flipping di bit) e verifica la condizione $c(x) \bmod g(x)$ .

10. Metodi pratici e consigli di implementazione

In implementazioni reali, generatori e matrici usano bitwise XOR e shift register per codici ciclici (LFSR per CRC).
Per decoding efficienti di codici BCH/Reed–Solomon si usano algoritmi di algebra sui campi finiti (Euclide esteso, Berlekamp–Massey).
Per canali rumorosi si preferiscono schemi concatenati (RS + convolutional) o codici moderni LDPC/Polar con decoding iterativo (belief propagation).

11. Esercizi proposti (da svolgere)

Costruisci il codice $[7,4]$ di Hamming nella forma sistematica con generator $G=[I_4|P]$ e ottieni $P$ tale che $H=[-P^T|I_3]$ . Verifica la tabella delle sindromi.
Per il messaggio $u=(1,1,0,0)$ calcola $c$ . Simula un errore in posizione 5 e decodifica. Mostra tutti i passaggi.
Sia $n=7$ e $g(x)=x^3+x+1$ . Dimostra che $g(x)$ divide $x^7-1$ su $\mathbb{F}_2[x]$ . Costruisci il codice ciclico corrispondente e trova la dimensione $k$ .
Implementa in pseudo-codice la funzione encode(u) e decode(r) per il codice di Hamming (use a syndromes table).

12. Punti critici e appunti di rigore

La scelta di $G$ e $H$ è non unica: matrici diverse definiscono lo stesso codice (equivalenza di colonne).
La decodifica per minima distanza è ottima ma computazionalmente proibitiva per codici generali: la sindrome + tabella funziona solo se il numero di pattern di errore probabili è piccolo (es. t=1). Per correzione multipla si usano algoritmi strutturati (BCH, Reed–Solomon, Viterbi per convolutional).
La rappresentazione polinomiale è potente per i codici ciclici ma richiede consapevolezza dei campi finiti quando si passa a codici non binari.

13. Conclusione sintetica

La teoria dei codici mette in relazione algebra lineare (sottospazi vettoriali, matrici $G$ e $H$ ), algebra polinomiale (codici ciclici), teoria dei campi finiti (BCH, RS) e algoritmi numerici per la decodifica. Il passaggio dalla teoria (distanza minima, bound) alle applicazioni pratiche richiede la scelta di strutture codificanti che bilancino capacità di correzione, efficienza di codifica/decodifica e complessità computazionale, tenendo conto del modello di canale.

Cerca nel blog

PER UNA GAIA SCIENZA

Corso di Algebra Avanzata Teoria dei Codici e Crittografia: 3 Teoria dei Codici

Teoria dei Codici

Obiettivi

1. Concetti fondamentali e notazioni

2. Codici lineari: generatori e controllo di parità

Matrice generatrice $G$

Matrice di controllo $H$

Encoding e verifica

3. Distanza minima, bound fondamentali

4. Codice di Hamming: struttura e decodifica

Costruzione del codice di Hamming $(7,4)$

Proprietà

Esempio numerico (Hamming (7,4))

5. Decodifica per sindrome (algoritmo)

6. Codici ciclici: rappresentazione polinomiale

Rappresentazione

Proprietà

Esempio: CRC semplificato

7. Codici più avanzati: BCH e Reed–Solomon (cenni)

8. Correzione vs. rilevazione, canale e criteri di decodifica

9. Attività pratiche e esercizi svolti

Esercizio 1 — Costruzione di un codice di Hamming (7,4) e decodifica

Esercizio 2 — Simulazione di Hamming su più messaggi

Esercizio 3 — Codice ciclico semplice e CRC

10. Metodi pratici e consigli di implementazione

11. Esercizi proposti (da svolgere)

12. Punti critici e appunti di rigore

13. Conclusione sintetica

Commenti

Posta un commento

Post popolari in questo blog

Corso di Stampa 3D: 3 – Modelling 3D – Software

Corso di chimica: Reazioni chimiche

Corso di Taglio e Lavorazioni Digitali: 6 Introduzione al CNC

Corso di Algebra Avanzata Teoria dei Codici e Crittografia: 3 Teoria dei Codici

Teoria dei Codici

Obiettivi

1. Concetti fondamentali e notazioni

2. Codici lineari: generatori e controllo di parità

Matrice generatrice GG

Matrice di controllo HH

Encoding e verifica

3. Distanza minima, bound fondamentali

4. Codice di Hamming: struttura e decodifica

Costruzione del codice di Hamming (7,4)(7,4)

Proprietà

Esempio numerico (Hamming (7,4))

5. Decodifica per sindrome (algoritmo)

6. Codici ciclici: rappresentazione polinomiale

Rappresentazione

Proprietà

Esempio: CRC semplificato

7. Codici più avanzati: BCH e Reed–Solomon (cenni)

8. Correzione vs. rilevazione, canale e criteri di decodifica

9. Attività pratiche e esercizi svolti

Esercizio 1 — Costruzione di un codice di Hamming (7,4) e decodifica

Esercizio 2 — Simulazione di Hamming su più messaggi

Esercizio 3 — Codice ciclico semplice e CRC

10. Metodi pratici e consigli di implementazione

11. Esercizi proposti (da svolgere)

12. Punti critici e appunti di rigore

13. Conclusione sintetica

Commenti

Posta un commento

Post popolari in questo blog

Corso di Stampa 3D: 3 – Modelling 3D – Software

Corso di chimica: Reazioni chimiche

Corso di Taglio e Lavorazioni Digitali: 6 Introduzione al CNC

Matrice generatrice $G$

Matrice di controllo $H$

Costruzione del codice di Hamming $(7,4)$