La macchina di Galton

Come saprete, vi scrivo da un villaggio nel mezzo del bush, in Tanzania, a un’ora di auto dalla città più vicina. Questa è un’eccellente scusa per aver scritto un post poco approfondito e privo di immagini.

Il carnevale della matematica di questo mese ha come tema le “macchine matematiche”. Da fisico, obietterei subito che le “macchine” appartengono alla Fisica, in particolare alla meccanica, parola che ha la medesima etimologia, il greco μηχανή (mekhané). Vi appartengono necessariamente in quanto realizzazioni concrete, nello spazio fisico reale, che i matematici non conoscono che per sentito dire. D’altra parte ogni fenomeno fisico (ogni? forse – il discorso sarebbe complesso: c’è anche chi ha tirato fuori il primo teorema di incompletezza di Gödel in proposito, ma dovrebbe essere vero almeno per la meccanica classica) ammette una descrizione matematica, anzi, più di una, a seconda del livello a cui si vuole lavorare. Ci concediamo quindi di confondere questi due livelli: la teoria matematica e la fisica che ne viene descritta. Tra l’altro, è un lusso che il nostro cervello ama concedersi: gli esseri umani sono eccezionalmente bravi a praticare l’astrazione, ossia a cercare l’idealizzazione di un fenomeno (che si sappia, nessun altro o niente altro lo è nel sistema solare; resta da decidere se questo sia un record interessante o se il fatto che sia interessante lo pensiamo solo noi).

Questo sproloquio per introdurre l’argomento. È da un po’ che volevo fare una serie di post su dei teoremi particolarmente importanti o che mi piacciono particolarmente. Ne approfitto per parlare del primo attraverso una bellissima macchina che ne descrive perfettamente le deduzioni in un caso particolare (il caso più interessante, in realtà). Prima di spiegare ricordo ancora una volta che qui non ci sono teoremi, solo atomi, siamo noi a dare l’interpretazione. Se questo valga a tutti livelli della fisica è una domanda che andrebbe sottoposta ad un’apposita sottocommissione di filosofi delle scienza, che probabilmente litigherebbe per duemila anni e poi risponderebbe “boh”.

La macchina in questione è detta tavola di Galton, inventata, secondo Wikipedia, da un certo sir Francis Galton nel 1894. In alto, un imbuto rilascia, una alla volta, delle palline che cadono su un chiodo posto immediatamente sotto di esso, al centro, in modo che la pallina cada alla sua destra o alla sua sinistra grossomodo con uguale probabilità. Qualunque delle due vie essa scelga, troverà un nuovo chiodo ad aspettarla, e così via per un numero grande di passaggi, finché non raggiunge la base della “macchina”, dove viene fermata in una scanalatura in modo da osservare la sua posizione finale. Il tutto è più facile a vedersi che a spiegarsi: vi consiglio di andare a cercare una delle molte immagini e applet che ne mostrano il funzionamento (scusate se lascio a voi questo lavoro, ma la mia connessione internet rende ogni ricerca una sofferenza).

Mettetevi ora nei panni di una pallina. Chiamiamo asse x quello orizzontale, con origine in corrispondenza dell’imbuto. Ad ogni chiodo, determinate casualmente se spostarvi a destra o a sinistra, cioè se sommare o sottrarre un valore \delta x (dipendente dalla distanza tra i chiodi) alla vostra posizione corrente. La posizione finale dopo N chiodi è la somma di N valori, ognuno dei quali può essere, con uguale probabilità, +\delta x o $latex-\delta x$.

Indubbiamente, la clausola che il passo a destra e quello a sinistra siano egualmente frequenti fa subito pensare che, in media, la pallina resti attorno alla posizione zero. Ma sapere la media non dice tutto sulla distribuzione di probabilità: si può ottenere media zero con qualsiasi distribuzione finale di palline, purché simmetrica attorno all’origine. Anche se la media è zero, di sicuro non tutte le palline si troveranno esattamente sotto all’imbuto da cui sono partite. Mi aspetto che siano diffuse attorno ad esso, ma di quanto?

Qui entra in gioco il Teorema del Limite Centrale.

«La somma di N variabili casuali estratte dalla medesima distribuzione di probabilità, avente media M e deviazione standard S finite, è distribuita, per N grande, come una funzione gaussiana di media NM e deviazione standard S\sqrt{N}

Nel caso particolare della tavola, la somma di variabili casuali è la somma dei passi a destra o a sinistra, che avvengono con probabilità uguale e costante. La distribuzione esatta è una binomiale, che, per numero di passi sufficientemente grande, converge alla gaussiana.

Dal punto di vista matematico ha una sua eleganza perché si può vedere dal punto di vista degli spazi di funzioni: il ruolo particolare della gaussiana è dato dall’essere il punto fisso di una certa trasformazione; ma su questo non mi soffermo, innanzitutto perché non ne so abbastanza.

La bellezza di questo teorema consiste nel giustificare la presenza della distribuzione gaussiana un po’ dappertutto: l’altezza delle persone e molte altri dati biometrici sono distribuiti gaussianamente, così come molti tipi di errori di misurazione, eccetera. Ogni volta che il valore di una quantità è determinato dalla somma di un numero elevato di fattori imprevedibili, ci aspettiamo che il teorema entri in gioco, e le osservazioni lo confermano in molti casi.

Il random walk
Un caso molto simile si osserva realmente in fisica: considerate una particella “grande” rispetto alle molecole di un gas, nel quale è immersa. Essa riceve in continuazione spinte dalle molecole che la urtano casualmente, spingendola a destra o a sinistra. Applicando esattamente lo stesso ragionamento di cui sopra, si dimostra che la probabilità di trovare la particella ad una certa distanza dalla posizione iniziale è gaussiana, con una deviazione standard (l’ampiezza della gaussiana) che aumenta nel tempo. Questo è uno dei modi per risolvere il più semplice problema di DIFFUSIONE. In alternativa, si scrive un’equazione alle derivate parziali e la si risolve: è interessante notare che il modo più semplice per trovare la soluzione di quest’ultima (che naturalmente è la stessa: la gaussiana) è identico a quello usato per dimostrare il teorema del limite centrale (trasformare e antitrasformare alla Fourier, per chi fosse interessato).

A quanto pare non sono l’unico a trovarlo bello. Concludo con quello che Francis Galton scriveva: I know of scarcely anything so apt to impress the imagination as the wonderful form of cosmic order expressed by the “Law of Frequency of Error”. The law would have been personified by the Greeks and deified, if they had known of it. It reigns with serenity and in complete self-effacement, amidst the wildest confusion. The huger the mob, and the greater the apparent anarchy, the more perfect is its sway. It is the supreme law of Unreason. Whenever a large sample of chaotic elements are taken in hand and marshaled in the order of their magnitude, an unsuspected and most beautiful form of regularity proves to have been latent all along.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s