La mente statistica terza parte – LA STATISTICA

Foto: Statistica

Il Calcolo delle probabilità ha consentito negli ultimi tre secoli, non solo di affrontare con maggiore consapevolezza molti problemi pratici, ma soprattutto di ampliare in maniera determinante i confini di molti campi del sapere umano

La Statistica è la scienza che si occupa di raccogliere ed elaborare una serie di dati relativi a un determinato fenomeno collettivo (sociale, economico, fisico. ecc.), al fine di ricavare una legge matematica, capace di descriverne un comportamento medio.
Le fasi che, in genere, compongono un’indagine statistica, sono le seguenti:
• determinazione delle caratteristiche più significative del fenomeno da analizzare;
• scelta degli strumenti più idonei per effettuare la rilevazione dei dati;
• individuazione di un campione di individui che possa rappresentare la collettività in oggetto;
• raccolta dei dati forniti dal campione prescelto;
• elaborazione e interpretazione dei dati raccolti;
• individuazione di una legge che descriva il fenomeno, in accordo con risultati ottenuti.
Ognuna di queste fasi comporta l’effettuazione di alcune scelte, spesso piuttosto delicate, per cui, la possibilità di commettere degli errori, più o meno rilevanti è sempre in agguato. Senza contare che, essendo praticamente impossibile scegliere un campione coincidente con l’intera collettività, anche l’indagine statistica più impeccabile, è soggetta, per sua natura, a un errore di approssimazione.
Nel bene o nel male, al giorno d’oggi, si ricorre alla Statistica, per gli scopi più disparati: dalle rilevazioni degli indici di ascolto, ai sondaggi elettorali; dalle indagini di mercato, alle previsioni meteorologiche.
Inizialmente, questa disciplina aveva una finalità essenzialmente descrittiva, limitandosi a rappresentare l’insieme degli elementi raccolti, sotto forma di tabelle o di diagrammi, in modo da consentirne una più agevole consultazione. Col passare degli anni, grazie ai progressi compiuti in campo scientifico, è venuta ad assumere anche una funzione predittiva, fornendo delle indicazioni relative a possibili eventi futuri.
Questa particolare applicazione della statistica è estremamente utile in tutti i casi in cui non è facile calcolare la probabilità di un evento in forma diretta. Ad esempio, se si vuole calcolare la probabilità che, nel corso di un anno, cada la pioggia in una determinata zona desertica, il sistema migliore è rilevare quante volte, negli anni precedenti, è caduta la pioggia in quella zona. Se, in particolare, risulta che nell’arco di 200 anni è caduta in tutto 10 volte in quella zona, si può affermare che la probabilità che cada nel corso di un anno è uguale a: 10/200 = 1/20 = 0,05. Ovviamente, maggiore è il numero di rilevazioni effettuate e maggiore è il grado di attendibilità del risultato ottenuto.
Molto più ardua risulta la determinazione della probabilità relativa a un evento dipendente da decisioni umane. Ad esempio, se si vuole stabilire la probabilità che, uno studente iscritto al primo anno di una determita facoltà universitaria, riesca a portare a termine gli studi, non basta sapere semplicemente quanti studenti, in media , riescono a laurearsi in quella facoltà. È necessario, infatti, prendere in considerazione anche una serie di dati significativi, come: l’età dello studente, la media con cui si è diplomato, la condizione sociale della sua famiglia, le aspettative personali, ecc. Solo in questo modo, è possibile analizzare il comportamento di un campione che possa considerarsi rappresentativo dello studente in esame.
Un utilizzo molto pratico delle rilevazioni statistiche consiste nel verificare sperimentalmente l’attendibilità di un valore teorico di probabilità. In base al teorema di Bernoulli, infatti, se la frequenza di determinato evento coincide con la sua probabilità, vuol dire che questa era stata calcolata in maniera corretta.

ESERCIZI DI STATISTICA

1. Mettete in un sacchetto due palline bianche e due nere.
Effettuate più volte la seguente serie di operazioni:
– estraete casualmente due palline;
– osservate se le palline estratte sono entrambe bianche;
– rimettete le due palline nel sacchetto.
Contate il numero B di volte che avete estratto due palline bianche e il numero T delle estrazioni che avete effettuato in tutto.
Calcolate: F = B/T.
Confrontate il valore ottenuto con quello riportato nello spazio delle soluzioni.

2. Mettete in un sacchetto una pallina bianca e nove nere.
Effettuate più volte la seguente serie di operazioni:
– estraete casualmente due palline;
– osservate se una delle due palline estratte è bianca;
– rimettete le due palline nel sacchetto.
Contate il numero B di volte che avete estratto la pallina bianca e il numero T delle estrazioni che avete effettuato in tutto.
Calcolate: F = B/T.
Confrontate il valore ottenuto con quello riportato nello spazio delle soluzioni.

3. Preparate tre cartoncini in modo che il primo presenti due facce nere,il secondo due facce rosse e il terzo una faccia nera e una rossa.
Mettete i tre cartoncini nel sacchetto ed effettuate più volte le seguenti operazioni:
– estraete un cartoncino a caso;
– se la faccia superiore del cartoncino estratto è rossa, osservate il valore della faccia inferiore e rimettete il cartoncino nel sacchetto;
– se la faccia superiore è nera, rimettete il cartoncino nel sacchetto, senza osservare nulla.
Contate il numero R di volte che avete osservato una faccia inferiore rossa e il numero N delle estrazioni che avete effettuato in tutto.
Calcolate: F = R/N.
Confrontate il valore ottenuto con quello riportato nello spazio delle soluzioni.

4. Prendete due comuni dadi da gioco ed effettuate più volte la seguente serie di operazioni:
– lanciate i due dadi contemporaneamente;
– registrate il punteggio che avete ottenuto;
Riportate i valori ottenuti nel seguente schema

punteggio ottenibile quantità di uscite (Q) frequenza di uscita (Q/T)
2
3
4
5
6
7
8
9
10
11
12
numero totale dei lanci (T)

5. Prendete tre monete ben equilibrate ed effettuate più volte la seguente serie di operazioni:
– lanciate le tre monete contemporaneamente;
– registrate il numero di teste e di croci che avete ottenuto;
Riportate i valori ottenuti nel seguente schema

possibile esito dei lanci quantità di uscite (Q) frequenza di uscita (Q/T)
tre teste
due teste e un croce
Due croci e una testa
tre croci
numero totale dei lanci (T)

6. Le rilevazioni statistiche possono servire anche per calcolare l’area di figure dal contorno irregolare. Supponete, ad esempio, che la sagoma scura contenuta nel seguente quadrato corrisponda alla rappresentazione in scala di un lago; per misurarne l’area, potete procedere nel seguente modo:
– procuratevi un pacchetto di pastina da brodo, a chicchi molto piccoli, e gettatene casualmente una manciata sulla figura quadrato sottostante;
– contate il numero Q di chicchi che sono caduti all’interno dell’intero quadrato;
– contare il numero S di chicchi che sono caduti solo sulla sagoma scura;
– calcolate : A = S/Q
Il valore di A così ottenuto rappresenta una buona misura dell’area della sagoma scura, in relazione a quella del quadrato. Se attribuiamo al lato del quadrato una lunghezza di 10 km, quanti km2 misura l’area del lago?
Controllate la vostra risposta con quella riportata nello spazio delle soluzioni.

7. Tracciate su un foglio di carta delle linee parallele, facendo in modo che la distanza fra di esse sia uguale alla lunghezza di uno stuzzicadenti. Fate cadere casualmente sul foglio, più volte, una certa quantità di stuzzicadenti (tutti della stessa lunghezza). Calcolate il rapporto tra la quantità totale degli stuzzicadenti gettati e quella degli stuzzicadenti che hanno toccato, anche marginalmente, le linee tracciate. Controllate il risultato ottenuto con quello riportato nello spazio delle soluzioni.

8. Fate rotolare più volte una pedina della dama, lungo un piano inclinato. Segnate il punto dove la pedina si ferma, al termine di ogni discesa. Misurate la distanza percorsa in ciascuna discesa e riportate questi valori in un istogramma.
Nota – Per ogni evenienza, ricordiamo brevemente come si costruisce un istogramma.
Si riporta su un asse orizzontale, in ordine crescente, una serie di intervalli relativi ai vari valori ottenibili. In corrispondenza a ognuno di questi intervalli, si costruisce un rettangolo verticale la cui altezza deve essere proporzionale alla quantità di volte che si è rilevato un valore corrispondente a quello del relativo intervallo.

9. La legge dei grandi numeri garantisce che, se la frequenza di determinato evento (che è un dato oggettivo) coincide con la sua probabilità (che è un dato soggettivo), allora la previsione probabilistica è stata elaborata in maniera attendibile. La validità di questo teorema, però, non comporta necessariamente che un eventuale scarto dal valore atteso, riscontrato nell’effettuazione dei primi tentativi, debba essere compensato da quelli successivi (anche se può sembrare una contraddizione).
Si immagini, ad esempio, di aver eseguito una serie di lanci di una moneta e di aver ottenuto i risultati ripostati nella seguente tabella.

Lanci della moneta effettuati Quantità di teste uscite (Q) Quantità di teste attese (Q/T) Scarto tra i valori attesi e quelli usciti Frequenza di uscita delle teste
10 4
100 45
1.000 490
10.000 4.950
100.000 49.900

Riempite opportunamente le ultime tre colonne vuote e cercate di interpretare i risultati ottenuti.

10. Nel 1938, il fisico Frank Benford formulò una legge di distribuzione relativa ai valori delle prime cifre di un insieme di numeri interi generati casualmente. Diversamente da quanto si potrebbe pensare, tali frequenze non solo uguali per tutte le cifre iniziali. In base alla legge di Benford, quelle relative alle nove cifre significative sono le seguenti:
1: 30,10 %
2: 17,61 %
3: 12,49 %
4: 9,69 %
5: 7,92 %
6: 6,70 %
7: 5,80 %
8: 5,11 %
9: 4,58 %

Questa legge non sarebbe valida se si prendessero in considerazione tutti i numeri interi, compresi tra 1 e l’infinito. In questo caso, infatti, le loro prime cifre sarebbero tutte uniformemente rappresentate. Siccome, però, i numeri con cui noi abbiamo a che fare non arrivano all’infinito e, spesso, vengono generati in maniera crescente, si può comprendere come mai i numeri che iniziano con una cifra di basso valore siano più frequenti degli altri.
Provate a verificare, ad esempio, che le frequenze delle cifre iniziali dei prodotti riportati in una tavola pitagorica di dimensioni 9×9 presentano un andamento abbastanza simile a quello previsto dalla legge di Benford .

GLI INGANNI DELLA STATISTICA

Ormai le rilevazioni statistiche entrano sempre più prepotentemente nella nostra vita privata e lavorativa. Bisogna stare attenti, però, ad interpretare correttamente i dati emersi da un’indagine statistica, per evitare di giungere a conclusioni prive di senso. Un errore frequente consiste nell’invertire i ruoli della causa e dell’effetto, in merito a un determinato risultato osservato.
Ad esempio, diversi studi statistici hanno accertato che gli incidenti stradali sono causati prevalentemente da automobilisti del tutto sobri. Questo vuol dire che, per non rischiare di avere incidenti, è consigliabile guidare completamente sbronzi?
Assolutamente no. La maggior parte delle persone non guida in stato di ubriachezza; di conseguenza, la percentuale più alta degli incidenti stradali è causata da automobilisti assolutamente sobri…

Provate a interpretare questi altri risultati statistici, senza farvi trarre in inganno.

1. Gli incidenti stradali avvengono prevalentemente in luoghi non molto distanti dalle abitazioni degli automobilisti che li provocano. Questo vuol dire che, per non rischiare di avere incidenti, è consigliabile allontanarsi molto dalla propria abitazione?

2. Un valente architetto ha elaborato un progetto, per evitare il crollo degli edifici in caso di forti scosse telluriche. Dopo che il progetto è stato messo in opera, nonostante la sua oggettiva validità, il numero di edifici lesionati risulta sensibilmente superiore, rispetto al passato. Come mai?

3. In Arizona è presente una percentuale di persone affette da problemi respiratori, molto più alta di quella riscontrata nel resto degli Usa. Questo significa che il clima dell’Arizona danneggia le vie respiratorie?

4. In base a uno studio condotto in una scuola elementare, è risultato che i bambini con i piedi di più grandi sanno scrivere meglio di quelli con i piedi più piccoli. Questo significa che la dimensione dei piedi influenza l’abilità di scrittura?

5. In seguito a un forte aumento demografico, in un città dell’Europa settentrionale, si è rilevato anche un sensibile incremento del numero di nidi di cicogna. Questo dato può confermare la credenza popolare, secondo la quale i neonati li portano le cicogne?

6. I cantanti di successo sono in prevalenza primogeniti. Questo significa che i primogeniti sono più intonati?

7. La maggior parte degli informatici di professione ha una pessima calligrafia. Questo vuole dire che, scrivere male a mano, è un indice di propensione per l’Informatica?

8. Un’alta percentuale di persone anziane ama giocare al Lotto. Si può dedurre, quindi, che giocare al Lotto rende più longevi?.

9. Molto spesso le combinazioni vincenti al Superenalotto risultano essere state giocate da dei sistemisti. Si può affermare, quindi, che le combinazioni appartenenti a un sistema hanno maggiori probabilità di essere estratte, rispetto a quelle semplici?

10. Verso la fine degli anni ottanta un’importante rivista italiana di sociologia pubblicò un allarmato servizio, nel quale si denunciava che, negli Usa, nel giro di soli cinque anni, erano stati commessi ben quaranta gravi fatti di sangue, da parte di alcuni giovani giocatori di Dungeons & Dragons (il primo e più popolare gioco di ruolo). Un dato di tale rilevanza autorizzava a richiedere la messa al bando di quel gioco, per preservare la salute psichica dei giovani?

SOLUZIONI

Esercizi di statistica

1. Il valore ottenuto dovrebbe essere uguale a circa 1/4. Questo esercizio è una verifica statistica del primo problema, proposto nella prima parte di questo libretto.

2. Il valore ottenuto dovrebbe essere uguale a circa 1/5. Questo esercizio è una verifica statistica del problema n. 7, proposto nella seconda parte di questo libretto (dove la pallina bianca supplisce la moneta d’oro…).
3. Il valore di F ottenuto dovrebbe essere uguale a circa 2/3. Questo esercizio è una verifica statistica di un problema analogo a quello della scatola di Bernard, proposto nella seconda parte di questo libretto.

4. I valori ottenuti dovrebbero essere molto vicini ai seguenti.

punteggio
ottenibile
frequenza
di uscita
2 1/36
3 1/18
4 1/12
5 1/9
6 5/36
7 1/6
8 5/36
9 1/9
10 1/12
11 1/18
12 1/36

Questo esercizio è una verifica statistica del problema n. 8, proposto nella prima parte.

5. I valori ottenuti dovrebbero essere molto vicini ai seguenti.

Possibile esito dei lanci frequenza di uscita
tre teste 1/8
Due teste e un croce 3/8
Due croci e una testa 3/8
tre croci 1/8

6. Il valore ottenuto dovrebbe essere uguale a circa 69 km2.

7. Dovreste aver ottenuto un valore uguale a circa 1,57, ovvero alla la metà del valore approssimato di pi greco (3,14). L’esercizio proposto è un’applicazione del metodo ideato dal naturalista francese, Georges–Louis Leclerc Buffon, per calcolare il valore di pi greco in maniera empirica).

8. La forma dell’istogramma ottenuto dovrebbe essere simile alla seguente.

Nota – Un distribuzione dei dati che presenta un andamento di questa natura iene detta normale e si ottiene tutte le volte che i dati rilevati si ripartiscono simmetricamente intorno al valore medio. Molti aggregati di dati, della natura più disparata, portano a un risultato di questo genere; Ad esempio: i pesi delle pesche raccolte in un determinato frutteto; le altezze in centimetri di un campione di persone della stessa età; le somme dei punti ottenuti lanciando molte volte una certa quantità di dadi; e così via…
9. La tabella completa è la seguente.

Lanci della moneta effettuati Quantità di teste uscite Quantità di teste attese Scarto tra i valori attesi e quelli usciti Frequenza di uscita delle teste
10 4 5 1 0,400
100 45 50 5 0,450
1.000 490 500 10 0,490
10.000 4.950 5.000 50 0,495
100.000 49.900 50.000 100 0,499

Come si può notare, mentre la frequenza di uscita delle teste tende sempre di più a 0,5, valore della relativa probabilità, lo scarto tra i valori attesi e quelli effettivamente usciti non si compensa, ma aumenta sempre di più.

10. Una tavola pitagorica di dimensioni 9×9 ha una struttura del genere.

x 1 2 3 4 5 6 7 8 9
1 1 2 3 4 5 6 7 8 9
2 2 4 6 8 10 12 14 16 18
3 3 6 9 12 15 18 21 24 27
4 4 8 12 16 20 24 28 32 36
5 5 10 15 20 25 30 35 40 45
6 6 12 18 24 30 36 42 48 54
7 7 14 21 28 35 42 49 56 63
8 8 16 24 32 40 48 56 64 72
9 9 18 27 36 45 54 63 72 81

Le frequenze relative alle cifre iniziali dei prodotti in essa presenti sono riportate nella seguente tabella.

Cifra
Iniziale
1 2 3 4 5 6 7 8 9
Frequenza 22,22% 18,51% 13,38% 14,81% 7,40% 8,64% 4,93% 6,17% 3,70%

Nota – È possibile avvicinarsi in maniera più significativa ai valori previsti dalla legge di Benford, costruendo delle tavole pitagoriche di dimensioni sensibilmente più ampie di queste.

Gli inganni della statistica

1. Alla maggior parte degli automobilisti capita di guidare prevalentemente nei pressi della propria abitazione. Per questo motivo, la maggior parte degli incidenti stradali avviene in quei paraggi.

2. Siccome il progetto funziona realmente, gli edifici che prima sarebbero crollati al suolo, adesso restano solo lesionati (e il loro numero, quindi, aumenta sensibilmente rispetto al passato).

3. Il clima dell’Arizona è particolarmente indicato per la cura delle malattie respiratorie. Per questo motivo, molte persone che soffrono di tali patologie decidono di stabilirsi in Arizona.

4. Una scuola elementare è frequentata da bambini di diversa età. Ovviamente, sanno scrivere meglio i più grandi, che hanno, di conseguenza, anche i piedi di maggiori dimensioni.

5. L’aumento demografico ha indotto la costruzione di nuovi edifici. In questo modo è aumentato il numero di comignoli sui quali le cicogne possono costruire il loro nido.

6. Indipendentemente dal settore sociale preso in considerazione, la percentuale dei figli primogeniti è sempre maggiore di quella relativa ad altre categorie di figli. Infatti, vanno considerati primogeniti anche i figli unici…

7. Gli informatici di professione, essendo abituati a scrivere prevalentemente con la tastiera del computer, col passare del tempo disimparano a farlo a mano.

8. Le persone anziane giocano al Lotto soprattutto per vincere la noia; ma non si può affermare che un’attività del genere allunghi la vita. Sarebbe come affermare che guardare molto la televisione rende più longevi, dato che la maggior parte delle persone anziane guarda molto la televisione…

9. Abitualmente, vengono giocate molte più combinazioni raggruppate in sistemi, che combinazioni semplici; di conseguenza, è molto probabile che una combinazione vincente sia stata giocata da un sistemista. Ma ogni combinazione giocata ha una probabilità di essere estratta identica a quella di tutte le altre, indipendentemente dal fatto che appartenga a un sistema o no.

10. In quel periodo, quasi tutti i ragazzi statunitensi potevano essere considerati dei giocatori di Dungeons & Dragons; negli Usa, infatti, erano state vendute circa dieci milioni di confezioni di quel gioco, una cui partita coinvolge almeno tre-quattro partecipanti. Era, quindi, piuttosto azzardato attribuire a Dungeons & Dragons la responsabilità di tutte le potenziali nefandezze eseguibili dai giovani cittadini degli Usa. Con la stessa logica si sarebbe potuto affermare che, siccome la maggior parte dei giovani delinquenti statunitensi indossava i jeans (come la quasi totalità dei loro coetanei), allora quel tipo di abbigliamento induceva fortemente al crimine

Ennio Peres
Nato a Milano il 1 dicembre 1945 (ma residente a Roma dalla nascita), laureato in Matematica con lode, ex professore di Informatica e di Matematica, dalla fine degli anni ‘70 svolge la professione di giocologo (che, praticamente, si è inventata lui), con l’intento di diffondere tra la gente, tramite ogni possibile mezzo, il piacere creativo di giocare con la mente. Redattore della sezione Giochi & Parole dell’enciclopedia a fascicoli Il Mondo dei Giochi (Fabbri, 2001), ha curato le voci relative ai giochi dell’Enciclopedia dei Ragazzi (Treccani, 2005) e della Treccani Trevolumi (Treccani, 2008). Inoltre, ha realizzato l'Appendice di giochi matematici della Garzantina Matematica (Garzanti, 2013). Nel campo dell'editoria più strettamente scolastica, ha integrato con oltre cinquanta schede di matematica ricreativa i sei volumi del corso di Matematica e Geometria di Anna Montemurro (De Agostini, 2015). Autore di oltre quaranta libri di argomento ludico e scientifico, ideatore di giochi in scatola e di giochi radiofonici e televisivi, collaboratore di varie testate giornalistiche nazionali e del Canton Ticino, si avvale costantemente della preziosa consulenza della moglie, Susanna Serafini. Ha ricevuto diversi premi, tra i quali: - Premio Gradara Ludens 1998. - Premio Personalità ludica dell’ anno 2005. - Premio Internazionale Pitagora sulla Matematica 2006 (per il migliore lavoro multimediale). - Trofeo ARI 2008 (per la duplice figura di autore e di divulgatore dell’arte del Rebus).

LASCIA UN COMMENTO

Please enter your comment!
Please enter your name here