La Community italiana per le Scienze della Vita

La curiosa storia del Test t di Student

William Sealy Gosset, lo Student del Test t di Student, lo ha inventato per produrre una birra migliore.

La birra è quanto di più distante si possa immaginare dalla statistica. Eppure la storia della produzione della famosa birra Guinness è strettamente connessa con questa complessa quanto fondamentale disciplina. Come spesso accade nel mondo della scienza, alla base delle scoperte di maggior successo ci possono essere necessità pratiche sorte in ambienti molto diversi da quello accademico. Questo vale anche per la formulazione di uno dei test d’ipotesi maggiormente utilizzati oggigiorno, il test t di Student.

Questo test statistico permette di confrontare il valore della media di un campione di dati sperimentali con un valore di riferimento, oppure di verificare se tra le medie di due campioni vi sia una differenza significativa. La sua formulazione risale agli inizi del Novecento: si tratta di una storia curiosa e affascinante che mette in evidenza il rapporto tra mondo accademico e industria, tra complesse formulazioni teoriche e ricerca del sapore migliore per una delle birre più sorseggiate.

La rivoluzione del birrificio Guinness

La storia del marchio Guinness comincia nel 1759, quando Arthur Guinness avvia la produzione di una birra scura ad alta fermentazione presso il birrificio St. James’s Gate a Dublino[1]. Presto la birra stout si afferma nel mercato londinese e, alla fine del 19° secolo, la Guinness è la più grande birreria al mondo. All’inizio del Novecento, per garantire la qualità del prodotto, l’azienda si dota di un team di giovani e brillanti menti, costituendo un vero e proprio reparto di Controllo Qualità. La Guinness mette a loro disposizione laboratori, campi d’orzo, giardini di luppolo e una malteria e un birrificio sperimentali[1].

Così i giovani ricercatori iniziano a condurre esperimenti per selezionare le migliori varietà di luppolo e orzo e per individuare le condizioni ottimali di coltivazione, essicazione e conservazione al fine di ottenere il miglior sapore e la maggior durata per la loro birra.

William Sealy Gosset: lo Student del test t

Tra i migliori laureati assunti presso il birrificio Guinness, spicca la figura di William Sealy Gosset. Nato a Canterbury nel 1876, si laurea con lode in matematica e in chimica presso il New College di Oxford[2]. Nel 1899 viene assunto come birraio dalla Arthur Guinness, Son & Co. presso il birrificio di Dublino, per applicare le sue conoscenze di chimica e statistica all’indagine della qualità degli ingredienti grezzi e del prodotto finale. Lavorerà nell’azienda per tutta la vita, divenendo nel 1907 birraio incaricato del birrificio sperimentale e nel 1935 capo birraio del nuovo birrificio di Park Royal a Londra[2].

Il lavoro presso il birrificio lo stimola ad approfondire lo studio delle leggi della statistica e a elaborare nuovi modelli da applicare al controllo qualità, tra cui il test t. Gosset deve però pubblicare i suoi articoli utilizzando lo pseudonimo Student, nome con cui oggi è ricordato. La Guinness permetteva infatti ai suoi dipendenti di pubblicare le loro ricerche a patto che non menzionassero il loro nome, la birra o il nome dell’azienda, al fine di evitare la diffusione di informazioni confidenziali[3].

Il problema dei piccoli numeri

È proprio nell’ambiente del birrificio che Gosset si scontra con le limitazioni dei modelli statistici allora disponibili. I dati provenienti dagli esperimenti condotti in laboratorio e in campo presentavano una grande variabilità e si basavano su un numero limitato di osservazioni[1]. Era noto che la media campionaria fosse una stima inesatta della media di popolazione poiché affetta dall’errore campionario. Ma Gosset intuisce che anche il valore della deviazione standard campionaria è soggetto a un errore crescente man mano che la numerosità del campione diminuisce[4].

In questo caso la deviazione standard del campione non riflette in modo accurato la deviazione standard della popolazione. Pertanto, quando si affrontano esperimenti difficilmente ripetibili e si dispone quindi di un piccolo campione, non è possibile ricorrere alla procedura tradizionale basata sulla distribuzione normale per determinare quanto accurata è la stima della media di popolazione[4].

Il test t come soluzione al problema dei piccoli numeri

Per approfondire lo studio della legge dell’errore, nel 1906-1907 Gosset ottiene da Guinness la possibilità di trascorrere l’anno accademico presso il laboratorio di K. Pearson[2]. Il risultato di questi studi si concretizza nel 1908, con la pubblicazione nel giornale Biometrika del paper “The Probable Error of a Mean“, in cui Gosset introduce per la prima volta quello che sarà noto come test t di Student. Il giovane chimico ha finalmente trovato la risposta al problema dei piccoli numeri.

Basandosi su complessi calcoli matematici, Gosset introduce infatti una nuova variabile e deriva la funzione che descrive la distribuzione di probabilità di questa statistica. Viene così introdotta una famiglia di distribuzioni che comprende distribuzioni diverse a seconda del numero di unità campionarie e che permette di valutare se la differenza tra le medie di piccoli campioni sia significativa.

Il test t applicato al Controllo Qualità nel birrificio

A questo punto Gosset può affrontare l’analisi statistica dei dati derivanti dagli esperimenti sull’orzo, risultato di 7 anni di lavoro[1]. L’analisi deve tenere in considerazione le rese relative a diverse varietà d’orzo, diverse fattorie e distretti, oltre che valutazioni in merito alla qualità di maltazione e ai risultati di produzione della birra. Applicando per la prima volta il test t di Student, Gosset analizza quindi la resa e la qualità dell’orzo insieme in termini di valore per acro. Le sue complesse statistiche lo portano a concludere che la miglior varietà di orzo è la Archer[1]. Ora la Guinness sa quale varietà di sementi acquistare e distribuire ad agricoltori selezionati per comprarne poi il raccolto, destinato ad alimentare la produzione della loro ormai famosa birra scura ad alta fermentazione.

Ti potrebbe anche interessare:

Referenze

  1. J. F. Box (1987) – Guinness, Gosset, Fisher, and Small SamplesStatistical Science 2(1), 45-52
  2. University of St. Andrews, MacTutor History of Mathematics – William Saely Gosset
  3. S. T. Ziliak (2019) – How large are your G-values? Try Gosset’s Guinnessometrics when a little “p” is not enoughThe American Statistician 73, 281-290
  4. W. S. Gosset (1908) – The Probable Error of a Mean Biometrika 6(1), 1-25
Articoli correlati
Commenta