Media (statistica)
Da Wikipedia, l'enciclopedia libera.
In statistica la media è un insieme di indicatori di posizione, anche se spesso si intende la media aritmetica.
Le principali medie sono
- la media aritmetica
- la media geometrica
- la media armonica
- la media di potenza
le quali a loro volta possono essere
- semplici
- ponderate
A queste si possono aggiungere la mediana e la moda, le quali vengono calcolate in modo molto diverso rispetto alle tre altre medie.
Nella lingua italiana, in statistica, spesso viene chiamata media (intendendo implicitamente "aritmetica") cio' che realmente si chiama Valore atteso, in quanto vengono calcolati nello stesso modo, ma hanno significati teorici differenti: per taluni la media aritmetica viene applicata soltanto nella statistica descrittiva e il valore atteso nell'ambito della probabilità e delle variabili casuali in particolare.
Indice |
[modifica] Media aritmetica
[modifica] Media aritmetica semplice
Detto in modo molto semplice, la media aritmetica semplice è ... la media, così come viene intesa comunemente. Viene usata per riassumere con un solo numero un insieme di dati su un fenomeno misurabile (per esempio, l'altezza media di una popolazione).
Viene calcolata sommando i diversi valori a disposizione, i quali vengono divisi con il numero complessivo di valori.
[modifica] Formule
La formula della media aritmetica semplice è:
ovvero, utilizzano il simbolo della sommatoria:
[modifica] Caratteristiche
La media, come tutti gli indici di posizione, ci dice all'incirca l'ordine di grandezza (la posizione sulla scala dei numeri, appunto) dei valori esistenti.
In particolare dice che: se abbiamo N valori, con media Ma, allora per conoscere la somma di tutti questi valori è sufficiente moltiplicare N con Ma. Ci permette così di avere un'idea della quantità complessiva conoscendo soltanto il valore medio e quanti valori ci sono.
Che si tratti di un indicatore di posizione lo si verifica facilmente, in quanto se aggiungiamo a tutti i valori una stessa quantità allora la media è anch'essa aumentata di quella stessa quantità. Inoltre, se moltiplichiamo tutti i valori con un determinato numero, allora anche la media aritmetica viene moltiplicata con tale numero.
[modifica] Esempi
Problema:
- Abbiamo cinque bambini: Alessandro, Beatrice, Carmelo, Davide e Esmeralda.
- Alessandro ha 5 cioccolate, Beatrice e Davide una sola, mentre Carmelo ed Esmeralda hanno ciascuno due cioccolate.
Domanda: mediamente, quante cioccolate hanno i cinque bambini? .
Soluzione: I 5 bambini hanno (in ordine alfabetico) 5, 1, 2, 1 e 2 cioccolate. Dunque:
media = (5 + 1 + 2 + 1 + 2) / 5 = 11 / 5 = 2,2
Perciò possiamo dire che mediamente i cinque bambini hanno 2,2 cioccolate ciascuno e messi insieme ne hanno 11.
È vero che in realtà nessuno dei cinque bambini ha 2,2 cioccolate: o ne hanno di più o ne hanno di meno. Scopriamo però che se anche Monica, Nando, Ottavio e Pinuccia hanno mediamente 2,5 cioccolate a testa, allora il primo gruppo di bambini ha complessivamente più cioccolate del secondo.
Infatti 2,5·4 = 10 è più piccolo di 11.
Altro esempio: Abbiamo 5 sacchetti di castagne che pesano mediamente 200 grammi. Moltiplicando 200gr con 5, otteniamo che stiamo tenendo in mano un kilo di castagne. Non sappiamo però se tutti i sacchetti sono di circa 200gr. Potrebbe anche darsi che ce ne sia uno da mezzo chilo, uno da due etti e tre da un etto. Non lo possiamo sapere conoscendo soltanto la media.
[modifica] Facendosi aiutare da un software
Usando il pacchetto statistico R, si può calcolare la media aritmetica semplice nel seguente modo:
x <- c(5,1,2,1,2) N <- length(x) Ma <- sum(x) / N print(Ma) # risultato: 2.2
oppure, approfittando di R:
x <- c(5,1,2,1,2) Ma <- mean(x) print(Ma) # risultato: 2.2
Per verificare che possiamo aggiungere o moltiplicare valori costanti, continuiamo i due esempi:
print(mean(x+100)) # risultato: 102.2 print(mean(x*100)) # risultato: 220
[modifica] Media aritmetica ponderata
Nella media ponderata, i singoli valori, prima di essere sommati vengono moltiplicati con il peso (ponderazione) a loro assegnato. La divisione non viene fatta con il numero di valori, ma con la somma dei pesi.
[modifica] Formula e calcoli
La formula generale è
dove fi è il peso assegnato al valore identificato con i
Esempio
Riprendendo l'esempio dei bambini con le cioccolate di cui sopra:
- È abitudine, quando si fanno i calcoli a mano, di prepararsi una piccola tabella:
i | xi | fi | xi·fi |
1 | 1 | 2 | 2 |
2 | 2 | 2 | 4 |
3 | 5 | 1 | 5 |
∑ | 5 | 11 |
Dove: xi rappresenta il numero di cioccolate; fi è il peso rappresentato del numero di bambini che posseggono un egual numero di cioccolate.
Ricaviamo dalla tabella che:
∑ xi·fi = 11
e
∑ fi = 5
cosicché la media aritmetica ponderata è pari a 11/5=2,2.
Il fatto che si ottenga lo stesso risultato dell'esercizio precedente non è un caso, in quanto la media ponderata viene usata spesso dopo aver raggruppato tutti i valori trovati in giro, in quanto ci sono meno calcoli da fare, ovvero la stessa tabella riassuntiva può essere riciclata per disegnare istogrammi.
[modifica] Facendosi aiutare da un software
Usando il pacchetto statistico R, si può calcolare la media aritmetica ponderata nel seguente modo:
x <- c(1,2,5) f <- c(2,2,1) Ma.pond <- sum(x*f) / sum(f) print(Ma.pond)
oppure usando le funzioni specifiche di R:
x <- c(1,2,5) f <- c(2,2,1) Ma.pond <- weighted.mean(x,f) print(Ma.pond)
[modifica] Media geometrica
La media geometrica (semplice) è l'N-esima radice del prodotto di tutti gli N valori.
La media geometrica viene usata soprattutto quando i diversi valori vengono per loro natura moltiplicati tra di loro e non sommati. Esempio tipico sono i tassi di crescita (anche i tassi d'interesse o i tassi d'inflazione), adeguatamente modificati.
In questi casi è più corretto usare questo tipo di media al posto di quella aritmetica, perché ha caratteristiche utili in quelle situazioni.
[modifica] Caratteristiche e limiti
Il principale limite è che non si possono usare valori negativi. Una caratteristica è che valori piccoli (rispetto alla media geometrica) sono molto più importanti che valori grandi. In particolare, è sufficiente la presenza di un unico valore nullo, per rendere nulla la media, sia quella semplice che quella ponderata.
[modifica] Media geometrica semplice
[modifica] Formula
In formula si può definire la media geometrica come:
[modifica] Esempi
Negli ultimi cinque anni sono stati rilevati i seguenti tassi d'inflazione: 3,2% per il 1997, 2,7% (1998), 2,8% (1999), 2,2% (2000) e 3,2% (2001).
Trattandosi di valori relativi e percentuali, li trasformiamo anzitutto dividendo con 100 e poi sommando loro 1. Otteniamo così per gli ultimi cinque anni dei fattori di moltiplicazione pari a: 1,032 1,027 1,028 1,022 1,032.
Moltiplicando tra di loro questi cinque valori otteniamo
∏xi = 1,149142
Estraendo la radice quinta, si ottiene
Mg = 5√1,149142 = 1,028193
[modifica] Facendosi aiutare da un software
Usando il pacchetto statistico R, si può calcolare la media geometrica semplice nel seguente modo:
x <- c(1.032, 1.027, 1.028, 1.022, 1.032) N <- 5 Mg <- prod(x)^(1/N) print(Mg)
oppure, usando direttamente i dati sull'inflazione:
x <- c(3.2, 2.7, 2.8, 2.2, 3.2) N <- 5 Mg <- prod(x/100 + 1)^(1/N) print((Mg-1)*100)
[modifica] Media geometrica ponderata
[modifica] Media armonica
La media armonica è ... il reciproco della media aritmetica dei reciproci.
Particolarmente utile per qualche tipo di variabili come ad esempio per calcolare la velocità media lungo un percorso.
È vietato usare valori nulli per ovvi motivi, mentre sono leciti valori negativi.
Valori (sia positivi che negativi) vicini allo zero, sono molto più importanti di valori grandi. Infatti se in autostrada percorriamo metà del percorso a 120 km/h, e l'altra metà a 10 km/h, la velocità media complessiva è molto più vicina a 10 che a 120.
[modifica] Esempi
Sia il tratto A che il tratto B sono lunghi 120 km. Percorrendo il primo tratto a 120 km/h impieghiamo 1 ora, per fare il secondo tratto a 10 km/h impieghiamo 12 ore. Complessivamente impieghiamo 13 ore, percorrendo così l'intero percorso ad una media di 240km/13h = 18,46 km/h.
Utilizzano la media armonica otteniamo lo stesso risultato:
Mh = 2 / (1/120 + 1/10) = 2 / (0,00833 + 0,1) = 2 / 0,10833 = 18,46
[modifica] Facendosi aiutare da un software
Usando il pacchetto statistico R, si può calcolare la media armonica semplice nel seguente modo:
v <- c(120,10) Mh <- 1 / mean(1/v) print(Mh)
[modifica] Media di potenza
La media di potenza di ordine s è la radice s-ma della media aritmetica delle potenze di esponente s dei valori
La media di potenza è la generalizzazione della media aritmetica, geometrica e armonica, infatti, scegliendo oppurti valori per s, otteniamo la media aritmetica (s = 1), la media geometrica (s = 2) o la media armonica (s = -1).
[modifica] Definizione integrale
Una generalizzazione del concetto di media a distribuzioni continue prevede l'uso di integrali. Supponiamo di avere una funzione , integrabile. Allora si può definire la media come :
.
Più in generale data una funzione dove è un insieme sul quale è definita una funzione di integrazione, si definisce la media come:
.