Statistica Inferenziale Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Riepilogo lezione 5 Abbiamo visto: z Modelli probabilistici nel continuo z Distribuzione uniforme continua z Distribuzione esponenziale z Distribuzione normale z Distribuzione normale standardizzata z Distribuzione T-Student z Distribuzione Chi-quadrato 1 Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Popolazione z Popolazione: totalità dei casi (unità statistiche) sede del fenomeno oggetto di studio. z Rilevazione censuaria e campionaria: data una popolazione finita un campione casuale di ampiezza n si ottiene estraendo a sorte con reimmissione n unità della popolazione z Popolazione finita e infinita (astrazione utile a fini didattici) F(x) = modello descrittivo della popolazione Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Campione z Campione casuale di ampiezza n: variabile aleatoria multipla (X1, X2, …, Xn) le componenti sono indipendenti e identicamente distribuite con distribuzione f(x), dove f(x) denota il modello descrittivo della popolazione. Indichiamo con (x1,x2,…,xn) il campione effettivamente osservato: un punto nello spazio euclideo ad n dimensioni 2 Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Spazio campionario (Ω) z Spazio campionario (Ω): insieme di tutti i possibili campioni estraibili dalla popolazione. z Spazio campionario discreto o continuo a seconda se X è discreta o continua. Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Distribuzione del campione z Distribuzione del campione: f(x1,x2,…,xn) = f(x1)f(x2)…f(xn) Questa è una funzione di probabilità (caso discreto) o di densità (caso continuo) a seconda della natura di f(x) (o, equivalentemente, di X) z INDIPENDENZA delle osservazioni campionarie 3 Esempio Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com …continua alla slide successiva z Siamo interessati a studiare la composizione delle famiglie di una certa collettività. Per semplicità, immaginiamo che vi siano solo 8 famiglie, che etichettiamo con 1, 2, … 8 e che il numero di componenti per ciascuna di esse sia dato da z Il numero di componenti nella popolazione è descritto da z Esempio Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com …continua alla slide successiva Il numero medio di componenti nella popolazione è E(X) = 3.625 e la varianza nella popolazione è V(X) = 0.734. z z Supponiamo ora di estrarre un campione casuale (cioè con reimmissione) di ampiezza 2 dalla popolazione descritta. z Lo spazio dei possibili dati campionari, ossia di tutte le coppie di valori del carattere “numero di componenti” che potremmo rilevare (spazio campionario) è rappresentato nella tabella (slide successiva), dove indichiamo in ogni casella sia le possibili coppie di famiglie che potremmo estrarre, sia (in grassetto) il corrispondente numero di componenti. 4 Esempio Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com …continua alla slide successiva z Tabella Esempio Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com …continua alla slide successiva z La distribuzione congiunta del campione (X1, X2) può essere ottenuta facilmente dalla tabella precedente, ed è descritta nella seguente tabella a doppia entrata, in cui, in ciascuna casella riportamo anche, in grassetto, il corrispondente valore della media campionaria: 5 Esempio Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com …continua alla slide successiva z Notiamo che X1 e X2 sono indipendenti e identicamente distribuiti con la stessa distribuzione della popolazione X. z La definizione della media campionaria si ottiene dalla tabella precedente, e risulta: Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Esempio 6 Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Inferenza statistica z z z Parametro = ω = costante caratteristica della popolazione. Nell’esempio precedente il parametro di interesse è il numero di componenti della famiglia. Parametri scalari e vettoriali. Per esempio: – – z z Popolazione Bernoulliana: il parametro è p (scalare) Popolazione Normale: il parametro è ω = (μ,σ2) (vettoriale) Spazio dei parametri = Ω = insieme di tutti i valori plausibili per il parametro. Per esempio: Popolazione Normale: Ω = (ℜ,ℜ+) Inferenza statistica: risalire dai dati di un campione alle caratteristiche rilevanti della popolazione, o meglio di un parametro della popolazione (assunto un modello teorico per la popolazione stessa Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Inferenza statistica: concetti z Stima dei parametri (puntiale o per intervallo): sulla base del campione assegno al parametro di interesse un valore o un insieme di valori z Verifica delle ipotesi: faccio una congettura sul parametro e verifico, sulla base del campione, se essa è accettabile (non vera!) 7 Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Diversi approcci all’inferenza z Classico (Fisher, Neyman, Pearson): concezione frequentista della probabilità; fa uso unicamente delle informazioni contenute nel campione. z Bayesiano (Lindley, Savage, de Finetti): concezione soggettivista della probabilità; fa uso anche di informazioni a priori sui parametri espresse tramite distribuzioi di probabilità. z Teoria delle decisioni (Wald): tiene contro delle conseguenze di decisioni alternative espresse tramite funzioni di perdita; può fare uso anche di informazioni a priori. Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Statistiche campionarie z Statistica campionaria: una qualsiasi funzione g(X1, X2, … , Xn) del campione. z Poiché il campione è casuale, la statistica campionaria è una variabile casuale. 8 Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Statistiche campionarie più comuni …continua alla slide successiva Statistiche campionarie più comuni 9 Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Distribuzioni campionarie z Per una statistica campionaria Y= g(X1,X2, …, Xn) Si ha dove Distribuzione della media campionaria Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com …continua alla slide successiva z In generale, indipendentemente dalla distribuzione della popolazione, se la media della popolazione è μ e la varianza della popolazione è σ2 abbiamo che: 10 Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Distribuzione della media campionaria z Nota: la varianza della distribuzione della media campionaria è tanto minore quanto maggiore è la dimensione del campione. Inoltre la varianza è tanto maggiore quanto maggiore è la varianza della popolazione (nel caso limite in cui la popolazione ha varianza nulla, anche la varianza della media campionaria è nulla). Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Popolazione Bernoulliana 11 Popolazione Normale Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com …continua alla slide successiva Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Popolazione Normale z In altre parole la media campionaria, opportunamente standardizzata, si distribuisce asintoticamente come una Normale con media zero e varianza uno. Questo è il teorema del limite centrale che enunciato in altri termini dice che la media campionaria si distribuisce, asintoticamente (al crecere del campione), come una normale con media uguale alla media della popolazione e varianza pari alla varianza della popolazione divisa per m (ampiezza campionaria): 12 Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Nota bene Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Distribuzione della varianza campionaria z In generale, indipendentemente dalla distribuzione della popolazione, abbiamo che: 13 Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Distribuzione della differenza tra due medie campionarie z Da due diverse popolazioni provengono i campioni (X1, X2, …, Xn) e (Y1, Y2, … , Yn) Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Distribuzione della differenza tra due medie campionarie – casi particolari 14 Distribuzione di rapporti che coinvolgono medie e varianze campionarie Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com …continua alla slide successiva Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Distribuzione di rapporti che coinvolgono medie e varianze campionarie 15 Prof.R.Folgieri,aa 2009-10-email folgieri@mtcube.com Riepilogo Abbiamo visto: z Definizione di popolazione, di campione e di spazio campionario z Distribuzione del campione z Inferenza statistica – definizioni e approcci all’inferenza z Statistiche campionarie z Distribuzione della media campionaria z Popolazione Bernoulliana e popolazione Normale z Distribuzione della varianza campionaria z Distribuzione della differenza tra due medie campionarie e casi particolari z Distribuzione di rapporti che coinvolgono medie e varianze campionarie 16