ESERCIZI D’ESAME DI STATISTICA DESCRITTIVA A - Facoltà di Economia - Esame di Statistica – 24.01.2011 5. La rilevazione della capacità ricettiva negli Alberghi della provincia di Cagliari nel 2009 ha fornito i seguenti dati: 333 letti in 18 alberghi di categoria 1 stella 439 letti in 18 alberghi di categoria 2 stelle 1694 letti in 6 alberghi di categoria 5 stelle 4466 letti in 64 alberghi di categoria 3 stelle 13779 letti in 46 alberghi di categoria 4 stelle a. Si costruisca la funzione cumulativa delle frequenze degli alberghi in funzione della categoria, determinando la mediana della distribuzione e la distanza tra il terzo e il primo quartile. b. Si calcoli il numero medio di letti per ciascuna categoria d’albergo e si determinino media, mediana e le dispersioni assoluta e relativa di tali nuovi dati. B - Facoltà di Economia - Esame di Statistica – 21.02.2011 4. Un’indagine su 44 famiglie ha rilevato il numero X dei figli e il reddito annuale (Y in migliaia di Euro) di ogni singola famiglia, registrando le coppie di dati (X, Y): (2, 30.0) (0, 16.8) (1, 28.1) (6, 32.6) (0, 21.2) (1, 50.0) (1, 24.5) (0, 36.0) (1, 23.5) (8, 46.8) (2, 23.5) (0, 27.5) (6, 29.5) (2, 28.2) (3, 23.8) (2, 26.5) (2, 26.5) (6, 28.0) (1, 24.0) (2, 40.0) (4, 35.2) (7, 48.6) (3, 50.0) (3, 48.2). (4, 28.0) (1, 25.6) (0, 28.0) (1, 22.2) (0, 17.8) (0, 26.3) (3, 48.0) (1, 30.0) (5, 42.0) (4, 27.4) (8, 50.0) (0, 42.1) (0, 45.0) (6, 31.0) (7, 50.0) (5, 30.0) (1, 29.2) (1, 18.4) (0, 42.1) (4, 25.5) a. Si costruisca la tabella a doppia entrata delle frequenze congiunte, secondo il seguente schema: Y (y1) (y2) (y3) 16.00 - 24.00 24.50 - 30.00 30.50 - 50.00 X (x1) 0-1 (x2) 2-3 (x3) 4-5 (x4) >5 In base ai dati sintetizzati nella tabella a doppia entrata, si ricavino: b. medie e varianze della X e della Y, confrontando i coefficienti di variazione (per la classe “>5” si assuma 6 come valore rappresentativo); c. le distribuzioni condizionate di Y|x1 e di X|y2 e le rispettive medie e deviazioni standard. C - Facoltà di Economia - Esame di Statistica –20.07.2006 5. Nella seguente tabella sono riportati gli emolumenti mensili netti dichiarati da due liberi professionisti relativamente al primo semestre del 2000. Tali emolumenti sono stati rilevati in Euro per il primo professionista e in migliaia di Lire per il secondo. Si vuole calcolare la differenza tra le medie aritmetiche dei due emolumenti e la differenza della variabilità relativa mediante i coefficienti di variazione. Si commentino le conclusioni. mese Gennaio Febbraio Marzo Aprile Maggio Giugno Professionista 1 (Euro) 4514 3242 3145 5120 2765 4344 Professionista 2 (migliaia di Lire) 4376 9473 6895 6530 5342 6000 D - Facoltà di Economia - Esame di Statistica – 11.12.2006 2. Una compagnia aerea (attualmente in crisi!) sa che, in media il 65%, dei propri voli ha ritardo. La rilevazione dei ritardi ha fornito i seguenti dati: Ritardo (in centesimi di ora) 0-10 10-20 20-30 30-50 50-100 Numero di voli 2000 3000 2500 2000 500 a) Calcolare la media e la deviazione standard del tempo di ritardo per i voli ritardati. b) La compagnia ha valutato che ciascun volo ritardato produce una perdita fissa di 170 Euro e una perdita variabile di 100 Euro per ogni minuto di ritardo: qual è la perdita media mensile stimata? c) Si stabilisca se si ha maggiore variabilità nelle perdite o nel tempo di ritardo. E - Facoltà di Economia - Esame di Statistica –14.09.2006 5. Alla partenza da Cagliari sono stati intervistati 20 giovani turisti ai quali, tra le varie domande, è stato chiesto il numero dei giorni trascorsi in città e la propria fascia d’età. In base alle risposte fornite nel seguito, a. si costruisca la tabella a doppia entrata delle variabili numero di giorni e fascia d’età. Inoltre, limitatamente al numero di giorni b. si costruisca il grafico della funzione cumulativa delle frequenze; c. si determinino il primo e l’ultimo quartile; d. media, mediana, moda e varianza. giorni età giorni età 2 2 1 0 3 5 3 3 1 1 16-18 19-21 19-21 25-27 22-24 30-32 19-21 22-24 16-18 19-21 0 0 2 3 3 3 1 2 5 3 19-21 22-24 22-24 25-27 16-18 22-24 25-27 22-24 25-27 19-21 F - Facoltà di Economia - Esame di Statistica – 27.04.07 5. Data la seguente tabella di dati y -2.7 -1.2 0.0 5.5 7 8 5 6 4 2 2 12 0 x 1 3 4 3 0 2 si costruisca il diagramma a dispersione nel piano (X,Y) e si rappresentino le medie di Y condizionate a x1=1, x2=2 e x3=4, rispettivamente. G - Facoltà di Economia - Esame di Statistica – 15.11.2007 2. Nella tabella seguente è riportato il numero xi di esami sostenuti da 30 studenti di un certo corso di laurea: a) b) c) d) 1 6 4 1 3 4 5 5 1 6 3 3 5 1 4 2 5 4 1 6 5 3 1 2 2 4 1 3 6 5 Si costruisca la funzione cumulativa delle frequenze relative e se ne disegni il grafico. Si calcoli la distanza tra il primo e il terzo quartile. Si calcoli la distanza tra il primo e l’ultimo decile. Si determinino i seguenti indici: moda, mediana, media e varianza del numero di esami. Si determinino inoltre i medesimi indici dei punti b), c) e d) nel caso in cui al valore x=6 si sostituisca il valore x=7, mantenendo invariati tutti gli altri dati. H - Facoltà di Economia - Esame di Statistica – 29.05.2008 2. I dati (fittizi) sulla disoccupazione giovanile in un certo piccolo paese sono rappresentati nella seguente tabella, suddivisi tra popolazione maschile (M) e femminile (F), per fasce d’età: età 14-20 21-24 25-30 31-35 36-40 M 16 12 24 8 4 F 14 8 30 14 10 sesso a. Si determinino media, mediana e distanza interquartile della intera popolazione. b. Si confronti inoltre la dispersione relativa delle due sottopopolazioni, maschile e femminile. I - Facoltà di Economia - Esame di Statistica – 17.12.2008 5. In una gara di tiro al bersaglio, 25 concorrenti hanno a disposizione 10 tiri ciascuno. A prove ultimate il numero di bersagli centrati da ciascun concorrente è riportato nella tabella seguente: concorrente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 n. centri 7 4 5 3 4 8 5 5 0 4 8 1 5 3 4 7 7 5 8 4 8 5 3 8 8 Si rappresenti il grafico della funzione cumulativa delle frequenze del numero dei bersagli centrati, e si determinino: moda, mediana, distanza interquartile, media e varianza. L - Facoltà di Economia - Esame di Statistica – 06.06.2006 5. Data la seguente tabella relativa alla variabile statistica doppia (X,Y), si calcolino: a. le medie, le varianze di X e Y, e le loro mediane; b. le medie e le mediane della Y condizionatamente a ciascun valore della X. Supponendo che la tabella provenga da un campione casuale di 100 osservazioni si verifiche se le variabili X e Y si possono ritenere indipendenti al livello di significativita’ del 5%. Y -1 0 1 2 -1 0,05 0,03 0,10 0,22 0 0,03 0,02 0,10 0,15 1 0,07 0,10 0,05 0,08 X M - 3..Su un campione casuale di 7 aziende è stata rilevata la variazione del ricavo Y (in unità codificate) nelle vendite di un certo prodotto, rispetto al numero X di clienti raggiunti da una campagna di propaganda. In base ai dati raggruppati in classi nella seguente tabella si calcoli il coefficiente di correlazione lineare e si valuti se si può affermare che le due variabili siano tra loro statisticamente indipendenti. Y [-250; -51] [-50; 49] [50; 199] [0; 1199] 5 9 7 21 [1200; 1799] 7 3 9 19 [1800; 2699] 8 21 6 35 20 33 22 75 X N - Facoltà di Economia - Esame di Statistica – 21.09.2005 1. In uno studio sul linguaggio giornalistico di un quotidiano locale, sono state esaminate le parole usate nei titoli dei principali articoli, classificandole in base al numero di lettere. E’ stata ottenuta la seguente tabella: Numero lettere 1 2 3 4 5 6 7 8 9 Numero parole 22 30 23 20 43 36 20 15 18 10 11 12 13 14 9 8 4 0 2 a. si determinino il 1° e il 9° decile della distribuzione e se ne calcolino le rispettive distanze dalla mediana; b. sapendo che il coefficiente di variazione rilevato negli altri quotidiani della regione è pari a 0.5, si dica se la lunghezza (in lettere) delle parole usate dal quotidiano in studio è più o meno variabile. O - A 20 candidati all’esame di Statistica è stato chiesto di prevedere il voto che riporteranno all’esame. Le previsioni espresse sono le seguenti: x1=18 x2=20 x3=27 x4=30 x5=27 x6=18 x7=30 x8=25 x9=25 x10=18 x11=19 x12=20 x13=22 x14=22 x15=27 x16=28 x17=28 x18=28 x19=27 x20=25 Costruire il grafico della distribuzione delle frequenze cumulate. Calcolare media, mediana e distanza tra il terzo e il primo quartile. Si determini inoltre la dispersione relativa del 40% dei voti più bassi e del 60% dei voti più alti, mettendole a confronto.