Analisi Esplorativa Dei Dati (2009-2010)

Anno Accademico: 
2009-2010
Insegnamento: 
010EC
Analisi Esplorativa Dei Dati
Docente: 
Gabriella Schoier
Obiettivi: 
Il corso si propone d'introdurre i primi concetti, gli strumenti formali e le tecniche grafiche per l'analisi di dati statistici e di motivare l'uso delle tecniche statistiche per l'analisi di dati reali anche utilizzando adeguati strumenti software.
Programma: 
1) Concetti introduttivi Statistica e ricerca empirica. Il metodo statistico nelle scienze sperimentali e osservazionali. Popolazione e campione. Statistica descrittiva e inferenziale.Rilevazioni:caratteri e scale di misura;spoglio dei dati e costruzione di tavole statistiche. 2) Metodi per la descrizione e la sintesi di insiemi di dati statistici Distribuzioni di frequenza e tabelle statistiche. Tecniche di rappresentazione grafica. Il Diagramma ramo-foglie. L'istogramma e il diagramma di frequenze cumulate. Indici di tendenza centrale. Medie analitiche,schema delle medie potenziate, proprietà della media aritmetica. Medie di posizione, moda, mediana. I percentili. Il grafico dei quantili e la funzione cumulata empirica. Altri tipi di media. Indici di variabilità : scarto interquartile,scostamento semplice medio dalla media e dalla mediana, varianza, scarto medio assoluto, scarto quadratico medio. Indici relativi di variabilità relativi.I numeri indici(cenni). La concentrazione: definizione, la curva di Lorenz. I momenti, centrali e dall'origine.Misure di eterogeneità (Indice di Gini e indice di entropia). Il diagramma a scatola (box-plot). La simmetria e cenni sulla curtosi. Confronti fra due o più distribuzioni: il diagramma quantile-quantile. La trasformazione di variabili: trasformazioni lineari, la standardizzazione, la trasformazione logaritmica. Modelli teorici per distribuzioni di frequenza. Modelli per distribuzioni discrete e continue. Il modello gaussiano. Uso di grafici quantile-quantile per valutare la conformità dei dati ad un modello teorico. 3) L'analisi delle relazioni fra due variabili statistiche Tabelle di frequenza congiunta. Distribuzioni marginali e condizionate. Media e varianza marginale in funzione delle medie e delle varianze condizionate. Il concetto di indipendenza: probabilistica, in media, in distribuzione. L'analisi della dipendenza con variabile dipendente quantitativa. Box-plot multipli. Il rapporto di correlazione: eta2. Diagrammi di dispersione. Covarianza e correlazione. La funzione di regressione. La funzione di regressione lineare. Il criterio dei minimi quadrati. Indici per la misura dell'adattamento: il coefficiente di determinazione. Metodi diagnostici: analisi dei residui. Funzioni di regressione non lineari e trasformazione delle variabili. Il coefficiente di correlazione semplice. Correlazione spuria e coefficiente di correlazione parziale cenni all'analisi di regressione multipla. 4) Analisi esplorativa di dati statistici attraverso ERRE. Introduzione al linguaggio ERRE. L’uso di ERRE per rappresentazioni grafiche. Box-plot, istogrammi, q-q-plot. Calcolo dei principali indici statistici e uso di funzioni ERRE. Analisi di regressione lineare con ERRE.
Testi consigliati: 
Donato Posa, Sandra De Iaco, Monica Palma, Fondamenti di Statistica descrittiva Giappichelli editore, Torino 2008 David S. Moore Statistica di Base Apogeo 2005 Francesco Pauli, Nicola Torelli, Matilde Trevisani, Statistica esercizi ed esempi,Pearson Education 2008
Ultimo aggiornamento: 11-12-2013 - 16:27