Exploratory Data Analysis (2009-2010)

Academic Year of the Course: 
2009-2010
Course: 
010EC
Exploratory Data Analysis
Teaching staff: 
Gabriella Schoier
Course Outlines: 
The course is proposed to introduce the first concepts, the formal tools and the graphic technologies for the statistical analysis of data. The course will also comprise an introduction to basic commands of the software R for data analysis and graphics.
Contents: 
1) Concetti introduttivi Statistica e ricerca empirica. Il metodo statistico nelle scienze sperimentali e osservazionali. Popolazione e campione. Statistica descrittiva e inferenziale.Rilevazioni:caratteri e scale di misura;spoglio dei dati e costruzione di tavole statistiche. 2) Metodi per la descrizione e la sintesi di insiemi di dati statistici Distribuzioni di frequenza e tabelle statistiche. Tecniche di rappresentazione grafica. Il Diagramma ramo-foglie. L'istogramma e il diagramma di frequenze cumulate. Indici di tendenza centrale. Medie analitiche,schema delle medie potenziate, proprietà della media aritmetica. Medie di posizione, moda, mediana. I percentili. Il grafico dei quantili e la funzione cumulata empirica. Altri tipi di media. Indici di variabilità : scarto interquartile,scostamento semplice medio dalla media e dalla mediana, varianza, scarto medio assoluto, scarto quadratico medio. Indici relativi di variabilità relativi.I numeri indici(cenni). La concentrazione: definizione, la curva di Lorenz. I momenti, centrali e dall'origine.Misure di eterogeneità (Indice di Gini e indice di entropia). Il diagramma a scatola (box-plot). La simmetria e cenni sulla curtosi. Confronti fra due o più distribuzioni: il diagramma quantile-quantile. La trasformazione di variabili: trasformazioni lineari, la standardizzazione, la trasformazione logaritmica. Modelli teorici per distribuzioni di frequenza. Modelli per distribuzioni discrete e continue. Il modello gaussiano. Uso di grafici quantile-quantile per valutare la conformità dei dati ad un modello teorico. 3) L'analisi delle relazioni fra due variabili statistiche Tabelle di frequenza congiunta. Distribuzioni marginali e condizionate. Media e varianza marginale in funzione delle medie e delle varianze condizionate. Il concetto di indipendenza: probabilistica, in media, in distribuzione. L'analisi della dipendenza con variabile dipendente quantitativa. Box-plot multipli. Il rapporto di correlazione: eta2. Diagrammi di dispersione. Covarianza e correlazione. La funzione di regressione. La funzione di regressione lineare. Il criterio dei minimi quadrati. Indici per la misura dell'adattamento: il coefficiente di determinazione. Metodi diagnostici: analisi dei residui. Funzioni di regressione non lineari e trasformazione delle variabili. Il coefficiente di correlazione semplice. Correlazione spuria e coefficiente di correlazione parziale cenni all'analisi di regressione multipla. 4) Analisi esplorativa di dati statistici attraverso ERRE. Introduzione al linguaggio ERRE. L’uso di ERRE per rappresentazioni grafiche. Box-plot, istogrammi, q-q-plot. Calcolo dei principali indici statistici e uso di funzioni ERRE. Analisi di regressione lineare con ERRE.
Recommended Texts: 
David S. Moore The basic practice of statistics, third edition W.H Freeman & Co.2004
Last update: 12-11-2013 - 16:28