Analisi Esplorativa Dei Dati (2004-2005)

Anno Accademico: 
2004-2005
Insegnamento: 
EC001
Analisi Esplorativa Dei Dati
Docente: 
Gabriella Schoier
Obiettivi: 
Il corso si propone d'introdurre i primi concetti, gli strumenti formali e le tecniche grafiche per l’analisi di dati statistici e di motivare l’uso delle tecniche statistiche per l’analisi di dati reali anche utilizzando adeguati strumenti software.
Programma: 
1) Concetti introduttivi Statistica e ricerca empirica. Il metodo statistico nelle scienze sperimentali e osservazionali. Popolazione e campione. Statistica descrittiva e inferenziale.Rilevazioni:caratteri e scale di misura;spoglio dei dati e costruzione di tavole statistiche. 2) Metodi per la descrizione e la sintesi di insiemi di dati statistici Distribuzioni di frequenza e tabelle statistiche. Tecniche di rappresentazione grafica. Il Diagramma ‘ramo e foglie’. L’istogramma e il diagramma di frequenze cumulate. Indici di tendenza centrale. Medie analitiche,schema delle medie potenziate, proprietà della media aritmetica. Medie di posizione, moda, mediana. I percentili. Il grafico dei quantili e la funzione cumulata empirica. Altri tipi di media. Indici di variabilità: scarto interquartile,scostamento semplice medio dalla media e dalla mediana, varianza, scarto medio assoluto, scarto quadratico medio. Indici relativi di variabilità relativi.I numeri indici(cenni). I momenti, centrali e dall'origine.Misure di eterogeneità (Indice di Gini e indice di entropia). Il diagramma ‘a scatola’ (box-plot). La simmetria e cenni sulla curtosi. Confronti fra due o più distribuzioni: il diagramma quantile-quantile. La trasformazione di variabili: trasformazioni lineari, la standardizzazione, la trasformazione logaritmica. Modelli teorici per distribuzioni di frequenza. Modelli per distribuzioni discrete e continue. Il modello gaussiano. Uso di grafici quantile-quantile per valutare la conformità dei dati ad un modello teorico. 3) L’analisi delle relazioni fra due variabili statistiche Tabelle di frequenza congiunta. Distribuzioni marginali e condizionate. Media e varianza marginale in funzione delle medie e delle varianze condizionate. Il concetto di indipendenza: probabilistica, in media, in distribuzione. L’analisi della dipendenza con variabile dipendente quantitativa. Box-plot multipli. Il rapporto di correlazione: eta2. Diagrammi di dispersione. Covarianza e correlazione. La funzione di regressione. La funzione di regressione lineare. Il criterio dei minimi quadrati. Indici per la misura dell’adattamento: il coefficiente di determinazione. Metodi diagnostici: analisi dei residui. Funzioni di regressione non lineari e trasformazione delle variabili. Il coefficiente di correlazione semplice. Correlazione spuria e coefficiente di correlazione parziale cenni all’analisi di regressione multipla. 4) Analisi esplorativa di dati statistici attraverso ERRE. Introduzione al linguaggio ERRE. L’uso di ERRE per rappresentazioni grafiche. Box-plot, istogrammi, q-q-plot. Calcolo dei principali indici statistici e uso di funzioni ERRE. Analisi di regressione lineare con ERRE.
Testi consigliati: 
Zani S., Analisi dei dati statistici I, Giuffrè, Milano, 1997
Ultimo aggiornamento: 11-12-2013 - 15:53