Insegnamento STATISTICAL METHODS FOR ECONOMY AND FINANCE
Nome del corso di laurea | Finanza e metodi quantitativi per l'economia |
---|---|
Codice insegnamento | A000201 |
Sede | PERUGIA |
Curriculum | Statistics for finance and economics |
Docente responsabile | Luca Scrucca |
CFU | 12 |
Regolamento | Coorte 2019 |
Erogato | Erogato nel 2019/20 |
Anno | 1 |
Periodo | Annuale |
Tipo insegnamento | Obbligatorio (Required) |
Tipo attività | Attività formativa integrata |
Suddivisione |
STATISTICAL LEARNING AND DATA MINING ( MOD.II)
Codice | A000203 |
---|---|
Sede | PERUGIA |
CFU | 6 |
Docente responsabile | Luca Scrucca |
Docenti |
|
Ore |
|
Attività | Caratterizzante |
Ambito | Matematico, statistico, informatico |
Settore | SECS-S/01 |
Tipo insegnamento | Obbligatorio (Required) |
Lingua insegnamento | INGLESE |
Contenuti | Metodi statistici avanzati per il Data Mining, sia nel caso di supervised learning (classificazione e regressione) che di unsupervised learning (analisi dei cluster, riduzione della dimensionalità). Casi di studio reali introdotti e analizzati con il software R. |
Testi di riferimento | James G., Witten D., Hastie T. and Tibshirani R. (2013) An Introduction to Statistical Learning with Applications in R. Springer-Verlag. Materiale supplementare fornito dal docente nel corso delle lezioni. |
Obiettivi formativi | Al termine del corso lo studente dovrà essere in grado di applicare in maniera autonoma gli opportuni metodi statistici a problemi reali di regressione, classificazione e clustering, tramite il software R. |
Prerequisiti | Conoscenza di base della statistica, sia descrittiva che inferenziale, e il modello di regressione lineare. |
Metodi didattici | Lezioni frontali ed esercitazioni pratiche nel laboratorio informatico. |
Altre informazioni | Frequenza facoltativa ma fortemente consigliata. |
Modalità di verifica dell'apprendimento | Valutazioni in itinere ed esame orale finale. Le attività di laboratorio sono finalizzate ad accertare la capacità dello studente di mettere in pratica le metodologie introdotte in classe. L'esame orale finale intende invece valutare il livello di conoscenza e comprensione raggiunto dallo studente per quanto riguarda gli aspetti computazionali e metodologici trattati durante il corso. |
Programma esteso | Il corso prevede lo studio di metodi statistici avanzati per il Data Mining, sia nel caso di supervised learning (classificazione e regressione) che di unsupervised learning (analisi dei cluster, riduzione della dimensionalità). Tali metodi sono stati applicati con successo in molti ambiti, dalla finanza all'economia, dal business analytics alle scienze sociali e naturali. I metodi trattati saranno introdotti a partire da casi di studio reali e analizzati tramite il software R. In dettaglio, verranno trattati i seguenti argomenti: - Statistical learning e data mining: introduzione. - Obiettivi di un modello statistico: previsione e interpretabilità. - Supervised vs unsupervised learning. - Classificazione vs regressione. - Valutazione dell'accuratezza di un modello statistico. - Supervised learning: introduzione. - Estensioni al modello di regressione lineare: selezione del modello e regolarizzazione. Regressione polinomiale, splines, modelli generalizzati additivi. - Metodi di ricampionamento: cross-validation e bootstrap. - Classificazione: introduzione. - Modello logistico e multinomiale. - Analisi discriminante lineare e quadratica. - Gaussian naive Bayes - Modelli mistura Gaussiani - Algoritmo k-nearest neighbour (cenni). - Metodi avanzati per la regression e la classificazione: Artificial neural networks, Decision trees, Bagging, Random forests, Boosting. - Unsupervised learning: introduzione. - Analisi delle componenti principali - Misure di similarità e di distanza. Matrice delle distanze. - Metodi gerarchici per la cluster analysis. - Metodi non gerarchici (metodo k-means). - Model-based clustering. |
STATISTICAL METHODS FOR FINANCE (MOD.I)
Codice | A000202 |
---|---|
Sede | PERUGIA |
CFU | 6 |
Docente responsabile | Silvia Pandolfi |
Docenti |
|
Ore |
|
Attività | Caratterizzante |
Ambito | Matematico, statistico, informatico |
Settore | SECS-S/01 |
Tipo insegnamento | Obbligatorio (Required) |
Lingua insegnamento | INGLESE |
Contenuti | Inferenza statistica: stime basate sul metodo della massima verosimiglianza. Regressione: il modello di regressione lineare semplice e multiplo; il modello di regressione logistico. Casi di studio reali introdotti e analizzati con il software statistico R. |
Testi di riferimento | Weisberg, S. (2014) Applied Linear Regression, 4th edition, Wiley Ruppert, D. and Matteson, D.S. (2015) Statistics and Data Analysis for Financial Engineering, 2nd ed., Springer Materiale supplementare fornito dal docente nel corso delle lezioni. |
Obiettivi formativi | Al termine del corso lo studente sarà in grado di applicare i metodi di inferenza statistica e di regressione lineare studiati a dati reali, tramite l'utilizzo del software R. |
Prerequisiti | Conoscenze di statistica di base (statistica descrittiva e inferenza statistica). |
Metodi didattici | Lezioni frontali e utilizzo del software statistico R. |
Altre informazioni | Frequenza facoltativa ma fortemente consigliata. |
Modalità di verifica dell'apprendimento | L'esame consiste in una prova scritta con domande aperte di carattere teorico e interpretazione dell’output del software R per l’analisi di dati. |
Programma esteso | Metodo della massima verosimiglianza: verosimiglianza e funzione di log-verosimiglianza, stime di massima verosimiglianza (MLE), funzione Score e informazione di Fisher, proprietà statistiche degli stimatori MLE, calcolo numerico delle stime MLE, test del rapporto di verosimiglianza e intervalli di confidenza basati sulla verosimiglianza. Stime di massima verosimiglianza per distribuzioni applicate ai log-return. Modelli di regressione: regressione lineare semplice e multipla, stima dei parametri, metodo dei minimi quadrati e massima verosimiglianza, test di ipotesi, intervalli di confidenza, predittori categorici, analisi della varianza, bontà di adattamento, trasformazioni, metodi di selezione del modello, analisi diagnostica e dei residui, multicollinearità. Regressione logistica: specifica del modello, interpretazione dei parametri e stima dei parametri. |