Insegnamento CREDIT SCORING

Corso
Finanza e metodi quantitativi per l'economia
Codice insegnamento
A001937
Sede
PERUGIA
Curriculum
Statistics for finance and economics
Docente
Elena Stanghellini
Docenti
  • Elena Stanghellini
Ore
  • 42 ore - Elena Stanghellini
CFU
6
Regolamento
Coorte 2021
Erogato
2022/23
Attività
Caratterizzante
Ambito
Matematico, statistico, informatico
Settore
SECS-S/01
Tipo insegnamento
Opzionale (Optional)
Tipo attività
Attività formativa monodisciplinare
Lingua insegnamento
INGLESE
Contenuti
Il corso approfondisce i principali strumenti di classificazione: il modello logistico, l’analisi discriminante. Tali strumenti saranno poi applicati nell’ambito del credit Scoring. Saranno pertanto presentate le nozioni teoriche e pratiche per il Credit scoring, ovvero: definizione e fasi; probabilità e indipendenza; modelli logistici come classificatori; curva ROC e CAP e altri metodi di validazione.
Testi di riferimento
Alan Agresti, Maria Kateri (2021): Foundations of Statistics for Data Scientists (with R and Python). CRC Press, Chapman & Hall. ISBN: 9781003159834
Note in inglese a cura del docente (tradotte dal libro Stanghellini (2009) Introduzione ai metodi statistici per il Credit Scoring -- Springer Italia, Capp: 1-5.)
Obiettivi formativi
Un’importante componente della formazione del Data Scientist riguarda la classificazione. Il corso permette di acquisire gli elementi necessari alla comprensione e implementazione delle principali tecniche statistiche di classificazione parametrica. Le metodologie verranno applicate nel contesto del Credit Scoring per l'analisi e la previsione del rischio di insolvenza. Il taglio applicativo, mediante studio di casi reali attraverso il software R e Python, permette allo studente di acquisire familiarità con l'analisi dei dati e di vedere implementate le tecniche per la stima e la quantificazione della probabilità di default.
Prerequisiti
Per affrontare con successo il modulo di Credit Scoring, lo studente deve avere frequentato e possibilmente superato il corso Generalized Linear Models. In particolare, è richiesta la conoscenza del modello di regressione lineare multiplo, nei seguenti aspetti: a) ipotesi di base b) stima dei parametri con il metodo dei Minimi Quadrati Ordinari (OLS) e con la Massima verosimiglianza (MLE); c) distribuzioni campionarie degli stimatori, sotto normalità o asintotiche; d) intervalli di confidenza e verifica di ipotesi; test F sulla bontà del modello; e) problemi di eteroschedasticità.
Metodi didattici
L'insegnamento prevede quattro ore di lezione e due ore di esercitazione settimanali. Si consigliano gli studenti di seguire con assiduità le lezioni e le esercitazioni. Inoltre, gli studenti frequentanti possono scegliere di svolgere le esercitazioni assegnate dal docente su base bisettimanale. Le esercitazioni possono essere svolte in gruppi di 3 o 4 studenti ed esonerano dalla consegna del documento scritto (vedi modalità di verifica dell'apprendimento). Si consigliano gli studenti di partecipare allo schema di esercitazioni in gruppo.
Altre informazioni
Gli studenti incoming in programmi di scambio internazionali quali Erasmus e accordi quadro sono benvenuti.
Modalità di verifica dell'apprendimento
La valutazione è basata su una prova orale. Nella prova orale lo studente dovrà dimostrare sia padronanza dei contenuti teorici che capacità di applicare le tecniche di analisi dei dati presentate durante il corso. A tal fine, si mette a disposizione sulla pagina web del corso in Unistudium, la traccia di una esercitazione pratica di analisi di uno o più dataset. Lo studente dovrà consegnare un breve resoconto delle analisi svolte secondo la traccia messa in rete, almeno tre giorni prima della data prevista dell'orale. L'elaborato può essere inviato per e-mail al docente (e-mail disponibile nella pagina personale del docente). Gli studenti frequentanti possono aderire ad uno schema di esercitazioni su base settimanale (o bisettimanale). Questo esonera dalla presentazione dell'elaborato.
Programma esteso
Il modello logistico come modello lineare generalizzato. Interpretazione e stima dei parametri. Intervalli di confidenza e verifica di ipotesi. La classificazione e il Credit Scoring. Definizione di Credit scoring: ipotesi e obiettivi; fasi; errori di classificazione; scelta del cut-off; curva ROC e CAP. Richiami di probabilità: indipendenza marginale e condizionata; variabili casuali categoriali e misure di associazione. Il modello logistico: variabili dummy; forma matriciale; stima mediante massima verosimiglianza; verifica d'ipotesi; criteri di scelta e procedure di selezione del modello; tabella di errata classificazione; test di Hosmer e Lemeshow; il campione bilanciato e metodi di ribilanciamento. Analisi discriminante: il caso normale; stima di massima verosimiglianza dei parametri di una v.c. normale multivariata; stima della funzione discriminante; selezione delle variabili; funzione discriminante di Fisher. Lo score nel tempo. Reject Inference. Il corso sarà basato su analisi di casi reali, analizzati al computer con il software statistico R e Python.
Condividi su