Insegnamento CREDIT SCORING

Corso

Finanza e metodi quantitativi per l'economia

Codice insegnamento

A001937

Sede

PERUGIA

Curriculum

Finanza ed assicurazione

Docente

Elena Stanghellini

Docenti

Elena Stanghellini

Ore

42 ore - Elena Stanghellini

CFU

Regolamento

Coorte 2021

Erogato

2022/23

Attività

Caratterizzante

Ambito

Matematico, statistico, informatico

Settore

SECS-S/01

Tipo insegnamento

Opzionale (Optional)

Tipo attività

Attività formativa monodisciplinare

Lingua insegnamento

INGLESE

Contenuti

Il corso approfondisce i principali strumenti di classificazione: il modello logistico, l’analisi discriminante. Tali strumenti saranno poi applicati nell’ambito del credit Scoring. Saranno pertanto presentate le nozioni teoriche e pratiche per il Credit scoring, ovvero: definizione e fasi; probabilità e indipendenza; modelli logistici come classificatori; curva ROC e CAP e altri metodi di validazione.

Testi di riferimento

Alan Agresti, Maria Kateri (2021): Foundations of Statistics for Data Scientists (with R and Python). CRC Press, Chapman & Hall. ISBN: 9781003159834
Note in inglese a cura del docente (tradotte dal libro Stanghellini (2009) Introduzione ai metodi statistici per il Credit Scoring -- Springer Italia, Capp: 1-5.)

Obiettivi formativi

Un’importante componente della formazione del Data Scientist riguarda la classificazione. Il corso permette di acquisire gli elementi necessari alla comprensione e implementazione delle principali tecniche statistiche di classificazione parametrica. Le metodologie verranno applicate nel contesto del Credit Scoring per l'analisi e la previsione del rischio di insolvenza. Il taglio applicativo, mediante studio di casi reali attraverso il software R e Python, permette allo studente di acquisire familiarità con l'analisi dei dati e di vedere implementate le tecniche per la stima e la quantificazione della probabilità di default.

Prerequisiti

Per affrontare con successo il modulo di Credit Scoring, lo studente deve avere frequentato e possibilmente superato il corso Generalized Linear Models. In particolare, è richiesta la conoscenza del modello di regressione lineare multiplo, nei seguenti aspetti: a) ipotesi di base b) stima dei parametri con il metodo dei Minimi Quadrati Ordinari (OLS) e con la Massima verosimiglianza (MLE); c) distribuzioni campionarie degli stimatori, sotto normalità o asintotiche; d) intervalli di confidenza e verifica di ipotesi; test F sulla bontà del modello; e) problemi di eteroschedasticità.

Metodi didattici

L'insegnamento prevede quattro ore di lezione e due ore di esercitazione settimanali. Si consigliano gli studenti di seguire con assiduità le lezioni e le esercitazioni. Inoltre, gli studenti frequentanti possono scegliere di svolgere le esercitazioni assegnate dal docente su base bisettimanale. Le esercitazioni possono essere svolte in gruppi di 3 o 4 studenti ed esonerano dalla consegna del documento scritto (vedi modalità di verifica dell'apprendimento). Si consigliano gli studenti di partecipare allo schema di esercitazioni in gruppo.

Altre informazioni

Gli studenti incoming in programmi di scambio internazionali quali Erasmus e accordi quadro sono benvenuti.

Modalità di verifica dell'apprendimento

La valutazione è basata su una prova orale. Nella prova orale lo studente dovrà dimostrare sia padronanza dei contenuti teorici che capacità di applicare le tecniche di analisi dei dati presentate durante il corso. A tal fine, si mette a disposizione sulla pagina web del corso in Unistudium, la traccia di una esercitazione pratica di analisi di uno o più dataset. Lo studente dovrà consegnare un breve resoconto delle analisi svolte secondo la traccia messa in rete, almeno tre giorni prima della data prevista dell'orale. L'elaborato può essere inviato per e-mail al docente (e-mail disponibile nella pagina personale del docente). Gli studenti frequentanti possono aderire ad uno schema di esercitazioni su base settimanale (o bisettimanale). Questo esonera dalla presentazione dell'elaborato.

Programma esteso

Il modello logistico come modello lineare generalizzato. Interpretazione e stima dei parametri. Intervalli di confidenza e verifica di ipotesi. La classificazione e il Credit Scoring. Definizione di Credit scoring: ipotesi e obiettivi; fasi; errori di classificazione; scelta del cut-off; curva ROC e CAP. Richiami di probabilità: indipendenza marginale e condizionata; variabili casuali categoriali e misure di associazione. Il modello logistico: variabili dummy; forma matriciale; stima mediante massima verosimiglianza; verifica d'ipotesi; criteri di scelta e procedure di selezione del modello; tabella di errata classificazione; test di Hosmer e Lemeshow; il campione bilanciato e metodi di ribilanciamento. Analisi discriminante: il caso normale; stima di massima verosimiglianza dei parametri di una v.c. normale multivariata; stima della funzione discriminante; selezione delle variabili; funzione discriminante di Fisher. Lo score nel tempo. Reject Inference. Il corso sarà basato su analisi di casi reali, analizzati al computer con il software statistico R e Python.