Codice |
A005434 |
CFU |
3 |
Docente responsabile |
Andrea Capotorti |
Docenti |
- Irene Benedetti (Codocenza)
|
Ore |
- 21 Ore (Codocenza) - Irene Benedetti
|
Attività |
Affine/integrativa |
Ambito |
Attività formative affini o integrative |
Settore |
MAT/06 |
Tipo insegnamento |
Obbligatorio (Required) |
Lingua insegnamento |
ITALIANO |
Contenuti |
Convergenza di successioni di variabili aleatorie - Funzioni caratteristiche - Teoremi limite classici. Passeggiate aleatorie e catene di Markov. Processi stazionari. |
Testi di riferimento |
J. Jacod and P. Protter, Probability Essentials, Springer-verlag Berlin And Heidelberg Gmbh & Co. Kg, 2004. Grimmett-Stirzaker: Probability and Random Processes; Clarendon Press, Oxford (1982). |
Obiettivi formativi |
Approfondire concetti fondamentali della teoria del Calcolo delle Probabilità, con particolare attenzione ai maggiori risultati relativi alle diverse tipologie di convergenza di successioni di variabili aleatorie e alle funzioni caratteristiche, e ai teoremi limite classici. Conoscenze generali dei principali processi, padronanza dei metodi d'indagine. Lo studente dovrà essere in grado di esporre, collegare e confrontare i concetti principali e i risultati presentati nel corso e di dimostrare i teoremi fondamentali del programma d'esame. Dovrà saper risolvere problemi, seguendo l'esempio fornito dagli esercizi svolti in aula. |
Prerequisiti |
Per poter seguire coscientemente il corso e sostenere l'esame con profitto è indispensabile possedere gli obiettivi formativi dell'insegnamento di Probabilità e Statistica I. |
Metodi didattici |
Lezioni frontali in aula su tutti gli argomenti in programma; svolgimento in aula di alcuni esercizi in forma seminariale partecipata per abituare gli studenti ad affrontare problemi espliciti e curarne l'esposizione. |
Altre informazioni |
1) Frequenza: facoltativa. 2) Per informazioni sui servizi di supporto agli studenti con disabilità e/o DSA visita la pagina http://www.unipg.it/disabilita-e-dsa. |
Modalità di verifica dell'apprendimento |
L'esame prevede una prova orale su argomenti di tutto il programma, finalizzata ad accertare il livello di conoscenza e capacità di comprensione raggiunto dallo studente sui contenuti teorici e metodologici indicati nel programma. La prova orale consentirà inoltre di verificare le capacità espositive dello studente con proprietà di linguaggio ed organizzazione autonoma dell'esposizione sugli stessi argomenti a contenuto teorico. Per informazioni sui servizi di supporto agli studenti con disabilità e/o DSA visita la pagina http://www.unipg.it/disabilita-e-dsa |
Programma esteso |
Convergenza di successioni di variabili aleatorie: convergenza in distribuzione, convergenza in probabilità, convergenza in media r-esima, convergenza quasi certa; Funzioni caratteristiche: definizione, proprietà, legame con la convergenza in distribuzione, teoremi di continuità ed applicazioni. Teoremi limite classici: le leggi dei grandi numeri e il teorema del limite centrale. Passeggiate aleatorie: distribuzioni, tempi di primo passaggio o ritorno, principio di riflessione e alcune conseguenze riguardanti i tempi di soggiorno. Catene di Markov: matrici di transizione, stati ricorrenti stati transienti, classificazione degli stati. Distribuzioni stazionarie, e loro legami con i tempi medi di ricorrenza. Conseguenze sulle passeggiate aleatorie. Processi stazionari, teorema ergodico e alcune conseguenze. |
Codice |
A005435 |
CFU |
6 |
Docente responsabile |
Andrea Capotorti |
Docenti |
|
Ore |
- 42 Ore - Andrea Capotorti
|
Attività |
Affine/integrativa |
Ambito |
Attività formative affini o integrative |
Settore |
MAT/06 |
Tipo insegnamento |
Obbligatorio (Required) |
Lingua insegnamento |
ITALIANO |
Contenuti |
Approfondimenti matematici dei metodi statistici avanzati di Statistical e Machine Learning, sia nel caso di supervised learning (classificazione e regressione) che di unsupervised learning (analisi dei cluster, riduzione della dimensionalità). |
Testi di riferimento |
Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning Data Mining,Inference,and Prediction (available on-line at https://hastie.su.domains/ElemStatLearn/download.html) James G., Witten D., Hastie T., Tibshirani R. (2021) An Introduction to Statistical Learning with Applications in R, 2nd edition, Springer-Verlag (freely available at https://www.statlearning.com) Slides delle lezioni disponibili nella pagina UniStudium del corso. |
Obiettivi formativi |
L'insegnamento costituisce un approfondimento dal punto di vista matematico dei principali metodi e tecniche di Statistical e Machine Learning, sia in ambito supervised (regressione e classificazione) che unsupervised (clustering e riduzione delle dimensionalità). Le principali conoscenze acquisite saranno: • concetti introduttivi e specifici modelli di statistical learning; • valutazione tramite tecniche di ricampionamento della capacità predittiva dei modelli di regressione e classificazione. Le principali abilità (ossia la capacità di applicare le conoscenze acquisite) saranno: • applicare in maniera autonoma gli opportuni metodi e algoritmi a problemi reali di regressione, classificazione e clustering; • analizzare dati tramite il software R per la stima di modelli supervised e unsupervised. |
Prerequisiti |
Conoscenze dei principali modelli statistici discreti e continui, distribuzioni di probabilità e loro proprietà, teorema di Bayes, regressione lineare |
Metodi didattici |
Lezioni frontali e attività laboratoriale con software R |
Altre informazioni |
La frequenza delle lezioni è fortemente consigliata. Per studenti con DSA e/o invalidità far riferimento al referente didipartimento e al sito dell’ateneo: http://www.unipg.it/disabilita-e-dsai. |
Modalità di verifica dell'apprendimento |
Valutazioni in itinere ed esame orale finale. Le attività di laboratorio sono finalizzate ad accertare la capacità dello studente di mettere in pratica le metodologie introdotte in classe. L'esame orale finale intende invece valutare il livello di conoscenza e comprensione raggiunto dallo studente per quanto riguarda gli aspetti computazionali e metodologici trattati durante il corso. |
Programma esteso |
Il corso prevede l'approfondimento metodologico di metodi statistici avanzati per il Data Science, sia nel caso di supervised learning (classificazione e regressione) che di unsupervised learning (analisi dei cluster, riduzione della dimensionalità). Tali metodi sono stati applicati con successo in molti ambiti, dalla finanza all'economia, dal business analytics alle scienze sociali e naturali. I metodi trattati saranno introdotti a partire da casi di studio reali e analizzati tramite il software R. In dettaglio, verranno trattati i seguenti argomenti: - Statistical and machine learning: introduzione. - Previsione vs interpretabilità. - Supervised vs unsupervised learning. - Classificazione vs regressione. - Valutazione dell'accuratezza di un modello statistico. - Supervised learning: introduzione. - Estensioni al modello di regressione lineare: selezione del modello e regolarizzazione. Regressione polinomiale. - Metodi di ricampionamento: cross-validation e bootstrap. - Classificazione: introduzione. - Modello logistico e multinomiale. - Analisi discriminante lineare e quadratica. - Gaussian naive Bayes. - Modelli misture finite Gaussiani. - Algoritmo k-nearest neighbour. - Metodi avanzati per la regressione e la classificazione. - Generalized Additive Models. - Artificial neural networks. - Decision trees. - Bagging. - Random forests. - Boosting. - Unsupervised learning: introduzione. - Analisi delle componenti principali. - Misure di similarità e di distanza. Matrice delle distanze. - Metodi gerarchici per la cluster analysis. - Metodi non gerarchici (metodo k-means). - Model-based clustering. |