Insegnamento DATA SCIENCE E APPLICAZIONI IN FISICA
Nome del corso di laurea | Fisica |
---|---|
Codice insegnamento | A002331 |
Sede | PERUGIA |
Curriculum | Astrofisica e astroparticelle |
Docente responsabile | Livio Fano' |
Docenti |
|
Ore |
|
CFU | 6 |
Regolamento | Coorte 2023 |
Erogato | Erogato nel 2023/24 |
Erogato altro regolamento | |
Attività | Affine/integrativa |
Ambito | Attività formative affini o integrative |
Settore | FIS/04 |
Anno | 1 |
Periodo | Secondo Semestre |
Tipo insegnamento | Opzionale (Optional) |
Tipo attività | Attività formativa monodisciplinare |
Lingua insegnamento | Italiano |
Contenuti | Elementi di statistical learning e introduzione agli strumenti più comuni Elementi base teorici e pratici sulle infrastrutture per il calcolo scientifico, in particolare per la gestione dei dati eterogenei (strutturati e non) e per la loro elaborazione |
Testi di riferimento | The Elements of Statistical Learning (Data Mining, Inference, and Prediction) Autori: Trevor Hastie Robert Tibshirani Jerome Friedman Dispense e materiale di approfondimento saranno forniti dal docente. Testi esterni saranno suggeriti durante il corso |
Obiettivi formativi | Apprendimento dai dati attraverso l’uso di strumenti statici dedicati alla complessità computazionale e al grande volume di dati. Applicazioni specifiche per la Fisica. Conoscenza di base dei sistemi di calcolo e gestione di dati in cloud. Nozioni di base su tecnologie quali container e orchestratori, finalizzato allo sviluppo di applicazioni native per il cloud. |
Prerequisiti | E’ consigliato il corso di “metodi statistici per l’analisi dei dati”. |
Metodi didattici | Il metodo di insegnamento si baserà su lezioni frontali per fornire le basi teoriche e sarà integrato con sessioni pratiche. Verranno anche effettuati degli approfondimenti su infrastrutture reali utilizzate per la gestione di dati in cloud e relativa analisi. |
Altre informazioni | La scienza dei dati combina metodi di studio avanzati di statistica con quelli dell’informatica, in particolare verso architetture infrastrutturali scalabili ad alta capacità di calcolo |
Modalità di verifica dell'apprendimento | Agli studenti del corso verrà richiesto: 1) presentare alla classe durante il corso un approfondimento assegnato dal docente su uno degli argomenti affrontati 2) risolvere un problema assegnato alla fine del corso su argomenti trattati in classe 3) esame orale finale Per informazioni sui servizi di supporto agli studenti con disabilità e/o DSA visita la pagina http://www.unipg.it/disabilita-e-dsa |
Programma esteso | Introduzione allo statistical learning: 1) accuratezza della predizione e modellazione, supervised learning 2) regressione e classificazione 3) model selection 4) decision trees - random forest 5) support vector machine 6) unsupervised learning e Principal Component Analysis 7) neural network e deep learning Applicazioni alla ricerca: 1) introduzione al corso 2) Cloud (IaaS)/PaaS/SaaS 3) Cloud Storage 4) Introduzione a Docker Containers 5) Cloud Automation 6) Processamento di dati locali e remoti in cloud: semplice esempio |