Insegnamento DATA SCIENCE E APPLICAZIONI IN FISICA

Nome del corso di laurea Fisica
Codice insegnamento A002331
Sede PERUGIA
Curriculum Astrofisica e astroparticelle
Docente responsabile Livio Fano'
Docenti
  • Livio Fano'
  • Daniele Spiga
Ore
  • 21 Ore - Livio Fano'
  • 21 Ore - Daniele Spiga
CFU 6
Regolamento Coorte 2023
Erogato Erogato nel 2023/24
Erogato altro regolamento
Attività Affine/integrativa
Ambito Attività formative affini o integrative
Settore FIS/04
Anno 1
Periodo Secondo Semestre
Tipo insegnamento Opzionale (Optional)
Tipo attività Attività formativa monodisciplinare
Lingua insegnamento Italiano
Contenuti Elementi di statistical learning e introduzione agli strumenti più comuni

Elementi base teorici e pratici sulle infrastrutture per il calcolo scientifico, in particolare per la gestione dei dati eterogenei (strutturati e non) e per la loro elaborazione
Testi di riferimento The Elements of Statistical Learning
(Data Mining, Inference, and Prediction)
Autori: Trevor Hastie Robert Tibshirani Jerome Friedman

Dispense e materiale di approfondimento saranno forniti dal docente. Testi esterni saranno suggeriti durante il corso
Obiettivi formativi Apprendimento dai dati attraverso l’uso di strumenti statici dedicati alla complessità computazionale e al grande volume di dati. Applicazioni specifiche per la Fisica.

Conoscenza di base dei sistemi di calcolo e gestione di dati in cloud. Nozioni di base su tecnologie quali container e orchestratori, finalizzato allo sviluppo di applicazioni native per il cloud.
Prerequisiti E’ consigliato il corso di “metodi statistici per l’analisi dei dati”.
Metodi didattici Il metodo di insegnamento si baserà su lezioni frontali per fornire le basi teoriche e sarà integrato con sessioni pratiche.

Verranno anche effettuati degli approfondimenti su infrastrutture reali utilizzate per la gestione di dati in cloud e relativa analisi.
Altre informazioni La scienza dei dati combina metodi di studio avanzati di statistica con quelli dell’informatica, in particolare verso architetture infrastrutturali scalabili ad alta capacità di calcolo
Modalità di verifica dell'apprendimento Agli studenti del corso verrà richiesto:

1) presentare alla classe durante il corso un approfondimento assegnato dal docente su uno degli argomenti affrontati
2) risolvere un problema assegnato alla fine del corso su argomenti trattati in classe
3) esame orale finale

Per informazioni sui servizi di supporto agli studenti con disabilità e/o DSA visita la pagina http://www.unipg.it/disabilita-e-dsa
Programma esteso Introduzione allo statistical learning:

1) accuratezza della predizione e modellazione, supervised learning
2) regressione e classificazione
3) model selection
4) decision trees - random forest
5) support vector machine
6) unsupervised learning e Principal Component Analysis
7) neural network e deep learning


Applicazioni alla ricerca:

1) introduzione al corso
2) Cloud (IaaS)/PaaS/SaaS
3) Cloud Storage
4) Introduzione a Docker Containers
5) Cloud Automation
6) Processamento di dati locali e remoti in cloud: semplice esempio
Condividi su