Università degli Studi di Perugia

Insegnamento COMPUTER VISION AND ROBOT PERCEPTION

Nome del corso di laurea	Ingegneria informatica e robotica
Codice insegnamento	A002337
Curriculum	Robotics
Docente responsabile	Gabriele Costante
Docenti	Gabriele Costante
Ore	48 Ore - Gabriele Costante
CFU	6
Regolamento	Coorte 2021
Erogato	Erogato nel 2021/22
Erogato altro regolamento
Attività	Caratterizzante
Ambito	Ingegneria informatica
Settore	ING-INF/04
Anno	1
Periodo	Secondo Semestre
Tipo insegnamento	Obbligatorio (Required)
Tipo attività	Attività formativa monodisciplinare
Lingua insegnamento	ITALIANO
Contenuti	Operazioni di filtraggio, estrazione di punti di interesse e di descrittori di immagine. Matching e Trasformazioni di immagine. Bag of visual words per ricerca di immagini. Geometria epipolare e ricostruzione stereo. Visual odometry e visual SLAM. Deep Learning e reti neurali convoluzionali. Esercitazioni guidate su Pytorch per la progettazione di reti neurali convoluzionali.
Testi di riferimento	Richard Szeliski. “Computer Vision: Algorithms and Applications”, Springer - Ian Goodfellow, Yoshua Bengio, Aaron Courville. “Deep Learning”, MIT Press - Christopher Bishop. “Pattern Recognition and Machine Learning”, Springer; Richard Hartley, Andrew Zisserman. “Multiple view geometry”, Cambridge University Press – Ramesh Jain, Rangachar Kasturi, Brian G. Schunk. “Machine Vision”, McGraw-Hill. Dispense a cura del docente disponibili su UNISTUDIUM - PIATTAFORMA DI E-LEARNING DELL'UNIVERSITÀ DEGLI STUDI DI PERUGIA (https://www.unistudium.unipg.it/unistudium/ )
Obiettivi formativi	- Conoscenza di base di: problematiche connesse all’estrazione di informazioni di vario livello semantico da immagini; tecniche di estrazione di features e di descrittori di immagine; tecniche per la stima della trasformazione tra coppie di immagini; algoritmi per la ricerca e la classificazione di immagini; strategie per la ricostruzione 3D a partire da immagini in configurazione stereo; principi alla base della Visual odometry e del Visual SLAM; caratteristiche, vantaggi e soluzioni basate su reti neurali convoluzionali.- Abilità: nella scelta di tecnologie e blocchi funzionali di sistemi di analisi di immagine per varie applicazioni; nell’utilizzo di reti neurali convoluzionali e nella progettazione di architetture di deep learning per l’analisi di immagine (in particolare con il framework Pytorch)- L'insegnamento, inoltre, contribuisce al conseguimento dei seguenti risultati di apprendimento: elaborare e/o applicare idee originali in applicazioni diverse; risolvere problemi in ambienti nuovi e/o interdisciplinari; motivare le scelte progettuali compiute evidenziando possibili criticità; integrare le conoscenze e gestire la complessità.
Prerequisiti	Al fine di comprendere i contenuti presentati e conseguire gli obiettivi di apprendimento è utile possedere una conoscenza di base di Algebra Lineare e una buona conoscenza di Machine Learning e di programmazione. Insegnamento suggerito: “Machine Learning and Data Mining”.
Metodi didattici	L’insegnamento è organizzato come segue:- lezioni frontali in aula;- lezioni frontali a carattere seminariale- esercitazioni guidate presso il Laboratorio di Informatica sulla progettazione di reti neurali convoluzionali con framework Pytorch. In ogni esercitazione gli studenti vengono distribuiti su 16 postazioni di lavoro. Strumenti di supporto alla didattica: lavagna e PC+proiettore, PC.
Altre informazioni	II Semestre (maggiori dettagli vengono riportati al link http: //www.ing.unipg.it/it/didattica/studiare-nei-nostri-corsi/orario-delle-lezioni ).
Modalità di verifica dell'apprendimento	Le conoscenze relative all’insegnamento vengono accertate attraverso una Prova orale e una Prova pratica (tesina). La prova orale prevede la discussione del progetto presentato e due domande su argomenti scelti dal docente, e dura circa 45 minuti. La prova è volta ad accertare la compresione, da parte dello studente, degli strumenti teorici fondamentali forniti dall'insegnamento, nonchè le relazioni tra tali strumenti e le tematiche generali dell'ingegneria informatica. Il progetto presentato viene utilizzato per verificare le capacità di progettazione di soluzioni basate su reti neurali convoluzionali per applilcazioni di computer vision attraverso il framework Pytorch. La tesina deve essere inviata al docente il giorno prima della prova di esame. Le prenotazioni alle prove di esame avvengono tramite il portale SOL: https://www.segreterie.unipg.it/ Per informazioni sui servizi di supporto agli studenti con disabilità e/o DSA visita la pagina http://www.unipg.it/disabilita-e-dsa
Programma esteso	Introduzione alla Computer Vision. Filtraggio di immagine. Image Features. Descrittori di Immagine e matching tra descrittori. RANSAC e trasformata di Hough. Bag of visual words. Geometria Stereo. Visual odometry. Machine learning e Computer Vision: Introduzione, Nearest Neighbor, Classificatore lineare, SVM, Reti neurali. Deep Learning. Reti neurali convoluzionali (CNN). Architetture per le CNN . Reti neurali ricorrenti: RNN –LSTM –GRU. CNN applicazioni di computer vision (Detection, segmentation, recognition). Modelli generativi (Generative adversarial network (GAN)) e applicazioni non supervisionate delle CNN. Esercitazioni di laboratorio: Framework per il deep learning, Design di architetture per le CNN, Esempi di applicazioni delle CNN.