Insegnamento COMPUTER VISION AND ROBOT PERCEPTION
- Corso
- Ingegneria informatica e robotica
- Codice insegnamento
- A002337
- Curriculum
- Robotics
- Docente
- Gabriele Costante
- Docenti
-
- Gabriele Costante
- Ore
- 48 ore - Gabriele Costante
- CFU
- 6
- Regolamento
- Coorte 2021
- Erogato
- 2021/22
- Attività
- Caratterizzante
- Ambito
- Ingegneria informatica
- Settore
- ING-INF/04
- Tipo insegnamento
- Obbligatorio (Required)
- Tipo attività
- Attività formativa monodisciplinare
- Lingua insegnamento
- ITALIANO
- Contenuti
- Operazioni di filtraggio, estrazione di punti di interesse e di descrittori di immagine. Matching e Trasformazioni di immagine. Bag of visual words per ricerca di immagini. Geometria epipolare e ricostruzione stereo. Visual odometry e visual SLAM. Deep Learning e reti neurali convoluzionali. Esercitazioni guidate su Pytorch per la progettazione di reti neurali convoluzionali.
- Testi di riferimento
- Richard Szeliski. “Computer Vision: Algorithms and Applications”, Springer -
Ian Goodfellow, Yoshua Bengio, Aaron Courville. “Deep Learning”, MIT Press - Christopher Bishop. “Pattern Recognition and Machine Learning”, Springer; Richard Hartley, Andrew Zisserman. “Multiple view geometry”, Cambridge University Press – Ramesh Jain, Rangachar Kasturi, Brian G. Schunk. “Machine Vision”, McGraw-Hill.
Dispense a cura del docente disponibili su UNISTUDIUM - PIATTAFORMA DI E-LEARNING DELL'UNIVERSITÀ DEGLI STUDI DI PERUGIA (https://www.unistudium.unipg.it/unistudium/ ) - Obiettivi formativi
- - Conoscenza di base di: problematiche connesse all’estrazione di informazioni di vario livello semantico da immagini; tecniche di estrazione di features e di descrittori di immagine; tecniche per la stima della trasformazione tra coppie di immagini; algoritmi per la ricerca e la classificazione di immagini; strategie per la ricostruzione 3D a partire da immagini in configurazione stereo; principi alla base della Visual odometry e del Visual SLAM; caratteristiche, vantaggi e soluzioni basate su reti neurali convoluzionali.- Abilità: nella scelta di tecnologie e blocchi funzionali di sistemi di analisi di immagine per varie applicazioni; nell’utilizzo di reti neurali convoluzionali e nella progettazione di architetture di deep learning per l’analisi di immagine (in particolare con il framework Pytorch)- L'insegnamento, inoltre, contribuisce al conseguimento dei seguenti risultati di apprendimento: elaborare e/o applicare idee originali in applicazioni diverse; risolvere problemi in ambienti nuovi e/o interdisciplinari; motivare le scelte progettuali compiute evidenziando possibili criticità; integrare le conoscenze e gestire la complessità.
- Prerequisiti
- Al fine di comprendere i contenuti presentati e conseguire gli obiettivi di apprendimento è utile possedere una conoscenza di base di Algebra Lineare e una buona conoscenza di Machine Learning e di programmazione. Insegnamento suggerito: “Machine Learning and Data Mining”.
- Metodi didattici
- L’insegnamento è organizzato come segue:- lezioni frontali in aula;- lezioni frontali a carattere seminariale- esercitazioni guidate presso il Laboratorio di Informatica sulla progettazione di reti neurali convoluzionali con framework Pytorch. In ogni esercitazione gli studenti vengono distribuiti su 16 postazioni di lavoro. Strumenti di supporto alla didattica: lavagna e PC+proiettore, PC.
- Altre informazioni
- II Semestre (maggiori dettagli vengono riportati al link http: //www.ing.unipg.it/it/didattica/studiare-nei-nostri-corsi/orario-delle-lezioni ).
- Modalità di verifica dell'apprendimento
- Le conoscenze relative all’insegnamento vengono accertate attraverso una Prova orale e una Prova pratica (tesina).
La prova orale prevede la discussione del progetto presentato e due domande su argomenti scelti dal docente, e dura circa 45 minuti.
La prova è volta ad accertare la compresione, da parte dello studente, degli strumenti teorici fondamentali forniti dall'insegnamento, nonchè le relazioni tra tali strumenti e le tematiche generali dell'ingegneria informatica.
Il progetto presentato viene utilizzato per verificare le capacità di progettazione di soluzioni basate su reti neurali convoluzionali per applilcazioni di computer vision attraverso il framework Pytorch.
La tesina deve essere inviata al docente il giorno prima della prova di esame.
Le prenotazioni alle prove di esame avvengono tramite il portale SOL: https://www.segreterie.unipg.it/
Per informazioni sui servizi di supporto agli studenti con disabilità e/o DSA visita la pagina http://www.unipg.it/disabilita-e-dsa - Programma esteso
- Introduzione alla Computer Vision. Filtraggio di immagine. Image Features. Descrittori di Immagine e matching tra descrittori. RANSAC e trasformata di Hough. Bag of visual words. Geometria Stereo. Visual odometry. Machine learning e Computer Vision: Introduzione, Nearest Neighbor, Classificatore lineare, SVM, Reti neurali. Deep Learning. Reti neurali convoluzionali (CNN). Architetture per le CNN . Reti neurali ricorrenti: RNN –LSTM –GRU. CNN applicazioni di computer vision (Detection, segmentation, recognition). Modelli generativi (Generative adversarial network (GAN)) e applicazioni non supervisionate delle CNN. Esercitazioni di laboratorio: Framework per il deep learning, Design di architetture per le CNN, Esempi di applicazioni delle CNN.