Insegnamento STATISTICS AND BIOINFORMATICS

Nome del corso di laurea Agricultural and environmental biotechnology
Codice insegnamento A005361
Curriculum Comune a tutti i curricula
Docente responsabile Andrea Onofri
CFU 10
Regolamento Coorte 2025
Erogato Erogato nel 2025/26
Erogato altro regolamento
Anno 1
Periodo Primo Semestre
Tipo insegnamento Obbligatorio (Required)
Tipo attività Attività formativa integrata
Suddivisione

BIOINFORMATICS

Codice A005364
CFU 5
Docente responsabile Alessandro Magini
Docenti
  • Alessandro Magini
Ore
  • 45 Ore - Alessandro Magini
Attività Affine/integrativa
Ambito Attività formative affini o integrative
Settore BIO/11
Tipo insegnamento Obbligatorio (Required)
Lingua insegnamento INGLESE
Contenuti • Introduzione alla bioinformatica e ai principali tipi di dati biologici. • Principali banche dati e strumenti bioinformatici. • Predizione e analisi delle origini di replicazione nei genomi. • Strategie di ricerca di motivi e sequenze consenso. • Tecniche di allineamento di sequenze: globale, locale e multiplo. • Dati di sequenziamento NGS: formati (FASTQ/BAM/VCF), QC and trimming. • Assemblaggio genomico de novo e su genoma di riferimento. • DNA metabarcoding e metagenomica shotgun. • RNA-Seq e studio dell’espressione genica. • Bioinformatica delle proteine: domini, motivi e annotazione.
Testi di riferimento 1. Ankenbrand, M. J., & Hachmann, L. (2018). The Biostar Handbook: A Beginner’s Guide to Bioinformatics. 2nd edition. 2. Zvelebil, M., & Baum, J. O. (2007). Understanding Bioinformatics. Taylor & Francis Inc.
Obiettivi formativi Questo corso intende introdurre gli studenti ai concetti e agli strumenti fondamentali della bioinformatica, con particolare attenzione alle applicazioni rilevanti per le Biotecnologie. L’obiettivo centrale è trasformare problemi biologici reali—spesso complessi—in sfide algoritmiche, attraverso una combinazione di comprensione teorica ed esercitazioni pratiche. Al termine del corso gli studenti saranno in grado di: • Interpretare e gestire output NGS • Selezionare e utilizzare banche dati per reperire, organizzare e tracciare informazioni biologiche. • Eseguire e valutare allineamenti di sequenza (globale/locale/multiplo) ed estrarne evidenze biologicamente significative. • Identificare motivi/sequenze consenso e ragionare sui segnali delle origini di replicazione. • Assemblare piccoli genomi (de novo / guidati da riferimento) e valutare la qualità con metriche standard. • Mappare le read e delineare i passaggi essenziali per la scoperta e l’interpretazione di varianti. • Delineare pipeline minime per RNA-Seq, DNA metabarcoding e metagenomica shotgun.
Prerequisiti Per un apprendimento efficace dei contenuti del corso, si richiedono conoscenze adeguate di biochimica e biologia molecolare.
Metodi didattici Il corso adotta un approccio multimodale e centrato sullo studente, integrando lezioni e materiali video con brainstorming e discussioni guidate per favorire il coinvolgimento e la partecipazione attiva. Sarà utilizzata una metodologia pratica e laboratoriale, volta a promuovere l’apprendimento cooperativo e il learning by doing. Gli studenti applicheranno concetti e strumenti di bioinformatica a casi di studio realistici, in coerenza con l’impostazione della disciplina.
Altre informazioni • La frequenza non è obbligatoria ma fortemente consigliata. • I materiali di studio saranno forniti dal docente e resi disponibili agli studenti sulla piattaforma UNISTUDIUM all’indirizzo www.unistudium.unipg.it. • Ricevimento: previo appuntamento; si prega di concordarlo via email all’indirizzo alessandro.magini@unipg.it.
Modalità di verifica dell'apprendimento 1. Esame scritto nelle date di appello previste nel calendario: prova della durata di 60 minuti con quesiti a risposta multipla e domande aperte, finalizzata a valutare conoscenze, comprensione e capacità di risolvere problemi applicativi. 2. Valutazione in itinere (riservata esclusivamente agli studenti frequentanti): presentazioni orali dei risultati delle attività di laboratorio assegnate dal docente, durante le quali saranno saggiate le capacità espositive e le capacità di argomentare le risposte alle domande poste durante la discussione. La valutazione considera accuratezza dei contenuti, correttezza metodologica, chiarezza espositiva e capacità di discussione. Gli studenti frequentanti — ossia coloro che partecipano ad almeno il 75% delle lezioni e presentano tutti i lavori richiesti — potranno scegliere tra la valutazione in itinere e l’esame scritto. Gli studenti non frequentanti potranno sostenere esclusivamente l’esame scritto. Per informazioni sui servizi di supporto agli studenti con disabilità e/o DSA visita la pagina http://www.unipg.it/disabilita-e-dsa
Programma esteso 1. Introduzione • Che cos’è la bioinformatica; • DNA/RNA/proteine, ORF, codoni, strand e reverse-complement, notazione delle sequenze e formati base (FASTA/FASTQ). 2. Banche dati biologiche • INSDC (GenBank/ENA/DDBJ), RefSeq vs GenBank; UniProt/InterPro; PDB/AlphaFold. • Identificatori, citazione delle risorse; Entrez/EBI Search; accesso a dataset e metadati (SRA/BioProject). 3. Dalla biologia all’algoritmo: oriC e sequenze consenso per fattori di trascrizione • Segnali di origine di replicazione: DnaA-box e GC-skew; • Motif finding per fattori di trascrizione • Caso studio: regolazione del ritmo circadiano nelle piante (motivi “evening element”), limiti e validazione biologica. 4. Allineamento di sequenze (DNA e proteine) • Globale (Needleman–Wunsch), locale (Smith–Waterman), multiplo (MSA). • Matrici di sostituzione (PAM/BLOSUM), identità vs similarità, “twilight zone”; BLAST: logica ed E-value. • Lettura critica di score, gap e risultati. 5. Dati di sequenziamento NGS: formati e qualità • Formati: FASTQ/BAM/VCF; paired-end, coverage, Phred. • FastQC, trimming, rimozione contaminanti, gestione metadati. 6. Assemblaggio genomico: de novo e con riferimento • OLC vs grafo di de Bruijn; k-mer, cammini euleriani; contig vs scaffold; scelta di k. • Valutazione dell’assemblaggio: N50/L50, misassemblies, completezza (BUSCO), copertura; buone pratiche. 7. DNA metabarcoding e metagenomica shotgun • Marker-based • Shotgun: classificazione tassonomica (es. Kraken/Bracken), host/contaminant removal, lettura dei profili e cautele. 8. RNA-Seq (pipeline essenziale) • Quantificazione, normalizzazione, principi di analisi differenziale. • Lettura di tabelle/figure di risultato e collegamenti all’annotazione funzionale. 9. Bioinformatica delle proteine: domini e struttura 3D • Ricerca e annotazione di domini/motivi (Pfam/InterPro, PROSITE) e funzioni (GO/KEGG). • Strutture 3D: consultazione PDB e modelli AlphaFold; qualità del modello e limiti. • Collegare struttura/domìni a funzione, varianti e interazioni.

EXPERIMENTAL METHODS IN AGRICULTURE

Codice A005363
CFU 5
Docente responsabile Andrea Onofri
Docenti
  • Andrea Onofri
Ore
  • 45 Ore - Andrea Onofri
Attività Caratterizzante
Ambito Discipline biotecnologiche agrarie
Settore AGR/02
Tipo insegnamento Obbligatorio (Required)
Lingua insegnamento INGLESE
Contenuti Il corso fornirà basi teoriche e strumenti pratici per organizzare e condurre esperimenti scientifici nel settore agrario, analizzare correttamente i dati, procedendo alla corretta interpretazione e presentazione dei risultati.
Testi di riferimento E-book del docente linkato su UNISTUDIUM
Obiettivi formativi Al termine del corso gli studenti dovranno avere competenze sui seguenti aspetti: 1. Aspetti basilari per l'organizzazione degli esperimenti 2. Disegni sperimentali più importanti e quando si usano 3. Cosa è l'ANOVA e quando si usa 4. Analisi grafica dei residui. Metodo di Box e Cox per le trasformazioni stabilizzanti 5. Cosa è la regressione lineare e quando si usa 6. Cosa sono i test di confronto multiplo e quando si usano 7. Cosa è la regressione non-lineare e quando si usa Abilità (saper fare) 1. Impostare un esperimento scientifico 3. Analizzare i dati provenienti da un esperimento scientifico 4. Valutare se le assunzioni di base per i metodi parametrici sono rispettate 5. Mettere in atto le più importanti strategie correttive 6. Costruire semplici equazioni per la descrizione di fenomeni scientifici 7. Utilizzare software statistico avanzato Comportamenti (saper essere) 1. Mostrare spiccato senso critico nella produzione, interpretazione e selezione di dati scientifici 2. Mostrare un sufficiente grado di precisione scientifica nell'impostare esperimenti ed eseguire simulazioni
Prerequisiti Si richiede soltanto una minima conoscenza del computer e della sua organizzazione (concetto di file, folder, salvataggio file e minima conoscenza del sistema operativo)
Metodi didattici Verranno utilizzati i seguenti strumenti didattici: Video proiezioni delle lezioni, materiale didattico distribuito dal docente, dispense consegnate dal docente Oltre alla frequenza delle lezioni, lo studente si avvarrà di: lettura e studio personale su testi di riferimento lettura e studio personale su materiale consegnato dal docente lettura e studio personale su materiale on-line messo a disposizione dal docente attività personale pratica di abilità tecniche e di laboratorio
Altre informazioni Le informazioni principali di questo corso sono contenute nella piattaforma UNISTUDIUM
Modalità di verifica dell'apprendimento Esame scritto finale con prova pratica di analisi dei dati
Programma esteso Il corso si occuperà di alcuni dei metodi fondamentali per il reperimento di informazioni scientifiche, cioè l'organizzazione di esperimenti e l'impiego di modelli matematici di simulazione. Dovrà fornire le basi teoriche e gli strumenti pratici per pianificare, organizzare e condurre esperimenti scientifici nel settore agrario, nonché di procedere alla corretta elaborazione ed interpretazione dei dati e alla presentazione dei relativi risultati tramite tesi e/o report e/o pubblicazione. LEZIONI FRONTALI (circa 1.5 ore ciascuna, più 45 min. di discussione collettiva, riepilogo e presentazione di casi-studio) 1 - Procedimento scientifico e misurazione dei fenomeni naturali; variabilità dei dati sperimentali. Popolazione, campione e campionamento. Metodi e criteri di stima. I perché dell'inferenza statistica. Unità sperimentali. Repliche e sottocampionamento. Indipendenza delle unità sperimentali. 2 - Pianificazione degli esperimenti e ANOVA. Generalità sul disegno sperimentale. Disegni a randomizzazione completa. Disegni a blocco randomizzato e a quadrato latino. Disegni fattoriali. Esempi. 3 - Disegni sperimentali complessi. split-plot, split-block e gerarchico. Esperimenti ripetuti nello spazio e nel tempo. Esempi. 4 - Analisi della varianza nei disegni a randomizzazione completa e blocco randomizzato. Inferenze statistiche nell'ANOVA. Esempi 5 - Verifica delle assunzioni di base e analisi preliminare dei dati. Ispezione grafica dei residui. Trasformazioni stabilizzanti. Esempi. 6 - Test di confronto multiplo: pregi e difetti delle metodiche più importanti. Applicazioni relative ad alcuni casi-studio tipici. 7 - Analisi della varianza nelle prove a split-plot, split-block e negli esperimenti ripetuti nello spazio e nel tempo. Esempi 8 - Analisi di regressione e di correlazione. Quando è necessaria. Esempi. La regressione polinomiale. Inferenze statistiche ed ANOVA nell'analisi di regressione. Esempi. 9 - La regressione non-lineare. Il caso del dosaggio biologico. Esempi. 10 - La regressione non lineare. Curve di dissipazione degli erbicidi. Curve di crescita delle colture. Altre funzioni di interesse biologico. Verifica dell'adattamento. Esempi. Argomenti delle esercitazioni Le esercitazioni saranno opportunamente calibrate per consentire allo studente, non solo la comprensione dei concetti esposti a lezione, ma soprattutto di eseguire praticamente ed autonomamente le analisi statistiche presentate. Allo studente verranno presentati casi-studio, tratti dalla realtà operativa della ricerca scientifica applicata al mondo agricolo. Lo studente verrà quindi guidato ed indirizzato alla risoluzione di questi casi-studio, utilizzando il software più adatto.
Condividi su