Insegnamento BIOINFORMATICS AND BIOSTATISTICS

Nome del corso di laurea Biotecnologie
Codice insegnamento GP004129
Curriculum Comune a tutti i curricula
Docente responsabile Roberto Maria Pellegrino
Docenti
  • Roberto Maria Pellegrino
Ore
  • 52 Ore - Roberto Maria Pellegrino
CFU 6
Regolamento Coorte 2021
Erogato Erogato nel 2023/24
Erogato altro regolamento
Informazioni sull'attività didattica
Attività Altro
Ambito Abilità informatiche e telematiche
Settore BIO/11
Anno 3
Periodo Primo Semestre
Tipo insegnamento Obbligatorio (Required)
Tipo attività Attività formativa monodisciplinare
Testi di riferimento Manuela Helmer Citterich et al, Fondamenti di Bioinformatica. Ed Zanichelli.
Michael C. Whitlock, Dolph Schluter "Analisi statistica dei dati biologici", ed Zanichelli
Articoli scientifici di riviste specializzate e presentazioni saranno forniti in formato PDF durante il corso.
Programma esteso 1) Elementi di informatica di base: Architettura dei calcolatori, Sistemi operativi, Algoritmi e programmi, Linguaggi di programmazione, Introduzione all'uso di “R”: operazioni con variabili, vettori e matrici. Server e web server, Basi di dati, il modello relazionali, processo di normalizzazione, algebra relazionale e interrogazione di un database relazionale, Operatori booleani.
2) Elementi di statistica descrittiva: Definizioni, popolazioni e campioni, tipi di campionamento, tipi di dati e variabili, distribuzione delle frequenze. Rappresentazione della distribuzione delle frequenze, diagrammi a barre, a torta, tabelle di frequenze e istogrammi per dati numerici. Mediana e differenza interquartile, rappresentazione boxplot, Media aritmetica e deviazione standard, confronto tra misure di posizione e dispersione. La distribuzione normale: Formula della distribuzione normale e sue proprietà, la distribuzione normale standardizzata, tavole statistiche. Teorema del limite centrale. Distribuzione campionaria di una stima, misurare l'incertezza di una stima, intervallo di confidenza, deviazione standard ed errore sperimentale. Formulazione, impiego e verifica delle ipotesi: ipotesi nulla, ipotesi alternativa. P-value Z-test, T-test, ANOVA, F-test, analisi ROC.
3) Analisi Statistica multivariata: proprietà della matrice dati: filtrazione, trasformazione e scalaggio dei dati. Univariate Analysis on multiple experiments: Fold Change Analysis, T-tests, Volcano plot, One-way Analysis of Variance (ANOVA), Correlation Heatmaps, Pattern Search, Correlation Networks (DSPC). Chemometrics Analysis: Principal Component Analysis (PCA), Partial Least Squares - Discriminant Analysis (PLS-DA). Feature Identification: Significance Analysis of Microarray (SAM), Empirical Bayesian Analysis of Microarray (EBAM). Hierarchical Clustering: Dendrogram, Heatmaps. Partitional Clustering: K-means. Classification & Feature Selection: Random Forest, Support Vector Machine (SVM). Functional Analysis, Enrichment Analysis, Pathway Analysis, Network Analysis. Biomarker Analysis: univariate and multivariate ROC curve analyses Time-series/Two-factor Analysis: ANOVA Simultaneous Component Analysis (ASCA); Multivariate Empirical Bayes Analysis of Variance (MEBA).
4) L’evoluzione biologica e molecolare, meccanismi molecolari alla base dei processi evolutivi, Geni Omologhi, ortologhi e paraloghi. Cenni alla teoria delle reti biologiche e loro applicazione alla biologia dei sistemi
5) Allineamento e confronto tra sequenze biologiche, Allineamento globale di coppie di sequenze, Programmazione dinamica, Matrici di sostituzione, Allineamento locale di coppie di sequenze, Ricerche per similarità in banca dati, BLAST: Parametri di input e output, Significatività degli allineamenti di sequenze, Interpretazione dei risultati. Allineamento di sequenze a genomi, Allineamento multiplo di sequenze.
6) Analisi proteomiche e metabolomiche mediante spettrometria di massa, interpretazione di spettri, uso di banche dati e servizi web dedicati.
Condividi su