Polo GGB offre servizi di sequenziamento basati su tecnologia NGS e servizi di bioinformatica.
L’infrastruttura software per il servizio di analisi bioinformatica è una combinazione di software personalizzati e open-source per assicurare un’analisi dei dati completa e personalizzata. I servizi bio-informatici del Polo GGB coprono un’ampia gamma di applicazioni NGS.
Il Laboratorio di Bioinformatica del Polo GGB ha sede a Siena presso il bio-incubatore della Fondazione Toscana Life Science.
Questa struttura consente di accedere alle tecnologie per eseguire analisi di bioinformatica e di biostatistica per la ricerca biomedica. Particolare interesse è rivolto allo sviluppo di algoritmi e strumenti per la misura di parametri inerenti l’analisi genomica. Molti degli algoritmi applicati sono implementati sulla base di software liberamente disponibili ed accessibili via web (es. Genome Analysis Toolkit – GATK).
Specifiche competenze all’interno dello staff del Polo GGB permettono di fornire, oltre a servizi di tipo standard per la bioinformatica, anche elaborazioni personalizzate mediante progettazione di moduli software specifici dedicati alle analisi di genomica custom.
Sede:
c/o Toscana Life Sciences
Strada del Petriccio e Belriguardo 35, 53100 SIENA
Referente:
Chiara Leo ~ c.leo@pologgb.com
Telefono:
+39 0577 381310
Il progetto Genoma Umano ha portato alla luce l’importanza di saper analizzare e comprendere l’enorme mole di dati di sequenziamento. Ed è da questa capacità che dipende la ricerca in campo medico.
Sia i medici che i ricercatori saranno in grado di aumentare considerevolmente la quantità di dati genomici raccolti su ampie popolazioni di studio, di individuare un migliore processo diagnostico e strategie terapeutiche sempre più efficaci e personalizzate. Appare quindi concreta la possibilità che i trattamenti e le terapie possano essere adattati allo specifico patrimonio genetico di ogni paziente. In questo scenario risulta evidente quanto la bioinformatica e i nuovi approcci informatici siano fondamentali per l’analisi di grandi quantitativi di dati e per raggiungere una migliore comprensione delle basi genetiche delle malattie e della risposta ai farmaci.
Il PoloGGB fornisce un servizio di analisi dei dati genomici grazie all’esperienza accumulata nel risolvere una vasta gamma di problematiche di tipo bioinformatico. La nostra piattaforma di analisi comprende una combinazione di software personalizzati e open-source in grado di coprire diverse applicazioni ed esigenze di studio.
La comprensione approfondita del trascrittoma è fondamentale per un’attenta interpretazione degli elementi funzionali del genoma e per la conoscenza di meccanismi che sottendono determinate patologie.
Il sequenziamento del trascrittoma è, in molti casi, il metodo di elezione per l’analisi di geni differenzialmente espressi, per l’investigazione di pattern e varianti di splicing, di isoforme di geni, di polimorfismi a singolo nucleotide, di modificazioni post-trascrizionali e, infine, è la metodica prevalente per il monitoraggio di una popolazione di trascritti che possono essere espressi in una data condizione e in uno specifico momento. Uno studio di tale importanza richiede una esperta capacità di elaborazione di grandi quantitativi di dati trascrittomici utilizzando programmi bioinformatici dedicati e conoscenze scientifiche.
Il PoloGGB fornisce un servizio di analisi dei dati trascrittomici grazie all’esperienza accumulata nel risolvere una vasta gamma di problematiche di tipo bioinformatico. La nostra piattaforma di analisi comprende una combinazione di software personalizzati e open-source in grado di coprire diverse applicazioni ed esigenze di studio.
Le sequenze sono assemblate in trascritti utilizzando un assemblatore di sequenze corte e i trascritti sono assemblati a loro volta in sequenze contigue più lunghe unendo le zone di sovrapposizione.
L’assemblaggio de novo di un trascrittoma è il metodo comunemente scelto per lo studio di organismi che non fanno parte dei modelli classici di studio, dato che è un approccio molto meno costoso della costruzione di un “primo” genoma di riferimento/de novo.
Dopo aver effettuato l’allineamento al genoma di riferimento o aver assemblato un trascrittoma de novo, è possibile identificare e quantificare i trascritti di mRNA putativi e individuare le regioni codificanti, così come si può effettuare un’analisi di espressione differenziale.
Infine, l’annotazione del trascrittoma fornisce informazioni sulla funzione biologica dei trascritti e delle proteine per le quali codificano, utilizzando strumenti e database ben noti di funzioni molecolari, ontologia genica e vie metaboliche.
Qundi, le sequenze possono poi essere annotate e classificate in categorie note di small RNA, rendendo possibile anche l’analisi di espressione differenziale.
In particolare, i micro RNA (miRNAs) sono una classe di small RNA non codificanti lunghi da 18 a 22 paia di basi. Recenti scoperte sulla funzione e il ruolo dei miRNA hanno stimolato lo studio di questo nuovo livello di regolazione genica, implicato nello sviluppo di alcuni processi patologici. Nuovi miRNA possono essere scoperti tramite allineamento di dati di RNA sequencing ad alta profondità di lettura sul genoma di riferimento e successiva predizione della struttura secondaria del precursore.
Si pensa che i lncRNA includano approssimativamente 30,000 diversi trascritti nell’umano, dunque i lncRNA sono la porzione più abbondante del trascrittoma non codificante. Nonostante diversi lncRNAs siano stati annotati funzionalmente, la maggior parte di essi resta ancora da caratterizzare.
La scoperta dei lncRNA è ancora in una fase iniziale e solo una minima frazione dei lncRNA è stata studiata. Se da una parte siamo in grado di iniziare a classificare diverse tipologie di funzioni dei lncRNA, non possiamo ancora predire la funzione di nuovi lncRNA. Il PoloGGB propone il profilo dell’espressione come un metodo per individuare la funzione dei lncRNA. Individuare i lncRNA differenzialmente espressi in specifiche condizioni sperimentali potrebbe gettare una luce sulle loro possibili funzioni.
La pipeline di nostra scelta prima allinea e assembla i dati di RNA-seq per costruire un trascrittoma completo per tutti i campioni. Poi, usando una serie di filtri basati sull’annotazione genica, la lunghezza delle sequenze, I livelli di espressione, il potenziale di codifica e altre caratteristiche, viene definite un elenco di candidati lncRNA contenente informazioni che includono la dimensione del trascritto, la collocazione genomica e opzionalmente l’espressione genica differenziale.
I recenti approcci per lo studio dei dati di RNA-Seq comprendono la quantificazione dell’espressione all’interno dei margini di geni precedentemente pubblicati e di algoritmi disegnati per la ricostruzione di interi trascritti.
L’analisi di espressione differenziale consiste nell’esecuzione di test statistici sui dati normalizzati di espressione al fine di scoprire cambiamenti quantitativi nei livelli di espressione tra i gruppi sperimentali.
Un ruolo sempre più da protagonista sta rivestendo l’epigenomica che apre lo scenario a nuove opportunità legate allo sviluppo di terapie innovative, all’identificazione di potenziali target farmacologici e a una migliore comprensione delle basi patologiche delle malattie.
I progressi nei saggi di profilazione epigenomica e le quantità crescenti di dati hanno aperto nuove prospettive utili per comprendere e studiare gli epigenomi normali e le loro modificazioni. Negli ultimi tempi sono stati sviluppati un numero sempre maggiore di strumenti computazionali e nuove metodologie per analizzare i complessi insiemi dei dati epigenomici.
Il PoloGGB fornisce un servizio di analisi dei dati epigenomici grazie all’esperienza accumulata nel risolvere una vasta gamma di problematiche di tipo bioinformatico. La nostra piattaforma di analisi comprende una combinazione di software personalizzati e open-source in grado di coprire diverse applicazioni ed esigenze di studio.
Questa analisi è utile per esaminare il ruolo delle interazioni proteina-DNA implicate nella regolazione dell’espressione genica e di altri processi cellulari essenziali allo scopo di comprendere a fondo i processi biologici e determinate malattie.
Le sequenze sono prima allineate al genoma di riferimento per poi predire le regioni del genoma dove la proteina si lega (peak calling) sulla base del numero di sequenze che mappano nella regione specificata.
Le differenze nel legame possono essere analizzate per determinare quali regioni del DNA sono legate in diversi campioni o in diverse condizioni sperimentali, mentre i picchi possono essere annotati se sono in corrispondenza di siti di inizio della trascrizione noti (TSS), di promotori o di regioni intergeniche.
L’analisi bioinformatica per lo studio dei dati di metilazione del DNA comprendono, in genere, i seguenti passaggi:
Il metodo di conversione con bisolfito delle citosine non metilate in uracili fornisce una mappatura dettagliata della posizione delle metil-citosine. Il processo include l’allineamento delle sequenze e la quantificazione assoluta della metilazione del DNA alla risoluzione di singole basi. Per analizzare la distribuzione globale della metilazione del DNA, le regioni selezionate possono essere visualizzate su un browser genomico comunemente utilizzato come IGV (Integrative Genomic Viewer). Lo studio delle zone metilate e la determinazione di regioni differentemente metilate (DMR) in gruppi di campioni possono essere eseguiti manualmente o utilizzando differenti processi automatizzati.
SEQUENZIAMENTO COMPLETO DEL METILOMASEQUENZIAMENTO DI SPECIFICHE REGIONI DEL METILOMAGli studi metagenomici sono alla base dei significativi progressi nel campo dell’ecologia microbica. L’analisi metagenomica è una soluzione economica per l’identificazione e la quantificazione del materiale genetico nelle comunità microbiche non in coltura. Essa è in grado di analizzare in modo più approfondito i dati filogenetici e tassonomici di microbiomi complessi e nicchie ambientali che sarebbero altrimenti difficili o impossibili da esaminare.
Man mano che vengono generati più set di dati metagenomici, la disponibilità di procedure standardizzate, archiviazione e analisi dei dati diventa sempre più considerevole. Con il crescere del numero dei dati, l’analisi del metagenoma richiede una suite di tecnologie genomiche e strumenti bioinformatici in grado di accedere in modo diretto al contenuto genetico di intere comunità di organismi.
Il PoloGGB fornisce un servizio di analisi dei dati metagenomici grazie all’esperienza accumulata nel risolvere una vasta gamma di problematiche di tipo bioinformatico. La nostra piattaforma di analisi comprende una combinazione di software personalizzati e open-source in grado di coprire svariate applicazioni ed esigenze di studio.
Il sequenziamento NGS del rDNA 16S/18S/ITS è un metodo di sequenziamento basato su ampliconi, molto utilizzato, che permette la rilevazione della maggior parte dei batteri e/o dei funghi presenti in campioni che potrebbero non essere individuati utilizzando altri metodi e la determinazione della loro diversità biologica.
L’annotazione metagenomica consiste nell’organizzare le sequenze in unità tassonomiche note basandosi sull’omologia con le sequenze precedentemente depositate in database di riferimento per identificare l’appartenenza tassonomica delle sequenze.
L’analisi metagenomica sui dati di interi genomi “shotgun” include tre principali passaggi: assemblaggio, annotazione e analisi statistica. Se l’obiettivo è quello di analizzare il genoma di un tipo di microrganismo invece che di una comunità, le sequenze prodotte andranno assemblate in sequenze genomiche contigue più lunghe. Gli assemblatori per i campioni di metagenomica rientrano in due categorie: assemblaggio basato su un genoma di riferimento e l’assemblaggio de novo. L’annotazione metagenomica consiste nell’organizzare le sequenze in unità tassonomiche note basandosi sull’omologia con le sequenze precedentemente depositate in database di riferimento per identificare l’appartenenza tassonomica delle sequenze.
SEQUENZIAMENTO SHOTGUN
Clicca sul contatto per iniziare una chat con noi.