Biologic Network Inference: CRS4 and Linkalab among best performers at DREAM5 conference at Columbia University

Fri, 10/12/2012 - 21:24 -- admin

Il team composto da Andrea Pinna, Nicola Soranzo, Vincenzo De Leo e Alberto de la Fuente si è classificato lo scorso 16 novembre fra i primi posti nella competizione sulla "Network Inference" durante il DREAM5, evento ospitato nella prestigiosa sede della Columbia University di New York durante la Conferenza congiunta su biologia sistemica, genomica regolatoria e sfide sull'inferenza delle reti biologiche. Il team, chiamato "ALF" e guidato da Alberto de la Fuente del CRS4, ha ottenuto questo premio anche grazie alla sua collaborazione con il Laboratorio per lo studio dei sistemi complessi Linkalab e si è meritato, inoltre, una menzione speciale.

La "Joint Conference" alla Columbia ha fornito l'occasione a ricercatori computazionali e sperimentali attivi nei campi della genomica regolatoria e della biologia sistemica di confrontare i rispettivi approcci di studio, con l'auspicio di ottenere un giorno una comprensione condivisa dei meccanismi di regolazione dei geni. "DREAM" sta per "Dialogue for Reverse Engineering Assessments and Methods". Lo spirito di questo appuntamento, giunto alla quinta edizione, è di assoluta novità: "L'inferenza di reti biologiche e la costruzione di modelli quantitativi dei sistemi biologici", spiega Vincenzo De Leo, il ricercatore che ha rappresentato Linkalab nel team ALF, "sono ancora ai primi passi: nessuno può ancora dire quanto siano adeguati i loro strumenti. Di conseguenza," prosegue De Leo, "DREAM ambisce a una valutazione non distorta dei metodi proposti".

"Si forniscono ai partecipanti alla competizione i dati di un esperimento del quale devono predire i risultati, noti solo agli organizzatori", continua De Leo. "Controllando fino a che punto le previsioni ottenute dai partecipanti coincidono con gli effettivi risultati possiamo capire meglio quali siano gli algoritmi più utili a ottenere modelli affidabili da dataset di geni".

Il responsabile scientifico del team, Alberto de la Fuente, partecipa a questa competizione dalla sua seconda edizione e si è già classificato tra i primi posti nel 2007 e nel 2009. De la Fuente si occupa proprio di sviluppare nuove metodologie per l'analisi integrata dei dati di espressione genica e di genotipizzazione per l'interpretazione delle reti di geni. Lavora inoltre per identificare reti di geni disfunzionali, partendo dai dati di espressione genica associati a certe malattie. Vincenzo De Leo, invece, lavora a un progetto, in collaborazione con il CRS4 e finanziato dalla Regione Sardegna, che applica tecniche di "Differential networking Analysis" a dati relativi al diabete in Sardegna. "Il progetto", spiega De Leo, "riguarda l'analisi di dati di espressione genica da sostituti della pelle geneticamente modificati".

La ricostruzione delle complesse reti di interazioni fra i geni è un passo molto importante nella comprensione del funzionamento delle cellule. Le moli di dati che, negli ultimi anni, i biologi hanno accumulato consistono tipicamente di liste di "oggetti biologici" e di informazioni sulle loro interazioni: sono dunque molto adatte a essere analizzate con la Teoria delle Reti complesse.

Molto spesso le malattie complesse dipendono, infatti, dall'alterata interazione tra set di geni, e non semplicemente da cambiamenti occorsi in un singolo gene. Comprendere le dinamiche di queste interazioni tramite l'inferenza di reti può rappresentare un progresso consistente per la ricerca su queste malattie. Il principio alla base dell'inferenza di reti dalle osservazioni su larga scala è, spiega Alberto de la Fuente, "stabilire un relazione di causa-effetto tra i geni, usando, per esempio, le perturbazioni di specifici geni e misurando quali di questi cambiano il loro livello di espressione; questi geni sono legati a quelli perturbati da un rapporto causale. Si distingue poi tra relazioni di causa-effetto dirette e indirette. Il modello di rete risultante, una rete genetica, consiste solo di connessioni che corrispondono a relazioni di causa-effetto di tipo diretto tra i geni".

Sono 29 i team, provenienti da tutto il mondo e da atenei quali Università di Chicago, Università di Vanderbilt, Università di New York e ParisTech, che hanno partecipato alla DREAM5 sull'inferenza di reti. Gli organizzatori hanno fornito ai team quattro dataset: tre erano reali esperimenti biologici (da batteri e lieviti) e uno era un esperimento simulato al computer. Ogni dataset consisteva di misurazioni, ottenute da diverse situazioni sperimentali: ad esempio limitando o amplificando l'espressione di un gene, aggiungendo un farmaco oppure introducendo modifiche in una serie temporale. Lo scopo della ricerca era identificare i link tra dei fattori di trascrizione e i loro geni bersaglio. "Gli organizzatori", racconta De Leo, "hanno concesso ai team due mesi di tempo, che abbiamo impiegato per definire le tecniche per ottenere il miglior risultato possibile e rispondere ai quesiti della challenge".

Il team ALF ha sviluppato tre differenti approcci al problema, ognuno dei quali ha prodotto un sotto-insieme di risultati. Il primo approccio, "Perturbation response analysis", analizzava la risposta dell'espressione dei geni a seguito della rimozione o della sovraespressione di un gene o di un set di geni. Il secondo approccio, "Full order partial correlation analysis of the steady-state data subset", si proponeva di osservare le correlazioni tra coppie di geni che non potevano essere spiegate da altri geni. L'approccio numero tre, "Co-deviation analysis of aspecific perturbation data", intendeva identificare geni che deviavano sensibilmente dal loro valore medio di espressione quando un dato fattore di trascrizione deviava sensibilmente dal suo valor medio. Il risultato dei tre approcci è stato, infine, combinato per ottenere una lista di predizioni di link regolatori, tra le migliori predizioni nella competizione DREAM.

Riferimenti:
Il sito della Conferenza alla Columbia University
Il sito del DREAM project
Il sito del laboratorio di Bioinformatica del CRS4
Il profilo del prof. Alberto de la Fuente
Il poster che illustra il lavoro del team ALF [file .pdf ]
L'abstract del lavoro [file .pdf]
Il certificato ufficiale [file .pdf]

Topics 
Article images: 
Biologic Network Inference CRS4 Linkalab DREAM5 Columbia University