Motivation: Genomic copy number (CN) information is useful to study genetic traits of many diseases. Using array comparative genomic hybridization (aCGH), researchers are able to measure the copy number of thousands of DNA loci at the same time. Therefore, a current challenge in bioinformatics is the development of efficient algorithms to detect the map of aberrant chromosomal regions. Methods: We describe an approach for the segmentation of copy number aCGH data. Variational estimator for genomic aberrations (VEGA) adopt a variational model used in image segmentation. The optimal segmentation is modeled as the minimum of an energy functional encompassing both the quality of interpolation of the data and the complexity of the solution measured by the length of the boundaries between segmented regions. This solution is obtained by a region growing process where the stop condition is completely data driven. Results: VEGA is compared with three algorithms that represent the state of the art in CN segmentation. Performance assessment is made both on synthetic and real data. Synthetic data simulate different noise conditions. Results on these data show the robustness with respect to noise of variational models and the accuracy of VEGA in terms of recall and precision. Eight mantle cell lymphoma cell lines and two samples of glioblastoma multiforme are used to evaluate the behavior of VEGA on real biological data. Comparison between results and current biological knowledge shows the ability of the proposed method in detecting known chromosomal aberrations.

L'articolo affronta il problema della segmentazione di dati da array di genomica comparativa (aCGH) basati su polimorfismi di singolo nucleotide (SNP). SI tratta di un problema di elaborazione di segnali che ha forti ricadute applicative in quando permette di identificare le regioni del genoma che subiscono alterazioni (delezioni e amplificazioni). Queste alterazioni sono fondamentali per scoprire quali geni sono alla base di malattie importanti come il cancro.L'articolo propone un nuovo originale algoritmo basato su un modello Variazionale ereditato dalla elaborazione delle immagini. L'analisi delle prestazioni dell'algoritmo, denominato VEGA, e' effettuata sia su dati sintetici che su su dati reali. VEGA e' anche confrontato con altri metodi allo stato dell'arte ed i risultati mostrano come VEGA ottenga mediamente prestazioni superiori in termini di accuracy e recall.L'algoritmo e' stato implementato come package R/Bioconductor e disponibile in open source dalla pagina del progetto internazionale Bioconductor. http://www.bioconductor.org/packages/devel/bioc/html/Vega.htmlIl package è utilizzato da diversi gruppi in ambito internazionale

VEGA: Variational segmentation for copy number detection

CERULO L;CECCARELLI M
2010-01-01

Abstract

Motivation: Genomic copy number (CN) information is useful to study genetic traits of many diseases. Using array comparative genomic hybridization (aCGH), researchers are able to measure the copy number of thousands of DNA loci at the same time. Therefore, a current challenge in bioinformatics is the development of efficient algorithms to detect the map of aberrant chromosomal regions. Methods: We describe an approach for the segmentation of copy number aCGH data. Variational estimator for genomic aberrations (VEGA) adopt a variational model used in image segmentation. The optimal segmentation is modeled as the minimum of an energy functional encompassing both the quality of interpolation of the data and the complexity of the solution measured by the length of the boundaries between segmented regions. This solution is obtained by a region growing process where the stop condition is completely data driven. Results: VEGA is compared with three algorithms that represent the state of the art in CN segmentation. Performance assessment is made both on synthetic and real data. Synthetic data simulate different noise conditions. Results on these data show the robustness with respect to noise of variational models and the accuracy of VEGA in terms of recall and precision. Eight mantle cell lymphoma cell lines and two samples of glioblastoma multiforme are used to evaluate the behavior of VEGA on real biological data. Comparison between results and current biological knowledge shows the ability of the proposed method in detecting known chromosomal aberrations.
2010
L'articolo affronta il problema della segmentazione di dati da array di genomica comparativa (aCGH) basati su polimorfismi di singolo nucleotide (SNP). SI tratta di un problema di elaborazione di segnali che ha forti ricadute applicative in quando permette di identificare le regioni del genoma che subiscono alterazioni (delezioni e amplificazioni). Queste alterazioni sono fondamentali per scoprire quali geni sono alla base di malattie importanti come il cancro.L'articolo propone un nuovo originale algoritmo basato su un modello Variazionale ereditato dalla elaborazione delle immagini. L'analisi delle prestazioni dell'algoritmo, denominato VEGA, e' effettuata sia su dati sintetici che su su dati reali. VEGA e' anche confrontato con altri metodi allo stato dell'arte ed i risultati mostrano come VEGA ottenga mediamente prestazioni superiori in termini di accuracy e recall.L'algoritmo e' stato implementato come package R/Bioconductor e disponibile in open source dalla pagina del progetto internazionale Bioconductor. http://www.bioconductor.org/packages/devel/bioc/html/Vega.htmlIl package è utilizzato da diversi gruppi in ambito internazionale
Variational Segmentation ; aCGH arrays; Genome Analysis
File in questo prodotto:
File Dimensione Formato  
Bioinformatics2010.pdf

non disponibili

Licenza: Non specificato
Dimensione 882.42 kB
Formato Adobe PDF
882.42 kB Adobe PDF   Visualizza/Apri   Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12070/1924
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus 18
  • ???jsp.display-item.citation.isi??? 18
social impact