Escudo de la República de Colombia
Sistema Nacional de Biliotecas - Repositorio Institucional Universidad Nacional de Colombia Biblioteca Digital - Repositorio Institucional UN Sistema Nacional de Bibliotecas UN

Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica

Leal Ayala, Luis Guillermo (2013) Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica. Maestría thesis, Universidad Nacional de Colombia.

Texto completo

[img]
Vista previa
PDF - Versión Aceptada
Available under License Creative Commons Attribution Non-commercial No Derivatives.

8MB

Resumen

Diversos métodos estadísticos son aplicados a la investigación de redes complejas, por ejemplo en la construcción y comparación de redes de coexpresi´on génica (RCG). Las RCG muestran de forma gráficas cómo los genes de un ser vivo participan coordinadamente en los procesos celulares. Las RCG esquematizan el funcionamiento global del sistema biológico por medio de nodos (genes) y aristas (relaciones funcionales entre genes), con base en datos experimentales. En este trabajo se identifican varias limitaciones previa- mente reportadas en las metodologías de construcción y comparación de RCG. Se evalúan y seleccionan los métodos más indicados para mejorar desde un enfoque estadístico las estrategias empleadas actualmente. La tesis hace los siguientes aportes: • En la construcción de RCG: – Se emplea una medida de similitud que considera las asociaciones no lineales entre los datos de expresión. – Se adapta un método basado en coeficientes de agrupamiento para establecer las aristas de la red. • En la comparación de RCG: – Se proponen nuevas variables capaces de capturar información topológica y biológica intrínseca en la red. – Se comparan las redes aplicando un análisis en componentes principales seguido de una clasificación no jerárquica. La metodología se evaluó con datos obtenidos en experimentos de inmunidad en las plantas: arroz, soya, tomate, yuca y Arabidopsis. Los resultados demuestran que las RCG construidas con esta metodología contienen aristas valiosas para entender el sistema. Se encontró una forma objetiva y confiable de construir la red, con la cual se reduce el ruido de los datos y se evitan aristas no significativas. Con el objetivo de caracterizar las redes, se demostró que las nuevas variables son independientes del tamaño de la red y aportan información valiosa para comprender los sistemas en estudio. Finalmente, al hacer la clasificación de las redes en el espacio factorial, se encontraron patrones de similitud entre las redes, al igual que asociaciones entre las variables que las describían., Abstract: Statistical methods are used in scientific research to study complex networks such as gene coexpression networks (GCNs). These networks show how genes take part of cellular processes coordinately. GCNs depict the biological systems by means of nodes (genes) and edges (functional relationships between genes), based on experimental data. In this work, some shortcomings of current methodologies for construction and comparison of GCNs are studied. Several methods were evaluated and the most suitable were selec- ted to propose a novel enhanced statistical methodology. This thesis makes the following contributions: • To the construction of GCNs: – A similarity measure that takes into account nonlinear relationships on data is used. – A novel method based on clustering coefficients was adapted with the aim of defining the network’s edges. • To the comparison of GCNs: – New variables that summarize topological and biological information of the GCNs were proposed. – A principal component analysis and the non-hierarchical classification method of K-Means were applied with the aim of studying the GCNs based on multi- variate analyses. This methodology was applied using gene expression data that were obtained from immunity experiments of the plants: rice, soybean, tomato, cassava and Arabidopsis. The results show that many important edges were included in GCNs, but also the noise of data was reduced to avoid non-significant edges. The variables used to characterize GCNs are nondependent on networks’ size and revealed new information to understand the biological system. Finally, the GCNs classification on the principal component’s space, allowed the finding of similar networks and of dependences among variables.

Tipo de documento:Tesis/trabajos de grado - Thesis (Maestría)
Colaborador / Asesor:López Kleine, Liliana and López, Camilo
Información adicional:Maestría en Ciencias-Estadística. Línea de investigación: Estadística genómica
Palabras clave:Redes de coexpresión génica, Medidas de similitud, Información mutua, Umbral de similitud, Coeficientes de agrupamiento, Análisis en componentes principales, Clasificación no jerárquica, Comparación de redes, Inmunidad vegetal, Gene coexpression networks, Similarity measures, Mutual information, Similarity threshold, Clustering coefficient, Principal component analysis, Non-hierarchical classification, Network comparison, Plant immunity
Temática:5 Ciencias naturales y matemáticas / Science > 51 Matemáticas / Mathematics
5 Ciencias naturales y matemáticas / Science > 57 Ciencias de la vida; Biología / Life sciences; biology
Unidad administrativa:Sede Bogotá > Facultad de Ciencias > Departamento de Estadística
Código ID:12850
Enviado por : Universidad Nacional de Colombia Biblioteca Digital -1-Sede Bogotá
Enviado el día :26 Junio 2014 20:09
Ultima modificación:26 Junio 2014 20:09
Ultima modificación:26 Junio 2014 20:09
Exportar:Clic aquí
Estadísticas:Clic aquí
Compartir:

Solamente administradores del repositorio: página de control del ítem

Vicerrectoría de Investigación: Número uno en investigación
Indexado por:
Indexado por Scholar Google WorldCat DRIVER Registry of Open Access Repositories OpenDOAR Metabiblioteca BDCOL OAIster Red de repositorios latinoamericanos DSpace BASE Open archives La referencia Colombiae Open Access Theses and Dissertations Tesis latinoamericanas CLACSO
Este sitio web se ve mejor en Firefox