Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas

Tesis para obtener el grado de Magíster Scientiae en Explotación de Datos y Descubrimiento del Conocimiento, de la Universidad de Buenos Aires, en diciembre de 2008

Bibliographic Details
Main Author: Taie, Armando
Other Authors: Haedo, Ana Silvia
Format: Tesis
Language:Español
Published: Facultad de Ciencias Exactas y Naturales, Universidad de Buenos Aires 2020
Subjects:
Online Access:http://hdl.handle.net/20.500.12123/7151
_version_ 1855483950607106048
author Taie, Armando
author2 Haedo, Ana Silvia
author_browse Haedo, Ana Silvia
Taie, Armando
author_facet Haedo, Ana Silvia
Taie, Armando
author_sort Taie, Armando
collection INTA Digital
description Tesis para obtener el grado de Magíster Scientiae en Explotación de Datos y Descubrimiento del Conocimiento, de la Universidad de Buenos Aires, en diciembre de 2008
format Tesis
id INTA7151
institution Instituto Nacional de Tecnología Agropecuaria (INTA -Argentina)
language Español
publishDate 2020
publishDateRange 2020
publishDateSort 2020
publisher Facultad de Ciencias Exactas y Naturales, Universidad de Buenos Aires
publisherStr Facultad de Ciencias Exactas y Naturales, Universidad de Buenos Aires
record_format dspace
spelling INTA71512024-09-04T16:07:55Z Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas Taie, Armando Haedo, Ana Silvia Paniego, Norma Beatriz Soria, Marcelo ADN Minería de Datos Ontología Arroz Genes Procesamiento de Datos DNA Data Mining Ontology Rice Data Processing Tesis para obtener el grado de Magíster Scientiae en Explotación de Datos y Descubrimiento del Conocimiento, de la Universidad de Buenos Aires, en diciembre de 2008 Los experimentos de micromatrices de DNA permiten obtener información sobre la expresión conjunta de cientos o miles de genes, lo que ha producido un importante incremento en el volumen de datos disponibles en el área de las ciencias biológicas. Sin embargo, esta disponibilidad de información no ha implicado un aumento proporcional en el avance del conocimiento relacionado. La minería de datos (data-mining) surge como una tecnología emergente que sirve de soporte para el descubrimiento de conocimiento, que se revela a partir de patrones observables en datos estructurados o asociaciones que usualmente eran desconocidas. El presente trabajo consiste en desarrollar una metodología de análisis de datos que permita descubrir conocimientos biológicamente relevantes, partiendo de datos de micromatrices de arroz almacenados en repositorios públicos, enriqueciendo esta información mediante la asociación con los términos de la Ontología de Genes (Gene Ontology, GO). La GO propone establecer descripciones coherentes de los genes a partir del desarrollo de vocabularios controlados y proporciona tres redes estructuradas de términos controlados para describir los atributos de los genes que pueden ser aplicados a cualquier organismo. La metodología desarrollada se basa en la aplicación de paquetes de software de código abierto para el análisis de datos, como el lenguaje R, que provee un entorno de procesamiento estadístico y gráfico. R posee una instalación base y módulos que se agregan según el tipo de análisis que se realice. Entre ellos se encuentra el módulo Bioconductor que permite el análisis de datos bioinformáticos. Este tipo de iniciativas de código abierto y libre, facilitan la comunicación entre los usuarios creando comunidades que se van fortaleciendo y enriqueciendo a través de los conocimientos compartidos. Se utilizó un paquete especial del Bioconductor para consultar y rescatar información de la Base de Datos de la GO (GO.db). Estas aplicaciones, asociadas al administrador de Base de Datos MySQL, fueron usadas en el desarrollo de una pipeline para implementar los procedimientos de extracción del conocimiento propuestos en esta tesis. Se utilizaron como modelo, los datos crudos obtenidos de estudios independientes sobre perfiles de expresión de genes de arroz inducidos ante estreses abióticos. DNA microarray technology allows scientists to study the expression of thousands of genes simultaneously; however the increase of biological data has not implied a proportional growth of related knowledge. Knowledge discovery from the amount of data collected depends on the development and appropriate use of data mining and statistical tools. This work involves the application of techniques for extracting knowledge implicit previously unknown and potentially useful from the biological information obtained from gene expression studies using microarrays. Three sets of experimental DNA microarray data from selected Oryza sativa abiotic stress experiments were analyzed using a pipeline based on MySQL database and R/Bioconductor routines. A secondary refinement process using the GO annotations was introduced to enrich the level of biological information included in the clusters. The result was a high-level biological significance categorization of microarray data based on GO resources. EEA Corrientes Fil: Taie, Armando. Instituto Nacional de Tecnología Agropecuaria (INTA). Estación Experimental Agropecuaria Corrientes; Argentina 2020-04-27T14:14:07Z 2020-04-27T14:14:07Z 2008-12 info:ar-repo/semantics/tesis de maestría info:eu-repo/semantics/masterThesis info:eu-repo/semantics/acceptedVersion http://hdl.handle.net/20.500.12123/7151 spa info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf Facultad de Ciencias Exactas y Naturales, Universidad de Buenos Aires
spellingShingle ADN
Minería de Datos
Ontología
Arroz
Genes
Procesamiento de Datos
DNA
Data Mining
Ontology
Rice
Data Processing
Taie, Armando
Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas
title Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas
title_full Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas
title_fullStr Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas
title_full_unstemmed Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas
title_short Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas
title_sort desarrollo de una metodologia de extraccion de conocimientos a partir de datos de micromatrices de dna basada en ontologias geneticas
topic ADN
Minería de Datos
Ontología
Arroz
Genes
Procesamiento de Datos
DNA
Data Mining
Ontology
Rice
Data Processing
url http://hdl.handle.net/20.500.12123/7151
work_keys_str_mv AT taiearmando desarrollodeunametodologiadeextracciondeconocimientosapartirdedatosdemicromatricesdednabasadaenontologiasgeneticas