Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas
Tesis para obtener el grado de Magíster Scientiae en Explotación de Datos y Descubrimiento del Conocimiento, de la Universidad de Buenos Aires, en diciembre de 2008
| Main Author: | |
|---|---|
| Other Authors: | |
| Format: | Tesis |
| Language: | Español |
| Published: |
Facultad de Ciencias Exactas y Naturales, Universidad de Buenos Aires
2020
|
| Subjects: | |
| Online Access: | http://hdl.handle.net/20.500.12123/7151 |
| _version_ | 1855483950607106048 |
|---|---|
| author | Taie, Armando |
| author2 | Haedo, Ana Silvia |
| author_browse | Haedo, Ana Silvia Taie, Armando |
| author_facet | Haedo, Ana Silvia Taie, Armando |
| author_sort | Taie, Armando |
| collection | INTA Digital |
| description | Tesis para obtener el grado de Magíster Scientiae en Explotación de Datos y Descubrimiento del Conocimiento, de la Universidad de Buenos Aires, en diciembre de 2008 |
| format | Tesis |
| id | INTA7151 |
| institution | Instituto Nacional de Tecnología Agropecuaria (INTA -Argentina) |
| language | Español |
| publishDate | 2020 |
| publishDateRange | 2020 |
| publishDateSort | 2020 |
| publisher | Facultad de Ciencias Exactas y Naturales, Universidad de Buenos Aires |
| publisherStr | Facultad de Ciencias Exactas y Naturales, Universidad de Buenos Aires |
| record_format | dspace |
| spelling | INTA71512024-09-04T16:07:55Z Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas Taie, Armando Haedo, Ana Silvia Paniego, Norma Beatriz Soria, Marcelo ADN Minería de Datos Ontología Arroz Genes Procesamiento de Datos DNA Data Mining Ontology Rice Data Processing Tesis para obtener el grado de Magíster Scientiae en Explotación de Datos y Descubrimiento del Conocimiento, de la Universidad de Buenos Aires, en diciembre de 2008 Los experimentos de micromatrices de DNA permiten obtener información sobre la expresión conjunta de cientos o miles de genes, lo que ha producido un importante incremento en el volumen de datos disponibles en el área de las ciencias biológicas. Sin embargo, esta disponibilidad de información no ha implicado un aumento proporcional en el avance del conocimiento relacionado. La minería de datos (data-mining) surge como una tecnología emergente que sirve de soporte para el descubrimiento de conocimiento, que se revela a partir de patrones observables en datos estructurados o asociaciones que usualmente eran desconocidas. El presente trabajo consiste en desarrollar una metodología de análisis de datos que permita descubrir conocimientos biológicamente relevantes, partiendo de datos de micromatrices de arroz almacenados en repositorios públicos, enriqueciendo esta información mediante la asociación con los términos de la Ontología de Genes (Gene Ontology, GO). La GO propone establecer descripciones coherentes de los genes a partir del desarrollo de vocabularios controlados y proporciona tres redes estructuradas de términos controlados para describir los atributos de los genes que pueden ser aplicados a cualquier organismo. La metodología desarrollada se basa en la aplicación de paquetes de software de código abierto para el análisis de datos, como el lenguaje R, que provee un entorno de procesamiento estadístico y gráfico. R posee una instalación base y módulos que se agregan según el tipo de análisis que se realice. Entre ellos se encuentra el módulo Bioconductor que permite el análisis de datos bioinformáticos. Este tipo de iniciativas de código abierto y libre, facilitan la comunicación entre los usuarios creando comunidades que se van fortaleciendo y enriqueciendo a través de los conocimientos compartidos. Se utilizó un paquete especial del Bioconductor para consultar y rescatar información de la Base de Datos de la GO (GO.db). Estas aplicaciones, asociadas al administrador de Base de Datos MySQL, fueron usadas en el desarrollo de una pipeline para implementar los procedimientos de extracción del conocimiento propuestos en esta tesis. Se utilizaron como modelo, los datos crudos obtenidos de estudios independientes sobre perfiles de expresión de genes de arroz inducidos ante estreses abióticos. DNA microarray technology allows scientists to study the expression of thousands of genes simultaneously; however the increase of biological data has not implied a proportional growth of related knowledge. Knowledge discovery from the amount of data collected depends on the development and appropriate use of data mining and statistical tools. This work involves the application of techniques for extracting knowledge implicit previously unknown and potentially useful from the biological information obtained from gene expression studies using microarrays. Three sets of experimental DNA microarray data from selected Oryza sativa abiotic stress experiments were analyzed using a pipeline based on MySQL database and R/Bioconductor routines. A secondary refinement process using the GO annotations was introduced to enrich the level of biological information included in the clusters. The result was a high-level biological significance categorization of microarray data based on GO resources. EEA Corrientes Fil: Taie, Armando. Instituto Nacional de Tecnología Agropecuaria (INTA). Estación Experimental Agropecuaria Corrientes; Argentina 2020-04-27T14:14:07Z 2020-04-27T14:14:07Z 2008-12 info:ar-repo/semantics/tesis de maestría info:eu-repo/semantics/masterThesis info:eu-repo/semantics/acceptedVersion http://hdl.handle.net/20.500.12123/7151 spa info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf Facultad de Ciencias Exactas y Naturales, Universidad de Buenos Aires |
| spellingShingle | ADN Minería de Datos Ontología Arroz Genes Procesamiento de Datos DNA Data Mining Ontology Rice Data Processing Taie, Armando Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas |
| title | Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas |
| title_full | Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas |
| title_fullStr | Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas |
| title_full_unstemmed | Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas |
| title_short | Desarrollo de una metodología de extracción de conocimientos a partir de datos de micromatrices de DNA basada en ontologías genéticas |
| title_sort | desarrollo de una metodologia de extraccion de conocimientos a partir de datos de micromatrices de dna basada en ontologias geneticas |
| topic | ADN Minería de Datos Ontología Arroz Genes Procesamiento de Datos DNA Data Mining Ontology Rice Data Processing |
| url | http://hdl.handle.net/20.500.12123/7151 |
| work_keys_str_mv | AT taiearmando desarrollodeunametodologiadeextracciondeconocimientosapartirdedatosdemicromatricesdednabasadaenontologiasgeneticas |