Introducción a la Bioinformática

Índice de contenidos 1 Pinyin 2 Referencia en inglés 3 Principales contenidos de investigación de la bioinformática 3.1 Obtención de genomas completos de humanos y diversos organismos 3.2 Descubrimiento de nuevos genes y nuevos polimorfismos de un solo nucleótido 3.3 Proteínas no codificantes en el genoma 3.4 A nivel del genoma Estudiar la evolución biológica 3.5 Completo el estudio comparativo de los genomas 3.6 Del genoma funcional a la biología de sistemas 3.7 Simulación de la estructura de proteínas y diseño de fármacos 3.8 Investigación sobre la aplicación y desarrollo de la bioinformática 1 Pinyin Sh ē ng W ù xĥ n xī Xī Xé.

2 Español Referencia Bioinformática

La bioinformática es una materia interdisciplinaria emergente. Mucha gente pensaría que la bioinformática implica tanto la biología como la física y debe ser un área temática muy amplia. De hecho, su connotación es muy específica y su alcance muy claro. La bioinformática nació junto con la investigación del genoma, por lo que su contenido de investigación se desarrolla estrechamente con la investigación del genoma.

A grandes rasgos, la bioinformática se dedica a la adquisición, procesamiento, almacenamiento, distribución, análisis e interpretación de información biológica relacionada con la investigación del genoma. Esta definición contiene dos significados: uno es la recopilación, organización y servicio de datos masivos, es decir, la gestión de estos datos, el otro es el descubrimiento de nuevos patrones a partir de ellos, es decir, hacer un buen uso de estos datos;

Específicamente, la bioinformática analiza la información de la secuencia del ADN genómico como fuente para encontrar regiones codificantes que representan proteínas y genes de ARN en la secuencia del genoma, al mismo tiempo, dilucida la naturaleza de la información de un gran número de no codificantes; regiones del genoma, descifrar las reglas del lenguaje genético ocultas en las secuencias de ADN, resumir y organizar los datos sobre perfiles de transcripción y perfiles de proteínas relacionados con la liberación y regulación de la información genética genómica, para comprender los procesos del metabolismo. , desarrollo, diferenciación y evolución del derecho.

La bioinformática también utiliza información de regiones codificantes del genoma para simular la estructura espacial de las proteínas y predecir sus funciones, y combina esta información con información fisiológica y bioquímica sobre organismos y procesos vitales para dilucidar sus mecanismos moleculares. y en última instancia realizar diseño molecular de proteínas y ácidos nucleicos, diseño de fármacos y diseño sanitario personalizado.

La informática genómica, el cálculo y simulación de la estructura de las proteínas y el diseño de fármacos están estrechamente relacionados con los principios centrales de la transmisión de información genética, por lo que deben estar vinculados orgánicamente.

¿Por qué la investigación genómica se basa en la bioinformática? En primer lugar, con el estudio de los genomas, la información relacionada está creciendo de manera explosiva y existe una necesidad urgente de procesar cantidades masivas de información biológica. Desde que los científicos descifraron el genoma de 18.000 nucleótidos de Haemophilus influenzae en 1995, se ha completado la secuenciación del genoma completo de unos 60 microorganismos y varios organismos eucariotas, como levaduras, nematodos, Drosophila y Arabidopsis. En la primavera de 2001, los científicos habían publicado la secuencia de la mayor parte del genoma humano, un borrador de trabajo del genoma humano. Estos resultados significan que la investigación genómica entrará en una nueva etapa de extracción de información y análisis de datos. Según las estadísticas de las bases de datos internacionales, el número de bases de ADN era de 3.000 millones en 1999, 6.000 millones en abril de 2000 y ahora ha llegado a 1.400 millones, duplicándose aproximadamente cada 14 meses. Al mismo tiempo, el crecimiento del poder de procesamiento digital de los chips electrónicos de computadora equivale a duplicarse cada 18 meses. Como resultado, las computadoras pueden administrar y ejecutar de manera eficiente grandes cantidades de datos.

Sin embargo, la razón más fundamental es la complejidad de los datos genómicos. El llamado genoma de un organismo se refiere a la suma de todo el material genético de un organismo. El material genético biológico es una macromolécula biológica llamada ácido desoxirribonucleico (ADN), que se compone de cuatro nucleótidos conectados en serie, generalmente representados por los caracteres A, T, G y C. En términos generales, el código genético de los organismos es un código lineal largo. cadena unida por estos cuatro personajes. Estas cadenas tienden a ser muy largas. Por ejemplo, el código genético humano contiene 3.200 millones de caracteres. Cuando se apilan, forman un "libro celestial" con más de 654,38 millones de páginas y 3.000 palabras por página. Este "libro celestial" contiene una gran cantidad de información sobre la estructura, función y actividades vitales del cuerpo humano, pero sólo consta de cuatro palabras, sin léxico, sintaxis ni puntuación. Parece que todas las páginas son similares. Cómo leerlo es una gran pregunta. La investigación del genoma es, en última instancia, el proceso de convertir problemas biológicos en símbolos numéricos. Para resolver este problema, debemos desarrollar nuevas teorías, métodos, técnicas y herramientas analíticas, y debemos confiar en el procesamiento de información por computadora.

Participar en la investigación bioinformática debe tener una variedad de fundamentos científicos. En primer lugar, se requiere una cierta cantidad de potencia informática, incluido el correspondiente equipo de software y hardware.

Debe haber varias bases de datos o una comunicación efectiva con los sistemas de bases de datos nacionales e internacionales. Se requiere un sistema de Internet desarrollado y estable; al mismo tiempo, la bioinformática requiere algoritmos y software potentes e innovadores. Sin innovación algorítmica, la bioinformática no puede lograr un desarrollo sostenible. Por último, debería establecer conexiones amplias y estrechas con la ciencia experimental, especialmente con los métodos automatizados de investigación biológica de paso alto a gran escala y las tecnologías de plataforma. Estas tecnologías no son sólo los principales métodos para generar datos bioinformáticos, sino también medios clave para validar los resultados de la investigación bioinformática. Por lo tanto, quienes se dedican a la investigación bioinformática también deben tener conocimientos interdisciplinarios.

Mi país tiene una cierta base en la investigación y aplicación de la bioinformática, por lo que se espera lograr resultados revolucionarios. Esto es muy importante para mejorar la fortaleza de mi país en el campo de la investigación básica y ocupar un liderazgo internacional. posición en algunos aspectos. La aplicación de los resultados de la bioinformática también producirá enormes beneficios sociales y económicos.

3 Principales contenidos actuales de la investigación en bioinformática 3.1 Obtener el genoma completo del ser humano y de diversos organismos El objetivo principal de la investigación del genoma es obtener el código genético completo del ser humano. El código genético humano tiene 3.200 millones de bases, pero los secuenciadores de ADN actuales sólo pueden leer de cientos a miles de bases por reacción. En otras palabras, para obtener todo el código genético humano, primero se debe descifrar el genoma humano, luego medir secuencias cortas y luego volver a ensamblarlas.

Sin embargo, es fácil imaginar que si un libro se rompiera en pedazos del mismo tamaño, nunca se podrían volver a unir correctamente, porque al mismo tiempo se pierde el contexto del libro. ¿Cómo se debe hacer esto? Podemos tomar dos libros idénticos y rasgarlos por separado según diferentes métodos de rasgado. Al cruzar diferentes fragmentos y encontrar las mismas palabras, puedes restaurar parcialmente el contexto del libro. Cuanto más se desgarra el libro, más conexiones contextuales se restablecen. Por lo tanto, para obtener un conjunto completo de códigos genéticos humanos, los 3.200 millones de bases humanas no pueden medirse sólo una vez, sino que a menudo se requieren varias mediciones. Por ejemplo, el borrador del genoma humano publicado en las revistas Nature y Science a principios de este año informó que contenía aproximadamente 2.900 millones de bases, con una cobertura de mapa físico del 96% y una cobertura de secuencia del 94%. Más del 90% de los grupos de secuencias contiguos tienen más de 654,38+ millones de bases; aproximadamente el 25% de los grupos de secuencias contiguos tienen más de 10 millones de bases. En estas secuencias se encontraron entre 30.000 y 40.000 genes codificadores de proteínas. Obtener un mapa de este tipo equivale a analizar el genoma humano unas cinco veces. Para hacer esto, es necesario conectar decenas de millones de pequeños fragmentos mediante alineación, lo que a menudo se denomina empalme y ensamblaje de datos de secuencia del genoma.

Cada aspecto de la secuenciación del genoma a gran escala está estrechamente relacionado con el análisis de la información. Desde el muestreo y análisis de la densidad óptica del secuenciador, la lectura de bases, la identificación y eliminación de portadores, el empalme y el llenado de espacios en la secuencia, hasta la identificación de secuencias repetidas, la predicción de marcos y el etiquetado de genes, cada paso depende estrechamente del software y las bases de datos de bioinformática. Entre ellos, el empalme de secuencias y el llenado de espacios entre secuencias son los problemas más críticos y principales. Su dificultad radica no sólo en su enorme cantidad de datos sino también en sus secuencias altamente repetitivas. Por tanto, en este proceso, es particularmente necesario vincular el diseño experimental y el análisis de la información. Por otro lado, se deben desarrollar algoritmos apropiados y el software correspondiente de acuerdo con los requisitos de los diferentes pasos para manejar diversos problemas complejos. Muchos centros de investigación del genoma de renombre en el mundo tienen sus propias estrategias de empalme y ensamblaje, y ese trabajo se completa en supercomputadoras.

Con un genoma completo, los humanos tendrán una comprensión más detallada y precisa de sí mismos. Por ejemplo, sólo el 1,1% de nuestro genoma codifica proteínas (llamadas exones). La región entre exones (llamadas intrones) representa el 24%; pero las secuencias de intervalo entre genes representan el 75%, lo que significa que las regiones del genoma humano que no codifican proteínas representan la gran mayoría. Se descubrió que los genes que codifican proteínas humanas son más complejos que los de otros organismos y tienen métodos de empalme más ricos. Se descubrió que las duplicaciones de segmentos son muy comunes en el genoma, lo que refleja la compleja historia evolutiva de los humanos. Se descubrió que el cromosoma 13 humano era relativamente estable, mientras que el cromosoma 12 masculino y el cromosoma 16 femenino eran variables, y así sucesivamente.

3.2 Descubrimiento de nuevos genes y nuevos polimorfismos de un solo nucleótido El descubrimiento de nuevos genes es actualmente un tema candente en la investigación genómica internacional, y la bioinformática es un medio importante para descubrir nuevos genes. Por ejemplo, el genoma completo de Saccharomyces cerevisiae contiene alrededor de 6.000 genes, aproximadamente el 60% de los cuales se obtuvieron mediante análisis de información.

(1) Clonación informática de genes

El uso de la base de datos E ST para descubrir nuevos genes también se denomina clonación informática de genes. Las secuencias E ST son secuencias cortas de ADNc expresadas por genes y que transportan información sobre ciertos fragmentos del gen completo. En 2001 y 2010, había más de 3,8 millones de secuencias E-ST humanas en la base de datos EST de GenBank, que cubrían aproximadamente el 90% de los genes humanos.

Ya en 1996, China comenzó a buscar nuevos genes mediante la clonación informática. Su principio es muy simple, es decir, encontrar todos los fragmentos EST que pertenecen al mismo gen y luego conectarlos. Debido a que las secuencias E ST se generan aleatoriamente en muchos laboratorios de todo el mundo, debe haber una gran cantidad de pequeños fragmentos repetidos en muchas secuencias E ST que pertenecen al mismo gen. Utilizando estos pequeños fragmentos como marcadores se pueden unir diferentes EST hasta encontrar su longitud completa, por lo que podemos decir que se ha encontrado un gen mediante clonación in silico. Si este gen no se ha descubierto antes, entonces hemos descubierto un gen nuevo. Sin embargo, los programas de clonación informática son complejos de diseñar y requieren enormes cantidades de cálculos.

(2) Predecir nuevos genes a partir de secuencias de ADN genómico.

Predecir nuevos genes a partir de secuencias del genoma es esencialmente una cuestión de distinguir entre regiones codificantes de proteínas y regiones no codificantes de proteínas. Para el enfoque teórico, se trata de descubrir qué características matemáticas y físicas difieren entre las regiones codificantes y no codificantes. Al comparar estas secuencias con una base de datos de genes conocidos, se pueden descubrir nuevos genes.

El descubrimiento de nuevos genes profundizará nuestra comprensión de las actividades de la vida. Según informes de la revista Nature del año 1999 al 65438+2 de febrero, se han identificado 679 genes a partir de los datos del cromosoma 22 humano, el 55% de los cuales son desconocidos. Hay 35 enfermedades relacionadas con mutaciones cromosómicas, como enfermedades del sistema inmunológico, cardiopatías congénitas y esquizofrenia. Sin embargo, sigue siendo una tarea muy importante y ardua integrar completa y correctamente todos los genes humanos y sus proteínas correspondientes y funciones relacionadas en un índice. La Colaboración Internacional del Genoma Humano está trabajando para establecer un "Índice genético integral" completo y un "Índice integral de proteínas" relacionado.

(3) Se descubrieron polimorfismos de un solo nucleótido.

Algunas personas fuman y beben pero viven más tiempo, y algunas personas han estado enfermas desde la infancia; el mismo medicamento para tratar tumores es muy eficaz para algunas personas, pero completamente ineficaz para otras. ¿Por qué es esto? La respuesta está en las diferencias en sus genomas. Muchas de estas diferencias se manifiestan como variaciones de una sola base, conocidas como polimorfismos de un solo nucleótido (S NP).

En general, se cree que el estudio de S NP es un paso importante en la aplicación del Proyecto Genoma Humano. Esto se debe principalmente a que S NP proporcionará una poderosa herramienta para el descubrimiento de grupos de alto riesgo, la identificación de genes relacionados con enfermedades, el diseño y prueba de medicamentos y la investigación básica en biología. S NP está ampliamente distribuido en el genoma y estudios recientes han demostrado que ocurre una vez cada 300 pares de bases en el genoma humano. La existencia de una gran cantidad de sitios S NP brinda a las personas la oportunidad de descubrir mutaciones genómicas relacionadas con diversas enfermedades, incluidos los tumores; desde un punto de vista experimental, es más fácil encontrar mutaciones genéticas relacionadas con enfermedades a través de S NP que a través de familias. Algunos SNP no causan directamente la expresión de genes de enfermedades, pero debido a que son adyacentes a ciertos genes de enfermedades, se convierten en un marcador importante. Las nanopartículas también desempeñan un papel muy importante en la investigación básica. En los últimos años, el análisis de las NP S del cromosoma Y ha logrado una serie de resultados importantes en los campos de la evolución humana, la evolución de la población humana y la migración.

3.3 Estudios estructurales y funcionales de regiones proteicas no codificantes del genoma

Investigaciones recientes muestran que en bacterias y otros microorganismos, las regiones proteicas no codificantes solo representan del 10% al 20% % de la secuencia completa del genoma %. Con la evolución de los organismos, hay cada vez más regiones no codificantes. En los organismos superiores y en los genomas humanos, las secuencias no codificantes ya representan la gran mayoría de las secuencias del genoma. Esto muestra que estas secuencias no codificantes deben tener funciones biológicas importantes. Generalmente se cree que están relacionados con la regulación de la expresión genética.

En lo que respecta al genoma humano, hasta ahora sólo se ha comprendido realmente la región codificante de proteínas (gen) en el D-NA. Los últimos datos muestran que esta parte de la secuencia sólo representa el 1,1% del total. genoma. La investigación sobre la región codificante, que representa sólo el 1,1% del genoma humano, ha producido decenas de premios Nobel, y la región no codificante del 98% contiene una cantidad considerable de resultados.

Por lo tanto, la búsqueda de las características de codificación, regulación de la información y reglas de expresión de estas regiones será un tema candente durante mucho tiempo y una fuente de resultados importantes.

3.4 Estudio de la evolución biológica a nivel del genoma En los últimos años, con el aumento masivo de datos sobre secuencias del genoma, el debate sobre la relación entre las diferencias de secuencia y la evolución se ha vuelto cada vez más intenso. En primer lugar, se descubrió que los árboles filogenéticos reconstruidos basándose en diferentes secuencias moleculares para la misma población pueden ser diferentes. Al mismo tiempo, las discusiones sobre la relación entre "evolución vertical" y "evolución horizontal" han ido atrayendo gradualmente la atención de la gente. Se trata del "fenómeno de transferencia horizontal" de genes descubierto en los últimos años. Es decir, los genes pueden migrar entre poblaciones coexistentes, lo que da lugar a diferencias de secuencia que no son relevantes para la evolución. Incluso los análisis del genoma humano han encontrado que docenas de genes humanos son similares sólo a genes bacterianos que no están presentes en las moscas de la fruta y los nematodos. Si utilizas estas secuencias de genes humanos para estudiar la evolución, llegarás a conclusiones absurdas. Por lo tanto, en los estudios actuales de evolución molecular, se deben seleccionar como muestras moléculas evolucionadas verticalmente. Especialmente en el análisis de la evolución molecular, "similitud" y "homología" son dos conceptos diferentes. La similitud solo refleja la similitud entre los dos y no contiene ningún significado evolutivo. La homología se refiere a similitudes relacionadas con el mismo antepasado.

3.5 Estudio comparativo del genoma completo En la era posgenómica cada vez hay más datos del genoma completo. Con estos datos, las personas pueden analizar y estudiar algunas cuestiones biológicas importantes, como por ejemplo: ¿Dónde se originó la vida? ¿Cómo evolucionó la vida? ¿Cómo se originó el código genético? ¿Cuántos genes necesita el organismo vivo independiente más pequeño? ¿Cómo hacen estos genes que los organismos cobren vida? Espera un momento. Estas importantes preguntas sólo pueden responderse a nivel del genoma. Por ejemplo, los genomas de ratones y humanos son aproximadamente del mismo tamaño, contienen alrededor de 3 mil millones de pares de bases y tienen un número similar de genes, la mayoría de los cuales son homólogos. Pero la diferencia entre ratones y humanos es muy grande. ¿Por qué? De manera similar, algunos científicos estiman que la diferencia genómica entre diferentes razas es sólo del 0,1%; la diferencia entre simios es aproximadamente del 1%; Pero las diferencias entre sus fenotipos son sorprendentes. Por lo tanto, esta diferencia debe atribuirse no sólo a los genes y secuencias de ADN, sino también a diferencias en todo el genoma y la organización cromosómica. Este trabajo fue pionero en genómica comparada.

Los científicos descubrieron que todos los genes se pueden dividir en varias categorías según sus funciones y filogenia, incluidos genes relacionados con la replicación, la transcripción, la traducción, las damas de honor moleculares, la producción de energía, el transporte de iones y varios metabolismos. Este trabajo también proporciona nuevas vías para la clasificación de proteínas. Al mismo tiempo, comparando varios genomas completos, los científicos calcularon que el número mínimo de genes necesarios para sustentar las actividades vitales es de unos 250. Asimismo, cuando comparamos los genomas de ratones y humanos, vemos que aunque los genomas son similares en tamaño y número de genes, la organización de los genomas es muy diferente. Por ejemplo, los genes presentes en el cromosoma 1 del ratón se han distribuido en los cromosomas humanos 1, 2, 5, 6, 8, 13 y 18. Los estudios han demostrado que las diferencias en el orden de ciertas proteínas ribosómicas pueden reflejar la relación genética entre especies. Cuanto más estrecha es la relación genética, más cercano es el orden de los genes. Esto permite estudiar las relaciones filogenéticas entre especies comparando las secuencias de genes.

Mi país inició la secuenciación y el análisis a gran escala de genomas microbianos completos en 1998. En la actualidad, los científicos chinos han completado la secuenciación del 1% del genoma humano, identificadas de forma independiente en China: eubacterias termófilas y arqueas termófilas; un "borrador de trabajo" de los 430 millones de pares de bases del genoma del arroz. Estos datos proporcionarán el material más directo para la investigación de China en este campo.

3.6 Desde la genómica funcional hasta la biología de sistemas, el número de genes expresados ​​en diferentes tejidos varía mucho. El cerebro tiene la mayor cantidad de genes expresados, con alrededor de 30.000 a 40.000 transcripciones, y algunos tejidos tienen sólo docenas o cientos de genes expresados. En diferentes etapas del crecimiento y desarrollo individual, los tipos y cantidades de genes expresados ​​en el mismo tejido también son diferentes. Algunos genes se expresan en la infancia, otros en la mediana edad y otros en la vejez. No sólo necesitamos conocer la secuencia del gen, sino también la función del gen, es decir, el perfil de expresión del gen en diferentes tejidos en diferentes momentos. Esto se conoce comúnmente como investigación genómica funcional.

Para obtener perfiles de expresión génica se han desarrollado nuevas técnicas a nivel de ácidos nucleicos y proteínas.

Se trata de tecnología de chip genético (o chip de ADN) a nivel de ácido nucleico y tecnología de identificación de secuencias y separación de proteínas a gran escala a nivel de proteína, que es la llamada tecnología de proteoma. Debido a la alta densidad de puntos de muestra en el chip, que puede alcanzar cientos de miles por chip, la extracción de datos del perfil de expresión y el descubrimiento de conocimientos se han convertido en la clave del éxito de esta investigación. El desarrollo de biochips y tecnologías de proteomas se basa cada vez más en teorías, tecnologías y bases de datos bioinformáticas. En el siguiente paso, la investigación en genómica funcional se desarrollará en sistemas complejos, es decir, explorará las interacciones de varias partes y niveles en los sistemas biológicos, ingresando así al campo de la biología de sistemas.

3.7 Simulación de la estructura de proteínas y diseño de fármacos La simulación de la estructura espacial de proteínas y el diseño de fármacos tienen una historia de 20 a 30 años. Con el rápido desarrollo de la investigación del genoma humano, el campo se enfrenta a una nueva situación, es decir, está a la vuelta de la esquina encontrar las secuencias de bases de 30.000 a 40.000 genes humanos, por lo que las secuencias de aminoácidos de sus productos de expresión también serán poco a poco se dio cuenta. En este momento, es una tarea urgente predecir la estructura espacial de estas proteínas y luego realizar el diseño de fármacos específicos. Este también es un problema computacional a gran escala.

3.8 Investigación sobre la aplicación y desarrollo de la bioinformática Los resultados de la investigación en bioinformática no sólo tienen un importante valor teórico, sino que también pueden aplicarse directamente a la producción industrial, agrícola y a la práctica médica. Por lo tanto, los algoritmos, el software y las bases de datos de análisis y aplicación relacionados con la bioinformática tienen un valor económico importante y eventualmente se convertirán en productos básicos que brindarán beneficios económicos y sociales.

(1) Información genética relacionada con enfermedades y desarrollo de software y algoritmos relacionados.

Muchas enfermedades están relacionadas con mutaciones genéticas o polimorfismos genéticos. Se estima que aproximadamente 1.000 protooncogenes y 100 genes supresores de tumores están asociados con el cáncer. Hay más de 6.000 enfermedades humanas asociadas con diversos cambios genéticos humanos. Más enfermedades son el resultado de la interacción entre el medio ambiente (incluidos los microorganismos patógenos) y los genes humanos (productos genéticos). Con la profundización del proyecto del genoma humano, cuando conozcamos la ubicación de todos los genes humanos en el cromosoma, sus características de secuencia (incluidos los S NP), sus patrones de expresión y las características de sus productos (ARN y proteínas), las personas podrán efectivamente determinar los mecanismos moleculares de diversas enfermedades y luego formular los métodos de diagnóstico y tratamiento correspondientes. Por lo tanto, dos tareas bioinformáticas son importantes: una es establecer una base de datos de información genética humana relacionada con enfermedades (incluida la base de datos S NP) y la otra es desarrollar algoritmos bioinformáticos para el análisis eficaz de datos de genotipado, especialmente datos y métodos de S NP. para calcular asociaciones entre enfermedades y factores causales.

(2) Establecer una base de datos genómica relacionada con el mejoramiento animal y vegetal y desarrollar tecnología de mejoramiento asistida por marcadores moleculares.

Basándonos en la distancia evolutiva entre diferentes especies y la homología de genes funcionales, podemos encontrar fácilmente genes relacionados con los beneficios económicos de diversos cultivos ganaderos y comerciales, y comprender mejor su desarrollo, crecimiento y diversas vías y Mecanismos de resistencia al estrés. Sobre esta base, el uso de marcadores moleculares genómicos relevantes puede acelerar la reproducción y transformarse según los deseos de las personas.

(3) Desarrollar software de diseño de fármacos y tecnología de biología molecular basada en información biológica.

La información del genoma humano proporciona nuevas moléculas candidatas y nuevos genes diana candidatos para el desarrollo de fármacos. Al mismo tiempo, el diseño de vectores de expresión, PCR y cebadores de hibridación comúnmente utilizados en biología molecular, así como diversos kits (incluidos chips de ADN) deben basarse en la información de secuencia de los ácidos nucleicos. La gran cantidad de información que proporciona la informática genómica abre un amplio espacio para el desarrollo de este tipo de tecnología.