¿Características de la rama de la biología? ¿Tipos y características de los recursos de información biológica en Internet? ¿Características de las bases de datos de información biológica?
1. Explicación de términos:
1. Bioinformática: la adquisición, almacenamiento, análisis y utilización de información de biomoléculas basada en las matemáticas, aplicación
Tecnología informática; , la ciencia del estudio de datos biológicos.
2. Similitud: la correlación entre dos secuencias (ácido nucleico, proteína).
3. Homología: relación entre ramas procedentes de un mismo ancestro en el proceso de evolución biológica.
4. Identidad: La relación entre dos secuencias (ácido nucleico, proteína) sin variación de secuencia.
5. Alineamiento de secuencias: Con el fin de determinar la similitud e incluso homología entre dos o más secuencias
, y ordenarlas según ciertas reglas.
6. Consulta de base de datos biológica (consulta de base de datos): Búsqueda de coincidencia de palabras clave para secuencias, estructuras e información de anotaciones en varias bases de datos secundarias.
7. Búsqueda en bases de datos biológicas (búsqueda en bases de datos): utilice un algoritmo de comparación de similitud de secuencia específico para encontrar bases de datos de secuencias de ácidos nucleicos o proteínas que sean similares a la secuencia sexual que se va a probar.
2. Preguntas de respuesta corta:
1. ¿Cuáles son las tres bases de datos centrales de la biología molecular? ¿Cuáles son las características de cada uno de ellos?
Base de datos de secuencias de ácidos nucleicos GenBank; base de datos de secuencias de proteínas SWISS-PROT; base de datos de números de estructuras de macromoléculas biológicas
2. .
En los años 50 se empezó a nutrir la bioinformática;
En los años 60 la información biomolecular vinculó conceptualmente la biología computacional y la informática
El verdadero inicio de la bioinformática; en la década de 1970;
Desde la década de 1970 hasta principios de la de 1980, aparecieron una serie de métodos de comparación de secuencias y análisis bioinformáticos famosos
Métodos
Después de la década de 1980, aparecieron varias organizaciones de servicios bioinformáticos y bases de datos bioinformáticas;
Después de la década de 1990, HGP promovió el rápido desarrollo de la bioinformática.
3. ¿Cuáles son los principales métodos y tecnologías de la bioinformática?
Métodos estadísticos matemáticos; métodos de programación dinámica; tecnología de reconocimiento de patrones y aprendizaje automático; tecnología de bases de datos y minería de datos; tecnología de redes neuronales artificiales; mecánica cuántica; mecánica
Computación; simulación informática de biomoléculas; tecnología de Internet
4. ¿Cuáles son las características técnicas, ventajas y desventajas de cada uno?
Método de degradación química del ADN de Maxam-Gilbert: Ventajas: puede detectar secuencias completamente desconocidas y regiones ricas en CG. Desventajas: la operación es engorrosa.
Método de terminación de cadena doble Deoxy de Sanger: Ventajas: simple, puede detectar fragmentos más largos; Desventajas: requiere una secuencia parcial conocida o
agregar adaptadores: Ventajas: barata, cantidad de paso alto; una vez.
5. ¿Qué tipos de bases de datos de biología molecular existen? ¿Cuáles son las características de cada uno?
Base de datos del genoma: Secuenciación del genoma
Base de datos de secuencias de ácidos nucleicos: Determinación de la secuencia de ácidos nucleicos
Base de datos primaria: Base de datos de secuencias de proteínas: Determinación de la secuencia de proteínas. Base de datos de estructura tridimensional de macromoléculas biológicas (proteínas)
Base de datos de estructura: difracción X y RMN
Características: pequeña cantidad, gran capacidad, actualización rápida
Base de datos secundaria: construida en base a los cuatro tipos de bases de datos y materiales bibliográficos anteriores
Características: gran número, pequeña capacidad, actualización lenta
6. .
Sistema de búsqueda avanzada; búsqueda de ácidos nucleicos, proteínas, literatura, estructuras, secuencias de genoma, estructuras tridimensionales de macromoléculas,
datos de mutaciones, secuencias de sondas, polimorfismos de un solo nucleótido, etc. datos.
7. Describir brevemente las funciones y tipos de NCBI BLAST.
Herramienta de comparación de similitud de secuencias;
Para ácidos nucleicos: blastn ordinario, para secuencias muy similares megablast;
Para proteínas: blastp ordinario, para dominios conservados rpsblast;
Para secuencias traducidas artificialmente: secuencia de traducción de ácido nucleico versus secuencia de proteína blastx, secuencia de traducción de proteína versus tblastn
, secuencia de traducción de ácido nucleico versus secuencia de traducción tblastx
; Otros: Genoma blast, búsqueda de secuencia de expresión génica GEO blast, comparación de secuencias por pares...
8.
9. Qué software bioinformático se puede aplicar durante la producción y análisis de biochips.
3. Preguntas de ensayo:
1. ¿Qué es la bioinformática? ¿Cuáles son las principales áreas de aplicación de la bioinformática?
Adquisición, almacenamiento, análisis y utilización de información de biomoléculas; basado en las matemáticas, aplicando tecnología informática para estudiar
la ciencia de los datos biológicos.
Recopilación y gestión de datos de biomoléculas; búsqueda en bases de datos y comparación de secuencias; análisis de secuencias de genoma y procesamiento de datos de expresión de proteínas;
2. ¿Cuáles son las aplicaciones de la bioinformática en el ámbito médico?
Diagnóstico auxiliar (enfermedades genéticas, tipificación HLA);
Estudio de los mecanismos de acción de los fármacos y asistencia en el desarrollo y fabricación de nuevos fármacos.
3. ¿Qué métodos bioinformáticos se utilizaron principalmente en el Proyecto Genoma Humano? ¿Qué papel importante jugaron en el Proyecto Genoma Humano
?
Interpretación de resultados de secuenciación única; empalme de cóntigos y cromosomas; identificación de regiones genéticas y sus regiones reguladoras; búsqueda de relaciones espaciotemporales de interacciones genéticas
4. Métodos para la predicción de la estructura secundaria de proteínas.
Estrategia:
Objetivo: Determinar si el residuo en el centro de cada segmento está en uno de los estados de hélice, b pliegue, b giro (u otros estados)
Estado estructural secundario, es decir, tres estados.
a.Método de análisis teórico (método de cálculo ab initio):
La predicción de la estructura se realiza mediante cálculos teóricos (mecánica molecular, dinámica molecular, etc.). Ventajas: no se requieren datos empíricos y la estructura de orden superior se puede inferir a partir de la estructura primaria. Desventajas: la diferencia en el nivel de energía entre las proteínas nativas y las desplegadas es muy pequeña (kcal/mol); el espacio de concepción de proteínas es enorme
, la cantidad de cálculo para el plegamiento de proteínas es enorme; los parámetros del campo de fuerza en el modelo de cálculo son inexactos.
b.Método estadístico: realizar análisis estadísticos de proteínas con estructuras conocidas, establecer modelos de mapeo de secuencia a estructura,
y luego predecir proteínas con estructuras desconocidas directamente a partir de aminoácidos basados en. la estructura del modelo de mapeo.
Método empírico: Predicción de estructuras basada en la tendencia de una determinada secuencia a formar una determinada estructura. Mediante el análisis estadístico de proteínas con estructuras conocidas se descubre la tendencia de varios aminoácidos a formar diferentes estructuras secundarias, formándose así una serie de reglas para predecir estructuras secundarias.
Método de extracción de reglas estructurales: extraiga reglas generales sobre la formación de estructuras de proteínas de la base de datos de estructuras de proteínas para guiar el establecimiento de modelos de proteínas de estructuras desconocidas.
Método de modelado de homología: Predice la estructura espacial o unidades estructurales de proteínas mediante análisis de secuencias de homología o coincidencia de patrones.
Métodos:
1. Método de Chou-Fasman (método de parámetros empíricos basado en estadísticas de residuos de aminoácidos individuales, desarrollado por Chou y
Fasman en el Década de 1970 Se propuso en la década de 1990. Mediante análisis estadístico, se obtiene el factor de tendencia de cada residuo que aparece en una conformación de estructura secundaria específica, y luego estos factores de tendencia se utilizan para predecir la estructura secundaria de la proteína.
) 2.
Método GOR (Es un método basado en la teoría de la información y la estadística bayesiana. GOR trata las secuencias de proteínas como una serie de
valores de información; el método GOR no solo la influencia; (se considera el tipo de residuo de aminoácido en la posición predicha, pero también la influencia del tipo de residuos adyacentes en la conformación de la posición) 3. Método basado en la hidrofobicidad de los aminoácidos 4. Most
Método de proximidad; 5. Método de red neuronal artificial; 6. Método integral: 7. Predicción de proteínas utilizando información evolutiva