Red de conocimientos sobre prescripción popular - Cuidado de la salud en otoño - Easygene|Proceso de análisis de secuenciación de metilación del ADN del genoma completo

Easygene|Proceso de análisis de secuenciación de metilación del ADN del genoma completo

¿Cómo realizar un experimento de metilación del ADN del genoma completo? Se presenta en detalle desde cuatro aspectos: principios técnicos, proceso de secuenciación, proceso de análisis de información y ruta de investigación.

La modificación epigenética puede cambiar rasgos sin cambiar la secuencia del ADN. Los cambios en la modificación epigenética están estrechamente relacionados con la función de los genes, e incluso con el estado celular, el desarrollo, el envejecimiento, la enfermedad, etc. Entre muchas modificaciones epigenéticas, la metilación del ADN es una de las modificaciones más importantes y ampliamente estudiadas, y la secuenciación de metilación del genoma completo (WGBS-seq) es sin duda el método de investigación más eficaz.

La secuenciación de metilación del genoma completo aprovecha la propiedad del bisulfito para convertir la citosina (C) no metilada en timina (T). Después de tratar el genoma con bisulfito y secuenciarlo, la tasa de metilación se puede calcular como la proporción de lecturas que no se convierten en C y T en un solo sitio C con respecto a todas las lecturas cubiertas. Esta tecnología tiene un valor de aplicación importante para estudiar exhaustivamente los mecanismos epigenéticos del desarrollo embrionario, los mecanismos de envejecimiento, la aparición y desarrollo de enfermedades y la detección de sitios de marcas epigenéticas relacionadas con enfermedades.

El diagrama esquemático del principio de secuenciación de la metilación del genoma completo es el siguiente:

Detección de muestra-interrupción de muestra-construcción de biblioteca-procesamiento de BS-control de calidad de la biblioteca

(1) Prueba de muestras

La prueba de muestras de ADN incluye principalmente dos métodos:

(1) La electroforesis en gel de agarosa analiza el grado de degradación del ADN y la presencia de contaminación. La prueba muestra que la banda principal es obvia y las tiras son claras.

Qubit 2.0 cuantifica con precisión la concentración de ADN y la cantidad total de ADN detectada no es inferior a 1 ug.

(2) Construcción de la biblioteca

Una vez calificada la muestra, utilice el sistema Bioruptor para transferir 1? g La muestra de ADN genómico se mezcló con ADN lambda no metilado y luego se fragmentó hasta un tamaño promedio de aproximadamente 250 pb. Después de la fragmentación, el ADN purificado fragmentado al azar se repara, inactiva y fosforila utilizando una mezcla de ADN polimerasa T4, fragmentos de Klenow y polinucleótido quinasa T4. Posteriormente, el fragmento de ADN de extremos romos se adeniló en 3' con un fragmento de Klenow (3'-5' exo-) y luego se reemplazó la citosina ligada con ADN ligasa T4 con un adaptador ligado a un conector de 5'-metilcitosina. Después de cada paso, el ADN se purifica mediante perlas magnéticas. Luego, use el kit ZYMO EZ DNA Mmethylation Gold de acuerdo con las instrucciones para convertir la citosina no metilada en uracilo. Finalmente, se usó la ADN polimerasa JumpStart Taq para la amplificación por PCR y luego se usaron perlas magnéticas para purificar el producto de la PCR para obtener la biblioteca final.

(3) Control de calidad de la biblioteca

Una vez completada la construcción de la biblioteca, utilice Qubit2.0 para realizar la cuantificación preliminar de la biblioteca y diluirla a 1 ng/ul. Luego, utilice Agilent 2100 para detectar el tamaño de inserción de la biblioteca. Después de que el tamaño de la inserción alcance el tamaño esperado, utilice el método qPCR (concentración efectiva de la biblioteca >: 2 nM) para cuantificar con precisión la concentración efectiva de la biblioteca para garantizar la calidad de la biblioteca.

(4) Secuenciación en la computadora

Después de pasar la prueba de la biblioteca, se agrupan diferentes bibliotecas de acuerdo con los requisitos de concentración efectiva y el volumen de datos fuera de línea objetivo, y luego se secuencian en la Illumina. Plataforma Nova. La estrategia de secuenciación es PE150.

(1) Control de calidad de los datos externos originales

Los datos originales fuera de línea están en formato FASTQ, que es el formato estándar para la secuenciación de alto rendimiento. Los archivos FASTQ contienen una celda cada cuatro líneas y contienen un mensaje de lectura. La ID de la primera línea de la unidad de lectura generalmente comienza con el símbolo @; la segunda línea es el orden de clasificación, es decir, la tercera línea suele ser un signo +, o la misma información que la primera línea; ; la cuarta línea es el valor de calidad de la base, que describe la precisión de la base en la segunda fila. Una base corresponde a un valor de masa base, por lo que la longitud de esta línea es la misma que la de la segunda línea. A continuación se muestra un ejemplo de un mensaje leído:

Los datos originales sin conexión contienen secuencias de adaptadores introducidas durante la construcción de la base de datos y bases de baja calidad. Estos factores conducirán a menos lecturas en el futuro en comparación con los genomas, lo que resultará en menos información y, por lo tanto, en la necesidad de filtrar. Se utilizó el software Trim_galore para realizar pasos de control de calidad en los datos sin procesar, como eliminar secuencias de adaptadores y bases de baja calidad.

(2) Alineación de secuencia

En función de la similitud de secuencia con el genoma de referencia, las lecturas de control de calidad deben compararse con el genoma de referencia.

En comparación con la secuenciación convencional del genoma y del transcriptoma, las características de los datos generados por la secuenciación WGBS determinan tres dificultades principales:

(1) Las hebras positivas y negativas de los fragmentos de ADN se someten a conversión con bisulfito. Ya no habrá complementación inversa, y se generarán cuatro secuencias diferentes después de la PCR, lo que aumentará en gran medida la complejidad computacional de la alineación.

(2) Después de la conversión con bisulfito, la mayoría de las bases C en la secuencia de ADN se convierten en bases T, por lo que la secuencia contiene una gran cantidad de T pero carece de C; la cadena complementaria generada después de la PCR contiene una; Una gran cantidad de a Sin embargo, la falta de g reducirá la complejidad de la secuencia (es decir, las características de composición de la secuencia son más simples), lo que aumentará la dificultad de comparación.

(3) La comparación entre C y T es asimétrica. Después de la conversión con bisulfito, las bases C no metiladas (en su mayoría) de la secuencia se convierten en T, lo que provocará errores de coincidencia entre la secuencia secuenciada y el genoma de referencia. T debe estar alineado tanto con T como con C; y c sólo puede compararse con c, lo que también aumenta la dificultad de la comparación.

Utilice el software BSMAP para comparar. Al comparar BSMAP, utilice la posición de la base C en el genoma de referencia como guía, marque la T correspondiente a la posición de la base C en el genoma de referencia como C y deje la otra T sin cambios, para que las lecturas puedan ser comparado directamente con el genoma de referencia.

(III) Cálculo del nivel de metilación

El nivel de metilación se puede calcular en función de la relación entre las lecturas de C que no se convierte en T y la de C que se convierte en T, es decir:

valor β = C-reads/(C-reads+T-reads)* 100%

Entre ellos, el valor β es el nivel de metilación de la citosina , C-reads es el número de lecturas que respaldan la metilación que cubre el sitio (el sitio se mide como C-reads) y T-reads es el número de lecturas que respaldan la metilación que cubre el sitio (el sitio se mide como T-reads ). El diagrama esquemático del principio de cálculo es el siguiente:

Los niveles de metilación se cuentan a través de BSMAP.

(4) Identificación y estadísticas de regiones metiladas diferencialmente (DMR)

La detección de DMR utiliza software de metileno publicado en revistas autorizadas. El software primero presegmenta el genoma para excluir fragmentos que no contienen sitios CG en secuencias más largas. Luego se utiliza el algoritmo de separación binaria para estrechar recursivamente el rango de detección, y se busca como posible DMR el área con la mayor diferencia de metilación promedio acumulada entre grupos. Finalmente, el DMR preciso se obtiene combinando pruebas estadísticas dobles (prueba MWU y 2D); prueba KS). El principio de detección se muestra en la siguiente figura:

Los estándares para detectar DMR en este análisis son los siguientes:

(1) La diferencia de metilación promedio en la región no es menor que 0.1;

(2)2) El número de sitios CpG no es inferior a 5

(3) La longitud de esta región no es inferior a 50 pb;; >

(4) Diferencias en los niveles de metilación El valor P corregido de la prueba estadística es inferior a 0,05;

(5) El valor p de la prueba 2d ks es inferior a 0,05.

(5) Diagrama de flujo de análisis de información

El contenido central de la investigación genómica de la metilación del ADN radica en la extracción de datos de metilación del ADN. La metilación del ADN generalmente sigue un proceso de tres pasos para la extracción de datos.

En primer lugar, se analizan los cambios de metilación de todo el genoma, incluidos cambios en los niveles medios de metilación, cambios en la distribución del nivel de metilación, análisis de reducción de dimensionalidad, análisis de conglomerados, análisis de correlación, etc.

En segundo lugar, realice un análisis del nivel de diferencia de metilación para detectar genes diferenciales específicos, incluida la identificación de DMC/DMR/DMG, la distribución de DMC/DMR en elementos genómicos, el análisis de unión de TF de DMC/DMR y el tiempo. serie A Estrategias de análisis de datos base y análisis funcional de DMG.

Finalmente, análisis de asociación de metilómica y transcripción, incluida la asociación global de metagenes, la asociación de correspondencia DMG-DEG, la asociación de redes, etc.

Secuencias dúplex de todo el genoma de dos grupos metileno de ADN interconvertibles diferentes en células madre embrionarias de ratón. Estudio proteómico de metilación de células madre embrionarias de ratón en dos condiciones.

1, Antecedentes

Las células madre embrionarias de ratón generalmente se cultivan en una matriz que contiene suero y se denominan células madre séricas. Agregar dos inhibidores de quinasa puede mantener las células madre embrionarias en un estado fundamental pluripotente sin suero, llamadas células madre 2i (2i ESC). Estos dos tipos de células madre embrionarias pueden transformarse entre sí.

En el pasado, la investigación sobre la metilación en este campo se basaba principalmente en la espectrometría de masas, con una cobertura y resultados de investigación limitados. También hay una falta de investigación proteómica sobre la metilación en células madre embrionarias 2i.

2. Métodos

Se utilizó la secuenciación de metilación de bisulfito de genoma completo (WGBS) para estudiar la genómica de metilación de estas dos células madre embrionarias de ratón.

3. Conclusión

Las modificaciones de la metilación del ADN de dos tipos de células madre embrionarias de ratón se detectaron y compararon sistemáticamente de forma exhaustiva y precisa. Las 2iESC masculinas estaban globalmente hipometiladas en comparación con las ESC séricas; en suero, las ESC femeninas eran similares a las 2ESC masculinas en términos de hipometilación global, pero los niveles de metilación se redujeron aún más en el estado de 2ESC.

Lo anterior es una introducción al proceso experimental y las ideas de análisis de la secuenciación de la metilación del genoma completo.

Referencias:

[1] Ashburner, M. y C. A. Ball et al., "Gene Ontology: A Tool for Unifying Biology". Consorcio de Ontología Genética. Nat Genet, 2000, 25 (1): 25-9.

[2] Dirk Schubeler. Función y contenido informativo de la metilación del ADN. Naturaleza, 2015, 517:321–326.

[3] Frank Jühling et al. metileno: Llamada rápida y sensible de regiones metiladas diferencialmente a partir de datos de secuenciación de bisulfito. Investigación del genoma, 2016, 26: 256-262.

[4] Kanehisa M, Goto S. KEGG: Enciclopedia de genes y genomas de Kyoto. Investigación de ácidos nucleicos, 2000, 28(1): 27-30.

[5] Iwamoto Tadafumi Kato Yoshiichi. Análisis completo de metilación e hidroximetilación del ADN en el cerebro humano y sus implicaciones en los trastornos psiquiátricos. Neurofarmacología, 2014, 80: 133-139.

[6] Yang Xiaojing et al. La metilación del genoma puede alterar la expresión genética y es un objetivo terapéutico para el cáncer. Célula cancerosa 26, 577–590.

[7] Yuan Xinxi et al. BSMAP: Programa de mapeo de secuencias de bisulfito de genoma completo BMC Bioinformatics, 2009, 10:232.

[8] Gao, et al. Metilación del ADN durante la embriogénesis previa a la implantación en monos. Resolución celular de abril de 2017; 27(4):526-539.pii: cr201725.