Secuenciación del genoma

Pregunta 1: Utilice la ruta técnica de secuenciación del genoma completo para extraer ADN genómico, luego interrumpa aleatoriamente la electroforesis para recuperar fragmentos de ADN de la longitud requerida (0,2 ~ 5 Kb) y luego prepare grupos de genes o amplificación electrónica mediante E-PCR. Finalmente, los fragmentos insertados se secuencian mediante métodos de extremos emparejados (Solexa) o de extremos emparejados (SOLiD). Luego, las secuencias medidas se ensamblan en Contigs, que se pueden ensamblar aún más en estructuras según la distancia entre los extremos emparejados, que luego se pueden ensamblar en cromosomas, etc. El efecto de ensamblaje está relacionado con la profundidad, la cobertura y la calidad de la secuenciación. Los ensamblajes de uso común incluyen: SOAPdenovo, Trimity, Abyss, etc.

Pregunta 2: ¿Cuánto cuesta volver a secuenciar el genoma completo de una persona? El tamaño del genoma humano es 3G. Generalmente, es necesario medir al menos 20x datos antes de volver a secuenciar (si el multiplicador de datos es alto, es útil para el análisis de información. En otras palabras, generalmente es necesario medir 60G de). datos Si 1G se calcula en 5.000 yuanes, costará 30 Diez mil yuanes.

Pero depende de su propósito. My-seq lanzado por Illumina parece costar solo decenas de miles para probar a una persona.

Pregunta 3: ¿Qué es la tecnología de secuenciación del genoma? Desde la creación de Celera Genetics en 1998, la investigación del genoma humano ha sido realizada simultáneamente por dos científicos: el Proyecto Genoma Humano financiado con fondos públicos y Celera Genetics de Estados Unidos. Durante el estudio, también utilizaron dos métodos diferentes de secuenciación y análisis. El método de análisis central de Celera se llama método de escopeta y el Proyecto Genoma Humano utiliza el método de clonación.

El llamado método de escopeta es en realidad un método altamente informatizado. Primero, el genoma se divide aleatoriamente en fragmentos de longitud conocida (2000 pares de bases, 10000 pares de bases, 50000 pares de bases) y luego se utiliza un algoritmo matemático para ensamblar estos fragmentos en fragmentos adyacentes y determinar su ubicación correcta en el genoma.

Los científicos de Celera primero secuenciaron el ADN utilizando el método de la escopeta, cubriendo todo el genoma ocho veces, y luego utilizaron dos fórmulas matemáticas para ensamblar la secuencia del genoma humano varias veces para determinar las unidades de transcripción en el gen y predijeron el genoma humano. funciones moleculares del 60% de los genes identificados. Finalmente, los investigadores compararon la información del genoma humano con las secuencias del genoma de Drosophila y C. elegans previamente completadas y descubrieron las funciones principales de los tres.

Sin embargo, la regla de clonación adoptada por el Proyecto Genoma Humano es copiar secuencias de genes humanos más grandes y luego mapearlas en regiones apropiadas del genoma para su estudio. Este enfoque requiere que los investigadores dediquen más tiempo y esfuerzo desde el principio a la clonación y el boceto.

Científicos del Proyecto Genoma Humano y editores senior de Science and Nature compararon y evaluaron los datos obtenidos por los dos grupos de investigación. Los resultados muestran que, aunque existen ciertas diferencias entre el análisis del genoma de Celera y el análisis de ingeniería del genoma humano, existe un alto grado de superposición en la mayoría de los lugares.

Las secuencias determinadas por Celera cubren más del 95% del genoma humano, y aproximadamente el 85% del genoma humano existe en fragmentos de al menos 500.000 pares de bases dispuestos en el orden correcto. Esta secuencia proporciona pruebas sólidas de la existencia de al menos 26.383 genes que controlan la síntesis de proteínas en humanos, y pruebas débiles de la existencia de 1,275438+0,000 genes hipotéticos adicionales.

Pregunta ¿Cuáles son las ventajas de la secuenciación de ARN en comparación con la secuenciación del genoma completo? La secuenciación de ARN, también conocida como RNA-seq, generalmente se refiere a la secuenciación del transcriptoma, que solo mide las transcripciones dentro de las células. Sólo se puede detectar la porción transcrita del genoma. Generalmente se utiliza para encontrar genes expresados ​​diferencialmente y descubrir genes nuevos. La secuenciación del genoma es una medición del genoma completo, independientemente de si está transcrito o no, y se usa comúnmente para el ensamblaje, la resecuenciación y la genotipificación del genoma.

Estas son dos cosas fundamentalmente diferentes, una mide el transcriptoma y la otra mide el genoma. La diferencia entre ellos es la diferencia entre transcriptoma y genoma. En cuanto a los méritos, júzgalos según tus propios propósitos.

Preguntas son bienvenidas.

Pregunta 5: ¿Cuál es la importancia de la secuenciación del genoma personal? Teóricamente, conocer la secuencia puede determinar los genes de la persona, conociendo así las características fenotípicas de la persona, o a qué enfermedades es susceptible, qué enfermedades puede contraer en el futuro y qué enfermedades puede heredar en el futuro...

Pero actualmente todo el genoma de un individuo es inútil porque sabemos muy poco sobre la información de la secuencia del genoma, como las enfermedades relacionadas con SNP y las enfermedades genéticas poligénicas. La secuenciación del genoma completo en la investigación científica puede proporcionarnos una base de datos para analizar características relevantes.

Con el éxito de la secuenciación de Corea del Sur cuyo nombre en código es AK1, sólo cinco personas en el mundo han completado la secuenciación completa del genoma. Las otras cuatro personas son: James, un hombre yoruba de África y pionero en la investigación genética. ? ¿Watson, Krieger? Venter y un chino con nombre en código YH.

Pregunta 6: ¿Cuál es la profundidad de secuenciación del genoma? La profundidad de secuenciación del genoma es generalmente 10X.

La profundidad de secuenciación se refiere a la relación entre el número total de bases obtenidas mediante la secuenciación y el tamaño del genoma que se va a probar. Suponiendo que el tamaño de un gen es 2M y la profundidad de secuenciación es 10X, la cantidad total de datos obtenidos es 20M.

La secuenciación de genes es una nueva tecnología de pruebas genéticas que puede analizar y determinar toda la secuencia genética de la sangre o la saliva para predecir la posibilidad de sufrir diversas enfermedades, características de comportamiento individuales y si el comportamiento es razonable, como cáncer o leucemia, atletismo, bebida, etc.