¿Qué es el análisis en serie de la expresión genética?
Análisis en serie de la expresión genética
En 1995, Velculescu et al propusieron la tecnología de análisis en serie de la expresión genética
(SAGE), que puede analizar simultáneamente miles de Se estudiaron las transcripciones.
1. El principio y ruta experimental de SAGE.
1.1 Principio de SAGE
Hay dos bases principales para SAGE. En primer lugar, una etiqueta de secuencia de nucleótidos corta de 9 a 10 bases contiene suficiente información para identificar de forma única una transcripción. Por ejemplo, una secuencia de 9 bases puede distinguir 262.144 transcripciones diferentes (49), y se estima que el genoma humano solo codifica 80.000 transcripciones, por lo que, en teoría, cada etiqueta de 9 bases puede representar la secuencia característica de una transcripción. En segundo lugar, si la etiqueta de 9 bases se puede concentrar en un clon para su secuenciación, y la secuencia de nucleótidos de secuencia corta resultante se puede ingresar en la computadora para su procesamiento en forma de datos continuos, se pueden secuenciar miles de transcripciones de ARNm. .
1.2 Ruta experimental SAGE.
Como se muestra en la Figura 1: (1) La transcripción inversa se utiliza para sintetizar ADNc utilizando oligo(dT) biotinilado como cebador y una endonucleasa de restricción (enzima de anclaje).
Enzima de anclaje,
AE) digestión enzimática. Las enzimas ancladas requieren al menos un sitio de restricción en cada transcrito y, en general, las endonucleasas de restricción de 4 bases pueden cumplir este requisito porque la mayoría de los ARNm tienen más de 256 bases (44). La porción del extremo 3' del ADNc se recogió mediante perlas de estreptavidina. Para cada ARNm, sólo se recoge el fragmento entre su cola poliA y el sitio de escisión enzimática más cercano. (2)
Divida el ADNc en dos partes, A y B, y conecte el adaptador A o el adaptador B respectivamente. Cada adaptador contiene una secuencia del sitio de escisión de la enzima Tagging Enzyme
TE (Tagging Enzyme es una enzima de restricción de tipo II que puede escindir en una posición aproximadamente a 20 bases de distancia del sitio de reconocimiento. Doble cadena de ADN). La estructura del conector es la secuencia del cebador A/B, el sitio de reconocimiento de la enzima marcadora y el sitio de reconocimiento de la enzima de anclaje. (3)
Utilice una enzima marcadora para digerir un fragmento corto de ADNc (aproximadamente de 9 a 10 bases) conectado con un conector, mezcle y conecte los fragmentos cortos de ADNc de los dos grupos de ADNc para formar una etiqueta doble. y luego se amplifican los cebadores A y B. (4)
Utilice una enzima de anclaje para cortar el producto de amplificación, extraer el fragmento, el clon y la secuencia de etiqueta dual (Ditga). Generalmente, cada clon tiene al menos 10 secuencias de etiquetas y el número de etiquetas en un clon oscila entre 10 y 50. (5)
Procesar datos de etiquetas. Cada etiqueta en la secuencia medida está separada por una secuencia de enzima de anclaje. En la Figura 1, la enzima de anclaje usa la endonucleasa de restricción Nia Ⅲ y la secuencia CATG/GTAC se usa para determinar el punto de partida de la etiqueta. Posición inicial y dirección.
Figura 1 Análisis seriado de expresión génica (SAGE)
La enzima de anclaje (AE) y la enzima de etiquetado (TE) son NiaⅢ, FokI
X y O representan las secuencias de nucleótidos de diferentes etiquetas respectivamente
Dado que la longitud de las etiquetas dobles es básicamente la misma, no causará asimetría en la amplificación. Al mismo tiempo, la gran cantidad y tipo de transcripciones permiten la misma etiqueta. para conectarse La posibilidad de etiquetas dobles es extremadamente pequeña, lo que garantiza que cada etiqueta en el clon represente una unidad del producto de transcripción de una transcripción en el estado celular actual. Por lo tanto, se pueden obtener miles de productos de expresión génica a través de software de computadora. análisis de secuencia de etiquetas y abundancia.
Aunque la tecnología SAGE puede recopilar información de expresión genética de tejidos biológicos de la manera más completa posible, no puede garantizar completamente que todos los ARNm de baja abundancia estén cubiertos. Además, la conexión del cuerpo de la etiqueta puede hacer que el clon contenga muy pocos cuerpos de la etiqueta debido a la interferencia del conector, y el final de la secuencia del clon no se puede conectar de manera eficiente al vector. Powell utiliza perlas magnéticas de biotina para adsorber específicamente los cebadores y evitar la interferencia de los adaptadores (Powell
1998).
2. Ventajas y aplicaciones de SAGE
SAGE es una tecnología de investigación de expresión génica rápida y eficaz que puede ser utilizada por cualquier laboratorio con PCR y equipos de secuenciación manual, combinados con secuenciación automatizada. tecnología, puede completar el análisis de 1.000 transcripciones en 3 horas. Además, el uso de diferentes enzimas de anclaje (endonucleasas tipo II que reconocen de 5 a 20 bases) hace que esta tecnología sea más flexible.
En primer lugar, SAGE se puede aplicar a la investigación del genoma humano. En 1995, Velculescu et al. seleccionaron Bsm F I y Nia
Ⅲ como enzimas de etiquetado y enzimas de anclaje respectivamente, y utilizaron computadoras para analizar los datos de etiquetas de 9 bases y buscar en GenBank. De las 1.000 etiquetas analizadas, más de 95 pudieron representar transcripciones únicas. Los niveles de transcripción se dividen en 4 categorías según la frecuencia de aparición de la etiqueta: ①
Más de tres veces ***380, lo que representa 45,2 ② Aparece tres veces ***45, lo que representa 5,4; Apareció dos veces
***351, lo que representa 7,6; ④ solo apareció una vez
***840, lo que representa 41,8. Por lo tanto, SAGE puede extraer de forma rápida y completa información sobre la expresión genética de organismos y realizar análisis cuantitativos de genes conocidos. SAGE también se puede utilizar para encontrar nuevos genes. Aunque la etiqueta SAGE solo incluye 9 bases, la secuencia de 13 bases se puede confirmar agregando la secuencia del sitio de la enzima de anclaje (4 bases). Si una etiqueta no tiene una secuencia homóloga cuando se busca una secuencia conocida, el fragmento de 13 bases se puede utilizar como sonda para seleccionar una biblioteca de ADNc para obtener clones de ADNc.
En segundo lugar, SAGE se puede utilizar para comparar cuantitativamente la expresión genética específica de células tisulares en diferentes estados. Stephen
L et al. (1997) utilizaron la tecnología SAGE para comparar la expresión genética en células de fibra de blastocisto de ratón. Los fibroblastos de blastocisto de ratón pueden producir la proteína supresora de tumores P53 sensible a la temperatura, y las diferencias en la expresión genética a dos temperaturas diferentes se pueden comparar mediante el análisis SAGE.
De aproximadamente 15
genes analizados, se encontró que la expresión de 14 genes dependía de la proteína P53, y la expresión de 3 genes estaba significativamente relacionada con la inactivación de la proteína P53. Zhang et al. (1997) compararon la expresión genética de 300.000 transcritos en células normales y células tumorales y encontraron que entre los 4.500 transcritos analizados, al menos 500 tenían diferencias significativas en la expresión en los dos tejidos celulares.
En tercer lugar, dado que SAGE puede recopilar la información de expresión genética de un genoma en la máxima medida al mismo tiempo, los datos del análisis de transcripción se pueden utilizar para construir mapas de expresión cromosómica (Expresión cromosómica
mapa). Victor et al. analizaron la expresión genética del genoma de la levadura y encontraron 4655 genes a partir de 60633 transcripciones (niveles de expresión distribuidos entre 0,3 y 2,0/célula), de los cuales 1981 genes tienen funciones confirmadas y 2684 no han sido reportadas. El mapa de expresión cromosómica elaborado fusionando información de expresión genética con el mapa del genoma conecta la expresión genética con la estructura física y es más propicio para el estudio de patrones de expresión genética. (Velculescu, 1997)
SAGE es una herramienta eficaz para la investigación cualitativa y cuantitativa sobre la expresión genética, y es muy adecuada para comparar la expresión genética biológica en diferentes estados de desarrollo o estados patológicos. Además, SAGE puede obtener información de expresión genómica casi completa y puede leer directamente la información de expresión genética de cualquier tipo de célula o tejido. La aplicación de la tecnología SAGE acelerará enormemente el progreso de la investigación del genoma, pero debe integrarse y complementarse con otras tecnologías para realizar el estudio más completo de la expresión genética del genoma.