¿Alguien sabe qué son los genes superpuestos en genética? ¿Qué es la fragmentación genética?
Genes superpuestos
Los genomas de los procariotas y algunos virus o fagos son relativamente pequeños y tienen pares de nucleótidos extremadamente limitados. Entonces, ¿cómo utilizar eficazmente estas bases limitadas para codificar más información genética? ? En biología existe un mecanismo muy inteligente: la superposición de genes. Su verdad es como nuestro antiguo palíndromo, como por ejemplo:
El Hombre Loto en Luyangjin
Cai Yi
El nuevo canto del cisne de Yushu Shengge
p>Su pronunciación es: Los recolectores de loto están en Luyangjin. Hay una nueva canción en Luyangjin llamada Singing Jade es el recolector de loto. Un poema que solía requerir 28 palabras para expresarse ahora puede completarse en sólo 14 palabras aprovechando la superposición de varias palabras entre la primera y la segunda oración. Lo mismo ocurre con los genes superpuestos, que utilizan la superposición de bases para codificar más información.
Los genes superpuestos se descubrieron por primera vez en 1977, cuando el famoso científico estadounidense Sanger estableció un método de secuenciación. Utilizó este método de secuenciación para secuenciar el fago monocatenario circular F×174. El genoma resultante consta de 5386 nucleótidos, **contiene 11 genes, constituye tres unidades de transcripción y es iniciado por tres promotores (pA, pB, pD). (Figura 10-4) El producto de este gen ha sido completamente aislado y sus aminoácidos han excedido con creces la cantidad que pueden codificar 5386 bases. Es decir, el 5386Nt contenido en F-174 puede codificar hasta 1795 aminoácidos. . Si el peso molecular promedio de cada aminoácido es 110, compare todas las secuencias de ADN con la secuencia de aminoácidos de la proteína y encuentre que el gen B está en el gen A0, y el gen K atraviesa la unión del gen A-C, con el cola del gen A0 y la cabeza del gen C Superposición parcial, el gen E está en el gen D. Situaciones similares se han encontrado en otros bacteriófagos como G4, parvovirus y SV40. Los genes superpuestos no sólo permiten la utilización económica del genoma sino que también funcionan como reguladores de la expresión.
Los genes superpuestos sólo existen en fagos y virus y no se han encontrado en eucariotas. Esto puede deberse a que el genoma del primero es relativamente pequeño, pero debe codificar algunos genes para sustentar su vida y reproducción. Bajo presión de selección, se conservó esta forma de genes superpuestos.
Antes de la década de 1970, la gente siempre creía que el material genético era ADN bicatenario y que los genes dispuestos en él eran continuos. Robert y Sharp revolucionaron esta percepción. Utilizaron adenovirus como objetivo experimental porque su secuencia es muy cercana a la de otros animales superiores, incluidos los humanos. Se descubrió que la disposición de sus genes en el ADN estaba separada por algunos segmentos no relacionados y era discontinua.
Su descubrimiento ha cambiado la comprensión previa de los científicos sobre la evolución, juega un papel importante en la investigación básica sobre la biología moderna y la teoría de la evolución biológica, y también es de gran importancia en la investigación médica sobre tumores y otras enfermedades genéticas.
El genoma de los eucariotas es muy complejo y el contenido de ADN es mucho mayor que el de los procariotas. Debido a que el genoma del fago es muy pequeño, codifica algunas proteínas necesarias y las bases obviamente no son suficientes, por lo que no solo casi todas las bases están involucradas en la codificación, sino que también aparecieron "genes superpuestos" durante la evolución, utilizando genes limitados para codificar. más información genética. El genoma de los eucariotas es rico en ADN y no requiere "genes superpuestos". Muchas secuencias no están codificadas, como las secuencias repetidas, las secuencias espaciadoras y las secuencias de inserción, es decir, los intrones. Pero no codificar no significa que no haya funcionalidad. Algunas quizás aún no las sepamos, como la repetición de secuencias. Los conceptos de secuencias espaciadoras y secuencias de inserción son diferentes. Los espaciadores se refieren a las partes no codificadas entre genes, algunos se transcriben como espaciadores transcritos internos (TS) y otros no se transcriben como espaciadores no transcritos internamente (NTS). Las secuencias entrelazadas se refieren a regiones no codificantes dentro de los genes, también conocidas como intrones. Esta secuencia está presente en la transcripción original pero se elimina después del procesamiento, por lo que a menudo no se incluye como información de traducción. La región espaciadora suele contener el promotor de la transcripción y otras secuencias reguladoras aguas arriba. También pueden codificarse algunos intrones, como enzimas maduras y endonucleasas.
En genética, los genes que codifican proteínas suelen denominarse genes estructurales. Los genes estructurales de los eucariotas son genes de ruptura. Un gen roto puede contener varias secuencias codificantes, llamadas exones.
Los dos exones están separados por una secuencia espaciadora no codificada llamada intrón. Cada gen roto tiene una región no codificante fuera del primer y último exón, llamada secuencia flanqueante. Hay una serie de secuencias reguladoras en las secuencias flanqueantes (Figura 3-3).
Existen principalmente las siguientes secuencias reguladoras: ① Hay una caja TATA aproximadamente de 20 a 30 nucleótidos aguas arriba del punto de inicio de la transcripción 5'-terminal. La caja TATA es una secuencia de nucleótidos muy corta y su secuencia de bases es TATAATAAT. La caja TATA es una secuencia en el promotor y es un punto de contacto importante para la ARN polimerasa, lo que permite a la enzima identificar con precisión el punto de inicio de la transcripción y comenzar la transcripción. Cuando cambia la secuencia de bases en la caja TATA, la transcripción del ARNm comienza desde una posición anormal. ②Hay una caja CAAT aproximadamente de 70 a 80 nucleótidos aguas arriba del punto de inicio de la transcripción del terminal 5'. La caja CAAT es otra secuencia corta de nucleótidos en el promotor y su secuencia de bases es GGCTCAATCT. La caja CAAT es otro punto de unión de la ARN polimerasa. Su función es incierta, pero generalmente se cree que controla la frecuencia de inicio de la transcripción sin afectar el punto de inicio de la transcripción. Cuando se cambia esta secuencia, la cantidad de ARNm formado se reduce significativamente. ③ Hay alrededor de 100 nucleótidos aguas arriba del punto de inicio de la transcripción del terminal 5'. Parte de la secuencia puede mejorar la actividad de la transcripción y puede aumentarla cien veces, por lo que se llama potenciador. Cuando estas secuencias están ausentes, los niveles de transcripción pueden reducirse considerablemente. Las investigaciones muestran que los potenciadores suelen ser específicos de cada tejido, porque diferentes núcleos celulares tienen diferentes factores específicos que se unen a los potenciadores, produciendo así diferentes efectos reguladores sobre la expresión genética en diferentes tejidos y órganos. Por ejemplo, hay un potenciador específico de tejido aproximadamente 250 nucleótidos aguas arriba del extremo 5' del gen de la insulina humana. Hay un factor proteico específico en las células beta de la insulina que puede actuar en esta región para mejorar la transcripción del gen de la insulina. Otros tejidos y células no tienen este factor proteico, por lo que no tienen este efecto. Ésta es una razón importante por la que el gen de la insulina sólo puede expresarse bien en las células beta de la insulina. ④ Hay una secuencia de nucleótidos AATAAA aguas abajo del código de terminación del terminal 3', que puede desempeñar un papel importante en la adición de la cola del ARNm (la adición de poli A a la cola del ARNm). Más abajo de esta secuencia hay repeticiones invertidas. Esta secuencia se puede transcribir para formar una estructura en horquilla (Figura 3-4). La estructura en horquilla dificulta el movimiento de la ARN polimerasa. Dado que el enlace de hidrógeno entre la cadena de U al final de la estructura en horquilla y la cadena de A en el ADN plantilla de transcripción es débil, la hibridación entre el ARNm y el ADN es inestable y el ARNm se desprenderá de la plantilla y el La ARN polimerasa también se desprenderá del molde, se disocia del ADN y finaliza la transcripción. La secuencia AATAAA y sus secuencias repetidas invertidas posteriores se denominan colectivamente terminadores, que son señales para la terminación de la transcripción.