Red de conocimientos sobre prescripción popular - Colección de remedios caseros - ¿Se considera bioinformática la tecnología de secuenciación del transcriptoma completo?

¿Se considera bioinformática la tecnología de secuenciación del transcriptoma completo?

No hemos compartido notas sobre el análisis de datos de todo el transcriptoma porque realmente no hay oportunidades de proyectos directos en este campo. Solo hemos intercambiado algunos problemas menores con los fanáticos de la cuenta oficial de WeChat. Un transcriptoma completo no es un transcriptoma completo. El transcriptoma de longitud completa se refiere a la detección de ARNm ordinario, más tres genes no codificantes convencionales, como lncRNA, miRNA y circRNA, mientras que el transcriptoma de longitud completa se refiere al uso de secuenciación de tercera generación y otras tecnologías durante la secuenciación para hacer la base completa de transcripciones de genes La base se puede secuenciar de una sola vez, lo que facilita conocer las diferencias entre diferentes transcripciones empalmadas alternativamente.

Entonces, ¿por qué rara vez involucramos el análisis de datos del transcriptoma completo? La razón principal es que tiene tres genes convencionales no codificantes: lncRNA, miRNA y CircRNA. Como todos sabemos, los genes no codificantes tienen mala reputación y se consideran muy importantes. Sin embargo, no hay evidencia directa de su importancia y no existe una disposición sistemática de bases de datos biológicas como Go y Kegg. y comunicarse con él, generalmente es solo un símbolo.

Pero ya sea que se trate de ARNm ordinario o de los tres genes no codificantes convencionales de lncRNA, miRNA y CircRNA, eventualmente se obtendrá una matriz de expresión, que en realidad es un análisis diferencial convencional. La cuenta oficial de WeChat tuiteó sobre el proceso relevante:

Un artículo es suficiente para explicar las reglas de almacenamiento y descarga de datos geográficos.

Suficiente para interpretar las reglas de la base de datos SRA.

Basta con descargar la matriz de expresiones de la base de datos GEO.

El análisis GSEA es suficiente (versión independiente en lenguaje R)

Análisis de diferencias basado en información de grupo: este artículo no es suficiente

Si se trata de ARNm ordinario , se puede asignar directamente a bases de datos biológicas como go y kegg. Si se trata de un gen no codificante, primero debe localizar su gen objetivo y luego anotar el gen objetivo en bases de datos biológicas como Go y Kegg.

Secuenciación completa del transcriptoma

Por ejemplo, cáncer de mama NPJ. El artículo de diciembre de 2021: "Perfiles de ARN largo de vesícula extracelular plasmática en el diagnóstico del cáncer de mama y predicción de la respuesta al tratamiento" es la secuenciación del transcriptoma completo de dos cohortes:

Cohorte 1: se incluyeron 172 pacientes, de los cuales Había 112 pacientes con cáncer de mama, 19 pacientes con enfermedad mamaria benigna y 41 controles sanos. (Modelo de diagnóstico de tumores)

Cohorte 2: 58 pacientes recibieron terapia neoadyuvante, 24 pacientes en el grupo pCR (respuesta patológica completa) y 34 pacientes en el grupo sin pCR. (Modelo de predicción de eficacia)

Su secuenciación del transcriptoma se encuentra en cb.ac.cn/gsa-human/browse/HRA001985, puede ver:

Secuenciación del transcriptoma

Aunque el artículo trata sobre la secuenciación exLR (exLR-seq) de 172 muestras de plasma de pacientes, se descubrió que el grupo benigno y el grupo de cáncer de mama tenían mRNA, lncRNA, pseudogenes y circRNA más abundantes que el grupo sano.

La cantidad de datos de secuenciación para cada muestra en este artículo no es grande, que es la cantidad de datos para la secuenciación convencional del transcriptoma de ARNm. No detecta específicamente ARNm común para cada muestra, pero agrega tres genes no codificantes convencionales, como lncRNA, miRNA y CircRNA, para obtener un archivo fastq independiente.

Por ello, centramos nuestra atención en dos artículos adicionales de la revista Molecular Cancer.

"circPARD3 impulsa la progresión maligna y la resistencia a los medicamentos en el carcinoma de células escamosas de laringe al inhibir la autofagia a través de la vía PRKCI-Akt-mTOR"

"El ARN circular circo ro 1C regula let-7c - El eje 5p/PBX3 promueve la progresión del carcinoma de células escamosas de laringe》

Esta es una verdadera secuenciación del transcriptoma completo y análisis de datos. Se pueden obtener miARN, circARN, lncARN y ARNm expresados ​​diferencialmente a partir de dos grupos de carcinoma de células escamosas de laringe (LSCC) y mucosa normal adyacente (ANM), y se pueden predecir las vías de señalización y los procesos biológicos en los que participan principalmente moléculas clave.

Chip del transcriptoma completo

Recuerdo que toda la secuenciación del transcriptoma y el análisis de datos discutidos en 2019 todavía eran 8.000 muestras, porque se La información necesaria requiere un análisis de correlación. Actualmente (2022) debería haber menos de 4000 muestras completas de secuenciación del transcriptoma y análisis de datos, pero la secuenciación no es el único medio para obtener información completa del transcriptoma. Otra solución comercial madura es la tecnología de chips, como https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi? ACC = GSE 175962

GPL 20712 Agilent -070156 human. miRNA [versión miRNA]

GPL 21825 074301 array star human circular RNA microarray V2

GPL 26963 Agilent-085982 array star human lncRNA V5 microarray

Tiene tres chips, que en conjunto pueden verse como un transcriptoma completo. Lo que pasa es que los datos del chip de Agilent son más complicados de analizar.

Aprendizaje

Descargue las matrices de expresión de tres chips del conjunto de datos GSE175962 mencionado anteriormente y analice sus diferencias de forma independiente. Luego, consulte los dos artículos de "Molecular Cancer" mencionados anteriormente para analizar las asociaciones entre miRNA, circRNA, lncRNA y mRNA expresados ​​​​diferencialmente, y dibuje varios diagramas de red.

Servicio de crédito

Actualmente, la ngsomics se ha estudiado ampliamente en todos los aspectos de las ciencias de la vida, pero los diseños experimentales más comunes, como la diferencia entre cáncer y cáncer, y el tratamiento farmacológico del paciente. La diferencia en eficacia antes y después ha sido detectada por la multiómica. En otras palabras, si su pensamiento se detiene aquí, la multiómica no puede bendecirle. Pero si sus superficiales habilidades de diseño experimental no se ven superadas por la tecnología de secuenciar todo el transcriptoma, después de todo, es común analizar cada muestra.