¿Se considera bioinformática la tecnología de secuenciación del transcriptoma completo?
Entonces, ¿por qué rara vez involucramos el análisis de datos del transcriptoma completo? La razón principal es que tiene tres genes convencionales no codificantes: lncRNA, miRNA y CircRNA. Como todos sabemos, los genes no codificantes tienen mala reputación y se consideran muy importantes. Sin embargo, no hay evidencia directa de su importancia y no existe una disposición sistemática de bases de datos biológicas como Go y Kegg. y comunicarse con él, generalmente es solo un símbolo.
Pero ya sea que se trate de ARNm ordinario o de los tres genes no codificantes convencionales de lncRNA, miRNA y CircRNA, eventualmente se obtendrá una matriz de expresión, que en realidad es un análisis diferencial convencional. La cuenta oficial de WeChat tuiteó sobre el proceso relevante:
Un artículo es suficiente para explicar las reglas de almacenamiento y descarga de datos geográficos.
Suficiente para interpretar las reglas de la base de datos SRA.
Basta con descargar la matriz de expresiones de la base de datos GEO.
El análisis GSEA es suficiente (versión independiente en lenguaje R)
Análisis de diferencias basado en información de grupo: este artículo no es suficiente
Si se trata de ARNm ordinario , se puede asignar directamente a bases de datos biológicas como go y kegg. Si se trata de un gen no codificante, primero debe localizar su gen objetivo y luego anotar el gen objetivo en bases de datos biológicas como Go y Kegg.
Secuenciación completa del transcriptoma
Por ejemplo, cáncer de mama NPJ. El artículo de diciembre de 2021: "Perfiles de ARN largo de vesícula extracelular plasmática en el diagnóstico del cáncer de mama y predicción de la respuesta al tratamiento" es la secuenciación del transcriptoma completo de dos cohortes:
Cohorte 1: se incluyeron 172 pacientes, de los cuales Había 112 pacientes con cáncer de mama, 19 pacientes con enfermedad mamaria benigna y 41 controles sanos. (Modelo de diagnóstico de tumores)
Cohorte 2: 58 pacientes recibieron terapia neoadyuvante, 24 pacientes en el grupo pCR (respuesta patológica completa) y 34 pacientes en el grupo sin pCR. (Modelo de predicción de eficacia)
Su secuenciación del transcriptoma se encuentra en cb.ac.cn/gsa-human/browse/HRA001985, puede ver:
Secuenciación del transcriptoma
Aunque el artículo trata sobre la secuenciación exLR (exLR-seq) de 172 muestras de plasma de pacientes, se descubrió que el grupo benigno y el grupo de cáncer de mama tenían mRNA, lncRNA, pseudogenes y circRNA más abundantes que el grupo sano.
La cantidad de datos de secuenciación para cada muestra en este artículo no es grande, que es la cantidad de datos para la secuenciación convencional del transcriptoma de ARNm. No detecta específicamente ARNm común para cada muestra, pero agrega tres genes no codificantes convencionales, como lncRNA, miRNA y CircRNA, para obtener un archivo fastq independiente.
Por ello, centramos nuestra atención en dos artículos adicionales de la revista Molecular Cancer.
"circPARD3 impulsa la progresión maligna y la resistencia a los medicamentos en el carcinoma de células escamosas de laringe al inhibir la autofagia a través de la vía PRKCI-Akt-mTOR"
"El ARN circular circo ro 1C regula let-7c - El eje 5p/PBX3 promueve la progresión del carcinoma de células escamosas de laringe》
Esta es una verdadera secuenciación del transcriptoma completo y análisis de datos. Se pueden obtener miARN, circARN, lncARN y ARNm expresados diferencialmente a partir de dos grupos de carcinoma de células escamosas de laringe (LSCC) y mucosa normal adyacente (ANM), y se pueden predecir las vías de señalización y los procesos biológicos en los que participan principalmente moléculas clave.
Chip del transcriptoma completo
Recuerdo que toda la secuenciación del transcriptoma y el análisis de datos discutidos en 2019 todavía eran 8.000 muestras, porque se La información necesaria requiere un análisis de correlación. Actualmente (2022) debería haber menos de 4000 muestras completas de secuenciación del transcriptoma y análisis de datos, pero la secuenciación no es el único medio para obtener información completa del transcriptoma. Otra solución comercial madura es la tecnología de chips, como https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi? ACC = GSE 175962
GPL 20712 Agilent -070156 human. miRNA [versión miRNA]
GPL 21825 074301 array star human circular RNA microarray V2
GPL 26963 Agilent-085982 array star human lncRNA V5 microarray
Tiene tres chips, que en conjunto pueden verse como un transcriptoma completo. Lo que pasa es que los datos del chip de Agilent son más complicados de analizar.
Aprendizaje
Descargue las matrices de expresión de tres chips del conjunto de datos GSE175962 mencionado anteriormente y analice sus diferencias de forma independiente. Luego, consulte los dos artículos de "Molecular Cancer" mencionados anteriormente para analizar las asociaciones entre miRNA, circRNA, lncRNA y mRNA expresados diferencialmente, y dibuje varios diagramas de red.
Servicio de crédito
Actualmente, la ngsomics se ha estudiado ampliamente en todos los aspectos de las ciencias de la vida, pero los diseños experimentales más comunes, como la diferencia entre cáncer y cáncer, y el tratamiento farmacológico del paciente. La diferencia en eficacia antes y después ha sido detectada por la multiómica. En otras palabras, si su pensamiento se detiene aquí, la multiómica no puede bendecirle. Pero si sus superficiales habilidades de diseño experimental no se ven superadas por la tecnología de secuenciar todo el transcriptoma, después de todo, es común analizar cada muestra.