Interacciones celulares en el análisis unicelular-5: comparación de interacciones entre grupos de NicheNet
Cargue los paquetes requeridos.
Lea los datos de la demostración
En esta demostración, se comparan el nicho alto de pEMT y el nicho bajo de pEMT, que es el mismo para diferentes grupos.
Leer en la red de ligandos del receptor NicheNet (25345*688) y la matriz de ligandos del receptor.
Si analiza datos de ratones, primero debe realizar una transformación homóloga del gen.
Cada nicho debe tener al menos un grupo de unidades "remitente/nicho" y un grupo de unidades "receptor/destino".
En este conjunto de datos de demostración, esperamos ver diferencias en el impacto de las células inmunes en las células tumorales en tejidos tumorales con pEMT alto y pEMT bajo. Por lo tanto, "malignant_high" y "malignant_low" se definen como la población de células "receptoras/objetivo" y las otras células se definen como la población de células "remitentes/nicho". NOTA: Las células T y las células mieloides se definen como remitentes solo en muestras con pEMT alto porque el número de estos dos tipos de células es demasiado bajo en muestras con pEMT bajo.
? Es decir, NicheNet puede considerar grupos de células con condiciones específicas al realizar comparaciones entre grupos. (La comparación se realiza entre todos los grupos de unidades del remitente, no entre grupos de unidades específicas).
! IMPORTANTE: ¡El tipo de unidad receptora debe constar de 1 grupo!
En este paso, determinaremos el DE entre diferentes nichos del emisor y del receptor para definir el DE del par L-R.
Lo que tenemos aquí es un par receptor-ligando diferente.
El método por defecto para calcular genes diferenciales es el test de Seurat Wilcoxon (también se pueden utilizar otros métodos).
Como puede ver, primero calcula el DE del remitente: cinco celdas del remitente en alto y tres celdas del remitente en bajo, y luego calcula las celdas del remitente en bajo y cinco celdas del remitente en DE alto.
Luego recibe: Calcula los genes de diferencia de altura y los genes de diferencia de altura de las células tumorales.
La importancia de contar los tipos de células individualmente en lugar de combinar todas las células emisoras y receptoras es evitar que los resultados del análisis diferencial estén impulsados principalmente por células de alta abundancia.
En función del porcentaje de expresión génica en las células, inicialmente se analizan los genes diferenciales. Sólo los genes cuya expresión en las células supere un umbral establecido (10%) se considerarán genes diferenciales comúnmente expresados.
Como se describió anteriormente, los ligandos expresados diferencialmente de una célula emisora se obtienen contando todas las células emisoras en esa muestra y en otra muestra. Por lo tanto, tenemos muchas formas de resumir los ligandos expresados diferencialmente entre tipos de células. Podemos utilizar LFC medio o LFC mínimo. Pero es más recomendable un LFC mínimo. Debido a que es el indicador específico más fuerte para evaluar la expresión del ligando, porque el LFC mínimo alto significa que el ligando se expresa más fuertemente en este tipo de células en el nicho 1 que en todos los tipos de células en el nicho 2 (si se usa el LFC promedio, no puede ser se excluye que una o más células en el nicho 2 también expresen fuertemente el ligando).
Este paso obtiene principalmente el objeto DE_sender_receiver, que es el gen diferencial en diferentes nichos.
Datos del transcriptoma en espacio limitado
En este paso, predecimos la actividad de cada ligando para el tipo de célula receptora en diferentes nichos. (Similar al análisis normal de actividad del ligando de NicheNet).
Para calcular la actividad del ligando, primero necesitamos definir un conjunto de genes de interés en cada nicho. En este ejemplo, el conjunto de genes de pEMT alto son los genes que están regulados positivamente en los tumores con pEMT alto en comparación con los tumores con pEMT bajo. La configuración genética de PEMT-LO se invierte.
Antes de analizar la actividad del ligando, lo mejor es examinar el número de genes en un conjunto de genes. Generalmente se cree que son más adecuados entre 20 y 1.000 genes en el genoma diana para el análisis de la actividad del ligando.
Si hay demasiados genes DE, se recomienda utilizar un umbral lfc_cutoff más alto. Para >2/nichos presentes, recomendamos utilizar un límite de 0,15. Si solo hay dos conjuntos de unidades receptoras/nichos, recomendamos utilizar un umbral más alto (por ejemplo, 0,25). Para datos con una profundidad de secuenciación más profunda, como Smart-seq2, también se recomienda utilizar un umbral más alto.
En estos datos de demostración, utilizamos datos de Smart-seq2 y solo comparamos dos nichos, por lo que utilizamos un umbral de LFC alto para obtener menos genes DE (un umbral más alto da como resultado menos genes DE y es más confiable) .
En este paso, calcularemos la expresión proporcional y las puntuaciones de expresión de receptores, ligandos y genes diana en diferentes poblaciones celulares. Esto se muestra usando DotPlot, pero también se puede mostrar de otras maneras.
En este paso se obtienen tablas de expresión de ligandos, receptores y dianas. Tome exprs_tbl_ligand como ejemplo. Cada tabla contiene el tipo de célula, la cantidad de ligando/receptor/diana expresada en la célula y el porcentaje de expresión.
En este paso, calcularemos las interacciones ligando-receptor en función de la intensidad de la expresión del receptor y calificaremos los receptores para cada ligando en cada tipo de célula; el receptor que se exprese con mayor fuerza en el cuerpo obtendrá la puntuación más alta. Esto no afecta la secuenciación posterior de ligandos individuales, pero nos ayuda a secuenciar los receptores más importantes para cada ligando. (En segundo lugar están otros factores relacionados con el receptor; ver más abajo).
En este paso, combinaremos todos los resultados de los cálculos anteriores para ordenar los enlaces directos ligando-receptor-objetivo. Clasificamos cada atributo de interés entre 0 y 1, y la puntuación de prioridad final es la suma ponderada de las puntuaciones de clasificación de todos los atributos de interés.
Ofrecemos a los usuarios la opción de considerar los siguientes atributos de prioridad (cuyos pesos se definen en prioritizing_weights):
Nota: Estas configuraciones proporcionarán configuraciones DE en comparación con la actividad del cuerpo. los pares de receptores tienen mayor peso. Si lo desea, el usuario puede cambiar esta configuración, al igual que otras configuraciones, si aborda mejor la pregunta biológica específica que desea abordar.
Antes de la visualización, necesitamos definir los pares ligando-receptor más importantes en cada nicho. Primero determinaremos la puntuación más alta para cada par ligando/ligando-receptor. Luego se obtienen los 50 ligandos principales para cada nicho.
Ahora veremos primero los principales pares de KC ligando-receptor (aquí, tomaremos los 2 receptores con mayor puntuación para cada ligando preferido)
Visualización: en comparación con otros campos, LFC es mínimo
Mostrar códigos espaciales como información adicional