Métodos de análisis unicelular

Durante los últimos 10 años, se han desarrollado una variedad de métodos unicelulares, con diferentes enfoques que afectan la captura y expansión de las células y la profundidad de lectura de cada celda [2]. Cada método tiene sus propias ventajas y desventajas, pero en general, todas las tecnologías scRNA-seq desarrolladas hasta la fecha comparten el mismo flujo de trabajo: preparación de muestras, captura de células individuales, transcripción y amplificación inversa, preparación de bibliotecas, secuenciación y análisis[3].

1. Preparación de muestras (aislamiento celular)

El flujo de trabajo experimental general para la secuenciación de ARN unicelular comienza con la disociación del órgano o tejido de interés. La preparación adecuada de la muestra es un requisito previo para generar buenos datos transcriptómicos unicelulares. Un paso crítico en el proceso de preparación de muestras, especialmente para tejidos densos, es la disociación de células individuales, que generalmente se logra enzimáticamente con agitación mecánica suave (y en algunos casos mediante perfusión tisular) para limitar la celularidad excesiva y el ruido de fondo [4]. La selección de enzimas proteolíticas (p. ej., tripsina, colagenasa o enzimas liberadoras) y el tiempo de digestión también deben optimizarse cuidadosamente para maximizar el rendimiento de las células individuales y minimizar la muerte celular.

2. Aislamiento de células individuales

Los primeros métodos para la captura de células individuales incluían micropipeta, micromanipulación y microdisección por captura con láser [26-27]. En comparación con varios métodos utilizados actualmente, estos métodos tienen un rendimiento bajo, una alta dificultad técnica y requieren mucho tiempo y mano de obra, pero aún pueden usarse cuando la cantidad de células a analizar es pequeña (como células raras). .

La clasificación de células activadas por fluorescencia (FACS) es un tipo especial de citometría de flujo que proporciona una manera de clasificar diferentes tipos de células, una a la vez, según el tamaño celular y la fluorescencia. Tiene un mayor rendimiento y una velocidad más rápida que los métodos anteriores [29]. Las posibles limitaciones de la citometría de flujo incluyen la necesidad de anticuerpos específicos que pueden interferir con el análisis posterior, pero también la necesidad de grandes cantidades de material de entrada (microlitros o incluso mililitros), lo que dificulta el aislamiento de cantidades muy pequeñas de muestra o células raras [29 ].

La llegada de los dispositivos de microfluidos los ha hecho preferidos para el aislamiento celular porque requieren volúmenes más pequeños de reactivos que FACS y otros métodos utilizados anteriormente. En los dispositivos de microfluidos, el flujo hidrodinámico permite que las células se separen y procesen en canales que van desde decenas a cientos de micrones, por lo que pueden ser comparables en tamaño al de las células. Además, los dispositivos de microfluidos pueden automatizar la secuenciación de algunas reacciones de procesamiento de ARN posteriores y permitir la medición y el control de las concentraciones de reactivos extracelulares [30]. Existen otras técnicas y plataformas de separación, como se detalla en el resumen [31].

2. Captura de ARNm

Cuando las células están completamente separadas, los ARNm maduros deben capturarse, transcribirse de forma inversa a ADNc y amplificarse. El método de captura celular a menudo depende de las propiedades de la muestra de interés (por ejemplo, tamaño de la celda). Actualmente, la tecnología scRNA-seq se puede clasificar según el método de aislamiento y captura de células individuales, y diferentes métodos determinan diferentes rendimientos, escala y profundidad de secuenciación. La eficiencia de la captura celular depende del protocolo utilizado. Muchos dispositivos utilizan códigos de barras específicos que permiten la captura de múltiples células y ARNm simultáneamente. Este proceso se llama "multiplexación". Por ejemplo, en los métodos Drop y Drop-Seq, la preparación de ADNc con código de barras está contenida en las gotas.

3. Transcripción inversa y amplificación por PCR

Normalmente se utilizan cebadores de ácido oligodesoxirribonucleico para la RT del ARNm. Esto se hace para evitar atrapar otros ARN estructurales, como el ARN ribosómico y el ARN de transferencia, que constituyen la mayoría del ARN celular. Sin embargo, el uso de cebadores de ácido oligodesoxirribonucleico adolece del problema de una baja eficacia de captura. Se ha informado que para los protocolos actuales, la eficiencia de captura es aproximadamente del 10 al 15 % [28].

4. Preparación de la biblioteca

Una vez capturadas con éxito las células individuales, se lisan para generar el ADNc de la primera cadena mediante transcripción inversa y luego se procede a la síntesis de la segunda cadena y la PCR. amplificación. Algunos métodos scRNA-seq (como el sistema Fluidigm C1) requieren tantas reacciones de amplificación por PCR como el número de células analizadas, pero otras tecnologías (como los métodos basados ​​en gotas) permiten la PCR híbrida utilizando tecnología de códigos de barras celulares (como la genómica 10x). , lo que reduce los costos y aumenta los rendimientos [5].

4. Secuenciación

5. Mapeo

Realice una secuenciación de próxima generación y genere datos sin procesar. Cuando se complete la captura de una sola célula, la preparación de la biblioteca y la secuenciación. es decir, los datos sin procesar se pueden leer y comparar.

Las herramientas de mapeo desarrolladas originalmente para RNA-seq por lotes también son aplicables a los datos de scRNA-SEQ. Hay una variedad de herramientas de mapeo disponibles para comparar datos de RNA-seq. Las herramientas de alineación actualmente populares, como TopHat2, STAR y HISat, funcionan bien en términos de velocidad y precisión. Pueden comparar eficazmente miles de millones de lecturas con genomas o transcriptomas de referencia. STAR es un método basado en matrices de sufijos que es más rápido que TopHat2, pero requiere más memoria [22]. HISAT se desarrolla basándose en los métodos BWT y Ferragina-Manzini (FM). La investigación de Kim et al. muestra que HISat es actualmente la herramienta más rápida y puede lograr la misma o mayor precisión que otros alineadores disponibles [23].

El software universal de comparación de lectura RNA-seq STAR se puede utilizar para generar matrices de códigos de barras de características a través de plataformas disponibles públicamente, como Cell Ranger de 10x Genome Company. También puede utilizar Cell Ranger para filtrar y contar códigos de barras y UMI. Cellranger, dropEst, Dr.seq2 y scPipe se pueden utilizar para generar matrices de expresión.

6. Cuantificación de transcripciones

La capacidad de cuantificar con precisión la abundancia de transcripciones se ve obstaculizada por un alto grado de variabilidad técnica causada por los diferentes pasos de procesamiento. Actualmente, posibles soluciones a estos problemas son la adición de estándares cuantitativos como la incorporación o identificadores moleculares únicos (UMIS).

Los Spike-ins son transcritos de ARN de secuencia y cantidad conocidas que se añaden a los lisados ​​celulares en determinadas cantidades para calibrar la medición del análisis de hibridación del ARN. Después del aislamiento celular, realice todos los pasos experimentales. El propósito de utilizar estas moléculas es proporcionar información sobre la relación entre la cantidad de moléculas de entrada y la cantidad de lecturas de secuenciación observadas. El conjunto de insertos más popular es el ARN sintético de 92 isoformas individuales de ERCC [32]. Un factor que complica el uso de picos es que normalmente se agregan a muestras unicelulares en concentraciones relativamente altas, por lo que representan una proporción relativamente grande de las lecturas. Por lo tanto, no todos los protocolos se pueden adaptar para su uso, como las tecnologías basadas en gotas.

Otro estándar cuantitativo utilizado en scRNA-seq es el UMI. Son secuencias de nucleótidos que varían de 4 a 12 nucleótidos de longitud que se incorporan a los cebadores antes de la transcripción inversa para marcar de forma única el extremo 5' o 3' de cada copia individual de ARNm de cada transcripción. La probabilidad de que el mismo ARNm y el mismo UMI estén conectados es casi nula, por lo que podemos ignorar el error provocado por la PCR. Para un tipo de ARNm, el número de medición UMI puede considerarse aproximadamente como el número de expresión del ARNm. La idea básica es que cada transcripción se pueda cuantificar en función del número de UMI diferentes, evitando así el sesgo causado por la amplificación por PCR. Para evitar subestimar el número de transcripciones sin procesar de genes altamente expresados, la longitud n del UMIS debe elegirse de modo que el número de códigos de barras únicos sea mayor que el número de transcripciones expresadas en el nivel más alto [28]. Los protocolos basados ​​en UMI eliminan los sesgos relacionados con la amplificación y la profundidad de secuenciación porque múltiples lecturas de la misma transcripción asociada con el mismo UMI se contraen en un recuento único. Sin embargo, esto sólo es cierto si todas las bibliotecas se secuencian con una profundidad suficiente para que cada molécula marcada de forma única se observe al menos una vez. De lo contrario, algunas moléculas de ADNc marcadas con UMI pueden perderse [33].

Debido a diferencias de protocolo inherentes, la adición y UMIS no son adecuados para todas las tecnologías scRNA-seq. Los picos se utilizan en los métodos Smart-seq2 y Super-seq, pero no son compatibles con los métodos basados ​​en gotas, mientras que UMIS se utiliza habitualmente en tecnologías de secuenciación de extremo 3' (como Drop-Seq, InDrop y Mars-Seq ). Por lo tanto, los usuarios pueden elegir un método scRNA-seq apropiado en función de las características y ventajas técnicas, la cantidad de células que se secuenciarán y las consideraciones de costo.

Para la cuantificación de la expresión de genes/transcripciones, se requieren diferentes métodos dependiendo del rango de secuencias de transcripción capturadas por scRNA-seq.

Los datos generados mediante métodos de scRNA-seq de transcripción completa (como Smart-seq2 y MATQ-seq) se pueden analizar mediante un software desarrollado para RNA-seq por lotes para cuantificar la expresión de genes/transcripción.

① Las herramientas de ensamblaje del genoma actualmente populares, incluidas Cufflinks, RSEM y Stringtie, se han utilizado ampliamente en muchos estudios de scRNA-seq para obtener estimaciones de expresión de genes/transcripciones relevantes. Entre ellos, Pertea et al. [24] señalaron que StringTie es superior a otras herramientas en la reconstrucción de genes/transcripciones y en la cuantificación de la expresión.

Para los esquemas de scRNA-seq del extremo 3' (como CELseq2, MARS-seq, Drop-Seq e InDrop), se requiere un algoritmo especial para calcular la expresión de gen/transcripción basada en UMIS.

①SAVER es una herramienta eficaz basada en UMI que puede estimar con precisión la expresión genética de células individuales [25].

Para garantizar datos de scRNA-seq de alta calidad, es muy importante desagregar el tejido en células individuales antes de la captura celular. Los principales desafíos en la preparación de células individuales incluyen la fragilidad de la muestra inicial, el estrés físico, la selección del tampón, la duración de la disociación celular y el rendimiento de las células individuales [18]. Para scRNA-seq basado en gotas, se deben preparar poblaciones unicelulares viables antes de la captura unicelular, y se deben eliminar los agregados o grupos de células, los restos de células muertas y el ARNm que flota libremente. Los métodos tradicionales de aislamiento de células son suficientes para preparaciones unicelulares, pero la eficiencia de la hidrólisis enzimática del tejido naciente en células individuales viables debe optimizarse para evitar la pérdida de poblaciones de células frágiles o propensas a la muerte. La composición de la matriz extracelular y el tipo de tejido pueden afectar la selección de enzimas digestivas, la temperatura y la duración de la digestión, y el método de hidrólisis enzimática debe seleccionarse y optimizarse en función del tejido original [15].

Se recomienda marcar las células vivas con calceína etoximetilo y otros colorantes inmediatamente después de la disociación, y luego usar citometría de flujo (FACS) para realizar una selección positiva en las células vivas, mientras que algunos colorantes que se unen a ácidos nucleicos, como El yoduro de propidio puede unirse a ácidos nucleicos bicatenarios que flotan libremente y la citometría de flujo puede separar células vivas mediante selección negativa [4]. El uso de soluciones comerciales de eliminación de desechos celulares durante la preparación de células individuales puede ayudar a mejorar la limpieza de la muestra y la precisión del recuento de células objetivo, especialmente para la preparación de células con una tasa de supervivencia inferior al 70% [4].

1. Método de las gotas: El método de las gotas utiliza tecnología de códigos de barras de ADN para analizar células individuales envueltas en gotas de aceite, lo que reduce en gran medida el tiempo y el coste necesarios para cada análisis. El análisis a gran escala permite el análisis de hasta aproximadamente 10.000 células por muestra [11]. Por lo tanto, tiene las características de alto rendimiento y alta eficiencia de captura. Y puede proporcionar un mayor rendimiento celular y menores costos de secuenciación celular. Por lo tanto, los protocolos basados ​​en gotitas son adecuados para generar una gran cantidad de células para identificar subpoblaciones celulares en muestras complejas de tejido o tumores.

Entre ellos, 10x Genomics puede realizar la secuenciación unicelular del extremo 3' o del extremo 5', con mayor escala y rendimiento en comparación con los métodos de placa o microfluidos. La profundidad de lectura de cada celda está entre 10000 y 100000 [13]. Los métodos basados ​​en gotas cuantifican las transcripciones mediante secuenciación 3' o 5'. Recuperación de transcripción reducida (3-10%) en comparación con otros métodos existentes (10-20%) [12].

La tasa de detección de células y la eficiencia de captura de ARNm son bajas. La sensibilidad y la profundidad de lectura también son deficientes, pero su sensibilidad sigue siendo suficiente para el análisis a gran escala de muestras heterogéneas complejas y se espera que mejore a medida que los métodos se optimicen continuamente y se reduzcan los costos.

2. Método de placa o método de micropocillos: si el número de células en el experimento no es grande, puede considerar el método de placa para clasificar las células en placas de varios pocillos que contienen cebadores de PCR para la construcción de la biblioteca. La captura de células es rentable pero tiene una alta tasa de detección [1]. Además, estos métodos admiten la secuenciación de extremos 3'/5' y la secuenciación de transcripciones completas. Los protocolos basados ​​en placas o microplacas utilizan micropipetas automatizadas o clasificación de células activadas por fluorescencia (FACS) para aislar células individuales en placas de 96 o 384 pocillos que contienen tampón de lisis y otros reactivos de procesamiento. Una ventaja importante de este enfoque es que las muestras de células se pueden almacenar durante largos períodos de tiempo antes del análisis, lo que proporciona flexibilidad para la planificación y coordinación experimental. Los métodos basados ​​en placas o en micropocillos suelen tener una alta sensibilidad y pueden cuantificar de forma fiable hasta 10.000 genes por célula. Sin embargo, una desventaja de este enfoque es que la transcripción inversa debe realizarse en pozos separados, lo que puede ralentizar el flujo de trabajo, limitar los rendimientos y aumentar el ruido en el análisis posterior [4].

3. Métodos basados ​​en microfluidos: plataformas automatizadas basadas en microfluidos. En dispositivos de microfluidos, el flujo hidrodinámico permite la separación y el procesamiento en canales que van desde decenas a cientos de micrones. Para una sola celda, el tamaño del canal puede ser. comparable al de una sola célula. Una característica clave de este método es que las células capturadas se pueden observar microscópicamente antes de la transcripción inversa y la amplificación. Además, se utilizan pequeños volúmenes de suspensiones celulares (

Además, este método requiere uniformidad de tamaño celular y su coste es mayor que otras técnicas, lo que limita su aplicación en experimentos de paso alto.

El método CEL-SEQ [9] combina la amplificación lineal de la transcripción in vitro y la recolección de muestras marcadas con códigos de barras para facilitar el análisis paralelo de múltiples muestras.

El método CEL-seq2 [8] lo permite. La construcción de una única biblioteca mejora la sensibilidad de la transcripción y la detección de genes. En comparación con los métodos Smart-seq que pueden capturar transcripciones completas, CEL-seq2 solo se lee en el extremo 3' y, por lo tanto, no puede detectar formas empalmadas alternativamente. u otras transcripciones no poliadeniladas [10]

1. A diferencia de los métodos basados ​​en gotas, los métodos basados ​​en placas o los métodos de microfluidos pueden acomodar células de varios tamaños y formas, pero están limitados por unas únicas engorrosas y costosas. selección y aislamiento de células [16]

2. Cada protocolo scRNA-seq tiene sus ventajas y desventajas considerando el equilibrio entre el propósito de la investigación y el costo de secuenciación, es posible que se requiera una tecnología scRNA-seq específica [17]

p>

3. Un estudio anterior demostró que, en comparación, incluyendo CEL-seq2, MARS-seq, SMART-SEQ y Drop-seq, utilizando la tecnología scRNA-seq, Smart-seq puede detectar genes más expresados. >

4. Sheng et al. han demostrado que [18] MATQ-seq, un método de secuenciación de transcripciones completas, es eficaz para detectar una baja abundancia. Puede ser mejor que Smart-seq2 en términos de genes. p>

5. Los diferentes protocolos de scRNA-seq tienen diferentes ventajas y desventajas, y algunas revisiones publicadas han comparado algunos de ellos en detalle [17, 19]. Varias tecnologías de scRNA-seq pueden capturar poliA+ y. ARN poliA, como SUPeR-seq [20] y MATQ-seq [21]. Estos protocolos son adecuados para secuenciar una gran cantidad de ARN no codificante (ARN lnc) y ARN circular (ARN circular). Los estudios han demostrado que los lncRNA y circRNA desempeñan funciones importantes en diversos procesos biológicos de las células y pueden convertirse en importantes biomarcadores del cáncer. Por lo tanto, este método scRNA-seq se puede utilizar en células individuales. -ARN codificantes a diferentes niveles