Red de conocimientos sobre prescripción popular - Conocimiento de las drogas - Análisis de supervivencia (análisis de supervivencia)

Análisis de supervivencia (análisis de supervivencia)

1. Definición de análisis de supervivencia Análisis de supervivencia: disciplina que realiza inferencia estadística sobre una o más variables aleatorias no negativas y estudia fenómenos de supervivencia, datos de tiempo de reacción y sus leyes estadísticas.

Análisis de supervivencia: método estadístico que considera tanto el resultado como el tiempo de supervivencia. Puede aprovechar al máximo la información incompleta proporcionada por los datos censurados para describir las características de distribución del tiempo de supervivencia y analizar los principales factores que afectan la supervivencia. tiempo. La principal diferencia entre el análisis de supervivencia y otros análisis multivariados es que el análisis de supervivencia considera el tiempo que lleva cada observación para producir un resultado determinado.

Escenarios de aplicación

¿Qué es la supervivencia? Supervivencia tiene un significado amplio y puede referirse a la supervivencia de una persona o un animal (a diferencia de la muerte), la condición de un paciente en remisión (a diferencia de una recaída o deterioro), el funcionamiento normal de un sistema o producto (a diferencia de fracaso o fracaso), e incluso clientes de pérdida. En el análisis de supervivencia, el principal objeto de estudio es la probabilidad de vivir más de un tiempo determinado. También se puede describir la probabilidad de que sucedan otras cosas, como el fallo de un producto, el primer delito de una persona que sale de prisión, la primera vez que un desempleado encuentra trabajo, etc. En algunos campos del análisis, el seguimiento se suele utilizar para estudiar los patrones de desarrollo de cosas, como la eficacia de un fármaco, el tiempo de supervivencia tras una cirugía, la vida útil de una máquina, etc.

En la investigación médica, el seguimiento se suele utilizar para estudiar los patrones de desarrollo de las cosas. Por ejemplo, conocer la eficacia de un fármaco, conocer el tiempo de supervivencia de una operación, conocer la vida útil de un instrumento médico, etc. El análisis de los datos de supervivencia se denomina análisis de supervivencia. Los llamados datos de supervivencia se refieren a datos que describen la duración de la vida o el tiempo de ocurrencia. Con más detalle, la duración del tiempo de supervivencia de una persona está relacionada con muchos factores. Es común estudiar la relación entre los factores y el tiempo de supervivencia. Este es el llamado análisis de supervivencia.

Por ejemplo, estudiar cuánto tardan en morir los pacientes tras ser infectados por el virus, cuánto tardan en fallar las máquinas de trabajo, etc. Aquí, la "supervivencia individual" puede resumirse y abstraerse en algunos acontecimientos preocupantes. Por lo tanto, SA se convierte en un método para estudiar la relación entre los eventos y el momento en que ocurren. Este método es ampliamente utilizado en medicina, biología y otras disciplinas. En los últimos años, cada vez más personas lo utilizan para la extracción de datos de Internet, como utilizar el análisis de supervivencia para predecir la difusión de información en las redes sociales o predecir la probabilidad de abandono de usuarios.

El contenido de la investigación del análisis de supervivencia es 1. Describir el proceso de supervivencia, estudiar las características de distribución del tiempo de supervivencia, estimar la tasa de supervivencia y el tiempo medio de supervivencia, dibujar curvas de supervivencia, etc. Con base en la duración del tiempo de supervivencia, se puede estimar la tasa de supervivencia en cada punto temporal, se puede estimar la mediana del tiempo de supervivencia con base en la tasa de supervivencia o se pueden analizar las características de supervivencia con base en la curva de supervivencia, generalmente usando el modelo Kaplan- Método de Meier y método de la tabla de vida. 2. Compare el proceso de supervivencia Puede comparar la tasa de supervivencia de cada muestra a través de la tasa de supervivencia y su error estándar para explorar si existen diferencias en el proceso de supervivencia entre grupos. Normalmente se utilizan la prueba de rango logarítmico y la prueba de Breslow. 3. El análisis de factores de riesgo consiste en explorar los factores protectores y adversos, el tamaño y la dirección de los factores y los riesgos relativos a través del modelo de análisis de supervivencia. Básicamente se utiliza el modelo de regresión de Cox. 4. Establecer un modelo matemático y establecer el modelo matemático final, que también se completa mediante el modelo de regresión de Cox.

Los requisitos básicos para los datos en el análisis de supervivencia son 1. Las muestras deben obtenerse mediante muestreo aleatorio y el número y proporción de casos de muerte no deben ser demasiado pequeños. 2. La proporción de datos completos no puede ser demasiado pequeña, es decir, el valor límite no puede ser demasiado. 3. El motivo del corte es ser imparcial. Para evitar sesgos, los análisis generalmente se realizan sobre la edad, ocupación, región y gravedad de la enfermedad truncadas de los sujetos del estudio. 4. El tiempo de supervivencia debe ser lo más preciso posible. 5. Falta.

Datos de supervivencia * * * tiene las mismas características que 1. Contiene información de finalización y hora. 2. Las terminaciones se dividen en dos categorías. 3. Generalmente se recogen mediante visitas de seguimiento. Las observaciones de seguimiento a menudo comienzan desde un momento unificado (como después del ingreso o algunas medidas de tratamiento como la cirugía) y terminan en un momento designado. 4. Debido a razones como la pérdida de seguimiento, los datos sobre el tiempo de supervivencia de los sujetos de investigación suelen estar incompletos y los tipos de distribución son complejos, por lo que los métodos anteriores no se pueden aplicar simplemente.

2. Conceptos básicos del análisis de supervivencia

Evento inicial: evento que refleja las características iniciales del tiempo de supervivencia, como el diagnóstico de una enfermedad y el inicio del tratamiento de una determinada. enfermedad. Evento de fracaso: en el estudio de seguimiento del análisis de supervivencia, algunos sujetos pudieron observar la muerte y obtener un tiempo de supervivencia preciso, y la información que proporcionaron fue completa. Este evento se denomina evento de falla, también conocido como evento de muerte y evento de punto final.

Los eventos finales y los eventos iniciales son relativos y ambos están determinados por el propósito de la investigación. Deben especificarse claramente en el diseño, respetarse estrictamente en el estudio y no pueden modificarse a voluntad.

Tiempo de supervivencia: A grandes rasgos, se refiere al tiempo que transcurre desde que se produce un determinado evento inicial hasta que se produce un determinado evento final. La unidad de medida puede ser año, mes, día, hora, etc. , generalmente representado por el símbolo T. Este tiempo no es necesariamente el tiempo habitual, sino también una variable relacionada con el tiempo. Como la distancia, etc. , debe definirse de acuerdo con el propósito de la investigación. 1) El tipo de distribución es difícil de determinar. Generalmente no obedece a la distribución normal y en la mayoría de los casos no obedece a ningún tipo de distribución normal. 2) Los factores que influyen son complejos y difíciles de controlar. 3) Con base en los resultados de los sujetos de la investigación, los datos del tiempo de supervivencia se pueden dividir en dos categorías: Datos completos: el tiempo desde el punto de inicio de la observación hasta la ocurrencia de los eventos de muerte. Datos incompletos: El final del proceso de observación del tiempo de supervivencia no se debe a la muerte, sino a otros motivos. Los datos incompletos se pueden dividir en: datos censurados y datos truncados. Los principales motivos son: pérdida de seguimiento: pérdida de contacto; retiro: retiro del estudio por factores ajenos a la investigación o a factores ajenos al tratamiento terminación: cuando ha transcurrido el tiempo especificado en el diseño, pero el sujeto de la investigación está; sigue vivo, la observación finaliza.

¿Qué es la expresión de supresión? Eliminación correcta: ¿solo saber que la vida útil real es mayor que un cierto número? Eliminación izquierda: solo sé que la esperanza de vida real es inferior a un número determinado; Truncamiento de intervalo: dentro de un intervalo de tiempo, solo se conoce la vida real.

Probabilidad de muerte condicional: Indica la posibilidad de que un individuo sobreviva dentro de un período de tiempo determinado. Por ejemplo, probabilidad de muerte anual q = número de muertes en un determinado año/población al inicio de un determinado año. Si se eliminan datos en un año determinado, es necesario corregir el denominador. La población corregida = población al comienzo del año - número de casos eliminados/2.

Probabilidad condicional de supervivencia: La probabilidad de que un individuo que sobreviva al comienzo de un determinado período sobreviva al final del período p = el número de personas que sobreviven durante un año en un determinado año / la población al comienzo de un año determinado = 1-q; si hay datos eliminados en el año actual, es necesario corregir el denominador. La población corregida = población al comienzo del año - número de casos eliminados/2.

Función de supervivencia

Si hay datos censurados se debe calcular la probabilidad de supervivencia para diferentes periodos. Suponiendo que el tiempo de supervivencia del objeto observado en cada ciclo es independiente, aplique el teorema de multiplicación de probabilidad para multiplicar la probabilidad de cada ciclo y obtener la tasa de supervivencia.

La tasa de supervivencia es diferente de la probabilidad de supervivencia condicional. La probabilidad de supervivencia condicional es el resultado de un solo período, mientras que la tasa de supervivencia es esencialmente la probabilidad condicional acumulativa de supervivencia, que es el resultado acumulativo de múltiples períodos. Por ejemplo, la tasa de supervivencia a 3 años es la probabilidad de supervivencia en un año, supervivencia en el segundo año y supervivencia en el tercer año.

Los métodos de estimación de la tasa de supervivencia s(t) incluyen métodos paramétricos y métodos no paramétricos. Hay dos métodos no paramétricos de uso común, a saber, el método del límite multiplicativo y el método de la tabla de vida. El método del límite del producto se utiliza principalmente para observar datos de supervivencia no agrupados, mientras que el método de la tabla de vida es adecuado para observar datos agrupados con una gran cantidad de casos. Los resultados de los cálculos de diferentes métodos de tablas de vida agrupadas serán diferentes. Cuando solo hay un valor de observación en cada intervalo de agrupación en los datos agrupados, los resultados del cálculo del método de la tabla de vida son exactamente los mismos que los del método de límite del producto.

Curva de supervivencia: Con el tiempo de observación (seguimiento) como eje horizontal y la tasa de supervivencia como eje vertical, se genera un gráfico que conecta las tasas de supervivencia correspondientes a cada punto temporal. La curva de supervivencia es una curva descendente. Al analizar, se debe prestar atención a la altura de la curva y la pendiente de la caída. Una curva de supervivencia plana indica una tasa de supervivencia alta o un período de supervivencia largo, mientras que una curva de supervivencia pronunciada indica una tasa de supervivencia baja o un período de supervivencia corto.

Tiempo medio de supervivencia: También llamado tiempo de media supervivencia, significa que exactamente el 50% de los individuos siguen vivos. Cuanto más larga sea la mediana del período de supervivencia, mejor será el pronóstico de la enfermedad; cuanto más corta sea la mediana del período de supervivencia, peor será el pronóstico. A menudo se utilizan métodos gráficos o métodos de interpolación lineal para estimar el tiempo medio de supervivencia.

Función de densidad de probabilidad f(t)

[Error en la carga de la imagen...(Picture-f5d8a7-1630478089306)]

Función de supervivencia S(t)

Función de riesgo h(t)

Función de riesgo acumulativo H(t)

3. El propósito del análisis de supervivencia

Estimación: basada en la muestra Los datos de supervivencia estiman la tasa de supervivencia general y otros indicadores relacionados (como el tiempo de supervivencia medio, por ejemplo, la tasa de supervivencia, la curva de supervivencia y el tiempo de supervivencia medio después del tratamiento se basan en los datos del tiempo de supervivencia de los pacientes con tumores cerebrales). son estimados. Comparar: compare las tasas de supervivencia de diferentes grupos de tratamiento, como comparar las tasas de supervivencia de diferentes tratamientos para tumores cerebrales, para comprender qué opción de tratamiento es mejor.

Análisis de factores influyentes: El propósito es explorar y comprender los factores que afectan el tiempo de supervivencia, o estudiar el impacto de uno o algunos factores en la tasa de supervivencia después de equilibrar la influencia de ciertos factores. Para mejorar el pronóstico de los pacientes con tumores cerebrales, debemos comprender los principales factores que afectan el pronóstico del paciente, incluida la edad, el sexo, la duración de la enfermedad, el estadio del tumor, el plan de tratamiento, etc. Predicción: Predicción de supervivencia individual en diferentes niveles de factores, como predecir la tasa de supervivencia de T años (meses) de pacientes con tumores cerebrales en función de la edad, el sexo, el curso de la enfermedad, el estadio del tumor, el plan de tratamiento, etc.

Cuatro. Métodos específicos de análisis de supervivencia Los métodos de análisis de supervivencia se pueden dividir en métodos descriptivos, métodos paramétricos, métodos semiparamétricos y métodos no paramétricos1. El método descriptivo puede calcular directamente la función de supervivencia, la función de muerte y la función de riesgo en cada momento o cada intervalo de tiempo mediante fórmulas basadas en la información proporcionada por observaciones de muestra, y mostrar el patrón de distribución del tiempo de supervivencia en forma de lista o dibujo. . Ventajas: El método es simple y no requiere distribución de datos. Desventajas: Es imposible comparar las diferencias en las funciones de distribución del tiempo de supervivencia de dos o más grupos, analizar los factores de riesgo y establecer un modelo de relación entre el tiempo de supervivencia y los factores de riesgo.

2. El método no paramétrico no requiere la distribución del tiempo de supervivencia al estimar la función de supervivencia. El método de prueba no paramétrico se utiliza para probar el impacto de los factores de riesgo en el tiempo de supervivencia. Métodos comúnmente utilizados: método de límite de producto y método de tabla de vida Ventajas: se puede estimar la función de supervivencia y se pueden comparar dos o más grupos de funciones de distribución de supervivencia. Se puede analizar el impacto de los factores de riesgo en el tiempo de supervivencia y no existe ningún requisito para la distribución del tiempo de supervivencia. Desventajas: No se puede establecer el modelo de relación entre el tiempo de supervivencia y los factores de riesgo.

3. El método de parámetros estima los parámetros en el modelo de distribución hipotético en función de los valores de observación de la muestra para obtener el modelo de distribución de probabilidad del tiempo de supervivencia. Las distribuciones a las que a menudo obedece el tiempo de supervivencia incluyen la distribución exponencial, la distribución de Weibull, la distribución lognormal, la distribución logarítmica y la distribución gamma. Ventajas: Se pueden estimar funciones de supervivencia y se pueden comparar dos o más grupos de funciones de distribución de supervivencia. Se puede analizar el impacto de los factores de riesgo en el tiempo de supervivencia y se puede establecer un modelo de relación entre el tiempo de supervivencia y los factores de riesgo. Desventaja: es necesario conocer de antemano la distribución de los tiempos de supervivencia.

4. El método semiparamétrico no necesita asumir la distribución del tiempo de supervivencia, pero puede utilizar un modelo para analizar la distribución del tiempo de supervivencia y el impacto de los factores de riesgo en el tiempo de supervivencia. uno es la regresión COX. Ventajas: Se pueden estimar funciones de supervivencia y se pueden comparar dos o más grupos de funciones de distribución de supervivencia. Se puede analizar el impacto de los factores de riesgo en el tiempo de supervivencia y se puede establecer un modelo de relación entre el tiempo de supervivencia y los factores de riesgo sin conocer de antemano la distribución del tiempo de supervivencia.

Modelo de regresión de riesgos proporcionales de Cox, denominado modelo de regresión de Cox.

Si las variables del modelo Cox PH cambian con el tiempo, se convierte en un modelo de Cox extendido y la FC deja de ser constante. Un ejemplo muy simple: si el lugar de residencia del paciente también es una variable, el paciente puede mudarse, por ejemplo, después de cinco años de smog a Beijing y luego vivir en Xiamen, entonces su probabilidad de recurrencia definitivamente se reducirá. Por tanto, la variable de residencia está relacionada con el tiempo. Una forma sencilla es dividir el tiempo en intervalos de acuerdo con el momento en que cambian las variables, de modo que las variables en cada intervalo permanezcan sin cambios. Luego se aplica el modelo Cox PH.