Red de conocimientos sobre prescripción popular - Conocimiento de las drogas - Análisis de supervivencia (2): modelo de riesgos proporcionales de Cox

Análisis de supervivencia (2): modelo de riesgos proporcionales de Cox

El modelo de riesgos proporcionales de Cox (Cox, 1972) es un modelo de regresión estadística comúnmente utilizado en investigación médica para investigar la asociación entre el tiempo de supervivencia de un paciente y una o más variables predictivas.

En el capítulo anterior Conceptos básicos del análisis de supervivencia, describimos los conceptos básicos del análisis de supervivencia y los métodos de análisis y resumen de los datos de supervivencia, que incluyen:

Los métodos anteriores: Kaplan-Meier curva y prueba Logrank - es un ejemplo de análisis univariado. Describieron la supervivencia basándose en un factor de la encuesta, pero ignoraron el impacto de otros factores.

Además, las curvas de Kaplan-Meier y las pruebas de rango logarítmico solo son útiles si la variable predictora es categórica (por ejemplo: tratamiento A frente a tratamiento B; hombre frente a mujer). No funcionan fácilmente con predictores cuantitativos como la expresión genética, el peso o la edad.

Una alternativa es el análisis de regresión de riesgos proporcionales de Cox, que funciona tanto con predictores cuantitativos como con variables categóricas. Además, el modelo de regresión de Cox amplía el método de análisis de supervivencia y puede evaluar simultáneamente el impacto de varios factores de riesgo en el tiempo de supervivencia.

En este artículo, describiremos el modelo de regresión de Cox y proporcionaremos ejemplos prácticos utilizando el software R.

Contenido

En la investigación clínica, hay muchas situaciones en las que varias cantidades conocidas (llamadas covariables) pueden afectar el pronóstico del paciente.

Por ejemplo, supongamos que comparas dos grupos de pacientes: aquellos con y sin un genotipo específico. Si uno de los grupos también contiene individuos mayores, cualquier diferencia en la supervivencia puede atribuirse al genotipo, la edad o ambos. Por lo tanto, cuando se investiga la supervivencia asociada con cualquier factor, a menudo es necesario realizar ajustes por los efectos de otros factores.

El modelado estadístico es una herramienta común que puede analizar las tasas de supervivencia de múltiples factores simultáneamente. Además, el modelo estadístico proporciona el tamaño del efecto de cada factor.

El modelo de riesgos proporcionales de Cox es uno de los métodos más importantes para modelar datos de análisis de supervivencia. La siguiente sección presenta los conceptos básicos del modelo de regresión de Cox.

El objetivo de este modelo es evaluar el impacto de varios factores en la supervivencia de forma simultánea. En otras palabras, nos permite examinar cómo factores específicos influyen en la incidencia de un evento específico (por ejemplo, infección, muerte) en un momento específico. Esta relación a menudo se denomina relación de riesgo. Las variables (o factores) predictivas a menudo se denominan covariables en la literatura sobre análisis de supervivencia.

El modelo de Cox está representado por una función de riesgo representada por h(t). En resumen, la función de riesgo puede interpretarse como el riesgo de morir en el momento t. se puede estimar de la siguiente manera:

donde:

El modelo de Cox se puede escribir como una regresión lineal múltiple del logaritmo del riesgo de la variable x(i) y el riesgo de referencia es el elemento "intersección" que cambia con el tiempo.

El coeficiente bi se denomina índice de riesgo (HR, Hazard Ratio). Un valor bi mayor que cero, o equivalente a un índice de riesgo mayor que 1, indica que a medida que aumenta el valor de la i-ésima covariable, el riesgo del evento aumenta y por lo tanto el tiempo de supervivencia disminuye.

En otras palabras, un Hazard Ratio mayor que 1 indica que la covariable está relacionada positivamente con la probabilidad del evento y por tanto negativamente con el tiempo de supervivencia.

En resumen,

HR=1: Sin efecto

HR<1: Peligro reducido

HR>1: Peligro aumentado

p>

En la investigación del cáncer:

El supuesto clave del modelo de Cox es que las curvas de riesgo de los grupos de observación (o pacientes) deben ser proporcionales y no pueden cruzarse.

Supongamos dos pacientes k y k' con diferentes valores de x.

La función de riesgo correspondiente se puede escribir simplemente de la siguiente manera:

Por lo tanto, el modelo de Cox es un modelo de riesgos proporcionales: el riesgo de cualquier conjunto de eventos es un múltiplo constante del riesgo de cualquier otro conjunto de eventos. Este supuesto significa que, como se mencionó anteriormente, las curvas de riesgo para los grupos deben ser proporcionales y no cruzadas.

En otras palabras, si el riesgo de muerte de una persona es el doble que el de otra en algún momento inicial, el riesgo de muerte sigue siendo el doble que el de otra persona en cualquier momento posterior.

Esta suposición de riesgos proporcionales debe probarse. Discutiremos métodos para evaluar la proporcionalidad en el próximo artículo de esta serie: Supuestos del modelo de Cox.

Usaremos dos paquetes de R:

La función coxph() [en el paquete de supervivencia] se puede utilizar para calcular un modelo de regresión de riesgos proporcionales de Cox en R.

El formato simplificado es el siguiente:

Utilizaremos los datos de cáncer de pulmón en el paquete survival R.

Ajustaremos una regresión de Cox utilizando las siguientes covariables: edad, sexo, ph.ecog y wt.loss.

Primero calculamos el análisis de Cox univariado para todas estas variables. Luego ajustaremos un análisis de Cox multivariado utilizando las dos variables para describir cómo estos factores afectan conjuntamente la supervivencia.

El análisis univariante de Cox se calcula de la siguiente manera:

El resumen de funciones () del modelo de Cox produce un informe más completo:

Los resultados de la regresión de Cox se pueden interpretado como:

Para aplicar la función coxph univariante a múltiples covariables a la vez, ingrese el siguiente comando:

El resultado anterior muestra el coeficiente beta de regresión para cada variable en relación con la supervivencia general, tamaño del efecto (dado como índice de riesgo) y significación estadística. Cada factor se evaluó mediante regresión de Cox univariada por separado.

A partir del resultado anterior,

Ahora queremos describir cómo estos factores afectan conjuntamente la supervivencia. Para responder a esta pregunta, realizaremos un análisis de regresión múltiple de Cox. Dado que la variable ph.karno no es significativa en el análisis univariado de Cox, se omite en el análisis multivariado. Incluimos 3 factores (sexo, edad y ph.ecog) en el modelo multivariado.

La regresión de Cox del tiempo hasta la muerte con covariables de constante de tiempo se especifica de la siguiente manera:

Los valores p para las tres pruebas generales (probabilidad, Wald y puntuación) son significativos, lo que indica que el modelo es significativo. Estas pruebas evalúan la hipótesis nula combinada de 0 para todas las betas. En el ejemplo anterior, las estadísticas de prueba son muy consistentes y la hipótesis nula sintética se rechaza por completo.

En el análisis multivariado de Cox, las covariables género y ph.ecog se mantuvieron significativas (p < 0,05). Sin embargo, la covariable edad no fue significativa (p = 0,23, mayor que 0,05).

El valor p para el género es 0,000986 y el índice de riesgo HR = exp(coef) = 0,58, lo que indica una fuerte relación entre el género del paciente y un riesgo reducido de muerte. Los índices de riesgo para las covariables pueden interpretarse como efectos multiplicativos sobre el riesgo. Por ejemplo, mantener constantes otras covariables (mujer (sexo = 2)) reduce el riesgo en 0,58, o 42%. Concluimos que ser mujer se asocia con un pronóstico favorable.

Asimismo, el valor p de ph.ecog es 4,45e-05 y el índice de riesgo HR = 1,59, lo que indica una fuerte relación entre el valor de ph.ecog y un mayor riesgo de muerte. Manteniendo constantes otras covariables, cuanto mayor sea el valor de ph.ecog, menor será la tasa de supervivencia.

En comparación, el valor p para la edad es ahora p = 0,23. Hazard ratio HR = exp(coef) = 1,01; intervalo de confianza del 95%: 0,99 a 1,03.

Dado que el intervalo de confianza para la FC es 1, estos resultados indican que la edad contribuye menos a la diferencia en la FC y solo se acerca a la significación después de ajustar los valores de phog y el sexo del paciente. Por ejemplo, manteniendo constantes otras covariables, un año adicional de edad induce un riesgo diario de muerte con un coeficiente de expβ = 1,01 o 1%, lo que no es una contribución importante.

Una vez que ajuste un modelo de Cox a sus datos, podrá visualizar la supervivencia prevista para un grupo de riesgo específico en cualquier momento dado. La función survfit() estima la proporción de supervivencia, que por defecto es la media de las covariables.

También podríamos mostrar cómo la supervivencia estimada depende del valor de la covariable objetivo.

Con esto en mente, quisimos evaluar el impacto del sexo en la supervivencia estimada. En este caso, construimos un nuevo marco de datos con dos filas, una para cada género. Otras covariables se fijan en su media (si son variables continuas) o en su nivel más bajo (si son variables discretas). Para pseudocovariables, la media es la proporción en el conjunto de datos que está codificada como 1. Este marco de datos se pasa a survfit() a través del parámetro newdata:

En este artículo, describimos un modelo de regresión de Cox para evaluar simultáneamente la relación entre múltiples factores de riesgo y el tiempo de supervivencia del paciente. Demostramos cómo calcular un modelo de Cox usando el paquete de supervivencia. Además, describimos cómo utilizar el paquete survminer para visualizar los resultados del análisis.