¿Por qué no debemos tratar las variables dependientes del tiempo como basales en los modelos de Cox?

Autor: Alberto Carmona-Bayonas

01/10/2024
​La tradición no justifica que pidas un análisis erróneo, sólo para que puedas comparar tu sesgo con el sesgo previo imperante en el campo.
Uno de los aspectos más frustrantes en el análisis estadístico es recibir solicitudes para realizar cosas incorrectas para la estructura de los datos. Estudiar un error decenas de veces y que te pidan con insistencia ese sacrilegio matemático "porque es lo normal". Lo que más me preocupa es que, debido a un sesgo en el análisis, se puedan tomar decisiones clínicas erróneas. Siempre tengo en mente el principio de primum non nocere (primero, no hacer daño). El problema surge cuando algunos investigadores insisten con vehemencia en realizar el análisis inadecuado. 

Quiero aclarar que soy consciente de la necesidad de encontrar un equilibrio con el deseo de los investigadores. Si lo que piden no suena mal, posiblemente sea el mejor enfoque. El análisis debe ser robusto, capaz de captar las regularidades y patrones importantes en la base de datos. Sin embargo, los análisis también deben ser comprensibles para el resto de oncólogos, además de seguir las prácticas aceptadas en el campo. Los revisores y editores son muy proclives a rechazar análisis correctísimos, porque no los entienden. 
 


Aquí quiero reflexionar sobre una cuestión que tengo entre manos. La idea de realizar un análisis de supervivencia incorporando la variable "cirugía" sin considerar el momento en que los pacientes se operan. El argumento es que este enfoque es el más común, y por tanto necesario para "comparar con estudios previos". La percepción (errónea) suele ser que una técnica de ajuste de sesgo tipo propensity score matching solucionaría los problemas. 

Años atrás, había trabajado en este campo y lo enfoqué utilizando un modelo multiestado. Me parecía una forma elegante de analizar biografías de enfermedad, evaluando cómo se transita entre diferentes estados clínicos (ver referencias). El reto de estos enfoques es que suelen ser más complejos que las respuestas directas que a veces se buscan. Yo no estoy de acuerdo con esto. Los métodos deben ser tan sencillos como se pueda, pero si son demasiado sencillos, las conclusiones pueden ser falsas.

Cuando revisé la literatura, noté que existían muchos estudios observacionales sobre cirugía de metástasis que no abordaban este problema: no hay discusiones en los comités multidisciplinarios sobre operar a pacientes fallecidos. Se interviene a los que van bien. Si no tienes cuidado terminas afirmando, como sucede con frecuencia, que la cirugía de metástasis aumenta la supervivencia, cuando la relación causal puede ser la inversa. 

Incluso había meta-análisis de estos estudios que concluían que la cirugía de metástasis era beneficiosa. No pretendo cuestionar aquí la idea clínica de fondo. De hecho, estoy convencido de que las terapias locorregionales, incluida la cirugía de metástasis, son lo más adecuado en muchos contextos. Sin embargo, el verdadero problema es que la falta de una randomización que elimine el sesgo de confusión y ancle el análisis en el tiempo cero impide entender plenamente el beneficio de los tratamientos. Los artefactos estadísticos y el sesgo de tiempo inmortal explican algunos resultados inflados.

Para ejemplificar de manera didáctica por qué los análisis multivariable no son suficientes en ciertos contextos, voy a usar un ejemplo que muestra cómo el sesgo de tiempo inmortal puede ser severo y no se trata de un sesgo de confusión. Para ello, he simulado en R un estudio observacional donde la cirugía de metástasis no sólo no tiene un efecto positivo sobre la supervivencia, sino que, de hecho, está asociada con un riesgo (con hazard ratio [HR] de 1.5). Esto puede explicarse por varios mecanismos plausibles. Por ejemplo, la cirugía es una terapia local, y si un paciente se complica, puede que no reciba quimioterapia sistémica efectiva, lo que empeoraría su pronóstico.

La simulación tiene n=500. Obviamente, las cirugías se realizan únicamente a pacientes vivos, y he diseñado el estudio para que las intervenciones ocurran de forma relativamente precoz, casi todas dentro de los primeros tres meses. La base de datos no tiene otras covariables, ni contempla otros sesgos de confusión operando. No me he molestado en simular censuras.

Aquí presento un histograma con los tiempos hasta la cirugía de metástasis desde el diagnóstico:

Tiempo a la cirugía de metástasis desde el diagnóstico

Si alguien está interesado en replicar esto, me pueden solicitar el código R de la simulación, no lo incluyo aquí por razones de espacio.

El histograma muestra claramente que la mayoría de las cirugías de metástasis no son basales, no ocurren al diagnóstico de cáncer, simulando el hecho de que los pacientes suelen operarse tras 3-4 meses de quimioterapia.

A continuación voy a estimar la supervivencia usando el estimador de Kaplan-Meier, teniendo en cuenta la cirugía de metástasis como variable fija, basal:

Curvas de Kaplan-Meier considerando la cirugía como variable basal.

El gráfico sugiere, a primera vista, un efecto impresionante de la cirugía de metástasis sobre la supervivencia, mostrando una HR 0.38 (intervalo de confianza (IC) del 95%, 0.31-0.45). Esto podría llevar a la conclusión equivocada, como pasa con frecuencia, de que la cirugía es altamente beneficiosa. Sin embargo, al examinar cuidadosamente la gráfica, deberías advertir varios problemas.

El más obvio es que la curva de Kaplan-Meier está estratificada desde el tiempo cero por una variable que no se conoce en ese momento, ya que la "cirugía" es una variable dependiente del tiempo que se actualiza conforme los pacientes sobreviven lo suficiente como para operarse. Esta situación implica que el estadístico es un oráculo que adivina quiénes se van a operar y quiénes no en el futuro. Nadie fallece para poder estar ahí.

¿Qué solución hay?

Desafortunadamente, no hay una forma directa de representar este tipo de estructuras de datos con curvas de Kaplan-Meier tradicionales. Estas curvas suponen que las categorías de comparación son fijas desde el inicio del estudio, pero en este caso, el estado quirúrgico de los pacientes cambia a lo largo del tiempo, lo cual es incompatible con este método.

La tradición no justifica que pidas un análisis erróneo, sólo para que puedas comparar tu sesgo con el sesgo previo imperante en el campo. Inútil recordarlo, la mayoría de los que puedan volverán a cometer este sesgo.

Mi respuesta es a menudo encogerme de hombros: este tipo de análisis es, sencillamente, incorrecto. Las curvas de Kaplan-Meier no son adecuadas para variables dependientes del tiempo, y hay que elegir métodos de análisis que respeten la estructura temporal de los datos, como los modelos de riesgos proporcionales con variables dependientes del tiempo o modelos multiestado.

Para ilustrar el concepto, voy a emplear un modelo de Cox extendido donde la cirugía se trata correctamente como una variable dependiente del tiempo. Esto requiere reestructurar los datos y convertirlos a un formato largo, lo que significa que puede haber más de una fila por paciente. Este formato permite actualizar la información sobre el estado quirúrgico de cada paciente en diferentes momentos, lo que permite capturar la dinámica del proceso.

No pasa nada porque haya varias filas por paciente, ya que en un modelo de Cox extendido, se ajustan las covariables dependientes del tiempo, y se agrupan por el identificador, lo que permite controlar la correlación entre múltiples observaciones de un mismo individuo. El resultado del modelo refleja que la cirugía es en realidad perjudicial, tal como había simulado, con una HR de 1.78 (IC 95%, 1.45-2.19), lo que está bastante cerca del parámetro simulado. Cuando algunos insisten en generar algo parecido a las curvas de Kaplan-Meier para variables dependientes del tiempo, una solución a menudo utilizada son las curvas de Simon-Makuch. Estas curvas son una extensión de las de Kaplan-Meier, corregidas para tener en cuenta únicamente a los pacientes que están en riesgo y expuestos a la variable dependiente del tiempo (en este caso, la cirugía). Estas curvas pueden ser útiles ante investigadores muy tercos, ya que evitan el sesgo de tiempo inmortal, pero tienen un problema importante: su interpretación clínica es limitada.

Curvas de Simon Makuch

Así, las curvas de Kaplan-Meier están diseñadas para ofrecer predicciones claras y prácticas, por ejemplo, responder a la pregunta de un paciente: "Doctor, ¿cuál es mi probabilidad de sufrir un evento en función de una variable conocida, como si recibo tal o cual tratamiento?". Sin embargo, en el caso de una variable dependiente del tiempo como la cirugía, esta predicción es imposible porque no se puede conocer a priori si el paciente se operará o cuándo lo hará. Por lo tanto, las curvas de Simon-Makuch no permiten hacer predicciones reales a nivel clínico, ya que no podemos adivinar el momento en el que se realizará la cirugía varios meses antes. La idea que tienes que tener en mente es que las curvas de supervivencia deben transmitir probabilidades claras, útiles para tomar decisiones.

Finalmente, cuando los datos lo permiten, mi enfoque preferido son las curvas landmark. Este método consiste en especificar un punto temporal (landmark) en el que la mayoría de las cirugías ya han ocurrido y, a partir de ese momento, se analizan los resultados sin considerar las cirugías que se realicen posteriormente. Esto permite calcular una probabilidad condicional de supervivencia para los pacientes que han sobrevivido hasta el tiempo del landmark.

En este ejemplo, he seleccionado un landmark a los 4 meses, y como puedes ver, la curva landmark es útil para evitar el sesgo de tiempo. Al centrarse en los pacientes que han sobrevivido hasta ese punto y a partir de allí analizar los eventos, se evita el error de codificar como cirugías a aquellos pacientes que aún no se han operado. No es una solución perfecta, ya que excluye la información de los pacientes antes del landmark, pero al menos proporciona una estimación descriptiva clara del resultado de la cirugía en los supervivientes tras el momento del landmark.

Análisis landmark

Al final, si tienes que predecir el futuro para que tu análisis funcione, quizás el problema no está en los datos, sino que lo tienes tú y la bola de cristal que estás usando.


landmark modelo de cox extendido variables dependientes del tiempo cirugía de metástasis.

0 comentarios

Nombre:
Escribe un comentario: