Autor(es): Christopher Oddy, Joe Zhang, Jessica Morley, Hutan Ashrafian
Año: 2024
Referencia bibliográfica:
Oddy, C., Zhang, J., Morley, J., & Ashrafian, H. (2024). Promising Algorithms to Perilous Applications: A Systematic Review of Risk Stratification Tools for Predicting Healthcare Utilisation. BMJ Health Care Inform, 31, e101065. https://doi.org/10.1136/bmjhci-2024-101065
Categoría asignada: Coste-efectividad
Resumen:
El artículo Promising Algorithms to Perilous Applications: A Systematic Review of Risk Stratification Tools for Predicting Healthcare Utilisation evalúa las herramientas de estratificación de riesgos utilizadas para predecir la utilización de recursos sanitarios en sistemas de atención primaria. Dichas herramientas forman parte fundamental de estrategias de gestión de salud poblacional (PHM), enfocadas en identificar a los individuos de alto riesgo y aplicar intervenciones preventivas. Los autores revisan estudios sobre el desarrollo, validación y despliegue de modelos predictivos en escenarios del mundo real, evaluando su impacto en la morbilidad y en la reducción del uso de servicios de salud.
El estudio parte de la observación de que los modelos de predicción de riesgos suelen evaluarse mediante cohortes retrospectivas, con poca atención a su eficacia en la mejora de la atención sanitaria cuando se despliegan en diferentes contextos. Los autores realizaron una búsqueda sistemática en bases de datos como MEDLINE y Embase, identificando 51 estudios que evaluaron 28 modelos de predicción de riesgos. Aunque la mitad de los modelos fueron validados externamente, solo dos fueron validados a nivel internacional, lo que pone de manifiesto la falta de pruebas sobre su robustez en contextos globales.
Uno de los resultados más preocupantes es que la mayoría de los estudios de evaluación en el mundo real no demostraron una reducción en la utilización de recursos sanitarios. De hecho, en algunos casos, las intervenciones basadas en la selección de casos mediante modelos de estratificación de riesgos resultaron en aumentos significativos en las admisiones hospitalarias y en la carga de trabajo en atención primaria. Solo un tercio de los estudios reportó algún beneficio, lo que plantea dudas sobre la eficacia de estas herramientas para mejorar la prestación de servicios de salud.
Un ejemplo específico es el algoritmo PRISM, utilizado para guiar la asignación de recursos en atención primaria. Un ensayo clínico con 230,000 pacientes mostró que la intervención basada en este modelo resultó en un aumento del 44% en las admisiones hospitalarias. A su vez, el Nairn Case Finder fue más exitoso, logrando una reducción del 42.5% en las admisiones hospitalarias en una muestra más pequeña de 96 pacientes de alto riesgo.
En cuanto a la precisión predictiva, los modelos desarrollados mediante técnicas de aprendizaje automático (ML) presentaron las mejores cifras, con valores de C-statistic de hasta 0.90. Sin embargo, los autores destacan que estos modelos no han sido validados externamente, lo que plantea dudas sobre su capacidad para generalizar en poblaciones diversas. En los modelos que sí fueron validados externamente, el rendimiento fue similar al de la validación interna, con valores de C-statistic que oscilan entre 0.53 y 0.88.
El artículo sugiere que el fallo de los modelos para reducir la utilización de recursos sanitarios podría deberse a una desconexión entre el desarrollo teórico de los modelos y las complejidades de los entornos clínicos del mundo real. La identificación de individuos con alto riesgo de utilización de recursos no siempre se traduce en mejoras en la prestación de servicios, ya que las intervenciones aplicadas a estas cohortes pueden ser heterogéneas y no siempre responden a las necesidades clínicas específicas de los pacientes.
Los autores concluyen que, aunque los modelos de estratificación de riesgos muestran una capacidad discriminatoria aceptable en contextos similares a los de su desarrollo, su aplicación en poblaciones no seleccionadas no ha demostrado ser eficaz para reducir la morbilidad o el uso de servicios de salud. En lugar de seguir integrando estos sistemas en la atención primaria sin una comprensión clara de sus riesgos y beneficios, los autores recomiendan realizar evaluaciones independientes de su seguridad, eficacia y coste-efectividad.
Este artículo plantea preguntas importantes sobre el coste de implementar estas herramientas a nivel poblacional y destaca la necesidad de un enfoque más cuidadoso y basado en la evidencia para su despliegue en la práctica clínica. Además, insta a los responsables políticos a revisar el coste-efectividad de estos programas, particularmente en sistemas de salud con recursos limitados.