Puntos Clave
Un grupo de investigadores de Estados Unidos, se propuso abordar las brechas de conocimiento al comparar las recomendaciones acerca del diagnóstico y manejo de un sistema de IA, con los médicos tratantes durante las visitas de atención de urgencia virtuales, agudas y del mundo real.
- Los pacientes accedieron al servicio a través de una aplicación móvil, iniciando las visitas al ingresar sus inquietudes o consultas médicas.
- Un modelo IA realizó una entrevista dinámica estructurada, recopilando información sobre los síntomas y el historial médico.
- La IA, utilizando esta información y los datos del historial clínico electrónico del paciente, proporcionó información inicial sobre las afecciones con los síntomas de consulta. Los pacientes luego podían iniciar una video consulta con un médico.
- 2 jueces examinaron cada caso de forma independiente, puntuando las decisiones del tratamiento médico otorgado por la IA y los médicos.
- Las recomendaciones iniciales entre IA y médicos coincidieron en 242 pacientes sobre 461 (67.9%), fueron mejores para la IA en el 20.8% y mejores para los médicos tratantes en el 11.3%.
- Cuando hubo diferencia, las recomendaciones de IA fueron, con más frecuencia, de mejor calidad, teniendo un mejor desempeño en las señales de alertas críticas, mientras que los médicos fueron más efectivos en la adaptación de las recomendaciones a la información cambiante durante las consultas.
- Las consultas analizadas fueron todas de patologías leves, de baja gravedad.
Inteligencia Artificial (IA): ya está entre nosotros
La IA demostró ser prometedora en varios dominios de la atención médica, incluidos el diagnóstico por imágenes, la cardiología, la anatomía patológica, la predicción y detección de riesgos.
En la práctica clínica, en el “mundo real”, principalmente en la atención primaria, existen datos limitados, o bajados en pocos casos, acerca de la aplicación de la IA.
En efecto, la mayoría de los estudios existentes se centran en el rendimiento de la IA en tareas puntuales, como la interpretación de imágenes o la predicción de riesgos para resultados específicos, en lugar de en el potencial de la IA para respaldar el diagnóstico y el tratamiento de un paciente.
Un nuevo estudio con 461 pacientes
Un grupo de investigadores Estados Unidos, en un centro de atención médica virtual de urgencias de Los Ángeles, se propuso abordar estas brechas en el conocimiento, al comparar las recomendaciones acerca del diagnóstico y manejo de un sistema de IA, con las decisiones de los médicos tratantes durante las visitas de atención de urgencia virtuales, agudas y del mundo real.
Las visitas elegibles fueron aquellas con síntomas comunes para los que el sistema de IA ha demostrado una alta precisión diagnóstica.
Para esto hicieron un estudio de cohorte retrospectivo en una clínica virtual de atención primaria, de patologías de urgencia. En esta, los médicos reciben habitualmente asistencia a partir de la IA para la admisión, el diagnóstico y el manejo.
Los pacientes accedieron al servicio a través de una aplicación móvil, iniciando las visitas al ingresar sus inquietudes o consultas médicas.
Un modelo IA realizó una entrevista dinámica estructurada, recopilando información sobre los síntomas y el historial médico.
En promedio, se respondieron 25 preguntas en un período de 5 minutos.
Un algoritmo, utilizando esta información y los datos del historial clínico electrónico del paciente, proporcionó información inicial sobre las afecciones con los síntomas de consulta. Los pacientes luego podían iniciar una video consulta con un médico.
El algoritmo también sugirió recomendaciones de manejo a los médicos tratantes, incluyendo prescripciones de medicamentos, órdenes de pruebas de laboratorio y derivaciones a entornos de atención apropiados.
Cuatro médicos expertos, cada uno con al menos 10 años de experiencia, revisaron los casos mediante un proceso de 2 pasos:
# Revisión inicial.
2 jueces examinaron cada caso de forma independiente. La revisión incluyó las respuestas del paciente al cuestionario de admisión, la transcripción de la videoconferencia y el diagnóstico y las decisiones de tratamiento del médico. Los jueces desconocían la identidad del paciente y del médico original. Se puntuaron tanto el diagnóstico como las decisiones de tratamiento del médico y del asistente IA mediante una escala de 4 puntos:
- Tratamiento óptimo (diagnóstico adecuado y tratamiento conforme a las directrices).
- Tratamiento razonable (por ejemplo, recomendar el tratamiento de una posible faringitis vírica, en contra de las directrices).
- Tratamiento inadecuado (por ejemplo, prescribir antibióticos para una afección vírica).
- Tratamiento potencialmente perjudicial (por ejemplo, no derivar un caso aparentemente urgente al servicio de urgencias).
# Revisión de casos discordantes.
En los casos en que las puntuaciones de los 2 jueces, tanto del IA como del médico, diferían en más de un nivel (es decir, óptimo versus inadecuado o potencialmente perjudicial), se involucró a un tercer juez. Los 3 jueces se reunieron para debatir el caso. Se buscó el consenso, pero no se obligó a ninguno, y cada juez registró su puntuación final.
Un juez resumió las razones principales en los casos en que las puntuaciones de la IA y del médico diferían.
Los resultados: ¿Qué encontraron en este estudio?
Las recomendaciones iniciales de la IA y las recomendaciones finales del médico coincidieron en 262 visitas (56.8%).
Entre las 461 visitas ponderadas, las recomendaciones de La IA se calificaron con mayor frecuencia como óptimas (77.1%) que las decisiones del médico tratante (67.1%).
Las puntuaciones de calidad fueron:
- Iguales en el 67.9% de los casos.
- Mejores para la IA en el 20.8%.
- Mejores para médicos tratantes en el 11.3%.
Las conclusiones: ¿Qué nos deja este estudio?
Cuando las recomendaciones de la IA y del médico diferían, las recomendaciones de la IA fueron con más frecuencia las de mejor calidad.
Los hallazgos sugieren que la IA tuvo un mejor desempeño en la identificación de señales de alerta críticas y en el apoyo a la atención que cumple con las directrices, mientras que los médicos fueron más efectivos en la adaptación de las recomendaciones a la información cambiante durante las consultas.
Vemos acá como la IA podría contribuir a la toma de decisiones de los médicos en la atención de urgencias virtual.
Cómo criticas al estudio tenemos que los pacientes no estaban cegados sobre quién los iba a atender (sabían que era una IA o un humano). Además, los médicos podían tener acceso a lo que hacía o había prescripto la IA. Otro punto es que las consultas eran todas de patologías leves, de baja gravedad (lo que llamamos en la práctica “códigos verdes”).