ChatGPT-4 revoluciona el diagnóstico clínico, pero los médicos desconfían.
Un estudio clínico demuestra que ChatGPT-4 supera a los médicos en precisión diagnóstica. Sin embargo, el sesgo humano y la falta de capacitación limitan su potencial en la práctica.
La inteligencia artificial está cambiando las reglas del juego en múltiples sectores, y la medicina no es la excepción. Un reciente estudio realizado por investigadores estadounidenses ha revelado que ChatGPT-4, la herramienta de OpenAI, es capaz de superar a los médicos en la precisión y calidad de los diagnósticos. Sin embargo, la resistencia de los profesionales a confiar plenamente en estas herramientas plantea desafíos para su adopción.
El estudio involucró a 50 médicos de distintas especialidades, divididos en dos grupos: uno con acceso al chatbot como herramienta complementaria y otro que utilizó únicamente recursos tradicionales. Además, se evaluó el desempeño de ChatGPT-4 trabajando de manera autónoma. Los resultados fueron sorprendentes: la inteligencia artificial alcanzó una puntuación del 92% en precisión diagnóstica, superando tanto al grupo que usó la IA junto con métodos convencionales (76%) como al grupo que trabajó sin ella (74%).
Uno de los hallazgos más llamativos fue el rechazo de los médicos a aceptar diagnósticos alternativos generados por el chatbot, incluso cuando estos eran más precisos. Según el Dr. Adam Rodman, coautor del estudio, «los médicos tendían a ignorar las sugerencias de la IA cuando estas contradecían sus propias hipótesis». Este fenómeno, asociado al exceso de confianza, limita la capacidad de aprovechar el potencial de estas herramientas en la práctica clínica.

Además, muchos médicos usaron el chatbot como si fuera un buscador tradicional, en lugar de aprovechar su capacidad para analizar casos completos y proporcionar razonamientos estructurados. Esto pone en evidencia la necesidad de capacitar a los profesionales para utilizar eficazmente esta tecnología, que podría actuar como un «asistente médico» al ofrecer segundas opiniones y complementando el juicio humano.
A pesar de las limitaciones, este estudio subraya el potencial transformador de los grandes modelos de lenguaje en la medicina, especialmente en la resolución de casos complejos. La historia de la IA en la medicina no es nueva: desde los años 70, sistemas como INTERNIST-1 buscaron replicar el razonamiento humano, aunque su adopción fue limitada. Hoy, con herramientas como ChatGPT-4, el panorama cambia, gracias a su capacidad para interpretar el lenguaje natural y generar diagnósticos precisos de manera ágil y accesible.

