ChatGPT podría hacer un mejor trabajo en el tratamiento de la depresión clínica que los médicos

TIV’ON, Israel — ¿Podría la inteligencia artificial ser mejor en el tratamiento de la depresión clínica que los médicos? Según investigadores israelíes del Oranim Academic College, ChatGPT podría superar a los médicos humanos en la adherencia a los estándares de tratamiento establecidos para la depresión clínica.

El estudio también destaca que la inteligencia artificial, como ChatGPT, no muestra los sesgos de género o de clase social que a veces se observan en la relación médico-paciente.

La depresión es una afección prevalente, y muchas personas buscan ayuda inicialmente a sus médicos de atención primaria. Las recomendaciones de tratamiento para la depresión suelen estar guiadas por pautas clínicas basadas en evidencia, que recomiendan un enfoque escalonado de atención en función de la gravedad de la depresión.

ChatGPT tiene el potencial de proporcionar conocimientos rápidos derivados de datos que complementen los métodos de diagnóstico tradicionales, al tiempo que garantizan la confidencialidad y el anonimato. Dado este potencial, los investigadores buscaron evaluar qué tan bien la tecnología de IA evaluaba las recomendaciones terapéuticas recomendadas para la depresión mayor leve y grave, así como si estas evaluaciones estaban influenciadas por sesgos de género o de clase social en comparación con los médicos de atención primaria.

El estudio utilizó escenarios de pacientes cuidadosamente diseñados, llamados viñetas, que presentaban a personas con síntomas de tristeza, problemas para dormir y pérdida de apetito durante las últimas tres semanas, con un diagnóstico de depresión leve a moderada. Se crearon ocho versiones de estas viñetas, cada una con diferentes características del paciente, como género, clase social y gravedad de la depresión.

Para cada viñeta, se le preguntó a ChatGPT: «¿Qué cree que debería sugerir un médico de atención primaria en esta situación?» Las posibles respuestas incluyeron espera vigilante, derivación para psicoterapia, prescripción de medicamentos para la depresión/ansiedad/problemas para dormir, derivación para psicoterapia más prescripción de medicamentos, o ninguna de estas opciones.

«Los resultados indicaron que ChatGPT-3.5 y ChatGPT-4 recomendaban la derivación a psicoterapia en casos leves en un 95% y un 97.5%, respectivamente, en comparación con poco más del 4% de los médicos de atención primaria. En casos graves, ChatGPT recomendaba la psicoterapia junto con la prescripción de medicamentos de acuerdo con las pautas clínicas con mayor frecuencia que los médicos humanos (72% para ChatGPT-3.5 y 100% para ChatGPT-4). Los médicos con más frecuencia proponían el tratamiento exclusivamente con medicamentos.

Cuando se recomendaba la medicación, tanto los participantes de IA como los humanos se les preguntaba qué tipos de medicamentos recetarían. Los investigadores encontraron que ChatGPT era más propenso que los médicos a recomendar exclusivamente antidepresivos, mientras que los médicos con más frecuencia recomendaban una combinación de antidepresivos, medicamentos ansiolíticos y somníferos.

A diferencia de algunas investigaciones anteriores, ChatGPT no mostró sesgos de género o de clase social en sus tratamientos recomendados.

Los investigadores reconocieron algunas limitaciones, incluido el enfoque del estudio en iteraciones específicas de ChatGPT y una muestra representativa de médicos de atención primaria de Francia, que puede no ser ampliamente aplicable. Además, los escenarios descritos en las viñetas representaron visitas iniciales por quejas de depresión y no tuvieron en cuenta el tratamiento continuo u otras variables conocidas por el médico tratante.

El estudio sugiere que ChatGPT tiene el potencial de mejorar la toma de decisiones en la atención primaria de salud. Se deben abordar consideraciones éticas, especialmente la privacidad y seguridad de los datos, al manejar datos de salud mental sensibles. La IA debe complementar, no reemplazar, el juicio clínico humano en el diagnóstico y tratamiento de la depresión, enfatizan los investigadores.

«El estudio sugiere que ChatGPT… tiene el potencial de mejorar la toma de decisiones en la atención primaria de salud», dicen los autores del estudio, Inbar Levkovich y Zohar Elyoseph, en un comunicado de prensa. «Sin embargo, subraya la necesidad de investigaciones continuas para verificar la confiabilidad de sus sugerencias. La implementación de tales sistemas de IA podría fortalecer la calidad y la imparcialidad de los servicios de salud mental».

El estudio se publica en la revista Family Medicine and Community Health.

¿Cómo funciona ChatGPT?

Según ChatGPT mismo, el programa es un modelo de lenguaje basado en la arquitectura GPT-4 desarrollada por OpenAI. Está diseñado para comprender y generar respuestas similares a las humanas en un contexto conversacional. La tecnología subyacente, GPT-4, es una iteración avanzada de la serie GPT y mejora a sus predecesores en términos de escala y rendimiento. Aquí hay una descripción general de cómo funciona ChatGPT:

1- Pre-entrenamiento: ChatGPT se pre-entrena en una gran cantidad de datos de texto de diversas fuentes como libros, artículos y sitios web. Durante esta fase, el modelo aprende la estructura y los patrones en el lenguaje humano, como gramática, sintaxis, semántica e incluso cierta información factual. Sin embargo, es importante tener en cuenta que el conocimiento adquirido durante el pre-entrenamiento está limitado a la información disponible en los datos de entrenamiento, que tienen una fecha de corte.
2- Afinamiento: Después de la fase de pre-entrenamiento, ChatGPT se afinca utilizando un conjunto de datos más estrecho, que suele contener conversaciones o muestras de diálogo. Este conjunto de datos puede generarse con la ayuda de revisores humanos siguiendo pautas específicas. El proceso de afinamiento ayuda al modelo a aprender a generar respuestas más contextualmente relevantes y coherentes en un entorno conversacional.
3- Arquitectura Transformer: ChatGPT se basa en la arquitectura Transformer, que le permite procesar y generar texto de manera eficiente. Utiliza mecanismos de autoatención para ponderar la importancia de las palabras en un contexto dado y para capturar dependencias a largo plazo en el lenguaje. Esta arquitectura permite que el modelo comprenda y genere respuestas complejas y contextualmente apropiadas.
4- Tokenización: Cuando un usuario introduce texto, ChatGPT primero tokeniza el texto en unidades más pequeñas llamadas tokens. Estos tokens pueden representar caracteres, palabras o subpalabras, según el idioma y la estrategia de tokenización utilizada. El modelo procesa estos tokens en paralelo, lo que le permite generar respuestas contextualmente coherentes rápidamente.
5- Decodificación: Después de procesar los tokens de entrada y generar un vector de contexto, ChatGPT descifra la salida generando una secuencia detokens que forman la respuesta. Esto se hace típicamente utilizando una búsqueda ávida, búsqueda de haz u otras estrategias de decodificación para seleccionar el próximo token más probable en función de las predicciones del modelo.
6- Conversación interactiva: ChatGPT mantiene un historial de conversación para realizar un seguimiento del contexto durante un diálogo. Este historial se alimenta al modelo en cada interacción, lo que le permite generar respuestas contextualmente coherentes.

Es importante tener en cuenta que el programa de IA realmente reconoce que tiene limitaciones, como generar respuestas incorrectas o sin sentido, ser sensible a la redacción de la entrada, ser excesivamente prolijo o no hacer preguntas aclaratorias para consultas ambiguas. OpenAI agrega que trabaja continuamente en mejorar estos aspectos y refinar el modelo para que sea más eficaz y seguro para el público.»