Semana passada um artigo publicado pela NEJM AI começou a ser mencionado entre as pessoas interessadas por IA e saúde. Seu título: Experimento randomizado de um Chatbot de IA Generativa para tratamento de saúde mental (Randomized Trial of a Generative AI Chatbot for Mental Health Treatment).
Todas as chamadas e resumos dos artigos noticiavam o seguinte: “O primeiro estudo clínico de um bot terapêutico que utiliza IA generativa sugere que ele foi tão eficaz quanto a terapia humana para participantes com depressão, ansiedade ou risco de desenvolver transtornos alimentares.”
Como sempre, não há nenhum juízo de valor moral (ou correlato) sobre as matérias, menos ainda sobre o artigo.
O que o artigo fez, então? Se você quer a versão TLDR (too long, didn’t read), ela está aqui: a comparação foi entre usar uma ferramenta de IA generativa “treinada” para terapia versus lista de espera, ou seja, não fazer nada. E, nessa comparação, a análise entre grupos mostrou que a terapia AI GEN foi melhor que “não fazer nada”.
⇒ Repetindo: a comparação fundamental do artigo foi Terapia mediada por IA (Therabot) versus Lista de espera (ou seja, não fazer nada)
Assim, de novo: o estudo NÃO comparou terapia mediada por humanos versus terapia mediada por IA.
Já adianto que uma análise estatística detalhada e uma discussão mais profunda sobre o resultado serão abordados numa futura parte 2.
O desenho experimental foi o seguinte: os pesquisadores recrutaram 210 voluntários e dividiram (de forma aleatorizada) em 2 grupos: