Semana passada um artigo publicado pela NEJM AI começou a ser mencionado entre as pessoas interessadas por IA e saúde. Seu título: Experimento randomizado de um Chatbot de IA Generativa para tratamento de saúde mental (Randomized Trial of a Generative AI Chatbot for Mental Health Treatment).

Todas as chamadas e resumos dos artigos noticiavam o seguinte: “O primeiro estudo clínico de um bot terapêutico que utiliza IA generativa sugere que ele foi tão eficaz quanto a terapia humana para participantes com depressão, ansiedade ou risco de desenvolver transtornos alimentares.”

Em português claro: NÃO foi isso que o estudo fez.

Como sempre, não há nenhum juízo de valor moral (ou correlato) sobre as matérias, menos ainda sobre o artigo.

O que o artigo fez, então? Se você quer a versão TLDR (too long, didn’t read), ela está aqui: a comparação foi entre usar uma ferramenta de IA generativa “treinada” para terapia versus lista de espera, ou seja, não fazer nada. E, nessa comparação, a análise entre grupos mostrou que a terapia AI GEN foi melhor que “não fazer nada”.

⇒ Repetindo: a comparação fundamental do artigo foi Terapia mediada por IA (Therabot) versus Lista de espera (ou seja, não fazer nada)

Assim, de novo: o estudo NÃO comparou terapia mediada por humanos versus terapia mediada por IA.

Uma versão menos resumida:

Já adianto que uma análise estatística detalhada e uma discussão mais profunda sobre o resultado serão abordados numa futura parte 2.

Metodologia

O desenho experimental foi o seguinte: os pesquisadores recrutaram 210 voluntários e dividiram (de forma aleatorizada) em 2 grupos:

  1. 104 pessoas como controle EM LISTA DE ESPERA
  2. 106 pessoas com 3 diagnósticos possíveis: depressão maior (MDD), ansiedade generalizada (GAD) e distúrbios alimentares (CHR-FED).