
19 de fevereiro de 2026
Modelo preditivo para otimização de tratamentos em saúde mental
Renata de Oliveira Valentim; Gabrielle Maria Romeiro Lombardi
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Este estudo analisou estatisticamente e propôs um modelo preditivo para apoiar o tratamento de pacientes com Transtorno Depressivo Maior (TDM), Transtorno de Ansiedade Generalizada (TAG), Transtorno Bipolar (TB) e Transtorno de Pânico (TP). Utilizando algoritmos de machine learning, a pesquisa avaliou o desempenho na identificação das combinações mais eficazes de tratamento (farmacológico, psicoterapia, exercício físico), considerando variáveis como idade e gênero. O objetivo foi contribuir para a personalização do cuidado em saúde mental, explorando o potencial da IA para ampliar o acesso a terapias baseadas em evidências e superar os modelos de tentativa e erro. A investigação também buscou desenvolver um protótipo de sistema de apoio à decisão clínica e diagnosticar a viabilidade e os pré-requisitos de dados para sua implementação.
A saúde mental é um pilar do bem-estar, mas sistemas de saúde globais enfrentam barreiras como subfinanciamento e acesso restrito. Pessoas com transtornos mentais enfrentam estigma, discriminação e violações de direitos, fatores que agravam sua condição (WHO, 2025). Em 2019, estimava-se que 970 milhões de pessoas globalmente viviam com algum transtorno mental, sendo ansiedade e depressão os mais prevalentes. A pandemia de COVID-19 agravou o cenário, com um aumento de 25% na prevalência global desses transtornos (WHO, 2022).
Os impactos geram perdas econômicas por queda de produtividade que superam os custos diretos do tratamento. No Brasil, entre 2014 e 2024, mais de 470 mil afastamentos do trabalho foram atribuídos a transtornos mentais, refletindo o ônus socioeconômico (Casemiro et al., 2025). A crise afeta desproporcionalmente categorias como enfermeiros, professores e policiais. Estudos apontam que enfermeiros apresentam risco elevado de ansiedade, depressão e Burnout (Luz et al., 2021). Similarmente, uma pesquisa com professores revelou que 75% relataram transtornos psíquicos menores e 44% foram diagnosticados com depressão (Caldas et al., 2025).
Disparidades de gênero são um fator crítico: mulheres apresentam maior prevalência de ansiedade e depressão, enquanto homens, menos diagnosticados, enfrentam maior risco de suicídio, influenciados por fatores socioculturais (Morais et al., 2025). A literatura corrobora que Transtorno Depressivo Maior (Salk et al., 2017), Transtorno de Ansiedade Generalizada (Vesga-López et al., 2008) e Transtorno de Pânico (McLean et al., 2011) ocorrem com frequência aproximadamente duas vezes maior em mulheres. O TDM é marcado por perda de prazer e alterações de apetite e sono; o TB envolve oscilações de humor; o TAG manifesta-se por preocupação excessiva; e o TP é caracterizado por ataques de medo intenso.
Tratamentos convencionais, como farmacoterapia e Terapia Cognitivo-Comportamental (TCC) (Mayo Clinic, 2025), consideram o histórico clínico (Češková et al., 2020), mas a integração de variáveis genéticas, ambientais e comportamentais é limitada. Isso compromete a eficácia e reforça a necessidade de modelos de saúde mental de precisão, que visam combinar diversas fontes de dados para orientar intervenções personalizadas (Quinlan et al., 2020; Pulciani et al., 2017; Bickman et al., 2014). A inteligência artificial (IA) emerge como ferramenta para analisar grandes volumes de dados e prever as combinações de tratamento mais eficazes, apoiando a decisão clínica (Lobo, 2017). A integração de digicêuticos, como aplicativos de saúde e terapias de realidade virtual, representa uma fronteira inovadora (Eskandar, 2024).
A metodologia foi um estudo experimental com análise de dados secundários, utilizando o conjunto de dados sintéticos do Kaggle, “Mental Health Diagnosis and Treatment Monitoring”. A natureza sintética dos dados eliminou a necessidade de aprovação por Comitê de Ética. As variáveis analisadas incluíam ID do paciente, idade, gênero, diagnóstico (TDM, TAG, TB, TP), gravidade dos sintomas, pontuação de humor, qualidade do sono, nível de atividade física, tipo de medicação, tipo de terapia, duração do tratamento, nível de estresse e o desfecho clínico (melhora, piora, sem mudança). O objetivo era testar a viabilidade de um modelo preditivo para identificar a melhor combinação de tratamento, incluindo intervenções digitais.
A primeira fase, Análise Exploratória de Dados (EDA), buscou compreender as distribuições e relações entre as variáveis. A etapa incluiu a análise de variáveis demográficas e clínicas, a identificação de correlações e a criação de visualizações com Matplotlib e Seaborn em Python. Foram aplicados testes estatísticos como o Qui-Quadrado, para avaliar a associação entre variáveis categóricas, e testes de normalidade como Shapiro-Wilk e Kolmogorov-Smirnov, informando a subsequente etapa de modelagem.
Na fase de modelagem preditiva, foram testados três algoritmos de machine learning com a biblioteca Scikit-learn para prever a eficácia do tratamento: Regressão Logística Multinomial, um modelo clássico escolhido por sua interpretabilidade como linha de base (Favero et al., 2024); Random Forest, um algoritmo de ensemble baseado em árvores de decisão, selecionado por sua capacidade de capturar relações complexas e não lineares (Breiman, 2001); e Gradient Boosting, um método de ensemble sequencial que otimiza erros residuais para alta capacidade preditiva (Friedman, 2001).
Para validação, o conjunto de dados foi dividido em amostras de treino (70%) e teste (30%). O desempenho foi avaliado com métricas de classificação, incluindo acurácia (previsões corretas), precisão (exatidão das previsões positivas), recall (capacidade de identificar casos positivos) e F1-score (média harmônica entre precisão e recall). Adicionalmente, foi calculada a Área Sob a Curva ROC (AUC) para avaliar a capacidade do modelo de discriminar entre as classes de desfecho. A combinação dessas métricas permitiu uma avaliação completa do desempenho de cada modelo.
A análise exploratória revelou uma amostra de 500 indivíduos com idade concentrada entre 19 e 60 anos, com predominância da faixa de 19 a 30 anos (28,2%). A participação de crianças e adolescentes (0 a 18 anos) foi mínima (2,4%). A distribuição de gênero foi equilibrada (53,2% masculino, 46,8% feminino). Quanto aos diagnósticos, o TAG foi o mais prevalente (27%), seguido por TDM (25%), TB (24,8%) e TP (23,2%). A distribuição dos tipos de medicação e terapia foi homogênea, e a prática de atividade física foi moderada a elevada, com a maioria relatando entre 4 e 10 horas semanais.
A análise da relação entre diagnóstico e desfecho clínico (piora, melhora, sem mudança) mostrou que, embora o TAG concentrasse a maior proporção de melhora (39,26%) e o TDM a maior parcela sem mudança (39,20%), as diferenças não foram estatisticamente significativas. O teste Qui-Quadrado resultou em um p-valor de 0,108, indicando ausência de evidências de associação entre diagnóstico e resultado do tratamento. A análise dos resíduos padronizados corroborou essa conclusão, não identificando diferenças significativas, com todos os valores de resíduo permanecendo abaixo do limiar de |2|.
As medidas de associação, como o Coeficiente de Contingência (C=0,14) e o V de Cramer (φc=0,10), reforçaram a ausência de uma relação clinicamente relevante, indicando uma associação muito fraca (Cohen, 1988). Essa falta de associação pode ser explicada pela estrutura do dataset sintético; todos os pacientes receberam uma combinação de farmacoterapia e psicoterapia, o que pode ter atenuado as diferenças esperadas com base na literatura, que sugere maior resposta em TAG (Bandelow et al., 2017) e maior dificuldade de remissão em TDM (Rush et al., 2006). A ausência de preditores fortes sugere que fatores não incluídos, como comorbidades e biomarcadores, desempenham um papel mais influente, ressaltando a necessidade de modelos de saúde de precisão (Češková & Šilhán, 2021; Bickman et al., 2014).
Outras análises confirmaram a ausência de padrões significativos. A matriz de correlação entre variáveis clínicas numéricas (gravidade dos sintomas, humor, qualidade do sono, nível de estresse) mostrou coeficientes extremamente baixos (|r| < 0,1). Os testes de normalidade (Shapiro-Wilk e Kolmogorov-Smirnov) rejeitaram a hipótese de normalidade para todas as variáveis numéricas (p < 0,001). Testes de hipóteses como o de Kruskal-Wallis não encontraram diferenças significativas na mediana da gravidade dos sintomas (p = 0,4488) ou na pontuação de humor (p = 0,5627) entre os diagnósticos. Tampouco foi encontrada associação entre tipo de terapia e resultado (Qui-Quadrado, p = 0,1445) ou correlação entre qualidade do sono e nível de estresse (Spearman, p = 0,4025). O nível de estresse também se mostrou uniforme entre os diagnósticos (ANOVA, p = 0,906), sugerindo que as variáveis disponíveis careciam de poder discriminatório.
Na modelagem preditiva, os três algoritmos apresentaram desempenho baixo, convergindo para uma acurácia de 34%, valor próximo ao de uma classificação aleatória. O modelo de Regressão Logística Multinomial alcançou essa acurácia com métricas de precisão, recall e F1-score igualmente baixas, e curvas ROC com valores de AUC próximos a 0,5
Conclui-se que o objetivo foi atingido, preservando-se os achados e a contribuição prática delineada.
Referências:
Bandelow, B.; Michaelis, S. 2017. Epidemiology of anxiety disorders in the 21st century. Dialogues in Clinical Neuroscience 19(2): 89-97.
Bickman, L.; Lyon, A. R.; Wolpert, M. 2016. Achieving Precision Mental Health through Effective Assessment, Monitoring, and Feedback Processes. Adm Policy Ment Health 43:271–276.
Borelli, J. L.; Wang, Y.; Li, F. H.; Russo, L. N.; Tironi, M.; Yamashita, K.; Zhou. El.; Lai, J.; Nguyen, B.; Azimi, I.; Marcotullio, C.; Labbaf, S.; Jafarlou, S.; Dutt, N.; Rahmani, A. 2025. Detection of Depressive Symptoms in College Students Using Multimodal Passive Sensing Data and Light Gradient Boosting Machine: Longitudinal Pilot Study. JMIR Form Res(9):1
Brasil. 2024. Resolução nº 10, de 2 de julho de 2024. Regulamenta as atribuições do farmacêutico na Saúde Digital e Inteligência Artificial e dá outras providências. Conselho Federal de Farmácia. Diário Oficial da União, Brasília, 2 jul. 2024.
Breiman, L. 2001. Random Forests. Machine Learning 45(1): 5–32.
Caldas, F. B.; Reis, C. P. M.; Gomes-Souza, R.; Azevedo, L. A.; Lima, K. S. 2025. Adoecimento mental em professores da educação básica: uma revisão sistemática da literatura. Cadernos de Educação 24(48): 1-22.
Casemiro, P.; Moura, R. 2025. Crise de saúde mental: Brasil tem maior número de afastamentos por ansiedade e depressão em 10 anos. Disponível em: <https://g1. globo. com/trabalho-e-carreira/noticia/2025/03/10/crise-de-saude-mental-brasil-tem-maior-numero-de-afastamentos-por-ansiedade-e-depressao-em-10-anos. ghtml>. Acesso em: 16 mar. 2025.
Češková, E.; Šilhán, P. 2021. From Personalized Medicine to Precision Psychiatry? Neuropsychiatric Disease and Treatment: 17 3663–3668.
Christodoulou, E., Ma, J., Collins, G. S., Steyerberg, E. W., Verbakel, J. Y., & Van Calster, B. 2019. A systematic review shows no performance benefit of machine learning over logistic regression for clinical prediction models. Journal of Clinical Epidemiology, 110, 12–22.
Cohen, J. 1988. Statistical power analysis for the behavioral sciences. 2 ed. New York: Routledge.
Eskandar, K. 2024. The impact of virtual reality exposure therapy in the treatment of PTSD and anxiety disorders. Debates em Psiquiatria 14: 1-21.
Favero, L. P., Belfiore, P. 2024. Manual de Análise de Dados: Estatística e Machine Learning com Excel, SPSS, Stata, R e Python. GEN LTC.
Franken, K., ten Klooster, P., Bohlmeijer, E., Westerhof, G., & Kraiss, J. (2023). Predicting non-improvement of symptoms in daily mental healthcare practice using routinely collected patient-level data: a machine learning approach. Frontiers in Psychiatry, 14, 1236551
Friedman, J. H. 2001. Greedy Function Approximation: A Gradient Boosting Machine. Annals of Statistics 29(5): 1189–1232.
Grande, I.; Berk, M.; Birmaher, B.; Vieta, E. 2016. Bipolar disorder. The Lancet 387(10027): 1561-1572.
Lobo, L. C. 2017. Inteligência Artificial e Medicina. Revista Brasileira de Educação Médica 41(2): 185-193.
Luz, D. C. R. P.; Campos, J. R. E.; Bezerra, P. O. S.; Campos, J. B. R.; Nascimento, A. M. V.; Barros, A. B. 2021. Burnout e saúde mental em tempos de pandemia de COVID-19: revisão sistemática com metanálise. Revista Nursing 24(276): 5714-5719.
MAYO CLINIC. Mood disorders. Disponível em: https://www. mayoclinic. org/diseases-conditions/mood-disorders/symptoms-causes/syc-20365057. Acesso em: 27 mar. 2025.
McLean, C. P.; Asnaani, A.; Litz, B. T.; Hofmann, S. G. 2011. Gender differences in anxiety disorders: prevalence, course of illness, comorbidity and burden of illness. Journal of Psychiatric Research 45(8): 1027–1035.
Moggia, D.; Lutz, W.; Brakemeier, E.-L.; Bickman, L. 2024. Treatment Personalization and Precision Mental Health Care: Where are we and where do we want to go? Administration and Policy in Mental Health and Mental Health Services Research 51(5): 611–616.
Mohamed, E. S.; Naqishbandi, T. A.;Bukhari, S. A. C; Sawrikar, I. R. V.; Hussain, A. 2023. A hybrid mental health prediction model using Support Vector Machine and Random Forest. Healthcare Analytics: v3(2023)100185.
Morais, K. M. A.; Omes, J. A.; Batista, M. H.; Bezerra, A. P. A. M.; Gascón, S. 2025. Diferenças de gênero em transtornos mentais comuns e pensamentos suicidas entre trabalhadores formais no Brasil. Saúde Coletiva (Edição Brasileira) 15(93): 14869-14874.
Pulciani, S.; Di Lonardo, A.; Fagnani, C.; Taruscio, D. 2017. P4 medicine versus Hippocrates. Ann Ist Super Sanita: 53(3):185–191.
Quinlan, E. B.; Banaschewski, T.; Barker, G. J., 2020. IMAGEN Consortium. Identifying biological markers for improved precision medicine in psychiatry. Mol Psychiatry: 25(2):243–253.
Roy-Byrne, P. P.; Craske, M. G.; Stein, M. B. 2005. Panic disorder. The Lancet 365(9458): 1023-1032.
Rush, A. J.; Trivedi, M. H.; Wisniewski, S. R.; Nierenberg, A. A.; Stewart, J. W.; Warden, D.; Niederehe, G.; Thase, M. E.; Lavori, P. W.; Lebowitz, B. D.; McGrath, P. J.; Rosenbaum, J. F.; Sackeim, H. A.; Kupfer, D. J.; Luther, J.; Fava, M. 2006. Acute and longer-term outcomes in depressed outpatients requiring one or several treatment steps: a STARD report. American Journal of Psychiatry 163(11): 1905-1917.
Salk, R. H.; Hyde, J. S.; Abramson, L. Y. 2017. Gender differences in depression in representative national samples: meta-analyses of diagnoses and symptoms. Psychological Bulletin 143(8): 783–822.
Suárez, M., Torres, A. M.; Segura, P. B.; Mateo, J. 2025. Application of the Random Forest Algorithm for Accurate Bipolar Disorder Classification. Life 2025, 15(3), 394.
U. S. Food and drug administration (FDA). 2025. Artificial Intelligence-Enabled Medical Devices. Disponível em < https://www. fda. gov/medical-devices/software-medical-device-samd/artificial-intelligence-enabled-medical-devices >. Acesso em 03 set. 2025.
Vesga-López, O.; Schneier, F.; Wang, S.; Heimberg, R.; Liu, S. M.; Hasin, D. S.; Blanco, C. 2008. Gender differences in generalized anxiety disorder: results from the National Epidemiologic Survey on Alcohol and Related Conditions (NESARC). Journal of Clinical Psychiatry 69(10): 1606–1616.
WORLD HEALTH ORGANIZATION (WHO). 2022. Early evidence of the pandemic’s impact: Scientific brie. Disponível em <https://www. who. int/publications/i/item/WHO-2019-nCoV-SciBrief-Mentalhealth-2022.1>. Acesso em 16 mar. 2025.
WORLD HEALTH ORGANIZATION (WHO). 2025. Mental health. Disponível em: <https://www. who. int/health-topics/mental-health>. Acesso em: 27 mar. 2025.
Xu, J.; Zhang, W. 2025. A machine learning-based approach to predict depression in Chinese older adults with subjective cognitive decline: a longitudinal study. Scientific Reports(15): 26985.
Estatísticas: 15961 caracteres • 2287 palavras
Resumo executivo oriundo de Trabalho de conclusão de Curso de Data Science e Analytics
Saiba mais sobre o curso, clique aqui.





































