Imagem Modelo de aprendizado de máquina para triagem de pesquisa de clone de Hemoblobinúria Paroxística Noturna

10 de março de 2026

Modelo de aprendizado de máquina para triagem de pesquisa de clone de Hemoblobinúria Paroxística Noturna

Felipe Magalhães Furtado; Adâmara Felício

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

A hemoglobinúria paroxística noturna caracteriza-se como uma desordem hematológica clonal e adquirida, com origem em mutações somáticas no gene fosfatidilinositol glicano classe A, localizado no cromossomo X. Essa alteração genética nas células-tronco hematopoiéticas resulta na deficiência parcial ou total de proteínas ancoradas pelo glicosilfosfatidilinositol na superfície das membranas celulares (Brodsky, 2014). A ausência dessas proteínas reguladoras, especificamente o CD55 e o CD59, torna as células sanguíneas vulneráveis à lise mediada pelo sistema complemento, desencadeando um quadro clínico complexo que envolve hemólise intravascular crônica, episódios de trombose venosa ou arterial e graus variáveis de falência medular (Cançado et al., 2021). Embora seja considerada uma patologia rara, com incidência estimada entre um e dois casos por milhão de habitantes, a gravidade das complicações e o impacto direto na mortalidade exigem métodos diagnósticos precisos e ágeis (Richards et al., 2021). O padrão-ouro para a identificação da doença é a citometria de fluxo multiparamétrica, técnica que permite a detecção de populações celulares deficientes em proteínas ligadas ao glicosilfosfatidilinositol em diferentes linhagens hematológicas.

A análise imunofenotípica por citometria de fluxo fundamenta-se na utilização de lasers e anticorpos monoclonais conjugados a fluorocromos para a caracterização detalhada de propriedades físicas e químicas das células (Bertho e Ferraz, 2013). No contexto da triagem para a patologia em questão, o diagnóstico baseia-se na identificação de neutrófilos e monócitos que não expressam marcadores específicos, como o CD157 e a variante fluorescente da aerolisina, conhecida como FLAER (Sutherland et al., 2018). Tradicionalmente, a interpretação desses dados é realizada de forma manual por especialistas, processo que envolve a segmentação de populações celulares em gráficos de dispersão e a análise subjetiva de intensidades de fluorescência. Tal abordagem, além de demandar tempo considerável, está sujeita à variabilidade interobservador e exige treinamento técnico exaustivo. Com o aumento da complexidade dos painéis diagnósticos e do volume de exames laboratoriais, a integração de ferramentas de inteligência artificial surge como uma alternativa para otimizar o fluxo de trabalho e aumentar a reprodutibilidade dos resultados (Dinalankara et al., 2024).

O desenvolvimento de modelos de aprendizado de máquina aplicados à hematologia laboratorial tem demonstrado potencial para reduzir erros diagnósticos e melhorar a eficiência operacional (Harrison et al., 2021). Algoritmos baseados em redes neurais artificiais e árvores de decisão podem processar grandes volumes de dados brutos provenientes dos citômetros, identificando padrões fenotípicos que definem clones anormais com alta precisão (Seheult et al., 2025). No entanto, a transição dessas tecnologias para o ambiente clínico exige validações rigorosas que garantam a segurança do paciente e a conformidade com as normas de medicina laboratorial (Bogdanoski et al., 2024). A aplicação de modelos supervisionados para a detecção de clones da doença em neutrófilos e monócitos justifica-se pela padronização dos anticorpos utilizados e pela clareza das populações celulares envolvidas, permitindo que o algoritmo aprenda a distinguir entre células normais e aquelas com deficiência de proteínas ancoradas (Sutherland et al., 2018). O objetivo central reside na criação de um sistema de triagem capaz de sinalizar amostras suspeitas, direcionando a atenção do analista para casos que apresentem evidências quantitativas de populações clonais.

A metodologia empregada para a construção dos modelos utilizou dados de amostras de sangue periférico processadas em rotina diagnóstica entre janeiro de 2024 e agosto de 2025, em um laboratório de análises clínicas em Brasília. O conjunto de dados inicial foi composto por 40 amostras para o desenvolvimento, sendo 20 normais e 20 contendo clones da patologia, além de 40 amostras distintas destinadas à validação analítica. Para assegurar a qualidade analítica, estabeleceu-se que cada amostra deveria conter no mínimo 50.000 células. O processamento dos dados brutos foi realizado através do software Infinicyt, convertendo arquivos no formato original para planilhas eletrônicas. As variáveis selecionadas incluíram parâmetros de tamanho e complexidade celular, como o espalhamento frontal e lateral, além das intensidades de fluorescência para os marcadores CD45, CD15, CD64, CD157 e FLAER. Durante a fase de pré-processamento, as variáveis de tempo e o sinal de espalhamento lateral de alta sensibilidade foram excluídos para reduzir ruídos e redundâncias.

O tratamento estatístico dos dados envolveu a aplicação da transformação arco seno hiperbólico com fator de divisão cinco, técnica essencial para estabilizar a variância e facilitar a diferenciação entre populações positivas e negativas em dados de citometria (Finak et al., 2010). Para a remoção de valores atípicos, utilizaram-se critérios rigorosos baseados em gráficos de dispersão, mantendo, por exemplo, ocorrências de espalhamento frontal entre 35.000 e 200.000 unidades. A padronização das variáveis numéricas foi executada por meio do escore Z, utilizando os parâmetros calculados exclusivamente na base de treino para evitar o vazamento de informações para os conjuntos de teste e validação. Devido ao desequilíbrio inerente entre o número de células normais e anormais, aplicou-se a técnica de sobreamostragem sintética de minorias, gerando instâncias sintéticas da classe positiva para equilibrar o treinamento dos modelos (Imani et al., 2025).

Foram desenvolvidas duas arquiteturas distintas de aprendizado de máquina: uma floresta aleatória e uma rede neural artificial do tipo feed-forward. O modelo de floresta aleatória foi configurado com 500 árvores de decisão, utilizando o critério de divisão baseado na raiz quadrada do número de variáveis em cada nó. Já a rede neural foi projetada com uma camada de entrada de oito neurônios, duas camadas ocultas densas com 16 e oito neurônios respectivamente, utilizando a função de ativação ReLU e camadas de descarte de 25% para prevenir o sobreajuste. A camada de saída empregou a função sigmoide para gerar probabilidades de pertencimento à classe clonal. O treinamento da rede neural utilizou o otimizador Adam e a função de perda de entropia cruzada binária, com monitoramento da área sob a curva de precisão-sensibilidade para interrupção precoce do processo (Saito e Rehmsmeier, 2015).

A avaliação do desempenho dos modelos considerou três estratégias de definição de limiar de decisão: o índice de Youden, o ponto de máximo F1-score e a sensibilidade mínima pré-definida de 0,95. A escolha do limiar é crítica em aplicações médicas, pois determina o equilíbrio entre a capacidade de detectar casos positivos e a taxa de alarmes falsos. Para a validação analítica, seguiu-se o protocolo de comparação de métodos, avaliando a acurácia qualitativa e quantitativa, a repetitividade e a capacidade de detecção (Devitt et al., 2023). A análise qualitativa considerou uma amostra como positiva se o modelo identificasse mais de 50 células clonais, seguindo as diretrizes internacionais de consenso para o diagnóstico da doença por citometria de fluxo (Sutherland et al., 2018).

Os resultados da análise exploratória revelaram que as distribuições das variáveis não apresentavam normalidade, conforme indicado pelo teste de Shapiro-Wilk, e exibiam heterocedasticidade pelo teste de Levene. O teste de Mann-Whitney confirmou diferenças estatisticamente significativas entre o grupo normal e o grupo com a patologia para todas as variáveis analisadas, com valores de p inferiores a 0,001 (Fávero e Belfiore, 2025). Observou-se que os neutrófilos clonais apresentavam intensidades de fluorescência drasticamente reduzidas para FLAER e CD157 em comparação aos neutrófilos normais, validando a escolha desses parâmetros como preditores fundamentais para os modelos. Na base de teste, ambos os modelos demonstraram desempenho excepcional, com áreas sob a curva ROC superiores a 0,99 e áreas sob a curva de precisão-sensibilidade acima de 0,98. A floresta aleatória apresentou acurácia de 0,9389 e especificidade de 1,0000, enquanto a rede neural obteve acurácia de 0,9583 e sensibilidade de 0,8517.

Na fase de validação analítica com amostras externas, a floresta aleatória demonstrou robustez superior, alcançando 100% de concordância qualitativa com a análise manual realizada por especialistas. Em contrapartida, a rede neural apresentou apenas 45% de concordância, falhando ao classificar amostras normais como positivas devido à superestimação de eventos clonais. A análise quantitativa por meio do teste de Wilcoxon pareado e do gráfico de Bland-Altman confirmou que a floresta aleatória não apresentava viés sistemático significativo, com uma mediana de viés de apenas uma célula e limites de concordância estreitos entre -22,25 e +24,25 células. Esses dados sugerem que o modelo de floresta aleatória é capaz de reproduzir a contagem celular realizada manualmente com precisão clínica aceitável.

A repetitividade do modelo de floresta aleatória foi testada através do processamento de 10 amostras em triplicata, resultando em contagens idênticas em todas as rodadas, o que evidencia a estabilidade do algoritmo frente ao mesmo conjunto de dados. No teste de capacidade de detecção, o modelo foi capaz de identificar a presença de clones em amostras contaminadas artificialmente com pequenas quantidades de células anormais. Em cenários com 200 e 100 células inseridas, o algoritmo detectou consistentemente mais de 50 eventos, atingindo o critério para classificação positiva. No limite inferior de 50 células, o modelo identificou corretamente a presença do clone em três de cinco cenários, demonstrando sensibilidade para detecção de clones pequenos, embora com maior variabilidade nessa faixa limítrofe.

A discussão dos resultados aponta que a floresta aleatória supera a rede neural na tarefa de triagem clínica para esta patologia específica, provavelmente devido à sua menor susceptibilidade ao sobreajuste em conjuntos de dados com características fenotípicas muito bem delimitadas. A falha da rede neural na validação externa, apesar do excelente desempenho no treinamento, reforça a necessidade de cautela ao aplicar modelos de aprendizado profundo em medicina diagnóstica sem uma base de dados massiva e diversificada (Ng et al., 2024). A capacidade da floresta aleatória em manter a especificidade em 100% é um fator determinante para sua utilidade como ferramenta de triagem, pois minimiza a ocorrência de resultados falso-positivos que gerariam ansiedade desnecessária aos pacientes e custos adicionais ao laboratório.

A implementação prática de tais modelos exige a integração com softwares de aquisição de dados e sistemas de informação laboratorial para que o processamento ocorra de forma automatizada logo após a leitura da amostra no citômetro. Além disso, é imperativo estabelecer um programa de monitoramento pós-implantação para avaliar o desempenho contínuo do modelo frente a variações de lotes de reagentes ou calibrações de equipamentos (Seheult et al., 2025). Embora o modelo de floresta aleatória tenha se mostrado promissor, ele não substitui a revisão final por um profissional qualificado, mas atua como um filtro inteligente que prioriza casos críticos e aumenta a confiança no processo diagnóstico. Pesquisas futuras devem focar na expansão do banco de dados para incluir casos com fenótipos raros ou interferentes biológicos, além de explorar arquiteturas de modelos que possam integrar dados de diferentes linhagens celulares, como as hemácias, para um diagnóstico ainda mais abrangente.

As limitações deste estudo incluem o uso de dados de um único centro laboratorial e a restrição da análise às linhagens de neutrófilos e monócitos. A variabilidade técnica entre diferentes modelos de citômetros e protocolos de coloração pode influenciar o desempenho do algoritmo, sugerindo que a calibração local é necessária antes da adoção em larga escala. No entanto, a metodologia de validação analítica empregada segue os rigorosos padrões exigidos para a introdução de novas tecnologias em medicina laboratorial, conferindo credibilidade aos achados (Devitt et al., 2023). A transparência no processo de pré-processamento e a escolha de métricas de avaliação centradas na relevância clínica garantem que o modelo desenvolvido possua aplicabilidade real no suporte à decisão médica.

Conclui-se que o objetivo foi atingido, uma vez que o modelo de floresta aleatória desenvolvido demonstrou alta acurácia e robustez técnica para a triagem de clones de hemoglobinúria paroxística noturna em ambiente laboratorial. A ferramenta provou ser capaz de identificar populações celulares anormais com concordância total em relação ao método de referência manual, mantendo estabilidade e precisão quantitativa. Enquanto a rede neural exigiria conjuntos de dados mais amplos para atingir confiabilidade clínica, a floresta aleatória apresenta-se como uma solução viável e segura para otimizar o diagnóstico citométrico, reduzindo a carga de trabalho manual e padronizando a interpretação de exames complexos.

Referências Bibliográficas:

Bertho, A. L.; Ferraz, R. (2013). Citometria de fluxo: princípios metodológicos de funcionamento. Editora Atheneu.

Bierzanowski, S.; Pietruczuk, K. (2025). Revolution in flow cytometry: using artificial intelligence for data processing and interpretation. European Journal of Translational and Clinical Medicine.

Breiman, L. (2001). Random Forests. Machine Learning.

Brodsky, R. A. (2014). Paroxysmal nocturnal hemoglobinuria. Blood.

Cançado, R. D.; Araújo, A. S.; Sandes, A. F.; Arrais, C.; Lobo, C. L. C.; Figueiredo, M. S.; Gualandro, S. F. M.; Saad, S. T. O.; Costa, F. F. (2021). Consensus statement for diagnosis and treatment of paroxysmal nocturnal haemoglobinuria. Hematology Transfusion Cell Therapy.

Cortez, P.; Neves, J. (2000). Redes Neurais Artificiais. Universidade do Minho.

Devitt, K. A.; Oldaker, T.; Shah, K.; Illingworth, A. (2023). Summary of validation considerations with real-life examples using both qualitative and semiquantitative flow cytometry assays. Cytometry.

Fávero, L. P.; Belfiore, P. (2025). Manual de análise de dados: estatística e

Resumo executivo oriundo de Trabalho de Conclusão de Curso de MBA em Data Science, Inteligência Artificial e Analytics

Saiba mais sobre o curso, clique aqui

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade