Imagem Otimização de Nanopartículas de PLGA Orientada por Aprendizado de Máquina

26 de fevereiro de 2026

Otimização de Nanopartículas de PLGA Orientada por Aprendizado de Máquina

João Victor Brandão Quitiba; Thiago Gentil Ramires

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada á sinstese e redação.

Este estudo desenvolveu e validou um fluxo de trabalho computacional, integrando análise de imagem por aprendizado profundo e modelos de regressão, para prever composições de nanopartículas de poli(ácido láctico-co-glicólico) (PLGA) que maximizem a internalização em células de câncer de mama. A pesquisa demonstrou que abordagens orientadas por dados podem acelerar a otimização de formulações de nanomedicina, identificando os parâmetros físico-químicos mais influentes para o design de sistemas de entrega de fármacos. O câncer é um desafio global, com estimativas de 19,96 milhões de novos casos e 9,74 milhões de mortes em 2022, uma tendência crescente (Bray et al., 2024). Terapias oncológicas convencionais, como quimioterapia e radioterapia, enfrentam limitações como falta de especificidade e efeitos colaterais severos, incluindo cardiotoxicidade e nefrotoxicidade, que danificam tecidos saudáveis (Zhang et al., 2018). A eficácia dessas abordagens é frequentemente comprometida em casos de metástase; a localização de todas as células tumorais é inviável (Lin et al., 2012; Ju e Yopp, 2021).

Nesse contexto, a nanomedicina surge como uma alternativa para superar as barreiras dos tratamentos tradicionais (Li et al., 2022). As nanopartículas podem ser projetadas para encapsular fármacos de baixa solubilidade, protegê-los da degradação e aumentar sua meia-vida circulatória (Fang et al., 2014). A plataforma baseada em PLGA, um polímero biodegradável e biocompatível aprovado pelo FDA, é amplamente investigada por permitir a liberação controlada de agentes quimioterápicos (Danhier et al., 2012). A funcionalização da superfície com polietilenoglicol (PEG) melhora a estabilidade e reduz a depuração pelo sistema imunológico, processo conhecido como “stealthing” (Zhang et al., 2022). A incorporação de grupos funcionais como carboxila (–COOH) e amina (–NH2) permite o direcionamento ativo para células tumorais que superexpressam receptores específicos, aumentando a eficácia e minimizando a toxicidade sistêmica (Betancourt et al., 2009; Peer et al., 2007).

Estudos como o de Ortiz-Perez et al. (2024) demonstram a viabilidade de usar dados de HTA para construir modelos que preveem a internalização de nanopartículas de PLGA com base em sua composição. Essa abordagem permite a exploração de variáveis como a proporção de solvente/antissolvente, concentrações de PLGA e seus derivados funcionalizados, e características resultantes como diâmetro hidrodinâmico (Z-ave) e índice de polidispersão (PDI). A aplicação de aprendizado de máquina a esses dados acelera a identificação de formulações promissoras e fornece insights sobre as interações nano-bio, orientando o desenvolvimento racional de nanomedicamentos (Mekki-Berrada et al., 2021).

Este trabalho utiliza um conjunto de dados pré-existente de imagens de internalização para construir um pipeline computacional que integra quantificação automatizada de imagens e modelagem preditiva. O objetivo central foi desenvolver um modelo de aprendizado de máquina para prever a composição ideal de nanopartículas de PLGA, validando que ferramentas de ciência de dados podem reduzir o tempo e os recursos experimentais necessários para a otimização de nanocarreadores. A abordagem proposta visa prever o desempenho e interpretar os fatores determinantes, fornecendo um guia para o design de futuras formulações terapêuticas.

A metodologia utilizou um conjunto de dados público de Ortiz-Perez et al. (2024), com imagens de alto conteúdo (HCI) e dados físico-químicos de 60 formulações de nanopartículas de PLGA, testadas na linhagem celular de câncer de mama MDA-MB-468. O conjunto de dados foi gerado por Design de Experimentos (DoE) iterativo, guiado por uma rede neural bayesiana. As variáveis de formulação incluíam a proporção solvente/antissolvente (S/AS) e as proporções relativas de PLGA, PLGA-PEG (PP-L), PLGA-PEG-COOH (PP-COOH) e PLGA-PEG-NH2 (PP-NH2). As características físico-químicas, como diâmetro hidrodinâmico médio (Z-ave) e índice de polidispersão (PDI), foram registradas. O processo experimental foi dividido em quatro ciclos: um ciclo inicial de DoE com 30 formulações para treinar os modelos, seguido por três ciclos de otimização (Ciclos 1, 2 e 3) focados em exploração (redução da incerteza), explotação (maximização da internalização) e validação final (Bao et al., 2024).

Para quantificar a internalização das nanopartículas, foi empregado o modelo de aprendizado profundo Cellpose, em sua versão cpsam que integra o Segment Anything Model (SAM) (Pachitariu et al., 2025). Cellpose é um modelo de segmentação generalista que identifica e delineia células com alta precisão sem necessidade de retreinamento (Stringer et al., 2020). O pipeline de análise de imagem incluiu pré-processamento para reduzir ruído, seguido pela segmentação de núcleos e citoplasmas. A intensidade do sinal fluorescente vermelho (corante DiD encapsulado) foi quantificada dentro das máscaras celulares. A intensidade média de pixels por célula foi utilizada como métrica de internalização e variável de resposta para os modelos de regressão. Os resultados do Cellpose foram comparados com dados gerados pelo software CellProfiler para validar a abordagem (McQuin et al., 2018).

Com os dados de internalização extraídos, dez algoritmos de regressão de aprendizado de máquina foram treinados para modelar a relação entre os parâmetros de formulação e a eficiência de internalização. Os modelos incluíam Regressão Linear, Ridge, Lasso, Decision Tree, Random Forest, Gradient Boosting, SVM, K-Nearest Neighbors, MLP e uma Rede Neural customizada. Os hiperparâmetros de cada modelo foram ajustados por busca em grade (grid-search) com validação cruzada. A avaliação seguiu duas estratégias: a primeira (Conjunto de Dados A) usou as formulações do Ciclo 3 como conjunto de teste externo para avaliar a generalização. A segunda (Conjunto de Dados B) empregou uma divisão aleatória de 70/30 do conjunto completo para simular um cenário de extrapolação. O desempenho foi medido pelo coeficiente de determinação (R²) e pela raiz do erro quadrático médio (RMSE).

Para abordar a incerteza, foi implementado o algoritmo Split Conformal Prediction (SCP), uma estrutura agnóstica que gera intervalos de predição com garantias estatísticas de cobertura de 95% (Oliveira et al., 2022). O SCP calibra os intervalos com base nos erros residuais de um conjunto de calibração. Para tornar a abordagem sensível à densidade de dados, a largura do intervalo de predição foi ajustada com base na distância da nova amostra ao seu vizinho mais próximo no conjunto de treinamento. Essa adaptação, inspirada em métodos kNN (Lugosi e Matabuena, 2025), aumenta a incerteza para previsões em regiões pouco exploradas, penalizando a extrapolação e fornecendo uma medida de confiança mais realista. A análise de importância de características, com o modelo Random Forest, e a visualização de redução de dimensionalidade com RadViz (Nováková e Štěpánková, 2011) foram usadas para interpretar os modelos e identificar os fatores que influenciam a internalização. O processamento foi realizado em Python com bibliotecas como scikit-learn e cellpose.

A validação do pipeline de análise de imagem com Cellpose foi a primeira etapa dos resultados. A quantificação da internalização foi realizada em imagens RGB, marcando núcleos (DAPI, azul), citoplasmas (FITC, verde) e nanopartículas (DiD, vermelho). Após a segmentação, a intensidade média do sinal vermelho por célula foi calculada. A comparação com medições obtidas previamente com CellProfiler revelou alta correlação, com R² de 0,945 para a intensidade média por célula e 0,957 para a intensidade média por área celular. O baixo RMSE de 4,900 para a intensidade média por célula confirmou diferenças numéricas moderadas. Essa concordância demonstrou que o Cellpose, um modelo generalista de ajuste mínimo, reproduziu de forma confiável os resultados de um pipeline tradicional, validando seu uso para gerar dados de internalização de alto rendimento.

A avaliação dos modelos no Conjunto de Dados A (teste com formulações do Ciclo 3) mostrou resultados promissores. Modelos de ensemble como Gradient Boosting e Random Forest, e o SVM, alcançaram os melhores resultados, com R² de validação cruzada de aproximadamente 0,60. No conjunto de teste do Ciclo 3, o desempenho foi ainda maior, sugerindo que os modelos previam com precisão a internalização para formulações composicionalmente semelhantes às do treinamento. Este resultado valida a capacidade do modelo de guiar a otimização em regiões bem exploradas do espaço de design. A variância inexplicada de 40% indica, no entanto, que outros fatores não capturados ou a complexidade do sistema limitam a precisão global.

Quando avaliados no Conjunto de Dados B (divisão aleatória 70/30), o desempenho no conjunto de teste foi mais variável e inferior. Essa configuração simulou um cenário de extrapolação, com pontos de teste distantes dos dados de treinamento. Modelos lineares tiveram uma queda acentuada na precisão, enquanto modelos não lineares como Random Forest e Gradient Boosting mantiveram um desempenho comparativamente melhor, embora reduzido. Essa divergência ressaltou a dificuldade de generalização dos modelos para além das regiões cobertas pelos dados de treinamento. A análise de incerteza com Split Conformal Prediction (SCP) corroborou essa observação. A visualização da superfície de incerteza, projetada por PCA, mostrou que regiões com menor incerteza correspondiam às áreas densamente amostradas, enquanto a incerteza aumentava em regiões não exploradas.

A projeção RadViz complementou a análise, visualizando a distribuição das formulações no espaço de design. A projeção revelou que formulações com alta internalização prevista se agrupavam em direção à âncora da característica PP-NH2, reforçando sua importância. A influência do Z-ave também foi observada na distribuição dos pontos. As formulações formaram aglomerados estruturados, confirmando que o modelo capturou relações sistemáticas entre as características de entrada e a resposta de internalização.

A quantificação de incerteza com Split Conformal Prediction (SCP) foi um componente crucial, fornecendo uma medida de confiança para as previsões e um guia estratégico para futuros experimentos, equilibrando a exploração de novas regiões com a otimização de formulações promissoras. Embora a precisão preditiva para formulações muito distintas das de treinamento seja um desafio, a estrutura desenvolvida mostra potencial para acelerar o ciclo de desenvolvimento de nanomedicamentos, reduzindo a dependência de testes experimentais exaustivos. Conclui-se que o objetivo foi atingido: demonstrou-se que a integração de análise de imagem por aprendizado profundo e modelos de regressão pode prever e orientar o design de nanopartículas de PLGA para otimizar a internalização celular, estabelecendo um framework promissor para o desenvolvimento de nanomedicinas de próxima geração.

Referências:
Bao, Z.; Yung, F.; Hickman, R. J.; Aspuru-Guzik, A.; Bannigan, P.; Allen, C. 2024. Data-driven development of an oral lipid-based nanoparticle formulation of a hydrophobic drug. Drug Delivery and Translational Research, v. 14, n. 7, p. 1872–1887.
Betancourt, T.; Byrne, J. D.; Sunaryo, N.; Crowder, S. W.; Kadapakkam, M.; Patel, S.; Casciato, S.; Brannon-Peppas, L. 2009. PEGylation strategies for active targeting of PLA/PLGA nanoparticles. Journal of Biomedical Materials Research Part A, v. 91A, n. 1, p. 263–276.
Blanco, E.; Shen, H.; Ferrari, M. 2015. Principles of nanoparticle design for overcoming biological barriers to drug delivery. Nat Biotechnol., v. 33, n. 9, p. 941-951.
Bray, F.; Laversanne, M.; Sung, H.; Ferlay, J.; Siegel, R. L.; Soerjomataram, I.; Jemal, A. 2024. Global cancer statistics 2022: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA: A Cancer Journal for Clinicians, v. 74, n. 3, p. 229–263.
Bruix, J.; Reig, M.; Sherman, M. 2016. Evidence-Based Diagnosis, Staging, and Treatment of Patients With Hepatocellular Carcinoma. Gastroenterology, v. 150, n. 4, p. 835–853.
Cao, L.-B.; Zeng, S.; Zhao, W. 2016. Highly Stable PEGylated Poly(lactic-co-glycolic acid) (PLGA) Nanoparticles for the Effective Delivery of Docetaxel in Prostate Cancers. Nanoscale Research Letters, v. 11, n. 1, p. 305.
Cuenca, A. G.; Jiang, H.; Hochwald, S. N.; Delano, M.; Cance, W. G.; Grobmyer, S. R. 2006. Emerging implications of nanotechnology on cancer diagnostics and therapeutics. Cancer, v. 107, n. 3, p. 459–466.
Danhier, F.; Ansorena, E.; Silva, J. M.; Coco, R.; Le Breton, A.; Préat, V. 2012. PLGA-based nanoparticles: An overview of biomedical applications. Journal of Controlled Release, Drug Delivery Research in Europe. v. 161, n. 2, p. 505–522.
Donahue, N. D.; Acar, H.; Wilhelm, S. 2019. Concepts of nanoparticle cellular uptake, intracellular trafficking, and kinetics in nanomedicine. Advanced Drug Delivery Reviews, Unraveling the In Vivo Fate and Cellular Pharmacokinetics of Drug Nanocarriers. v. 143, p. 68–96.
Dos Santos, T.; Varela, J.; Lynch, I.; Salvati, A.; Dawson, K. A. 2011. Quantitative Assessment of the Comparative Nanoparticle‐Uptake Efficiency of a Range of Cell Lines. Small, v. 7, n. 23, p. 3341-3349.
Fang, R. H.; Hu, C.-M. J.; Luk, B. T.; Gao, W.; Copp, J. A.; Tai, Y.; O’Connor, D. E.; Zhang, L. 2014. Cancer Cell Membrane-Coated Nanoparticles for Anticancer Vaccination and Drug Delivery. Nano Letters, v. 14, n. 4, p. 2181–2188.
Hamdallah, S. I.; Zoqlam, R.; Erfle, P.; Blyth, M.; Alkilany, A. M.; Dietzel, A.; Qi, S. 2020. Microfluidics for pharmaceutical nanoparticle fabrication: The truth and the myth. International Journal of Pharmaceutics, v. 584, p. 119408.
Ju, M. R.; Yopp, A. C. 2021. Surgical resection of early stage hepatocellular carcinoma: balancing tumor biology with the host liver. Chinese Clinical Oncology, v. 10, n. 1, p. 5–5.
Le, D. 2015. Anti-Tumor Activity of Docetaxel PLGA-PEG Nanoparticles with a Novel Anti-HER2 scFv. Journal of Nanomedicine & Nanotechnology, v. 06.
Li, J.; Gao, X.; Wang, Y.; Xia, T.; Zhao, Y.; Meng, H. 2022. Precision design of engineered nanomaterials to guide immune systems for disease treatment. Matter, v. 5, n. 4, p. 1162–1191.
Lin, S.; Hoffmann, K.; Schemmer, P. 2012. Treatment of Hepatocellular Carcinoma: A Systematic Review. Liver Cancer, v. 1, n. 3–4, p. 144–158.
Lugosi, G.; Matabuena, M. 2025. Conformal and kNN Predictive Uncertainty Quantification Algorithms in Metric Spaces (Versão 1). arXiv. 21 Jul 2025. Disponível em: <https://doi. org/10.48550/ARXIV.2507.15741>. Acesso em: 23 ago. 2025.
Lv, H.; Chen, X. 2022. Intelligent control of nanoparticle synthesis through machine learning. Nanoscale, v. 14, n. 18, p. 6688–6708.
McQuin, C.; Goodman, A.; Chernyshev, V.; Kamentsky, L.; Cimini, B. A.; Karhohs, K. W.; Doan, M.; Ding, L.; Rafelski, S. M.; Thirstrup, D.; Wiegraebe, W.; Singh, S.; Becker, T.; Caicedo, J. C.; Carpenter, A. E. 2018. CellProfiler 3.0: Next-generation image processing for biology. PLoS Biology, v. 16, n. 7, p. e2005970.
Mekki-Berrada, F.; Ren, Z.; Huang, T.; Wong, W. K.; Zheng, F.; Xie, J.; Tian, I. P. S.; Jayavelu, S.; Mahfoud, Z.; Bash, D.; Hippalgaonkar, K.; Khan, S.; Buonassisi, T.; Li, Q.; Wang, X. 2021. Two-step machine learning enables optimized nanoparticle synthesis. npj Computational Materials, v. 7, n. 1, p. 1–10.
Nováková, L.; Štěpánková, O., 2011. Visualization of trends using RadViz. Journal of Intelligent Information Systems, v. 37, no. 3, p.355-369.
Oliveira, R. I.; Orenstein, P.; Ramos, T.; Romano, J. V. 2022. Split Conformal Prediction and Non-Exchangeable Data (Versão 2). arXiv. 23 Aug 2024. Disponível em: <https://doi. org/10.48550/ARXIV.2203.15885>. Acesso em: 23 ago. 2025.
Ortiz-Perez, A.; Tilborg, D. van; Meel, R. van der; Grisoni, F.; Albertazzi, L. 2024. Machine learning-guided high throughput nanoparticle design. Digital Discovery, v. 3, n. 7, p. 1280–1291.
Pachitariu, Marius; Rariden, M.; Stringer, C. Cellpose-SAM: superhuman generalization for cellular segmentation. , 01 mai. 2025. Disponível em: <https://www. biorxiv. org/content/10.1101/2025.04.28.651001v1>. Acesso em: 18 jul. 2025.
Peer, D.; Karp, J. M.; Hong, S.; Farokhzad, O. C.; Margalit, R.; Langer, R. 2007. Nanocarriers as an emerging platform for cancer therapy. Nature Nanotechnology, v. 2, n. 12, p. 751–760.
Rezvantalab, S.; Keshavarz Moraveji, M. 2019. Microfluidic assisted synthesis of PLGA drug delivery systems. RSC Advances, v. 9, n. 4, p. 2055–2072.
Sah, E.; Sah, H. 2015. Recent Trends in Preparation of Poly(lactide‐co‐glycolide) Nanoparticles by Mixing Polymeric Organic Solution with Antisolvent. Journal of Nanomaterials, v. 2015, n. 1, p. 7946

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade