07 de maio de 2026
Machine learning na torra e análise sensorial de cafés especiais
Marco Aurélio Aloise Filho; Elisa Antolli
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Com aproximadamente 38% da produção global entre os anos 2023 e 2024, o Brasil mantém a posição de maior produtor de café do mundo, consolidando uma trajetória iniciada ainda no período monárquico (Abreu; Lago, 2010). A produção nacional divide-se predominantemente entre as espécies *Coffea arabica*, que representa cerca de 79% do volume total, e *Coffea canephora*, com 21% de participação (Embrapa, 2023). Enquanto a variedade canephora é reconhecida pela robustez, os cafés do tipo arábica possuem maior valor de mercado devido à suavidade e complexidade das notas sensoriais. Atualmente, observa-se uma mudança no perfil do consumidor, que migra da busca por uma bebida meramente estimulante para a valorização de experiências gustativas complexas, impulsionando o surgimento de micro torrefações que priorizam a preservação de características locais e o frescor do produto (Christo et al., 2021). O conceito de café especial aplica-se aos grãos que atingem uma pontuação mínima de 80 pontos em uma escala de zero a 100, conforme o protocolo de avaliação sensorial da Specialty Coffee Association (SCA, 2025). Este processo, denominado *cupping*, é realizado por profissionais certificados que analisam parâmetros como fragrância, aroma, acidez, corpo e doçura. A qualidade final da bebida depende de um manejo rigoroso que envolve desde a adubação e colheita no ponto ideal de maturação até o armazenamento adequado para evitar a degradação das características intrínsecas do grão.
A etapa de torrefação atua como o momento crítico de modulação dos sabores, onde as transformações químicas revelam o potencial sensorial do café verde. Durante o aquecimento, ocorrem fenômenos como a quebra dos ácidos clorogênicos, a degradação parcial da sacarose e a formação de cadeias complexas de açúcares e polissacarídeos (Rao, 2020). As notas sensoriais emergem de forma progressiva: inicialmente surgem aromas vegetais e herbáceos, seguidos por notas florais delicadas, como jasmim e lavanda, típicas de grãos de alta qualidade. Com o avanço do processo, destacam-se notas frutadas e, posteriormente, tons de caramelo que indicam o equilíbrio entre doçura e corpo. Torras mais prolongadas resultam em notas de chocolate e maior densidade, porém, se estendidas excessivamente, podem gerar sabores rançosos ou carbonizados (Santos, 2024). O desenvolvimento dessas nuances segue uma curva log-normal, iniciando pela acidez em torras rápidas, seguida pela doçura e pelo corpo, até atingir o sabor de queimado em estágios avançados (Melo, 2004). O desafio do mestre de torra reside em encontrar o equilíbrio exato que atenda às preferências do mercado, utilizando a tecnologia para investigar correlações entre as variáveis operacionais e os resultados na xícara.
A metodologia aplicada classifica-se como explicativa e experimental, adotando uma abordagem mista que combina dados quantitativos e qualitativos para determinar a influência das variáveis de torra no resultado sensorial. O estudo envolveu o desenvolvimento de um software específico em linguagem C#, utilizando a plataforma .NET 8 e interface em Windows Presentation Foundation, para a coleta automatizada de dados durante o processo operacional. A comunicação entre o sistema e o torrador comercial ocorreu via protocolo Modbus/TCP por meio de uma conexão Wi-Fi, permitindo o mapeamento dos sensores e controladores do equipamento. As variáveis quantitativas monitoradas incluíram o tempo total em segundos, as temperaturas inicial e final dos grãos, o peso do café cru e torrado, a perda de umidade e a taxa de elevação de temperatura, conhecida como Rate of Rise. Variáveis qualitativas também foram registradas, como a identificação do lote, o ponto de torra mensurado pela escala Agtron e a categorização das notas sensoriais em grupos como vegetais, frutadas, caramelo e chocolate (Vanegas-Ayala, 2023). O delineamento experimental permitiu o registro sistemático de cada ciclo de torra, vinculando um identificador único a cada amostra para garantir a rastreabilidade durante a fase de avaliação sensorial.
O processamento dos dados utilizou o modelo de aprendizagem de máquina não supervisionado denominado Density-Based Spatial Clustering of Applications with Noise, com o objetivo de identificar agrupamentos e correlações por meio do coeficiente de Pearson. A escolha deste algoritmo fundamentou-se na capacidade de lidar com ruídos provenientes de interferências térmicas nos sensores do torrador, que opera em altas temperaturas e pode gerar leituras incorretas. Para a configuração do modelo, adotou-se um raio de densidade épsilon de 0,4 e um mínimo de três pontos para a formação de um agrupamento, valores definidos a partir da observação das amostras reais. A coleta de dados foi realizada de forma empírica durante a execução de 55 torras reais, originadas de três lotes distintos: um lote da variedade Mundo Novo com 86 pontos, um lote Catuaí Amarelo com 84 pontos e um blend de produção familiar. Cada ciclo de torra utilizou uma carga mínima de 300 g para assegurar a precisão dos sensores, conforme as especificações técnicas do fabricante do equipamento, que possui capacidade total de 1000 g. Após a conclusão da torra, os grãos foram pesados para aferir a perda de massa e uma amostra de 40 g foi separada para a classificação sensorial.
O protocolo de avaliação seguiu rigorosamente as normas da Specialty Coffee Association, utilizando 9 g de café moído para cada xícara de prova. O processo iniciou com a análise da fragrância do pó seco, seguida pela infusão em 150 ml de água fervida. Após quatro minutos, a crosta formada na superfície foi rompida para a avaliação do aroma e, em seguida, removida para a degustação do líquido. Os avaliadores pontuaram atributos como acidez, doçura, corpo, finalização e equilíbrio em uma escala que varia de seis a 10, onde o valor seis representa um padrão bom e 10 a excelência máxima. O software integrou esses resultados ao banco de dados, permitindo a análise cruzada com as variáveis do perfil de torra, como a temperatura inicial do tambor e o tempo de permanência em cada fase química. Devido às limitações de viabilidade financeira e à oferta restrita de café causada por condições climáticas adversas na safra de 2024, o volume de dados reais foi expandido artificialmente. Para isso, implementou-se uma Generative Adversarial Network com arquitetura adaptativa, treinada com as 55 amostras iniciais para gerar 500 torras sintéticas condizentes com a realidade física do processo.
A arquitetura da rede neural adversária foi ajustada conforme o volume de dados disponível, utilizando 128 neurônios e duas camadas para o gerador e o discriminador. O gerador empregou a função de ativação Leaky ReLU nas camadas ocultas para evitar o problema de neurônios mortos e a função Tanh na saída para os dados normalizados entre -1 e 1. O discriminador utilizou a função Sigmoid para calcular a probabilidade de a amostra ser real. O treinamento foi conduzido por 2000 épocas utilizando o otimizador Adam para garantir estabilidade. Antes do envio para a rede, os dados passaram por pré-processamento, incluindo a normalização de valores numéricos, a conversão de tempos para segundos e a codificação de variáveis categóricas por meio da técnica one-hot encoding. As torras sintéticas foram armazenadas de forma independente para não contaminar a análise primária, servindo como base de validação para o comportamento do algoritmo de agrupamento em volumes maiores de informação.
Os resultados obtidos nas torras reais demonstraram que o processo inicia-se com a fase de secagem, onde ocorre o equilíbrio térmico entre o tambor pré-aquecido e os grãos frios. Este ponto de equilíbrio, denominado Turning Point, ocorreu em média a 141 °C, marcando o início da subida da temperatura dos grãos. Durante a secagem, os grãos perdem umidade e transitam da coloração verde para tons amarelados. A análise indicou que a força de subida da temperatura nesta fase influencia a percepção final de doçura. Após a secagem, a fase de Maillard promove a caramelização dos açúcares e o escurecimento do grão (Rao, 2020). Nesta etapa, o monitoramento da potência da resistência do torrador revelou uma redução gradual para controlar a inclinação da curva térmica. O encerramento da fase de Maillard é marcado pelo primeiro crack, uma reação exotérmica onde o grão libera calor e expande sua estrutura física. A última fase, a pirólise, mostrou-se a mais determinante para a definição do perfil sensorial, exigindo controle rigoroso do tempo para evitar a carbonização.
A análise das correlações para o atributo acidez revelou uma correlação positiva de 52% com o ponto de torra, indicando que torras mais claras, situadas no nível 85 da escala Agtron, favorecem a percepção de uma acidez agradável. Em contrapartida, observou-se uma correlação negativa de -60% com o tempo em pirólise, sugerindo que quanto menor o tempo de permanência nesta fase final, melhor a preservação da acidez. Para o parâmetro doçura, a correlação positiva foi de 62% com torras claras e 49% com a taxa total de elevação de temperatura, evidenciando que um ganho de calor mais rápido durante a pirólise potencializa a percepção de açúcares na bebida. Já o corpo do café apresentou um comportamento inverso, com correlação negativa de -64% em relação à escala Agtron, o que demonstra que torras mais escuras, próximas ao nível 45, produzem uma bebida com maior peso na boca e sensação tátil mais persistente. O tempo total de torra exerceu influência de 43% sobre o corpo, confirmando que processos mais longos e temperaturas finais mais elevadas favorecem o desenvolvimento desta característica.
No que tange às notas sensoriais específicas, as notas frutadas apresentaram correlação de 44% com torras de nível médio e correlação negativa de -42% com o tempo de pirólise, reforçando que a agilidade na finalização do processo preserva os compostos voláteis associados a frutas. As notas de caramelo foram influenciadas positivamente pela taxa de elevação de temperatura nas fases iniciais, enquanto as notas de chocolate mostraram correlação negativa de -45% com a escala Agtron e positiva de 40% com o tempo total de torra. Estes dados indicam que perfis de torra mais lentos e desenvolvidos são ideais para ressaltar sabores achocolatados. A análise das 500 amostras sintéticas geradas pela rede neural adversária corroborou as tendências observadas nos dados reais. Para a acidez, as amostras artificiais mantiveram a correlação negativa com o tempo total de torra em -94% e com o tempo de pirólise em -90%. A doçura nas amostras sintéticas também apresentou forte correlação positiva com a taxa de elevação de temperatura na fase de Maillard, atingindo 87%.
A comparação entre os dados orgânicos e artificiais demonstrou que a rede neural foi capaz de aprender as relações complexas do processo de torrefação. Embora os percentuais exatos tenham variado, as direções das correlações apontadas pelo algoritmo de agrupamento foram consistentes em ambos os cenários. Por exemplo, tanto nos dados reais quanto nos sintéticos, a prevalência de notas frutadas foi associada a tempos de pirólise reduzidos e torras de nível médio. Da mesma forma, a tendência de notas de chocolate para perfis mais escuros e lentos foi replicada com sucesso pela inteligência artificial. Esta aderência demonstra a viabilidade do uso de dados sintéticos para suplementar bases de dados pequenas em estudos de engenharia de software aplicados à agronomia, permitindo que o sistema continue a fornecer direcionamentos úteis mesmo diante de limitações na oferta de matéria-prima real.
A integração entre o software de monitoramento e os modelos de aprendizagem de máquina oferece uma ferramenta robusta para o mestre de torra, permitindo que o profissional compreenda como pequenas variações operacionais impactam o perfil sensorial de seus lotes. A capacidade de identificar que uma torra mais rápida melhora a doçura em 39% ou que o tempo para atingir o primeiro crack afeta a percepção de acidez em -38% fornece um embasamento científico que transcende a intuição empírica. O uso da tecnologia Modbus/TCP para captura de dados em tempo real, aliado ao tratamento de ruídos pelo algoritmo de densidade, garante a integridade das informações coletadas em ambiente industrial. O estudo reforça a importância da digitalização na cadeia produtiva de cafés especiais, onde a precisão técnica é o diferencial para a obtenção de produtos de alto valor agregado.
Conclui-se que o objetivo foi atingido, uma vez que o desenvolvimento do software e a aplicação dos modelos de aprendizagem de máquina permitiram identificar correlações precisas entre as variáveis operacionais da torra e os atributos sensoriais da bebida. A utilização do algoritmo de agrupamento por densidade mostrou-se eficaz no tratamento de ruídos térmicos, enquanto a rede neural adversária demonstrou competência na expansão da base de dados, mantendo a fidelidade às tendências físicas observadas nas torras reais. Os resultados evidenciam que torras mais claras e rápidas favorecem a acidez e a doçura, enquanto perfis mais escuros e prolongados são necessários para o desenvolvimento de corpo e notas de chocolate. Esta ferramenta tecnológica proporciona aos profissionais da torrefação um método científico para a modulação de sabores, contribuindo para o fortalecimento do mercado brasileiro de cafés especiais e abrindo caminho para futuras pesquisas que incluam novas variáveis ambientais e químicas no processo de análise.
Referências Bibliográficas:
Abreu, M. P.; Lago, L. A. C. 2010. A economia brasileira no império, 1822-1889. Texto para Discussão, No. 584. Rio de Janeiro, Brasil: Departamento de Economia, Pontifícia Universidade Católica do Rio de Janeiro. Disponível em: https://hdl.handle.net/10419/176067.
Christo, B. F.; Dias Junior, C. M.; Silva, T. B. S.; Colodetti, T. V. 2021. Cafés especiais como oportunidade de competitividade para pequenos e médios produtores brasileiros. Brazilian Journal of Development 7(8): 83617-83633. Curitiba, Brasil.
Empresa Brasileira de Pesquisa Agropecuária [EMBRAPA]. 2023. Produção dos cafés do Brasil ocupa 1,9 milhão de hectares em 2023. Brasília, DF, Brasil. Disponível em: https://www.embrapa.br/cultivos/busca-de-noticias/-/noticia/81515963/producao-dos-cafes-do-brasil-ocupa-19-milhao-de-hectares-em-2023?form=MG0AV3. Acesso em: 22 fev. 2025.
Melo, W. L. B. A. 2004. A importância da informação sobre o grau de torra do café e sua influência nas características organolépticas da bebida. São Carlos, SP, Brasil. Disponível em: https://www.infoteca.cnptia.embrapa.br/infoteca/bitstream/doc/30170/1/CT582004.pdf. Acesso em: 27 maio 2025.
Rao, S. 2020. Coffee Roasting: Best Practices. [s.l.]: Rao Coffee Consulting.
Santos, J. Elvio do. 2024. Manual da torra de café: guia prático da torrefação de sucesso. [s.l.]: Consultoria Mestre Cafeeiro.
Tostati Cafés Especiais. 2025. Entenda o protocolo SCA de pontuação de cafés especiais e seus 11 atributos. Disponível em: https://www.tostati.com.br/blog/entenda-o-protocolo-sca-e-seus-11-atributos/. Acesso em: 22 fev. 2025.
Vanegas-Ayala, S. C.; Leal-Lara, D. D.; Barón-Velandia, J. 2023. Roasted coffee beans characterization through optoelectronic color sensing. Coffee Science e182156. Brasil. Disponível em: https://coffeescience.ufla.br/index.php/Coffeescience/article/view/2156. Acesso em: 29 ago. 2025.
Resumo executivo oriundo de Trabalho de Conclusão de Curso da Especialização em Engenharia de Software do MBA USP/Esalq
Para saber mais sobre o curso, clique aqui e acesse a plataforma MBX Academy




























