Imagem Percepções sobre automação em processos seletivos a partir de mineração de dados do Reddit

16 de janeiro de 2026

Percepções sobre automação em processos seletivos a partir de mineração de dados do Reddit

Autor(a): José Lucas Lara de Melo — Orientador(a): Lauro Marques Vicari

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este estudo investigou o uso de Inteligência Artificial [IA] e automação em processos seletivos por meio de mineração de texto, analisando percepções de candidatos e recrutadores em postagens públicas no Reddit sobre IA e Applicant Tracking Systems [ATS]. Com modelagem de tópicos, a pesquisa extraiu os principais temas discutidos, enquanto a análise de sentimentos foi empregada para identificar a opinião dos participantes. A relevância desta investigação deriva da importância crescente do capital intelectual como fonte de vantagem competitiva. Este capital, ligado às competências dos colaboradores, posiciona a gestão de recursos humanos, especialmente a atração e retenção de talentos, como eixos centrais para o sucesso organizacional (Kontoghiorghes, 2016; Vaiman et al., 2021).

Os processos seletivos, que visam contratar novos funcionários, variam conforme o perfil da vaga e as políticas da empresa. Tradicionalmente, recrutadores formam um amplo banco de candidatos para selecionar o mais alinhado ao perfil (Breaugh, 2013). Contudo, o recrutamento online aumentou drasticamente o volume de candidaturas, tornando o processo manual demorado e custoso. Neste cenário, automação e IA surgem como soluções para aumentar a eficiência, delegando tarefas repetitivas a sistemas e liberando recrutadores para atividades estratégicas (Blumen e Cepellos, 2023). O uso de ATS com IA promete ganhos de eficiência, reduzindo tempo e custo de contratação e contribuindo para a formação do capital intelectual (Nikolaou, 2021).

Paralelamente à eficiência, as organizações investem na construção de uma marca empregadora (“employer branding”) atrativa (Baratelli e Colleoni, 2022). O processo seletivo reflete a cultura da empresa, e os candidatos usam essas observações para suprir a assimetria de informação sobre a vaga e a organização (Falk et al., 2013). Ferramentas como entrevistas assíncronas analisadas por IA, como o HireVue, são promovidas como capazes de reduzir o gerenciamento de impressão dos candidatos. No entanto, a recepção por parte dos candidatos é frequentemente negativa, pois muitos sentem que a ausência de um entrevistador humano limita sua performance e desumaniza a interação (Langer et al., 2020).

A implementação de IA em processos seletivos apresenta riscos, especialmente em relação à ética e à assertividade da tecnologia. Se a IA for percebida como injusta ou enviesada, a organização pode sofrer danos em sua marca empregadora e na capacidade de atrair talentos (Lee, 2018; Ore e Sposato, 2021). Compreender a percepção do mercado sobre a automação no recrutamento é, portanto, fundamental para o posicionamento estratégico das organizações (Pandey, 2023). A literatura acadêmica, como aponta Van Esch et al. (2019), tem focado na assertividade dos sistemas, negligenciando as percepções de candidatos e profissionais de RH, uma lacuna que este estudo busca preencher.

Para isso, a pesquisa usou mineração de textos de redes sociais para capturar insights autênticos em larga escala. A plataforma escolhida foi o Reddit, com mais de 100 mil comunidades ativas (“subreddits”) e reconhecida como uma valiosa fonte de dados sobre interação social (Reddit, 2025). Com uma base de usuários majoritariamente de língua inglesa e com os EUA como principal mercado (Statista, 2024), o Reddit ofereceu um ambiente ideal para coletar um grande volume de dados textuais, permitindo a distinção entre fóruns de candidatos e de recrutadores.

A metodologia foi uma pesquisa exploratória descritiva, que busca descrever um fenômeno e suas características (Vergara, 2009). O estudo teve quatro fases: coleta de dados, pré-processamento textual, modelagem de tópicos e análise de sentimentos. A coleta de dados usou a API oficial do Reddit e a biblioteca PRAW para Python (Boe, 2023). Um algoritmo automatizou a busca de postagens em inglês com termos-chave como “AI hiring” e “ATS”. De 95 subreddits iniciais, oito foram selecionados com base na relevância e engajamento, incluindo comunidades como “r/recruiting”, “r/jobs” e “r/RecruitingHell”.

A segunda fase, de pré-processamento, limpou e padronizou os dados. O processo foi adaptado para as duas técnicas seguintes. Para a modelagem de tópicos, aplicaram-se oito etapas, incluindo conversão para minúsculas, remoção de links, pontuação, caracteres especiais e “stopwords” (palavras sem valor semântico), tokenização e lemantização (redução de palavras à sua forma base). A remoção de “stopwords” usou a biblioteca NLTK (Bird et al., 2023), e a lemantização foi feita com a biblioteca spaCy (Honnibal e Montani, 2025). Para a análise de sentimentos, o pré-processamento foi mais brando, removendo apenas links e padronizando o texto, pois aspectos como capitalização e pontuação podem influenciar os escores (Hutto e Gilbert, 2014).

A terceira fase foi a modelagem de tópicos com o algoritmo “Latent Dirichlet Allocation” [LDA], uma técnica que extrai temas latentes de grandes volumes de texto (Blei e Latterfly, 2009). O LDA assume que cada documento é uma mistura de tópicos, e cada tópico é uma distribuição de palavras. A implementação foi feita com a biblioteca Gensim para Python (Řehůřek e Sojka, 2023). A escolha do número ótimo de tópicos (K) foi guiada pela métrica de perplexidade (valores mais baixos são melhores) (Huang al. 2017) e pelo coeficiente de coerência, que avalia a qualidade semântica dos tópicos (Röder et al., 2015). A quarta fase foi a análise de sentimentos para classificar a polaridade (positiva, negativa ou neutra) das opiniões (Liu, 2020). Optou-se pelo método léxico VADER (“Valence Aware Dictionary and sEntiment Reasoner”), ajustado para a linguagem de mídias sociais, que calcula um escore composto normalizado entre -1 (negativo) e +1 (positivo) (Hutto e Gilbert, 2014). A acurácia do VADER foi validada comparando sua classificação com a rotulação manual de 100 comentários.

A análise para determinar o número ótimo de tópicos para o modelo LDA indicou que uma configuração com quatro tópicos (k=4) oferecia o melhor equilíbrio entre coerência, interpretabilidade e perplexidade. Modelos com menos tópicos (k=2) eram muito gerais, enquanto modelos com mais tópicos (k=7) apresentaram baixa coerência. A análise visual com a ferramenta pyLDAvis (Sievert e Shirley, 2014) confirmou que os quatro tópicos eram semanticamente distintos, com apenas uma pequena sobreposição entre os Tópicos 1 e 2. Os resultados da modelagem revelaram quatro temas centrais nas discussões sobre automação em recrutamento.

O Tópico 1 (43,5% dos “tokens”) foi interpretado como “Relatos de experiências de aplicação e rejeição”. Termos como “emprego”, “aplicação”, “processo”, “recrutador”, “rejeição” e “e-mail” compõem seu núcleo. A presença de palavras relacionadas a tempo (“minuto”, “hora”) e expressões como “nunca” e “esperança” sugere ênfase nas experiências pessoais dos candidatos, especialmente em narrativas sobre rejeições automáticas e a frustração com a dificuldade de obter uma entrevista.

O Tópico 2 (32% dos “tokens”) foi denominado “Dúvidas sobre ATS e estratégias de otimização de currículo”. Este tema agrega termos como “IA”, “currículo”, “ATS”, “triagem” e “filtro”, refletindo a incerteza dos candidatos sobre o funcionamento dos sistemas. A discussão gira em torno de como superar os filtros automatizados, com termos como “palavra-chave” e “carta de apresentação” indicando um foco em estratégias para otimizar currículos e aumentar a compatibilidade com as vagas.

O Tópico 3 (13,3% dos “tokens”) foi identificado como “Reações negativas a entrevistas conduzidas por IA”. Caracteriza-se por termos como “entrevista”, “IA”, “HireVue”, “unidirecional” e “gravação”. A forte carga emocional negativa é evidente em expressões como “falso”, “foda-se” e “merda”, revelando aversão a entrevistas assíncronas. Os candidatos expressam desconfiança sobre a justiça desses métodos, com termos como “viés” e “discriminação” apontando para preocupações éticas sobre a validade das avaliações por IA, corroborando Langer et al. (2020).

O Tópico 4 (11,2% dos “tokens”) foi classificado como “Percepções de recrutadores sobre a integração tecnológica”. Este tópico apresenta uma perspectiva distinta, com termos como “ATS”, “recurso”, “integração” e “plataforma”. A valência é majoritariamente positiva, indicada por palavras como “ótimo” e “amor”, sugerindo que profissionais de RH veem a automação como uma ferramenta valiosa. Termos como “busca” e “compartilhar” indicam que o tópico também serve como espaço para troca de melhores práticas.

A análise de sentimentos com VADER indicou, inicialmente, uma predominância de neutralidade e positividade. Nas comunidades de recrutadores (“r/Recruiting”, “r/HumanResources”), a prevalência de sentimentos positivos alinhava-se ao Tópico 4. No entanto, em comunidades como “r/interviews” e “r/RecruitingHell”, os resultados do VADER contradiziam as evidências qualitativas. Por exemplo, enquanto o Tópico 3 revelou forte negatividade sobre entrevistas com IA, a análise de sentimentos para a comunidade de entrevistas apontou neutralidade.

Essa discrepância motivou uma verificação da acurácia do modelo. A comparação da classificação do VADER com uma amostra de 100 textos rotulados manualmente revelou uma baixa acurácia de 58%. A matriz de confusão mostrou que o algoritmo identificou bem textos positivos (sensibilidade de 88%), mas falhou em classificar conteúdos negativos e neutros (sensibilidade abaixo de 50%). O VADER teve dificuldade em capturar nuances como sarcasmo, ironia e críticas indiretas. Textos claramente negativos do ponto de vista humano foram classificados como neutros ou positivos, evidenciando uma limitação significativa do método.

A análise integrada dos resultados, priorizando a robustez da modelagem de tópicos, revela uma clara assimetria nas percepções sobre automação no recrutamento. De um lado, candidatos expressam frustração, desconfiança e preocupações éticas, especialmente sobre a desumanização do processo, a falta de feedback e a percepção de injustiça dos sistemas. Do outro, recrutadores demonstram entusiasmo e uma visão pragmática, focada nos ganhos de eficiência. Essa divergência representa um desafio para organizações que buscam equilibrar eficiência operacional com uma marca empregadora positiva.

As implicações práticas são diretas. As empresas precisam adotar uma abordagem mais transparente sobre o uso de IA e ATS. É fundamental alinhar as expectativas dos candidatos, explicando o uso das ferramentas e garantindo que o fator humano permanece central na decisão final. Abordar proativamente as preocupações sobre justiça e viés pode mitigar percepções negativas. A forte aversão às entrevistas por IA sugere que as organizações devem avaliar cuidadosamente o impacto dessa ferramenta na experiência do candidato e considerar alternativas com interação humana. Para os recrutadores, a tecnologia deve ser usada não apenas para filtrar, mas para melhorar a comunicação e a agilidade do processo, fortalecendo a marca empregadora.

A pesquisa evidenciou que a percepção sobre a automação em recrutamento é marcada por uma assimetria entre candidatos e recrutadores. Enquanto candidatos se preocupam com justiça, transparência e humanidade, os recrutadores focam na eficiência. As limitações do estudo, como a baixa acurácia do VADER, sugerem que futuras pesquisas poderiam usar modelos mais avançados, como “Transformers”, para capturar melhor as nuances da linguagem. A expansão da coleta de dados para outras plataformas também poderia enriquecer a compreensão do tema. Conclui-se que o objetivo foi atingido: demonstrou-se que as percepções sobre o uso de IA e automação em processos seletivos são polarizadas entre candidatos e recrutadores, ressaltando a necessidade crítica de estratégias organizacionais focadas na transparência e na comunicação para gerenciar a marca empregadora na era digital.

Referências:
Acikgoz, Y.; Davison, K. H.; Compagnone, M.; Laske, M. 2020. Justice perceptions of artificial intelligence in selection. International Journal of Selection and Assessment 28: 399-416.
Baratelli, G.; Colleoni, E. 2022. Does artificial intelligence (AI) enabled recruitment improve employer branding? International Journal of Business and Management 17(2): 45-54.
Bird, S.; Klein, E.; Loper, E. 2023. Natural Language Toolkit (NLTK): Documentation. Disponível em: <https://www. nltk. org/>. Acesso em: 7 abr. 2025.
Blei, D. M.; Lafferty, J. D. 2009. Topic models. In: Srivastava, A. N.; Sahami, M. (eds.). Text Mining: Classification, Clustering, and Applications. Chapman and Hall/CRC: Boca Raton, FL, p. 71-94.
Blumen, D.; Cepellos, V. 2023. Dimensões do uso de tecnologia e Inteligência Artificial (IA) em processos de Recrutamento e Seleção (R&S): benefícios, tendências e resistência. Cadernos EBAPE. BR 21(2): 1-16.
Boe, D. 2023. PRAW – The Python Reddit API Wrapper: Documentation and Usage Guide. Disponível em: <https://praw. readthedocs. io/>. Acesso em: 7 abr. 2025.
Breaugh, J. A. (2013). Employee Recruitment. Annual Review of Psychology 64: 389-416.
Falk, S.; Hammermann, A.; Mohnen, A. 2013. Different degrees of informational asymmetry on job markets and its impact on companies’ recruiting success. Journal of Business Economics 83: 295–317.
Honnibal, M.; Montani, I. 2025. spaCy: Industrial-strength Natural Language Processing in Python. Disponível em: <https://spacy. io>. Acesso em: 14 jun. 2025.
Hotho, A.; Nürnberger, A.; Paass, G. 2005. A Brief Survey of Text Mining. Journal for Language Technology and Computational Linguistics 20(1): 19–62.
Huang, L.; Ma, J.; Chen, C. 2017. Topic Detection from Microblogs Using T-LDA and Perplexity. Anais do 24º Workshop da Asia-Pacific Software Engineering Conference (APSECW), Nanjing, China, 2017. p. 71–77.
Hutto, C. J.; Gilbert, E. 2014. A Parsimonious Rule-Based Model for Sentiment Analysis of Social Media Text. In: Anais do International AAAI Conference on Web and Social Media, [S. l.], 8(1): 216-225.
Kherwa, R.; Bansal, D. 2019. Topic modeling: A comprehensive review. EAI Endorsed Transactions on Scalable Information Systems 6(21): 1-11.
Kontoghiorghes, C. 2016. Linking high performance organizational culture and talent management: satisfaction/motivation and organizational commitment as mediators. The International Journal of Human Resource Management 27(15-16): 1833-1853.
Kulkarni, A.; Shivananda, A. 2021. Natural Processing Recipes: Unlocking Text Data with Machine Learning and Deep Learning using Python. Apress. Bangalore, Karnataka, India
Langer, M.; König, C. J.; Hemsing, V. 2020. Is anybody listening? The impact of automatically evaluated job interviews on impression management and applicant reactions. Journal of Managerial Psychology 35(4): 271-284.
Lee, M. K. 2018. Understanding perception of algorithmic decisions: Fairness, trust, and emotion in response to algorithmic management. Big Data and Society 5(1): 1-16.
Liu, B. 2020. Sentiment Analysis: Mining Opinions, Sentiments, and Emotions. 2. ed. Cambridge University Press.
Nikolaou, I. 2021. What is the role of technology in recruitment and selection? The Spanish Journal of Psychology 24(2): 1-6.
Ore, O.; Sposato, M. 2021. Opportunities and risks of artificial intelligence in recruitment and selection. International Journal of Organizational Analysis 30(6): 1771-1782.
Pandey, N. 2023. Future of employer branding in the era of Bard, ChatGPT, metaverse and artificial intelligence. NHRD Network Journal 16(3): 258-268.
Reddit Inc. 2025. Sobre o Reddit. Reddit Inc. Disponível em: <https://redditinc. com>. Acesso em: 7 abr. 2025.
Řehůřek, R.; Sojka, P. 2023. Gensim: Topic modelling for humans. Disponível em: <https://radimrehurek. com/gensim/>. Acesso em: 14 jun 2025.
Röder, M.; Both, A.; Hinneburg, A. 2015. Exploring the space of topic coherence measures. In: Anais do ACM International Conference on Web Search and Data Mining, New York, NY, EUA, 8: 399-408.
Sievert, C.; Shirley, K. 2014. LDAvis: A method for visualizing and interpreting topics. In: Anais do Interatictive Language Learning, Visualization, and Interfaces of the Association for Computational Linguistics, Baltimore, MD, EUA: 2014 63-70.
Statista. 2024. Number of monthly active Reddit users worldwide from 2019 to 2024. Statista. Disponível em: <https://www. statista. com/statistics/443332/reddit-monthly-active-users/>. Acesso em: 7 abr. 2025.
Vaiman, V.; Cascio, W. F.; Collings, D. G.; Swider, B. W. 2021. The shifting boundaries of talent management. Human Resource Management 60(2): 253-257.
Van Esch, P.; Black, J. S.; Ferolie, J. 2019. Marketing AI recruitment: The next phase in job application and selection. Computers in Human Behavior 90: 215-222.
Vergara, S. C. Projetos e relatórios de pesquisa em administração. 10. ed. São Paulo: Atlas, 2009.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade