08 de janeiro de 2026
Análise de sentimentos em avaliações de restaurantes em Campo Grande-RJ
Autor: Josiane De Oliveira Da Silva — Orientadora: Jose Guilherme Martins Dos Santos
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Este estudo desenvolveu e implementou um modelo de análise de sentimentos para classificar, como positivas ou negativas, as avaliações de clientes de restaurantes de Campo Grande, Rio de Janeiro – RJ, publicadas no Google Maps. A partir dos sentimentos expressos, a pesquisa buscou compreender as percepções dos clientes e identificar padrões de satisfação e insatisfação, gerando insights estratégicos para auxiliar gestores a identificar preferências do público. A premissa da investigação é que a grande quantidade de dados gerados por consumidores em plataformas digitais representa um recurso valioso, embora subutilizado, para a gestão no setor de alimentação.
O setor de serviços de alimentação no Brasil, incluindo bares e restaurantes, demonstrou crescimento médio de 11% ao ano entre 2009 e 2019 (SEBRAE, 2022). Contudo, a crise da Covid-19 impôs desafios, com 77% dos estabelecimentos operando com prejuízo em abril de 2021 (ABRASEL, 2021). O período de 2022 a 2024 foi de reestruturação, culminando em um saldo positivo de 52.055 postos de trabalho formais criados no setor em 12 meses até novembro de 2024, com o Rio de Janeiro contribuindo para essa recuperação (SINDRIO, 2025). As expectativas para 2025 são otimistas, com 73% dos empreendedores prevendo aumento nas vendas (ABRASEL, 2024), mas a sustentabilidade do crescimento depende da gestão interna.
A alta taxa de mortalidade de empresas no setor, onde cerca de 80% fecham antes de dois anos, é atribuída a falhas internas como falta de planejamento, treinamento inadequado e, crucialmente, desconhecimento do consumidor (SEBRAE, 2023). Bateson e Hoffman (2016) argumentam que a eficácia do serviço está ligada à compreensão do comportamento do consumidor, especialmente na avaliação pós-compra, onde a escuta ativa é fundamental. Kotler (2021) reforça que empresas de sucesso coletam feedback sistematicamente para promover melhorias contínuas. Muitos gestores, no entanto, negligenciam essa fonte de inteligência competitiva (SEBRAE, 2016).
Com a digitalização, a jornada do cliente e a geração de feedback migraram para o ambiente online. Dados não estruturados gerados por consumidores podem ser transformados em informações estratégicas com técnicas computacionais (Hair et al., 2018). Conforme Limeira (2017), métodos automáticos de análise de conversas online permitem realizar pesquisas de mercado de forma ágil e escalável. A análise de sentimentos, subárea do Processamento de Linguagem Natural (PLN), é uma abordagem para lidar com o volume de textos e identificar a polaridade das opiniões (Lima, 2021). No entanto, uma classificação binária (positivo/negativo) pode ser insuficiente.
A vantagem competitiva reside em uma análise de maior granularidade, que investiga sentimentos associados a aspectos específicos como comida, atendimento, ambiente e preço. Liu (2012) destaca que o objetivo da mineração de opinião é descobrir sentimentos sobre entidades e seus aspectos. Essa abordagem permite identificar, por exemplo, que um cliente está satisfeito com a comida, mas insatisfeito com o preço, fornecendo um diagnóstico para ações corretivas. Este trabalho aplica essa metodologia para fornecer uma ferramenta aos gestores de restaurantes de Campo Grande, permitindo alinhar seus serviços às expectativas do público e fortalecer sua posição no mercado.
A metodologia adotada foi quantitativa, empregando PLN e aprendizado de máquina supervisionado. O processo iniciou com a coleta de dados, extraindo avaliações textuais e notas em estrelas (1 a 5) de restaurantes em Campo Grande-RJ no Google Maps, publicadas entre 2022 e 2025. Para a extração, utilizou-se web scraping com a biblioteca Selenium, eficaz para interagir com páginas dinâmicas. Conforme Bird et al. (2009), o Selenium simula a navegação humana, permitindo o acesso a elementos carregados via JavaScript. O processo foi configurado com pausas programadas para evitar sobrecarga nos servidores.
Após a coleta, os dados brutos passaram por pré-processamento. Textos de avaliações online contêm ruídos como gírias, erros ortográficos e abreviações, que podem comprometer a performance do modelo (Provost e Fawcett, 2016). O tratamento envolveu a normalização do texto (conversão para minúsculas, remoção de elementos não textuais) e a remoção de stopwords. Para a modelagem supervisionada, os dados foram rotulados. A estratégia inicial foi usar as notas em estrelas como proxy para o sentimento (Liu, 2012). Uma análise exploratória, com nuvens de palavras para cada nota, foi realizada para validar a abordagem.
Um desafio surgiu com as avaliações de nota 3, consideradas neutras. Para investigar sua polaridade, foi conduzida uma análise com as bibliotecas VADER e TextBlob, após tradução dos textos para o inglês (Pereira, 2022). Os resultados indicaram forte ambiguidade, levando à decisão de excluir essas avaliações para evitar ruído no modelo. O pré-processamento continuou com a tokenização, usando o ToktokTokenizer, e a aplicação de stemming para reduzir palavras à sua raiz, diminuindo a dimensionalidade do vocabulário (Caseli e Nunes, 2024). Com o texto limpo, a etapa seguinte foi a vetorização.
Para esta tarefa, empregou-se a técnica Term Frequency-Inverse Document Frequency (TF-IDF), que calcula um peso para cada palavra com base em sua frequência e raridade, destacando termos relevantes (Pareek et al., 2024). Para capturar contexto, o TF-IDF foi combinado com n-grams (unigramas, bigramas e trigramas). O modelo de classificação escolhido foi a Regressão Logística, um algoritmo robusto para classificação binária em análise de sentimentos devido à sua eficiência e interpretabilidade (Silva, 2016). Dado o desbalanceamento das classes (maioria de avaliações positivas), utilizou-se o parâmetro class_weight=’balanced’, que ajusta os pesos das classes de forma inversamente proporcional às suas frequências (Branco et al., 2015). A avaliação do modelo usou a matriz de confusão e métricas como acurácia, precisão, recall e F1-score, calculadas para cada classe (Malakin, 2024; Géron, 2019).
A coleta de dados resultou em um corpus de 7.082 avaliações. A análise exploratória revelou uma concentração em avaliações de 5 estrelas, um padrão consistente com estudos que apontam para uma disposição afetiva positiva em relação à alimentação (Desmet e Schifferstein, 2008), indicando um provável desbalanceamento de classes. O processo de limpeza confirmou a presença de desafios típicos de dados gerados por usuários, como erros gramaticais e gírias (Silva, 2016). A padronização dos textos foi crucial para a qualidade dos dados, alinhada às boas práticas de PLN (Pinna et al., 2020; Caseli e Nunes, 2024).
O tratamento das avaliações de 3 estrelas foi um ponto crítico. A nuvem de palavras para esta categoria mostrou um equilíbrio entre termos positivos (“bom”, “excelente”) e negativos (“preço”, “demora”), sugerindo uma experiência ambivalente. A análise de polaridade com VADER e TextBlob confirmou essa ambiguidade. Para aumentar a clareza do sinal de treinamento, decidiu-se excluir essas 723 avaliações, abordagem semelhante à de Pang e Lee (2004), que demonstraram melhorias na acurácia ao remover dados de polaridade incerta. Após a filtragem, as notas 1 e 2 foram rotuladas como negativas (classe 0) e as notas 4 e 5 como positivas (classe 1), resultando em um dataset com 87% de avaliações positivas.
O modelo de Regressão Logística, treinado com 70% dos dados e testado com 30%, alcançou uma acurácia geral de 89%. Uma análise detalhada das métricas por classe, recomendada para dados desbalanceados (Branco et al., 2015; Grandini et al., 2020), revelou nuances. O F1-score para a classe positiva (1) foi de 92%, indicando excelente desempenho. Para a classe negativa (0), o F1-score foi de 79%. Embora seja um bom resultado, a diferença demonstra que o modelo teve maior dificuldade em classificar as críticas da classe minoritária. Essa limitação é aceitável no contexto do estudo, mas aponta para oportunidades de melhoria, como a aplicação de técnicas de reamostragem (Branco et al., 2015).
A análise baseada em aspectos, que segmentou as avaliações em comida, atendimento, ambiente e preço, foi a etapa mais rica em insights. Alinhada com as propostas de Shin et al. (2022), essa abordagem permitiu entender os drivers específicos da satisfação e insatisfação, conceitos fundamentais em marketing (Kotler e Keller, 2012). A categoria “comida” foi a mais mencionada. As avaliações positivas destacaram termos como “boa” e “sabor”, enquanto as negativas focaram em “ruim”, “salgado” e “sempre”, sugerindo que a quebra de consistência é um fator crítico de insatisfação.
No atendimento, cordialidade e eficiência (“gentil”, “educado”) foram os principais elogios, enquanto desorganização e mau trato (“ruim atend”, “mal atend”) foram as críticas mais contundentes, reforçando a importância do treinamento da equipe (Simões, 2015). A análise do ambiente revelou que clientes valorizam espaços “tranquilos”, “familiares” e “aconchegantes”. Por outro lado, falta de climatização (“quente”) e problemas de higiene (“sujo”) foram fortes detratores da experiência, corroborando a pesquisa de Carvalho (2019) sobre a influência do ambiente sensorial.
A categoria preço demonstrou a importância da percepção de valor. Termos como “justo” e “custobenefici” foram centrais nas avaliações positivas, indicando que o consumidor busca uma relação equilibrada entre custo e qualidade. As críticas foram marcadas por expressões como “não vale” e “pess custobenefici”, sinalizando que preços desproporcionais geram forte insatisfação. Esses resultados por categoria forneceram a base para um quadro de oportunidades estratégicas, traduzindo dados em ações como padronização de receitas, capacitação de equipe, melhorias na infraestrutura e revisão de estratégias de precificação.
Este estudo desenvolveu um modelo de análise de sentimentos para classificar avaliações de restaurantes em Campo Grande-RJ e extrair insights. A metodologia, da coleta de dados com web scraping à modelagem com Regressão Logística e análise por aspectos, foi eficaz para transformar dados textuais em inteligência de negócio. Os desafios enfrentados, como linguagem informal, ambiguidade das notas intermediárias e desbalanceamento de classes, foram sistematicamente tratados para garantir a robustez dos resultados. A exclusão das avaliações de 3 estrelas, embora simplificando o problema, garantiu um sinal mais claro para o modelo, resultando em um desempenho geral de 89% de acurácia.
O modelo final, apesar de uma performance superior para a classe positiva (F1-score de 92%) em comparação com a negativa (F1-score de 79%), provou ser uma ferramenta valiosa. A análise por categorias (comida, atendimento, ambiente e preço) identificou os principais fatores de satisfação e insatisfação. Foram identificados padrões como a valorização da consistência na comida, a importância da cordialidade no atendimento, a necessidade de um ambiente limpo e climatizado, e a busca por uma justa relação custo-benefício. Esses achados se traduzem em diretrizes práticas para os gestores focarem seus esforços de melhoria. Para trabalhos futuros, sugere-se a exploração de técnicas mais avançadas para lidar com ambiguidade e desbalanceamento, como modelos baseados em transformers e estratégias de sobreamostragem.
Conclui-se que o objetivo foi atingido: demonstrou-se que a aplicação de técnicas de análise de sentimentos em avaliações online é uma ferramenta acessível e de alto impacto para compreender a percepção do público e gerar inteligência competitiva para o setor de restaurantes. A metodologia e os resultados fornecem um diagnóstico detalhado do cenário gastronômico de Campo Grande-RJ, oferecendo aos gestores locais um roteiro baseado em dados para aprimorar seus serviços, fidelizar clientes e prosperar em um mercado competitivo.
Referências:
Associação Brasileira de Bares e Restaurante [ABRASEL]. 2021. Pesquisa Situação Econômica maio 2021. Disponível em:< https://abrasel. com. br/noticias/noticias/alto-endividamento-pressiona-bares-e-restaurantes-diz-pesquisa-nacional-da-abrasel/ >. Acesso em: 18 fev. 2025.
Associação Brasileira de Bares e Restaurante [ABRASEL]. 2024. Pesquisa Situação Econômica dezembro. Disponível em: < https://abrasel. com. br/noticias/noticias/bares-restaurantes-otimistas-primeiro-trimestre-2025-pesquisa-abrasel/ >. Acesso em: 18 fev. 2025.
Bateson, J. E. G.; Hoffman, K. D. 2016. Princípios de Marketing de Serviços: Conceitos, estratégias e casos. 3. ed. +A Educação – Cengage Learning Brasil, Porto Alegre, RS, Brasil.
Bezerra, J. F.; Vasconcelos, R.; Leal, M. B. A.; Albuquerque, N. M. R. C. 2022. Gestão de restaurantes: uma prática de hospitalidade. Curso de Graduação Tecnológica em Gastronomia. Centro Universitário Brasileiro, UNIBRA. Disponível em: < https://www. grupounibra. com/repositorio-unibra > , < gestao-de-restaurantes-uma-pratica-de-hospitalidade32. pdf >. Acesso em: 16 ago. 2025.
Bird, S.; Klein, E.; Loper, E. 2009. Natural Language Processing with Python. 1. ed. Sebastopol: O’Reilly Media.
Branco, P.; Torgo, L.; Ribeiro, R. P. A. 2015. A Survey of Predictive Modelling under Imbalanced Distributions. Faculdade de Ciências. Universidade do Porto. Disponível em: < https://arxiv. org/abs/1505.01658 >. Acesso em: 06 jun. 2025.
Carvalho, V. V. 2019. Análise da influência do ambiente sobre a satisfação dos clientes de um restaurante no Shopping Riomar. Monografia (Graduação em Administração). Departamento de Administração, Centro de Ciências Sociais Aplicadas. Universidade Federal de Sergipe, São Cristóvão, SE, Brasil. Disponível em: < https://ri. ufs. br/handle/riufs/12419 >. Acesso em: 15 ago. 2025.
Caseli, H. M.; Nunes, M. G. V. 2024. Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. 3 ed. BPLN. Disponível em: < https://brasileiraspln. com/livro-pln/3a-edicao >. Acesso em: 15 ago. 2025.
Desmet. P. M. A.; Schifferstein. H. N. J. 2008. Sources of positive and negative emotions in food experience. Department of Industrial Design, Delft University of Technology. Disponível em: < https://www. sciencedirect. com/science/article/abs/pii/S0195666307003364? via%3Dihub > Acesso em: 15 ago. 2025.
Géron, A. 2019. Mãos à obra: aprendizado de máquina com Scikit-Learn & TensorFlow: conceitos, ferramentas e técnicas para a construção de sistemas inteligentes. 576 p. Alta Books, Rio de Janeiro, Brasil.
Grandini. M.; Bagli. E.; Visani. G. 2020. Metrics for Multi-Class Classification: an Overview. Disponível em: < https://arxiv. org/abs/2008.05756 >. Acesso em: 15 ago. 2025.
Hair, J. F. Jr.; Harrison, D. E.; Rischer, J. J.2018. Marketing research in the 21st century: opportunities and challenges. Brazilian Journal of Marketing – BJMKT, v. 17, n. 5, p. Disponível em: < https://www. redalyc. org/journal/4717/471759753005/ >. Acesso em: 18 fev. 2025.
Kotler, P. 2021. Marketing Para O Século XXI. p.33. Editora Alta Books. E-book. Rio de Janeiro, Brasil.
Kotler, P.; Keller, K. L. 2012. Administração de marketing. 14. ed. Pearson Education do Brasil. São Paulo, Brasil.
Lima, Y. S. A. 2021. Análise de sentimentos em cenários intensivos em conhecimento. Disponível em: < https://www. puc-rio. br/ensinopesq/ccpg/pibic/relatorioresumo2021/download/relatorios/CTC/IND/INDYasmin%20Silva%20Amaro%20de%20Lima. pdf >. Acesso em: 18 fev. 2025.
Limeira, T. M. V. 2017. Comportamento do consumidor brasileiro. 2ª ed. p.64. Saraiva Uni. E-book. Rio de Janeiro, Brasil.
Liu, B. 2012. Sentiment analysis and opinion mining. San Rafael: Morgan & Claypool Publishers. San Rafael, CA, EUA.
Malakin, L. A. 2024. Avaliação de Classificadores na Análise de Sentimentos em Redes Sociais Durante a Pandemia da COVID-19. Dissertação. Mestrado em Matemática, Estatística e Computação. Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, Brasil. Disponível em: < https://www. teses. usp. br/teses/disponiveis/55/55137/tde-05072024-112257/pt-br. php >. Acesso em: 12 ago. 2025.
Munzert, S.; Rubba, C.; Meibner, P.; Nyhuis, D. 2015. Automated data collection with R: A practical guide to web scraping and text mining. 1ª ed. John Wiley & Sons, Ltd. Reino Unido.
Pang, B.; Lee, L. 2004. A sentimental education: sentiment analysis using subjectivity summarization based on minimum cuts. Disponível em: < https://arxiv. org/abs/cs/0409058 >. Acesso em: 06 jun. 2025.
Pareek, A.; Saini, K.; Kumari, A.; Nikita, K. 2024. Restaurant Review Sentiment Analysis: An Automated Approach to Customer Feedback Analysis. Jaipur: Arya Institute of Engineering and Technology. Disponível em: < https://propulsiontechjournal. com/index. php/journal/article/view/2216 >. Acesso em: 13 fev. 2025.
Pereira, F. V. 2022. Processamento de linguagem natural para detecção de padrões no mercado de ações brasileiro. Universidade Federal de Santa Maria, Santa Maria, RS, Brasil. Disponível em: < https://propulsiontechjournal. com/index. php/journal/article/view/2216 >. Acesso em: 06 jun. 2025.
Pinna, F. C. A.; Yamasaki, G. T. M.; La Rosa, I. A. S. 2020. Reconhecimento de Entidades Nomeadas na Língua Portuguesa. 78 p. Universidade de São Paulo – USP, Escola Politécnica, Departamento de Computação e Sistemas Digitais – PCS. São Paulo, Brasil. Disponível em: < https://pcs. usp. br/pcspf/wp-content/uploads/sites/8/2020/12/MonografiaPCS3560SEM2020Grupo_S15. pdf >. Acesso em: 13 fev. 2025.
Provost, F.; Fawcett, T. 2016. Data Science para negócios. Tradução de Data Science for Business. 408 p. Alta Books. Rio de Janeiro, Brasil.
Serviço Brasileiro de Apoio às Micro e Pequenas Empresas [SEBRAE]. 2016. Alimentação fora do lar. São Paulo: Sebrae.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:




























