08 de abril de 2026
Proctoring e IA: supervisão remota escalável de provas online
Claudio Rubens Silva Filho; Danielle Aparecida Alcântara
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
O aumento expressivo da digitalização no ensino superior impulsionou globalmente a adoção de avaliações em formato remoto, processo que se intensificou com a necessidade de continuidade educacional em períodos de restrição presencial. No cenário brasileiro, dados do censo do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira indicam que 77,2% das vagas de graduação são ofertadas na modalidade de Educação a Distância, abrangendo um contingente superior a 19 milhões de alunos. Essa predominância exige que os processos avaliativos acompanhem a evolução tecnológica, uma vez que as provas são componentes obrigatórios e indispensáveis para a validação do aprendizado. Diante desse panorama, a manutenção da integridade e da credibilidade das avaliações torna-se um desafio crítico, especialmente em exames de alta relevância, como processos seletivos admissionais, exames nacionais e certificações profissionais.
Embora o formato digital ofereça flexibilidade e alcance, ele introduz vulnerabilidades relacionadas à conduta dos examinandos. Problemas comuns incluem a dificuldade na identificação inequívoca do candidato, o risco de vazamento de conteúdos, o uso de materiais de consulta não autorizados e a utilização de dispositivos eletrônicos, como celulares e calculadoras. Práticas recorrentes de má conduta envolvem a alternância entre abas do navegador durante a execução do exame, mudanças bruscas de posição em relação à câmera e a presença de terceiros no ambiente de prova. A pressão por desempenho acadêmico, aliada à facilidade de acesso a ferramentas conectadas, potencializa as oportunidades para a violação das normas estabelecidas. A desonestidade acadêmica é frequentemente motivada pelo despreparo, pela percepção de impunidade e pela crença de que não haverá sanções efetivas, sendo disparada por gatilhos de incentivo, oportunidade e racionalização (Golden & Kohlbeck, 2020).
Nesse contexto, o uso de sistemas de monitoramento remoto, conhecidos como proctoring, surge como uma alternativa tecnológica para assegurar a lisura dos exames. Essas soluções utilizam inteligência artificial para identificar padrões suspeitos e analisar o comportamento dos participantes de forma individualizada, mesmo em aplicações que envolvem grandes volumes de alunos simultâneos. A análise automatizada de vídeo e áudio permite registrar ocorrências em tempo real, fornecendo material probatório para auditorias posteriores e eventuais contestações jurídicas. O desenvolvimento de modelos técnicos funcionais de proctoring visa enfrentar os desafios de escalabilidade e custo, garantindo que instituições de ensino possam ofertar exames digitais com supervisão confiável e resultados auditáveis. O objetivo central reside na criação de uma arquitetura capaz de verificar a identidade do aluno, detectar objetos proibidos e identificar a presença de pessoas não autorizadas, orientando decisões estratégicas para a implementação de produtos comerciais robustos.
A fundamentação teórica do proctoring baseia-se na necessidade de mitigar as oportunidades de fraude por meio da vigilância constante e da análise de dados biométricos e comportamentais. Estudos indicam que a supervisão humana remota, embora eficaz em pequena escala, não possui a capilaridade necessária para atender à demanda massiva do ensino superior contemporâneo, além de apresentar custos elevados e dificuldades logísticas. Por outro lado, soluções puramente automatizadas enfrentam desafios técnicos relacionados a falsos positivos e questões éticas ligadas à privacidade dos dados. A evolução da visão computacional permite que algoritmos de reconhecimento facial e detecção de objetos operem com níveis crescentes de precisão, tornando viável a integração dessas tecnologias em plataformas de software como serviço especializadas em processos avaliativos. A missão dessas plataformas é oferecer um ambiente seguro onde a honestidade acadêmica seja preservada, garantindo que a nota obtida reflita fielmente o conhecimento do examinando (Lee & Fanguy, 2022).
A metodologia adotada para a concepção e validação da solução de proctoring possui caráter exploratório e experimental, sendo estruturada em cinco etapas fundamentais que compreendem desde a definição da arquitetura até a análise detalhada dos dados coletados. O processo iniciou-se com a análise de dois cenários arquiteturais distintos para a identificação de ocorrências. O primeiro cenário baseava-se na análise contínua do streaming de vídeo, enquanto o segundo fundamentava-se na análise de frames estáticos capturados em intervalos regulares de tempo. Ao avaliar o equilíbrio entre eficácia e viabilidade econômica, optou-se pelo segundo cenário, que apresentou um custo operacional aproximadamente 50% menor. A definição dos parâmetros técnicos incluiu o uso de vídeo com resolução de 720p e taxa de bits média de 512 kbps, resultando em um consumo de dados de cerca de 0,7 GB por hora de prova. A captura de frames foi configurada para uma frequência de uma imagem a cada cinco segundos, totalizando 720 imagens por hora, com um tamanho médio de 50 kb por arquivo.
O levantamento de requisitos foi realizado por meio de consultas a clientes de plataformas educacionais, análise de soluções globais de mercado e entrevistas com gestores e coordenadores pedagógicos de instituições privadas de ensino superior. Participaram desse processo três gestores educacionais e dois gerentes de tecnologia, selecionados pela vasta experiência em processos avaliativos digitais e pela vivência direta na tomada de decisão sobre tecnologias educacionais. A diversidade do grupo permitiu captar necessidades de instituições de diferentes portes, focando em escalabilidade, segurança e usabilidade. Os requisitos funcionais identificados incluíram a autenticação segura de usuários, a configuração prévia do ambiente com validação de hardware, a verificação contínua de identidade durante o exame e a detecção automática de indícios de fraude com emissão de alertas em tempo real. Já os requisitos não funcionais priorizaram a criptografia de dados, o suporte a milhares de usuários simultâneos, a baixa latência na transmissão e a eficiência no uso de recursos de nuvem para otimização de custos.
O desenvolvimento do protótipo utilizou a infraestrutura da Amazon Web Services, aproveitando serviços especializados para garantir a robustez necessária. A arquitetura foi projetada para ser agnóstica em relação ao provedor, permitindo futura replicação em outras nuvens. O frontend foi implementado com tecnologias web padrão, como HTML, CSS e JavaScript, organizando as jornadas de uso em dois módulos principais: o do participante e o do fiscal de prova. No módulo do participante, scripts em JavaScript realizam a captura dos frames e os enviam para uma função serverless via API Gateway. Essa função utiliza o serviço de reconhecimento de imagem para identificar a presença de pessoas, objetos não permitidos e validar a identidade do aluno confrontando a imagem atual com a foto registrada no momento do acesso. As ocorrências detectadas são persistidas em um banco de dados não relacional e disparam notificações imediatas na interface do fiscal.
A codificação do backend foi realizada utilizando o framework MVC Laravel, escolhido pela agilidade no desenvolvimento e facilidade na definição de fluxos de navegação e regras de negócio. Para a captura e análise de frames, utilizou-se o ambiente de execução Node.js em funções Lambda, o que assegurou alta capacidade de resposta e elasticidade sem sobrecarregar o servidor principal. A topologia da rede incluiu um balanceador de carga elástico para distribuição de tráfego entre múltiplas instâncias de aplicação, integrado a um serviço de escalonamento automático. Este serviço foi parametrizado para iniciar novas instâncias sempre que o processamento atingisse 70% da capacidade por um período consecutivo de três minutos. O armazenamento de dados foi dividido entre um banco de dados relacional para informações estruturadas, como cadastros e questões, e um banco não relacional para o alto volume de registros de ocorrências. O serviço de armazenamento de objetos foi utilizado para guardar os frames e o vídeo final da prova, garantindo persistência a baixo custo.
A transmissão do vídeo em tempo real foi viabilizada por serviços de streaming de vídeo, permitindo que o fiscal acompanhasse a webcam do participante com latência reduzida. Para validar essa funcionalidade, criou-se uma interface de teste com visualização simultânea do produtor do vídeo e do consumidor. A estimativa de custos para a operação foi calculada detalhadamente, resultando em um valor de 1,69 USD por hora de prova por participante. Esse montante engloba os custos de ingestão e consumo de vídeo, o processamento de imagens para detecção de rótulos e faces, a verificação de identidade e o armazenamento de dados. O componente de maior impacto financeiro foi o serviço de reconhecimento de imagem, responsável por cerca de 66% das despesas totais, o que indica a necessidade de explorar alternativas de código aberto para otimização econômica em larga escala.
A etapa de validação e testes envolveu a aplicação de provas simuladas em ambiente controlado com um grupo de 16 participantes. Durante as sessões, foram induzidos comportamentos intencionais para testar a sensibilidade do sistema, como a saída do campo de visão, o uso de aparelhos celulares, a troca de pessoas diante da câmera e o uso de acessórios como bonés e óculos. A coleta de dados resultou em 264 ocorrências registradas, as quais foram analisadas quantitativamente para determinar a acurácia do modelo. A análise qualitativa foi conduzida por meio de questionários anônimos aplicados aos participantes, buscando compreender as percepções sobre privacidade, conforto e segurança durante o monitoramento. Os feedbacks coletados foram agrupados em categorias relacionadas à segurança, privacidade e experiência do usuário, servindo de base para a identificação de melhorias necessárias no produto final.
Os resultados quantitativos obtidos nos testes demonstraram uma eficácia elevada do sistema de proctoring na detecção de comportamentos suspeitos. No critério de identificação de terceiros no ambiente e na detecção de saída do participante do campo de visão da câmera, o sistema alcançou uma acurácia de 100%, sem o registro de alarmes falsos nessas categorias. Para o uso de aparelhos celulares, a eficácia foi de 96%, com apenas dois alarmes falsos em um total de 50 ocorrências simuladas. O desempenho ligeiramente inferior foi observado na detecção de cobertura parcial do rosto, que apresentou uma acurácia de 92,98%, com quatro casos de falsos positivos em 57 ocorrências. Esse resultado sugere que a obstrução facial é mais sensível a variáveis externas, como condições de iluminação e o uso de acessórios permitidos, o que demanda refinamentos nos algoritmos para reduzir a sensibilidade a fatores não relacionados a fraudes.
A acurácia geral do sistema foi calculada em 96%, baseada na detecção correta de 144 ocorrências em um universo de 150 eventos validados, descontando-se os seis alarmes falsos registrados. Esse índice de precisão é significativamente superior aos resultados reportados em estudos anteriores sobre sistemas de supervisão baseados em inteligência artificial. Pesquisas indicam que sistemas que avaliam apenas um critério podem apresentar taxas de erro de até 30%, enquanto softwares multimodais que combinam diversos fatores tendem a apresentar cerca de 8% de falsos positivos e 13% de falsos negativos (Tweissi, Al Etaiwi & Al Eisawi, 2022). A superioridade dos resultados obtidos neste estudo pode ser atribuída à evolução tecnológica dos modelos de visão computacional e à configuração otimizada da arquitetura de nuvem utilizada. É fundamental reiterar que a tecnologia atua como uma ferramenta de apoio à decisão, cabendo ao avaliador humano a análise final das evidências para atestar a ocorrência de desonestidade acadêmica.
A análise qualitativa revelou que, embora a maioria dos participantes compreenda a importância do monitoramento para garantir a credibilidade do exame, existem preocupações legítimas quanto à privacidade e à exposição do ambiente doméstico. Relatos indicaram desconforto ao ter que mostrar o espaço privado e insegurança sobre o destino das gravações após o término da prova. No âmbito da usabilidade, os participantes destacaram a facilidade de navegação na plataforma, mas apontaram dificuldades técnicas pontuais, como a liberação de acesso aos periféricos de áudio e vídeo no navegador. Esses feedbacks direcionaram a proposição de melhorias, como a implementação de um simulador de ambiente para testes prévios de hardware, a criação de um checklist visual de passos obrigatórios e a exibição de um termo de consentimento detalhado, em conformidade com a Lei Geral de Proteção de Dados.
A discussão sobre a viabilidade econômica evidenciou que o custo de 1,69 USD por hora de prova é um fator determinante para a estratégia de precificação do serviço. A dependência de serviços proprietários de visão computacional expõe a solução a variações cambiais e custos elevados em operações de larga escala. Como alternativa, sugere-se o desenvolvimento de modelos próprios utilizando bibliotecas de código aberto, o que poderia reduzir drasticamente os custos operacionais e aumentar a soberania tecnológica da solução. Além disso, a integração de novas variáveis comportamentais, como o monitoramento do tempo de permanência fora da aba do exame e a análise de movimentos oculares e labiais, pode elevar ainda mais o nível de segurança, dificultando consultas a fontes externas ou conversas paralelas não detectadas pela câmera.
Outro ponto de discussão relevante é o risco de exclusão digital associado à obrigatoriedade de recursos tecnológicos avançados. A necessidade de uma conexão de internet estável e de hardware adequado pode penalizar estudantes com menor acesso a infraestrutura tecnológica. Portanto, a adoção do proctoring deve ser acompanhada de estratégias para contornar falhas técnicas e garantir que a credibilidade do exame não seja comprometida por fatores alheios ao desempenho acadêmico. A transparência no uso dos dados e a conformidade legal são pilares essenciais para a aceitação social dessas tecnologias. O equilíbrio entre o rigor da fiscalização e o respeito à privacidade do examinando é o desafio central para a evolução das plataformas de avaliação online.
A arquitetura escalável demonstrada provou ser capaz de suportar as demandas de um sistema de proctoring moderno, integrando processamento serverless e serviços de inteligência artificial de forma eficiente. A escolha por analisar frames em vez de streaming contínuo de vídeo para a detecção de fraudes mostrou-se uma decisão acertada do ponto de vista econômico, sem comprometer significativamente a precisão do monitoramento. A capacidade de resposta do sistema, aliada ao registro persistente de logs e evidências em vídeo, oferece uma camada de segurança robusta para instituições de ensino. A evolução contínua dos algoritmos de aprendizado de máquina promete reduzir ainda mais a incidência de falsos positivos, tornando a supervisão automatizada cada vez mais indistinguível da supervisão humana em termos de discernimento comportamental.
A implementação de práticas anti-spoofing e a análise biométrica avançada representam o próximo passo para fortalecer a autenticação em provas digitais. A detecção de tentativas de acesso utilizando fotos ou vídeos de terceiros é crucial para impedir a falsidade ideológica. Da mesma forma, o monitoramento de variáveis do sistema operacional, como o bloqueio de capturas de tela e a desativação de segundos monitores, complementa a vigilância por vídeo, criando um ecossistema de avaliação blindado contra as formas mais comuns de trapaça digital. O sucesso da solução depende da integração harmoniosa entre essas diversas camadas de proteção, garantindo que o processo seja fluido para o aluno honesto e rigoroso para quem tenta burlar as regras.
Em termos de infraestrutura, a utilização de serviços de escalonamento automático e balanceamento de carga assegura que a plataforma mantenha o desempenho mesmo durante picos de acesso, comuns em exames nacionais com milhares de inscritos. A divisão entre armazenamento relacional e não relacional otimiza a recuperação de dados cadastrais e a gravação massiva de eventos de monitoramento, garantindo a integridade das informações. A persistência dos dados em serviços de armazenamento de objetos com políticas de retenção claras atende aos requisitos de auditoria e conformidade legal, permitindo que as instituições revisitem as provas sempre que necessário.
A experiência do usuário deve ser priorizada para reduzir a ansiedade associada ao monitoramento remoto. A inclusão de mensagens orientativas, suporte técnico em tempo real e interfaces intuitivas contribui para um ambiente de prova menos estressante. O reconhecimento de dificuldades estruturais dos candidatos, como ambientes com ruído excessivo ou espaços compartilhados, deve ser previsto nas políticas de aceitação da instituição, permitindo uma abordagem mais inclusiva e socialmente responsável. O proctoring não deve ser visto apenas como uma ferramenta de punição, mas como um mecanismo de garantia de justiça para todos os participantes, assegurando que o mérito acadêmico prevaleça.
Conclui-se que o objetivo foi atingido, uma vez que a viabilidade técnica da solução de proctoring foi demonstrada com uma acurácia de 96% na detecção de fraudes e uma arquitetura em nuvem capaz de suportar a escalabilidade necessária para exames de grande porte. O estudo evidenciou que, embora os custos com serviços de visão computacional sejam elevados, a integração de tecnologias automatizadas oferece uma camada de segurança indispensável para a credibilidade das avaliações online no ensino superior. Os desafios identificados em relação à privacidade e à sensibilidade a variáveis de iluminação apontam para a necessidade de refinamentos contínuos no modelo e na comunicação com os usuários. A transição para modelos de código aberto e a inclusão de novas métricas comportamentais representam caminhos promissores para a evolução da ferramenta, garantindo uma solução economicamente sustentável e tecnicamente robusta para o mercado educacional brasileiro.
Referências Bibliográficas:
Golden, J., & Kohlbeck, M. 2020. Addressing cheating when using test bank questions in online Classes. Journal of Accounting Education. Disponível em: <https://doi.org/10.1016/j.jaccedu.2020.100671>. Acesso em: 10/04/2025.
Lee, K., & Fanguy, M. 2022. Online exam proctoring technologies: Educational innovation or deterioration? British Journal of Educational Technology, 53(3), 475–490. Disponível em: <https://doi.org/10.1111/bjet.13182>. Acesso em: 20/09/2025.
Tweissi, A., Al Etaiwi, W., and Al Eisawi, D., 2022. The Accuracy of AI-Based Automatic Proctoring in Online Exams. The Electronic Journal of e-Learning, 20(4), pp. 419-435. Disponível em: <https://academic-publishing.org/index.php/ejel/article/view/2600>. Acesso em: 10/09/2025.
Resumo executivo oriundo de Trabalho de Conclusão de Curso da Especialização em Engenharia de Software do MBA USP/Esalq
Saiba mais sobre o curso, clique aqui




























