Resumo Executivo

31 de março de 2026

Hit Song Science: Machine Learning nos Hits da Billboard (1958-2024)

Angélica Dolores Pereira de Melo; Paulo Fernando do Nascimento Afonso

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

A caracterização da indústria musical como um sistema de produção fabril remonta ao início do século XX, quando o New York Times descreveu a Tin Pan Alley como um conglomerado de editoras capaz de manufaturar, promover e distribuir canções como se fossem mercadorias ordinárias (Bishop, 1958). Esse modelo de negócio, estabelecido em Manhattan, fundamentava-se na lógica do lucro por meio da divisão do trabalho, especialização e padronização, assemelhando-se a qualquer linha de produção industrial emergente na época. A estrutura organizacional permitia que, para cada dez músicas impressas, nove pudessem recuperar apenas metade dos custos operacionais, que envolviam direitos, royalties, impressão e propaganda. No entanto, o sucesso de um único hit, com a venda de pelo menos 50 mil cópias, era suficiente para cobrir todos os prejuízos e gerar lucros consideráveis, consolidando a métrica do sucesso como o motor da indústria (Suisman, 2009).

A metrificação dos hits modelou a dinâmica de produção e reduziu incertezas no suprimento e na demanda, permitindo a consolidação de uma indústria robusta. A partir de 1890, a contratação de arranjadores e compositores em tempo integral transformou esses profissionais em operários da música, reduzindo riscos e trazendo flexibilidade aos negócios. Os editores detinham o poder de decisão final, alterando títulos, letras e refrões com base no gosto do público, enquanto os letristas eram compelidos a estudar as preferências populares para garantir a aceitação do mercado (Tilzer, 1916). O hit, portanto, não era apenas uma força econômica, mas uma força cultural que reconfigurou estruturas musicais, possibilitando o surgimento de gêneros como o jazz e o blues (Suisman, 2009). Com a transição para o formato digital e o streaming, a indústria retornou ao seu modelo inicial de venda de singles, onde a música volta a ser comercializada por valores unitários reduzidos.

Em 2003, o termo Hit Song Science foi introduzido pela empresa Polyphonic HMI para nomear softwares de predição baseados em inteligência artificial. Esse campo multidisciplinar une a ciência da computação a tópicos de teoria musical, sociologia e mercados culturais, objetivando identificar atributos comuns em canções populares por meio de técnicas de aprendizado de máquina (Seufitelli et al., 2023). A capacidade de prever um sucesso antes de sua distribuição é de interesse vital para diversos agentes, desde diretores executivos que buscam maximizar investimentos até provedores de serviços digitais que utilizam hits para atrair publicidade. Entender a estrutura de um hit permite decisões estratégicas sobre qual faixa deve liderar um álbum e onde aplicar esforços promocionais em acordos de 360 graus.

A exploração dos hits sob a perspectiva das paradas de sucesso, da economia e do engajamento de público revela que as tabelas de classificação são a fonte primária de metrificação (Seufitelli et al., 2023). Embora o sucesso de uma música possa ser subjetivo, ele é mensurado quantitativamente por meio de execuções, vendas, posições em rankings e abrangência multicultural. A revista Billboard, desde a década de 40, estabelece rankings baseados em uma conjuntura de fatores que incluem execução em rádios, vendas de fonogramas e, mais recentemente, o volume de reproduções em plataformas digitais. Essa base de dados é considerada uma das fontes mais confiáveis para a análise de dados no campo da predição musical, permitindo investigar os padrões que definem a era do fonograma.

O detalhamento metodológico deste estudo envolveu a coleta de dados do Top Chart da Billboard, focando exclusivamente nos hits que alcançaram a posição número um no ranking anual entre os anos de 1958 e 2024. Para a extração de características intrínsecas, foram utilizadas ferramentas especializadas que fornecem métricas de batidas por minuto, energia, danceabilidade, valência, duração, tonalidade e tempo do compasso. A análise da estrutura lírica e dos elementos formais, como introdução, refrão e ponte, foi realizada por meio de sincronização com bases de dados de letras musicais. No caso específico do ano de 1997, foram considerados dois fonogramas distintos para Elton John devido à ausência de um registro único para a mescla de suas faixas nas plataformas de streaming.

A organização dos dados também contemplou a classificação de gênero dos intérpretes, dividindo-os em categorias masculinas, femininas e mistas, além de identificar se o hit era fruto de uma performance solo ou de uma colaboração. Hits instrumentais foram identificados, mas excluídos das análises descritivas que dependiam de elementos textuais. A exploração das características seguiu a taxonomia que divide os atributos em genótipos, relacionados ao áudio e propriedades acústicas, e fenótipos, que abrangem informações não estruturais como popularidade e presença de artistas convidados (Seufitelli et al., 2023). Essa distinção é fundamental para compreender como a arte sonora se relaciona com os fatores externos de mercado.

O processo operacional de análise utilizou a técnica de agrupamento hierárquico aglomerativo, uma abordagem de aprendizado de máquina não supervisionada. A escolha por essa técnica justifica-se pela necessidade de diagnosticar similaridades e dissimilaridades em uma amostra que atravessa sete décadas de evolução cultural e tecnológica. A medida de distância adotada foi a de Manhattan, aplicada a variáveis métricas padronizadas por escore Z para garantir que diferentes escalas não distorcessem os resultados. O método de encadeamento completo foi selecionado para a formação dos grupos, visando identificar padrões bem definidos entre os 68 hits da amostra. A análise buscou verificar se as fórmulas de fabricação de hits identificadas no passado ainda encontram eco nas produções contemporâneas.

Os resultados indicam que o critério de permanência no ranking é a variável-chave para a longevidade de um hit e sua capacidade de movimentar o mercado. A média de permanência dos hits analisados entre os 100 mais ouvidos foi de 26 semanas. Observou-se uma variação significativa, com o período mínimo de 17 semanas registrado em 1970 e o máximo de 91 semanas em 2022. Curiosamente, quatro hits classificados como número um do ano pela Billboard não atingiram o topo da parada semanal em seus respectivos anos, mas garantiram a liderança anual devido à consistência de sua audiência ao longo de meses. Esse fenômeno demonstra que a estabilidade no gosto do público pode ser mais valiosa do que um pico momentâneo de popularidade.

A análise histórica revela uma transformação profunda na virada do milênio. Entre 1958 e 1999, a média de permanência de um hit no ranking era de 25 semanas. A partir dos anos 2000, esse número saltou para 49 semanas, representando um aumento de 98% na longevidade das canções de sucesso. Esse crescimento está intrinsecamente ligado à transição para o mundo digital e à mudança nos hábitos de consumo. Enquanto no século XX o sucesso era limitado pela capacidade de distribuição física e pela medição analógica, o século XXI permite a contabilização em tempo real de cada reprodução em serviços de streaming. A entrada de tecnologias como o Napster e o compartilhamento de arquivos no início da década de 2000 gerou inicialmente um pessimismo na indústria, mas os dados mostram que o setor se reinventou e alcançou níveis de fidelização sem precedentes.

A comparação entre artistas de diferentes eras ilustra essa mudança de paradigma. Os Beatles, por exemplo, mantiveram seus dois principais hits anuais por um total somado de 34 semanas no ranking. Em contraste, a cantora Adele permaneceu 65 semanas com um único hit em 2011. Essa disparidade não sugere necessariamente que artistas contemporâneos sejam mais ouvidos em termos absolutos, mas sim que os recursos atuais de computação e a onipresença dos dispositivos móveis permitem uma captura muito mais precisa e extensa do comportamento do ouvinte. No passado, as execuções em ambientes privados não eram computadas, e o sucesso dependia majoritariamente das vendas em lojas e da execução em rádios.

A década de 1990 funcionou como um período de transição, apresentando uma média de 37,3 semanas de permanência, valor superior aos períodos anteriores, mas ainda abaixo da era do streaming. A popularização do Compact Disc e a influência massiva da MTV foram fatores determinantes para esse crescimento intermediário. A música passou a ser consumida de forma mais visual e colecionável, preparando o terreno para a revolução digital. Outro fator relevante é o retorno à lógica dos singles; se até os anos 1990 o consumidor era compelido a adquirir álbuns completos, o ambiente digital resgatou a venda e o consumo de faixas individuais, espelhando o modelo de negócios das partituras do século XIX.

A análise das colaborações entre artistas revela uma tendência crescente de parcerias no século XXI. Entre 1958 e 1999, apenas três hits número um do ano foram colaborações, representando uma participação ínfima. A partir dos anos 2000, essa proporção subiu para 24%, evidenciando que a união de diferentes bases de fãs e a mistura de gêneros musicais tornaram-se estratégias eficazes para alcançar o topo das paradas. Esse comportamento denota maior competitividade e a necessidade de diversificação em um mercado saturado. No que tange ao formato, a amostra total mostra um equilíbrio entre grupos e artistas solo, embora os artistas solo tenham dominado as posições de destaque nas últimas duas décadas.

A predominância masculina nos hits globais é marcante, com 64,71% das canções interpretadas por homens. A média de mulheres no topo anual é de apenas 2,83 por década. A década de 1960 apresentou apenas uma mulher entre os dez maiores sucessos, enquanto as décadas de 1980 e 1990 mostraram um aumento para cinco representantes femininas. Esse cenário reflete questões culturais e estruturais da indústria que historicamente favoreceram vozes masculinas. No entanto, observa-se que intérpretes femininas de grande sucesso, como Whitney Houston, Mariah Carey e Adele, frequentemente quebram padrões técnicos, como a regra da voz média, atingindo notas muito altas que fogem ao conforto do ouvinte comum, mas que se tornam diferenciais competitivos.

As características tonais dos hits mostram uma preferência clara pela tonalidade de dó e suas variações, presente em 16 canções da amostra. A região entre as notas mi e fá concentra a maior parte dos sucessos femininos, enquanto os hits masculinos orbitam tonalidades mais baixas, como dó e ré. A tonalidade maior é predominante em 75% dos casos, reforçando a ideia de que músicas com sonoridade mais aberta e positiva tendem a performar melhor comercialmente. Apenas um quarto da amostra utilizou tonalidades menores, geralmente associadas a sentimentos de melancolia ou introspecção.

Em termos de métricas acústicas, a média de batidas por minuto dos hits é de 123, com extremos variando de 68 a 204 batidas por minuto. A métrica de energia, que avalia a intensidade da percepção sonora, manteve uma média de 58 em uma escala de zero a 100, com uma tendência clara de estabilização acima de 50 após os anos 2000. A danceabilidade, relacionada à facilidade de induzir o movimento corporal, apresentou média de 63, sendo as décadas de 1980 e 2010 as mais expressivas nesse quesito. A valência, que mede a positividade emocional da faixa, registrou média de 60,82, indicando que a euforia é um componente frequente nos grandes sucessos.

A estrutura temporal das músicas também demonstra padronização, com 93% dos hits seguindo o compasso de 4/4. A duração média estabilizou-se entre três e quatro minutos a partir de 2010, com o hit mais longo registrado em 1968 e o mais curto em 1965. A análise lírica revelou que a repetição do título ao longo da letra é uma ferramenta poderosa de memorização, ocorrendo em média 17,95 vezes por música. Esse recurso é intensificado no refrão, que se repete em média 2,8 vezes, enquanto a estrutura narrativa costuma ser composta por dois versos principais. A presença de uma finalização distinta, como um fade-out ou um trecho diferenciado, foi observada em 72% dos casos, sublinhando a importância de fechar a narrativa musical de forma marcante.

A clusterização resultou na formação de sete grupos distintos. O primeiro grupo, focado na força do rap e do hip-hop, concentrou sucessos dos anos 2000 com alta energia e batidas marcantes. O segundo grupo reuniu baladas dançantes de diversas épocas, unindo artistas como The Police e Dua Lipa por meio de métricas de danceabilidade superiores a 60. O terceiro grupo destacou a positividade do pós-guerra na década de 1960, com letras ufanistas e ritmos que vendiam o estilo de vida americano. O quarto grupo concentrou a positividade do mundo atual, com hits dos anos 1990 e 2000 que enfatizam a autoconfiança e relacionamentos. O quinto grupo foi classificado como o de hits visuais, com canções fortemente atreladas a videoclipes narrativos e histórias bem-humoradas. O sexto grupo, o mais homogêneo, reuniu os românticos clássicos, caracterizados por tonalidades maiores e temas sentimentais. Por fim, o sétimo grupo englobou baladas de grande alcance vocal que marcaram as décadas de 1960 a 1990.

Com base nos padrões observados, foram propostas nove regras para a fabricação de hits atuais voltadas ao treinamento de modelos de aprendizado de máquina. Os hits devem apresentar dois versos, repetir o refrão três vezes e possuir uma finalização clara. A tonalidade deve ser preferencialmente maior, em compasso 4/4, e situada entre dó e mi para vozes médias. O título deve ser repetido exaustivamente, cerca de 17 vezes, para garantir a fixação. Para vozes femininas fora da região média, a tonalidade de sol é a mais indicada. A média de batidas deve orbitar 123 por minuto, e o investimento em parcerias é altamente recomendado. A duração ideal deve ser de quatro minutos, mantendo valência, energia e danceabilidade em torno de 60.

Conclui-se que o objetivo foi atingido, uma vez que a investigação dos padrões dos hits ao longo de sete décadas permitiu identificar uma evolução clara na longevidade e na estrutura das canções de sucesso, culminando na proposição de variáveis robustas para a modelagem supervisionada. A transição do modelo analógico para o digital não apenas alterou a forma de consumo, mas dobrou a capacidade de permanência de um hit no gosto popular, evidenciando que a democratização dos meios de produção e a precisão das métricas de streaming transformaram a indústria musical em um ecossistema mais competitivo e orientado por dados. A identificação de sete clusters distintos demonstrou que, apesar das mudanças tecnológicas, certas fórmulas de composição e atributos acústicos permanecem como pilares fundamentais para a aceitação massiva, validando a aplicação de técnicas de aprendizado de máquina como ferramentas essenciais para a compreensão e predição do fenômeno cultural do hit.

Referências Bibliográficas:

Bishop, W. 1958. How Popular Song Factories Manufacture a Hit. NYT, Sept. 18; “Reminiscences of Walter Bishop”, Sept. 1958, p. 23, CU-OHROC; Goldberg, Tin Pan Alley, 100.

Tilzer, H.V. 1916. Introduction to Edward Michael Wickes, Writting the Popular Song. Springfield, Mass. XV-XVI. “Business with Music Publishers”, MTR 38 (May 14, 1904): 43.

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Mais recentes

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade