Index do Futebol Brasileiro no Twitter – semana 1/parte 1 (22-27 de maio)

Terceira semana do Campeonato Brasileiro 2013 e eu aproveito para iniciar aqui o que estou chamando de Index do Futebol Brasileiro no Twitter. Minha pesquisa de doutorado investiga comunidades online de fãs de esporte e, especialmente, meu foco são as interações de fãs brasileiros de futebol no Twitter. Para isso, estou mapeando as discussões dos 12 maiores clubes de futebol do país e, aqui, vou fazer quinzenalmente uma análise breve sobre o material que venho coletando na pesquisa. Essa primeira semana, de teste, inclui dados do dia 22 ao dia 27 de maio.

Os dados do Twitter permitem analisar vários aspectos das conversas, redes e dinâmicas que marcam as comunidades em torno de cada clube. Vou focar aqui em aspectos básicos: quem são as fontes de informação mais compartilhadas nas conversas (parte 1); quem são os usuários mais influentes (parte 1); quais são as hashtags mais tweetadas (parte 2); as mensagens mais tweetadas (parte 2); e como cada torcida se comporta em termos de volume/tipo de mensagem quando o time joga ou não joga, perde ou ganha, joga em casa ou joga fora e assim por diante  (parte 1) — a parte 2 dessa análise será publicada amanhã. O Twitter, assim como outras platformas de mídia social, tem sido largamente utilizado para comentários e interações ligadas ao mundo esportivo. Por isso, essas redes fornecem um material rico de análise para compreender como fãs de esporte têm se apropriado de novas tecnologias de informação nas atividades cotidianas que compõem o “ser torcedor”.

Para fazer a análise, estou coletando mensagens a partir de palavras-chave. Os times incluídos aqui são: Atlético-MG, Botafogo, Corinthians, Cruzeiro, Flamengo, Fluminense, Grêmio, Internacional, Palmeiras (2a divisão), Santos, São Paulo e Vasco. A pesquisa está em andamento e, como esta semana é ainda um teste, não foi possível incluir todos os times da primeira divisão. Mas o objetivo é incorporar ideias que surjam a partir das análises quinzenais e talvez outros times mais para frente. Vamos aos dados:

Volume de tweets

No total, esses primeiros seis dias tiveram 516.444 posts relacionados aos times selecionados. Para coletar esses dados, eu uso palavras-chave e também uma série de filtros após a coleta dos dados (por exemplo, apenas mensagens postadas por usuários que twittam em português foram consideradas). Em termos de volume de mensagens, Flamengo e Santos foram os times que os usuários mais twittaram. No caso do Santos, a saída de Neymar parece ter gerado o maior fluxo de mensagens. Com relação aos outros times, como é perceptível, o volume de mensagens se intensifica nos dias em que os clubes estão em campo.

volume_tweets_22-28maio

Mensagens com links

As mensagens do Twitter podem conter ou não conter um link sendo compartilhado. É interessante notar no gráfico 2 como a proporção de mensagens com URLs é bem maior quando o time não está em campo. Nos dias de jogo (que estão destacados no gráfico), todas as torcidas tendem a conversar de forma mais expontânea, compartilhando menos links nas mensagens. O padrão é bastante visível e pode indicar qual o tipo de interação predominante no dia-a-dia do torcedor no Twitter.

porcentagem_urls_22-27maio

Usuários mais influentes e domínios mais compartilhados

Os usuários mais influentes nas conversas e os domínios mais compartilhados fornecem indícios significativos sobre o papel de torcedores, jornalistas, meios de comunicação e outros atores sobre as conversas. A influência desses usuários é medida pela razão respostas recebidas/mensagens postadas. Esses dados serão apresentados time-a-time.

Atlético-MG

dominios_users_atletico_22-27maio

Botafogo

dominios_users_botafogo_22-27maio

Corinthians

dominios_users_corinthians_22-27maio

Cruzeiro

dominios_users_cruzeiro_22-27maio

Flamengo

dominios_users_flamengo_22-27maio

Fluminense

dominios_users_fluminense_22-27maio

Grêmio

dominios_users_gremio_22-27maio

Inter

dominios_users_inter_22-27maio

Palmeiras

dominios_users_palmeiras_22-27maio

Santos

dominios_users_santos_22-27maio

São Paulo

dominios_users_saopaulo_22-27maio

Vasco

dominios_users_vasco_22-27maio

Esses dados demonstram a predominância do portal Globoesporte no cenário digital brasileiro. O portal de esportes da Globo é o domínio de mídia tradicional mais usado como fonte pelos usuários. Outros domínios de mídia incluem Terra, Uol, Espn, Lancenet, Gazeta Esportiva, Estadão, Sportv etc. Além disso, veículos regionais também têm significativa ocorrência como o Super Esportes em Minas e o Zero Hora no Rio Grande do Sul.

Plataformas de mídia social como Facebook, Instagram e YouTube também são fortemente linkadas. URLs de endereços do próprio Twitter (imagens e endereços de posts, por exemplo) também são frequentes. Alguns domínios de mídia alternativa como blogs e websites de canais de pequeno porte também marcam presença, como o popular Futnet (futnet.com.br). Por fim, os sites de cada clube e blogs dedicados a times específicos também são razoavelmente populares.

Adicionado em 07/06/13

Para facilitar a visualização dos domínios compartilhados no geral:

dominios_todosclubes_22-27maio

Entre os usuários mais influentes, também podemos encontrar perfis de canais de mídia e vários jornalistas. Um dado particularmente interessante é a influência que alguns torcedores-chave e perfis cômicos têm nas conversas das comunidades dos times. Na análise a longo prazo será possível perceber se esses usuários-torcedores com grande influência são frequentemente os mesmos, o que pode fornecer indícios sobre as relações de hierarquia no interior das comunidades dos clubes.

Tipos de post

Outra informação que é crucial para entender o dia-a-dia do torcedor em redes sociais, nesse caso, o Twitter, é o tipo de mensagem sendo compartilhada. Abaixo, os gráficos mostram qual o tipo de tweet sendo postado em cada dia. Para tal análise, as mensagens do Twitter foram classificadas em: tweet original, respostas autênticas, retweets não editados e retweets editados. Basicamente, as respostas autênticas e retweets demonstram interações, uma vez que dois usuários ao menos estão envolvidos na mensagem. Especialmente, as respostas autênticas indicam conversas mais explícitas, com dois usuários trocando mensagens e não só ecoando mensagens postadas por outros. Os dados foram organizados por estado e a estrela abaixo do time indica clube que foi campeão estadual; a seta vermelha indica time que foi recentemente desclassificado de competição.

Minas Gerais

tipos_msg_mg_22-27maioRio Grande do Sul

tipos_msg_rs_22-27maioRio de Janeiro

tipos_msg_rj_22-27maioSão Paulo

tipos_msg_sp_22-27maio

Um padrão visível na maioria dos times é o aumento da proporção de tweets originais nos dias de jogos. Esse dado parece estar particularmente relacionado à diminuição da proporção de URLs nesses mesmos dias. Além disso, aparentemente, a proporção de respostas autênticas também diminui quando o time está em campo. Esse padrão parece estar também ligado ao tipo de engajamento dos usuários quando há jogo.

Amanhã publicarei as hashtags mais twittadas e os top posts por time.

Algumas observações técnicas

  • Os tweets sobre um time não necessariamente são postados por torcedores daquele time. A coleta se baseou nos nomes dos clubes e em termos usados tradicionalmente pelos torcedores para se referir a um time (por exemplo, a do Atlético foi coletada a partir de “atlético” e “galo”). Depois dessa primeira coleta, os tweets foram filtrados com expressões usuais do futebol (gol, campeonato, etc.) para excluir, por exemplo, mensagens sobre o Flamengo que fossem sobre o bairro do “Flamengo”. Por fim, os nomes de todos os jogadores do elenco e técnico atual dos times foi usado para adicionar mais um filtro. Entretanto, é claro que atleticanos podem twittar sobre o Cruzeiro. Inter e Grêmio, por exemplo, compartilham usuários entre os mais influentes (o mesmo perfil teve muito influência nas conversas de ambos os times). Isso porque usuários dedicados ao Grêmio podem também comentar algo sobre o Inter e vice-versa. Enfim, ainda que o volume de tweets represente um dado importante, ele não leva em conta se as mensagens são de apoio ou contrárias aquele clube.
  • A coleta de dados do São Paulo foi prejudicada por problemas técnicos. O volume de mensagens considerado aqui apenas levou em conta o termo “spfc”. Na próxima análise, a expressão “São Paulo” será adicionada juntamente com filtros para excluir mensagens sobre a cidade de “São Paulo”.

* Essa análise é fortemente inspirada no Australian Twitter News Indextrabalho desenvolvido por Axel Bruns no ARC Centre of Excellence for Creative Industries and Innovation (CCI). Vários dos métodos de processamento de dados do Twitter aqui aplicados foram também desenvolvidos por Bruns e podem ser consultados aqui. *

Anúncios

Um Comentário

  1. Pingback: Engajamento do torcedor brasileiro em mídias sociais | ágora esportiva

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

%d blogueiros gostam disto: