Início ESTATÍSTICAS Superestimamos o impacto da forma recente?

Superestimamos o impacto da forma recente?

6
0

A forma é um dos conceitos mais debatidos no futebol. Jogadores, treinadores, jornalistas e especialistas mencionam regularmente a dinâmica gerada pelas vitórias consecutivas. Os guias de forma são onipresentes nas análises pré-jogo, com a ideia de que os resultados recentes indicam a probabilidade de uma equipe vencer a próxima partida. Mas será que esta ideia está realmente fundamentada?

É difícil procurar a influência da forma ou da velocidade no futebol. Existem muitos fatores de confusão, nomeadamente a variação na qualidade dos adversários, os efeitos da vantagem de jogar em casa, as variações na seleção das equipas e o pequeno tamanho das amostras. As condições não são replicáveis, tornando difícil estudar se as vitórias recentes aumentaram as chances de vitória. No entanto, existem alguns testes estatísticos simples que realizamos para descobrir se a forma tem algum impacto no resultado dos jogos subsequentes.

Um teste é observar a frequência com que ocorrem sequências de vitórias. As sequências são uma característica natural da maioria dos processos aleatórios: se você lançar uma moeda 38 vezes seguidas, há 45% de chance de obter cinco caras consecutivas em algum ponto da sequência. Se a forma realmente tiver um efeito sobre os resultados futuros, seria de esperar que sequências de uma determinada extensão ocorressem com mais frequência na prática do que ocorreriam por acaso. Neste post examinarei se há alguma evidência disso.

frequência de sequências de vitórias

O experimento foi assim: para cada temporada da EPL desde a temporada 95/96, identifiquei todos os times que venceram de 14 a 29 partidas em uma temporada e os dividi em quatro grupos: aqueles que venceram 14–17 partidas, aqueles que venceram 18–21, 22–25 e 27–29 partidas. O grupo final continha apenas 17 times, 15 dos quais haviam conquistado o título naquele ano (com exceção do Liverpool em 13/14 e do Spurs em 16/17). Apenas dois clubes conseguiram 30 ou mais vitórias numa temporada: Chelsea em 16/17 e Man City em 17/18.

Dentro de cada grupo, medi a proporção de times que completaram sequências de vitórias naquela temporada, com a duração das sequências variando de 2 a 15 partidas.(1); diamantes vermelhos dentro foto 1 mostrar resultado. O painel superior esquerdo mostra times que venceram de 14 a 17 partidas em uma temporada. À medida que a duração da sequência de vitórias aumenta, a curva diminui rapidamente: cerca de 90% das equipas deste grupo conseguiram uma ‘sequência’ de vitórias de 3 jogos, mas menos de 20% completaram uma ‘sequência’ de vitórias de 5 jogos. Menos da metade das equipes que venceram entre 18 e 21 partidas (painel superior direito) completaram uma sequência de 5 vitórias consecutivas, mas apenas 20% completaram uma sequência de 6 vitórias consecutivas. Em comparação, mais da metade das equipes no grupo de 22-25 vitórias (canto inferior esquerdo) completaram uma seqüência de 6 vitórias consecutivas, enquanto mais de 80% das equipes no grupo final (painel inferior direito) alcançaram uma seqüência de 6 vitórias consecutivas.

foto 1: Proporção de times da EPL que completaram uma sequência de vitórias variando de 2 a 15 partidas em uma temporada. As equipes são agrupadas pelo número total de partidas vencidas em cada temporada: 14–17 (canto superior esquerdo), 18-21 (canto superior direito), 22-25 (canto inferior esquerdo) e 26-29 (EUdireitos-direitos). A área cinza mostra a variação resultante do embaralhamento repetido da ordem dos resultados de cada equipe (removendo qualquer impacto nos resultados).

Se a forma não tem efeito nos resultados futuros, o que esperaríamos desses resultados? Para determinar isso, embaralhei a ordem dos resultados das equipes de cada grupo, essencialmente destruindo qualquer informação sobre sequências de vitórias (mas talvez criando aleatoriamente algumas novas).(2). Ao alterar repetidamente a ordem das partidas, podemos avaliar quantas vezes as sequências vencedoras ocorrem completamente por acaso. Como um lembrete: se a forma tiver um impacto significativo nos resultados futuros, seria de esperar que sequências de uma determinada extensão ocorressem com mais frequência na prática do que ocorreriam por acaso.

áreas cinzentas foto 1 Estes representam a gama de resultados obtidos a partir de permutações repetidas (especificamente, os percentis 5 a 95). Os diamantes vermelhos, resultados observados, situam-se bem dentro destas regiões em todos os quatro grupos, indicando que não há evidência de que sequências de vitórias ocorram com mais frequência do que seria de esperar por acaso.

Então levei a análise um passo adiante. Em vez de embaralhar a ordem dos resultados de cada equipe, simulei as partidas com base na diferença Quanto Pontos em ambos os lados (role para baixo até o apêndice se estiver interessado em detalhes). Estas simulações controlam as diferenças na força das equipas e na vantagem de jogar em casa, mas não fornecem qualquer informação sobre a forma recente de cada equipa. Os resultados são mostrados como linhas tracejadas azuis Figura 2. A simulação reproduz quase exatamente a taxa observada de sequências de vitórias em cada um dos quatro grupos(3). Novamente, não há evidências de que a forma recente tenha impacto nos resultados posteriores.

Figura 2. Como na Figura 1, mas incluindo também os resultados de uma simulação baseada em Elo, na qual a forma recente não tem efeito no resultado dos próximos jogos (linhas tracejadas azuis). As simulações são totalmente consistentes com a frequência observada de sequências de vitórias na EPL (diamantes vermelhos).

forma vs vantagem em casa

Qual seria o tamanho do efeito na velocidade necessário para detectá-lo nesta análise? Para responder a isso, fiz uma modificação simples na simulação para imitar os efeitos do impulso, incorporando um aumento temporário e cumulativo na pontuação Elo (ou “força”) de uma equipe após cada partida vencida durante uma sequência de vitórias (mais detalhes são fornecidos no Apêndice). Acontece que, para detectar um efeito de impulso, o incentivo obtido ao vencer quatro jogos consecutivos teria de compensar os benefícios da vantagem de jogar em casa. Dado que a vantagem de jogar em casa é um factor muito bem estabelecido na previsão dos resultados dos jogos, este é um efeito bastante grande.

As estatísticas de sequências de vitórias são uma forma simples, mas rudimentar, de ver o impacto da forma nos próximos jogos. O problema é que o bom desempenho é um conceito muito relativo. mais sutil estudos Tentou-se controlar a força relativa dos adversários, o fator casa e a importância de cada partida. No entanto, tudo se complica muito rapidamente e os resultados são inconclusivos. Análise simples baseada em regressão linear forma como um profeta Também não houve evidências de que a aparência tenha qualquer poder preditivo.

E quanto à forma/velocidade em outros esportes? Houve vários estudos sobre ‘mãos quentes’ no basquete – a hipótese de que é mais provável que um jogador acerte um arremesso (marque) se suas tentativas anteriores também tiverem sido bem-sucedidas. UM papel original estudaram o desempenho de jogadores universitários de basquete nesse tema e concluíram que não havia evidências de mãos quentes. Os autores sugerem que a “ilusão” das mãos quentes é uma ilusão: as pessoas subestimam a frequência com que sequências de sucessos ou fracassos podem ocorrer de forma completamente aleatória e, assim, tentam fornecer explicações sobre o motivo pelo qual ocorrem. No entanto, estudos recentes (por exemplo) Aqui, Aqui E Aqui) questionaram a metodologia utilizada e argumentaram que testes estatísticos mais precisos demonstram evidências claras de mãos quentes.

Dado que o basquetebol (lances livres) e o basebol proporcionam um ambiente mais controlado para avaliar a velocidade do que o futebol, não é surpreendente que as tentativas de detectá-la ao nível do jogador no futebol tenham sido tipicamente realizadas. desenhou um espaço em branco. Isto não significa que o factor de bem-estar associado a vitórias (ou golos) consecutivos não exista: afinal, jogadores e treinadores mencionam-no frequentemente. Mas talvez tenhamos a tendência de interpretar isso demais como um guia para o que pode acontecer a seguir.

Obrigado a Bobby Gardiner, David Shaw e Roxanne Guenette pelos comentários.

——-

(1) Eu meço a proporção de equipes que alcançam sequências consecutivas, em vez da taxa em que as sequências ocorrem, para evitar problemas associados à contagem do número de sequências curtas em uma sequência longa.

(2) Randomizei os jogos em casa e fora de casa separadamente para que a ordem dos jogos em casa e fora permanecesse a mesma.

(3) O acordo não se limita à probabilidade de ocorrência de sequências, o número médio de sequências vencedoras de uma determinada duração na simulação também é consistente com os dados observados.

Apêndice: Metodologia de Simulação

O núcleo da simulação Elo é o método de simulação dos resultados das partidas. O número de gols marcados por cada equipe em uma partida é derivado de uma distribuição de Poisson com média, μ, dada por um modelo linear simples:

registrom = b0 +b1x1 +b2x2

Existem duas variáveis ​​previstas no modelo: x1 = ΔElo/400 onde ΔElo é a diferença entre a pontuação Elo daquela equipe e a de seus oponentes, e x2 Um indicador binário de vantagem em casa é igual a um se o time estiver jogando em casa e menos um caso contrário. Observe que as pontuações Elo são explicitamente projetadas para prever os resultados das partidas. A pontuação Elo é obtida para cada equipe no início de cada temporada clubello; As simulações não são executadas ‘a quente’.

Os coeficientes beta são determinados através de regressão linear utilizando partidas da EPL das temporadas 10/09 a 16/17, obtendo valores b0 = 0,25, b1 = 0,81 e b2 = 0,13. Todos são significativos, assim como a mudança no desvio em relação ao modelo apenas de interceptação.

Para incluir o efeito da velocidade incluí um aumento cumulativo, bAté a pontuação Elo da equipe após cada vitória consecutiva. Por exemplo, a pontuação Elo de um time que vencer quatro partidas consecutivas será aumentada 4b; No entanto, assim que a equipe não conseguir vencer o jogo, o aumento total será zerado.

A figura abaixo mostra o impacto que esse modelo de formulário tem na frequência de sequências de vitórias. O gráfico mostra três valores b: 0 (linhas azuis), 10 (verde) e 20 (vermelho). Para efeito de comparação, o fator casa vale um aumento de 65 pontos em relação ao placar Elo do time da casa. As áreas sombreadas em cinza indicam o intervalo esperado b=0 caso (ou seja, o momentum não tem impacto nos resultados futuros).

Aumentar a velocidade para 20 gerará sequências de vitórias a uma taxa claramente maior do que a frequência que ocorre quando a velocidade não está incluída no modelo. Neste cenário, quatro vitórias consecutivas proporcionam um impulso temporário que supera a vantagem de jogar em casa.

Figura A1: A proporção de equipes que alcançam uma sequência de vitórias em um determinado período de uma temporada, o que pode impactar resultados futuros com base em simulações. As linhas azuis mostram os resultados quando a forma não tem efeito nos resultados futuros, as linhas verdes e vermelhas mostram os resultados das simulações quando cada vitória aumenta temporariamente a pontuação Elo do time em 10 e 20 pontos respectivamente (a menos que o time não perca uma partida). A área sombreada em cinza indica a distribuição da hipótese nula, ou seja, a forma não tem efeito nos resultados futuros. Rejeitar a hipótese nula no nível de 5% exigiria um aumento de Elo de pelo menos 20 pontos por vitória.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui