Início ESTATÍSTICAS superar as metas esperadas

superar as metas esperadas

3
0

Dos blogs à BBC, o conceito de gol esperado (ou xG) entrou no léxico da grande mídia. Tornou-se popular porque é um conceito útil; Este é um conceito útil porque o futebol é um jogo com poucos gols. O acaso (ou sorte) pode ser a diferença entre a vitória e a derrota, um dia bom ou um dia ruim. No entanto, os golos esperados medem o que teria acontecido num dia normal.

É uma quantidade simples de medir. Os chutes recebem um número entre 0 e 1: a proporção de chutes idênticos (por exemplo, da mesma posição) que resultaram em um gol. Este número às vezes é chamado qualidade do acasoEm seguida, cada chute feito por uma equipe durante uma partida (ou temporada) é somado para calcular o número de gols que você “esperava” que eles marcassem.

Os modelos xG tradicionais não levam em consideração a identidade do jogador que arremessa. Você precisa de um conjunto de dados contendo milhares de arremessos para medir adequadamente a qualidade das chances em todas as situações e circunstâncias, o que significa que você precisa coletar arremessos de muitos jogadores diferentes. Claro, seria de esperar que jogadores atacantes da qualidade de Harry Kane, Mo Salah ou Eden Hazard tivessem maior probabilidade de converter oportunidades do que avançados menos espectaculares ou defensores ou médios medianos. Dado que o xG é calibrado principalmente com base na taxa de sucesso de chutes de jogadores de baixo nível, devemos esperar que atacantes de elite como Kane superem o total de xG de seus chutes em uma temporada. Mas até que ponto?

Neste post descrevo um método estatístico simples para medir o desempenho superior de xG, a taxa na qual atacantes típicos excedem sua meta esperada de oportunidades. A próxima seção descreve a metodologia, depois considerarei os resultados: Quem são os artilheiros mais eficientes da EPL?

medindo melhor desempenho

Eu defino o desempenho ideal, $o_p$, para um jogador P Como:

$\Largeo_p = \fracG_pxG_p \;$,

onde $G_p$ é o número de gols marcados pelo jogador, e $xG_p$ é a contagem esperada de gols de seus chutes (independentemente de resultarem em gol ou não). Para um jogador médio, $o_p$ deveria estar próximo de 1; Para um defensor é provável que seja menor que 1 e para um atacante típico deve ser muito maior que 1.

A maneira mais fácil de medir a melhoria do desempenho de um jogador é simplesmente dividir o número de gols marcados durante um determinado período pelo total de xG de suas chances. No entanto, o número e a qualidade das oportunidades variam muito de jogador para jogador – Harry Kane realizou muito mais remates do que Josh King – e por isso a incerteza na nossa medida de melhoria do desempenho será maior para alguns jogadores do que para outros. Para identificar com segurança os jogadores que pontuam consistentemente mais do que seu registro de xG, precisamos medir Distribuição Do seu melhor desempenho.

Adotei uma abordagem empírica de Bayes para medir o desempenho melhorado, multiplicando o anterior (medido a partir dos dados) por uma função de probabilidade de Poisson para estimar a distribuição posterior do desempenho melhorado para cada jogador. Detalhes específicos são fornecidos no apêndice.

Medi a qualidade do acaso usando o modelo descrito em uma postagem anterior. Este modelo, que foi calibrado em mais de 15.000 fotos do dispositivo Os dados de incidência levam em consideração não apenas a distância e o ângulo do gol, mas também o número de defensores intervenientes e a pressão defensiva exercida sobre o arremessador.

O artilheiro mais eficiente da EPL

foto 1 Abaixo é mostrado o desempenho melhorado previsto para todos os jogadores atuais da EPL que realizaram pelo menos 100 arremessos nas temporadas 2016/17 e 2017/18 (exceto cobranças de falta, para as quais o modelo xG não está bem calibrado). O diamante vermelho indica a média posterior; As barras de erro azuis indicam +-1 desvio padrão em torno da média.

Figura 1. distribuição posterior de melhor desempenho – Proporção de gols em relação aos gols esperados – para jogadores atuais da EPL que deram pelo menos 100 arremessos nas temporadas 16/17 e 17/18. O diamante vermelho indica média; barras de erro azuis $\pm1$ sd

Eden Hazard lidera a lista com um desempenho superior estimado em $1,34\pm0,21$, o que indica que, em média, ele marcou cerca de 33% mais gols do que um jogador médio nas mesmas ocasiões. Em 2016/17 e 2017/18 ele marcou 28 gols em 127 cobranças (exceto cobranças de falta), significativamente superior ao seu total de xG de 18,4. Outros modelos XG Também foi descoberto que Hazard supera consistentemente seu xG.

Mo Salah e Heung-Min Son também tiveram um desempenho muito melhor, com Salah marcando 32 gols em um total de xG de 21,8, e Son marcando 26 gols em um total de xG de 17,4. É interessante que os três melhores jogadores – Son, Salah e Hazard – sejam todos médios ofensivos dinâmicos que marcam a maioria dos seus golos em jogo aberto.

Apenas cinco jogadores têm desempenho significativamente superior a 1,0 no nível de confiança de 90%: os três jogadores acima, mais Romelu Lukaku e Harry Kane. Embora Josh King tenha uma classificação ligeiramente superior a Kane ou Lukaku, a distribuição posterior de seu desempenho superior é muito mais ampla porque há menos dados (ou seja, menos arremessos) para avaliá-lo.

Christian Benteke é de longe o jogador com melhor desempenho inferior e o único jogador com uma média de desempenho superior abaixo de 1. Ele claramente teve algumas temporadas difíceis, marcando apenas 18 gols em um total de xG de 26,7. Os problemas de Benteke parecem estar ligados a chutes feitos com seu pé direito preferido: embora seus gols estejam alinhados com seu total de xG para chutes com o pé esquerdo e cabeçadas, ele marcou apenas 7 gols em chutes com o pé direito nas últimas duas temporadas, para um total de xG de 14,6.

Talvez um resultado surpreendente tenha sido o desempenho de Sergio Aguero. Apesar de ter marcado 40 gols nas temporadas 2016/17 e 2017/18 (excluindo cobranças de falta), o desempenho superior esperado de Aguero é de quase 1, com seu xG geral de 218 chutes sendo de 40,8. Ele também tem um pé só, com seus gols com o pé esquerdo ficando significativamente atrás dos números xG de seus chutes com o pé esquerdo. nos dados de destino esperados understat. com destaca que, nas últimas 5 temporadas, Aguero marcou 95 gols em um total de xG de 90,3, o que significa um índice de eficiência de 1,05: significativamente menor que Kane ou Hazard no mesmo período.

expectativas pessoais

É claro que a melhoria do desempenho é puramente uma medida da taxa de conversão de oportunidades: não diz nada sobre a capacidade dos jogadores de criar oportunidades para si próprios ou para os seus companheiros de equipa. No entanto, fornece um mecanismo para individualizar os golos esperados, permitindo a avaliação específica do jogador das capacidades de finalização em amostras limitadas. Seria interessante medir a melhoria do desempenho ao longo da carreira de um jogador, gerando assim curvas de envelhecimento independentes da qualidade das equipas em que jogou. Também pode ser usado para melhorar as previsões de resultados de partidas baseadas em xG – um tópico ao qual retornarei em uma postagem futura.

—–

Apêndice: Estimativa bayesiana de desempenho ideal.

A distribuição posterior do desempenho superior de um jogador $p$ $o_p$ é dada por:

$p(o_p | G_p ; xG_p ) \propto \displaystyle \prod_i=1^n_pp(G_i,pp(o)$ ,

onde $G_i,p$ é o número de gols marcados pelo jogador em $i$ das partidas $n_p$ disputadas durante as temporadas 16/17 e 17/18, e $xG_p$ é a média de gols esperados (por jogo) com base em seus chutes nessas partidas, medido usando o modelo descrito aqui. O anterior, $p(o)$, é uma distribuição gama com média 1,06 e desvio padrão de 0,3, medida a partir da distribuição de $G/xG$ para todos os jogadores da EPL que deram pelo menos 50 arremessos nas temporadas 16/17 e 17/18. A média é maior que 1,0 porque o limite de 50 arremessos remove os jogadores defensivos da amostra, o que introduz viés de seleção.

$p(G_i,p | o ; A distribuição gama é o conjugado anterior à função de probabilidade de Poisson, portanto a distribuição posterior da melhoria do desempenho do jogador também é uma distribuição gama.

Na prática, o melhor desempenho para cada jogador é estimado redimensionando o anterior por $p(xG_p o)$ – tratando $xG_p$ como um fator de escala – redimensionando a distribuição anterior de $xG_p$ para a distribuição de $o_p$.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui