Dos blogs à BBC, o conceito de ‘gol esperado‘ entrou no vocabulário da grande mídia. Tornou-se popular porque é um conceito útil; Este é um conceito útil porque o futebol é um jogo com poucos gols. O acaso (ou sorte) pode ser a diferença entre a vitória e a derrota, um dia bom ou um dia ruim. No entanto, as metas esperadas medem o que acontecerá algum dia média Dia.
É uma quantidade simples de medir. Os chutes recebem um número entre 0 e 1: a proporção de chutes idênticos (por exemplo, da mesma posição) que resultaram em um gol. Vou me referir a isso como ‘qualidade do acaso‘. então você adiciona isso qualidade do acaso Para cada chute feito por uma equipe em uma partida, calcule o número de gols que você “espera” marcar naquele dia.(1).
Um problema com medidas específicas de qualidade das oportunidades é que elas ignoram a outra equipe. Quantos defensores eles tinham entre o arremessador e o artilheiro? Com que eficácia eles estavam negando-lhe tempo e espaço para fazer um chute certeiro? Há uma enorme diferença entre cabecear a bola em direção a uma rede desprotegida e lutar contra quatro zagueiros enquanto se estica para se firmar em um cruzamento.
felizmente, obrigado Tecnologias de estratagemaPodemos melhorar a situação agora. Os seus analistas codificaram pelo menos duas informações defensivas importantes no seu conjunto de dados de “principais oportunidades”: o número de jogadores defensores entre a bola e a baliza ao rematar e uma estimativa da pressão que exercem sobre um jogador atacante ao rematar.
Neste post vou examinar como a qualidade das chances é afetada pelo posicionamento e ações dos defensores adversários. Farei isso em duas etapas: primeiro, criarei um modelo básico no qual a probabilidade de gol é determinada inteiramente pela posição do chute e pelo tipo de chute (cabeçalho, pênalti, cobrança de falta, etc.). Em seguida, estenderei este modelo para incluir as métricas de defesa do Stratagem, demonstrando quantitativamente como a configuração e as atividades da equipe defensora afetam a probabilidade de um gol ser marcado.
modelo original
Stratagem coleta grandes quantidades de dados para cada partida. Mais notável para esta análise, eles fornecem(2): :
1) localização do tiro;
2) Tipo de chute (livre, pênalti, gol contra, lance aberto);
3) Parte do corpo (perna esquerda, perna direita, cabeça);
4) O número de defensores entre a posição do chute e o gol;
5) pressão defensiva (numa escala entre 0-5);
Vou me concentrar nos chutes provenientes de jogo aberto, ignorando cobranças de falta, pênaltis e gols contra. Atualmente, os dados estão disponíveis apenas para a temporada 2016/17; O conjunto de dados final contém pouco menos de 7.600 possibilidades de jogo aberto.
Para o modelo básico usei regressão logística para determinar a probabilidade de um gol marcado por um chute (qualidade do acaso) dada a distância e o ângulo da linha alvo (conforme mostrado na Figura 1). As equações e resultados da regressão são apresentados no Apêndice 1 no final deste post; Como seria de esperar, os coeficientes de posição e ângulo são altamente significativos para oportunidades com e sem cabeça.
Este é um modelo bastante normalizado para a qualidade das oportunidades, embora não nos diga nada sobre a influência da equipa defensora, apenas a probabilidade média de marcar numa determinada posição. O próximo passo é examinar como a qualidade da chance varia quando incorporamos as métricas defensivas do Stratagem.
Incorporando métricas de defesa
Conforme mencionado acima, o Stratagem oferece dois indicadores; ‘numDefPlayers‘: o número de jogadores de defesa (incluindo goleiros) na linha direta da posição de chute até o gol, e’defPressão‘: Pressão defensiva exercida sobre o arremessador, avaliada em uma escala entre 0-5. Stratagem descreve seu sistema de pontuação de pressão da seguinte maneira:
Expandi o modelo básico de qualidade de chance para incluir essas duas métricas defensivas. A regressão resultante concluiu que ambos os coeficientes de proteção eram altamente significativos e melhoraram significativamente a probabilidade logarítmica do modelo em relação ao modelo original (ver Apêndice 1). Outras métricas também indicam melhorias no ajuste do modelo, com aumento na probabilidade média de previsão correta e diminuição nas pontuações de Brier. Não tenho dúvidas de que a inclusão de métricas defensivas melhorou significativamente o modelo.
Mas o que significam as novas informações em termos práticos? Resumindo, cada três defensores adicionais que interferem reduzem pela metade as chances de gol. Em jogo aberto, um chute não contestado (sem cabeça) de doze jardas resultará em gol em 42% dos arremessos (2 em 5); Colocar três defensores entre o gol e o arremessador reduz esse número para 24%. Aumentar a pressão defensiva de zero para alta pressão (pontuação 4 no sistema do Stratagem) tem quase o mesmo efeito.
Figura 2 Exibe graficamente como a qualidade das chances depende dos indicadores defensivos. Ele mostra quatro cenários: canto superior esquerdoRemates executados sob ligeira pressão defensiva e com apenas um defensor interveniente (geralmente o guarda-redes); canto superior direitoBaixa pressão defensiva, mas quatro defensores interferem; canto inferior esquerdoPressão alta com dois defensores interferentes; E canto inferior direitoAlta pressão e quatro zagueiros interferentes. Em cada caso forneço um exemplo da temporada 2016/17; Todas as quatro fotos foram selecionadas aproximadamente na mesma posição. As zonas refletem a qualidade do acaso e têm a mesma cor da Figura 1: 5-10% (ciano), 10-20% (magenta), 20-30% verde, 30-40% amarelo e >=50% (vermelho).
Os quatro cenários demonstram claramente como a probabilidade de um golo depende da defesa. Quando um jogador tem uma visão clara e desobstruída do gol (canto superior esquerdo Na Figura 2) qualquer distância razoável aumenta significativamente as chances de pontuação. As zonas 1 e 2 (formas ciano e magenta) estendem-se muito além da área de grande penalidade, e a Zona 6 (a zona mais interna, indicando 50% de chance de gol) se estende além da pequena área. Os remates perto da marca de grande penalidade – como a oportunidade de Benik Afobe para o Bournemouth, aos 61 minutos, frente ao Southampton, em Abril – têm, em média, uma oportunidade em três de marcar.
no outro extremo (canto inferior direito), remates à baliza excessivamente pressionados e obstruídos, a qualidade das oportunidades é significativamente reduzida. Os chutes ao redor da marca de pênalti – como o chute de Nacer Chadli aos 70 minutos da partida do West Brom contra o Liverpool na temporada passada – têm 1 chance em 10 de marcar um gol: três vezes menos do que no caso desobstruído. A Zona 1 (a área mais externa) não se estende além da área de grande penalidade e a chance de marcar em qualquer lugar fora da pequena área é inferior a 25%. Este exemplo mostra claramente a dificuldade de jogar contra uma defesa lotada.
Resumo
Neste post demonstrei que as informações registradas pelo estratagema sobre a posição e ações da equipe defensora são importantes para avaliar a qualidade das chances. Eu construí um qualidade do acaso O modelo que inclui tanto o número de defensores intervenientes como a quantidade de pressão aplicada ao jogador atacante mostra que supera os modelos baseados apenas na posição e no tipo de remate. A disponibilidade destes dados é claramente um enorme benefício para a comunidade analítica.
Os resultados medem a dificuldade de marcar contra uma defesa lotada. As chances de acertar um chute de fora da área lotada são inferiores a 5%, desperdiçando essencialmente a posse de bola. Uma equipe bem organizada e ultradefensiva pode reduzir as chances de gol de fora da pequena área para menos de 20%, ou uma em cinco. Nessa situação, a capacidade de tirar os defensores da posição é obviamente muito importante.
Vale ressaltar que, ao longo da temporada 2016/17, as diferenças entre as posições defensivas foram calculadas e, portanto, a expectativa de gols marcados ou de gols sofridos para cada equipe da EPL não é significativamente diferente em relação ao modelo apenas de posição. A maior mudança está na expectativa de gols do Liverpool, que aumentou de 0,96 gols por jogo no modelo original para 1,03: é um total de 36 a 39 gols na temporada (na verdade, eles sofreram 42). Isto significa que a defesa do Liverpool deu aos seus adversários oportunidades ligeiramente melhores do que o modelo apenas de posição de remate.
—————————————————–
(1) É importante notar que a maioria das medidas são independentes da identidade do jogador que executa o arremesso. Você precisa de um conjunto de dados contendo milhares de arremessos para medir adequadamente a qualidade das chances em todas as situações e circunstâncias, portanto, é necessário coletar arremessos de muitos jogadores diferentes. A qualidade da probabilidade do chute é mais correta do que a probabilidade do gol para o ‘jogador médio’ no seu conjunto de dados.
(2) A Stratagem Aid também recolhe dados sobre a qualidade do remate e fornece uma avaliação mais subjectiva da qualidade do acaso.
Apêndice 1: Resultados da Regressão do Modelo
O modelo logístico para qualidade do acaso é definido como:
Qualidade de probabilidade = 1/(1+exp(-y) )
onde, no modelo original,
y = β0+B1*distância+ β2*ângulo
E no modelo estendido,
y = β0+B1*distância+ β2*Ângulo+B3*Pressão+B4*nDef.







