Alice.AI

Análise Descritiva

O peso da camisa também vira dado

Esta é uma análise descritiva: ela não prevê o placar, mas ajuda a enxergar padrões físicos que aparecem no histórico. A ideia é simples: colocar jogadores e setores no mesmo eixo de peso para entender onde as distribuições se concentram.

Zaga Portugal 75,4 kg
Meio Uzbequistão 71,0 kg
Diferença média +4,4 kg
Histórico zaga x meio não perdeu 74,7%

Como ler o eixo

A leitura começa no peso em kg

O eixo horizontal é o peso dos jogadores. Quanto mais à direita uma curva aparece, mais pesado é o setor naquele recorte. A altura da curva mostra concentração de jogadores, não vantagem em campo.

Esquerda faixas de peso menores
Direita faixas de peso maiores
Altura mais jogadores concentrados ali

Como nasce uma curva KDE

De pontos individuais para uma distribuição

Primeiro cada jogador vira um ponto. Depois, vários pontos no mesmo eixo formam uma distribuição suavizada. Isso permite comparar elencos e setores sem reduzir tudo a um único número.

Um jogador marcado no eixo de peso em kg.
1. Um jogador no eixo de peso.
Dois jogadores marcados no mesmo eixo de peso em kg.
2. Dois jogadores já permitem comparação visual.
Muitos jogadores formando uma curva KDE no eixo de peso.
3. Muitos jogadores viram uma curva de distribuição.

Aplicação

Portugal x Uzbequistão no mesmo eixo

A zaga de Portugal aparece mais à direita que o meio do Uzbequistão: 75,4 kg contra 71,0 kg no peso médio. Isoladamente, isso não decide jogo. Mas mostra como dados físicos podem revelar padrões curiosos que podem fazer diferença antes da bola rolar.

Curva KDE do meio-campo do Uzbequistão.
4. Primeiro, o meio do Uzbequistão.
Curva KDE da zaga de Portugal.
5. Depois, a zaga de Portugal.
Curvas KDE sobrepostas da zaga de Portugal e do meio-campo do Uzbequistão.
6. Por fim, juntamos as curvas.

Análise descritiva. Não representa previsão de placar.

Quer saber como pastel de nata pode ajudar Portugal na Copa? Descubra com Alice.AI.

Histórico total

Zaga x meio foi o recorte mais desbalanceado

Antes de olhar apenas Portugal e Uzbequistão, vale ver o histórico total. No recorte utilizado, as médias das zagas tendem a ficar mais à direita que as médias dos meios, indicando setores defensivos mais pesados em várias seleções.

No recorte do histórico utilizado, peso / zaga x meio foi a combinação setorial com maior desbalanceamento. Nessa combinação, o lado mais pesado não perdeu em 74,7% dos jogos considerados.

Histórico total de peso médio por setor, comparando distribuições de zagas e meios.
Histórico total: médias das zagas e dos meios no eixo de peso médio.

Copa de 2022

Isso já apareceu em Copa do Mundo

Na Copa de 2022, a França apareceu como lado mais pesado em jogos decisivos contra Marrocos, Inglaterra e Polônia. Isso não prova causalidade, mas ajuda a mostrar que o padrão físico observado no histórico também encontra exemplos concretos em jogos de Copa.

Em 2022, zaga x meio teve diferença clara em 18 de 64 jogos. Nesses casos, o lado mais pesado não perdeu em 72,2%.

Distribuição de peso do elenco em França 2 x 0 Marrocos na semifinal da Copa de 2022.
Semifinal: França 2 x 0 Marrocos, +7,8 kg.
Distribuição de peso do elenco em Inglaterra 1 x 2 França nas quartas da Copa de 2022.
Quartas: Inglaterra 1 x 2 França, +5,7 kg.
Distribuição de peso do elenco em França 3 x 1 Polônia nas oitavas da Copa de 2022.
Oitavas: França 3 x 1 Polônia, +5,2 kg.

Fontes e reprodutibilidade

De onde vieram os dados

Fontes: dados físicos de jogadores do dataset público EA Sports FC/FIFA 15-24 no Kaggle; dados consolidados dos convocados da Copa de 2022; base histórica de resultados de seleções usada no projeto. A análise foi construída em Python e os gráficos usam KDE para visualizar distribuições de peso.

Fontes raw, datasets derivados e artefatos locais

Fontes de dados brutos

  1. Jogadores FC/FIFA 15-24 Fonte: Kaggle - EA Sports FC/FIFA 15-24 Complete Player Dataset. Arquivo principal: male_players.csv. Campos usados: peso, altura, idade, país, seleção, posição e versão do jogo.
  2. Convocados Copa 2022 Fonte: base consolidada de jogadores da Copa de 2022 usada no projeto. Campos usados: seleção, peso, altura, idade, posição e convocação.
  3. Resultados históricos de seleções Fonte: Kaggle - International football results. Arquivo principal: results.csv. Campos usados: data, seleções, placar, mandante/visitante, país-sede, campo neutro e competição.

Datasets derivados

  • Métricas físicas por seleção e setor.
  • Rankings históricos de peso, altura e idade por confronto.
  • Curvas KDE e tabelas de reprodutibilidade.