Análise Descritiva
O peso da camisa também vira dado
Esta é uma análise descritiva: ela não prevê o placar, mas ajuda a enxergar padrões físicos que aparecem no histórico. A ideia é simples: colocar jogadores e setores no mesmo eixo de peso para entender onde as distribuições se concentram.
Como ler o eixo
A leitura começa no peso em kg
O eixo horizontal é o peso dos jogadores. Quanto mais à direita uma curva aparece, mais pesado é o setor naquele recorte. A altura da curva mostra concentração de jogadores, não vantagem em campo.
Como nasce uma curva KDE
De pontos individuais para uma distribuição
Primeiro cada jogador vira um ponto. Depois, vários pontos no mesmo eixo formam uma distribuição suavizada. Isso permite comparar elencos e setores sem reduzir tudo a um único número.
Aplicação
Portugal x Uzbequistão no mesmo eixo
A zaga de Portugal aparece mais à direita que o meio do Uzbequistão: 75,4 kg contra 71,0 kg no peso médio. Isoladamente, isso não decide jogo. Mas mostra como dados físicos podem revelar padrões curiosos que podem fazer diferença antes da bola rolar.
Análise descritiva. Não representa previsão de placar.
Quer saber como pastel de nata pode ajudar Portugal na Copa? Descubra com Alice.AI.Histórico total
Zaga x meio foi o recorte mais desbalanceado
Antes de olhar apenas Portugal e Uzbequistão, vale ver o histórico total. No recorte utilizado, as médias das zagas tendem a ficar mais à direita que as médias dos meios, indicando setores defensivos mais pesados em várias seleções.
No recorte do histórico utilizado, peso / zaga x meio foi a combinação setorial com maior desbalanceamento. Nessa combinação, o lado mais pesado não perdeu em 74,7% dos jogos considerados.
Copa de 2022
Isso já apareceu em Copa do Mundo
Na Copa de 2022, a França apareceu como lado mais pesado em jogos decisivos contra Marrocos, Inglaterra e Polônia. Isso não prova causalidade, mas ajuda a mostrar que o padrão físico observado no histórico também encontra exemplos concretos em jogos de Copa.
Em 2022, zaga x meio teve diferença clara em 18 de 64 jogos. Nesses casos, o lado mais pesado não perdeu em 72,2%.
Fontes e reprodutibilidade
De onde vieram os dados
Fontes: dados físicos de jogadores do dataset público EA Sports FC/FIFA 15-24 no Kaggle; dados consolidados dos convocados da Copa de 2022; base histórica de resultados de seleções usada no projeto. A análise foi construída em Python e os gráficos usam KDE para visualizar distribuições de peso.
Fontes raw, datasets derivados e artefatos locais
Fontes de dados brutos
-
Jogadores FC/FIFA 15-24
Fonte:
Kaggle - EA Sports FC/FIFA 15-24 Complete Player Dataset.
Arquivo principal:
male_players.csv. Campos usados: peso, altura, idade, país, seleção, posição e versão do jogo. - Convocados Copa 2022 Fonte: base consolidada de jogadores da Copa de 2022 usada no projeto. Campos usados: seleção, peso, altura, idade, posição e convocação.
-
Resultados históricos de seleções
Fonte:
Kaggle - International football results.
Arquivo principal:
results.csv. Campos usados: data, seleções, placar, mandante/visitante, país-sede, campo neutro e competição.
Datasets derivados
- Métricas físicas por seleção e setor.
- Rankings históricos de peso, altura e idade por confronto.
- Curvas KDE e tabelas de reprodutibilidade.