Trabajo elaborado para la asignatura “Programación y manejo de datos en la era del Big Data” de la Universitat de València durante el curso 2020-2021. El repo del trabajo está aquí. La página web de la asignatura y los trabajos de mis compañeros pueden verse aquí.
1. Introducción
El fútbol femenino es el deporte de equipo más practicado por mujeres en todo el mundo. Este deporte empezó a ser practicado en una sección femenina hace mucho tiempo, a finales del siglo XIX, en Londres pero fue a causa de las distintas guerras y los problemas económicos y sociales de los años siguientes que este deporte dejó de ser practicado.
Actualmente, hace años que el fútbol femenino dejó de ser un mundo de hombres y las mujeres dieron el paso para practicar este deporte, a pesar de que tienen que seguir aguantando comentarios despectivos y frases como “el fútbol es un deporte de hombres”.
Según los datos oficiales de la FIFA, más o menos 26 millones de mujeres juegan al fútbol en 180 países del mundo. Europa es el continente que ha experimentado un mayor crecimiento en los últimos años donde el número de mujeres que practican este deporte se ha multiplicado por cinco.
En nuestro país, España, también ha habido un gran progreso y la selección nacional femenina ha estado presente en los últimos años en Mundiales y Eurocopas.
Poco a poco se está normalizando esta modalidad del fútbol pero todavía faltan muchos aspectos para mejorar como el sueldo de las profesionales, ni comparable con las cifras que se mueven en el fútbol masculino.
Debido a la necesidad de dar mayor visibilidad al fútbol femenino y ya que yo también practico este deporte he decidido tratar este tema en el trabajo de la asignatura “Programación y manejo de datos en la era del Big Data”.
La finalidad y objetivo de este análisis es observar el desarrollo a lo largo del tiempo del fútbol femenino en los diferentes países del mundo.
3. Análisis de selecciones
3.1. Evolución del fútbol femenino a lo largo del tiempo
# A partir de la tabla que ya habia arreglado anteriormente, agrupo los años para saber cuantos partidos se jugaron cada año.
evol <- date %>% group_by(Año)%>% count()
# Hago el gráfico que en este caso es un 'barplot'
ggplot(evol, aes(x=Año, y=n, col='red')) +
geom_bar(stat = "identity") + theme(legend.position="none") +
theme(axis.ticks = element_line(linetype = "blank"),
axis.text = element_text(size = 7), axis.text.y = element_text(size = 15),
panel.background = element_rect(fill = "grey100",
size = 0.6)) +labs(title = "Evolución partidos por año",
x = "Años", y = "Nº Partidos") + theme(axis.text.x = element_text(angle = 90))
Podemos ver que ha habido un notable crecimiento de los partidos de fútbol femenino a lo largo del tiempo.
En el año 1969 tan solo se disputaron 4 partidos y en los últimos años ha habido un máximo de 349 partidos oficiales en el mismo año (2018).
Se puede observar una clara tendencia a que hay tres años seguidos con un número alto de partidos seguido de uno que baja el número notablemente, hasta llegar al año 2014 que se han ido igualando. Esto se debe a que cada año se disputa un torneo diferente según el continente, menos el Mundial y los Juegos Olímpicos que ambos son a nivel mundial.
Los años que tenían un mayor número de partidos coinciden con los partidos para la clasificación a la Eurocopa, el Mundial y la clasificación para este, que como veremos más adelante son los torneos oficiales con más partidos disputados.
month <- date %>% group_by(Mes)%>% count()
gr_month <- ggplot (month, aes(x=Mes, y = n), aes(fct_rev(Mes))) + geom_bar(stat="identity", fill = "aquamarine") + coord_flip() + labs(x = "Mes", y = "Número de partidos")+labs(title = "Evolución partidos por mes")
ggplotly(gr_month)
Con respecto a este gráfico, podemos ver los meses en los que más partidos se disputan. En este caso el mes con más partidos y esto se debe a que muchos partidos de la clasificación a la Eurocopa, el Mundial y la Copa de América se juegan en este mes ya que estos torneos se juegan durante los meses de junio y julio. Además, el torneo amistoso de la Copa de Algarve es el segundo torneo que más partidos tiene disputados y este se juega todos los años en marzo desde el año 1994.
3.2. Torneos
tourn <- futfem %>% group_by(tournament)%>% count()
x <- c(86, 115, 268, 173, 226, 16, 545, 42, 126, 145, 6, 157, 20, 284, 172, 106, 78, 32, 6, 130, 30, 6, 153, 1241)
lbl <- c("AFC Asian Cup", "AFC Asian Cup qualification", "AFC Championship", "African Championship", "
African Championship qualification", "African Cup of Nations", "Algarve Cup", "CONCACAF Championship", "
CONCACAF Gold Cup", "CONCACAF Gold Cup qualification", "CONCACAF Invitational Tournament", "Copa América", "Euro", "FIFA World Cup", "FIFA World Cup qualification", "Four Nations Tournament", "OFC Championship", "OFC Nations Cup", "OFC Nations Cup qualification", "Olympic Games", "SheBelieves Cup", "Tournoi de France", "UEFA Euro", "
UEFA Euro qualification")
pie3D(x, labels = lbl, explode = 0.1, main = "Torneos", labelcex = 0.5)
Como ya había mencionado en el apartado anterior y que ahora podemos ver en el gráfico los torneos donde se juegan una mayor cantidad de partidos son las fases de clasificación a la Eurocopa femenina, la Copa de Algarve y el Mundial. Entre estos tres, la Eurocopa y el Mundial son torneos oficiales mientras que la copa de Algarve es un torneo amistoso.
El último campeón de la copa del mundo fue EEUU en 2019, esta misma selección es la que más veces ha ganado este campeonato, un total de 4 veces.
Con respecto a la Eurocopa, el último ganador fue Países Bajos en 2017, sin embargo, la selección que más veces ha ganado este torneo es la selección femenina alemana, un total de 8 títulos.
3.3. Selecciones que más partidos han jugado en casa y más partidos fuera
Partidos jugados en casa
selec_home <- futfem %>% group_by(home_team)%>% count()
selec_home <- selec_home %>% arrange(desc(n))
reactable(selec_home, defaultPageSize = 10, paginationType = "jump", showPageSizeOptions = TRUE , pageSizeOptions = c ( 10 , 50 , 100 ),defaultColDef = colDef(
align = "center",
minWidth = 70,
headerStyle = list(background = "cyan"),
filterable = TRUE), highlight = TRUE, outlined = TRUE,
columns = list(
`Movies&TVShow/año` = colDef(style = function(value) {
if (value > 0) {
color <- "#e00000"}
else {
color <- "#008000"
}
list(color = color, fontWeight = "bold")
})))
Partidos jugados fuera
selec_away <- futfem %>% group_by(away_team)%>% count()
selec_away <- selec_away %>% arrange(desc(n))
reactable(selec_away, defaultPageSize = 10, paginationType = "jump", showPageSizeOptions = TRUE , pageSizeOptions = c ( 10 , 50 , 100 ),defaultColDef = colDef(
align = "center",
minWidth = 70,
headerStyle = list(background = "cyan"),
filterable = TRUE), highlight = TRUE, outlined = TRUE,
columns = list(
`Movies&TVShow/año` = colDef(style = function(value) {
if (value > 0) {
color <- "#e00000"}
else {
color <- "#008000"
}
list(color = color, fontWeight = "bold")
})))
3.4. Pais donde más partidos se han jugado
country <- futfem %>% group_by(country)%>% count() %>% rename(pais = country)
country <- country %>% arrange(desc(n)) %>% rename(partidos = n)
country %>% DT::datatable(extensions = 'Buttons',
options = list(dom = 'Blfrtip',
buttons = c('copy', 'csv', 'excel', 'pdf', 'print'),
pageLength = 5, autoWidth = TRUE ))
El país donde más veces se ha jugado un partido es Portugal, un total de 580 partidos ya que ahí se disputa el torneo de Algarve Cup que es uno de los torneos con más partidos jugados ya que se juega todos los años. A este, le siguen China y Estados Unidos que son dos de los países más importantes respecto al fútbol femenino porque suelen estar presentes en todos los torneos y sobre todo EEUU, la selección femenino siempre ha tenido un mayor apoyo por la población en comparación con otros países.
# Voy a crear un gráfico para poder visualizar mejor los paises. Cogiendo un código de un mapa de una página de internet y he cambiado los paises y las coordenadas de estos.
mapa <- map_data("world") %>% mutate(color = case_when(region == "Portugal" ~ 1,
region == "China" ~ 2,
region == "USA" ~ 3,
region == "Sweden" ~ 4,
region == "Germany" ~ 5,
region == "France" ~ 6,
region == "Canada" ~ 7,
region == "Italy" ~ 8,
region == "Netherlands" ~ 9)) %>% mutate(color = if_else(is.na(color),0,color))
paises <- c("Portugal","China","USA","Sweden","Germany","France","Canada","Italy","Netherlands")
lat <- c(37.17944,19.99194,19.01201,56.29053,53.87075,42.80542,43.93960,36.75703,51.38647)
long <- c(-7.406153,110.8888,-155.58134,16.52852,14.213672,9.480371,59.78760,12.051270,4.226171)
latlong <- data.frame(paises,lat,long)
mapa1 <- ggplot() + geom_map(data = mapa, map = mapa, aes(long, lat, map_id = region), color = "#000000", fill = "#f7eca1") +
geom_map(data = mapa %>% filter(color==1), map = mapa, aes(long, lat, map_id = region), color = "#000000", fill = "red") +
geom_map(data = mapa %>% filter(color==2), map = mapa, aes(long, lat, map_id = region), color = "#000000", fill = "green") +
geom_map(data = mapa %>% filter(color==3), map = mapa, aes(long, lat, map_id = region), color = "#000000", fill = "cyan") +
geom_map(data = mapa %>% filter(color==4), map = mapa, aes(long, lat, map_id = region), color = "#000000", fill = "#ab6800") +
geom_map(data = mapa %>% filter(color==5), map = mapa, aes(long, lat, map_id = region), color = "#000000", fill = "yellow") +
geom_map(data = mapa %>% filter(color==6), map = mapa, aes(long, lat, map_id = region), color = "#000000", fill = "#004dff") +
geom_map(data = mapa %>% filter(color==7), map = mapa, aes(long, lat, map_id = region), color = "#000000", fill = "#ff9300") +
geom_map(data = mapa %>% filter(color==8), map = mapa, aes(long, lat, map_id = region), color = "#000000", fill = "#a4034b") +
geom_map(data = mapa %>% filter(color==9), map = mapa, aes(long, lat, map_id = region), color = "#000000", fill = "#238a00") +
geom_point(data = latlong, aes(x = long,y = lat), size = 2) +
ylim(-55,NA) +
theme(panel.background = element_rect(fill = "#a6fffb") , panel.grid = element_line(colour = "#000000"), axis.title = element_blank(),
axis.text = element_blank(), axis.ticks = element_blank())
mapa1 + theme(panel.background = element_rect(fill = "gray100")) +labs(title = "Países donde más partidos se han jugado")
3.5. Mundial vs Eurocopa
comp <- date %>% group_by(Año) %>% count(tournament) %>% filter(tournament %in% c("FIFA World Cup", "UEFA Euro qualification"))
ggplot(comp, aes(fill=tournament, y=n, x=Año)) +
geom_bar(position="dodge", stat="identity") + theme(axis.line = element_line(colour = "gray",
linetype = "solid"), axis.text.x = element_text(angle = 90),
panel.background = element_rect(fill = "gray100")) +labs(title = "Mundial vs Eurocopa")
La Copa Mundial Femenina de la FIFA es el torneo internacional de fútbol femenino a nivel de selecciones nacionales más importante del mundo. Además, existen otras competencias juveniles como la Copa Mundial Femenina de Fútbol Sub-20 y la Copa Mundial Femenina de Fútbol Sub-17, ambas organizadas por la FIFA. La primera edición de este torneo fue en 1991 y a partir de ahí se decidió que se jugaría cada 4 años aunque ha habido años en los que se ha disputado aunque no tocaba. En un principio, este torneo contaba con 16 selecciones y ha ido evolucionando y haciéndose grande hasta que en 2015 subió a 24 y se espera que en el mundial de 2023 se dispute con 32 selecciones.
El Campeonato de Europa Femenino de la UEFA, comúnmente conocido como Eurocopa Femenina, es la competición internacional futbolística más importante entre selecciones nacionales femeninas de la UEFA. Este torneo comenzó a disputarse en 1969 sin embargo estos años no fue considerado oficial y la primera edición del torneo respaldado por la UEFA fue en 1982.
3.6. Tipo de campo
neutral <- date %>% group_by(neutral) %>% count()
datos <- c(2324, 1839)
pie3D(datos, labels = datos, col = 2:3, labelcol = "red", border = "white", main = "Tipo de campo")
legend(x = "topright", legend = c("False", "True"), fill = c("pink", "green"),
title = "Legend")
Con estos datos obtenemos que de 4163 partidos oficiales que se han disputado desde el año 1969, 2324 han sido disputados en campo propio de alguno de los dos paises.
