Skip to the content.

< Inicio

Mejor jugador del partido

A partir de los datos del mundial 2018 se busca armar un arbol de decisión del equipo que tuvo al mejor jugador del partido. Archivo

Para esto inicialmente cargamos el archivo, seteamos el campo Man of the Match como campo label ya que es el relevante para este problema, y para evitar errores en la creación del arbol indicamos que Team y Oponent son del tipo ID, para que no interfieran en el futuro árbol.

image

image

image

Agregamos un bloque Cross Validation, el cual separará el set de datos en un subgrupo para training y otro para pruebas.

image

Dentro del bloque Cross Validation y en la sección de Training vamos a agregar el bloque de Decision Tree.

image

En la sección de Test agregamos un bloque Apply Model donde utilizaremos el modelo del Árbol de Decision creado con el set de test, y un bloque de Performance (Classification) para medir que tan bueno fue nuestro Árbol respecto a los datos reales.

image

Resultados

Matriz de Confusión

image

Árbol de decisión

image

Conclusiones

Se creó un Árbol de decisión para el jugador del partido, dicho modelo tiene un accuracy de 73%. Tal como vemos en la matriz de confución los equipos identificados por nuestro modelo como el equipo que tiene al Jugador del Partido y que realmente lo tienen, cumple con un acierto de 85.94%. Sin embargo el cuando el modelo indica que un equipo no tiene al jugador del partido solo se acertó un 60.94%. El set de datos se encuentra nivelado, por lo tanto la diferencia de porcentajes no está relacionado a la calidad de los datos. Esto quiere decir que a pesar de que el accuracy de nuestro modelo no es bajo existe un margen de mejora principalmente para mejorar la cantidad de Falsos Positivos.

Referencia

https://www.kaggle.com/mathan/fifa-2018-match-statistics