martes, 5 de julio de 2016

Exploración de datos


Exploración de datos

En esta sección se presentan los datos visualmente para poder encontrar relaciones, tendencías, dependecias entre lo datos.

Campañas de un caballo a lo largo de su vida

En los gráficos a continuación se muestra las posiciones de un sólo caballo a lo largo de su vida en las pistas:

Figura 1
En la figura 1 se muestra a un caballo con respecto a las posiciones obtenidas en cada carrera, se esperaba que existiera algún tipo de "regularidad" o tendencia en los datos, como por ejemplo que con el tiempo y entrenamiento aumentara su éxito, o que su vejez lo fuera desgastando, pero lo que podemos ver son resultados irregulares (no tanto, pero veamos más ejemplos), también hay que notar que en este caso el caballo tuvo una muy corta vida útil en las carreras de caballos, por ende analizaremos más casos.


Figura 2

Figura 3

Figura 4

Como podemos ver en las figuras 2, 3 y 4, la vida de un caballo es bastante irregular, no se logra percibir patrones o una “consistencia” en las participaciones.

Relación Caballo-Jinete

En esta sección se graficará la campaña de caballos por fecha, pero el color representará a los jinetes, para poder verificar si el éxito en una carrera depende de la tupla Jinete+Caballo.

Figura 5
Como podemos ver en la figura 5, que por ejemplo el jinete verde gana-pierde-gana-pierde en en 4 carreras seguidas, y pierde por un margen considerable, es así que notamos que la tupla Jinete+Caballo no es un indicador de éxito.

Figura 6
Y en la figura 6 podemos ver que no exite una regularidad entre caballos y jinetes ya que estos cambian muy a menudo.

Relación Peso-Posición

En esta sección veremos la relación entre el Peso de un caballo + el peso de su jinete, tienen relación con la posición en la que llegan.

Figura 7
En la figura 7 parece haber una relación directa entre el pes y las posiciones, pero revisando a otros caballos nos damos cuenta de que hay errores.

Figura 8

Figura 9

Figura 10
En la figura 10 podemos ver que un caballo entre un día y otro gana y pierde al rededor de 100 kilos, lo cual no es posible, por ellos se cree existen datos erróneos en el atributo peso de caballo y peso de jinete, lo que hace que sea un mal atributo para poder encontrar relaciones ya que existen datos ruidosos.

Figura 11

En la figura 11 podemos notar que el peso del jinete sumado al peso del caballo en promedio no nos dice mucho sobre la posición en la cual va llegar, es así como los pesos se distribuyen de igual manera entre los diferentes posición de llegada.

Relación Posición-Partidor

En esta sección veremos la relación entre el partidor (número de celda donde le toca partir a un caballo) y la posición.

Figura 12

Figura 13

Figura 14
Como podemos ver en las figuras 12, 13 y 14, pareciera aber una relación directa entre Partidor y Posición, pero para ver el problema hay que analizarlo globalmente:

Figura 15
En la figura 15 se muestra que existe una relación entre posición y partidor, por lo cual, si un caballo parte en el partidor 1 tiene más probabilidades para ganar.

Regularidad Jinete

En esta sección veremos los resultados de jinetes durante su carrera.

Figura 16

Figura 17

Tanto en la figura 16 como 17 podemos ver que la vida de un jinete no es regular en cuanto a éxitos, no podemos encontrar patrones ni tendencias.