Es un posicionamiento en un plano de puntos según la correlación de 2 variables, donde en el eje X
contamos con un valor o variable y en el eje Y
contamos con otra variable, hacemos una intersección y ahí es donde vamos a poner uno de nuestros puntos en un plano.
- Nos ayuda a entender cómo están relacionados cada una de las 2 variables
- Debido a su posición podemos entender si son correlaciones de manera directa, indirecta o sin relación.
¿Qué hacer?
- Los colores son muy importantes.
- Entender lo que quiere decir la dispersión de nuestros eventos en el plano (Correlación positiva, negativa y sin correlación).
- La Correlación positiva se refiere a una dispersión de los puntos que va de abajo hacia arriba en la escala.
- Correlación negativa, va de arriba hacia abajo, es decir en sentido contrario a la correlación positiva.
- No hay correlación ni positiva ni negativa, significa que los datos están dispersos.
¿Qué NO hacer?
- Tener cuidado al momento de hacer anotaciones ya que un scatter plot generalmente se utiliza para mostrar muchos puntos de manera muy próxima.
- Entonces si tu utilizas anotaciones, es común que se empiecen a poner una encima de otra y puede evitar la visualización de los puntos.
Ejemplo de scatter plot mal hecho.
Recursos: What is a scatter plot?