Lazy loaded image
Python y Librerías para Ciencias de Datos
🟣Histogram
Palabras 487Tiempo de lectura 2 min
Jan 9, 2025
Jan 20, 2025
type
status
slug
summary
tags
category
icon
password
El histograma es un tipo de visualización que es demasiado útil para explorar nuestros datos, nos ayuda a tener una idea sobre cómo se distribuyen nuestras variables. Podemos imaginar 12 valores entre 0 y 6 y ponerlos en una línea numérica:
notion image
Para construir un histograma, podemos dividir la línea en bins (contenedores), lo ideal es separarlo de a 2 valores:
notion image
Debemos contar cuántos data points hay en cada bin:
notion image
Y esto lo convertimos en barras que también nos ayudan a ver el número de data points que hay en cada bin, su tamaño es correspondiente:
notion image
Hacer histogramas manualmente para pequeños datos es útil, pero cuando trabajamos con grandes cantidades, es más difícil, lento e ineficiente. Para construir histogramas con matplotlib, empezamos importando matplotlib y el subpackage pyplot:
notion image
Siempre que queramos saber qué argumentos podemos especificar, usar y modificar con los plots, podemos usar la función help():
notion image
Debemos tener la lista con los valores que vamos a graficar y luego, simplemente llamamos a plt.hist() y le pasamos la lista como un input:
notion image
notion image
Los histogramas cuentan con varias personalizaciones, las más comunes son:
  • plt.title(): Añade un título al gráfico para describir los datos mostrados.
  • plt.xlabel() y plt.ylabel(): Etiquetan los ejes X e Y respectivamente, explicando qué representan los datos.
  • plt.grid(): Muestra cuadriculas en el eje que le pasemos.

★ღ Distribución Edades de Perritos ★ღ

Tenemos una lista con distintas edades de unos perritos:
notion image
Y creamos el histograma:
notion image
Los histogramas pueden tener distintas personalizaciones, tal y como podemos observar al usar la función help(). Para este histograma usaremos:
  • Bins: Divide los datos en 6 intervalos.
  • Color: Es el color de relleno de las barras del histograma.
  • Edgecolor: Es el color del borde.
  • Grid: Muestra una cuadrícula en el eje que le indicamos, en este caso usará el eje Y.
  • Linestyle: Son las líneas de la cuadricula y les da un estilo de guion discontinuo.
  • Alpha: Ajusta la transparencia de las líneas de la cuadricula. Donde 0 es completamente transparente y 1 es completamente opaco.
notion image

★ღ Tamaño de Camadas de Gatitos ★ღ

Tenemos una lista que representa el número de gatitos por camada:
notion image
Y creamos el histograma:
notion image
Este histograma cuenta con las personalizaciones:
  • Bins: Divide los datos en 5 intervalos.
  • Color: Usa el color morado para rellenar las barras.
  • Alpha: Ajusta la opacidad de las barras en 0.8.
  • Edgecolor: Usa bordes blancos para las barras.
notion image

★ღ Duración de Vuelo de Mariposas ★ღ

Tenemos una lista que nos muestra los minutos que distintas mariposas pasan volando durante un día:
notion image
Y creamos el histograma:
notion image
Este histograma cuenta con las personalizaciones:
  • Bins: Divide los datos en 8 intervalos.
  • Color: Usa el color naranja para rellenar las barras.
  • Edgecolor: Usa bordes cafés para las barras.
  • Linestyle: Cambia el estilo del borde de las barras a una línea discontinua.
  • Linewidth: Hace que las líneas del borde sean más gruesas.
notion image
 
上一篇
Introducción a la Personalización de Plots
下一篇
Introducción al Aprendizaje Supervisado