type
status
slug
summary
tags
category
icon
password
El histograma es un tipo de visualización que es demasiado útil para explorar nuestros datos, nos ayuda a tener una idea sobre cómo se distribuyen nuestras variables. Podemos imaginar 12 valores entre 0 y 6 y ponerlos en una línea numérica:
.png?table=block&id=e88bbbbc-bd1c-4ee8-8e0b-212926e07a33&t=e88bbbbc-bd1c-4ee8-8e0b-212926e07a33&width=707.9567260742188&cache=v2)
Para construir un histograma, podemos dividir la línea en bins (contenedores), lo ideal es separarlo de a 2 valores:
.png?table=block&id=6dc18e69-07ff-47ff-a241-f4acab28c542&t=6dc18e69-07ff-47ff-a241-f4acab28c542&width=707.90869140625&cache=v2)
Debemos contar cuántos data points hay en cada bin:
.png?table=block&id=834ab3d3-47dc-4d9b-8047-19510b9f64b2&t=834ab3d3-47dc-4d9b-8047-19510b9f64b2&width=707.9447021484375&cache=v2)
Y esto lo convertimos en barras que también nos ayudan a ver el número de data points que hay en cada bin, su tamaño es correspondiente:
.png?table=block&id=60de7489-59e8-4a59-8e07-9981a0338b83&t=60de7489-59e8-4a59-8e07-9981a0338b83&width=708.0048217773438&cache=v2)
Hacer histogramas manualmente para pequeños datos es útil, pero cuando trabajamos con grandes cantidades, es más difícil, lento e ineficiente. Para construir histogramas con matplotlib, empezamos importando matplotlib y el subpackage pyplot:
.png?table=block&id=033df87c-d41a-4f47-b3eb-fddbf6df4c85&t=033df87c-d41a-4f47-b3eb-fddbf6df4c85&width=470.96875&cache=v2)
Siempre que queramos saber qué argumentos podemos especificar, usar y modificar con los plots, podemos usar la función help():
.png?table=block&id=1192a687-c77b-460b-b1c0-dca71d5564bd&t=1192a687-c77b-460b-b1c0-dca71d5564bd&width=707.9807739257812&cache=v2)
Debemos tener la lista con los valores que vamos a graficar y luego, simplemente llamamos a plt.hist() y le pasamos la lista como un input:
.png?table=block&id=c9ee6c2c-1e35-477a-815b-b3c199d43d8d&t=c9ee6c2c-1e35-477a-815b-b3c199d43d8d&width=470.953125&cache=v2)
.png?table=block&id=edceb635-8da2-4098-8bb3-74aba60a5dc5&t=edceb635-8da2-4098-8bb3-74aba60a5dc5&width=470.984375&cache=v2)
Los histogramas cuentan con varias personalizaciones, las más comunes son:
- plt.title(): Añade un título al gráfico para describir los datos mostrados.
- plt.xlabel() y plt.ylabel(): Etiquetan los ejes X e Y respectivamente, explicando qué representan los datos.
- plt.grid(): Muestra cuadriculas en el eje que le pasemos.
ღ★ღ Distribución Edades de Perritos ღ★ღ
Tenemos una lista con distintas edades de unos perritos:
.png?table=block&id=9b606c42-4188-4c6c-bc9c-4ea87431ccfd&t=9b606c42-4188-4c6c-bc9c-4ea87431ccfd&width=470.953125&cache=v2)
Y creamos el histograma:
.png?table=block&id=53706b4d-b902-43da-90ae-a9ecd3138026&t=53706b4d-b902-43da-90ae-a9ecd3138026&width=470.984375&cache=v2)
Los histogramas pueden tener distintas personalizaciones, tal y como podemos observar al usar la función help(). Para este histograma usaremos:
- Bins: Divide los datos en 6 intervalos.
- Color: Es el color de relleno de las barras del histograma.
- Edgecolor: Es el color del borde.
- Grid: Muestra una cuadrícula en el eje que le indicamos, en este caso usará el eje Y.
- Linestyle: Son las líneas de la cuadricula y les da un estilo de guion discontinuo.
- Alpha: Ajusta la transparencia de las líneas de la cuadricula. Donde 0 es completamente transparente y 1 es completamente opaco.
.png?table=block&id=964762f1-cb64-4994-a96c-1fab8d5571f0&t=964762f1-cb64-4994-a96c-1fab8d5571f0&width=470.984375&cache=v2)
ღ★ღ Tamaño de Camadas de Gatitos ღ★ღ
Tenemos una lista que representa el número de gatitos por camada:
.png?table=block&id=f30eb147-8f4b-47e4-8407-aec7e9f6569e&t=f30eb147-8f4b-47e4-8407-aec7e9f6569e&width=470.953125&cache=v2)
Y creamos el histograma:
.png?table=block&id=8671af36-1d6f-4648-b37c-3ad5c8d4427d&t=8671af36-1d6f-4648-b37c-3ad5c8d4427d&width=707.9927978515625&cache=v2)
Este histograma cuenta con las personalizaciones:
- Bins: Divide los datos en 5 intervalos.
- Color: Usa el color morado para rellenar las barras.
- Alpha: Ajusta la opacidad de las barras en 0.8.
- Edgecolor: Usa bordes blancos para las barras.
.png?table=block&id=027fbd95-4125-4d58-b529-ea10edd27ed3&t=027fbd95-4125-4d58-b529-ea10edd27ed3&width=707.9927978515625&cache=v2)
ღ★ღ Duración de Vuelo de Mariposas ღ★ღ
Tenemos una lista que nos muestra los minutos que distintas mariposas pasan volando durante un día:
.png?table=block&id=651df13d-2488-475c-b4d0-b5bda5a6f13e&t=651df13d-2488-475c-b4d0-b5bda5a6f13e&width=707.9927978515625&cache=v2)
Y creamos el histograma:
.png?table=block&id=b403d669-f065-4e5d-8695-dfc462950377&t=b403d669-f065-4e5d-8695-dfc462950377&width=707.96875&cache=v2)
Este histograma cuenta con las personalizaciones:
- Bins: Divide los datos en 8 intervalos.
- Color: Usa el color naranja para rellenar las barras.
- Edgecolor: Usa bordes cafés para las barras.
- Linestyle: Cambia el estilo del borde de las barras a una línea discontinua.
- Linewidth: Hace que las líneas del borde sean más gruesas.
.png?table=block&id=978cad9d-d8ad-47d2-a328-de17b861ee9d&t=978cad9d-d8ad-47d2-a328-de17b861ee9d&width=707.9807739257812&cache=v2)
- Autor:ByIris
- URL:http://145.223.74.189:3000//article/histogram-matplotlib
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!