Introducción a Pandas
Lazy loaded imageIntroducción a Pandas
Pandas es una librería de Python para manipulación de datos, basada en NumPy y Matplotlib, que utiliza estructuras como Series y DataFrames para almacenar datos en forma tabular. Se puede instalar con pip e importar fácilmente para analizar datos.
Agregar Nuevas Columnas
Lazy loaded imageAgregar Nuevas Columnas
Se explica cómo agregar nuevas columnas a un DataFrame en Pandas, incluyendo la suma de columnas existentes, clasificación de ventas y cálculo de porcentajes. Se proponen ejercicios prácticos para aplicar estos conceptos.
Métodos para Cambiar Valores
Counting
Lazy loaded imageCounting
Para contar cuántos perritos de cada raza han visitado la veterinaria, se deben eliminar duplicados de nombres, considerando tanto el nombre como la raza para evitar perder datos. Se utiliza el método value_counts para obtener la cantidad y proporciones de cada raza.
Sorting y Subsetting
Lazy loaded imageSorting y Subsetting
Ordenar y filtrar datos en pandas facilita el análisis, permitiendo organizar información por columnas, seleccionar subconjuntos según condiciones y combinar ambas funciones para obtener resultados específicos, como filtrar y ordenar datos de animales vacunados por edad.
Summary Statistics
Lazy loaded imageSummary Statistics
Las estadísticas de resumen en Pandas incluyen funciones como .mean() para calcular la media, .min() y .max() para encontrar valores extremos, y .agg() para estadísticas personalizadas. También se pueden calcular estadísticas acumulativas con .cumsum() y se proponen ejercicios prácticos utilizando un conjunto de datos de Walmart sobre ventas semanales.
Métodos para Transformación de Datos
Lazy loaded imageMétodos para Transformación de Datos
La transformación de datos en pandas incluye métodos como apply() para funciones personalizadas en filas o columnas, map() para transformar valores individuales en series, applymap() para aplicar cambios a todo un DataFrame, y groupby() para agrupar y sumar datos por categorías.
Introducción a Numpy
Lazy loaded imageIntroducción a Numpy
NumPy es una biblioteca esencial en Python para análisis de datos y computación científica, que permite trabajar con arrays multidimensionales y realizar operaciones matemáticas optimizadas, incluyendo álgebra lineal y generación de números aleatorios.
Características Básicas de un Array
🟣Características Básicas de un Array
Los arrays de Numpy permiten realizar cálculos rápidos y eficientes sobre colecciones de datos, superando las limitaciones de las listas en Python. Facilitan operaciones sobre matrices enteras y permiten crear subconjuntos mediante matrices booleanas.