Paso a Paso Pandas

Taller: Exploración de Datos con Pandas

📊 Taller: Exploración de Datos con Pandas

En este taller aprenderás a explorar y analizar el archivo Grandes_Superficies_20250402.csv utilizando la librería Pandas de Python.

1️⃣ Cargar el archivo

Primero importamos Pandas y cargamos el archivo CSV:

import pandas as pd
df = pd.read_csv("Grandes_Superficies_20250402.csv")

2️⃣ Ver las primeras filas

Para entender la estructura del archivo:

df.head()

3️⃣ Explorar columnas y tipos de datos

df.columns
df.dtypes

4️⃣ Obtener estadísticas generales

Revisar datos numéricos:

df.describe()

5️⃣ Identificar valores nulos

df.isnull().sum()

6️⃣ Ver el número de filas y columnas

df.shape

7️⃣ Agrupar por entidades o proveedores

Total por proveedor:

df.groupby("Proveedor")["Total"].sum().sort_values(ascending=False)

8️⃣ Filtrar por condición

Por ejemplo, solo entidades obligadas:

df[df["Obigada"] == "OBLIGADA"]

9️⃣ Ordenar por columnas

df.sort_values(by="Total", ascending=False)

🔟 Ver compras en ciudades específicas

df[df["Ciudad"] == "CALI"]

1️⃣1️⃣ Ver registros únicos

Por ejemplo, en “Rama de la Entidad”:

df["Rama de la Entidad"].unique()

1️⃣2️⃣ Graficar (opcional)

Si estás usando Jupyter o Colab:

import matplotlib.pyplot as plt

df.groupby("Proveedor")["Total"].sum().nlargest(5).plot(kind='barh')
plt.title("Top 5 Proveedores por Total")
plt.xlabel("Total")
plt.show()

✅ Conclusión

Con estas herramientas, puedes explorar, limpiar y analizar cualquier conjunto de datos usando Pandas. ¡Practica con diferentes columnas y filtros!

Comentarios

Entradas más populares de este blog

Taller - Dashboard en Python