Paso a Paso Pandas
📊 Taller: Exploración de Datos con Pandas
En este taller aprenderás a explorar y analizar el archivo Grandes_Superficies_20250402.csv utilizando la librerÃa Pandas de Python.
1️⃣ Cargar el archivo
Primero importamos Pandas y cargamos el archivo CSV:
import pandas as pd
df = pd.read_csv("Grandes_Superficies_20250402.csv")
2️⃣ Ver las primeras filas
Para entender la estructura del archivo:
df.head()
3️⃣ Explorar columnas y tipos de datos
df.columns
df.dtypes
4️⃣ Obtener estadÃsticas generales
Revisar datos numéricos:
df.describe()
5️⃣ Identificar valores nulos
df.isnull().sum()
6️⃣ Ver el número de filas y columnas
df.shape
7️⃣ Agrupar por entidades o proveedores
Total por proveedor:
df.groupby("Proveedor")["Total"].sum().sort_values(ascending=False)
8️⃣ Filtrar por condición
Por ejemplo, solo entidades obligadas:
df[df["Obigada"] == "OBLIGADA"]
9️⃣ Ordenar por columnas
df.sort_values(by="Total", ascending=False)
🔟 Ver compras en ciudades especÃficas
df[df["Ciudad"] == "CALI"]
1️⃣1️⃣ Ver registros únicos
Por ejemplo, en “Rama de la Entidad”:
df["Rama de la Entidad"].unique()
1️⃣2️⃣ Graficar (opcional)
Si estás usando Jupyter o Colab:
import matplotlib.pyplot as plt
df.groupby("Proveedor")["Total"].sum().nlargest(5).plot(kind='barh')
plt.title("Top 5 Proveedores por Total")
plt.xlabel("Total")
plt.show()
✅ Conclusión
Con estas herramientas, puedes explorar, limpiar y analizar cualquier conjunto de datos usando Pandas. ¡Practica con diferentes columnas y filtros!
Comentarios
Publicar un comentario