Dataframe
📊 ¿Qué es un DataFrame en Pandas?
Un DataFrame es la estructura de datos más importante en la librería Pandas. Es una **estructura bidimensional**, similar a una hoja de cálculo o tabla SQL, que permite almacenar y manipular datos etiquetados.
Características clave de un DataFrame:
- Tiene filas e índices etiquetados.
- Permite columnas de diferentes tipos de datos.
- Admite operaciones como selección, filtrado, agrupación y ordenamiento.
🧠 Componentes de un DataFrame
- Datos: contenido numérico, textual o mixto.
- Índice: etiquetas únicas para identificar filas.
- Columnas: nombres que identifican las variables.
📌 Ejemplo de un DataFrame
Supongamos que tenemos el siguiente conjunto de datos:
Nombre | Edad | Ciudad |
---|---|---|
Laura | 28 | Bogotá |
Carlos | 34 | Medellín |
Ana | 25 | Cali |
Esto en Pandas se representa así:
import pandas as pd
datos = { "Nombre": ["Laura", "Carlos", "Ana"],
"Edad": [28, 34, 25],
"Ciudad": ["Bogotá", "Medellín", "Cali"] }
df = pd.DataFrame(datos)
🔍 ¿Por qué usar DataFrames?
- Fácil lectura y escritura de datos (CSV, Excel, SQL...)
- Permite operaciones complejas con pocas líneas de código
- Ideal para limpiar, transformar y visualizar información
🚀 Acciones comunes con DataFrames
df.head()
→ Muestra las primeras filasdf.describe()
→ Resumen estadísticodf['Edad']
→ Acceso a una columnadf[df['Edad'] > 30]
→ Filtrar por condición
✅ Conclusión
Los DataFrames son fundamentales para el análisis de datos en Python. Gracias a Pandas, manipular datos es más simple, rápido y ordenado.
🔔 ¡Sigue explorando el mundo de los datos con Pandas!
Comentarios
Publicar un comentario