Dataframe

¿Qué es un DataFrame en Pandas?

📊 ¿Qué es un DataFrame en Pandas?

Un DataFrame es la estructura de datos más importante en la librería Pandas. Es una **estructura bidimensional**, similar a una hoja de cálculo o tabla SQL, que permite almacenar y manipular datos etiquetados.

Características clave de un DataFrame:
  • Tiene filas e índices etiquetados.
  • Permite columnas de diferentes tipos de datos.
  • Admite operaciones como selección, filtrado, agrupación y ordenamiento.

🧠 Componentes de un DataFrame

  • Datos: contenido numérico, textual o mixto.
  • Índice: etiquetas únicas para identificar filas.
  • Columnas: nombres que identifican las variables.

📌 Ejemplo de un DataFrame

Supongamos que tenemos el siguiente conjunto de datos:

Nombre Edad Ciudad
Laura 28 Bogotá
Carlos 34 Medellín
Ana 25 Cali

Esto en Pandas se representa así:

import pandas as pd
datos = { "Nombre": ["Laura", "Carlos", "Ana"],
        "Edad": [28, 34, 25],
        "Ciudad": ["Bogotá", "Medellín", "Cali"] }
df = pd.DataFrame(datos)

🔍 ¿Por qué usar DataFrames?

  • Fácil lectura y escritura de datos (CSV, Excel, SQL...)
  • Permite operaciones complejas con pocas líneas de código
  • Ideal para limpiar, transformar y visualizar información

🚀 Acciones comunes con DataFrames

  • df.head() → Muestra las primeras filas
  • df.describe() → Resumen estadístico
  • df['Edad'] → Acceso a una columna
  • df[df['Edad'] > 30] → Filtrar por condición

✅ Conclusión

Los DataFrames son fundamentales para el análisis de datos en Python. Gracias a Pandas, manipular datos es más simple, rápido y ordenado.

🔔 ¡Sigue explorando el mundo de los datos con Pandas!

Comentarios

Entradas más populares de este blog

Taller - Dashboard en Python