Entradas

Mostrando las entradas de abril, 2025

Taller - Guardar Figuras Interactivas en HTML

Taller - Guardar Figuras Interactivas en HTML 📁 Taller: Guardar Gráficas Interactivas como Archivos HTML 🎯 Objetivo: Aprenderás a guardar cada gráfica creada en Plotly como un archivo HTML interactivo, incluyendo una explicación para su mejor interpretación y datos representativos. 🔹 Instrucciones paso a paso: Crea tu figura en Plotly normalmente: import plotly.express as px import pandas as pd data = pd.DataFrame({ "Categoría": ["A", "B", "C"], "Ventas": [10, 20, 15] }) fig = px.bar(data, x="Categoría", y="Ventas", title="Ventas por Categoría", text="Ventas") fig.update_traces(textposition="outside") fig.show() Redacta una explicación breve y agrega los datos tabulados: explicacion = """ Ventas por Categoría Este gráfico muestra la cantidad de ventas obtenidas en cada categoría. Nos permite comparar el ...

Explicaciones de las Gráficas del Dashboard RRHH

Este documento acompaña al taller en Google Colab y explica el objetivo y utilidad de cada gráfica generada en el archivo dashboard.html. Sirve como referencia para interpretar correctamente los resultados del dashboard de Recursos Humanos. ________________________________________ 1. Contrataciones por Año Tipo: Gráfico de línea Explicación: Este gráfico muestra la evolución del número de contrataciones a lo largo del tiempo. Es útil para detectar tendencias de crecimiento o estancamiento en la incorporación de personal. Puede ayudar a identificar años con mayor demanda de talento o periodos de recesión. ________________________________________ 2. Top 5 Departamentos Tipo: Gráfico de barras Explicación: Presenta los cinco departamentos con mayor cantidad de empleados. Permite identificar en qué áreas se concentra la mayor parte de la fuerza laboral, lo cual es útil para asignar recursos, planificar formaciones o evaluar el impacto de decisiones organizacionales. ____________________...

Taller - Dashboard en Python

Taller - Dashboard en Python (Google Colab) 📈 Taller: Creación de Dashboard Interactivo en Python con Datos de Recursos Humanos 🌟 Objetivo: Aprenderás a construir un dashboard de análisis de Recursos Humanos usando Google Colab y librerías de visualización interactivas como Plotly . Al finalizar, generarás un archivo HTML con todas tus gráficas. 🔹 Instrucciones paso a paso: Sube el archivo RRHH.xlsx a tu entorno de Google Colab. Ejecuta el siguiente bloque para instalar las librerías necesarias: !pip install pandas plotly openpyxl seaborn matplotlib Carga el archivo Excel: import pandas as pd df = pd.read_excel("RRHH.xlsx") df.head() Limpieza de datos y corrección de tipos: Convertir fechas: df["Fecha_Contratacion"] = pd.to_datetime(df["Fecha_Contratacion"], errors='coerce') Reemplazar valores nulos o erróneos: # Reemp...

Modelado de Datos y Relaciones en Power BI

Taller: Modelado de Datos y Relaciones en Power BI Taller: Modelado de Datos y Relaciones en Power BI Objetivo Aprender a relacionar múltiples tablas en Power BI usando campos comunes, para obtener análisis cruzados y visualizaciones significativas. Pasos del Taller Finalizar las transformaciones en Power Query Editor usando Close & Apply . Confirmar la carga de todas las tablas en el panel Fields . Seleccionar un gráfico de columnas apiladas (Stacked Column Chart) . Arrastrar Category al eje X desde la tabla de productos. Arrastrar Revenue al área de valores desde la tabla de ventas. Observar si los resultados son válidos o hay un error (mismo valor para todas las categorías). Abrir la vista Model y conectar las tablas a través del campo común product_id . Verificar que la relación esté creada (flech...

Funciones numéricas básicas en Power BI

Taller: Funciones Numéricas en Power BI Taller: Funciones Numéricas en Power BI Objetivo Aprender a aplicar funciones numéricas básicas en Power BI para transformar datos cuantitativos y realizar conversiones entre unidades. Pasos del Taller Identificar columnas numéricas: Longitud, Profundidad y Anchura (en cm). Convertir tipo de datos: Asegúrate de que las columnas estén en formato numérico (entero o decimal). Aplicar operación matemática: Multiplica cada valor por 0.254 para convertir de centímetros a pulgadas. Utiliza Transform → Arithmetic → Multiply para cada columna de forma individual. Verifica los resultados: Las nuevas columnas deberían contener valores decimales. Recomendaciones Revisa siempre el tipo de dato antes de aplicar una operación matemática. Recuer...

Taller: Limpieza y Transformación de Datos en Power BI

Taller: Limpieza y Transformación de Datos en Power BI Taller: Limpieza y Transformación de Datos en Power BI Objetivo Aplicar técnicas de limpieza y transformación de datos en Power BI para preparar un conjunto de datos jerárquico de productos. Pasos del Taller Importar el archivo CSV: producthierarchy.csv . Eliminar caracteres invisibles: Usa Clean en la columna "product (brand)". Eliminar espacios innecesarios: Usa Trim para quitar espacios al inicio/final de cada campo. Capitalizar nombres: Aplica Capitalize Each Word sobre "product (brand)". Separar columnas combinadas: Dividir category || sub_category por delimitador personalizado " || " . Dividir length x depth x width (in cm) por " x " . Co...

Parte 6 – Combinar múltiples fuentes y extraer datos útiles

🧩 Parte 6 – Combinar múltiples fuentes y extraer datos útiles En esta etapa del proyecto aprenderás a complementar tus datos de ventas con información adicional desde otro archivo y a extraer partes relevantes de columnas complejas o mal estructuradas. 📁 Carga de nuevo conjunto de datos: Desde Power BI Desktop, abre el Power Query Editor con el botón Transformar datos . Haz clic en Inicio > Nueva fuente > Texto/CSV . Selecciona el archivo stores_settings.csv o el que contenga información de las tiendas. Renombra la tabla importada con un nombre representativo, como Tiendas . 🧠 Ejemplo de columnas con datos combinados: State - State Name - City: Tres datos en una sola columna (ej. TX - Texas - Houston ). Store Size: Datos como 101 m² o 60 km2 . 🔍 Extracción de información: #### 🟦 Extraer datos antes de un delimitador: - Selecciona la columna. - Ve a Transformar > Extraer > Antes del delimitador . - Usar delimitador: espacio ( "...

Parte 5 – Manejo de Errores y Reemplazo de Valores

🛠️ Parte 5 – Manejo de Errores y Reemplazo de Valores Al transformar datos, es común que aparezcan errores al intentar convertir tipos de datos. Esto ocurre cuando hay valores inválidos, como texto en una columna numérica. En esta sección aprenderás a detectar y corregir esos errores sin perder datos importantes. 🔍 Identificar errores: Cuando conviertes una columna a tipo decimal o entero y contiene textos como n/a o Seuil , Power BI genera errores. En Power Query, los errores aparecen marcados en rojo con un contador en la cabecera de la columna. 🔁 Opciones para solucionar errores: Volver al tipo original: Si una conversión a número genera errores, puedes revertirla seleccionando Tipo de datos > Texto . Reemplazar valores no válidos: Haz clic en la columna afectada. Selecciona Inicio > Reemplazar valores . Escribe el valor no válido (ej. n/a , Seuil , etc.) y reemplázalo por 0 o nulo . Eliminar el texto restante (...

🧠 Parte 4 – Configuración de Tipos de Datos

🧠 Parte 4 – Configuración de Tipos de Datos Antes de crear visualizaciones o aplicar medidas, es fundamental asegurarse de que cada columna tenga el tipo de dato correcto . Esto permite operaciones como sumas, conteos, agrupaciones y análisis de fechas. 📌 ¿Por qué es importante? Una columna de ingresos en formato texto no puede ser sumada. Una fecha mal formateada puede impedir cálculos de tiempo o agrupaciones por mes. Evita errores en gráficos y en medidas DAX. 🔧 Pasos para cambiar el tipo de dato: Abrir Power Query Editor desde Power BI con el botón Transformar datos . Ubicar el ícono al lado del nombre de cada columna (ejemplo: ABC para texto, 1.2 para decimales). Haz clic en el ícono y selecciona el tipo adecuado: Texto (ABC): Para identificadores, códigos o nombres. Decimal Number (1.2): Para ingresos, precios o cualquier valor monetario. Whole Number: Para cantidades sin decimales, como stock. Date: Para fechas e...

🧼 Parte 3 – Edición de Filas y Columnas en Power Query

🧼 Parte 3 – Edición de Filas y Columnas en Power Query En esta sección nos enfocaremos en cómo eliminar filas innecesarias, limpiar datos incompletos y ajustar columnas para que nuestros datos sean fiables y estén listos para análisis. 🔄 Edición de filas: Eliminar filas completamente vacías: - Ir a Inicio > Quitar filas > Quitar filas en blanco . - Esto eliminará todas las filas que no tienen ningún dato en ninguna columna. Eliminar filas con valores en blanco en una columna específica: - Haz clic en el icono de filtro de la columna (por ejemplo, Product ID ). - Desmarca la opción (blanks) y haz clic en Aceptar . Eliminar valores no válidos o desconocidos: - En el filtro de columna, desmarca valores como n/a , unknown o similares según aparezcan. Eliminar filas duplicadas: - Selecciona todas las columnas (Ctrl + clic). - Ir a Inicio > Quitar filas > Quitar duplicados para eliminar filas exactamente iguales. ...

Parte 2 – Limpieza básica con Power Query Editor

🧹 Parte 2 – Limpieza básica con Power Query Editor En esta sesión vamos a realizar las primeras transformaciones en Power BI utilizando el Power Query Editor . Este editor nos permite limpiar, transformar y preparar los datos para análisis. 🔄 Pasos prácticos: Abre Power BI y carga el archivo sales2017_raw.csv desde Obtener datos > Texto/CSV . Haz clic en Transformar datos para acceder a Power Query Editor. Eliminar filas superiores vacías o con metadatos: - En la pestaña Inicio (Home) , haz clic en Quitar filas > Quitar filas superiores . - Ingresa el número de filas a eliminar (por ejemplo: 2) y haz clic en Aceptar . Usar la primera fila como encabezado: - En la pestaña Transformar , selecciona la opción Usar la primera fila como encabezado . - Verás que ahora las columnas se renombran con los títulos correctos. Verifica los pasos aplicados: - En el panel derecho, dentro de Pasos aplicados , se verán operaci...
Taller Power BI - Análisis de Ventas 🧪 Taller 1: Limpieza y Análisis de Datos de Ventas 2017 en Power BI 🎯 Objetivo: Asumir el rol de analista de datos en una empresa de e-commerce y construir un informe visual sobre el comportamiento de ventas, trabajando con datos crudos y desordenados. 📁 Archivos Base: Archivo 1: sales2017_raw.csv 🧩 Etapas del Proyecto: Obtención y transformación de datos: Limpieza, conversión y formateo. Modelo de datos: Relaciones, tipos de datos y enriquecimiento. Visualización: Creación del dashboard final. 🔧 Paso a paso: Abrir Power BI Desktop. Ir a Inicio > Obtener datos > Texto/CSV y seleccionar sales2017_raw.csv . Haz clic en Transformar datos para abrir Power Query Editor. Eliminar filas vacías o que no contengan datos válidos. Promocionar la tercera fila como encabezado si es necesario (menú "Usar la primera fila como encabezado"). ...

Taller Power BI: Visualización de JSON Geográfico

Taller Power BI: Visualización de JSON Geográfico 🚀 Taller de Datos JSON y Power BI Objetivo: Aprender a importar un archivo JSON, explorar su estructura jerárquica y transformarla en una tabla plana lista para análisis en Power BI. 🧩 Paso 1: Abrir Power BI Desktop Abre Power BI Desktop . Haz clic en Inicio > Obtener datos > JSON . Busca el archivo .json que quieras analizar. Por ejemplo: ventas_ejemplo.json . 🗂️ Paso 2: Inspeccionar el JSON en Power Query Una vez cargado, se abrirá el editor de Power Query . Verás una columna con el nombre List o Record , dependiendo de cómo esté estructurado tu JSON. 🛠️ Paso 3: Expandir jerarquía paso a paso A. Si la raíz es una Lista: Haz clic en el botón de expansión de la columna (ícono de doble flecha ↕). Esto convertirá la lista en múltiples filas (una por cada elemento). Verás ahora regis...

🚀 Taller de Datos JSON y Power BI

🚀 Taller de Datos JSON y Power BI En este taller, aprenderemos a trabajar con datos en formato JSON y cómo cargarlos en Power BI para realizar análisis y visualizaciones. 📥 Paso 1: Descargar archivo JSON Vamos a trabajar con datos del portal datos.gov.co . Busca y descarga un archivo en formato JSON relacionado con los datos públicos, por ejemplo: Busca datasets como películas, comercio exterior, salud en formato JSON. Guarda el archivo JSON en tu computadora. 🔍 Paso 2: Cargar el archivo JSON en Power BI En Power BI, ve a Inicio → Obtener datos → JSON . Selecciona el archivo JSON descargado desde datos.gov.co . Haz clic en Conectar para cargar los datos en Power BI. Power BI analizará el archivo JSON y te mostrará una vista previa. 🔧 Paso 3: Transformar los datos (si es necesario) Si el archivo JSON tiene estructuras complejas (listas anidadas, objetos dentro de objetos), usa Power Query Editor para expandir esas columnas y convertirlas en una tabla de datos pl...

Taller 2 - Visualización Multivariable en Tableau: Gráfico de Burbujas

Taller 2 - Gráfico de Burbujas: Países y Variables Económicas Taller 2 - Visualización Multivariable en Tableau: Gráfico de Burbujas Objetivo Crear un gráfico de burbujas en Tableau para comparar la expectativa de vida con el GDP per cápita de los países en el año 2002, utilizando el tamaño de las burbujas para representar la población y el color para identificar el continente. Paso a Paso 1. Cargar los Datos Abrir Tableau y seleccionar Archivo de texto como fuente de datos. Cargar el dataset Países Vida que contiene columnas como: continente, país, año, expectativa de vida, población, GDP per cápita. 2. Crear el Gráfico de Burbujas Crear nueva hoja de trabajo: Gráfico de Burbujas . Arrastrar GDP per cápita a Columnas (eje X). Arrastrar Expectativa de vida a Filas (eje Y). Desagregar medidas: Ir a Análisis y desmarcar Medidas agregadas . 3. Ajustar Escalas Editar eje X: activar Escala logarítmic...

Visualización Multivariable: Scatterplot y Regresión

Taller 1 - Visualización Multivariable: Scatterplot y Regresión Taller 1 - Visualización Multivariable en Tableau Objetivo Crear visualizaciones multivariables en Tableau usando el dataset de pingüinos, enfocándonos en scatterplots y gráficos de regresión para analizar la relación entre la longitud del pico y la longitud de las aletas, diferenciando por especie. Paso a Paso 1. Cargar los Datos Abrir Tableau y seleccionar Archivo de texto como fuente de datos. Cargar el dataset de pingüinos (CSV). Verificar columnas: especie, isla, longitud del pico, profundidad del pico, longitud de las aletas, sexo, peso. 2. Crear el Scatterplot Crear nueva hoja de trabajo: Scatterplot de Regresión . Arrastrar longitud del pico a Columnas y longitud de las aletas a Filas . Ir a Análisis y desmarcar Medidas agregadas . 3. Ajuste de Ejes Editar eje X e Y: desmarcar Incluir el cero . Reducir el tamaño de los pu...

Taller: Storytelling con el Mercado de Analistas de Datos

Taller: Storytelling con el Mercado de Analistas de Datos Taller en Google Colab: Storytelling con el Mercado de Analistas de Datos Objetivo: Analizar el dataset de Kaggle sobre ofertas laborales para analistas de datos y construir una historia visual con hallazgos clave. 📊 Paso Extra: Extraer datos con operaciones de cadena Alex quiere ahora separar rangos de empleados como "201 to 500 employees" usando solo operaciones de cadena como split . Esto lo ayudará a limpiar datos sin depender de regex. import pandas as pd # Simulación de columna Size sizes = [ '201 to 500 employees', '10000+ employees', '1001 to 5000 employees', '51 to 200 employees', '10000+ employees', '-1', '501 to 1000 employees' ] df = pd.DataFrame({'Size': sizes}) def procesar_size(valor): if 'to' in valor: partes = valor.split(' to ') ...

Taller: Storytelling con el Mercado de Analistas de Datos

Taller: Storytelling con el Mercado de Analistas de Datos Taller en Google Colab: Storytelling con el Mercado de Analistas de Datos Objetivo: Analizar el dataset de Kaggle sobre ofertas laborales para analistas de datos y construir una historia visual con hallazgos clave. 🧪 Paso Extra: Detección automática de patrones con Regex Alex ahora quiere aplicar expresiones regulares para extraer datos importantes automáticamente de textos más complejos. Es momento de usar Python y Regex para detectar correos, valores monetarios, hashtags y más. import re def sugerir_y_aplicar_regex(texto): sugerencias = [] print(f"\n📌 Texto analizado:\n{texto}\n") if re.search(r"\d+", texto): sugerencias.append(("Números enteros", r"\d+", re.findall(r"\d+", texto))) if re.search(r"[A-Za-z]+", texto): sugerencias.append(("Palabras", r"[A-Za-z]+", re.fin...
Taller: Storytelling con el Mercado de Analistas de Datos Taller en Google Colab: Storytelling con el Mercado de Analistas de Datos Objetivo: Analizar el dataset de Kaggle sobre ofertas laborales para analistas de datos y construir una historia visual con hallazgos clave. 🔗 Paso 1: Accede a Google Colab Conoce a Alex, un joven apasionado por los datos. Ha decidido convertirse en analista de datos y quiere explorar el mercado laboral para entender dónde postularse y qué habilidades necesita. 1. Ingresa a https://colab.research.google.com . 2. Crea un nuevo notebook. 3. Cambia el nombre a: Storytelling_AnalystJobs . 📥 Paso 2: Cargar el dataset Alex encontró un interesante dataset de Kaggle con miles de ofertas laborales para analistas de datos. Ahora quiere cargarlo en su notebook para comenzar su análisis. 1. Descarga el archivo CSV desde Kaggle . 2. Sube el archivo a tu notebook usando: from google.colab ...

Certificado Existencia y Representación legal

Imagen

Taller Biblioteca

Taller: Diccionarios Anidados en Python Taller de Python: Diccionarios Anidados con Ejemplo de Biblioteca ✨ Objetivo Representar la información de una biblioteca utilizando diccionarios anidados en Python, desarrollando habilidades de organización y acceso a estructuras de datos. 📖 Contexto Una biblioteca universitaria quiere digitalizar la información de sus libros, autores y disponibilidad. Cada libro tiene un título, autor, año de publicación, categoría y estado de disponibilidad. ✍️ Actividades Crea un diccionario llamado biblioteca que contenga las claves nombre , ubicacion y coleccion . La clave coleccion debe contener una lista de libros. Cada libro es un diccionario con las siguientes claves: titulo autor : un subdiccionario con nombre y nacionalidad anio ...

Dataframe

¿Qué es un DataFrame en Pandas? 📊 ¿Qué es un DataFrame en Pandas? Un DataFrame es la estructura de datos más importante en la librería Pandas . Es una **estructura bidimensional**, similar a una hoja de cálculo o tabla SQL, que permite almacenar y manipular datos etiquetados. Características clave de un DataFrame: Tiene filas e índices etiquetados. Permite columnas de diferentes tipos de datos. Admite operaciones como selección, filtrado, agrupación y ordenamiento. 🧠 Componentes de un DataFrame Datos: contenido numérico, textual o mixto. Índice: etiquetas únicas para identificar filas. Columnas: nombres que identifican las variables. 📌 Ejemplo de un DataFrame Supongamos que tenemos el siguiente conjunto de datos: Nombre Edad Ciudad Laura 28...

Paso a Paso Pandas

Taller: Exploración de Datos con Pandas 📊 Taller: Exploración de Datos con Pandas En este taller aprenderás a explorar y analizar el archivo Grandes_Superficies_20250402.csv utilizando la librería Pandas de Python. 1️⃣ Cargar el archivo Primero importamos Pandas y cargamos el archivo CSV: import pandas as pd df = pd.read_csv("Grandes_Superficies_20250402.csv") 2️⃣ Ver las primeras filas Para entender la estructura del archivo: df.head() 3️⃣ Explorar columnas y tipos de datos df.columns df.dtypes 4️⃣ Obtener estadísticas generales Revisar datos numéricos: df.describe() 5️⃣ Identificar valores nulos df.isnull().sum() 6️⃣ Ver el número de filas y columnas df.shape 7️⃣ Agrupar por entidades o proveedores Total por proveedor: df.groupby("Proveedor")["Total"].sum().sort_values(ascending=False) 8️⃣ Filtrar por condición Por ejemp...

Pandas

Infografía: Librería Pandas en Python 🐼 Pandas: Tu Aliado en el Análisis de Datos ¿Qué es Pandas? Pandas es una librería de código abierto en Python que proporciona estructuras de datos y herramientas de análisis de datos de alto rendimiento y fáciles de usar. ¿Cómo se deriva el nombre "Pandas"? El nombre Pandas proviene de "Panel Data" , un término utilizado en estadística y econometría para referirse a conjuntos de datos que contienen observaciones a lo largo del tiempo para los mismos individuos. Pasos típicos en el análisis de datos con Pandas Cargar: importar datos desde archivos como CSV, Excel o bases de datos. Preparar: limpiar y transformar los datos (quitar duplicados, manejar valores nulos, convertir tipos). Manipular: ordenar, filtrar, agrupar y modificar los datos según necesidades. Modelar: estructurar los datos para...