Taller: Storytelling con el Mercado de Analistas de Datos
Taller en Google Colab: Storytelling con el Mercado de Analistas de Datos
Objetivo: Analizar el dataset de Kaggle sobre ofertas laborales para analistas de datos y construir una historia visual con hallazgos clave.
🧪 Paso Extra: Detección automática de patrones con Regex
Alex ahora quiere aplicar expresiones regulares para extraer datos importantes automáticamente de textos más complejos. Es momento de usar Python y Regex para detectar correos, valores monetarios, hashtags y más.
import re
def sugerir_y_aplicar_regex(texto):
sugerencias = []
print(f"\n📌 Texto analizado:\n{texto}\n")
if re.search(r"\d+", texto):
sugerencias.append(("Números enteros", r"\d+", re.findall(r"\d+", texto)))
if re.search(r"[A-Za-z]+", texto):
sugerencias.append(("Palabras", r"[A-Za-z]+", re.findall(r"[A-Za-z]+", texto)))
if re.search(r"\b\w+@\w+\.\w+", texto):
sugerencias.append(("Usuario de correo", r"(\w+)@", re.findall(r"(\w+)@", texto)))
if re.search(r"\.\w+$", texto):
sugerencias.append(("Extensiones", r"\.(\w+)$", re.findall(r"\.(\w+)$", texto)))
if re.search(r"\b\w", texto):
sugerencias.append(("Iniciales", r"\b\w", re.findall(r"\b\w", texto)))
if re.search(r"(19|20)\d{2}", texto):
sugerencias.append(("Años", r"(19|20)\d{2}", re.findall(r"(19|20)\d{2}", texto)))
if re.search(r"#\w+", texto):
sugerencias.append(("Hashtags", r"#\w+", re.findall(r"#\w+", texto)))
if re.search(r"\W", texto):
sugerencias.append(("No alfanuméricos", r"\W", re.findall(r"\W", texto)))
match_pesos = re.findall(r"(\$)(\d+(?:,\d{3})*(?:\.\d{2})?)", texto)
if match_pesos:
moneda = [m[0] for m in match_pesos]
valor = [m[1] for m in match_pesos]
sugerencias.append(("Valores con $", r"(\$)(\d+(?:,\d{3})*(?:\.\d{2})?)", list(zip(moneda, valor))))
print("🎯 Resultados encontrados:\n")
for descripcion, regex, resultados in sugerencias:
print(f"🔹 {descripcion}\n Regex: {regex}\n Coincidencias: {resultados}\n")
# Prueba del código
texto_usuario = input("🔎 Ingresa un texto para analizar: ")
sugerir_y_aplicar_regex(texto_usuario)
Comentarios
Publicar un comentario