Entradas

El día en que perdí el pickle bueno en el data lake de Microsoft Fabric

Imagen
  Voy a empezar con un caso que lo más seguro a más de uno le suena. Tiene un modelo entrenado. Funciona. Lo guarda como .pkl en el lago de datos con un nombre tipo modelo_v2_final_BUENO.pkl, y sigue con su vida. Dos semanas después alguien pregunta: ¿con qué datos lo entrenó?, ¿qué hiperparámetros usó?, ¿esta es la versión que está en producción o la que estaba probando? Y ahí se da cuenta de que no tiene ni idea. El pickle está, sí, pero todo lo que lo rodea —los parámetros, las métricas, la fecha, el porqué de esa decisión— vive en su cabeza o, peor, en un notebook que ya editó tres veces. Ese es exactamente el dolor que MLflow viene a resolver, y por eso le dedico esta serie de blog post. Cuando monta un proyecto de machine learning en Fabric "a la antigua", el flujo es manual de principio a fin: crea un notebook, entrena, guarda el modelo en el lago, y cuando lo quiere reusar tiene que volver a leer el archivo y rezar para acordarse del contexto. Si quiere reentrenar y ...

Configuración de retención de datos en Microsoft Fabric

  “Data is not only an asset because it exists, but because institutions can reconstruct its history.” Esta idea, aunque rara vez se formula de manera explícita en plataformas modernas de analítica, se ha convertido en uno de los pilares silenciosos de arquitecturas lakehouse y motores analíticos distribuidos. En el caso de Microsoft Fabric, el concepto de  data retention  dentro de Fabric Data Warehouse no es simplemente una política de almacenamiento: es el mecanismo que habilita capacidades críticas como time travel, snapshots, restore points y recuperación histórica de información. La relevancia de este tema crece conforme las organizaciones latinoamericanas comienzan a mover cargas analíticas sensibles hacia OneLake y arquitecturas unificadas basadas en Fabric. En Microsoft Fabric, cada Warehouse mantiene automáticamente versiones históricas de los datos mediante el uso del transaction log de Delta Lake. Esto significa que cuando un usuario ejecuta un UPDATE, DELETE ...

Entendiendo el Tenant Settings de Microsoft Fabric

Imagen
  “Las instituciones no solo definen lo que está permitido, sino también lo que es posible.” — Douglass North En el contexto de plataformas modernas de datos, esta afirmación cobra una relevancia particular. El  Tenant settings de Microsoft Fabric  no es simplemente un conjunto de switches técnicos, sino el marco institucional que define cómo se crea, distribuye y controla el valor basado en datos dentro de una organización. Cuando se analiza el Tenant settings de Microsoft Fabric, es necesario entender que no se trata de un conjunto de configuraciones técnicas aisladas, sino del punto donde se define el perímetro real de la plataforma. A diferencia de otros entornos donde la gobernanza se construye de forma distribuida, Fabric concentra en este nivel decisiones críticas sobre creación de artefactos, ejecución de modelos, automatización y capacidades avanzadas. Esto es particularmente relevante en América Latina, donde muchas organizaciones están migrando desde entornos f...

Panamá Puente Digital: Microsoft Fabric Real Time Analytics

Imagen
  Press enter or click to view image in full size En muchos proyectos de analítica, hay un momento en donde los datos dejan de ser históricos y empiezan a ser datos que se mueven. Ya no estamos viendo qué pasó ayer, sino qué está pasando ahora mismo. Y ahí es donde empiezan los retos interesantes. Porque cuando hablamos de datos geoespaciales en tiempo real — por ejemplo GPS de camiones, rutas de distribución, activos en movimiento o incluso personas — ya no basta con un data warehouse tradicional. Necesitamos una arquitectura que sea capaz de: ingerir datos en tiempo real procesarlos casi inmediatamente analizarlos con contexto y visualizarlos de forma que tenga sentido para el negocio En esta charla que voy a impartir en Panamá Puente Digital, la idea es precisamente explicar cómo hacer esto utilizando Microsoft Fabric, pero no desde la teoría, sino desde un enfoque práctico y aterrizado a casos reales. Cómo lo resolvemos con Microsoft Fabric Lo interesante de Microsoft Fabric es...