Data Lakehouses 101 con PySpark, Trino y Minio
Description
En el mundo de la IA, los datos son un diamante que normalmente se pierde en los Pantanos debido a las malas prácticas con los Data Lakes, cuando muchas empresas intentan productivizar sus datos. Los Data Warehouse son una solución costosa para este problema, pero que aumenta la complejidad de los simples Lakes. Aquí entran en acción los Data Lakehouses, siendo una solución híbrida con lo mejor de ambos mundos. Este taller tiene como objetivo introducir el patrón Data Lakehouse como una solución adecuada y flexible desde pequeñas empresas hasta empresas establecidas. Incluyendo un componente práctico de implementar su propio Data Lakehouse localmente con soluciones OpenSource, compatibles con herramientas Cloud de grado de producción.