Data Lake y el síndrome de Diógenes

Ya hay una nueva palabreja (buzzword) volando por ahí: Data Lake. Se viene a sumar a otras como “Big Data”. El responsable, una vez más, es Hadoop, ya que su principal ventaja, desde mi punto de vista, es lo barato que resulta almacenar y analizar gran cantidad de información. Hadoop ha propiciado la tendencia al almacenamiento de toda la información posible “por si acaso”. Es lo más parecido al síndrome de Diógenes que hay en el mundo TI (tendencia ya de por sí bastante extendida entre nosotros los “Datawarehousers“).

Pues bien, el concepto detrás de este Data Lake es precisamente ése: el almacenamiento  de cantidades ilimitadas de información de cualquier tipo o formato con el fin de tenerlas ahí para un posible (y seguramente a menudo poco probable) tratamiento a posteriori, que incluiría su filtrado, depuración, análisis e incluso incorporación de las pequeñas “pepitas de oro” que se pudieran extraer de allí a estructuras mas “serias”, como un Data Warehouse, por ejemplo.

Saludos.

Carlos.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: