Seleccionar página

¿Qué es el Big Data?

Qué es el Big Data y para qué sirve

El término big data se usa para caracterizar conjuntos de datos grandes, diversos y que cambian rápidamente, lo que es cada vez más frecuente en todas las organizaciones. Big data requiere de sistemas de administración de bases de datos con capacidades más allá de las que se ven en los sistemas estándar basados en SQL.

La mayoría de las definiciones intuitivas de big data se centran en el volumen de datos que se producen, a menudo medidos en términos de tera (1012), peta (1015) o exa (1018) bytes. Algunos afirman que se está ingresando a la llamada «Era Petabyte» (Anderson, 2008) mientras que otros prefieren hablar de cuántos exabytes de datos se producen cada día (McAfee y Brynjolfsson, 2012).

Sin embargo, aunque el volumen es, sin duda, un aspecto del big data (probablemente el menos problemático), a medida que la tecnología se desarrolla, lo que fue grande en el pasado será normal mañana y probablemente se piense que es bastante pequeño en el futuro. Por consiguiente, para comprender qué hace que big data sea diferente, también se debe considerar las dimensiones de la velocidad y la variedad.

Velocidad

Mientras que el volumen se refiere a lo que podría considerarse una «reserva» de datos, la velocidad se refiere a la que esa acción cambia; por ejemplo, la velocidad a la que se generan los datos, la frecuencia a la que se actualiza o la velocidad a la que son entregados.

Entre los ejemplos de datos de alta velocidad se incluyen datos financieros de mercados bursátiles, datos en tiempo real de sensores y cámaras de vídeo, y datos de stream generados por visitantes a tiendas en línea.

Variedad

Aunque tal vez no sea tan obvio como el volumen o la velocidad, en muchos sentidos la variedad plantea el mayor problema para el análisis de big data.

La variedad se refiere a la cantidad de diferentes fuentes de las que pueden proceder los datos y los formatos, estructuras y semántica que están asociadas a ellas (Estructura se refiere tanto al formato en el que se almacenan los datos, como el número y la longitud de los campos, y, más crucial, la semántica que debe asociarse con esos campos.

Para que una computadora pueda procesar datos de manera que sean válidos y significativos para los seres humanos, los datos primero deben codificarse, es decir, un valor semántico – efectivamente un significado – tiene que asignarse a cada elemento de datos (Kimble, 2013).

 Por último, nos quedamos con una frase de una referente y pionera del sector big data en España:

“Más importante que saber qué es big data es saber para qué queremos big data” Carme Artigas, cofundadora & CEO de la empresa de analítica avanzada Synergic Partners

Herramientas de Big Data

En la siguiente ilustración podéis ver cuáles son las herramientas principales utilizadas por cada uno de los roles en el mundo Big Data. Es importante que cada perfil los conozca y esté al tanto de nuevas versiones y nuevos productos que ayudarán en su trabajo diario.

Herramientas del Big Data

Ejemplos y aplicaciones del Big Data

Tecnología Big Data

Tecnología Big Data