Introducción al Mundo del Big Data

Esta serie de artículos tiene como objetivo explicar de forma sencilla qué es el Big Data y cómo puedes sacarle provecho en tu organización.
Comparte este artículo

Introducción

Este es el inicio de una serie de artículos en los que podrás hacer una inmersión profunda en el mundo del big data. Estos artículos se hacen con la finalidad de que personas no técnicas o con poco conocimiento en este tema puedan entender ¿qué es el Big Data? y ¿cómo puede ayudar a las organizaciones hoy en día?

Siempre podrás encontrar una tabla de contenido donde podrás ver los temas que vamos a ver en el artículo, si te interesa uno en particular simplemente haz clic sobre el tema y serás dirigido hacia esa sección. Sin más preámbulo empezamos de una vez.

Contenido del Artículo

¿Qué es Big Data?

Big Data hace referencia a cantidades ENORMES de datos. Tan simple como eso, grandes cantidades de datos que a diario se van generado en diferentes formatos tales como videos, imágenes, tweets, logs y muchos otros.

No podemos hablar del concepto de Big Data si no sabemos donde nace, tranquilos no son datos históricos, ni fechas ni nombres extraños. De hecho hablamos de hace menos de 20 años cuando empiezan a relucir estos temas.

Antes del Big Data

Antes, una empresa hacía todos los registros o transacciones que sucedían en el día a día a mano y si era una empresa que tenía la capacidad, podía tener una base de datos pequeña para este fin.

En esta base de datos guardaban los datos de los clientes, las ventas, proveedores, los productos, etc donde podrían tener unos cuantos megabytes de  información en la mayoría de los casos. 

Una que otra empresa a nivel mundial podría tener gigabytes de información.

Big Data, un problema tan grande como su nombre lo dice

Luego que surgiera el internet y se empezaran a digitalizar muchos otros procesos que a diario se hacían fuera de una computadora, la cantidad de datos aumentó sustancialmente.

Surgió un problema bastante grande, las computadoras no podían procesar tanta información, las bases de datos colapsaban, no había espacio para almacenar toda la data que se iba generando y el problema seguía creciendo.

Nacimiento del Big Data

Empresas como Google o Yahoo, quienes tenían que indexar muchísimos sitios webs que estaban siendo creados en ese momento empezaron a desarrollar tecnologías que permitieran aprovechar el rendimiento de equipos informáticos regulares o de bajo costo para procesar esta cantidad de información.

La idea era básicamente conectar muchas computadoras para que trabajaran en conjunto y así tener la capacidad necesaria sin tener que invertir mucho dinero en servidores o en memorias para procesarla.

¿Pero de cuántos datos estamos hablando?

Para el 2003, el CEO de Google en ese momento estimaba que durante toda la historia de la humanidad se habían generado 5 exabytes de datos. Si no sabes cuanto es un EXABYTE te hago la referencia.
UnidadEquivaleDispositivo
1 Gigabyte (GB)1,000 MBUn USB tiene 8GB
1 Terabyte (TB)1,000 GBUna computadora tiene 1TB
1 Petabyte (PB)1,000 TBMil computadoras de 1 TB
1 Exabyte (EB)1,000 PBUn millón de computadoras de 1TB

¿No está mal verdad? 5 exabytes en toda la historia de la humanidad parece poco. El verdadero problema es lo que sucedió después. 

Estamos hablando que en solo el año 2007 habíamos generado 281 exabytes de información, es decir más de 56 veces más datos que en toda la historia de la humanidad.

Para que tengan una idea de cuanta información existe se genera hoy en día podemos tomar como ejemplo la imagen a continuación que data sobre el 2019.

En el 2019 en un minuto...

Así como se generan tantos datos, surgen otras necesidades al momento procesarlos. Ahora con el Big Data es normal que se puedan tomar en consideración los datos para la toma de decisiones en una compañía.

Al estar digitalizada toda la información permite a las organizaciones estudiar los datos históricos, encontrar patrones, analizar e incluso predecir sobre lo que va a pasar en un determinado momento. Y es por esta sencilla razón que las empresas líderes a nivel mundial son las que mencionamos anteriormente y es gracias a la forma en la que utilizan los datos para el beneficio de ellas mismas.

Acerca del Autor:

Erick Reyes

Erick Reyes

Soy un Ingeniero en Sistemas y Computación, Máster en Emprendimiento e Innovación con especialidad en Big Data y Analítica en las Organizaciones. Me apasiona compartir lo poco que sé para ayudar a otras personas a cumplir sus objetivos. Autodidacta, pro-activo, innovador y con capacidad de resolución de problemas.

Otros artículos de Interés

Big Data

¿Cómo se procesa la información en Big Data?

El procesamiento de los datos se puede dar de varias formas, en tiempo real, por lotes o en una combinación entre las dos. Si quieres saber en que consisten cada tipo de procesamiento este artículo es para ti.

Big Data

¿Dónde guardamos los datos en Big Data?

Almacenar los datos puede convertirse en algo complejo dependiendo de nuestro ecosistema de Big Data. Vamos a simplificar aún más el almacenamiento de los datos explicando los conceptos de Data Lake y Data Warehouse.

Te gustaría aprender más?

Suscríbete al Newsletter.

small_c_popup.png

Suscríbete al Newsletter