Introducción
Este es el inicio de una serie de artículos en los que podrás hacer una inmersión profunda en el mundo del big data. Estos artículos se hacen con la finalidad de que personas no técnicas o con poco conocimiento en este tema puedan entender ¿qué es el Big Data? y ¿cómo puede ayudar a las organizaciones hoy en día?
Siempre podrás encontrar una tabla de contenido donde podrás ver los temas que vamos a ver en el artículo, si te interesa uno en particular simplemente haz clic sobre el tema y serás dirigido hacia esa sección. Sin más preámbulo empezamos de una vez.
Contenido del Artículo
¿Qué es Big Data?
Big Data hace referencia a cantidades ENORMES de datos. Tan simple como eso, grandes cantidades de datos que a diario se van generado en diferentes formatos tales como videos, imágenes, tweets, logs y muchos otros.
No podemos hablar del concepto de Big Data si no sabemos donde nace, tranquilos no son datos históricos, ni fechas ni nombres extraños. De hecho hablamos de hace menos de 20 años cuando empiezan a relucir estos temas.
Antes del Big Data
Antes, una empresa hacía todos los registros o transacciones que sucedían en el día a día a mano y si era una empresa que tenía la capacidad, podía tener una base de datos pequeña para este fin.
En esta base de datos guardaban los datos de los clientes, las ventas, proveedores, los productos, etc donde podrían tener unos cuantos megabytes de información en la mayoría de los casos.
Una que otra empresa a nivel mundial podría tener gigabytes de información.
Big Data, un problema tan grande como su nombre lo dice
Luego que surgiera el internet y se empezaran a digitalizar muchos otros procesos que a diario se hacían fuera de una computadora, la cantidad de datos aumentó sustancialmente.
Surgió un problema bastante grande, las computadoras no podían procesar tanta información, las bases de datos colapsaban, no había espacio para almacenar toda la data que se iba generando y el problema seguía creciendo.
Nacimiento del Big Data
Empresas como Google o Yahoo, quienes tenían que indexar muchísimos sitios webs que estaban siendo creados en ese momento empezaron a desarrollar tecnologías que permitieran aprovechar el rendimiento de equipos informáticos regulares o de bajo costo para procesar esta cantidad de información.
La idea era básicamente conectar muchas computadoras para que trabajaran en conjunto y así tener la capacidad necesaria sin tener que invertir mucho dinero en servidores o en memorias para procesarla.
¿Pero de cuántos datos estamos hablando?
Unidad | Equivale | Dispositivo |
---|---|---|
1 Gigabyte (GB) | 1,000 MB | Un USB tiene 8GB |
1 Terabyte (TB) | 1,000 GB | Una computadora tiene 1TB |
1 Petabyte (PB) | 1,000 TB | Mil computadoras de 1 TB |
1 Exabyte (EB) | 1,000 PB | Un millón de computadoras de 1TB |
¿No está mal verdad? 5 exabytes en toda la historia de la humanidad parece poco. El verdadero problema es lo que sucedió después.
Estamos hablando que en solo el año 2007 habíamos generado 281 exabytes de información, es decir más de 56 veces más datos que en toda la historia de la humanidad.
Para que tengan una idea de cuanta información existe se genera hoy en día podemos tomar como ejemplo la imagen a continuación que data sobre el 2019.
En el 2019 en un minuto...
- Se publican 511,200 tweets
- Se hacen 1,389 reservaciones en AirBnB
- Se solicitan 9,772 rides de Uber
- Se publican en Iinstagram 277,777 historias
- Se envían 188,000,000 correos
- Se ven 4,500,000 videos en Youtube
Así como se generan tantos datos, surgen otras necesidades al momento procesarlos. Ahora con el Big Data es normal que se puedan tomar en consideración los datos para la toma de decisiones en una compañía.
Al estar digitalizada toda la información permite a las organizaciones estudiar los datos históricos, encontrar patrones, analizar e incluso predecir sobre lo que va a pasar en un determinado momento. Y es por esta sencilla razón que las empresas líderes a nivel mundial son las que mencionamos anteriormente y es gracias a la forma en la que utilizan los datos para el beneficio de ellas mismas.