Menú
Acerca del Bootcamp
El Bootcamp de Big Data Nivel Desarrollador brinda conceptos fundamentales que los participantes necesitan para iniciar en el mundo del Big Data. El material de estudio está diseñado para que el participante aprenda a procesar grandes cantidades de datos, utilizando tecnologías de almacenamiento y procesamiento distribuido como lo son Hadoop y PySpark.
Otros detalles
- Virtual - Clases En vivo
- 16 horas
- De 8:00 AM a 5:00 PM
- Sábados y Domingos
Para quien es este bootcamp:
Este bootcamp está diseñado para ingenieros o programadores que quieren incursionar en el mundo del Big Data. Los requisitos para los participantes son:
- Conocimiento de un lenguaje de programación orientado a objeto.
- No se requiere conocimiento alguno en Big Data.
- Valorable el conocimiento en SQL.
Lo que vas a poder hacer luego de finalizar el bootcamp:
Una vez finalizado el bootcamp, los participantes contarán con los conocimientos necesarios para desenvolverse en un equipo orientado a desarrollar proyectos de Big Data. Ellos podrán:
- Conocer los principios básicos del Big Data
- Identificar y utilizar tecnologías como Spark, Hive y HDFS en entornos de Big Data
- Crear flujo de datos (data pipelines) con alto volumen de datos.
- Manejar archivos dentro del sistema distribuido de archivos de Hadoop.
- Transformar datos a través de tecnologías de procesamiento distribuido.
- Desarrollar aplicaciones con PySpark.
Contenido:
Introducción al Mundo del Big Data
- Introducción Al Mundo del Big Data
- Tecnologías Utilizadas en el Ecosistema
- Roles y Puestos de Trabajo
- Tipos de Datos
- Flujos de Datos – Data Pipes
- Cómo atacar un proyecto de Big Data
Ecosistema Hadoop
- Hadoop Distributed File System
- Componentes y usos del HDFS
- HDFS en línea de comandos
Apache Spark
- Spark Basics, ¿qué es y por qué se usa?
- Pyspark: Python + Spark
- Spark Framework
- Spark DataFrames
- Schemas
- Operaciones Básicas
- Lectura de fuentes de datos
Profundizando en Spark
- Análisis de datos estructurados mediante el uso de los DataFrames
- Transformaciones y acciones básicas
- Spark SQL
- Funciones de Spark SQL
- Transformaciones avanzadas
- Agrupaciones y agregaciones
- Joins
- Unions
RDD
- ¿Qué es un RDD?
- Lectura de Datos no estructurados con RDDs
- Pair RDDs
- Funciones Lambda
- Map Reduce en Spark
- Fase Map
- Fase Reduce
Análisis Exploratorio de un Dataset
- Casos prácticos basados en escenarios reales
- Herramientas utilizadas en Ecosistemas de Big Data
Solicita más información sin compromiso
Pregunta por nuestros precios especiales para grupos al info@reysantech.com
Preguntas Frecuentes:
Las sesiones se realizarán los días sábados y domingos. Inician a las 8:00 AM y se extienden hasta las 5:00PM. Con un total de 8 horas cada día, el bootcamp es intensivo.
Contando con pausas intermedias de 15 minutos cada dos horas y al medio día contarán con un periodo de una hora para almuerzo.
El bootcamp incluye 16 horas de sesiones en vivo donde contarán con un instructor desginado para atender las consultas y preguntas que surjan en el momento. Acceso a material de estudio en formato digital incluyendo prácticas y casos de uso.
Al finalizar el bootcamp, los participantes podrán acceder a los datos utilizados durante las sesiones y a las soluciones de los ejercicios prácticos que desarrollaremos durante las sesiones en vivo.
Durante el bootcamp, vamos a utilizar herramientas de almacenamiento y procesamiento distribuido como lo son Hadoop y Spark. Las prácticas las desarrollaremos sobre un cluster de Spark montado sobre el servicio de Databricks.
Analizaremos otras tecnologías como lo son Hive y DBFS que complementarán los conocimientos de los participantes durante las sesiones.
Al finalizar, los participantes podrán participar en procesos de selección en puestos de trabajo donde se utilicen las tecnologías de Big Data.
Los puestos más comunes son Ingeniero de Datos, Desarrollador de Big Data, o puestos similares.
Al finalizar otorgamos un certificado de participación a cada participante del bootcamp. El certificado indica que ha pasado por el Programa de Nivel Desarrollador por un periodo de 16 horas.
Solicita más información sin compromiso
Pregunta por nuestros precios especiales para grupos al info@reysantech.com