Big Data - Bootcamp

Nivel: Desarrollador

Próximas Convocatorias

23 y 24 de enero de 2021

RESERVADO

30 y 31 de enero de 2021

8 CUPOS DISPONIBLES

6 y 7 de febrero de 2021

11 CUPOS DISPONIBLES

Acerca del Bootcamp

El Bootcamp de Big Data Nivel Desarrollador brinda conceptos fundamentales que los participantes necesitan para iniciar en el mundo del Big Data. El material de estudio está diseñado para que el participante aprenda a procesar grandes cantidades de datos, utilizando tecnologías de almacenamiento y procesamiento distribuido como lo son Hadoop y PySpark.

Durante las sesiones de aprendizaje, se estudiarán casos de uso reales, que ayudarán a los participantes a entender cómo actuar y proceder dentro de una organización. 
Otros detalles

Para quien es este bootcamp:

Este bootcamp está diseñado para ingenieros o programadores que quieren incursionar en el mundo del Big Data. Los requisitos para los participantes son:

  • Conocimiento de un lenguaje de programación orientado a objeto.
  • No se requiere conocimiento alguno en Big Data.
  • Valorable el conocimiento en SQL.

Lo que vas a poder hacer luego de finalizar el bootcamp:

Una vez finalizado el bootcamp, los participantes contarán con los conocimientos necesarios para desenvolverse en un equipo orientado a desarrollar proyectos de Big Data. Ellos podrán:

  • Conocer los principios básicos del Big Data
  • Identificar y utilizar tecnologías como Spark, Hive y HDFS en entornos de Big Data
  • Crear flujo de datos (data pipelines) con alto volumen de datos.
  • Manejar archivos dentro del sistema distribuido de archivos de Hadoop.
  • Transformar datos a través de tecnologías de procesamiento distribuido.
  • Desarrollar aplicaciones con PySpark.

Contenido:

Introducción al Mundo del Big Data

  • Introducción Al Mundo del Big Data
  • Tecnologías Utilizadas en el Ecosistema
  • Roles y Puestos de Trabajo
  • Tipos de Datos
  • Flujos de Datos – Data Pipes
  • Cómo atacar un proyecto de Big Data 

Ecosistema Hadoop

  • Hadoop Distributed File System
  • Componentes y usos del HDFS
  • HDFS en línea de comandos

Apache Spark

  • Spark Basics, ¿qué es y por qué se usa?
  • Pyspark: Python + Spark
  • Spark Framework
  • Spark DataFrames
  • Schemas
  • Operaciones Básicas
  • Lectura de fuentes de datos 

Profundizando en Spark

  • Análisis de datos estructurados mediante el uso de los DataFrames
  • Transformaciones y acciones básicas
  • Spark SQL
  • Funciones de Spark SQL
  • Transformaciones avanzadas
  • Agrupaciones y agregaciones
  • Joins
  • Unions

RDD

  • ¿Qué es un RDD?
  • Lectura de Datos no estructurados con RDDs
  • Pair RDDs
  • Funciones Lambda
  • Map Reduce en Spark
  • Fase Map
  • Fase Reduce

Análisis Exploratorio de un Dataset

  • Casos prácticos basados en escenarios reales
  • Herramientas utilizadas en Ecosistemas de Big Data

Solicita más información sin compromiso

Pregunta por nuestros precios especiales para grupos al info@reysantech.com

Preguntas Frecuentes:

Las sesiones se realizarán los días sábados y domingos. Inician a las 8:00 AM y se extienden hasta las 5:00PM. Con un total de 8 horas cada día, el bootcamp es intensivo.

Contando con pausas intermedias de 15 minutos cada dos horas y al medio día contarán con un periodo de una hora para almuerzo.

El bootcamp incluye 16 horas de sesiones en vivo donde contarán con un instructor desginado para atender las consultas y preguntas que surjan en el momento. Acceso a material de estudio en formato digital incluyendo prácticas y casos de uso.

Al finalizar el bootcamp, los participantes podrán acceder a los datos utilizados durante las sesiones y a las soluciones de los ejercicios prácticos que desarrollaremos durante las sesiones en vivo.

Durante el bootcamp, vamos a utilizar herramientas de almacenamiento y procesamiento distribuido como lo son Hadoop y Spark. Las prácticas las desarrollaremos sobre un cluster de Spark montado sobre el servicio de Databricks.

Analizaremos otras tecnologías como lo son Hive y DBFS que complementarán los conocimientos de los participantes durante las sesiones.

Al finalizar, los participantes podrán participar en procesos de selección en puestos de trabajo donde se utilicen las tecnologías de Big Data.

Los puestos más comunes son Ingeniero de Datos, Desarrollador de Big Data, o puestos similares.

Al finalizar otorgamos un certificado de participación a cada participante del bootcamp. El certificado indica que ha pasado por el Programa de Nivel Desarrollador por un periodo de 16 horas.

Primer bootcamp de Big Data Nivel Desarrollador totalmente en español

Solicita más información sin compromiso

Pregunta por nuestros precios especiales para grupos al info@reysantech.com

Te interesa saber más?

Solitica más información