Procesamiento de Big Data con PySpark y Cloud Platforms

Bs.680,00

El curso comienza el 25 de febrero

SKU: B2C-V-26-02-13 Categorías: ,

Detalles y Beneficios del curso

Descripción del curso

Contenido del curso

Unidad 1: Introducción a Big Data y arquitecturas distribuidas

  • Concepto de Big Data: volumen, velocidad, variedad, veracidad y valor.
  • Diferencias entre procesamiento tradicional y procesamiento distribuido.
  • Casos de uso de Big Data en entornos empresariales e industriales.
  • Introducción a arquitecturas modernas: Data Warehouse vs. Data Lake.
  • Rol de Spark dentro del ecosistema Big Data.

Unidad 2: Fundamentos de Apache Spark y PySpark

  • ¿Qué es Apache Spark y por qué se utiliza?
  • Arquitectura de Spark: driver, executors y cluster manager.
  • PySpark como interfaz de Spark para Python.
  • Modos de ejecución: local vs. cluster.
  • Conceptos clave: paralelismo, particiones y tolerancia a fallos.

Unidad 3: Estructuras de datos en PySpark

  • Conceptos y casos de uso de RDDs y DataFrames.
  • Comparación técnica y creación desde diversas fuentes.
  • Inspección y exploración inicial de datos masivos.

Unidad 4: Transformaciones y acciones en PySpark

  • Transformaciones comunes: select, filter, withColumn y groupBy.
  • Acciones principales: count, show, collect y take.
  • Operaciones de agregación y manejo de grandes volúmenes de datos.
  • Optimización básica de consultas en Spark.
  • Buenas prácticas para escribir código PySpark eficiente.

Unidad 5: Integración con almacenamiento y plataformas cloud

  • Gestión de Data Lakes y almacenamiento distribuido.
  • Lectura y escritura optimizada en formatos CSV y Parquet.
  • Integración de PySpark con servicios de almacenamiento en la nube.
  • Fundamentos de entornos Cloud, escalabilidad y seguridad de datos.

Unidad 6: Casos prácticos aplicados a entornos empresariales

  • Procesamiento y limpieza de datos transaccionales a gran escala.
  • Transformación de datos crudos (Data Wrangling) en tablas analíticas.
  • Construcción de pipelines de datos eficientes con PySpark.
  • Resolución de escenarios reales y recomendaciones de implementación.

Desarrollar competencias prácticas para el procesamiento, transformación y análisis de grandes volúmenes de datos utilizando PySpark, integrándolo con plataformas cloud para la resolución de escenarios empresariales reales.

  • Comprender los fundamentos del ecosistema Big Data y la arquitectura distribuida de Apache Spark.
  • Manipular y transformar datos estructurados mediante el uso eficiente de la interfaz PySpark.
  • Aplicar operaciones distribuidas optimizadas para el procesamiento de grandes volúmenes de información.
  • Integrar flujos de trabajo de PySpark con entornos cloud y arquitecturas de data lake.
  • Resolver casos de uso reales aplicados a entornos industriales y estratégicos.

Este programa proporciona las herramientas fundamentales para dominar el procesamiento de datos a gran escala utilizando PySpark. El contenido abarca desde la arquitectura distribuida de Apache Spark hasta la implementación de transformaciones complejas y la integración con entornos cloud y data lakes. Al finalizar, el participante será capaz de construir pipelines de datos eficientes, optimizar consultas sobre volúmenes masivos de información y resolver desafíos técnicos reales mediante el uso de infraestructuras modernas de Big Data.

Profesionales de TI, analistas, científicos e ingenieros de datos, así como profesionales de áreas industriales y desarrolladores interesados en especializarse en el procesamiento de Big Data y arquitecturas distribuidas.

Calendario del curso

Febrero 2026
L M M J V S D

Descubra cómo Wibel puede avanzar en sus objetivos empresariales

Póngase en contacto con el equipo de Wibel. Permítanos ayudarle a alcanzar sus objetivos.

Instructor

Precios facturados

Precio normal:

Bs. 680

Preventa, sólo hasta el 18 de febrero

Bs. 630

Precio corporativo, para inscritos en grupos de 3 o +

Bs. 580

DESCUENTO DEL 20% PARA AFILIADOS DE LA S.I.B. SANTA CRUZ

Métodos de pago

Transferencia QR

    Instrucciones

  1. Ingresar a tu banca móvil, sección de pago con QR.
  2. Escanea el código QR que se muestra en pantalla.
  3. ¡Listo! Recibirás una notificación de pago.
Código QR

Banco Económico S.A.
Razón social: BELCAS S.R.L.
NIT: 375983023
Cuenta Corriente: 1041416494

Realiza tu pago directamente en nuestra cuenta bancaria. Utilice su número de pedido como referencia de pago. Tu pedido no se procesara hasta que se haya recibido el importe a nuestra cuenta.

Nuestros detalles bancarios

  • Banco: Banco Económico S.A.
  • Banco: Banco Union S.A
  • Banco: Tigo Money

Sin existencias

Ubicación de la empresa

Pasos para la Inscripción

Inscribirte en nuestro curso es un proceso sencillo y rápido.

A continuación, te presentamos los pasos a seguir:
Elige tu curso: Regístrate en el curso de tu preferencia a través de nuestra página web o contacta a nuestro asesor comercial vía WhatsApp.
Efectúa el pago: Efectúa el pago utilizando tu método preferido, ya sea mediante QR, transferencia bancaria o tarjeta bancaria (desde nuestra web).
Completa tu inscripción: Una vez inscrito, nuestro asesor te contactará y te solicitará algunos
datos adicionales para finalizar tu registro.
Únete al grupo: Serás añadido a un grupo de WhatsApp junto al docente para la coordinación de las clases y recibirás acceso a la nube con todos los archivos del curso.

¡Comienza tu formación con nosotros hoy mismo!

Sin existencias

CURSOS RELACIONADOS