
Data Engineer/Architect AWS Glue-EMR Expert
at Capgemini
Posted 19 hours ago
No clicks
- Compensation
- Not specified
- City
- Madrid
- Country
- Spain
Currency: Not specified
Design and build ETL transformation pipelines in AWS Glue (PySpark/Spark) and/or Amazon EMR (Spark) to migrate ETL workloads to a cloud-native AWS stack. Participate in technical assessments of workflows, complexity, dependencies, risks, and provide recommendations for target architectures. Define and implement orchestration and scheduling with AWS services (e.g., Step Functions vs Airflow); ensure data quality, monitoring, security baseline, and a robust handover to application teams.
Elegir Capgemini significa elegir una empresa donde tendrás la libertad de diseñar tu carrera profesional como desees, con el respaldo y la inspiración de una comunidad colaborativa de colegas en todo el mundo. Aquí podrás reinventar lo que es posible. Únete a nosotros y ayuda a las organizaciones líderes en el mundo a descubrir el valor de la tecnología y construir un mundo más sostenible e inclusivo.
Acerca del rol
¿Te apetece sumarte al equipo y participar en un programa de modernización y migración ETL hacia un stack cloud-native en AWS? Tendrías la oportunidad de rodearte de un equipo internacional trabajando en poner foco en data processing/transformations, asegurando paridad funcional, observabilidad, seguridad baseline y un handover robusto a equipos de aplicación.
¿Qué harás en el proyecto?
- -Diseñar y construir pipelines de transformación en AWS Glue (PySpark / Spark) y/o Amazon EMR (Spark) para migraciones ETL.
- Participar en el assessment técnico: análisis de workflows, complejidad, dependencias, riesgos y recomendaciones de target.
- Definir/implementar orquestación y scheduling con servicios AWS (p. ej., comparativas tipo Step Functions vs Airflow según necesidades).
- Asegurar calidad y reconciliación: validación de datos (comparativas origen/destino), evidencias de equivalencia funcional y pruebas de rendimiento.
- Implementar monitorización/alertas y buenas prácticas de operación (logs, troubleshooting, runbooks).
- Aplicar un baseline de seguridad y compliance: cifrado, roles, auditoría, y prácticas alineadas con políticas corporativas.
- Colaborar con perfiles de plataforma y equipos de aplicación en transferencia de conocimiento (paso de ETL “GUI” a enfoque code-centric).
Con respecto a tu perfil.
Para sentirte a gusto en la posición es necesario que puedas desenvolverte bien con:
- Experiencia sólida (senior) en AWS Glue y PySpark/Spark en entornos de datos.
- Experiencia con Amazon EMR (Spark) o ejecución de workloads Spark a escala.
- Experiencia real en migraciones/modernización ETL (idealmente desde herramientas tradicionales hacia AWS).
- Capacidad de diseñar soluciones completas de data processing con componentes de orquestación, operación y costes.
- Buenas habilidades de comunicación (perfil “consultivo” y orientado a decisiones con evidencia).
- Inglés alto (oral y escrito).
Se valorará:
- Experiencia con Data Catalog / lineage / metadata tracking.
- Experiencia con CloudWatch u observabilidad equivalente para pipelines.
- Conocimiento de Informatica (PowerCenter / IICS/IDMC) a nivel de integración o convivencia.
- Experiencia con enfoques de automatización de migración (aceleradores/conversión, frameworks internos, etc.).
- Conocimiento de optimización de costes en entornos serverless / pay-per-use (tuning Spark, particionamiento, etc.)
Valoraremos todas las candidaturas. Contamos con una amplísima oferta formativa. Aunque no tengas el 100% de los conocimientos valorados nos encantará conocerte. Valoramos positivamente disponer del Certificado de Discapacidad.
¿Qué te gustará de trabajar aquí?
- Proyectos internacionales
- Colaboración estrecha con partners tecnológicos.
- Oportunidad de participar activamente como actor clave en preparar a nuestros clientes hacia el data driven.
¿Por qué Capgemini? Nuestros compromisos y prioridades
El grupo Capgemini fomenta una cultura inclusiva en un entorno multicultural y accesible para personas con discapacidad. El Plan de Igualdad y Código Ético garantizan una selección y un desarrollo profesional igualitario dentro de un entorno libre de discriminación por cuestión de etnia, nacionalidad, origen social, edad, orientación sexual, expresión de género, religión o cualquier otra circunstancia personal, física o social.
Capgemini es un socio global en transformación empresarial y tecnológica, que ayuda a las organizaciones a acelerar su doble transición hacia un mundo digital y sostenible, generando un impacto tangible tanto en las empresas como en la sociedad. Somos un grupo responsable y diverso, con 340.000 profesionales en más de 50 países. Con más de 55 años de trayectoria, nuestros clientes confían en Capgemini para aprovechar el valor de la tecnología y cubrir todas sus necesidades de negocio. Ofrecemos soluciones completas que abarcan desde la estrategia y el diseño hasta la ingeniería, impulsadas por nuestras capacidades líderes en inteligencia artificial, IA generativa, cloud y datos, junto con un profundo conocimiento del sector y una sólida red de partners.
MAKE IT REAL. ¡Únete al equipo! www.capgemini.com/es-es

