Ingeniero Senior de Software de Datos (AWS/Databricks/PySpark)
Como parte de este proyecto, nuestros equipos de Datos están trabajando en migrar los pipelines de Productos de Datos desde cargas de trabajo de Oracle a Databricks. En EPAM, entrarás en un ambiente de trabajo dinámico y ágil, ayudando a clientes Fortune 1000 mientras te adhieres a las mejores prácticas de ingeniería.Si eres una persona profesional y dinámica con pasión por la transformación de datos y la innovación, únete a nosotros en Madrid, Málaga o remotamente por toda España para estar a la vanguardia de la innovación con EPAM.
ResponsabilidadesDiseñar, desarrollar, monitorear y operar pipelines de datosIntegrar conjuntos de datos de alta calidad para casos de uso analíticoHabilitar a otros equipos de datos para seguir los estándares del clientePruebas (preparación y ejecución)Mantenimiento de pipelines de datos existentes incl.alertas, corrección de errores, etcRequisitosMás de 3 años de experiencia práctica en Databricks o herramientas ETL similaresFuerte comprensión de Apache Spark, PySpark y PythonExperiencia comprobada en AWS Glue y Amazon S3 para almacenamiento y procesamiento de datos eficienteExperiencia en el uso de GitHub y pipelines CI/CD para control de versiones e integración continuaCompetencia en MicroStrategy o herramientas analíticas similares para visualización de datos y reportesSería ideal tenerHabilidades avanzadas en Databricks como delta, configuración de clusters o mlflowExperiencia integrando fuentes como sitios web, Exasol, APIs REST, SAP, BigQuery, GSheets, Salesforce, Jedox y másCalidad de DatosApache NiFiJavaOfrecemosSeguro médico privadoPlan de Compra de Acciones para Empleadxs de EPAMBaja por enfermedad pagada al 100%Programa de ReferenciadosCertificación profesionalCursos de idiomas