11.01.2023 09:34
Data Engineer (Hadoop, PySpark)
11.01.2023 09:34
Сервис пакетной загрузки данных ETL4Hadoop – это инструмент репликации данных источников из РСУБД (PostgreSQL, Oracle, MS SQL Server) и файлов (csv, xml, json) в КАП (DataLake Сбербанка на основе Hadoop). Стек технологий: Python, PySpark, Ozzie, SQL Обязанности: Разработка и проектирование новой функциональности Написание/расширение автотестов по реализованной функциональности Оптимизация и настройка производительности Анализ и исправление дефектов Хорошая коммуникабельность Требования: Опыт разработки на Python и PySpark не менее 3 лет Опыт работы с DevOps инструментами (Jira, Jenkins, Ansible, Git и пр.) Опыт работы с реляционными СУБД (PostgreSQL, Oracle, MS SQL) Хорошее знание SQL, навыки оптимизации запросов Навыки работы с Unix shell, системами версионирования кода Наличие проектного опыта работы с экосистемой Hadoop (HDFS, Hive, Scoop, Oozie) Фундаментальные знания принципов построения распределенных систем хранения и обработки данных Хорошая коммуникабельность Условия: Бесплатный фитнес-зал в БЦ Профессиональное обучение, семинары, тренинги, конференции, корпоративная библиотека ДМС, страхование жизни Самые инновационные, амбициозные проекты и задачи Свободный дресс-код Льготные кредиты и корпоративные скидки Конкурентная компенсация (оклад и премии по результатам деятельности)
Адрес
Москва
Похожие вакансии
По договоренности
11.01.2023 09:34
Сервис пакетной загрузки данных ETL4Hadoop – это инструмент репликации данных источников из РСУБД (PostgreSQL, Oracle, MS SQL Server) и файлов ...