11.01.2023 07:52

Data quality engineer

По договоренности
11.01.2023 07:52
ПРОЕКТ: Миграция данных из различных источников на Hadoop для одной из ведущих российских девелоперских компаний полного цикла, реализующих масштабные объекты недвижимости. На проекте данные загружаются из различных источников – MS SQL Server, REST API, Kafka и т.д. Задача DQ-инженера - проверка качества загружаемых данных, разработка стандартов загрузки, проверка полноты загружаемых данных. Данные проходят обработку, затем из них строятся витрины для бизнес-процессов. Для этого разрабатывается уникальный ID на основе персональных данных. Необходимо выстроить проверки (на полноту, на актуальность, на уникальность, на форматы и т.п.) для корректности данных через SQL-запросы и регулярные выражения. СТЭК: PostgreSQL; MS SQL Server: Airflow; Debezium; DataHub; JupiterHub; Python; HDFS; HUE; Hive; Impala; HBase; Kafka etc. ЧЕМ ТЫ БУДЕШЬ ЗАНИМАТЬСЯ: Выстраивать методологию тестирования данных на проекте; Проводить анализ загруженных данных/ витрин на предмет качества; На основе проведенного анализа составлять тест кейсы для дальнейшего написания DQ; Составлять SQL-запросы различного уровня сложности; Тестировать загрузку данных посредством ETL- инструментов. ТЫ НАШ ИДЕАЛЬНЫЙ КАНДИДАТ, ЕСЛИ У ТЕБЯ ЕСТЬ: Уверенные знания SQL; Начальные знания Python; Опыт работы с различными СУБД; Опыт составления чек-листов, тест-кейсов, тест-планов и др. документации тестирования. СОВСЕМ КРУТО, ЕСЛИ: Ты знаешь технологии BigData и экосистемы Hadoop (HDFS, HUE, Hive, Impala, HBase, Kafka etc); Ты работал с ETL- инструментами; Ты знаком с основами бухгалтерского учета. У НАС ТЫ СМОЖЕШЬ НАЙТИ: Прозрачную системы карьерного развития в компании; Персонального наставника с первого дня работы; Возможность развития личной экспертизы и экспертизы компании; Собственную платформу внутренних и внешних образовательных программ; Возможность пройти сертификацию; Возможность участия в обучении, конференциях, митапах; Неповторимую корпоративную культуру компании. Мы ищем кандидата без привязки к локации. Офисы компании находятся в городах: МОСКВА, САНКТ-ПЕТЕРБУРГ, НИЖНИЙ НОВГОРОД, САРАТОВ, ВОРОНЕЖ, ПЕНЗА.

Адрес

Санкт-Петербург

Похожие вакансии

По договоренности
11.01.2023 07:52
ПРОЕКТ: Миграция данных из различных источников на Hadoop для одной из ведущих российских девелоперских компаний полного цикла, реализующих масштабные объекты ...
Неофлекс
Санкт-Петербург
По договоренности
18.11.2022 05:20
компания "неофлекс" проект: миграция данных из различных источников на hadoop для одной из ведущих российских девелоперских компаний полного цикла, реализующих ...
Партнерские Вакансии
Санкт-Петербург
По договоренности
02.06.2022 01:03
компания "ак барс банк" обязанности: участие в проектных работах по развитию инструмента mdm (master data management) системы ataccama, которая используется ...
Партнерские Вакансии
Казань
По договоренности
30.04.2022 04:47
компания "hiqo solutions" hiqo solutions is growing the team, and looking for a data quality engineer. what we expect you ...
Партнерские Вакансии
Грузия Тбилиси

Новости

Смотрите также вакансии