15.09.2022 18:24
Data scientist (SberData)
15.09.2022 18:24
компания "сбербанк" в sberdata мы создаем централизованное хранилище данных всего сбера. это более 350 источников данных и 100+ пб информации, заказ и получение данных за 15 минут и современный технологический стек работы с данными, включая собственные сборки субд на базе hadoop и greenplum. в настоящий момент в поисках data scientist в отдел исследования данных департамента sberdata. чем занимается команда: внедряет машинное обучение в процессах блока технологий. реализуем проекты в абсолютно разных направлениях, например: 1. выявление аномалий в поведении платформе hadoop, ipa, kerberos 2. прогнозирование и оптимизация сроков предоставления доступа к данным 3. автоматизация ручных проверок документов 4. оценка используемых ресурсов парком “машин” в 300 тысяч единиц на горизонт 30 дней 5. генерация синтетических данных по готовому образу. прямо сейчас сконцентрированы на следующих активностях: 1. прогнозирование потребляемых ресурсов ас банка 2. прогнозирование потребляемых ресурсов yarn очередями hadoop кластера 3. прогнозирование роста hadoop кластера; обязанности обязанности предполагают участие в проектах на всех стадиях от начала до конца: - общение с бизнес-заказчиками: выявление и формализация их потребностей, анализ пригодности данных для моделирования, определение целевых метрик - формирование и проверка ml-гипотез с умением обосновать свой выбор, разработка решения - организация и проведение пилотов, оценка бизнес-эффекта - презентация результатов работы бизнесу - внедрение и сопровождение моделей. требования от кандидата мы ожидаем: - профильное образование - понимание базового машинного обучения и прикладной статистики - уверенное владение python (в том числе базовыми пакетами для анализа данных: scikit-learn, pandas, numpy) - умение писать код и разбираться в чужом - умение быстро погружаться в новую тему, искать правильные статьи и open-source решения. будет плюсом: - промышленный опыт в области анализа данных и машинного обучения - dl (pytorch, tensorflow) в прикладных задачах cv, nlp - hadoop, spark, hive - git, docker - опыт работы с бд (teradata, oracle, ms sql, postgresql). условия гибкий график для оптимального баланса работы и личной жизни бц чайка плаза 10, м. нагатинская/тульская/верхние котлы бесплатный фитнес-зал в бц профессиональное обучение, семинары, тренинги, конференции, корпоративная библиотека дмс, страхование жизни свободный дресс-код льготные кредиты и корпоративные скидки конкурентная компенсация (премии по результатам деятельности).
Адрес
Москва
Похожие вакансии
По договоренности
15.09.2022 18:24
компания "сбербанк" в sberdata мы создаем централизованное хранилище данных всего сбера. это более 350 источников данных и 100+ пб информации, ...
Партнерские Вакансии
Москва