17.07.2022 00:58

Middle+ Data Scientist в Дзен

По договоренности
17.07.2022 00:58
компания "яндекс" дзен – это контентная платформа, ленту рекомендаций которой ежедневно используют более 20 млн пользователей. думать про счастье пользователей мы уже умеем, однако есть и другая сторона, про которую не рассказывают в классических recsys курсах, – авторы. наша команда сфокусирована на счастье этой менее многочисленной, но ничуть не менее значимой части пользователей платформы. про задачи: 1. первые шаги автора на платформе или exploration аудитории автора с использованием контентной информации. так как статистики для маленьких авторов мало, то и хорошие предсказания для них сделать сложно. в этой задаче предлагается углубиться в алгоритмы оценки похожестей авторов и разработать новые механизмы отбора кандидатов. будем придумывать, как правильно агрегировать контентные эмбединги, чтобы получить репрезентативный эмбединг автора, какие ещё признаки говорят о похожестях авторов и как получить ground-truth в задаче оценки близостей. задача очень важна и с продуктовой точки зрения: решив её, мы поможем автору не фрустрировать на самых сложных первых этапах роста. 2. ⛰️ устойчивый рост автора внутри платформы или exploitation аудитории автора. чем больше автор, тем больше коллаборативной информации о нём мы можем использовать, а значит и тем больше у нас способов искать релевантную для автора аудиторию. делать это мы хотим на всех этапах ранжирования: - оффлайн набор кандидатов: задача отличается от стандартной тем, что количество авторов сильно меньше количества документов, а значит можно использовать отличные от матричной факторизации подходы; - онлайн набор кандидатов: даже если нам удалось найти самого релевантного автора, остаётся вопрос, как выбрать самые подходящие документы (статьи, видосы, короткие форматы) с этого автора; - ранжирование: “растить автора” и “показывать пользователю интересное“ – это разные задачи, поэтому и таргет ранжирования стоит пересмотреть. ту мейк лонг стори шорт, мы транспонируем стандартную задачу рекомендаций и вместо того, чтобы подбирать пользователю документы, хотим подобрать автору его аудиторию. почему дзен: - масштаб : дзен - один из крупнейших по аудитории интернет-сервисов россии: дзеном ежедневно пользуются более 20 миллионов человек; rps рантайма - 20к, а размер дневных логов, на которых мы обучаем модели - около 25 тб - пространство для роста : с ростом сервиса перед нами открываются всё более амбициозные и сложные задачи, до старости крутить один винтик вы точно не будете; - full stack :ml инженеры отвечают за полный цикл задачи, от постановки до обучения модели, внедрения в production и проведения аб-экспериментов; можно прокачаться во всех аспектах промышленного ml. что ожидаем от кандидатов: высшее техническое или математическое образование (слова матстаты, функан и опты должны вызывать у тебя тёплые чувства); опыт написания продакшн кода (язык не принципиален, мы пишем на java и тебя тоже научим ); ‍ уверенное знание алгоритмов и структур данных (прохождения курса макса бабенко не требуем, но приветствуем); ️ понимание, как работают алгоритмы машинного обучения под капотом; знание математической статистики (мы проводим много аб тестов + в некоторых задачах делаем аб тестирование на айтемах или авторах, поэтому владение аппаратом математической статистики очень помогает в работе); опыт решения ml задач (круто, если ты не просто можешь обучить модель, но и задуматься о корректной постановке задачи; опыт в рекомендательных системах не обязателен). что можем дать взамен: премии за хорошую работу; дмс со стоматологией, можно подключать ближайших родственников с большой скидкой; 14 дней больничных в год оплачиваем 100%; компенсация занятий спортом; новое оборудование, дополнительные мониторы; обучение за счет компании; материальная помощь в сложных жизненных ситуациях.

Адрес

Санкт-Петербург

Похожие вакансии

По договоренности
17.07.2022 00:58
компания "яндекс" дзен – это контентная платформа, ленту рекомендаций которой ежедневно используют более 20 млн пользователей. думать про счастье пользователей ...
Партнерские Вакансии
Санкт-Петербург

Новости

Смотрите также вакансии