08.07.2022 15:36
Site Reliability Engineer/SRE (в биллинг)
08.07.2022 15:36
Обязанности: Строгая оценка систем на соответствие Стандартам и Требованиям, контроль устранения недоработок, в том числе внесение изменений в системах находящихся в промышленной эксплуатации Контроль выпуска в prod нового "кода", весь деплой должен быть покрыт тестами с возможностью отката всех внесенных изменений Контроль инцидент менеджмента (включая участие в устранении аварий, стабилизации систем после дизастера), составление постмортемов (выполнение действий запланированных в рамках постмортема и направленных на предотвращение появления повторных инцидентов) Контроль и соблюдение SLI, SLO, SLA предъявляемых к системам Контроль мониторинга, алертинга, дашбордов Контроль и анализ планов резервного копирования, их доработка Контроль уровня покрытия систем планом DRP, проведение DR тестов Контроль процессов обновления ПО, добавления ресурсов, вывода из эксплуатации Согласование изменений систем (изменение архитектуры, дизайна, масштабирование), оценка рисков и целесообразности Совместно с командой разработки управлять Error Budget Требования: Опыт эксплуатации Linux систем от 5 лет - Ubuntu/Debian, CentOS/RHEL Хорошее понимание устройства ядра Linux, его модулей, понимание процессов управления потоками, задачами, памятью. Опыт работы с различными системами виртуализации – VMware ESXi, KVM, Xen. Практические навыки проектирования высоко-нагруженных, масштабируемых и отказоустойчивых сервисов (монолитные или микросервисные). Знание Python/Go на уровне Junior+ Знание и практический опыт использования Terraform, Ansible/Puppet/Chef Глубокие знания контейнеризации (Docker) и опыт работы с k8s Общие знания сетевых технологий. Знание и практический опыт эксплуатации высоконагруженных и распределенных SQL/NoSQL DB Знание и практический опыт работы с Git в связке с любым CI/CD Понимание принципов IaC Условия: Конкурентная заработная плата; Трудоустройство согласно ТК РФ; Корпоративная рабочая техника; ДМС, страхование от несчастных случаев и тяжелых заболеваний; Доступ к различным курсам обучения по развитию hard и soft навыков; Регулярные командные мероприятия.
Адрес
Москва
Похожие вакансии
По договоренности
08.07.2022 15:36
Обязанности: Строгая оценка систем на соответствие Стандартам и Требованиям, контроль устранения недоработок, в том числе внесение изменений в системах находящихся ...