10.10.2022 10:21
Reliability Lead
10.10.2022 10:21
МТС Digital – сердце цифровой экосистемы МТС. 12 гильдий инженеров, суперкомпьютер, системы видеоаналитики, IoT, собственная лаборатория AI и 20+ петабайт данных. Финтех, стриминг, гейминг, мобильные приложения, облачные сервисы. Каждый день мы работаем над тем, чтобы вывести мобильную и веб-разработку на новый уровень, благодаря сплоченным продуктовым командам и agile методологиям. Сейчас мы в поиске специалиста, чья главная задача помочь нам выстроить и внедрить единые подходы к обеспечению надежности продуктов, сервисов и систем в рамках Экосистемы МТС. Чем предстоит заниматься: Выстраивание единой методологии управления надежностью для Экосистемы МТС, включая подходы к: - определению классов критичности систем и сервисов на основе влияния их простоя на бизнес-процессы Экосистемы;- оценке экономически-обоснованных значений RTO и RPO;- формированию системы продуктовых метрик в части обеспечения надежности;- выстраиванию процессов управления уровнем сервиса на основе SLA/SLO/SLI;- обеспечению непрерывности и доступности критичных для экосистемы систем и сервисов;- управлению критическими событиями в продуктивной среде. Исполнение роли основного стейкхолдера платформы обеспечения эксплуатации экосистемы в части развития и масштабирования решений по мониторингу и управлению Критическими инцидентами и проблемами. Исполнение роли стейкхолдера платформы производственного процесса в части встраивания в процессы разработки и поставки элементов обеспечения надежности. Формирование Центра компетенций по управлению надежностью (методологическое развитие, экспертный консалтинг, обучение, управление бэклогом развития направления) и Центра практик по обеспечению надежности (SRE) (обеспечение масштабирование стандартов в рамках методологии обеспечения надежности, формирование комьюнити экспертов, сертификация экспертов и команды на соответствие стандартам группы, сопровождение «сложных» кейсов и т.д.). Развитие функции Mission Control Center (ситуационного центра) c функциями централизованного мониторинга состояния критических бизнес-сервисов Экосистемы, синхронизации критических изменений в продуктивной среде, координацией устранения критических инцидентов с последующим контролем восстановления сервисов и проведения postmortem анализа. Последующее управление Центром компетенций по управлению надежностью. Что мы ожидаем от тебя: Опыт работы в ИТ от 10 лет. Наличие управленческого опыта (управление командой не менее 10 человек). Отличные коммуникационные навыки. Опыт работы на позиции лидера практики SRE в крупных технологических компаниях. Опыт разработки SLA/SLI/SLO и знание принципов их формирования. Практический опыт локализации проблем и устранения инцидентов в больших и сложных системах. Опыт внедрения практик и инструментов SRE и DevOps. Опыт построения отказоустойчивых распределенных хранилищ на базе Cassandra, Mongo, Postgres, Ignite, Elastic. Опыт встраивания процессов / процедур обеспечения надежности в типовые процессы экплуатационных приложений . Знание принципов работы SCM систем и современных средств мониторинга и автоматизации управления инфраструктурой. Практический опыт внедрения практик и инструментов Capacity Management, Availability Management, Business Continuity Management. Опыт организации построения или управления инфраструктурой отказоустойчивых систем, работающих в режиме 24x7x365 и требующих минимального участия человека. Знание принципов и методов обеспечения качества и надёжности ИТ сервисов. Английский не ниже Intermediate. Что мы предлагаем: Возможность профессионального развития в разных направлениях компании: неограниченный доступ к материалам одного из лучших корпоративных университетов в стране (вебинары, книги, курсы). Возможность реализации инициатив по автоматизации внутренних процессов в программе iDA. Работу в молодой и активной команде: работа в Блоке информационных технологии, это не только личные KPI и результат. Можно делиться знаниями и получать экспертизу от коллег. Волонтерское движение, поддержку хобби и интересов сотрудников, корпоративные конкурсы с возможностью проявить себя. Стабильная заработная плата два раза в месяц + бонусы. Расширенный социальный пакет (ДМС со стоматологией, страхование жизни, страхование при поездках за рубеж и многое другое).
Адрес
Москва
Похожие вакансии
По договоренности
10.10.2022 10:21
МТС Digital – сердце цифровой экосистемы МТС. 12 гильдий инженеров, суперкомпьютер, системы видеоаналитики, IoT, собственная лаборатория AI и 20+ петабайт ...