Старший инженер по мониторингу [Senior]
Требования
Местоположение и тип занятости
Компания
Описание вакансии
deeplay — продуктовая ИТ-компания. Мы создаём системы и решения в сфере интеллектуальных игр.
Мы ценим идейных людей, которых заряжают нестандартные задачи и профессиональные вызовы. Тех, кто любит экспериментировать, находить уникальные решения и всегда ориентируется на результат. Если тебе близок такой подход, будем рады видеть тебя среди наших тиммейтов!
Сейчас нам нужен Старший инженер по мониторингу, который будет вносить свой вклад в развитие продуктов компании, сможет поддерживать открытое общение и дружескую атмосферу.
- Настроили процессы технического оснащения, чтобы можно было рассчитывать на нашу помощь в подготовке техники для работы, где бы ты ни находился.
- Выстроили систему взаимодействия — никаких бесконечных чатов в ТГ. Работаем через онлайн-сервис управления проектами и корпоративный мессенджер с настроенной картой каналов.
- Организовываем рабочие процессы с учётом часовых поясов, время для регулярных командных встреч подбирается максимально удобно для всех.
- Помогаем сохранять контекст и знакомиться с коллегами из других отделов — регулярно проводим общие информационные и развлекательные онлайн-мероприятия, а также командные встречи с выездами в российские города и за границу.
Основные задачи будущего тиммейта:
- Проектирование архитектуры мониторинга — создание отказоустойчивых, масштабируемых решений на базе Zabbix, Grafana, VictoriaMetrics;
- Разработка и сопровождение мониторинга (кастомные шаблоны, плагины, дашборды, экспортёры, метрики);
- Автоматизация процессов: внедрение Ansible, CI/CD, скриптов и утилит для развертывания и сопровождения систем мониторинга;
- Интеграция с инфраструктурой: настройка сбора метрик и алертов с серверов, сетевых устройств, приложений, баз данных, почтовых и прокси-сервисов;
- Управление визуализацией и алертингом: создание стандартов, кастомных визуализаций, дашбордов и алертов под задачи команд и бизнеса;
- Диагностика и оптимизация: устранение инцидентов, настройка производительности, работа с хранилищем метрик и журналами;
- Сопровождение и развитие инструментов: обновление систем мониторинга, контейнеризация сервисов, настройка резервного копирования и безопасности;
- Взаимодействие со смежными командами по вопросам наблюдаемости, документирование и стандартизация: описание архитектуры, автоматизации, регламентов мониторинга.
Для реализации этих задач потребуется:
- Опыт работы работы с системами мониторинга от 5 лет:
- Zabbix (проектирование отказоустойчивых кластеров, разработка шаблонов и LLD, автоматизация через API/CLI, интеграция с внешними системами);
- Grafana (построение HA-архитектуры, Dashboards-as-Code, разработка визуализаций и плагинов, стандартизация алертов и дашбордов);
- VictoriaMetrics (проектирование кластеров, оптимизация хранения и производительности, создание экспортёров, интеграции через API).
- Опыт администрирования Linux (управление службами, сетью, логами, безопасность, диагностика и тюнинг ОС);
- Скриптинг: Bash и PowerShell (автоматизация под Linux и Windows, включая инфраструктуру AD и Exchange, разработка CI/CD-пайплайнов и проверок доступности);
- Уверенные навыки работы с Ansible - разработка плейбуков и ролей, автоматизация настройки серверов под разные ОС, стандартизация и переиспользуемость решений;
- Опыт с Docker / Compose;
- Знание Go, чтение и написание утилит, экспортёров и парсеров на базе open-source мониторинга;
- Администрирование PostgreSQL (резервное копирование, мониторинг и оптимизация производительности, базовое администрирование);
- Опыт настройки балансировки и прокси (Nginx / HAProxy / Reverse Proxy) - TLS-терминация, SSL offloading, интеграция с backend-сервисами, мониторинг доступности.
Будет плюсом:
- Опыт построения высоконагруженных систем мониторинга;
- Знание Prometheus, Alertmanager;
- Опыт построения CMDB и интеграции с системами мониторинга;
- Опыт работы с почтовыми серверами Microsoft Exchange.
Мы предлагаем:
- Гибкий подход к формату и месту работы — удаленный формат в диапазоне +-2 часа от Омска/Новосбирска, или гибридный/офисный формат в комфортных офисах в этих городах.
- Регулярные офлайн-встречи для распределённых команд, чтобы ближе знакомиться со тиммейтами.
- Корпоративную культуру: общаемся на равных, поддерживаем друг друга, ценим обратную связь и инициативность, легкость общения и юмор;
- Возможность влиять на процессы: если увидишь потенциал для улучшения, сможешь воплотить свои идеи, повысить эффективность и качество продукта;
- Стать частью команды, которая находит драйв в своих задачах и стремится к технологическому лидерству в индустрии;
- Доступность руководства компании и открытую внутреннюю политику;
- Все преимущества аккредитованной IT-компании;
- Официальное трудоустройство, оплата отпуска и больничного по ТК РФ.
Обучение и развитие:
- Оценка компетенций и составление индивидуального плана для прокачки твоих скилов.
- Ежегодный перфоманс ревью с полезными рекомендациями от команды и возможностью увидеть свои достижения глазами тиммейтов.
- Частичная компенсация затрат на обучение.
- Изучение английского языка для всех желающих 2 раза в неделю.
- Доступ к корпоративной офлайн и онлайн-библиотеке.
- Регулярные шаринги знаний, хакатоны, митапы, трансляции, турниры.
Корпоративная жизнь:
- Открыто делимся новостями о развитии компании: регулярно проводим интервью и внутренние бизнес-мероприятия с руководителями и экспертами deeplay.
- Поддерживаем актуальное внутреннее информирование: систематически публикуем дайджесты о стратегии, продуктах и технологиях компании.
- Организовываем локальные тимбилдинги для команд.
- Развиваем тематические комьюнити: проводим киберспортивные турниры, участвуем в квизах/мозгобойнях, спортивных челленджах.
- Оказываем спонсорскую помощь профильным факультетам, выступаем с технической экспертизой на внешних мероприятиях, создаём собственные образовательные проекты.
P.S.: Хоть мы и постарались вместить в описание больше деталей, но нам все еще есть что рассказать. Будем рады познакомиться ;)