🎓 Выбирайте обучение по отзывам. Мы запустили рейтинг лучших онлайн-школ, чтобы находить качественные курсы стало еще проще. Cмотреть рейтинг

Analytics Engineer (DWH)

Местоположение и тип занятости

Можно удаленно

Компания

Крупнейшая в России Digital Health платформа, объединяющая различные сервисы цифровой медицины

Описание вакансии

СберЗдоровье - аккредитованная IT-компания, крупнейшая в России Digital Health платформа, объединяющая различные сервисы цифровой медицины.

Сервис начал свою работу в 2012 году под брендом DocDoc. Мы помогли миллионам людей получить помощь и продолжаем повышать качество медицинских услуг.

Об IT в цифрах:

3 бизнес-направления;

20+ команд (каждая наша команда кросс-функциональная, 7-12 человек, включает в себя QA, DevOps, аналитиков, архитекторов, Web/Mobile разработчиков и конечно же своего PM);

300+ IT специалистов (devops, manual/auto QA, web/mobile devs, backend devs, аналитики и архитекторы) из 40+ городов;

Кого ищем?

Мы в поиске аналитика-разработчика, который будет заниматься преобразованием сырых данных в удобный формат для продуктовых аналитиков в бизнес слое хранилища и позволит аналитикам сосредоточиться на бизнес-выводах, а команде — повысить качество и производительность аналитической инфраструктуры за счёт стандартизации, ускорения расчётов и улучшения документации.

Cтек: SQL - Trino/Hive/Presto; Dbt; Iceberg; CI/CD настройка пайплайнов для dbt, Superset; Python.

Цели и задачи:

  • Выделение мастер-сущностей из ядра ХД, разработка бизнес-правил дедубликации, унификации, создания золотых записей;
  • Разработка витрин на основе объектов raw data vault на движке Trino + Iceberg;
  • Описание моделей данных в DBT с полнотой тестов и документации;
  • Анализ отчётов Superset: определение популярных дашбордов, восстановление lineage от отчета до источника в STG/MDM, помощь в выстраивании витрин;
  • Написание SQL/Python-скриптов для контроля качества данных, инициировать улучшения качества данных;
  • Документирование и обмен знаниями. Ведение каталога данных, участие в код-ревью и внутренних демо;

Зона ответственности:

  • Разработка слоя мастер-данных (MDM) и витрин Data Mart на основе данных в STG (Data Vault 2.0);
  • Разработка переиспользуемых витрин, покрывающих ключевые аналитические отчёты в Superset;
  • Работа в связке с архитектором, аналитиками, продуктовыми командами бизнеса для унификации сущностей (клиенты, заказы, врачи и др.)

Что надо уметь:

  • Уверенный SQL ( написание сложных запросов, понимание того, как работает запрос в БД, как его можно оптимизировать через Explane analyze, как правильно выбрать ключ распределения, минизировать джойны);
  • Python для расчётов;
  • Опыт работы с Data Vault 1.0 / 2.0, понимание основных объектов DV;
  • Опыт построения витрин, применение подходов моделирования измерений и фактов star/snowflake schema;
  • Понимание и использование MDM подходов дедубликации, gold-records, matching, survivorship;
  • Работа с медленно меняющимися данными SCD2, ref;

Что тебе может дать СберЗдоровье:

  • Свободный выбор рабочего формата: удалённый внутри страны или гибридный в Москве;
  • Медицинская программа, включающая телемедицинские консультации, очные приёмы в клиниках, психологов, стоматологию, лабораторные и инструментальные диагностики;
  • Поддерживаем активный образ жизни — выбирай виды спорта по душе (корпоративные занятия сквошем, бегом, футболом в Москве и компенсация твоего спортивного абонемента);
  • Ипотечные программы (IT-ипотека или льготная ипотека для сотрудников Сбера);
  • Индивидуальный план развития каждому, он поможет тебе всегда видеть вектор своего пути;
  • Компенсация профильного обучения и конференций;
  • Ветеринары для ваших домашних животных 24/7

Приятное дополнение:

  • Мы общаемся на “ты”, не любим бюрократию и всегда помогаем друг другу.
  • Devrel и коммьюнити: поможем начать вести блог и делиться своим опытом, выступать на митапах и быть лидером сообщества компетенций;