Data analyst
- Алматы
- Постоянная работа
- Полная занятость
- Формулировать и решать прикладные задачи на табличных данных
- Извлекать признаки из неструктурированных и событийных данных (в т.ч. JSON, логов, временных рядов)
- Проводить исследовательский анализ, находить устойчивые зависимости и проверять гипотезы о поведении объектов
- Обучать и валидировать ML-модели (основной стек - градиентные бустинги)
- Проектировать стековые признаки, создавать агрегаты, лаги, rolling-метрики и пр.
- Развивать внутреннюю инфраструктуру - от подготовки данных до автоматизации пайплайнов
- Участвовать в разработке библиотек и шаблонов для фичей, метрик и моделей
- Знание SQL и опыт интеграции с аналитическими БД (Postgres, Starrocks и т.п.)
- Уверенные знания Python и библиотек для анализа данных (pandas, numpy, scikit-learn и др.)
- Хорошее знание и понимание Excel
- Глубокое понимание работы с табличными моделями (бустинговые модели, временные ряды и т.п.)
- Опыт извлечения и трансформации данных из вложенных структур (например, JSON)
- Навыки проектирования признаков и понимание их влияния на модель
- Понимание принципов построения устойчивых и воспроизводимых аналитических решений
- Аккуратность в работе с кодом и внимательность к деталям
- Опыт в построении и поддержке аналитических пайплайнов (Airflow или прочие интсрументы окрестрации)
- Знание подходов к организации слоёв данных
- Опыт построения собственных пайплайнов из "сырого" JSON в продакшн-фреймы
- Навыки контейнеризации, скриптов и CLI-инструментов (Docker, argparse и пр.)
- Участие в ML/DS-проектах с end-to-end ответственностью: от данных до внедрения
- Владение английским на уровне чтения технической документации и работы с научными статьями
HeadHunter