Middle Data Scientist
Freedom Holding Operations
- Алматы
- Постоянная работа
- Полная занятость
- Разработка и внедрение ML-моделей для решения бизнес-задач компании (регрессия, классификация, рекомендательные системы);
- Проведение полного цикла работы с данными: сбор, очистка, feature engineering, построение pipeline;
- Проектирование и проведение A/B-тестов, анализ результатов экспериментов;
- Выбор и оптимизация метрик качества моделей, настройка гиперпараметров;
- Разработка и поддержка инференса моделей в продакшене (API, скрипты);
- Мониторинг качества работающих моделей, выявление деградации и своевременное переобучение;
- Работа с SQL-запросами для извлечения и анализа данных;
- Визуализация результатов анализа и подготовка презентаций для стейкхолдеров;
- Перевод бизнес-требований в технические задачи Data Science;
- Приоритизация задач в бэклоге, управление сроками и рисками мини-проектов;
- Документирование кода, моделей и процессов;
- Командная работа с аналитиками, инженерами и продакт-менеджерами;
- Поддержка code review и соблюдение best practices разработки.
- Высшее образование (бакалавр/магистр) в области математики, статистики, Computer Science или инженерных специальностей;
- Опыт работы Data Scientist/ML Engineer от 2 лет в продуктовой компании или консалтинге;
- Опыт участия в полном цикле разработки ML-решений: от работы с данными до внедрения модели в продакшен.
- Уверенное владение Python и основными библиотеками: NumPy, pandas, scikit-learn;
- Базовые знания PyTorch или TensorFlow;
- Уверенное владение SQL: написание JOIN, CTE, базовая оптимизация запросов;
- Опыт работы с инструментами визуализации данных (matplotlib, seaborn, plotly);
- Владение Git, написание чистого кода, базовые знания pytest.
- Практический опыт работы с задачами регрессии, классификации, кластеризации;
- Навыки подготовки данных и feature engineering (работа с пропусками, категориальными признаками, масштабирование);
- Опыт тюнинга гиперпараметров (Grid/Random Search, early stopping);
- Понимание принципов A/B-тестирования и основных статистических тестов (t-test, χ²);
- Опыт разработки рекомендательных систем.
- Опыт дизайна экспериментов, проведения статистических тестов и power-анализа;
- Умение работать с продуктовыми метриками (CR, ARPU, LTV, retention);
- Грамотный выбор и интерпретация метрик качества моделей (ROC-AUC, PR-AUC, F1, calibration, uplift).
- Опыт разворачивания моделей в продакшен (скрипты, API на Flask/FastAPI);
- Навыки логирования и базового мониторинга метрик моделей.
- Умение переводить бизнес-задачи в ML-постановки.
- Четкая коммуникация результатов для нетехнических аудиторий.
- Навыки визуального сторителлинга;
- Самостоятельность в ведении задач и управлении мини-проектами;
- Ответственность за сроки и результаты.
- Опыт работы с gradient boosting библиотеками (XGBoost, LightGBM, CatBoost);
- Опыт работы с большими данными (Spark, Dask);
- Знание deep learning архитектур (CNN, RNN, трансформеры);
- Опыт работы с MLflow, DVC, Docker, Airflow/Prefect.
- Профессиональный коллектив;
- Возможность работать над проектами, приносящими пользу для тысяч людей;
- Неограниченный рост;
- Комфортный офис в центре города;
- Скидки на фитнес, обучение английскому языку, подарки на праздники и дни рождения;
- Бонусы и уникальные предложения от компаний холдинга;
- Спонсирование профессионального обучения;
- Насыщенная корпоративная жизнь с выездами на природу, праздничными мероприятиями в офисе, играми и розыгрышами подарков.
HeadHunter