
Senior Data Scientist
- Алматы
- Постоянная работа
- Полная занятость
- Разработка, валидация и внедрение ML моделей в прод-процессы: скоринг, антифрод, пропенсити/аплифт, churn, лимитирование, коллекшн-стратегии, с регулярным мониторингом и перетренировкой моделей
- Создание и развитие фичей, генерация признаков и агрегатов, в т.ч. по внешним источникам
- Построение и интерпретация A/B тестов и backtesting: дизайн экспериментов, uplift/инкремент, статистическая значимость, стабильность и drift анализ
- Полный цикл данных: определение источников, оценка качества, создание витрин, нормализация/слияние, документация и контроль метрик качества данных
- Продакшен интеграция: проработка процесса, участие в код и дизайн ревью, совместная работа с разработкой, оптимизация стоимости
- Model governance: explainability (SHAP/ICE), модельные карты и отчеты
- Кредитная политика и стратегии принятия решений: настройка decision engine, определение cut off, проектирование multi tier стратегий (одобрение/отклонение/ручная верификация), интеграция внешних данных
- Champion/Challenger подходы: проектирование и управление A/B экспериментами с несколькими моделями в продакшене, shadow режим для тестирования новых решений
- Бизнес взаимодействие: перевод гипотез в постановку ML задач, планирование, защита ресурсов, поддержка команды
- Business impact метрики: % одобрений, loss rate, ROI от внедрения моделей, качество портфеля через 6-12 месяцев
- Операционная эффективность: автоматизация процессов (STP %), снижение manual review, оптимизация ресурсов и затрат
- Ответственность за качество и устойчивость моделей в проде: uplift к бизнес‑метрикам (доля одобрений при стабильном NPL, снижение фрода, рост LTV/конверсии) с прозрачной атрибуцией эффекта
- Регулярные отчеты по стабильности, дрейфу, калибровке и влиянию фичей, план переобучений и A/B‑календарь
- 5+ лет в банке/МФО с фокусом на кредитный риск или смежные области
- Опыт успешного внедрения минимум 2-3 моделей в продакшен с измеримым business impact
- Математика и статистика: регрессии, отбор признаков, калибровка, метрики бинарных/регрессионных моделей, scorecard‑подход. дизайн экспериментов
- ML/DL стек: бустинги (LightGBM/CatBoost/XGBoost), линейные/логистические модели, деревья/RF
- Языки и инструменты: продвинутый Python + экосистема (pandas, numpy, scikit‑learn, shap), SQL для витрин и сложных джоинов, базовые навыки оптимизации кода
- Продакшен и MLOps: мониторинг качества/дрейфа, A/B‑инфраструктура, участие во внедрении и поддержке в продуктиве
- Навыки заказчика/партнера: валидация задач, формулирование KPI/метрик успеха, ясные коммуникации с риск/продукт/ИТ
- Четкая постановка задач, код‑ревью, поддержка и развитие команды, ответственность за результат и сроки
- Процессное мышление: понимание end to end кредитных процессов от заявки до взыскания, интеграция моделей в бизнес workflow
- Бизнес‑ориентация: умение объяснять сложное простым языком и защищать решения на обсуждениях
- Профессиональный менеджмент и команда, готовая делиться опытом, идеями и вдохновлять;
- Оформление в соответствии с ТК РК;
- График работы: 5/2 09:00-18:00;
- Отпуск 28 дней, 8 оплачиваемых выходных;
- ДМС или 1FIT на выбор;
- Обучение и повышение квалификации за счет компании.
HeadHunter