ML инженер, Data scientist
Yurt Tech
- Нур-Султан
- Постоянная работа
- Полная занятость
- Разработка моделей машинного обучения и глубокого обучения (CV, NLP, Multimodal, VLM).
- Использование фреймворков: PyTorch, TensorFlow, Hugging Face Transformers.
- Тонкая настройка (fine-tuning) готовых моделей на собственных данных.
- Конвертация моделей в ONNX и оптимизация с помощью TensorRT для ускорения инференса.
- Предобработка, очистка и анализ больших объёмов данных.
- Взаимодействие с VectorDB (например, FAISS, Chroma, Weaviate, Pinecone) в задачах RAG.
- Проектирование систем Retrieval-Augmented Generation (RAG).
- Индексация документов, извлечение контекста с помощью embedding-моделей.
- Интеграция с LLM (в том числе через Hugging Face или OpenAI API).
- Построение пайплайнов для чата с документами или внутренней базы знаний.
- Разработка REST API с использованием FastAPI или Flask.
- Контейнеризация моделей и приложений с помощью Docker и Docker + GPU (nvidia-docker).
- Оркестрация и масштабирование через Kubernetes.
- Работа с RabbitMQ для асинхронной очереди задач и микросервисной архитектуры.
- Мониторинг качества и производительности моделей в продакшене (latency, drift, accuracy).
- Логирование, алерты, перезапуск пайплайнов при сбоях.
- Регулярное переобучение и откат моделей при необходимости.
- Совместная работа с DevOps, аналитиками, инженерами и продуктовой командой.
- Участие в код-ревью, проектировании архитектуры решений.
- Поддержка экспериментов с LLM/VLM и их интеграция в реальные продукты.
- Работа в небольшой, но динамичной команде.
- Возможность влиять на архитектуру и развитие проекта.
- Уровень оплаты обсуждается индивидуально исходя из навыков и опыта работы кандидата.
HeadHunter