DevOps / MLOps Engineer (Core Team)

KOZ AI

  • Алматы
  • Постоянная работа
  • Полная занятость
  • 13 д. назад
Мы компания KOZ AI Мы - продуктовая ИИ-компания. Миссия должности:Забрать на себя всю инфраструктуру компании. Выстроить надежный, автоматизированный фундамент (CI/CD, IaC) и обеспечить безопасный деплой тяжелых LLM-решений в закрытых On-Premise контурах наших Enterprise-клиентов.Обязанности:
  • Автоматизация CI/CD: Перевести 100% ручных деплоев на автоматизированные пайплайны. Инфраструктура описана как код (IaC: Terraform, Helm).
  • Разделение сред: Полностью организовать и изолировать рабочие среды: Local, Stage, Prod.
  • MLOps и GPU: Успешно развернуть и оптимизировать (квантование, тензоризация) локальные open-source модели (Llama 3, Mistral) на GPU-серверах (RunPod, AWS, bare-metal заказчика) (опционально - готовы обучить)
  • Observability: Внедрить систему мониторинга и алертинга (Prometheus, Grafana, Loki/ELK) для серверов, API и контроля расхода токенов LLM.
  • Безопасность (Enterprise-grade): Обеспечить соответствие инфраструктуры требованиям ИБ крупных компаний (изоляция данных, закрытые контуры).
  • Data Data & High-load: Поддерживать стабильную работу K8s, Kafka, Redis и заложить архитектуру для Data Lake (Apache Iceberg).
Необходимые компетенции (Technical & Behavioral):
  • Твердая база: Глубокое практическое понимание Linux, Docker и Kubernetes (это фундамент, без него не берем).
  • IaC & CI/CD: Понимание Terraform и Helm. Умение писать пайплайны.
  • Гибридная инфраструктура: Понимание принципов работы Cloud (AWS/GCP/Яндекс) + On-Premise железа.
  • Обучаемость (Learning Agility): Сильный интерес к MLOps, PyTorch, RAG и работе с GPU-кластерами. Мы готовы обучать специфике AI, если у вас есть крепкая DevOps-база.
  • Проактивность: Способность брать ответственность за инфраструктуру целиком, а не ждать прямых указаний по каждой задаче.
Наш стек:
  • Core Infra: Kubernetes, Terraform/Helm, Гибрид Cloud + On-Premise.
  • AI/ML: PyTorch, RAG, локальные LLM, GPU-инфраструктура.
  • Data/Services: Apache Iceberg, Kafka, Redis, FastAPI, Service Mesh.
  • Observability: Prometheus, Grafana, Loki/ELK.
Что Мы предлагаем:
  • График работы: 5/2, Офис / Гибрид, Full-time;
  • Обучение и поддержку для достижения лучших результатов;
  • Официальное трудоустройство;
  • Стабильную заработную плату;
  • Карьерный рост в одной из крупной ИИ-компании.
Прямой путь в Core-команду. Вы будете работать бок о бок с сильными инженерами. При успешном выполнении Outcomes, ваш переход на позицию Senior DevOps/MLOps займет месяцы, а не годы.Разработка программного обеспечения

HeadHunter

Похожие вакансии

  • Middle / Senior ML Engineer

    • Алматы
    Мы Kaspi.kz - крупнейшая технологическая компания в Казахстане, миссия которой - улучшать людям жизнь. Ежемесячно нашим супер приложением пользуются более 14 млн казахстанцев. Се…
    • 12 ч. назад
  • Application Security Engineer (Middle+, Senior)

    • Алматы
    Kaspi.kz — крупнейшая технологическая компания в Казахстане. Ежемесячно нашим суперприложением пользуются более 12 млн казахстанцев. Сейчас мы ищем Application Security Engineer …
    • 12 ч. назад