Site Reliability Engineer (SRE)

Алматы
Постоянная работа
Полная занятость

13 ч. назад

В 2022 году произошла глубокая интеграция Market.kz с Kaspi.kz. Теперь это Объявления на Kaspi.kz — general classified, который стал частью экосистемы Kaspi.kz, которой пользуются 12,5 миллионов казахстанцев в месяц.Благодаря сервису Объявления на Kaspi.kz частные лица и предприниматели могут безопасно и бесплатно продавать, покупать или обменивать товары, предлагать и получать услуги.Мы ищем Site Reliability Engineer в команду Kaspi Работа/Объявления, от вас потребуется отвечать за надежность, производительность и масштабируемость инфраструктуры. Вы будете работать на стыке разработки и эксплуатации, автоматизируя процессы, внедряяОсновные обязанности

Поддержка и развитие production-инфраструктуры на базе Kubernetes
Настройка и оптимизация CI/CD пайплайнов в GitLab
Мониторинг систем с использованием Prometheus, VictoriaMetrics, Grafana
Централизованный сбор и анализ логов через Vector/Elasticsearch/Kibana
Автоматизация рутинных задач с помощью Ansible и bash-скриптов
Участие в расследовании инцидентов и проведении post-mortem анализа
Настройка и поддержка системы алертинга
Документирование инфраструктуры и процессов

Требования
Операционные системы и инструменты:

Уверенное владение основными дистрибутивами Linux, навыки администрирования системы, управления процессами, файловой системой и правами доступа
Умение писать shell-скрипты для автоматизации рутинных задач, понимание синтаксиса и базовых конструкций bash
Понимание принципов работы DNS, диагностировать проблемы с разрешением имен

Контейнеризация и оркестрация:

Умение работать с Docker-контейнерами, создавать Dockerfile, собирать образы и управлять контейнерами в продакшн-окружении
Понимание архитектуры Kubernetes, опыт деплоя и управления приложениями в кластере, знание основных объектов (pods, deployments, services)
Уверенное владение kubectl для управления Kubernetes-кластером, диагностики проблем и работы с ресурсами
Базовые навыки работы с Helm для управления Kubernetes-приложениями, понимание структуры charts и умение устанавливать релизы

CI/CD и автоматизация:

Владение основными командами git (clone, commit, push, pull, merge, branch), понимание workflow и умение работать в команде через систему контроля версий
Опыт настройки и поддержки CI/CD пайплайнов в GitLab, понимание принципов непрерывной интеграции и доставки
Базовые навыки написания Ansible playbooks для автоматизации конфигурирования и управления инфраструктурой

Мониторинг и логирование:

Понимание принципов сбора и хранения метрик в Prometheus, опыт написания PromQL-запросов для анализа данных мониторинга
Умение создавать дашборды для визуализации метрик, настраивать data sources и интерпретировать графики для мониторинга систем в Grafana
Базовые навыки работы с ELK-стеком для централизованного сбора и анализа логов, умение писать простые запросы в Kibana
Опыт настройки alerting rules и уведомлений на основе метрик и логов, понимание принципов эскалации инцидентов

Дополнительные технологии:

Опыт настройки Nginx в качестве веб-сервера и reverse proxy, понимание конфигурации виртуальных хостов и load balancing
Базовые навыки написания SQL-запросов для чтения и анализа данных, понимание принципов работы реляционных баз данных

Программирование:

Понимание на уровне чтения кода одного из языков программирования из списка PHP/Go/Python

Будет плюсом

Опыт работы с HashiCorp Vault для управления секретами, понимание принципов безопасного хранения credentials и токенов
Знакомство с GitOps-подходом и умение настраивать автоматический деплой приложений через ArgoCD
Базовое понимание возможностей применения ИИ-инструментов для автоматизации задач SRE и повышения эффективности работы
Навыки создания инфраструктурных диаграмм и схем с помощью инструментов diagram-as-code (например, Mermaid, PlantUML, D2 Diagrams)
Понимание концепций SLI/SLO/SLA и error budget

Что мы предлагаем

Работу с современным технологическим стеком
Возможность влиять на архитектурные решения
Профессиональное развитие и обучение
Комфортные условия работы

Kaspi.kz

Откликнуться