Главный эксперт разработки бизнес-процессов BPM
- Нур-Султан
- Постоянная работа
- Полная занятость
- Архитектура и устойчивость эксплуатации
- Участие в анализе архитектуры low-code BPM-платформы и микросервисных решений с точки зрения эксплуатации, отказоустойчивости и сопровождаемости;
- Формирование и предоставление рекомендаций по улучшению архитектуры сервисов, интеграций и инфраструктурных решений с целью повышения стабильности и масштабируемости;
- Анализ архитектурных решений при внедрении новых компонентов, интеграций и изменений в продуктивной среде;
- Участие в разборе архитектурных причин инцидентов и деградаций производительности;
- Оценка технических и операционных рисков при изменениях архитектуры и конфигураций
- Содействие внедрению best practices эксплуатации, мониторинга и логирования распределённых систем.
- Сопровождение, поддержка и эксплуатация
- Обеспечение сопровождения тестовых и продуктивных сред low-code BPM-платформы;
- Анализ и устранение сложных и критических инцидентов 3-й линии поддержки в микросервисной архитектуре;
- Диагностика проблем на уровне:
- backend-сервисов (Java / Spring Boot),
- интеграций и API,
- очередей сообщений (Kafka),
- баз данных (PostgreSQL, Oracle),
- поисковых систем (Elasticsearch);
- Анализ логов и трассировок с использованием централизованных систем логирования (ELK);
- Анализ метрик, алертов и показателей производительности в системах мониторинга (Grafana);
- Участие в релизах, деплое и сопровождении изменений в рамках CI/CD и GitOps-процессов (ArgoCD);
- Контроль стабильности сервисов в Kubernetes-среде, анализ состояния ресурсов и окружений;
- Проведение анализа первопричин инцидентов (RCA), подготовка корректирующих и предупреждающих мероприятий;
- Взаимодействие с командами разработки, DevOps и 1–2 линией поддержки для устранения системных проблем;
- Участие в стабилизации платформы после релизов и внедрений.
- Взаимодействие и документация
- Консультирование и методологическая поддержка специалистов 1–2 линий и менее опытных инженеров 3-й линии поддержки;
- Участие в обучающих сессиях, разборе инцидентов и внутрикомандных технических встречах;
- Взаимодействие с архитекторами, разработчиками, DevOps и другими подразделениями для обеспечения устойчивой эксплуатации платформы;
- Взаимодействие с подразделениями информационной безопасности по вопросам эксплуатации и устранения уязвимостей;
- Подготовка и актуализация эксплуатационной документации, инструкций и runbook’ов;
- Ведение и развитие базы знаний по инцидентам, типовым проблемам и решениям;
- Документирование причин инцидентов, технических ограничений и рекомендаций по улучшению эксплуатации;
- Участие в формировании стандартов и регламентов поддержки и сопровождения.
- Знание основных бизнес-процессов Банка и автоматизированных систем, обеспечивающих их поддержку;
- Знание принципов микросервисной архитектуры, межсервисного взаимодействия и интеграции с внутренними и внешними системами;
- Знание архитектуры low-code BPM-платформ и принципов исполнения бизнес-процессов;
- Знание принципов работы распределённых систем, очередей сообщений и асинхронных взаимодействий (Kafka);
- Знание принципов работы и эксплуатации контейнеризированных приложений и оркестрации (Kubernetes);
- Знание принципов мониторинга, логирования и трассировки распределённых систем (ELK, Grafana);
- Знание принципов построения и анализа метрик производительности и доступности сервисов;
- Знание принципов CI/CD и GitOps-подходов (в том числе ArgoCD);
- Знание принципов безопасного хранения и использования секретов (Vault);
- Знание принципов работы реляционных баз данных (PostgreSQL, Oracle), включая транзакционность, блокировки и производительность;
- Знание принципов работы поисковых систем и индексации данных (Elasticsearch);
- Знание архитектуры и принципов работы backend-приложений на базе Java / Spring Boot на уровне чтения и анализа кода;
- Знание основ сетевого взаимодействия, протоколов и API (REST);
- Знание методологий анализа причин инцидентов (Root Cause Analysis).
- Умение работать с логами распределённых систем, выявлять причинно-следственные связи и системные проблемы;
- Умение анализировать метрики и алерты, выявлять деградации производительности и потенциальные риски;
- Умение диагностировать проблемы в микросервисной архитектуре, включая взаимодействие сервисов, очередей сообщений и баз данных;
- Умение читать и анализировать код backend-приложений (Java / Spring Boot) для понимания логики ошибок и поведения системы;
- Умение работать с Kubernetes-окружением (анализ состояния сервисов, ресурсов, конфигураций);
- Умение анализировать и сопровождать процессы CI/CD и деплоя приложений;
- Умение работать с SQL-запросами и анализировать проблемы производительности баз данных.
HeadHunter