DevOps / MLOps Engineer

Андрей Щеглов

📍 Россия, Санкт-Петербург ⏳ Опыт: 🎂

О себе

Я — DevOps / MLOps инженер с более чем 15-летним опытом работы в IT. Моя главная миссия — проектирование отказоустойчивых инфраструктур и автоматизация процессов, которые помогают бизнесу быстрее доставлять ценность пользователям. Последние 4 года я сфокусирован на MLOps: оптимизирую работу с ML/DL нагрузками, настраиваю GPU-кластеры в Kubernetes и внедряю современные AI-решения (LLM, Whisper, HuggingFace).

Я верю в подход Infrastructure as Code (IaC), принципы DevSecOps и Zero Trust. Для меня важно не просто настроить CI/CD пайплайн или поднять кластер, но и обеспечить его безопасность, наблюдаемость (observability) и масштабируемость. Имею богатый опыт работы как с bare-metal серверами, так и с ведущими облачными провайдерами (AWS, Azure, GCP).

Всегда открыт к сложным инженерным вызовам и готов применять свой опыт для построения надежных и современных IT-систем.

Профессиональные навыки

Оркестрация

KubernetesDockerHelmDocker Compose

CI/CD

GitLab CIGitHub ActionsJenkinsArgoCDGoCD

IaC

TerraformTerragruntAnsibleAWX

Мониторинг

PrometheusGrafanaLokiZabbixVictoria MetricsTelegraf

Базы данных

PostgreSQL (Patroni, Etcd)MongoDBRedisElasticsearchMySQLMSSQL

Облако

AWS (EC2, EKS, S3, VPC, RDS, ALB, EFS)Azure (AKS, VM)GCP

AI/ML

HuggingFace TransformersONNXTorchServevLLMLLM (Mistral, Llama3)LaBSEWhisperOpen WebUI

Безопасность / Балансировка / Прочее

NginxHAProxyTraefikKeycloakLDAPOPAVaultKafkaLinuxPythonBash

Опыт работы

Ведущий DevOps-инженер

БИАТЕХ
Сентябрь 2024 — настоящее время () | Санкт-Петербург
  • Мигрировал GPU-сервисы и legacy-приложения из Docker в Kubernetes, сократив время деплоя на 40%.
  • Настроил пайплайны GitLab CI + ArgoCD и разработал Helm-чарты.
  • Развернул отказоустойчивые кластеры PostgreSQL (Patroni, Etcd) с балансировкой через HAProxy и Kafka.
  • Внедрил стек мониторинга: Prometheus, Grafana, Zabbix.
  • Построил Datalab на базе PostgreSQL, Trino, Iceberg с интеграцией OPA и LDAP/Keycloak.
  • Реализовал AI-Hub (Open WebUI + vLLM + Gravitee + Keycloak) в закрытом контуре K8s.
  • Настроил GPU-сервисы в K8s: MIG, Allocation Driver (AD), разделение VRAM.
  • Запустил модели LLM (Mistral, Llama3), LaBSE, Whisper, WI&WI через HuggingFace, ONNX, TorchServe.

Старший DevOps-инженер

Imhio
Август 2023 — Сентябрь 2024 | Кипр, Лимассол
  • Поддерживал инфраструктуру на Bare-metal, AWS и Azure; настраивал CI/CD в GitLab, GoCD, ArgoCD, GitHub Actions.
  • Описывал инфраструктуру как код (IaC) с помощью Ansible, Terraform, Terragrunt.
  • Администрировал Docker и Kubernetes; настраивал HA-решения (Nginx, Traefik, HAProxy, Keepalived, Peacemaker).
  • Развивал системы мониторинга и логирования: Prometheus, Grafana, Loki, Victoria Metrics.
  • Обслуживал системы видеообработки, хранения и трансляции для геораспределённых сервисов.
  • Поддерживал системы анализа изображений с использованием компьютерного зрения и нейросетей.

Старший MLOps-инженер

BSS
Июнь 2022 — Август 2023 | Санкт-Петербург
  • Разрабатывал и внедрял речевых ботов на базе NER, ASR, TTS.
  • Администрировал HA-кластеры: Nginx, Elasticsearch, MongoDB, Redis.
  • Осуществил миграцию сервисов из Docker-compose в Kubernetes, написал Helm-чарты.
  • Создавал Python-интеграции (REST/SOAP) и веб-приложения на Flask/Sanic.
  • Настраивал телефонию (FreeSWITCH, Asterisk) и разрабатывал Telegram-ботов.
  • Участвовал в проектах по созданию речевых ботов для МФЦ Москвы, СПб, Тулы, Ставрополя и др.

Cloud & DevOps Engineer Internship

EPAM
Январь 2022 — Май 2022 | Санкт-Петербург
  • Изучал и применял CI/CD инструменты: GitHub Actions, Jenkins, GitLab CI.
  • Работал с K8s, Ansible, Docker, Terraform и сервисами AWS (IAM, VPC, ALB, RDS, EFS, S3, EC2).
  • Применял методологии Agile/Kanban и Scrum.

Старший системный администратор

АО «Проектный Институт №1»
Август 2020 — Январь 2022
  • Администрировал VMware vSphere, vCenter, Horizon; обеспечивал виртуализацию предприятия.
  • Поддерживал облачный файл-сервер (Samba, Nextcloud, strongSwan), IKEv2 VPN, Zabbix, Postfix.

Старший системный администратор

Сеть магазинов «Суши ШОП»
Сентябрь 2014 — Август 2020
  • Управлял IT-инфраструктурой на базе VPN L2/L3 (Cisco, HP).
  • Администрировал колл-центр на Asterisk, мониторинг Zabbix, VMware ESXi и 1C.

Руководитель IT-отдела

ООО «ЕСТП-СРО»
Апрель 2013 — Август 2014

Системный администратор

НИЦ СПб ЭТУ
Июль 2010 — Февраль 2013

Образование

Информационные системы и технологии

СПбГМТУ (Санкт-Петербургский государственный морской технический университет)
2011–2015 | Вечернее/заочное

Cloud & DevOps Internship

EPAM University Program
Январь–Май 2022
  • Kubernetes, AWS, Docker, Terraform, Ansible, GitLab, Prometheus, Grafana, Amazon EKS