Отказоустойчивая виртуализация для цифровой трансформации в железнодорожном секторе

Как внедрить отказоустойчивую виртуализацию и поддержать цифровую трансформацию в железнодорожном секторе

АО "Московский ЛРЗ" - дочерняя структура ОАО "Российские железные дороги", специализирующаяся на ремонте железнодорожного подвижного состава. Предприятие обеспечивает полный цикл обслуживания электропоездов, а в его состав входит более восьми производственных цехов. Эти цеха поддерживают эксплуатацию локомотивов и электропоездов в масштабах всей железнодорожной сети, поэтому от стабильности ИТ-инфраструктуры напрямую зависят производственные процессы, соблюдение графиков и безопасность перевозок.

ИТ-команда и исходная инфраструктура

Внутренний ИТ-отдел предприятия относительно небольшой - всего восемь специалистов. В их зону ответственности входит техническая поддержка пользователей, сопровождение и развитие АТС, а также поддержка решений на базе 1С. При этом под управлением ИТ-службы находится около 200 хостов, что формирует достаточно сложный ландшафт при ограниченных кадровых ресурсах.

Изначально виртуализация была построена на базе Hyper-V. На двух физических серверах без кластеризации размещалось по восемь виртуальных машин на каждом хосте. Отказоустойчивость обеспечивалась лишь частично: некоторые критичные сервисы были настроены на репликацию между серверами, но единого отказоустойчивого кластера не было. Это создавало риски при выходе из строя одного из узлов или управляющего компонента.

При этом в ИТ-среде предприятия уже был развернут полный набор корпоративных сервисов:
- почтовая система и доменная инфраструктура;
- файловые хранилища и сервисы на базе 1С;
- решения по информационной безопасности;
- системы резервного копирования;
- подсистемы интеллектуальной обработки данных и анализа бизнес-процессов.

Комплексность этой среды предъявляла повышенные требования к совместимости нового программного обеспечения, его надежности, производительности и удобству управления.

Цифровая трансформация и импортозамещение

На предприятии была запущена программа цифровой трансформации, ключевым элементом которой стало импортозамещение программного обеспечения и радиоэлектронной продукции. Ранее инфраструктура практически полностью опиралась на решения зарубежных вендоров: использовались продукты Microsoft, Cisco и Kerio Technologies.

Перед ИТ-командой встал многокомпонентный вызов:
- подобрать отечественные аналоги по адекватной стоимости;
- обеспечить сопоставимый или более высокий уровень функциональности;
- соблюдать требования регуляторов и опираться на решения, включенные в реестр отечественного ПО;
- минимизировать технологические риски и зависимость от иностранных поставщиков.

Переход к отечественному стеку осуществлялся постепенно и продуманно. В первую очередь была обновлена аппаратная база: предприятие закупило серверы отечественного производства. Параллельно начался переход на решения "Группы Астра", что логично подвело к необходимости выбрать новую платформу виртуализации взамен Hyper-V.

Выбор платформы виртуализации: ключевые требования

Для замены существующей системы виртуализации требовалось решение, которое:
- не уступает по функционалу привычному Hyper-V;
- зрелое с точки зрения технологий и сопровождения;
- интегрируется с Astra Linux и другими используемыми компонентами;
- предоставляет механизмы высокой доступности и отказоустойчивости;
- укладывается в рамки бюджета и требований по лицензированию;
- не потребует массивных доработок при внедрении.

Также для команды было важно, чтобы продукт можно было развивать поэтапно: начинать с относительно небольшого объема ресурсов и затем масштабировать систему по мере роста нагрузки и числа виртуальных машин.

По итогам анализа доступных решений выбор был сделан в пользу VMmanager - продукта ISPsystem, который показал хорошую совместимость с Astra Linux и соответствовал основным критериям проекта, прежде всего отказоустойчивости и экономической эффективности.

Задачи проекта в условиях железнодорожной отрасли

ИТ-инфраструктура предприятий железнодорожного сектора традиционно относится к критическим: простои информационных систем могут привести к задержкам ремонтов, сбоям в логистике и, в конечном счете, к рискам для безопасности движения. Поэтому задачи проекта формулировались предельно четко:

1. Импортозамещение
Полный отказ от зарубежных программных решений в части виртуализации и плавный переход на отечественный стек без нарушения текущих бизнес-процессов.

2. Безопасность и отказоустойчивость
Обеспечение непрерывной работы цифровых сервисов, поддерживающих ремонт и эксплуатацию подвижного состава. Система должна сохранять работоспособность даже при отказе отдельных узлов или управляющих компонентов.

3. Стабильность управления
Выход из строя мастер-сервера не должен останавливать работу виртуальных машин. Базовые операции по управлению инфраструктурой должны оставаться доступными с уровня узлов.

4. Отказоустойчивый кластер
При недоступности управляющего сервера механизмы высокой доступности (HA) должны продолжать функционировать на уровне узлов, автоматически перезапуская виртуальные машины на доступных хостах.

Функциональные требования к VMmanager

Отдельное внимание уделялось тому, насколько платформа позволяет автоматизировать работу с виртуальными машинами и ускорить развертывание новых сервисов. Среди важных возможностей VMmanager:

- Работа с репозиториями ОС и конфигурациями ВМ.
Система позволяет централизованно управлять шаблонами операционных систем и конфигурациями виртуальных машин: задавать количество и объем дисков, параметры CPU и RAM, а также различные лимиты и ограничения. Это стандартизирует развертывание и снижает риск ошибок.

- Поддержка различных сценариев работы с ВМ.
Важно было иметь инструменты:
- создания и клонирования ВМ;
- работы со снапшотами;
- формирования образов;
- горячей миграции;
- балансировки нагрузки между хостами;
- быстрого восстановления сервисов при сбоях.

- Готовые шаблоны "из коробки".
Наличие базовых шаблонов сильно ускоряет внедрение новых сервисов и уменьшает рутинную работу ИТ-специалистов.

VMmanager выступил в роли единого инструмента для создания отказоустойчивой виртуальной инфраструктуры и централизованного управления как аппаратной, так и контейнерной виртуализацией. По совокупности характеристик он полностью соответствовал задачам проекта по функциональности, надежности и стоимости владения.

Этапы внедрения и наращивание ресурсов

Важным элементом стратегии стало поэтапное масштабирование. На старте была приобретена лицензия VMmanager на 80 ядер. Это позволило развернуть базовый кластер, перенести часть существующих сервисов и протестировать работу системы в боевых условиях.

Затем, по мере роста нагрузки и количества виртуальных машин, лицензия была расширена еще на 20 ядер. После успешной эксплуатации в таком режиме было принято решение перевести лицензию на модель "на физические серверы", что дало возможность более гибко использовать вычислительные ресурсы и планировать дальнейшую модернизацию железа.

Такой поэтапный подход позволил:
- избежать резких и рискованных "больших миграций";
- контролировать затраты, оплачивая только реально используемые ресурсы;
- оперативно адаптировать архитектуру под реальные потребности производства.

Результаты: что дало внедрение VMmanager

После внедрения платформы виртуализации на базе VMmanager предприятие получило управляемую, отказоустойчивую и соответствующую требованиям импортозамещения ИТ-инфраструктуру. Основные эффекты:

- Централизованное управление инфраструктурой.
Единый удобный интерфейс управления позволяет ИТ-команде оперативно контролировать состояние узлов, виртуальных машин и сервисов, не распыляя внимание на множество разрозненных консолей.

- Гибкое масштабирование.
Модель лицензирования и архитектура VMmanager дают возможность плавно наращивать ресурсы, добавляя новые серверы и ядра по мере необходимости, без полной перестройки системы.

- Ускоренное развертывание сервисов.
Использование готовых шаблонов из репозитория существенно сокращает время на подъем новых виртуальных машин и внедрение новых сервисов. Это особенно важно в условиях цифровой трансформации, когда новые ИТ-решения необходимо запускать регулярно и быстро.

- Повышенная отказоустойчивость.
Высокодоступный кластер обеспечивает автоматический перезапуск ВМ при сбоях на отдельных узлах, минимизируя простои и снижая риски для производственных процессов.

Роль отказоустойчивой виртуализации в цифровой трансформации железнодорожного сектора

Для предприятий железнодорожной отрасли цифровая трансформация - это не просто внедрение новых систем, а переход к управлению данными в режиме реального времени, автоматизации процессов ремонта и обслуживания, предиктивной аналитике и повышению безопасности перевозок.

Отказоустойчивая виртуализация становится базовым слоем, на который опираются:
- системы мониторинга состояния подвижного состава;
- решения для анализа больших массивов эксплуатационных данных;
- платформы управления ремонтными заказами и запасами;
- сервисы взаимодействия с персоналом и мобильные приложения;
- системы информационной безопасности и контроля доступа.

Без надежной виртуализационной платформы запуск подобных сервисов либо невозможен, либо сопровождается слишком высокими рисками. Поэтому внедрение VMmanager в данном случае не ограничивается только задачей импортозамещения - это фундамент для дальнейшего развития цифровых сервисов.

Практические выгоды для ИТ-команды и бизнеса

С технической точки зрения, ИТ-специалисты получили более удобный и прозрачный инструмент управления инфраструктурой. Снижение рутинной нагрузки за счет шаблонов, автоматизации и централизованного интерфейса высвобождает время на развитие, а не только на поддержание систем в рабочем состоянии.

Для бизнеса это выражается в:
- сокращении простоев производственных сервисов;
- улучшении качества планирования ремонтов и логистики;
- повышении управляемости затрат на ИТ;
- готовности к быстрому запуску новых проектов в рамках цифровой трансформации.

Масштабирование в разнородной инфраструктуре

Для железнодорожного предприятия типична разнородность аппаратной базы: серверы разных поколений, различающиеся по производительности и конфигурации. Платформа виртуализации должна уметь работать в таких условиях, обеспечивая балансировку нагрузки и возможность поэтапной замены оборудования без простоя ключевых сервисов.

VMmanager хорошо показывает себя в таких сценариях:
- позволяет объединять разнородные узлы в единый кластер;
- обеспечивает гибкое распределение ВМ по серверам;
- позволяет планировать миграции и обновления аппаратной части с минимальным влиянием на пользователей и производственные системы.

Планы развития и дальнейшие шаги

Получив стабильную и отказоустойчивую основу, предприятие может двигаться дальше по пути цифровой трансформации. На базе существующей виртуальной инфраструктуры логично развивать:
- сервисы предиктивной аналитики по данным датчиков и систем диагностики подвижного состава;
- интеграцию производственных ИТ-систем с корпоративными платформами учета и планирования;
- более глубокую автоматизацию процессов ремонта и обслуживания;
- расширение практики контейнеризации приложений для ускорения разработки и внедрения обновлений.

При этом виртуализационная платформа продолжит играть роль связующего слоя, обеспечивающего надежность и предсказуемость работы всех надстроенных сервисов.

***

Опыт АО "Московский ЛРЗ" показывает, что переход к отечественной отказоустойчивой виртуализации при грамотном планировании не только снижает технологические риски и решает задачу импортозамещения, но и создает основу для масштабной цифровой трансформации железнодорожного предприятия. В условиях высокой ответственности за бесперебойную работу инфраструктуры именно такой подход позволяет сочетать надежность, управляемость и готовность к дальнейшему росту цифровых сервисов.

Прокрутить вверх