Управление
ИТ-мощностями

Почему сегодня это еще важнее, чем было вчера?
Общаясь с самыми разными компаниями, как из среды заказчиков, так и с интеграторами и дистрибьюторами ИТ-оборудования, в последний год все чаще звучат разговоры о том, что новое оборудование сильно подорожало, его доступность ограничена, и ни один поставщик не берется гарантировать сроки и комплектность поставки заказов. В этой связи для крупных компаний как никогда прежде растет важность максимизации использования уже имеющейся инфраструктуры, оптимизации закупок нового оборудования, точного планирования будущих закупок.
Помимо этого, для многих компаний изменилась парадигма потребления клиентами их товаров и услуг. Например, ритейлу пришлось сместить фокус с модели оффлайн продаж в магазинах на модель онлайн продаж через интернет, а это совершенно разные управление заказами, обработка платежей, логистика, работа складов и прочее, прочее, прочее. С чем столкнулись компании? С тем, что системы, рассчитанные на одну нагрузку, резко получили другую нагрузку, а нехватка ресурсов, как нетрудно догадаться, плачевно сказывается на работоспособности ИТ-систем, ну а неважная работоспособность ИТ-систем в свою очередь плохо сказывается на работе бизнеса. В итоге имеем недовольных клиентов.

В то же время системы, которые раньше были нагружены, как положено, во многом работают в более спокойном режиме. Но использовать их просто так может быть нельзя, во-первых, потому что никто не знает, что они освободились, а во-вторых, потому что они, например, закуплены под нужды другого департамента.

Практика управления мощностями

Как же бизнесу решить такую комплексную задачу – повысить эффективность использования имеющихся ресурсов, оптимизировать будущие закупки и, главное, сделать все это в привязке к реальным текущим и будущим потребностям бизнеса, а не просто тыкать пальцем в небо?

Одним из ответов видится известная ITSM практика – процессы управления мощностями и управления спросом. О чем это, вкратце? О том, что нужна полная картина задействованных ресурсов, ответственные за каждый сектор, и, главное, предсказуемость загрузки на будущее.
В обычных условиях предсказуемость загрузки реализуется через два механизма: отслеживание исторического спроса (если в конце квартала бухгалтерия судорожно подбивает отчеты и остатки, то нагрузка на системы отчетности, очевидно, в конце каждого квартала будет возрастать) и процесс запроса и согласования новых мощностей (если двум группам тестировщиков нужно одно и то же окружение для тестирования новых релизов, то должен быть процесс запроса и согласования мощностей, который позволит всем сделать то, что им нужно, и при этом не «уронить» систему).

Как обстоят дела сейчас и какие есть проблемы?

Сейчас условия, понятное дело, необычные, поэтому на исторический спрос опираться может быть бесполезно, зато вот общая картина загрузки ресурсов и выстроенный процесс запроса и предоставления мощностей, а также высвобождения и переиспользование более не используемых, были бы крайне полезны.

Многие компании в том или ином виде этот процесс имеют, в ручном режиме запрос/выдача мощностей осуществляются, ну а уж системы мониторинга так и подавно есть почти во всех организациях, и в больших, и в маленьких.
Однако, классическая проблема может выглядеть так: ИТ получает заявку на создание новой виртуальной машины. Администратор виртуальной инфраструктуры запрашивает ресурсы у администратора СХД, согласно заявке – например, 2ТБ. Администратор СХД выдает 2ТБ, виртуальная машина создается, и использует… 100ГБ. Или 200ГБ. В то же время администратор СХД не видит реального использования, он видит 2ТБ аллоцированного дискового пространства. В итоге почти все они (а статистика IDC говорит, что до 40% в среднем в инфраструктуре хранения данных) не используются. Чего же не хватает и как можно улучшить процесс?

Почему не подходят классические системы мониторинга?

Если у вас 10 серверов или 1 СХД, то управлять прогнозированием их загрузки, вести табличку в экселе и согласовывать новые нагрузки с коллегой на кухне за чаем проблем не составит, но если серверов 10 000 и десятки или сотни систем хранения, а коллеги, отвечающие за нужные вам участки инфраструктуры сидят в разных городах, то картина значительно усложняется. Сервис деск системы и регламенты проведения работ, конечно, помогают причесать этот процесс, но опять все вручную. Системы мониторинга, конечно, решают вопрос контроля загрузки, но когда инфраструктура большая, систем зачастую бывает несколько, единая консоль есть не у всех, а главное – чаще всего, они дают только данные о загрузке, а на вопросы, которые по-настоящему волнуют бизнес и эксплуатацию, ответить не помогают.

Что нам дают системы мониторинга:
Процент использования процессоров, памяти, дискового пространства.
Пропускную способность сети и нагрузку на сеть.
Загрузку и состояние виртуальной и контейнерной инфраструктуры (как правило, кстати, в отдельных системах).
Наличие ошибок в работе оборудования и ПО.
В случае продвинутых систем дадут еще аналитику по причинам сбоев.
В случае с APM системами, дадут картину работы приложений и пользовательского опыта.
Процент использования процессоров, памяти, дискового пространства.
Пропускную способность сети и нагрузку на сеть.
Загрузку и состояние виртуальной и контейнерной инфраструктуры (как правило, кстати, в отдельных системах).
Наличие ошибок в работе оборудования и ПО.
В случае продвинутых систем дадут еще аналитику по причинам сбоев.
В случае с APM системами, дадут картину работы приложений и пользовательского опыта.
Вроде, здорово, столько всего… Но что мы на самом деле хотим знать? Ну, то есть, безусловно, мы хотим знать, что серверы работают, память есть, виртуальные машины работают, контейнеры создаются и штатно переезжают, но зачем нам все это?
В первую очередь нам важно, работает ли конечный сервис, а значит, получает ли пользователь его?
Если сервис не работает, то почему?
Можем ли мы развернуть новый сервис на текущей инфраструктуре?
Как изменение бизнес-требований скажется на инфраструктуре? Что надо будет поменять?
Сколько нам стоит работа ИТ-инфраструктуры и сколько нам заложить в бюджет на следующий год, учитывая планы бизнеса?
Ответы на эти вопросы, к сожалению, чаще всего либо остаются без ответов, либо ответы на них базируются просто на экспертной оценке ответственных сотрудников отделов эксплуатации.

Подобный подход как раз и приводит к неравномерному выделению ресурсов, плохо согласующемуся с реальными потребностями различных сервисов и приложений, потерям из-за простоев, и одновременной необходимости закупать лишнее оборудование для тех сегментов инфраструктуры, для которых оно на самом деле не нужно.

Что на самом деле нужно крупной организации от системы управления ресурсами?

Таким образом, было бы хорошо иметь некую единую консоль, в которой помимо самих данных о загрузке ресурсов (желательно, конечно, агрегированных изо всех источников, чтобы не смотреть отдельно в эту консоль, и отдельно, скажем, в vCenter), в которой при этом были бы функции:
привязки показателей ИТ-систем к показателям бизнеса (скажем, количества заказов к обращениям к базе данных и нагрузке на память или посетителей сайта к нагрузке на процессоры и память веб-серверов и серверов приложений);
построения прогнозов по различным сценариям в этих бизнес-терминах;
заказа и согласования предоставления мощностей с оценкой рисков и взаимовлияния;
рекомендации по размещению новых нагрузок или перераспределению загрузки ресурсов;
отчетности по загрузке ресурсов в привязке к бизнес-функциям (скажем, департаментам, филиалам или клиентам в случае сервис-провайдера).
привязки показателей ИТ-систем к показателям бизнеса (скажем, количества заказов к обращениям к базе данных и нагрузке на память или посетителей сайта к нагрузке на процессоры и память веб-серверов и серверов приложений);
построения прогнозов по различным сценариям в этих бизнес-терминах;
заказа и согласования предоставления мощностей с оценкой рисков и взаимовлияния;
рекомендации по размещению новых нагрузок или перераспределению загрузки ресурсов;
отчетности по загрузке ресурсов в привязке к бизнес-функциям (скажем, департаментам, филиалам или клиентам в случае сервис-провайдера).
Такое решение потенциально имело бы большую ценность для крупных компаний.
В текущих условиях – будет быстро понятно, на какие сервисы будет наибольшая нагрузка, какие не справятся, какие ресурсы уже заняты, и где можно быстро взять ресурсы без ущерба для работоспособности других систем.
Глобально – серьезная оптимизация ИТ-закупок, уход от подхода «давайте закупим впрок, а то в следующем году не дадут бюджет».
Прозрачность трат на инфраструктуру, лицензии и облачные сервисы для руководства ИТ и компании.
Организованный процесс управления спросом и мощностями, а значит снижение риска простоев бизнес-сервисов из-за нехватки ресурсов.

BMC TrueSight Capacity Optimization

В нашем случае таким решением выступает систем управления ИТ-мощностями BMC TrueSight Capacity Optimization. Truesight Capacity – это корпоративная платформа, имеющая массу коннекторов к самым разным технологиям и мощный ETL. Вместе они позволяют:
собирать данные о загрузке с физической, виртуальной, контейнерной, облачной инфраструктуры, СХД, сетевого оборудования;
привязывать ИТ-ресурсы к бизнес-сервисам и приложениям через интеграцию с CMDB;
привязывать загрузку ресурсов к бизнес-показателям через интеграцию с бизнес-системами (например, к количеству заказов или количеству одновременных пользователей сервиса);
прогнозировать будущее потребление и потребность в новых ресурсах;
рассчитывать стоимость ИТ-ресурсов для бизнеса, помогать с планированием будущих бюджетов на закупки.
собирать данные о загрузке с физической, виртуальной, контейнерной, облачной инфраструктуры, СХД, сетевого оборудования;
привязывать ИТ-ресурсы к бизнес-сервисам и приложениям через интеграцию с CMDB;
привязывать загрузку ресурсов к бизнес-показателям через интеграцию с бизнес-системами (например, к количеству заказов или количеству одновременных пользователей сервиса);
прогнозировать будущее потребление и потребность в новых ресурсах;
рассчитывать стоимость ИТ-ресурсов для бизнеса, помогать с планированием будущих бюджетов на закупки.
Крупнейшие компании, такие как Verizon, Atos, AT&T, Enel, Telefonica, Telecom Italia, Cerner и другие много лет используют TrueSight Capacity Optimization для управления своими ИТ-мощностями и оптимизации использования ресурсов. Проекты по внедрению системы окупаются менее, чем за год, а ROI исчисляется сотнями процентов, благодаря экономии на закупках новой инфраструктуры (а вместе с ней и необходимых лицензий ПО, электроэнергии и прочего, что часто забывают при расчетах), снижению количества простоев, связанных с нехваткой ресурсов, сокращению трудозатрат персонала на планирование и управление мощностями, отчетность.
Если вам интересно, как оптимизировать использование вашей ИТ-инфраструктуры и сэкономить сотни тысяч и миллионы долларов на ИТ-закупках, мы будем рады рассказать вам о решении TrueSight Capacity Optimization и опыте заказчиков BMC Software.
Закажите обратный звонок
Подписаться на новости