Системы мониторинга производительности и доступности ИТ-инфраструктуры

Инженерная инфраструктура современного ЦОД состоит из десятков устройств, многие из которых имеют встроенные микропроцессорные системы управления. Количество параметров, которые необходимо контролировать в современном ЦОД, может исчисляться тысячами (климатические параметры в отдельных стойках, токи потребления серверов, состояние охранных датчиков и т.д.). Все параметры необходимо собирать и анализировать в режиме реального времени 24 часа в сутки, 7 дней в неделю. Такое можно осуществить, только используя единую систему мониторинга и управления, которая осуществляет регулярный сбор информации со всех источников данных (датчики, состояние оборудования) и оказывает управляющее воздействие для обеспечения наиболее комфортных условий эксплуатации для оборудования.

В общем виде уровни мониторинга разделяются на:

  • мониторинг неисправностей;
  • мониторинг производительности;
  • мониторинг уровня предоставления сервиса.

За счет реализации многоуровневого подхода к мониторингу ресурсов ЦОД (во всех областях, начиная от сетевой инфраструктуры и заканчивая сервисами, а также приложениями, их реализующими) достигается требуемый уровень предоставления ИТ-сервисов, контролируемость и управляемость ИТ-ресурсов.

Внедрив систему мониторинга производительности и доступности ИТ-инфраструктуры, Вы получите:

  • практически мгновенное время реакции на событие - получение данных с особо критичных точек может осуществляться много раз в секунду, это позволяет обес-печить быструю реакцию системы, минимизировать возможные отрицательные последствия при возникновении чрезвычайных ситуаций;
  • отсутствие человека при принятии решения в экстренной ситуации - большинство современных угроз известно и известен алгоритм действий, который необходимо использовать при их возникновении, за счет объединения всех инженерных сис¬тем в единую логическую сеть с механизмами принятия решений, встроенными в контроллеры автоматизированной системы управления, обеспечивается задан¬ная реакция всей инженерной инфраструктуры ЦОД на возникновение чрезвычай¬ных ситуаций;
  • снижение человеческого фактора в рамках эксплуатации инженерной инфраструк¬туры;
  • автоматизированная система позволяет задавать необходимые параметры работы инженерных систем, контролировать их соблюдение, непрерывно следить за пока-зателями окружающей среды, электропитания, состояния технологического обору-дования с помощью независимых средств контроля, в случае выхода параметров за заданные границы или обнаружения отказов дежурному персоналу посылаются тревожные сообщения, а также рекомендации по ликвидации аварийной ситуации;
  • расширение возможностей инженерных систем путем увеличения количества точек контроля, что позволяет гарантировать соблюдение необходимых парамет¬ров окружающей среды для работы оборудования (например, регулирование работы системы обеспечения микроклимата не только на основе температуры горячего воздуха, подаваемого в кондиционер, но и на основе данных, полученных с дополнительных датчиков, установленных непосредственно в местах забора воз¬духа оборудованием);
  • единая среда мониторинга и управления - дежурный персонал имеет единый мне¬монический интерфейс контроля и управления всеми инженерными системами ЦОД, что облегчает восприятие информации персоналом, позволяет контроли¬ровать все параметры систем в реальном времени, своевременно обнаруживать изменения в работе и производить техническое обслуживание или ремонт;
  • возможность прогнозирования отказов элементов инженерной инфраструктуры - подключение дополнительных датчиков и измерение нестандартных параметров систем инженерной инфраструктуры позволяет вовремя предупредить вероятную аварию (например, датчики прогиба перекрытий при достижении определен¬ного значения подскажут, что давление на перекрытие достигло максимальных допустимых показателей и дальнейшее увеличение нагрузки приведет к обруше¬нию строительных конструкций).