Системы мониторинга производительности и доступности ИТ-инфраструктуры

Инженерная инфраструктура современного ЦОД состоит из десятков устройств, многие из которых имеют встроенные микропроцессорные системы управления. Количество параметров, которые необходимо контролировать в современном ЦОД, может исчисляться тысячами (климатические параметры в отдельных стойках, токи потребления серверов, состояние охранных датчиков и т.д.). Все параметры необходимо собирать и анализировать в режиме реального времени 24 часа в сутки, 7 дней в неделю. Такое можно осуществить, только используя единую систему мониторинга и управления, которая осуществляет регулярный сбор информации со всех источников данных (датчики, состояние оборудования) и оказывает управляющее воздействие для обеспечения наиболее комфортных условий эксплуатации для оборудования.

В общем виде уровни мониторинга разделяются на:

  • мониторинг неисправностей;
  • мониторинг производительности;
  • мониторинг уровня предоставления сервиса.

За счет реализации многоуровневого подхода к мониторингу ресурсов ЦОД (во всех областях, начиная от сетевой инфраструктуры и заканчивая сервисами, а также приложениями, их реализующими) достигается требуемый уровень предоставления ИТ-сервисов, контролируемость и управляемость ИТ-ресурсов.

Внедрив систему мониторинга производительности и доступности ИТ-инфраструктуры, Вы получите:

  • практически мгновенное время реакции на событие - получение данных с особо критичных точек может осуществляться много раз в секунду, это позволяет обес-печить быструю реакцию системы, минимизировать возможные отрицательные последствия при возникновении чрезвычайных ситуаций;
  • отсутствие человека при принятии решения в экстренной ситуации - большинство современных угроз известно и известен алгоритм действий, который необходимо использовать при их возникновении, за счет объединения всех инженерных систем в единую логическую сеть с механизмами принятия решений, встроенными в контроллеры автоматизированной системы управления, обеспечивается заданная реакция всей инженерной инфраструктуры ЦОД на возникновение чрезвычайных ситуаций;
  • снижение человеческого фактора в рамках эксплуатации инженерной инфраструктуры;
  • автоматизированная система позволяет задавать необходимые параметры работы инженерных систем, контролировать их соблюдение, непрерывно следить за показателями окружающей среды, электропитания, состояния технологического оборудования с помощью независимых средств контроля, в случае выхода параметров за заданные границы или обнаружения отказов дежурному персоналу посылаются тревожные сообщения, а также рекомендации по ликвидации аварийной ситуации;
  • расширение возможностей инженерных систем путем увеличения количества точек контроля, что позволяет гарантировать соблюдение необходимых параметров окружающей среды для работы оборудования (например, регулирование работы системы обеспечения микроклимата не только на основе температуры горячего воздуха, подаваемого в кондиционер, но и на основе данных, полученных с дополнительных датчиков, установленных непосредственно в местах забора воз¬духа оборудованием);
  • единая среда мониторинга и управления - дежурный персонал имеет единый мнемонический интерфейс контроля и управления всеми инженерными системами ЦОД, что облегчает восприятие информации персоналом, позволяет контролировать все параметры систем в реальном времени, своевременно обнаруживать изменения в работе и производить техническое обслуживание или ремонт;
  • возможность прогнозирования отказов элементов инженерной инфраструктуры - подключение дополнительных датчиков и измерение нестандартных параметров систем инженерной инфраструктуры позволяет вовремя предупредить вероятную аварию (например, датчики прогиба перекрытий при достижении определенного значения подскажут, что давление на перекрытие достигло максимальных допустимых показателей и дальнейшее увеличение нагрузки приведет к обрушению строительных конструкций).