"ЦОД должен обеспечивать рост бизнеса, а не наоборот"
5 августа 2008 ConnectConnect
Август, 2008 г.
Вячеслав Ковалев, начальник отдела ЦОД, Открытые Технологии.
Connect: Как бы Вы определили эффективность управления ресурсами современного ЦОД?
- Я считаю, что эффективность управления ЦОД - это возможность контролировать техническим персоналом все его ресурсы с минимальными дополнительными затратами. ИТ-менеджеру важно помнить, что ИТ должны обеспечивать рост бизнеса, а не наоборот. В каждом конкретном случае сохранить такой паритет сложно, но здесь это главное правило. Уверен, что руководство не выделит средств на развитие ЦОД, пока не увидит реальной выгоды, получаемой за счет экономии электроэнергии, использования рабочей площади, уменьшения объема услуг технических специалистов, а также благодаря эффективности каналов связи. Для того чтобы определить необходимость дополнительного инвестирования, нужно выяснить, насколько эффективно используются имеющиеся ресурсы.
Эффективность внедрения и эксплуатации ЦОД закладывается на этапе проектирования. Какие методы и инструменты проектирования и моделирования использует ваша компания?
- Грамотное проектирование является гарантом эффективного внедрения и последующей эксплуатации ЦОД. Проблемы в процессе эксплуатации обусловлены зачастую тем, что не соблюдены требования на стадиях проектирования. Современный
ЦОД - сложный вычислительный комплекс, включающий множество взаимозависимых систем. Выход из строя или остановка части оборудования не должны сказываться на дееспособности комплекса, имеющего определенный запас прочности. И если не решить эту непростую задачу, все вложенные средства могут быть пущены "на ветер". Малейший сбой будет негативно отражаться как на бизнесе компании, так и на ее имидже.
В нашей компании при построении ЦОД используются как собственные наработки в области проектирования, так и инструменты, предлагаемые производителями аппаратного и программного обеспечения. Благодаря многолетнему опыту участия в крупных проектах мы накопили большую базу знаний и методик решения сложных задач, их правильной декомпозиции на отдельные составляющие и детальной проработки проектной командой. У нас есть Центр компетенций, возможности которого позволяют "обкатать" отдельные решения на оборудовании производителя уже на ранних этапах проектирования и тем самым задать дальнейший "градиент движения" для всей проектной команды.
Технология виртуализации - основной инструмент повышения эффективности использования вычислительных ресурсов. Существуют ли количественные оценки того, насколько применение таких механизмов увеличивает продуктивность вычислительных ресурсов типового ЦОД?
- Да, есть. Наиболее доступный для всех участников отрасли вид оценок основан на регулярных отчетах специализированных аналитических компаний. По их данным, например, ресурсы ЦОД загружены сегодня всего на 20-30%. Перевести эту величину в количественный показатель невозможно, да и соотнести с возможностями технологии виртуализации сложно. Указанные цифры - своего рода ориентир, позволяющий руководителям предприятий проанализировать, характерна ли аналогичная ситуация для их ЦОД. Есть и вторая группа показателей, дающая возможность определить, насколько загружены реальный сервер (его процессор, память), система хранения данных (дисковые носители, адаптеры, контроллеры) или сетевой коммутатор. На основе такой информации руководитель ИТ-департамента вправе принять решение о необходимости виртуализации. Подобные показатели компания может определить для себя самостоятельно либо с помощью системного интегратора. Замечу, что в сфере виртуализации существует много решений. И от того, насколько полной будет информация, получаемая на базе второй группы показателей, зависит эффективность использования вычислительных ресурсов типового ЦОД.
Какие еще технологии можно порекомендовать заказчику для повышения эффективности использования вычислительных ресурсов?
- Виртуализация не является универсальным и единственным решением. До ее массового применения в ЦОД успешно пользовались другими способами перераспределения ресурсов. Все зависит от реальной задачи. Сегодня в качестве альтернативы можно рекомендовать, например, использование кластерной архитектуры. В этом случае приложение дублируется между несколькими узловыми вершинами кластера. В зависимости от уровня их загрузки либо при необходимости проведения профилактических работ отдельные приложения могут быть временно запущены на других серверах кластера. Грамотно продуманная кластерная архитектура дает возможность сбалансировать общую нагрузку всех серверов. Заслуживает внимания и решение на основе "тонких клиентов", обеспечивающее распределение загрузки серверов между клиентскими прикладными задачами, что позволяет экономить на оборудовании рабочих мест и серверной части.
Не менее актуальна проблема оптимизации использования площадей центра, а также работы инженерных систем обеспечения. Какие методы и механизмы решения подобных задач дают наибольший эффект?
- В своей практике мы используем методику последовательной проработки всех составляющих систем ЦОД. Каким бы ни был список слагаемых работоспособности центра, ядром ЦОД служат системы, отвечающие за бизнес-процессы компании, т. е. серверы, системы связи, системы хранения данных и сетевое оборудование. Требования для данного оборудования очень жесткие, поэтому в состав проектной команды входят технические специалисты сразу нескольких направлений, включая направление инженерной инфраструктуры. На начальном этапе проектируются ядро ЦОД и его межузловые соединения, выполняются работы по размещению оборудования в шкафах, подводу кабельных каналов и т. д. Затем за дело берутся проектировщики инженерных систем: СКС, климатических установок, электропитания, видеонаблюдения, пожарной безопасности. Если некоторые системы уже установлены заказчиком, они тоже учитываются при проектировании. Параллельно в нашем Центре компетенций моделируется решение на уровне межузловых соединений, а также проверяется компоновка в шкафах, определяется степень тепловыделения и охлаждения оборудования в реальной ситуации.
Для повышения надежности ИТ-инфраструктуры крупные компании разворачивают резервные центры. Если сравнивать традиционный дата-центр и комплексное решение с резервированием, то какие новые задачи с точки зрения оптимизации управления наиболее актуальны?
- При строительстве резервного ЦОД должно быть обеспечено взаимодействие отдельных систем, особенно в части ПО, отвечающего за прикладной уровень и СУБД. Несогласованная обработка потоков данных на двух площадках может привести к полной остановке комплекса. Также нельзя забывать о главной цели строительства резервных ЦОД - снижении рисков при возникновении внешних или внутренних угроз. Для персонала должен быть разработан план аварийного восстановления внутри каждого центра на случай чрезвычайных ситуаций. Более того, желательно регулярно проводить учения, имитирующие подобные ситуации. Основной и резервный ЦОД - части единого сложного комплекса, работу которого необходимо контролировать круглосуточно, поэтому на этапе проектирования должны быть заложены дополнительные средства на создание автоматизированных
рабочих мест для техперсонала. Это позволит обеспечить контроль состояния всех систем на обеих площадках.
За последние годы ЦОД построили многие компании. Есть ли у вас опыт модернизации действующих центров? В каких случаях заказчики выступают инициаторами подобных проектов?
- Такой опыт есть. Например, в одном из проектов мы использовали возможности технологии виртуализации, а также возможности архитектуры на базе серверов-лезвий. Предложенное масштабируемое решение позволило заказчику эффективно управлять ЦОД на всех уровнях. В случае нехватки имеющихся ресурсов (серверов, систем хранения данных) их можно будет добавлять в существующий комплекс, обеспечивающий высокую доступность приложений. А выход из строя какого-либо узла приложения не скажется на работе центра.
Что касается инициативы самих заказчиков, то она всегда продиктована требованиями растущего бизнеса. По мере его расширения становится очевидным, что возможности имеющегося оборудования исчерпаны. Возникает ситуация, когда экономия на ИТ негативно отражается на деятельности всей компании. Здесь важно, чтобы заказчик, став инициатором модернизации ЦОД, понимал масштабы задачи. Как правило, локальная модернизация отдельного пула оборудования уже неэффективна. Тем не менее сегодня в небольших ЦОД подобный подход к модернизации все еще сохраняется. Хорошо ли это? Опыт показывает, что уже через год в таких ЦОД возникают серьезные проблемы: перегрев оборудования, нехватка места, внеплановые остановки и т. д. Нередко оказывается, что часть систем недозагружена или перегружена. И как результат, спустя некоторое время заказчик принимает решение о дополнительных инвестициях в модернизацию ЦОД, но уже с привлечением профессионалов.
Предыдущая новость:
Чего банки ждут от ИТ?
Следующая новость:
Контроль критичных бизнес-процессов