Комплексный подход к построению центров обработки данных

29 января 2009 ФГ
Финансовая газета
#5, 29 января 2009 г.
Анатолий Якуш, технический руководитель направления, Открытые Технологии.

В последние годы наметилась тенденция к росту объема и спектра услуг, оказываемых банками как юридическим, так и физическим лицам, повышается качество сервиса. В частности, развивается кредитное направление, формируются различные фонды, совершенствуются системы "банк—клиент" (электронный банкинг) и т. п.

Увеличение числа клиентов обусловливает необходимость обрабатывать больше информации в единицу времени. Растет и разнообразие типов этих данных. По международным правилам банки обязаны хранить определенную информацию о клиентах и сделках в течение достаточно продолжительного времени, следовательно, повышаются объемы архивных хранилищ, усложняется работа с ними. Все это приводит к тому, что информационные системы финансовых организаций работают на пределе своих возможностей.

Кажется логичным следующий выход из положения:

  • установить в одном помещении необходимое количество серверов с соответствующим программным обеспечением и устройств хранения, предусмотрев резервирование критически важных узлов;
  • объединить все это оборудование в единый центр обработки данных (ЦОД), обеспечив дублирование каналов передачи данных и необходимую защиту от несанкционированного доступа извне.

Обычно в ЦОД с быстрым ростом объемов данных и необходимостью постоянного наращивания как объемов хранилищ, так и производительности серверов, уже заложены элементы повышения "живучести" бизнес-процессов, такие, как дублирование критичных элементов оборудования, дублирование внутренних каналов передачи информации, применение технологии RAID для повышения надежности хранения данных, применение технологий виртуализации как серверов, так и систем хранения.

Тем не менее при использовании только типовой схемы построения ЦОД могут возникнуть проблемы. Рассмотрим пути их решения.

После решения всех текущих технических проблем (определение объема основного хранилища, производительности серверов, способов и каналов подключения к провайдерам) на первое место выходят проблемы, связанные с обеспечением непрерывности бизнеса и преемственности программного обеспечения, а также с квалификацией персонала, эксплуатационными расходами и т.д.

Часть проблем решается путем проведения организационных мероприятий, например обучение персонала, ведение журнала внесения изменений, составление планов по поддержке бизнеса и восстановления после аварий. Другая часть может и должна решаться с помощью технических решений и применения передовых технологий.

Таким образом, при проектировании ЦОД необходимо учитывать следующие моменты:

  • используемое программное обеспечение, перспективы его модернизации, требования к аппаратному обеспечению и к каналам, количество внутренних пользователей, возможность работы внешних пользователей;
  • количество клиентов банка, требуемые объемы хранимой информации, перспективы их роста, сроки и объемы долговременного хранения архивной информации;
  • наличие сети филиалов, необходимость совместной работы с единой базой данных, удаленность филиалов, характеристики каналов связи;
  • допустимое время простоя при авариях, допустимые потери данных, наличие планов ВСР (Business Continuity Plan — План обеспечения бизнеса) и DRP (Disaster Recovery Plan — План восстановления после аварий), способы решения проблем, предусмотренные в планах;
  • текущий уровень информационной безопасности, возможность и необходимость его повышения, требования к шифрованию данных (как передаваемых по каналам связи, так и хранящихся в базе данных и архивах), требования к антивирусной защите;
  • наличие старого и/или устаревшего оборудования, необходимость его использования, возможность модернизации и/ или утилизации;
  • наличие и квалификация персонала как самого ЦОД, так и удаленных филиалов, возможность набора нового персонала и обучения имеющегося;
  • наличие помещений под оборудование, степень их готовности, правильное электропитание, кондиционирование, средства безопасности;
  • текущие эксплуатационные расходы (аренда помещений, заработная плата персонала, плата за энергопотребление, водоснабжение), возможность их роста.

Проанализируем более подробно некоторые из перечисленных моментов и практические способы их решения.


Высокие эксплуатационные расходы

Плотность застройки в городах, ограничения по подводимой мощности, сложности с подбором помещений — все это приводит к увеличению как разовых расходов (например, построение системы электропитания с ДГУ), так и долговременных (рост арендной платы).

Решением проблемы может стать применение при построении ЦОД серверов с новыми процессорами, выпущенными с использованием энергосберегающих технологий, а также уменьшение числа физических серверов за счет технологий виртуализации и blade-серверов.


Отказоустойчивость, катастрофы

Одна из проблем обеспечения непрерывности бизнеса — гарантия отказоустойчивости сервисов, повышение их способности сопротивляться масштабным катастрофам. Если локальные катастрофы (протечка воды, заморозки, землетрясение) можно решить техническими средствами, то глобальные решаются путем сочетания технических и организационных мер.

В мае 2005 г. из-за сбоя на подстанции и резкого скачка нагрузок в Москве и ряде других энергосистем страны произошло веерное отключение электроэнергии. Общий материальный ущерб столицы от этой аварии составил 1,7 млрд руб. Избежать этого можно было бы с помощью удаленного резервного ЦОД (РЦОД), находящегося, например, на другом конце города и получающего электроэнергию от другой подстанции. Однако при подобном веерном отключении питания имеется вероятность остановки и резервного ЦОД.

Необходимо тщательно проанализировать возможность катастроф, их влияние на доступность предоставляемых сервисов и предполагаемые убытки. В том случае, если убытки могут быть значительными, имеет смысл построения РЦОД даже в другом городе. В частности, в практике компании Открытые Технологии осуществлено несколько проектов резервных ЦОД для обеспечения требуемой защищенности сервисов и сохранности данных. Помимо реализации отказоустойчивого решения в основных центрах обработки данных были разработаны и созданы резервные на расстояниях 60 и 250 км. В соответствии с задачами, поставленными заказчиками, были определены критичные сервисы, проработаны процедуры как удаленной синхронизации баз данных, так и переключения пользователей.

И самое главное, для скорейшего восстановления работы сервисов необходимо иметь четко продуманный план действий — планы ВСР и DRP. При отсутствии этих планов, без проведения тренировочных мероприятий восстановление работоспособности бизнеса может занять неоправданно длительное время и оказаться критичным для предприятия.


Информационная безопасность

К проблемам, связанным с информационной безопасностью, относятся несанкционированный доступ к информации, ее искажение и утечка данных.

Частью общего плана обеспечения информационной безопасности, доступности и непротиворечивости данных могут быть решения, построенные на усилении контроля за доступом к информации с использованием средств биометрии, «тонких клиентов» без возможности подключения внешних носителей, многоуровневых репликаций на удаленные хранилища с хранением версий документов.

Согласно статье В.Ульянова "Непрерывность бизнеса по-новому" "по данным российской компании Perimetrix, существенная доля утечек информации происходит в результате утери или кражи мобильных накопителей" (Электроника экспресс. - 2008. - № 158. — С. 14-21). Применение "тонких клиентов" (например, SUN Ray, HP t5000 или Neoware) позволяет значительно снизить возможность копирования информации на эти самые катастрофически теряемые накопители.

Немаловажной составной частью общей политики информационной безопасности является криптографическая защита данных как архивных, так и передаваемых по каналам связи. В отношении последних особое внимание необходимо уделить информационному обмену по общедоступным каналам связи. Интерес к ним обусловлен высокой стоимостью, а порой и отсутствием физической возможности реализации защищенных выделенных трактов передачи банковской информации. Шифрование данных в этом случае выступает как обязательное требование. На данный момент существует несколько государственных стандартов Российской Федерации в области криптографической защиты информации (ГОСТ 28147-89, ГОСТ Р 34.10-2001, ГОСТ Р 34.11-2001), активно функционирует система сертификации средств криптографической защиты информации под руководством ФСБ России. На рынке имеются сертифицированные решения, позволяющие реализовать защищенный информационный обмен через открытые каналы. Ведутся разработки новых продуктов и совершенствуются стандарты и алгоритмы.


Системы управления

Большое количество разного оборудования требует либо соответствующего числа системных администраторов, либо мощной системы централизованного управления (СУ).

В качестве примеров подобных СУ можно привести Big Brother, HP Open-View, IBM Tivoly, Micromuse NetCool, CA SPECTRUM, комплекс EMC SMARTS. Перечень можно продолжать, но в любом случае все зависит от размеров информационной системы и потребностей предприятия.

Таким образом, при построении информационной системы предприятия, нацеленной на непрерывное предоставление сервисов пользователям, необходим анализ возможных проблем и путей их решения. При этом важно понимать, что механическое наращивание количества серверов или устройств хранения редко приводит к желаемому результату. Важен именно комплексный подход, учитывающий перспективы развития не только самого бизнеса, но и индустрии информационных технологий.




Предыдущая новость:
От ИТ-инфраструктур требуют гибкости и масштабируемости
Следующая новость:
Эволюция сетевой инфраструктуры хранения