? Безопасность – инструкции по защите от краж, пожаров и взрывов, как в основном здании, так и на удаленной площадке, а также информация о внешних хранилищах, таких как склады и подвалы.
   ? Площадки восстановления – информация о договорах, персонале с указанием конкретных функ­ций, системе безопасности и транспорте.
   ? Возврат к нормальным условиям – процедуры восстановления нормальной инфраструктуры (например, здания), условия, при которых начинают действовать эти процедуры и соответству­ющие неактивированные ("дремлющие") контракты.
    Процедуры
   Процедуры разрабатываются на основе Плана восстановления. Они должны быть эффективными [229], так, чтобы каждый мог выполнять работы по восстановлению, следуя этим процедурам. Процедуры должны включать:
   ? инсталляцию и тестирование технических средств и сетевых компонентов;
   ? восстановление приложений, баз данных и других данных.
   Эти и другие необходимые процедуры должны прилагаться к Плану восстановления.
    13.4.8. Начальное тестирование
   Начальное тестирование – критически важный аспект процесса ITSCM. Тесты следует проводить в начале работы, потом после проведения значительных изменений и затем, как минимум, один раз год. ИТ-подразделения отвечают за тестирование эффективности планов и процедур в отношении ИТ-элементов. Тесты могут проводиться с предварительным объявлением или без него.
    13.4.9. Обучение и осведомление
   Обучение персонала ИТ-подразделения и других отделов компании и осведомленность всего персо­нала организации являются важными условиями успешной реализации Процесса Управления Не­прерывностью ИТ-сервисов.
   Персонал ИТ-подразделения должен проводить обучение других членов команды восстановления бизнеса, незнакомых с вопросами информационных технологий, чтобы они могли оказать необходи­мую поддержку при проведении восстановительных работ. Обучение и тестирование должно охва­тывать как центральные, так и удаленные средства, предусмотренные на случай чрезвычайных об­стоятельств.
    13.4.10. Анализ и аудит
   Следует регулярно проводить аудит и проверять актуальность всех планов. Такая проверка затрагива­ет все аспекты Процесса Управления Непрерывностью ИТ-сервисов. В области ИТ такой аудит дол­жен проводиться при каждом значительном изменении ИТ-инфраструктуры, например, при вводе в операционную среду новых систем и сетей и появлении новых поставщиков. Аудит также должен про­водиться при любом изменении стратегии ИТ-подразделения или бизнеса. Организации, где происхо­дят быстрые и частые изменения, могут внедрить регулярную программу по проверке концепции про­цесса ITSCM. Любые изменения в планах и стратегии, появившиеся в результате проведения таких проверок, должны быть реализованы под руководством Процесса Управления Изменениями.
    13.4.11. Тестирование
   Необходимо проводить регулярное тестирование Плана восстановления, подобно объявлению учеб­ных тревог на борту корабля. Если в компании изучение плана начинается после того, как произош­ла чрезвычайная ситуация, то, вероятнее всего, у такой организации будет немало проблем с восста­новлением. Тестирование позволяет выявить слабые места плана и изменения, которые не были уч­тены. В некоторых случаях можно проводить тестирование изменений на средствах восстановления прежде, чем вводить их в действующую ИТ-инфраструктуру.
    13.4.12. Управление Изменениями
   Процесс Управления Изменениями играет важную роль в поддержании актуальности Планов восста­новления. Необходимо проводить анализ воздействия любого изменения на План восстановления.
    13.4.13. Обеспечение гарантий [230]
   Обеспечение гарантий работоспособности процесса означает проверку соответствия качества про­цесса (процедур и документации) бизнес-потребностям компании.
    13.5. Управление Процессом
   Эффективное Управление Процессом базируется на отчетах для руководства, критических факто­рах успеха и ключевых показателях качества.
    13.5.1. Отчеты для руководства
   В случае возникновения чрезвычайной ситуации предоставляются отчеты о причинах и последстви­ях чрезвычайной ситуации и действиях по ее разрешению. Любое выявленное при этом слабое мес­то будет учтено в Планах по улучшению сервисов.
   В отчеты для руководства по данному процессу также должны быть включены отчеты о тестирова­нии Плана восстановления. Должны также составляться отчеты о произведенных изменениях в пла­не по восстановлению как результатах изменения каких-либо частей ИТ-инфраструктуры.
    13.5.2. Критические факторы успеха и ключевые показатели качества
   Успех Процесса Управления Непрерывностью ИТ-сервисов зависит от следующих факторов:
   ? наличия эффективного Процесса Управления Конфигурациями;
   ? поддержки процесса всеми в компании;
   ? наличия современных эффективных инструментальных средств;
   ? проведения специального обучения для всех участников данного процесса;
   ? регулярного тестирования плана восстановления без предварительного уведомления.
   Ключевыми показателями качества являются:
   ? количество выявленных ошибок в планах восстановления;
   ? потеря дохода компании в результате чрезвычайной ситуации;
   ? стоимость процесса.
    13.5.3. Функции и роли
   Задачи Руководителя Процесса Управления Непрерывностью ИТ-сервисов состоят во внедрении и обеспечении поддержки процесса ITSCM для постоянного выполнения всех требований по Управ­лению Непрерывностью Бизнеса (ВСМ) и представлении функций ИТ-сервисов в рамках процесса ВСМ.
   В данном процессе можно определить несколько ролей и видов ответственности, а также установить различие между ответственностью в обычных условиях и ответственностью в кризисных ситуациях.
 

Совет директоров Инициация процесса ВСМ Выделение персонала и ресурсов Выработка политики Определение полномочий в рамках процесса Руководство действиями в кризисной ситуации Принятие корпоративных/бизнес-решений
Высшее руководство Управление Процессом ITSCM Утверждение планов, отчетов о тестировании и т. д. Коммуникации в компании и создание осведомленности в компании Интеграция процесса ITSCM в процесс ВСМ Координация и арбитраж (принятие окончательных решений) Предоставление персонала, ресурсов и финансовых средств
Руководство Проведение анализа рисков Определение, какие должны быть результаты работы Составление проектов договоров Руководство тестированием, оценкой и составлением отчетов Приведение в действие механизмов восстановления и обеспечения Руководство командами непрерывности Составление отчетов
Руководители команд и члены команд Проработка способов достижения результатов работы Ведение переговоров по предоставляемым услугам Проведение тестов, оценок и составление отчетов Разработка и внедрение процедур Реализация плана восстановления

 
   Таблица 13.1. Примеры видов ответственности в рамках Процесса Управления Непрерывностью ИТ-сервисов
 
    13.6. Проблемы и затраты
    13.6.1. Затраты
   Основные затраты, связанные с реализацией Процесса Управления Непрерывностью следующие:
   ? затраты времени и средств на инициацию, разработку и внедрение процесса ITSCM.
   ? затраты на организацию Управления Рисками и связанное с этим дополнительное аппаратное обеспечение. Эти расходы можно сократить, если включить эти действия в сферу деятельности Процесса Управления Доступностью на этапе разработки новых конфигураций.
   ? переходящие затраты на поддержку выбранных способов восстановления, такие как плата по Внешним Договорам по "горячему" старту, затраты на организацию тестирования и плата за пери­од поддержания в готовности средств восстановления.
   ? повторяющиеся операционные расходы на тестирование, аудит и корректировку планов.
   Эти расходы возникают только после того, как сделан обоснованный выбор и проведено сравнение с возможными расходами в случае отказа от создания Плана восстановления. Хотя затраты на под­держку такого плана могут показаться высокими, часто они оказываются вполне сопоставимыми с общими расходами на страхование от пожаров и воровства. Более того, эффективный процесс ITSCM может помочь уменьшить расходы на страхование.
    13.6.2. Проблемы
   При внедрении данного процесса могут возникнуть следующие проблемы:
   ? Ресурсы – организация должна предоставить дополнительные мощности проектной команде для разработки и тестирования плана.
   ? Серьезность намерений (обязательства) – ежегодные расходы на процесс должны быть включе­ны в бюджеты организации, для чего требуется твердое намерение руководства поддерживать Процесс Управления Непрерывностью ИТ-сервисов.
   ? Доступ к средствам восстановления – для всех обсужденных выше способов восстановления требуется проведение регулярного тестирования соответствующих средств. Поэтому заключае­мые договоры должны обеспечивать регулярный доступ ИТ-организации к средствам восстановления.
   ? Оценка потерь – некоторые потери, такие как потеря репутации, нельзя измерить в денежном вы­ражении.
   ? Составление бюджета – не всегда удается добиться понимания необходимости в дорогих средст­вах восстановления функциональности, иногда происходит сокращение Планов восстановления.
   ? Отсутствие обязательств со стороны бизнес-руководителя – это ведет к неудаче в разработке процесса ITSCM, хотя заказчик может полагать, что все необходимое сделано.
   ? Постоянное откладывание – это бывает в тех случаях, когда отсутствует большинство составля­ющих процесса и, как следствие этого, реализация процесса постоянно откладывается. В таких случаях на вопрос о Процессе Управления Непрерывностью ИТ-сервисов даются ответы: "Да. Мы встречается по этому вопросу на следующей неделе", "Мы собирается создать комиссию специ­ально по данному вопросу" и тому подобное.
   ? Черный ящик – это бывает в тех случаях, когда поставщик ИТ-услуг отказывается от ответствен­ности, а также прекращает управлять готовностью процесса: "Кто-то еще этим занимается". Пос­кольку организация затратила много средств или передала часть своих операций поставщику, ру­ководство надеется, что затраченные деньги обеспечат возможность восстановления или же что у поставщика есть планы, которые помогут восстановить бизнес после чрезвычайной ситуации.
   ? ИТ-подразделение – в своей работе должно руководствоваться действительными пожеланиями и требованиями бизнеса, а не своими предположениями.
   ? Знание бизнеса – важно, чтобы бизнес поддерживал разработку процесса ITSCM путем опреде­ления основных направлений работы.
   ? Отсутствие осведомленности в компании – необходимо, чтобы вся организация знала о значимо­сти процесса ITSCM. Без информирования персонала и его поддержки процесс обречен на неудачу.
    Глава 14 Управление Доступностью
    14.1. Введение
   В настоящее время развитие технологии идет нарастающими темпами. По этой причине во многих организациях необходимое для работы аппаратное и программное обеспечение становится более многочисленным и разнообразным, несмотря на все попытки его стандартизации. Старые и новые технологии вынуждены существовать вместе. Такое сосуществование приводит к появлению допол­нительных сетевых средств, интерфейсов и средств коммуникации. Происходит усиление зависимо­сти бизнеса от технологий.
   Несколько часов простоя компьютера могут иметь серьезные последствия для бизнеса и репутации компании на рынке, особенно сейчас, когда Интернет превращается в электронный вариант рынка. В этом электронном мире конкурентов друг от друга отделяет простое нажатие на клавишу «мыши». В этой связи особенно важным фактором становится степень удовлетворенности заказчиков. Эта одна из причин, почему в настоящее время вычислительные системы должны быть доступны 24 часа в сутки семь дней в неделю.
    14.1.1. Основные понятия
   На рис. 14.1 схематично представлены базовые понятия процесса Управления Доступностью.
 
   
   Рис. 14.1. Концептуальные понятия процесса Управления Доступностью (источник: OGC)
 
    Доступность
   Высокий Уровень Доступности означает, что заказчик имеет практически постоянный доступ к ИТ-сервису благодаря сокращению времени простоя и быстрому восстановлению предоставления услуг. Уровень Доступности определяется с помощью метрик. Доступность сервиса зависит от:
   ? сложности ИТ-инфраструктуры;
   ? надежности компонентов;
   ? способности быстро и эффективно реагировать на сбои;
   ? качества обслуживания и качества работы поддерживающих организаций и поставщиков;
   ? качества и границ компетенции процессов операционного управления.
    Надежность [231]
   Надежность, в контексте данного процесса, означает доступность сервиса в течение согласованного периода времени без каких-либо сбоев. Эта концепция включает в себя понятие устойчивости [232]. На­дежность сервиса будет возрастать, если предпринимать превентивные меры против возникновения простоев. Надежность сервиса является статистическим показателем и определяется сочетанием следующих факторов:
   ? надежность компонентов, используемых для предоставления сервиса;
   ? способность сервиса или его компонентов эффективно функционировать, несмотря на сбой одной или нескольких подсистем (устойчивость);
   ? профилактическое обслуживание для предотвращения простоев.
    Обслуживание [233]
   Понятия "обслуживание" и "способность к восстановлению" [234]предполагают выполнение работ по обеспечению функционирования сервиса и его восстановлению после сбоев, а также проведение профилактического обслуживания и регламентных (плановых) проверок, а именно:
   ? принятие мер по предотвращению сбоев;
   ? своевременное обнаружение сбоев;
   ? проведение диагностики, включая автоматическую самодиагностику компонентов;
   ? ликвидация сбоев;
   ? восстановление функционирования после сбоя;
   ? восстановление сервиса.
    Предоставление сервиса внешними поставщиками [235]
   Данное понятие относится к договорным обязательствам внешних поставщиков сервиса (подрядчи­ки, сторонние организации). Договорами определяется поддержка, которая будет обеспечена серви­сам, поставляемым внешними организациями (аутсорсинг). Поскольку это только часть ИТ-серви­са, данный термин не относится к общей доступности сервиса. Если подрядчик несет ответствен­ность за сервис в целом, как это бывает, например, при заключении договора хозяйственного обеспе­чения, тогда термины "Предоставление сервиса" и "доступность" будут синонимами. Для эффективного Управления Доступностью необходимо знание бизнеса и ИТ-среды. Важно по­нять, что доступность нельзя просто "купить": доступность должна закладываться на самых ранних этапах разработки и внедрения. В конечном счете доступность зависит от сложности инфраструкту­ры, надежности компонентов, профессионализма ИТ-организации и ее подрядчиков и от качества самого процесса.
    14.2. Цели процесса
   Целью Процесса Управления Доступностью является обеспечение рентабельного и согласованного Уровня Доступности ИТ-сервиса, который поможет бизнесу в достижении поставленных целей. Такое определение цели процесса означает, что потребности заказчика (бизнеса) должны соответст­вовать тому, что могут предложить ИТ-инфраструктура и организация. Если имеется расхождение между спросом и предложением, тогда Процесс Управления Доступностью должен предложить вы­ход из такой ситуации. Более того, данный процесс гарантирует оценку достигнутых Уровней Дос­тупности и их дальнейшее совершенствование в случае необходимости. Это означает, что в рамках процесса выполняются как проактивные, так и реактивные виды деятельности. При разработке про­цесса следует исходить из следующих предпосылок:
   ? Использование Процесса Управления Доступностью необходимо для достижения наибольшей удовлетворенности заказчика. Доступность и надежность – два показателя, во многом определя­ющие восприятие предоставляемых услуг заказчиком.
   ? Высокая степень доступности не означает отсутствие сбоев. Управление Доступностью в основ­ном отвечает за профессиональное реагирование на такие нежелательные ситуации.
   ? Проектирование процесса требует не только полного понимания информационных технологий, но понимания процессов и услуг заказчика. Достижение целей возможно только путем сочетания этих двух аспектов.
   У Процесса Управления Доступностью широкая сфера действия, охватывающая новые и уже суще­ствующие услуги, отношения с внешними и внутренними поставщиками, все компоненты инфра­структуры (аппаратное и программное обеспечение, сети и т. д.) и влияющие на доступность организационные аспекты, такие как Уровень Знаний Персонала, управленческие процессы, процедуры и инструментальные средства.
    14.2.1. Преимущества использования процесса
   Основное преимущество, которое дает Процесс Управления Доступностью, состоит в том, что услу­ги, разработанные, внедренные и находящиеся под Управлением ИТ-организации, отвечают требо­ваниям, предъявляемым к доступности сервиса. Полное понимание бизнес-процессов заказчика и информационных технологий в сочетании с постоянным стремлением максимально расширить дос­тупность сервиса в разумных пределах могут во многом содействовать формированию реальной культуры сервиса. Другие преимущества данного процесса состоят в следующем:
   ? создание единой точки контактов по вопросам доступности продуктов и услуг и наличие одного человека, отвечающего за эти вопросы;
   ? гарантируется соответствие новых продуктов и услуг предъявляемым к ним требованиям и согла­сованному с заказчиком стандарту доступности;
   ? Уровень Затрат поддерживается на приемлемом уровне;
   ? постоянный мониторинг стандартов доступности и их совершенствование по мере необходимости;
   ? в случае недоступности сервиса выполнение восстановительных мероприятий, соответствующих ситуации;
   ? уменьшение количества отказов в доступе к системам и сокращение периода недоступности сервиса;
   ? смещение акцентов с исправления дефектов на улучшение сервиса;
   ? простота обоснования добавочной стоимости для ИТ-организации.
   Процесс Управления Доступностью связан со следующими процессами ITIL.
    Управление Уровнем Сервиса
   Процесс Управления Уровнем Сервиса осуществляет согласование и Управление Соглашениями об Уровне Сервиса, в которых Доступность является одним из важнейших параметров.
    Управление Конфигурациями
   Процесс Управления Конфигурациями располагает информацией об инфраструктуре и может пре­доставлять ценную информацию Процессу Управления Доступностью.
    Управление Мощностями
   Изменение Мощностей часто влияет на доступность сервиса, а изменения параметров доступности затрагивают параметры мощности сервиса. Процесс Управления Мощностями располагает обшир­ной информацией, включая информацию об инфраструктуре. Поэтому эти процессы часто обмени­ваются информацией о сценариях модернизации ИТ-компонентов или их вывода из операционной среды, а также о тенденциях в сфере доступности, которые могут вызвать изменения в требованиях к мощностям сервиса.
    Управление Непрерывностью Сервиса
   Процесс Управления Доступностью не несет ответственности за восстановление бизнес-процессов после катастрофы. Это обязанность Процесса Управления Непрерывностью ИТ-сервиса, который предоставляет Процессу Управления Доступностью информацию о наиболее важных бизнес-про­цессах. На практике бывает так, что многие меры по улучшению доступности сервиса приводят к улучшению непрерывности ИТ-сервиса и наоборот.
    Управление Проблемами
   Процесс Управления Проблемами непосредственно участвует в обнаружении причин существую­щих и потенциальных проблем в сфере доступности сервиса и в их устранении.
    Управление Инцидентами
   Процесс Управления Инцидентами определяет способ разрешения инцидентов. Этот процесс предос­тавляет отчеты, содержащие информацию о затратах времени на разрешение инцидентов, ремонт и т. д. Соответствующая информация используется для определения достигнутого Уровня Доступности.
    Управление Безопасностью
   Процесс Управления Доступностью тесно связан с Процессом Управления Безопасностью, в кото­ром основными вопросами являются:
   ? Конфиденциальность;
   ? Целостность;
   ? Доступность.
   Критерии безопасности следует учитывать при определении требований к доступности. Процесс Управления Доступностью может дать ценную информацию Процессу Управления Безопасностью, особенно о новых услугах.
    Управление Изменениями
   Процесс Управления Доступностью информирует Процесс Управления Изменениями о вопросах обслуживания новых услуг и их элементов и инициирует проведение изменений, обусловленных во­просами доступности. Процесс Управления Изменениями информирует Процесс Управления Дос­тупностью о содержании Перспективного Плана Изменений (FSC).
    14.3. Процесс
   Для соответствия стандартам высокой доступности сервиса производится дублирование важных компонентов там, где это возможно, и используются системы обнаружения и устранения сбоев. Ча­сто в случае обнаружения дефекта начинают автоматически действовать резервные системы. Тем не менее, в таких ситуациях также необходимо принимать организационные меры, и их может обеспе­чить Процесс Управления Доступностью.
 
   
 
   Рис. 14.2. Входы и выходы Процесса Управления Доступностью (источник: OGC)
 
   Процесс Управления Доступностью начинает действовать после того, как бизнес четко определил свои требования к доступности сервиса. Это непрерывный процесс, который заканчивается только тогда, когда прекращается предоставление сервиса.
   Входами для Процесса Управления Доступностью являются (рис. 14.2):
   ? требования бизнеса к доступности;
   ? оценка влияния на все бизнес-процессы, поддерживаемые ИТ;
   ? требования к доступности, надежности и обслуживанию ИТ-компонентов инфраструктуры;
   ? данные о неисправностях, затрагивающих услуги или их компоненты, обычно в форме записей и отчетов об инцидентах и проблемах;
   ? данные о конфигурациях услуг и их компонентах и данные мониторинга;
   ? достигнутые Уровни Сервиса в сравнении с согласованными уровнями для всех услуг, оговорен­ных в соглашении о предоставлении сервиса.
   Выходы:
   ? критерии разработки архитектуры для обеспечения доступности и восстановления новых и улуч­шаемых ИТ-услуг;
   ? технология, обеспечивающая устойчивость инфраструктуры и позволяющая уменьшить или уст­ранить воздействие дефектных компонентов;
   ? гарантии доступности, надежности и обслуживания компонентов инфраструктуры, необходимые для предоставления ИТ-сервиса;
   ? отчеты о достигнутых Уровнях Доступности, надежности и обслуживания;
   ? требования к мониторингу доступности, надежности и обслуживания;
   ? план обеспечения доступности [236]для проведения проактивного улучшения ИТ-инфраструктуры.
    14.4. Виды деятельности
   В рамках Процесса Управления Доступностью выполняется ряд ключевых видов деятельности, свя­занных с планированием и мониторингом, а именно:
   ? Планирование
   ? определение требований к доступности сервиса;
   ? проектирование систем для достижения требуемого Уровня Доступности;
   ? проектирование систем для достижения требуемой способности восстановления [237];
   ? вопросы безопасности;
   ? управление обслуживанием;
   ? разработка Плана Доступности.
   ? Мониторинг
   ? проведение измерений и составление отчетов.
   Ниже дается описание основных видов деятельности.
    14.4.1. Определение требований к доступности сервиса
   Данный вид работ должен выполняться до заключения соглашения об Уровне Сервиса, и он затра­гивает новые ИТ-услуги и изменения в уже существующих услугах. ИТ-организация должна опре­делить как можно быстрее, будет ли она выполнять эти требования и если да, то как. Во время выполнения этого вида деятельности определяются:
   ? ключевые бизнес-функции;
   ? согласованный период простоя ИТ-сервиса;
   ? количественная оценка требований к доступности сервиса;
   ? количественная оценка воздействия незапланированного простоя на бизнес-функции;
   ? рабочие часы заказчика;
   ? соглашения об "окнах" для планового обслуживания.
   Четкое определение требований к доступности сервиса на ранних этапах позволяет избежать недо­разумений и неправильного толкования договоренностей на более поздних этапах. Требования заказчика необходимо сопоставлять с теми, которые организация может предоставить. Если выявляется несоответствие, то следует определить влияние такого несоответствия на стои­мость услуг.