Краткое руководство по внедерению архивирования документов в облаке
Перевод статьи Ричарда Медины, сооснователя и консультанта Doculabs Inc.
Если вы полагаете, что вашей компании стоит перейти на хранение документов в облаке, стоит предпринять два шага к принятию этого решения. Первый – понять каковы все-таки потребности вашей компании в вопросе архивирования документов - хранить их на собственных серверах или же выбрать облачное хранилище. После этого необходимо полностью прояснить для себя все аргументы за и против обоих вариантов.
Что такое архив?
Архив – это система, которая, как минимум:
- позволяет безопасно хранить документы (здесь слово “документы” употребим, обобщая всевозможные виды контента, включая электронные письма, документы, социальные медиа, и вэб-страницы.)
- позволяет хранить документы столько, сколько это необходимо.
- удаляет документы, когда они больше не нужны для соблюдения требований регулирующих органов или юристов, а также более не используются для бизнес-процессов.
- позволяет авторизованным пользователям (внутренним или внешним) получать доступ к документам для различных целей (бизнес-процессов, работы с клиентами или агентами, для изучения.)
Помимо этих требований архивы также типично имеют функции дедупликации данных, индексации и некоторые возможности по предъявлению электронной информации в регулирующие органы.
Если вы проанализируете, как ваша компания и компании, продобные вашей, архивировали данные ранее, вы увидите, как эти технологии развивались.
Для неструктурированных данных или контента, по большей части, архивирование было сфокусировано на неизменяемом контенте, генерируемом системой: различные отчеты, EOB (Explanation Of Benefits - отчет, высылаемый медицинскими страховыми компаниями клиентам, поясняющий, какое лечение и медицинские услуги покрывает их страховка), корреспонденция. Изображения тоже архивировались.
Когда вопрос о безопасности информации из электронной почты стал беспокоить компании, учитывая объемы информации и риски, архивирование стало более контентоориентированным. Архивирование электронной почты появилось не случайно. И я расскажу эту историю ниже. Все более часто (опять-таки из-за большого объема информации и рисков) хаотичное скопление динамично заполняемых документов (например, документы Microsoft Office), веб-содержимое и совместно разрабатываемые документы начали архивироваться совместно с другими формами электронной коммуникации, например, мгновенными сообщениями.
Все это ведет нас к дню сегодняшнему, когда крупные компании заинтересованы в архивировании всего вышеперечисленного, плюс информации о сделках, неструктурированных данных бизнес-систем, а также крупных файлов вроде аудио, видео и даже целых приложений.
Урок из истории архивирования электронной почты
Очень важно понимать, что конкретно вы хотите от архива, так как вариантов очень много, а вам нужно только то, что вам идеально подойдет. Позвольте мне рассказать вам историю об архивировании электронной почты, чтобы увидеть ситуацию в перспективе.
В ранних 2000-х достаточно большое количество поставщиков ЕСМ-продуктов пыталось создать решения для архивирования электронной почты. Они пытались использовать основные возможности ЕСМ-систем для архивирования, а также добавлять функции управления записями. И чем больше функций они добавляли, тем менее интересные интрументы архивирования они предлагали. Они не могли дать простое и вразумительное решения для базовых задач архивирования.
Их постигло фиаско по 4 направлениям:
- Они не смогли найти достойное решение, как управлять большими количеством учетных записей и почтовых ящиков,
- Они не смогли обеспечить надежный и быстрый доступ пользователям, которых хотели бы находить и восстанавливать прежние электронные письма и вложения.
- Некоторые вложения терялись
- у них не получилось сделать достаточное удобное место хранения – потому что пользователи переставали пользоваться системой и начинали копить электронную почту в других местах, не доверяя архиву компании делать то, для чего он предназначен.
Поэтому многие компании забросили свои основанные на ЕСМ-системах архивы, чтобы снова обратиться к специалистам по архивированию, которые были способны решать их задачи.
Архивирование на сегодняшний день предлагает гораздо больше возможностей, чем 12 лет назад. Теперь можно архивировать все: от переписки в социальных сетях до веб-страниц, фильмов, электронных писем, очередей печати.
Можно использовать архивирование для соблюдения требований регулирующих органов, для активного использования в бизнес-процессах, для доступа и совместной работы с клиентами и электронного хранения документов для предоставления защищенного доступа и т.д.
Это все совершенно разные сценарии с различными требованиями. И, обращаясь непосредственно к теме этой статьи, архивировать можно как на собственных серверах, так и в облаке. Так что вы должны быть уверены, что понимаете, зачем собираетесь архивировать.
Что должен делать ваш архив?
Начнем с этих ключевых и основных требований для архивирования. Вы должны все как следует взвесить, исходя из текущей ситуации в компании.
Возможно, стоит добавить какие-то дополнительные, более узкоспециализированные функции, такие как: возможность предоставления информации регулирующим органами (например, в финансовой сфере) или же расширенные возможности размещения информации в системы, предоставляющие возможность защищенного доступа. Также можно сфокусироваться на хранении определенных типов файлов: быстрые сообщения, групповые переписки, видео, веб-страницы и пр.)
Наиболее важные повышенные корпоративные требования к хранению документов в архивах – это:
- Возможности по разворачиванию и внедрению
- Доступность
- Защищенность
- Целостность и сохранность сведений
- Удобное расположение хранилища
- Интегрируемость
Давайте кратко обратимся к каждому из требований.
1. Возможности по разворачиванию и внедрению. Архив должен оперировать большими объемами информации и давать доступ пользователям к нужной информации в любой момент, когда сведения понадобятся. К всему прочему, поиск документа в архиве должен занимать приемлемое количество времени, и система должна выполнять операции по архивированию данных без заметного для пользователя негативного влияния на производительность системы.
2. Доступность. Архив должен предоставлять механизм для авторизованных пользователей для поиска и восстановления документов. Дополнительно архив должен обеспечивать возможность для определенных внешних пользователей получать доступ к таким документам, как электронные презентации для клиентов и агентов.
Это требование очень важно – не только по очевидной причине (вы хотите, чтобы нужная информация была доступна нужным, то есть авторизованным пользователям в нужное время), но еще и потому, что без этого пойдут ко дну все ваши надежды об организации удобного и защищенного архива компании.
Если вы не можете обеспечить быстрый (достаточно) и надежный доступ к документам, пользователи вскоре забросят систему и буду складировать свои электронные сообщения, объекты социальных медиа и прочее где-то у себя.
И это помешает не только внедрить систему удаления ненужных документов, но и поставит вас перед сложным вызовом – “отвоевать” обратно пользователей, забросивших систему.
3. Защищенность. Архив должен “уметь” ограничивать доступ к документам, которые являются личными, конфиденциальными, предназначенными только определенному кругу пользователей, секретными. То же относится к документам, необходимым для продолжения определенных бизнес-процессов.
Это может включать требования по шифрованию данных. Некоторые поставщики ПО стараются предложить изящные решения с возможностью доступа по двойной аутентификации с паролем, предоставляемым клиенту для улучшенной защиты данных в облаке.
4. Целостность и сохранность сведений.
Казалось бы, тут все очевидно. Но архив должен хранить документы в течение определенного периода времени, следуя требованиям бизнес-процессов и требованиям к хранению документов, выдвигаемым регулирующими органами.
Кроме того, архив должен предоставлять достаточные гарантии подлинности. И, наконец, если это применимо к вашей компании, архив должен предоставлять возможность хранения информации в неизменяемом виде, когда это необходимо.
5. Место расположения.
Добавление функции сохранения информации – это защищенное месторасположение: архив должен поддерживать удаление ненужных более документов, и это должно быть приуроченно как ко времени, так и к событиям.
Привязанные в определенным событиям операции сохранения информации должны быть гораздо более сложными, чем сохранение с привязкой к определенному времени. Когда вы начинаете заниматься управлением электронными записями – даже в тщательно и изящно проработанной ЕСМ или RM системе, вы обнаружите, что обязаны будете совершенно критически упрощать расписание сохранения файлов, если хотите, чтобы это работало.
Как правило, это 10-кратное сокращение – из сложнейших графиков в 2000 серий до графиков из 200 серий или даже менее.
Одна из лучших практик - совместить ориентированные на время и ориентированные на событие операции и связать их между собой событием долгого действия. Конечно, получится, что вы храните некоторые записи чуть дольше, чем в идеале. Однако несмотря на это, работа будет сделана.
Этот метод подойдет, если вы только начинаете архивировать. Начните с крупных категорий, потом постепенно расщепляйте их на более мелкие. Также архив должен иметь механизм, который будет запрашивать подтверждение перед тем, как что-то удалить. И он должен поддерживать корректирование удаления в случаях, если документ хранится уже дольше, чем того требуют законодательные нормативы.
Наконец, архив должен позволять персоналу, авторизованному в системе, периодически просматривать и редактировать периоды хранения информации.
6. Интеграция. Архив должен иметь основанную на определенных стандартах архитектуру и открытый интерфейс программирования приложений, который позволяет интеграцию с другими системами или компонентами, включая те решения, которые на сегодняшний день уже используются в вашей компании.
Хранение в облаке может поставить вас перед двумя вызовами, с учетом интеграции.
Во-первых, вы должны представлять, как вы собираетесь интегрироваться с облачным архивом. Если вы будете пользоваться услугами сервис-провайдера, технология архивирования может быть непрозрачной для вас. Вы сами должны будете проводить исследование, пытаясь изучить техническую сторону вопроса. Это в большинстве случаев очень существенный пункт требований. Такой же важный, как разворачиваемость.
Архивирование на собственных серверах против облачного решения
Мы очертили основные требования для архивирования, теперь посмотрим на главные плюсы и минусы того и другого способа архивирования.
Решения для архивирования на сервере
Многие серверные решения созданы специально для архивирования, большинство из них специализировано на хранении файлов и электронной почты из соображений информационной защиты. Но некоторые из этих соображений восходят к возможностям архивирования на мейнфрейме и воспроизводимом пространстве или на документах корпоративного приложения и пространстве хранения данных.
Плюсы:
Многие из этих решений давно появились и хорошо проработаны. Иногда я думаю, что когда люди исчезнут с лица Земли, некоторые из этих систем по-прежнему будут работать, доказывая свою надежность. Некоторые из них легко разворачиваются и могут выполнять очень сложные сценарии со множеством интеграций с входящими и исходящими потоками данных, с участие более 100 000 полльзователей и более чем петабайтом объектов.
Минусы:
В понятие риска поставщика и продукта входит множетсво факторов: многие из поставщиков начали свою деятельность еще в старые времена. Они цепляются за то, что знают, не имея достаточно четкого представления, как развивать продукт дальше.
Многие начали с одного вида архивирования и стали осваивать другие, более современные способы, но при этом не особенно преуспели в этом. Это перекликается с архивированием истории электронной почты, об этом я уже излагал выше.
Серверные решения, как правило, требуют много ресурсов, чтобы начать полноценно работать. Вы должны будете инвестировать в целую инфраструктуру, иногда очень сложную. В некотором роде это хорошо, так как такая структура помогает решать комплексные сложные задачи. Однако некоторые неэффективные или устаревшие модули блудут вам совершенно ни к чему, если ваши потребности скромны или если у вас небольшая компания.
Наконец, некоторые решения из этой категории не имеют определенных возможностей RM, которые могут быть вам интересны в будущем. Чтобы реализовать операцию сохранения информации, привязанную к определенному событию, вам, возможно, придется создать “систему Франкенштейна”, составленную из разрозненных элементов продуктов других поставщиков.
Облачные решения для архивации
Эти решения, фактически, позволяют вам отдать задачу хранения больших объемов данных на аутсорсинг в обмен на абонентскую плату. Тарификация может идти от объемов хранилища, от числа пользователей или от объема извлечения данных.
Плюсы:
Это хороший варинат, как с точки зрения предварительных расходов, так и с точки зрения экономии сбережений в течение ближайших нескольких лет.
Это растущий рынок. В любом случае, тут появление нововведений будет по-прежнему опережать элементы и функции, которые устаревают или исчезают. Разворачивание и поддержка таких решений требует меньше ресурсов, поэтому риск неудачного внедрения меньше.
Я считаю, что большинство организаций и поставщиков чрезвычайно недооценивают вероятность и негативное влияние неудачных внедрений, поэтому я считаю, это преимущество очень важно.
Облачные решения могут предоставить вам масштабируемость и гибкость – в них, в целом, есть все необходимое, хотя вы и не может отшлифовать и настроить ваш архив до состояния произведения искусства.
Минусы:
Тем не менее, у облачных решений есть и ряд своих недостатков (хотя и неактуальных в настоящее время для лучших представителей на рынке). Например, безопасность данных сейчас стала обеспечиваться гораздо лучше. В настоящее время у облачных решений защищенность порой даже лучше, чем у многих серверных. Другие недостатки у облачных решений точно такие же, что и у серверных. Но в случае с облачной архивацией риски больше, так как это более новый способ, и не всегда понятно, с чем придется столкнуться.
Например, некоторые решения не будут соответствовать вашим требованиям безопасности и доступности (несмотря на то, что я только что сказал), и попытки выяснить, сможет ли провайдер сделать доработки, эти недостатки устраняющие, могут потребовать от вас гораздо больших усилий, чем применение других решений.
Многие решения могут не удовлетворить ваши функциональные требования: как и поставщики серверных решений, поставщики облачных систем пытаются выйти за пределы общего архивирования, расширяя возможности (например, управление электронной почтой, электронного обнаружения, социальные медиа). И тут вам, опять-таки придется проводить серьезные исследования, чтобы убедиться, что поставщики смогут обеспечить вам надежное решение со всеми необходимыми для полноценной работы на вашем предприятии функциями.
Архивирование старейшая и наиболее зрелая ECM технология, предлагаемая на рынке (вне зависимости от того, серверные или облачные решения имеются в виду). Она восходит к 90-м годам, и у нас есть много клиентов, которые делали это успешно в течение более чем 10 лет. Это, безусловно, повод задуматься. Но прежде чем применять эту технологию будьте уверены, что верно оценили ваши конкретные требования к системе.