Исследовательская компания IDC сегодня опубликовала прогноз, согласно которому к 2011 году общие объемы информации, хранимые во всем мире на всех существующих цифровых носителях, превысят 1800 экзабайт, что в 10 раз больше, чем в 2006 году, когда суммарные объемы хранимых во всем мире данных составили 180 экзабайт (1 экзабайт = 1 миллиард гигабайт).
Аналитики из IDC говорят, что ежегодные темпы прироста объемов хранимых данных в мире составляют 60%, что больше, чем прогнозировалось еще 3 года назад. "Количество файлов, существующих на компьютерах, серверах, ноутбуках, системах хранения и съемных носителях, увеличивается почти в геометрической прогрессии", - говорят в IDC. "На самом деле, если перевести все объемы информации в простые биты и посчитать их, то полученное число уже будет превосходить количество звезд во Вселенной. На основании расчетов можно утверждать, что количество данных каждые 5 лет увеличивается десятикратно".
Составители отчета приводят интересное сравнение: если нынешняя тенденция продолжится, то к 2023 году количество хранимых бит информации превысит Число Авогадро, которым обозначается количество атомов углерода в 12 граммах (602 200 000 000 000 000 000 000 атомов).
Также в прогнозе IDC говорится, что рост количества файлов, хранящихся в электронном виде, на 50% превышает суммарный рост объемов хранимых данных, поэтому к 2011 году аналитики прогнозируют появление 20-квадрилионного файла (20 миллионов миллиардов).
Аналитики говорят, что по состоянию на конец 2007 года в мире хранилось около 281 экзабайта данных, что почти на 10% больше, чем прогнозировалось в 2006 году. Расхождение в компании объяснили более стремительным ростом популярности цифровых медианосителей и объемов графических, аудио- и видео-файлов в глобальной сети.
По своей структуре существующие на сегодня файлы очень различны - это могут быть как 6-гигабайтные образы DVD-дисков, так и мета-файлы RFID-меток, размер которых не превышает 128 байт. Однако исследования показывают, что активно пользователями эксплуатируется менее половины из всех хранимых данных, остальные файлы - это, так называемые "цифровые тени", к которым относятся файлы интернет-кешей в браузерах, журнальные файлы на серверах, данные об уже совершенных транзакциях, истории веб-поиска и прочие.
В IDC и крупнейшем мировом производителе систем хранения, компании EMC, говорят, что если корпоративные пользователи и руководители ИТ-отделов взглянут на информацию, хранимую на их серверах и рабочих компьютерах, то будут неприятно удивлены ее растущими объемами. Однако эта проблема - лишь верхушка айсберга. Собранные данные необходимо как-то защитить и сохранить, что становится все более трудоемкой задачей.
Для того чтобы снизить утечки данных или внезапную пропажу файлов, аналитики рекомендуют, во-первых, пересмотреть информационные потоки в компании, так как существует очень большая вероятность их избыточности и дублированности, во-вторых, следует выработать четкие критерии необходимости тех или иных данных, иными словами, нужно четко понимать, что нужно хранить, а что нет. Наконец, в-третьих, не помешает использовать современные решения, которые позволяют избежать неконтролируемого роста файлов. К таким решениям относят системы виртуализации, централизованного хранения, защиты данных и преобразования их в структурированный вид при помощи СУБД, пишет CyberSecurity.
Кроме того, в отчете говорится, что на сегодня около 70% генерируемой информации приходится на долю индивидуальных пользователей, однако за 85% всей хранимой информации ответственны компании (например бОльшая часть данных, размещаемых на YouTube, создается пользователями, но отвечать за их содержание и хранение, в том числе и перед правообладателями, приходится компании Google).
"Простое письмо размером 1 мегабайт, отправленное по 4 электронным адресам, в общей сложности генерирует до 50 мегабайт информации. Об этом нужно помнить", - говорят в IDC.