Насколько это велико? Простое руководство по пониманию огромных объёмов данных.
Термины, используемые в научных отчётах о больших данных (Big Data), иногда кажутся иностранным языком. Например, Большой адронный коллайдер, расположенный в Женеве, Швейцария, ежедневно генерирует около 42 терабайт данных. Национальный центр климатических данных, расположенный в городе Ашвилл, хранит более 6 петабайт климатической информации, собранной с кораблей, буёв, метеозондов, радиолокационных систем, спутников и компьютерных моделей. По оценкам центра, к 2020 году этот показатель должен был достичь 20 петабайт.
По расчётам специалистов, для хранения всей существующей сегодня информации в мире требуется не менее 1 200 эксабайт памяти.
Понять, что означают эти цифры, непросто. Даже эксперты признают, что такие масштабы данных поражают воображение. Специалист по информационному праву Оксфордского университета Виктор Майер-Шёнбергер и журналист Кеннет Кукьер в своей книге «Big Data», опубликованной в 2013 году, писали:
«На самом деле не существует хорошего способа представить себе, что означает такой огромный объём данных».
Чтобы понять эти масштабы, начнём с самых маленьких единиц.
Байт является основной единицей измерения компьютерной памяти. Для хранения одной буквы алфавита или одного символа обычно требуется один или два байта памяти.
Следующая единица измерения — килобайт. Один килобайт равен 1 024 байтам. Это соответствует десятой степени числа два, то есть 2¹⁰.
Мегабайт равен 2²⁰ байтам, то есть чуть более одному миллиону байт. Такого объёма памяти достаточно для хранения небольшого романа. Файл одной песни в формате MP3 среднего размера занимает примерно 4 мегабайта. Большая фотография может потребовать около 5 мегабайт памяти. Это примерно сопоставимо с объёмом памяти, необходимым для хранения всех произведений Уильяма Шекспира.
Следующая единица измерения — гигабайт. Один гигабайт равен 2³⁰ или 1 073 741 824 байтам. Такого объёма памяти достаточно для хранения одного 90-минутного фильма, примерно 250 песен или текста всех книг, расположенных на книжной полке длиной около 18 метров. Сегодня многие смартфоны на рынке оснащены памятью объёмом 16 гигабайт и более.
Далее следует терабайт. Один терабайт равен 2⁴⁰ байтам. В 2000 году учёные подсчитали, что для хранения всего печатного содержимого Библиотеки Конгресса США потребуется примерно 10 терабайт памяти.
Петабайт равен 2⁵⁰ байтам. Примерно такой объём памяти необходим для хранения одной копии всей печатной информации, существующей в мире.
Существуют и ещё более крупные единицы измерения:
Эксабайт — 2⁶⁰ байт
Зеттабайт — 2⁷⁰ байт
Йоттабайт — 2⁸⁰ байт
Если бы вся информация, хранящаяся в мире, — а это примерно 1 200 эксабайт данных — была напечатана в виде книг, то эти книги полностью покрыли бы Землю слоем толщиной в 52 книги.
А теперь представим, как информация хранилась тысячи лет назад.
Около 2 000 лет назад древние греки создали величественную библиотеку в египетском городе Александрия. Эта библиотека напоминала современные университетские кампусы с местами для прогулок, размышлений, чтения и обсуждений.
Цель Александрийской библиотеки была чрезвычайно амбициозной: собрать в одном месте все существующие письменные произведения мира. По различным оценкам, здесь когда-то хранились сотни тысяч книг и рукописей, собранных из разных уголков известного грекам мира.
Однако по современным меркам даже эта величественная библиотека выглядит очень маленькой.
Если бы вся существующая сегодня в мире информация была распределена поровну между всеми людьми на Земле, то на каждого человека пришлось бы примерно в 300 раз больше информации, чем содержалось во всей Александрийской библиотеке.