Как понять размеры данных?

размер данных, байт, килобайт, мегабайт, гигабайт, терабайт, петабайт, эксабайт, big data, большие данные, единицы памяти

Как понять размеры данных? Как понять размеры данных?

Насколько это велико? Простое руководство по пониманию огромных объёмов данных.

Термины, используемые в научных отчётах о больших данных (Big Data), иногда кажутся иностранным языком. Например, Большой адронный коллайдер, расположенный в Женеве, Швейцария, ежедневно генерирует около 42 терабайт данных. Национальный центр климатических данных, расположенный в городе Ашвилл, хранит более 6 петабайт климатической информации, собранной с кораблей, буёв, метеозондов, радиолокационных систем, спутников и компьютерных моделей. По оценкам центра, к 2020 году этот показатель должен был достичь 20 петабайт.

По расчётам специалистов, для хранения всей существующей сегодня информации в мире требуется не менее 1 200 эксабайт памяти.

Понять, что означают эти цифры, непросто. Даже эксперты признают, что такие масштабы данных поражают воображение. Специалист по информационному праву Оксфордского университета Виктор Майер-Шёнбергер и журналист Кеннет Кукьер в своей книге «Big Data», опубликованной в 2013 году, писали:

«На самом деле не существует хорошего способа представить себе, что означает такой огромный объём данных».

Чтобы понять эти масштабы, начнём с самых маленьких единиц.

Байт является основной единицей измерения компьютерной памяти. Для хранения одной буквы алфавита или одного символа обычно требуется один или два байта памяти.

Следующая единица измерения — килобайт. Один килобайт равен 1 024 байтам. Это соответствует десятой степени числа два, то есть 2¹⁰.

Мегабайт равен 2²⁰ байтам, то есть чуть более одному миллиону байт. Такого объёма памяти достаточно для хранения небольшого романа. Файл одной песни в формате MP3 среднего размера занимает примерно 4 мегабайта. Большая фотография может потребовать около 5 мегабайт памяти. Это примерно сопоставимо с объёмом памяти, необходимым для хранения всех произведений Уильяма Шекспира.

Следующая единица измерения — гигабайт. Один гигабайт равен 2³⁰ или 1 073 741 824 байтам. Такого объёма памяти достаточно для хранения одного 90-минутного фильма, примерно 250 песен или текста всех книг, расположенных на книжной полке длиной около 18 метров. Сегодня многие смартфоны на рынке оснащены памятью объёмом 16 гигабайт и более.

Далее следует терабайт. Один терабайт равен 2⁴⁰ байтам. В 2000 году учёные подсчитали, что для хранения всего печатного содержимого Библиотеки Конгресса США потребуется примерно 10 терабайт памяти.

Петабайт равен 2⁵⁰ байтам. Примерно такой объём памяти необходим для хранения одной копии всей печатной информации, существующей в мире.

Существуют и ещё более крупные единицы измерения:

Эксабайт — 2⁶⁰ байт
Зеттабайт — 2⁷⁰ байт
Йоттабайт — 2⁸⁰ байт

Если бы вся информация, хранящаяся в мире, — а это примерно 1 200 эксабайт данных — была напечатана в виде книг, то эти книги полностью покрыли бы Землю слоем толщиной в 52 книги.

А теперь представим, как информация хранилась тысячи лет назад.

Около 2 000 лет назад древние греки создали величественную библиотеку в египетском городе Александрия. Эта библиотека напоминала современные университетские кампусы с местами для прогулок, размышлений, чтения и обсуждений.

Цель Александрийской библиотеки была чрезвычайно амбициозной: собрать в одном месте все существующие письменные произведения мира. По различным оценкам, здесь когда-то хранились сотни тысяч книг и рукописей, собранных из разных уголков известного грекам мира.

Однако по современным меркам даже эта величественная библиотека выглядит очень маленькой.

Если бы вся существующая сегодня в мире информация была распределена поровну между всеми людьми на Земле, то на каждого человека пришлось бы примерно в 300 раз больше информации, чем содержалось во всей Александрийской библиотеке.

Комментарии

Новый комментарий