Единицы количества информации: бит, байт, килобайт, мегабайт, гигабайт, терабайт
"Если что-то измеряют, значит, это кому-нибудь нужно". Так мог бы сказать Маяковский, но его больше интересовали звезды. Однако всему ли присуща мера и всегда ли стоит этим заниматься? Надо же что-то оставить и поэтам.
Ко всему остальному можно применить метр и штангенциркуль.
Что было до единицы количества информации?
Даже примитивное строительство не могло обойтись без определения длины, ширины и высоты. Военные действия, которыми наши предки занимались еще раньше, чем начали что-то строить, тоже требовали вычисления расстояний, потребностей в тягловой силе и т. д. и т. п.
Но где брать единицы измерения? Жители острова, которым для счастья не хватало только календаря, тоже задавались этим вопросом, но безуспешно. Хотя решение лежало на поверхности.
На самом деле, вопрос не так уж сложен. Все первые единицы предоставила природа. У людей имелись руки и ноги. Неудивительно, что первыми возникли "локти" и "футы". "Человек есть мера всех вещей" — философское определение возникло отнюдь не на пустом месте.
Пока не требовалась точность
Сначала приблизительность измерений никого особо не волновала. Но уже во времена фараонов строители стали применять более совершенные инструменты. Если бы пирамида завалилась, по головке никого бы не погладили. Но они стоят до сих пор.
Когда впервые потребовалось измерять информацию, колесо изобретать не стали. Воспользовались старыми добрыми метрами и килограммами. Потому что информация была записана на бумаге. Бумага имела вес и объем.
Никакой речи о единице количества информации еще не было и не могло быть.
Но тут появились компьютеры
Вопрос возник еще на теоретической стадии. Потому что измерять количество информации в единицах длины и веса стало невозможно.
А без этих данных компьютер не мог быть создан. Хотя вычислительные средства уже существовали и отлично справлялись со своей задачей. Взять хотя бы "Железный Феликс", о котором помнят только те, кому далеко за пятьдесят.
Системы счисления
Как подсчитать число овец в стаде? Легко, если знать, сколько пальцев на руке. Одна, две... десять. Откладываем один камешек в сторону, повторяем процесс. Примерно так появилась первая система счисления.
А если бы у наших предков было шесть пальцев вместо пяти? Возникла бы двенадцатеричная система? Скорее да, чем нет. Хотя останки шестипалых homo sapiens до сих пор не найдены, такая система была создана. Хитрецы из Вавилона воспользовались костяшками пальцев одной руки.
Постепенно выяснилось, что систем счисления может быть сколько угодно. Для шестнадцатеричной потребуется 16 символов. Восьмеричной достаточно 8. Двоичной и того меньше - только ноль и единица.
"Инь" и "янь" цифрового мира
Двоичная система счисления оказалась последней. Придумать что-либо проще попросту невозможно. Но долгое время нею никто не пользовался. Что поделаешь, люди привыкли считать десятками.
Так и было, пока не появились первые ЭВМ. Чтобы считать, надо иметь систему счисления. Тут и вспомнили про ноль и единицу. Потому что напряжение либо есть, либо нет. Изобретать ничего не пришлось. Все уже имелось в наличии.
Двоичную систему, как выяснилось, придумали вездесущие китайцы. Император Фу Си, который по совместительству был еще и философом, дал определение системы еще за 4 тыс. лет до того, как родился Лейбниц. Выдающийся математик и сообщил в 1703 году эту пикантную новость.
Но сколько килобайт в гигабайте, не мог бы сказать и он. Не было ни того, ни другого.
Бит и его автор
Алгебру двоичного счисления для цепи, в которой течет ток, впервые описал американец Клод Шеннон в 1940 году. Ему удалось объединить электричество и математику в своей докторской диссертации. В ней он применил булеву алгебру для описания релейных схем. Логическая математика оперирует двумя понятиями: ложь и истина. Реле и выключатели электрической цепи могут быть либо включены, либо выключены. Удивительно, что никому раньше не пришло в голову сопоставить одно с другим.
Спустя 8 лет, в 1948 году, он ввел в употребление единицу количества информации и назвал ее bit. Короткое слово, известное теперь почти всем, он позаимствовал у Джона Тьюки. Тот не любил длинных названий и применял сокращение bit вместо Binary digiT. Это словосочетание переводится на русский как "двоичный разряд". Так мир узнал бит - наименьшую единицу измерения информации.
В самом общем смысле информацией называется степень неоднородности. Совершенно однородное пространство означает полное отсутствие информации. Случайно или нет, но сотворение мира Господь начал с того, что отделил свет от тьмы. В этот момент появилась информация, и она равнялась одному биту.
Рулетки бывают разные
Приверженцы азартных игр, возможно, будут разочарованы. Под рулеткой здесь понимается не то, на чем делают ставки. Есть еще измерительный инструмент с таким же названием. На нем нанесены миллиметры, сантиметры, дециметры — единицы измерения длины.
Каждое следующее деление на рулетке больше предыдущего в 10 раз. Так, получаются сантиметры, дециметры, метры и километры. Понятно, что такая градация связана с системой, применяемой для измерения длины.
А что на информационной рулетке? Здесь пришлось поступиться принципами. Бинарные разряды не соответствуют десятичным единицам измерения. Потому что в основе деления лежит степень числа 2.
Что за битом?
Следующая единица называется байтом. Чтобы понять, сколько бит содержится в 1 байте, нужно возвести 2 в третью степень. Получится восемь. Наименьшее число будет представлено в виде 00000001, наибольшее 11111111.
Отчего выбрано именно такая длина для байта? Отчасти потому, что число возможных комбинаций нолей и единиц равно 256. Этого оказалось вполне достаточно, чтобы закодировать цифры, алфавит и служебные символы для телетайпа и телеграфа.
Но вскоре байта оказалось мало. Долго мудрить не стали. Всем последующим единицам присвоили уже знакомые приставки: "кило", "мега", "гига", "тера" и так далее. Стало возможным подсчитать сколько байт в кбайт и ответить, чем Мб отличается от Гб.
Но тут начались противоречия.
Чем килограмм отличается от килобайта?
Если отвлечься от предмета измерения, то почти ничем. Приставка "кило" означает "тысяча". В одном случае имеем тысячу грамм, в другом столько же байт. Все просто и понятно. Значит, мегабайт - это миллион, гигабайт - миллиард, а терабайт - триллион байт.
Разница все же существует. Килограмм - он и в Африке килограмм, а вот килобайт не всегда 1 тыс. байт. Все дело в том, что в степенях двойки нет числа 1000. 29 = 512, а следующая степень, 210, равна уже 1024. Поэтому килобайт должен содержать не тысячу, а 1024 байта.
Чем измерить всю информацию в мире?
Все остальные деления шкалы байтов тоже получаются возведением числа 2 в степень, кратную 10:
- мегабайт — 1024 Кб (220);
- гигабайт — 1024 Мб (230);
- терабайт — 1024 Гб (240).
В каких единицах измеряется количество информации видно на рисунке.
Объем всей информации в мире в 2009 году оценивался в 0,8 зеттабайт. А в 2020 он должен возрасти до 44. Много это или мало? Если представить диск с видео такого объема, то на просмотр всех фильмов ушло бы 63 миллиона лет. Завершает ряд иотабайт. Он содержит 1024 зеттабайт, или 280 байт.