Окружающий мир заполнен информацией. Ежесекундно через органы чувств человек получает сотни сигналов и сообщений. Столь значимую составляющую жизни невозможно оставить без внимания, появилась даже специальная область знаний, специализирующаяся на информационных процессах и явлениях, – информатика. Ее основное оружие – умные электронно-вычислительные машины, способные быстро и точно анализировать данные и манипулировать ими. Способы представления информации в ЭВМ отличаются от тех, к которым мы привыкли, и обеспечивают максимальную эффективность вычислительного процесса.
Информация
Информация – понятие глобальное, дать ее всеохватное определение затруднительно. До сих пор не существует единого общенаучного термина, каждая область знаний оперирует собственным представлением об информации. Для простоты можно определить ее как данные о состоянии окружающего мира во всех его проявлениях.
Информация имеет смысл лишь тогда, когда ее кто-нибудь воспринимает или использует. В отличие от энергии или массы, которые, как известно, не пропадают, а лишь трансформируются, информация вполне может исчезнуть.
Основная задача информатики – научиться собирать, хранить и передавать данные. Реализация этого – дело непростое. Информация бывает разная, и каждый ее вид требует к себе особого подхода.
Виды информации
На сегодняшний день люди научились работать с огромным разнообразием данных, отличающихся природой происхождения и структурой.
Самые востребованные виды информации:
- Графическая информация – это самый первый вид данных, которым человечество научилось манипулировать. Она доступна для восприятия и не требует особенных преобразований. Наскальные рисунки – древнейшее хранилище информации об окружающем мире. На смену им пришли живопись, фотография и технические чертежи.
- Числовая информация позволяет описать количественные характеристики объектов. Важность данных этого типа взлетела до небес при развитии торговли и денежного обмена. Чтобы успешно хранить и передавать числовую информацию, пришлось придумать специальные системы символов. Каждая культура считала деньги по-своему, так образовались разные системы счисления.
- Текстовая информация – это закодированная особыми символами человеческая речь. С изобретением письменности стало возможным передавать любые концепции на сколь угодно большое расстояние, а также передавать знания следующим поколениям. Для удобства манипуляций с текстовой информацией человечеству пришлось изобрести бумагу и книгопечатание.
- Звуковая информация долго не поддавалась человеку. Лишь в конце XIX века появились первые звукозаписывающие устройства, позволяющие воспринимать и сохранять данные.
- Видеоинформация – живая графика – покорилась человеку с изобретением кинематографического аппарата.
Все эти данные могут быть записаны, обработаны электронно-вычислительными машинами и переданы от человека к человеку. Они могут храниться без потерь на протяжении долгого времени. Существуют и другие разновидности информации, с которыми человечество еще не научилось работать, например, тактильная или вкусовая.
Деление данных на виды имеет для информатики большое значение. Формы представления информации в ЭВМ базируются на ее особенностях, а каждый вид данных имеет специфическую структуру. Так, символьная и графическая информация обрабатываются машиной по-разному.
Работа с информацией
Главные остановочные пункты в жизненном цикле информации следующие:
- восприятие и сбор;
- хранение;
- передача;
- воспроизведение или отображение.
Во время длительного хранения или передачи данные могут искажаться или теряться. Значительные ошибки нарушают или полностью изменяют суть информации, следовательно, их нужно любой ценой избежать.
Для облегчения манипуляций с данными была придумана кодировка. Суть процесса кодирования в том, что информация по строго определенным правилам переводится в другую форму, над ней осуществляется некая операция, а затем происходит обратное преобразование.
Одна из первых удачных попыток кодирования – световые сигналы. Мигание источников света – удобный способ передачи информации на большие расстояния. С развитием техники люди придумали еще множество способов шифровать данные: электрические сигналы, радиоволны.
Кодирование обеспечивает большую сохранность и защищенность данных, позволяет увеличить скорость передачи информации и облегчить ее обработку.
Таким образом, информационный цикл приобретает следующий вид:
- сбор;
- кодирование;
- хранение;
- передача;
- декодирование;
- воспроизведение.
В процессе жизненного цикла данные могут неоднократно подвергаться кодированию и декодированию с использованием разных кодовых систем. Это необходимо для приведения информации в более удобное состояние для осуществления конкретной операции.
Материальная основа информации
Производить какие-либо реальные манипуляции можно только над материальными объектами, имеющими определенные характеристики, которые можно зафиксировать и измерить. Представление информации в ЭВМ базируется на электрических сигналах.
Работающие с данными узлы машины представлены огромным количеством крошечных элементов, которые в любой момент времени пребывают в одном из двух состояний: включенном или выключенном. Конкретная технология реализации может отличаться для разных ЭВМ и даже для разных блоков одной машины. Выключенное состояние обозначается нулем – отсутствие сигнала, включенное – единицей.
Количество информации, получаемое от одного структурного элемента, – один бит. Слово «бит» образовано от выражения binary digit (двоичная цифра). 1 бит – минимальная единица информации. Вся информация в компьютерах представлена последовательностью битов – нулей и единиц. Поразительно, какое огромное многообразие данных может быть зашифровано таким простым способом!
Представление информации в ЭВМ в виде отдельных точечных значений называется дискретным. По сравнению с аналоговым, оно проще реализуется и позволяет легче оперировать большими объемами данных.
Двоичный код
Последовательность битов, представляющая некоторые данные, называется двоичным кодом. С его помощью может быть закодирована любая информация: числовая, символьная, графическая.
Правила, по которым данные преобразуются в машинный код, специфичны для каждого типа. Отдельные значения в них могут совпадать, поэтому декодирование всегда производится в зависимости от контекста.
Двоичное представление информации в ЭВМ имеет ряд преимуществ:
- удобство реализации: двухпозиционные элементы гораздо проще и надежнее трех- и более позиционных;
- помехоустойчивость: сигнал, в котором присутствуют только два возможных состояния гораздо проще для восприятия;
- простота вычислений: двоичная арифметика максимально проста.
Математическая основа представления информации в ЭВМ – система счисления с основанием 2. Она намного проще привычной нам десятичной системы, оперирует всего двумя цифрами – нулем и единицей – и определяет правила всех математических операций, производимых над двоичным кодом.
Числовая информация
Существует три способа представления числовой информации в ЭВМ:
- число с фиксированной точкой;
- число с плавающей точкой;
- двоично-десятичное представление.
У чисел с фиксированной точкой, как следует из названия, место точки (запятой), отделяющей дробную часть строго определено и зафиксировано.
- Если точка находится после последней значащей цифры – число является целым.
- Расположение точки перед первой значащей цифрой соответствует правильной дроби (меньше единицы по модулю).
Для определения знака выделен самый первый разряд. У положительных чисел в нем расположен 0, у отрицательных – 1.
Главное преимущество такой формы представления – отсутствие погрешностей округления при вычислениях. Главный недостаток – ограниченный диапазон значений, зависящий от разрядной сетки конкретной ЭВМ.
Числа с плавающей точкой представлены сочетанием значений мантиссы и порядка. Такая форма записи называется полулогарифмической.
Точность вычислений для такого представления зависит от длины мантиссы: при округлении могут отсекаться лишние разряды.
И числа с фиксированной точкой, и мантисса, и порядок чисел с плавающей точкой представлены в двоичной системе.
Двоично-десятичное представление чисел обеспечивается специальными процессорами в составе ЭВМ. Число обрабатывается как десятичное, но каждая его цифра представляется двоичной тетрадой. Это позволяет сократить время обработки больших массивов десятичных чисел.
Текстовая информация
Для представления текстовой информации в ЭВМ используются специальные таблицы, в которых каждому символу ставится в соответствие уникальный двоичный код.
В наиболее популярной кодировке ASCII (Американский стандарт кода для международного обмена) на один символ выделено 8 бит – 1 байт. Для кодовой единицы такого размера существует 256 уникальных комбинаций, следовательно, можно закодировать 256 разных текстовых символов. Помимо букв разных алфавитов, в таблице учитываются математические операторы, знаки препинания и прочие специальные элементы.
Конечно, 256 комбинаций – слишком мало для нашего мультикультурного мира. Некоторые языки сами по себе содержат больше букв. В таблицах Unicode увеличили размер базовой единицы кода, выделив под нее 2 байта (16 бит). Это позволило увеличить предел кодирования до 65536 элементов.
Растровая графика
Представление графической информации в ЭВМ называют матричным. Оно основано на разбиении изображения на ряды точек (пикселей). Для каждого пикселя информация о положении, цвете и яркости сохраняется отдельно.
В черно-белых изображениях для точки достаточно указать "степень серости" – одну из 256 градаций серого цвета. Для этого выделяется 1 байт (8 бит).
Цветные иллюстрации требуют больше данных. Чтобы закодировать информацию о цвете точки, его представляют в виде композиции трех базовых цветов: красного, зеленого и синего. Это модель Red-Green-Blue – RGB. Кодирование одной точки цветного изображения требует 24 разрядов – по одному байту (8 бит) для каждой составляющей.
Векторная графика
Изображение может быть описано и по-другому. Для этого оно разбивается на элементарные фигуры – отрезки, дуги, круги. Каждая часть может быть описана с помощью математических формул. Так, круг представляется совокупностью координаты центра и радиуса окружности. Такой способ описания графики называется векторным.
Звуковая информация
Способы представления в ЭВМ информации о звуках значительно сложнее. Они активно развиваются, но еще далеки от стандартизации. Существует два основных направления обработки звуковых сигналов:
- Частотные модуляции (FM) – это попытка разложить звук на последовательность простых правильных гармонических сигналов, параметры которых можно описать. Основная сложность в том, что звук по своей природе непрерывен, а преобразование аналогового сигнала в дискретный всегда сопровождается потерями данных.
- Таблично-волновой синтез предполагает использование сэмплов – образцов звуков. При этом кодируется тип музыкального инструмента, высота тона, интенсивность и длительность сигнала. Качество полученного звука получается выше, чем в предыдущем способе, так как используются реальные образцы.
Мир заполнен информацией самых разных видов. Чтобы с ней работать, человек придумал кодирование – перевод сложных данных в простую форму для удобства хранения, передачи и обработки. В ЭВМ представление информации осуществляется в виде бинарного кода – последовательности отдельных битов. Любые данные могут быть зашифрованы таким методом. Все операции над числами компьютер производит по правилам двоичной системы счисления.