Кодировка ASCII (American standard code for information interchange) - базовая кодировка текста для латиницы

По данным Международного Союза электросвязи, в 2016 году Интернетом с той или иной регулярностью пользовалось три с половиной миллиарда человек. Большинство из них даже не задумываются о том, что любые сообщения, посылаемые ими через ПК или мобильные гаджеты, а также тексты, которые отображаются на всевозможных мониторах, на самом деле представляют собой комбинации из 0 и 1. Такое представление информации называется кодированием. Оно обеспечивает и значительно облегчает осуществление ее хранения, обработки и передачи. В 1963 году была разработана американская кодировка ASCII, которой и посвящена данная статья.

кодировка ASCII

Представление информации в компьютере

С точки зрения любой электронно-вычислительной машины текст представляет собой набор отдельных символов. К их числу принадлежат не только буквы, включая заглавные, но и знаки препинания, цифры. Кроме того, используются спецсимволы «=»,«&», «(» и пробелы.

Множество символов, из которых состоит текст, называется алфавитом, а их количество — мощностью (обозначается, как N). Для ее определения используется выражение N = 2^b, где b — число бит или информационный вес конкретного символа.

Доказано, что алфавит мощностью 256 символов позволяет представить все необходимые символы.

Так как 256 представляет собой 8 степень двойки, то вес каждого символа равен 8 бит.

Единица измерения 8 бит называется 1 байтом, поэтому принято говорить, что двоичный код любого символа в тексте, хранящемся на компьютере, занимает один байт памяти.

Как осуществляется кодирование

Любые тексты вводятся в память персонального компьютера посредством клавиш клавиатуры, на которых написаны цифры, буквы, знаки препинания и прочие символы. В оперативную память они передаются в двоичном коде, т. е. каждому символу сопоставляется привычный для человека десятеричный код, от 0 до 255, которому соответствует двоичный код - от 00000000 до 11111111.

Побайтовое кодирование символов позволяет процессору, выполняющему обработку текста, обращаться к каждому символу отдельно. В то же время 256 символов вполне достаточно для представления любой символьной информации.

Кодировка символов ASCII

Эта аббревиатура на английском расшифровывается как American standard code for information interchange.

Еще на заре компьютеризации стало очевидно, что можно придумать самые разнообразные способы кодировки информации. Однако для переноса информации с одной ЭВМ на другую требовалось разработать единый стандарт. Так, в 1963 году в США появилась таблица кодировки ASCII. В ней любому символу компьютерного алфавита поставлен в соответствие его порядковый номер в двоичном представлении. Изначально кодировка ASCII использовалась только в Соединенных Штатах, а затем стала международным стандартом для ПК.

Содержание таблицы

Коды ASCII делятся на 2 части. Международным стандартом считается лишь первая половина этой таблицы. В нее входят символы с порядковыми номерами от 0 (кодируется как 00000000) до 127 (код 01111111).

Порядковый номер N	Кодировка текста ASCII	Символ
0 - 31	0000 0000 - 0001 1111	Символы с N от 0 до 31 называют управляющими. Их функцией является «руководство» процессом вывода текста на монитор или печатающее устройство, подача звукового сигнала и т.п.
32 - 127	0010 0000 - 0111 1111	Символы с N от 32 до 127 (стандартная часть таблицы) — прописные и строчные буквы латинского алфавита, 10-ные цифры, знаки препинания, а также различные скобки, коммерческие и др. символы. Символом 32 обозначается пробел.
128 - 255	1000 0000 - 1111 1111	Символы с N от 128 до 255 (альтернативная часть таблицы или кодовая страница) могут иметь различные варианты, каждый из которых имеет свой номер. Кодовая страница используется для задания национальных алфавитов, которые отличны от латинского. В частности, именно с ее помощью осуществляется кодировка ASCII для русских символов.

В таблице кодировки прописные и строчные буквы идут друг за другом в алфавитном порядке, а цифры - по возрастанию значений. Такой принцип сохраняется и для русского алфавита.

Управляющие символы

Таблица кодировки ASCII изначально создавалась для приема и передачи информации по такому уже давно не используемому устройству, как телетайп. В связи с этим в набор символов были включены непечатаемые, используемые в качестве команд для управления этим устройством. Подобные команды применялись и в таких докомпьютерных методах обмена сообщениями, как азбука Морзе, и пр.

Самым распространенным «телетайпным» символом является NUL (00, «нулевой»). Он и по сей день используется в большинстве языков программирования, обозначая признак конца строки.

Где применяют кодировку ASCII

Американский стандартный код необходим не только для ввода текстовой информации с клавиатуры. Его также используют в графике. В частности, в программе ASCII Art Maker изображения различных расширений представляют собой спектр символов кодировки ASCII.

Подобные продукты бывают двух типов: выполняющие функцию графических редакторов путем преобразования изображения в текст и конвертирующие «рисунки» в ASCII-графику. Например, известный смайлик является ярким примером кодировочного символа.

ASCII может использоваться и при создании документа HTML. В таком случае вы можете вводить некий набор знаков, а при просмотре страницы на экране появится символ, который соответствует данному коду.

ASCII необходим и для создания многоязычных сайтов, так как знаки, которые не входят в конкретную национальную таблицу, заменяются ASCII-кодами.

Некоторые особенности

Для кодирования текстовой информации в кодировке ASCII изначально использовали 7 бит (один оставался пустым), однако сегодня она работает как 8-битная.

Буквы, располагающиеся в колонках, находящихся сверху и снизу, отличаются друг от друга только одним-единственным битом. Это значительно снижает степень сложности проверки.

Применение ASCII в Microsoft Office

При необходимости этот вид кодирования текстовой информации может использоваться в текстовых редакторах корпорации Microsoft, таких как Notepad и Office Word. Однако при наборе текста в таком случае будет невозможно использовать некоторые функции. Например, вы не сможете осуществлять выделение жирным шрифтом, так как кодировка ASCII сохраняет только смысл информации, игнорируя ее общий вид и форму.

Стандартизация

Организация ISO приняла стандарты ISO 8859. Эта группа определяет восьмибитные кодировки для разных языковых групп. В частности, ISO 8859-1 — это Extended ASCII, представляющая собой таблицу для Соединенных Штатов и стран Западной Европы. А ISO 8859-5 — это таблица, применяемая для кириллицы, в том числе для русского языка.

По ряду исторических причин стандарт ISO 8859-5 использовался очень недолго.

Для русского языка на данный момент реально применяются кодировки:

CP866 (Code Page 866) или DOS, которая часто называется альтернативной кодировкой ГОСТ. Она активно использовалась до середины 90-х годов прошлого века. На данный момент практически не используется.
КОИ-8. Кодировка была разработана в 1970-80-е годы, и на данный момент это общепринятый стандарт для почтовых сообщений в Рунете. Она широко применяется и в ОС семейства Unix, в том числе Linux. «Русский» вариант КОИ-8 называется КОИ-8R. Кроме того, существуют версии и для других кириллических языков, например украинского.
Code Page 1251 (CP 1251, Windows - 1251). Разработан корпорацией Microsoft для обеспечения поддержки русского языка в среде Windows.

Основным достоинством первого стандарта CP866 было сохранение псевдографических символов на тех же позициях, что и в Extended ASCII. Это позволяло запускать без изменений текстовые программы, зарубежного производства, такие как известный Norton Commander. На данный момент CP866 применяется для программ, разработанных под Windows, которые работают в полноэкранном текстовом режиме или в текстовых окнах, в том числе в FAR Manager.

Компьютерные тексты, написанные в кодировке CP866, в последнее время встречаются достаточно редко, однако именно она применяется для русских имен файлов в "Виндоус".

"Юникод"

На данный момент наиболее широкое распространение получила именно эта кодировка. Коды "Юникода" разделены на области. Первая (от U+0000 до U+007F) включает символы набора ASCII с кодами. Затем следуют области знаков различных национальных письменностей, а также пунктуационные знаки и технические символы. Кроме того, часть кодов "Юникода" зарезервирована на случай возникновения необходимости включить новые символы в будущем.

Теперь вы знаете, что в кодировке ASCII каждый символ представляется как комбинация 8 нулей и единиц. Неспециалистам эта информация может показаться ненужной и неинтересной, но разве вам не хочет знать, что происходит «в мозгах» вашего ПК?!

Наира 12 июня, 2017

Комментарии

Как сейчас выглядит Анна Синякина, сыгравшая в "Ворошиловском стрелке"

Анну Юрьевну Синякину величают «тургеневской девушкой отечественного кинематографа». Эта артистка больше знакома любителям театра, а кинозрители вспом...

Знаменитости

Из санитарки в больнице во владелицу сети клиник: история успеха Елены Малышевой

Наверное, каждый человек, проживающий в России, знает о том, кто такая Елена Малышева. Она - доктор, популярная и известная ведущая, успешная бизнес-л...

Знаменитости

Как научиться прощать и жить без обид

Обиды и непрощение отравляют нашу жизнь, приводят к стрессу и депрессии. Они мешают нормальным отношениям с людьми и наслаждению жизнью. Очень важно н...

Психология

Женщина-халк: как она выглядела до того, как пристраститься к бодибилдингу

Наталья Кузнецова — одна из самых известных девушек-бодибилдеров не только в России, но и во всем мире. Ее любовь к «железу» уже давно стала легендой....

Женские вопросы

Когда малышка появилась на свет, многие посчитали ее некрасивой. Сейчас девочке 6 лет, и она очень изменилась

Даже на первый взгляд некрасивый, недавно родившийся ребенок может через несколько лет поразить всех своей красотой....

Мужчина шел по улице и услышал странный стон, доносящийся прямо из-под земли. Недолго думая, он начал разбирать тротуарную плитку

Этому мужчине удалось совершить небольшой подвиг, лишь используя уши. Услышав призыв о помощи, он ни секунды не медлил....

Домашние животные

Школьница не хотела идти на выпускной из-за издевательств одноклассников. Мама разместила ее фото в интернете, а спустя 2 часа у ее дома дежурили 120 байкеров

Юной девушке приходилось часто пропускать школу из-за болезни. После очередных двух недель, проведенных в больнице, она была вынуждена терпеть насмешк...

Подростки

"С ними страшно общаться": бывшая домработница Пугачевой о Лизе и Гарри

После новости об отъезде Аллы Пугачевой на Святую землю бывшая домработница певицы Людмила Дороднова рассказала о наследниках звездного семейства. Жен...

Знаменитости

"Ваш внук попал в ДТП, он виновен, нужны деньги". Ответ бабушки обескуражил мошенников

Новости о неприятных происшествиях с близкими людьми вынуждают родственников отключать здравый смысл и рассудок, активируя эмоции. В таком состоянии ч...

Пожилые люди

Мужчина и женщина не стриглись более 10 лет. Когда они все же решились сменить имидж, то окружающие не поверили своим глазам, настолько изменилась их внешность

Некоторые эксперты по имиджу уверяют, что человек должен менять свой внешний вид не реже одного раза в два года, но ... Можете ли вы представить, как ...

Окружающая среда

Попробуй узнай: российские звезды на московских тусовках 12 лет назад

Что было, то, конечно, уже давно прошло. Знаменитых тусовщиков двенадцатилетней давности уже и не узнать. Но фото-то остались и вызывают у нас улыбку,...

Знаменитости

Девочка стала мамой в 13 лет. Как сегодня выглядит она и ее малышка (фото)

Рождение ребенка в раннем возрасте считается в современном обществе неприличным. Девочка, родившая ребенка в 13 лет, получила много критики со стороны...