Мегаобучалка Главная | О нас | Обратная связь


Представление текстовой информации



2016-09-16 734 Обсуждений (0)
Представление текстовой информации 0.00 из 5.00 0 оценок




Представление информации в памяти компьютера.

План.

1. Единицы измерения информации в ЭВМ.

2. Представление текстовой информации.

3. Представление графической информации.

Единицы измерения информации в ЭВМ.

Теоретические вопросы:

1. Расположите по возрастанию объемы памяти: 1010 байт, 10 бит, 2 байта, 20 бит, 1 Кбайт.

2. Чему равно количество информации, содержащееся в одном разряде двоичного числа?

3. Указать номер правильного ответа: а) байт меньше бита; б) 8 бит = 1 байт; в) 1 бит = 8 байт; г) байт больше, а иногда и равен биту.

4. Некто проставил 0 и 1 в каждую из имеющихся в его распоряжении 10 клеточек. Чему равно количество чисел, которое можно закодировать таким способом.

5. Получены четыре сообщения A, B, C, D, соответственно с объемом информации 211 Гбайт, 1 Тбайт, 222 Мбайт, 229 Кбайт. Укажите очередность этих сообщений в порядке возрастания объемов информации.

6. Прагматический аспект – это характеристика информации с точки зрения ее: а) структуры, б) количества, в) смысла, г) полезности?

7. Определить число бит, необходимых для записи числа 812.

Представление текстовой информации.

Кодовая страница - средство поддержки наборов символов и раскладок клавиатуры для различных стран и регионов. Кодовая страница — это таблица, связывающая используемые программой коды символов с клавишами клавиатуры и знаками на экране.

Для кодирования текстовой информации принят международный стандарт ASCII (American Standard Code for Information Interchange), в кодовой таблице которого зарезервировано 128 7-ми разрядных кодов для кодирования:

– символов латинского алфавита

– цифр

– знаков препинания

– математических символов

Добавление 8-го разряда позволяет увеличить количество кодов таблицы ASCII до 255. Коды от 128 до 255 представляют собой расширение таблицы ASCII. Эти коды в таблице ASCII использованы для кодирования некоторых символов, отличающихся от латинского алфавита, и встречающихся в языках с письменностью, основанной на латинском алфавите, - немецком, французском, испанском и др. Кроме этого, часть кодов использована для кодирования символов псевдографики, которые можно использовать, например, для оформления в тексте различных рамок и текстовых таблиц.

Рассмотрим структуру таблицы ASCII. Для удобства символы в ней пронумерованы в шестнадцатеричной системе счисления от 0 - 7F. Первые знакоместа в таблице занимают непечатаемые символы (0 до 1F), затем следуют печатаемые символы (20 - 7F).

Рисунок 1 Кодировка символов, предложенная IBM (соответствует ASCII-кодировке)

Слово COMPUTER, закодированное в кодах ASCII, выглядит так:

А если учесть, что в двоичном представлении для кодирования каждого символа используется 8-ми разрядный код, то получится двоичный код длиной в 64 символа:

01000011 01001111 01001101 01010000 01010101 01010100 01000101 01010010

Ввод символа осуществляется не только с клавиатуры, но и с помощью указания его кода следующим образом:

1. Нажмите клавишу ALT и, удерживая ее нажатой, наберите на цифровой клавиатуре десятичный код нужного символа.

2. После завершения ввода, отпустите клавишу ALT. На экране Вы увидите указанный символ.

Ранее используемая операционная система MS DOS поддерживала кодовую страницу CP-866.

Для демонстрации действия CP-866, выполните команду Пуск/ Все программы/ Стандартные/ Командная строка и в строке ввода наберите последовательно: Alt+067, Alt+079, Alt+077, Alt+080, Alt+085, Alt+084, Alt+069, Alt+082. В строке ввода Вы увидите слово COMPUTER.

Для кодирования символов национальных алфавитов используется расширение кодовой таблицы ASCII, то есть 8-ми разрядные коды от 128 до 255.

В языках использующих кириллический алфавит, в том числе русском, пришлось полностью менять вторую половину таблицы ASCII, приспосабливая ее под кириллический алфавит.

Рисунок 2 Альтернативная кодовая таблица (CP-866)

Но отсутствие согласованных стандартов привело к появлению различных кодовых таблиц для кодирования русскоязычных текстов, среди которых

– альтернативная кодовая таблица CP-866

– международный стандарт ISO 8859

– кодовая таблица фирмы Microsoft CP-1251 (кодировка Windows)

– кодовая таблица, применяемая в ОС Unix KOI 8-r

Слово КОМПЬЮТЕР, закодированное в кодах Windows (CP-1251), выглядит так:

К О М П Ь Ю Т Е Р

202 206 204 207 220 222 210 197 208

Если же эту последовательность кодов «прочитать» в CP-866, то получим:

 

Рисунок 3 Кодовая таблица Windows (CP-1251)

В январе 1991 года возник консорциум UNICODE (Unicode Consortium), целью которого является продвижение, развитие и реализация стандарта Unicode как международной системы кодирования для обмена информацией, а также поддержание качества этого стандарта в будущих версиях.

Юникод - стандарт кодировки знаков, разработанный консорциумом Unicode. Используя для представления каждого знака более одного байта, Юникод позволяет представить в одном наборе знаков почти все языки мира.

Набор знаков в кодировке Юникод имеет несколько форм представления, включая UTF-8, UTF-16 и UTF-32. В большинстве интерфейсов Windows используется форма UTF-16.

Ниже приведена сравнительная таблица кодов ASCII и UNICODE, взятая из Фрагмента спецификации UNICODE 4.0:

Рисунок 4 Сравнительная таблица кодов ASCII и UNICODE

Кодовая таблица для кириллицы приведена на следующем рисунке (взято из Фрагмента спецификации UNICODE 4.0)

Рисунок 5 Unicode Standard, Version 4.0

Операционная система MS Windows XP поддерживает кодировку Unicode. Просмотреть шестнадцатеричные коды символов можно в редакторе MS Word, выполнив команду Вставка/Символ:

Рисунок 6 Диалоговое окно Вставка/Символ текстового редактора MS Word.

Так для получения любого символа из рисунка 5, необходимо удерживая клавишу Alt, ввести код символа.

Например: Alt+1160 даст ҈, а Alt+1160 даст ҉. Сочетания Alt+22825, Alt+22225 и др. позволяют отобразить китайские иероглифы 天囑 (если такая возможность настроена в операционной системе).

Теоретические вопросы:

1. Двоичный код каждого символа при кодировании текстовой информации в кодах ASCII занимает в памяти персонального компьютера: 1 бит, 1 байт, 2 байта или 2 бита. Ответ: 1 байт

2. Двоичный код каждого символа при кодировании текстовой информации в кодировке Unicode занимает в памяти персонального компьютера: 1 бит, 1 байт, 2 байта или 2 бита. Ответ: 2 байта (точнее более одного)

Индивидуальное задание:

1. Запишите коды символов Вашей фамилии, записанной русскими заглавными буквами, в кодировке 866.

2. Записать коды символов Вашего полного имени, записанного первой заглавной и остальными строчными русскими буквами в кодировке 1251.

3. Запишите слово, представленное последовательностью кодов в шестнадцатеричной системе счисления в кодировке Unicode

№ варианта Код в кодировке Unicode   № варианта Код в кодировке Unicode
  04400430043704340435043B
04420435043E044004380438   043C04350442043E0434044B
04410438044104420435043C   043E0431044904350433043E
044F0437044B043A043E0432   0442044F0436043A0438043C
043E04460435043D043A0438   0441043E0441044204300432


2016-09-16 734 Обсуждений (0)
Представление текстовой информации 0.00 из 5.00 0 оценок









Обсуждение в статье: Представление текстовой информации

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ...
Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация...
Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы...
Личность ребенка как объект и субъект в образовательной технологии: В настоящее время в России идет становление новой системы образования, ориентированного на вхождение...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (734)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.009 сек.)