С точки зрения ЭВМ текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа "=", "(", "&" и т.п. и даже (обратите особое внимание!) пробелы между словами. Да, не удивляйтесь: пустое место в тексте тоже должно иметь свое обозначение.

Вспомним некоторые известные нам факты:

Множество символов, с помощью которых записывается текст, называется алфавитом.

Число символов в алфавите – это его мощность.

Формула определения количества информации: N = 2 b ,

где N – мощность алфавита (количество символов),

b – количество бит (информационный вес символа).

В алфавит мощностью 256 символов можно поместить практически все необходимые символы. Такой алфавит называется достаточным.

Т.к. 256 = 2 8 , то вес 1 символа – 8 бит.

Единице измерения 8 бит присвоили название 1 байт:

Двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.

Каким же образом текстовая информация представлена в памяти компьютера?

Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в двоичном коде. Это значит, что каждый символ представляется 8-разрядным двоичным кодом.

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер — по их коду.

Удобство побайтового кодирования символов очевидно, поскольку байт — наименьшая адресуемая часть памяти и, следовательно, процессор может обратиться к каждому символу отдельно, выполняя обработку текста. С другой стороны, 256 символов – это вполне достаточное количество для представления самой разнообразной символьной информации.

Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу.

Понятно, что это дело условное, можно придумать множество способов кодировки.

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.

Для разных типов ЭВМ используются различные таблицы кодировки.

Международным стандартом для ПК стала таблица ASCII (читается аски) (Американский стандартный код для информационного обмена).

Таблица кодов ASCII делится на две части.

Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111).

Структура таблицы кодировки ASCII

Порядковый номер

Символ

0 — 31

00000000 — 00011111

Символы с номерами от 0 до 31 принято называть управляющими.
Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.

32 — 127

00100000 — 01111111

Стандартная часть таблицы (английский). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы.
Символ 32 — пробел, т.е. пустая позиция в тексте.
Все остальные отражаются определенными знаками.

128 — 255

10000000 — 11111111

Альтернативная часть таблицы (русская).
Вторая половина кодовой таблицы ASCII, называемая кодовой страницей (128 кодов, начиная с 10000000 и кончая 11111111), может иметь различные варианты, каждый вариант имеет свой номер.
Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.

Первая половина таблицы кодов ASCII

Обращаю ваше внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом последовательного кодирования алфавита.

Для букв русского алфавита также соблюдается принцип последовательного кодирования.

Вторая половина таблицы кодов ASCII

К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows. MS-DOS, Macintosh и ISO). Из-за этого часто возникают проблемы с переносом русского текста с одного компьютера на другой, из одной программной системы в другую.

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 ("Код обмена информацией, 8-битный"). Эта кодировка применялась еще в 70-ые годы на компьютерах серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX.

От начала 90-х годов, времени господства операционной системы MS DOS, остается кодировка CP866 ("CP" означает "Code Page", "кодовая страница").

Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.

Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.

Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251.

С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode. Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.

Тип урока: Урок ознакомления с новым материалом.

(см. Презентация, слайд 2)

Цели урока:

  • познакомить учащихся со способами кодирования и декодирования текстовой информации с помощью кодовых таблиц и компьютера;
  • развивать логическое и алгоритмическое мышление обучающихся, познавательные интересы учащихся;
  • воспитывать умение слушать и слышать, самооценку у обучающихся.
  • формировать знания учащихся по теме “кодирование текстовой информации”;
  • развить навыки анализа и самоанализа;
  • формировать умения планировать и оценивать свою деятельность.
  • Оборудование:

  • рабочие места учеников (персональный компьютер с ОС Windows);
  • рабочее место учителя;
  • интерактивная доска;
  • таблицы кодировок;
  • мультимедийный проектор;
  • мультимедийная презентация;
  • карточки с заданиями.
  • ПЛАН УРОКА

    1. Организационный момент.

    Сообщение темы, целей и задач урока.

    Учитель: Сегодня на уроке вы узнаете, как представляется текстовая информация в компьютере. Научитесь кодировать и декодировать текстовую информацию с помощью кодовых таблиц и ПК.

    2. Ход урока

    1. Объяснение нового материала.

    Учитель: Сегодня на уроке мы с вами разберём понятия: текстовая информация, кодовая таблица. Будем кодировать и декодировать текстовую информацию.

    Начиная с конца 60-х годов, компьютеры получили возможность работать с текстовой информацией.

    Текстовая информация – это информация, выраженная в письменной форме.

    (см. Презентация, слайд 3)

    Определение текстовой информации записать в тетрадь.

    В процессе восприятия, передачи и хранения информации человеком и техническими устройствами происходит её кодирование.

    Учитель: Ребята, давайте вспомним: Что такое кодирование?

    (см. Презентация, слайд 4)

    Ответ: Кодирование – это процесс преобразования информации в форму, воспринимаемую компьютером, т.е. двоичный код.

    Ответ: Декодирование – это процесс обратный кодированию, который заключается в том, что происходит преобразование данных из двоичного кода в форму, понятную человеку.

    (см. Презентация, слайд 5)

    Учитель: Человек различает знаки по их начертанию. Для предоставления текста в памяти компьютера необходимо представить его в виде двоичного кода.

    Ребята, как представлен двоичный код в компьютере? (В виде каких символов?)

    Ответ: в виде последовательности из 0 и 1

    Для представления текстовой информации (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) достаточно 256 различных знаков. По формуле можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак:

    N = 2 i
    256 = 2 8
    i = 8 бит
    N – мощность алфавита
    i – информационный вес символа

    Записать в тетрадь.

    (см. Презентация, слайд 6)

    Учитель: При вводе в компьютер текстовой информации происходит её двоичное кодирование, изображение символа преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определённая последовательность из 8 электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает одну ячейку.

    В процессе вывода символа на экран компьютера производится обратный процесс – декодирование, т.е. преобразование кода символа в его изображение.

    (см. Презентация, слайд 7)

    Учитель: Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки.

    Определение таблицы кодировки записать в тетрадь.

    (см. Презентация, слайд 8)

    Учитель: Международным стандартом для ПК стала таблица ASCII (читается аски) (Американский стандартный код для информационного обмена).

    (см. Презентация, слайд 9)

    Таблица кодов ASCII делится на:

    1) Функциональные клавиши (принято называть управляющими) Символы с номерами от 0 до 31. Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.

    Символ 32 – пробел, т.е. пустая позиция в тексте.

    2) Коды 32 – 127 – входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.

    3) Коды 128 – 255 – национальный алфавит.

    Учитель: Рассмотрим кодовую таблицу MS – DOS (СР(кодовая страница)866) подробнее.

    Кодовая таблица MS – DOS (СР(кодовая страница)866) (называемая кодовой страницей) включает в себя:

    – буква " Ё " стоит особняком под номером 240 .

    • строчные
    • русские буквы (чтобы сохранить символы псевдографики) разбросаны:

    – с " р " по " я " занимают позиции с 224 по 239 ,

    – буква " ё " снова на отшибе и имеет номер 241 .

    (см. Презентация, слайд 10)

    Понятие кодировки Unicode

    В мире существует примерно 6800 различных языков. Если прочитать текст, напечатанный в Японии на компьютере в России или США, то понять его будет нельзя. Чтобы буквы любой страны можно было читать на любом компьютере, для их кодировки стали использовать 2 байта (16 бит).

    N = 2 i
    2 i = 2 16 = 65536
    N = 65536
    N – мощность алфавита символов в кодовой таблице Unicode.
    i – информационный вес символа

    (см. Презентация, слайд 11 – 12)

    Для разных типов ЭВМ используютcя различные кодировки:

    В настоящее время существует 5 кодовых таблиц для русских букв: Windows (СР(кодовая страница)1251), MS – DOS (СР(кодовая страница)866), KOИ – 8 (Код обмена информацией, 8-битный) (используется в OS UNIX), Mac (Macintosh), ISO (OS UNIX).

    Тексты, созданные в одной кодировке не будут правильно отображаться в другой.

    (см. Презентация, слайд 13)

    На данном слайде вы видите сравнение кодов в различных кодировочных таблицах.

    (см. Презентация, слайд 14)

    1. Давайте с помощью кодовой таблицы ASCII (аски) декодируем текст: С помощью последовательности десятичных кодов: 99 111 109 112 117 116 101 114 (computer)

    (см. Презентация, слайд 15)

    Цель: научиться определять числовые коды символов и вводить символы с помощью числовых кодов.

    (см. Презентация, слайд 16)

    Учитель: Работа в текстовом редакторе MS Word. Запустите текстовый редактор MS Word. Удерживая клавишу “ALT”, наберите коды на дополнительной цифровой клавиатуре:

    152 170 174 171 160

    Учитель: Какое слово получили?

    Выполнение практической работы учащимися

    Проверка выполнения практической работы.

    3. Подведение итогов урока

    Учитель: Сегодня на уроке вы научились кодировать и декодировать текстовую информацию при помощи кодировочной таблицы MS – DOS (СР(кодовая страница)866).

    4. Домашнее задание

    (см. Презентация, слайд 17)

    Учебник Н.Д. Угриновича § 3.1, ответить на вопросы. Произвести кодирование стихотворения из 4– строк (до 100 символов).

    Конспект урока «Кодирование текстовой информации. Кодировки русского алфавита» предназначен для учителей информатики, преподающих в 8-х классах.

    Урок поделен на два этапа. На первом – предусмотрено изучение новой темы, где рассматриваются различные способы кодирования текстовой информации при помощи таблиц кодировок. На втором – выполняется практическая работа, для закрепления нового материала. У учащихся повышается познавательный интерес, развивается логическое мышление, внимательность.

    Скачать:

    ВложениеРазмер
    prezentaciya.ppt293.5 КБ
    prilozhenie_1.doc487 КБ
    prilozhenie_2.doc85.5 КБ
    prilozhenie_3.doc36 КБ
    statya.doc68 КБ

    Предварительный просмотр:

    Подписи к слайдам:

    Предварительный просмотр:

    Стандартная часть кодировочной таблицы ASCII

    Предварительный просмотр:

    «Кодирование текстовой информации»

    Цель работы. Научиться определять числовые коды символов, вводить символы с помощью числовых кодов и осуществлять перекодировку русскоязычного текста в текстовом редакторе.

    Задание: В текстовом редакторе Блокнот ввести с помощью числовых кодов последовательность символов в кодировках Windows и MS-DOS.

    Ввод символов с помощью числовых кодов в текстовом редакторе Блокнот

    Запустить стандартное приложение Блокнот командой [Программы-Стандартные-Блокнот].

    С помощью дополнительной цифровой клавиатуры при нажатой клавише ввести число 0224, отпустить клавишу , в документе появится символ «а». Повторить процедуру для числовых кодов от 0225 до 0233, в документе появится последовательность из 12 символов «абвгдежзий» в кодировке Windows.

    С помощью дополнительной цифровой клавиатуры при нажатой клавише ввести число 224, в документе появится символ «р». Повторить процедуру для числовых кодов от 225 до 233, в документе появится последовательность из 12 символов «рстуфхцчшщ» в кодировке MS-DOS.

    143 174 162 239 167 160 171 160 32 174 225 165 173 236 32 175 165 225 226 224 235 169 32 228 160 224 226 227 170

    136 32 162 165 164 165 224 170 168 32 225 32 170 224 160 225 170 160 172 168 32 162 167 239 171 160 46

    144 160 173 168 172 32 227 226 224 174 172 44 32 175 224 174 229 174 164 239 32 175 174 32 175 160 224 170 227 44

    138 168 225 226 236 239 32 175 174 167 174 171 174 226 174 169 32 174 161 162 165 171 160 46

    135 173 160 165 226 32 164 165 162 174 231 170 160 32 168 32 172 160 171 236 231 168 170 44

    136 32 167 165 171 165 173 235 169 32 175 174 175 227 163 160 169 44

    133 225 171 168 32 164 162 168 166 165 226 225 239 32 226 224 160 172 162 160 169 231 168 170

    144 165 171 236 225 235 32 173 165 32 175 165 224 165 161 165 163 160 169 46

    141 160 172 32 173 165 32 164 160 173 174 32 175 224 165 164 227 163 160 164 160 226 236 44

    138 160 170 32 225 171 174 162 174 32 173 160 232 165 32 174 226 167 174 162 165 226 225 239 44 32 45

    136 32 173 160 172 32 225 174 231 227 162 225 226 162 168 165 32 164 160 165 226 225 239 44

    138 160 170 32 173 160 172 164 160 165 226 225 239 32 161 171 160 163 174 164 160 226 236 46 46 46