История возникновения бита и байта

Кто придумал единицу измерения информации 1 бит?

В своей книге Шеннон изложил способ, как количественно характеризовать сигнал. Для этого он использовал величину, которая называется количеством информации. Иногда ее называют просто информацией, а иногда и очень непонятным словом — «энтропия».

С момента появления работы Шеннона математики, физики и инженеры под термином «информация» стали понимать нечто новое, отличающееся от того, что подразумевается под этим словом в обыденной жизни.

Прочтя книгу, люди говорили, что она пустая или, наоборот, очень содержательная. Но никому даже в голову не приходило, что можно точно подсчитать, какое количество информации содержится на ее страницах. Еще более сложным казалась оценка количества информации в звуковых сигналах нашей речи или в телевизионном изображении !

Но Шеннон смог решить эту проблему, благодаря чему, начиная с 50-х годов нашего столетия человечество измеряет информацию так же уверенно, как, скажем, длину какого-либо предмета в метрах или его вес в килограммах. Единицей измерения информации с легкой руки Клода Шеннона стал бит.

Из жизни терминов

Бит (bit) – термин, обозначающий наименьшую единицу информации, с которой может оперировать вычислительная машина, “родился” в 1946 году. Он был впервые предложен неким Джоном Туки (John Tukey), а научному миру стал известен в 1948 году, после публикации в “Bell Systems Technical Journal” статьи, в которой автор (C.E.Shannon), ссылаясь на уже упомянутого господина Туки, и привел термин “бит”.

Бит, как известно, в состоянии принимать два значения – 0 и 1, то есть является двоичным, или бинарным числом, по-английски binary digit. Отсюда возникло и само его название – BInary digiT – bit.

Термин байт (byte), обозначающий последовательность битов, необходимых для компьютерного представления одного символа (как правило, 8 бит), гораздо моложе своего предшественника. Его “выдумал” в 1964 году (может, чуть раньше) доктор Вернер Бухгольц (Dr. Werner Buchholz), работавший в IBM. По крайней мере, первое упоминание байта встречается в одной из статей в “IBM Systems Journal” за 1964 год.

Что же касается происхождения самого термина, то тут существует несколько гипотез.

По одной из них, термин байт (byte) произошел от слов BInary digiT Eight (двоичное число восемь) путем замены в образовавшемся слове BITE буквы I на Y. Последнее было сделано для того, чтобы не путать в произношении и написании новый термин с уже существовавшим “битом”.

Сторонники другой гипотезы утверждают, что “байт” произошел от сокращения слов BinarY TErm (двоичный термин) без всякой возни с заменой одной буквы на другую.

Наконец, есть и третьи – те, кто, не мудрствуя лукаво, утверждают, что “байт” просто был переделан из “бита” для того, чтобы термины для обозначения однородных величин и в звучании были похожи друг на друга.

Одним словом, как бы там ни было, а “бит” и “байт” прижились, и теперь кажется, что без этих терминов вычислительная техника просто не смогла бы существовать.

Байт (англ. byte ) (русское обозначение: байт и Б; международное: B, byte) [1] — единица хранения и обработки цифровой информации; совокупность битов, обрабатываемая компьютером одномоментно. В современных вычислительных системах байт состоит из восьми битов и, соответственно, может принимать одно из 256 (2 8 ) различных значений (состояний, кодов). Однако в истории компьютерной техники существовали решения с иными размерами байта (например, 6, 32 или 36 битов), поэтому иногда в компьютерных стандартах и официальных документах для однозначного обозначения группы из 8 битов используется термин «октет» (лат. octet ).

В большинстве вычислительных архитектур байт — это минимальный независимо адресуемый набор данных.

Содержание

История [ править | править код ]

Название «байт» было впервые использовано в июне 1956 года В. Бухгольцем (англ. Werner Buchholz ) при проектировании первого суперкомпьютера IBM 7030 Stretch для пучка одновременно передаваемых в устройствах ввода-вывода битов числом от одного до шести. Позже, в рамках того же проекта, байт был расширен до восьми бит. Слово byte было выбрано как намеренно искажённое слово bite, произносящееся так же (англ. bite — «кусок»; «часть чего-либо, отделённая за один укус»; ср. также появившееся позже название для 4-битной единицы «ниббл» от англ. nibble — «покусывать»). Изменённое написание byte через y вместо i потребовалось, чтобы избежать смешения со словом «бит» (bit) [2] . В печати слово byte впервые появилось в июне 1959 года [3] .

Ряд ЭВМ 1950-х и 1960-х годов (БЭСМ-6, М-220) использовали 6-битовые символы в 48-битовых или 60-битовых машинных словах. В некоторых моделях ЭВМ производства Burroughs Corporation (ныне Unisys) размер символа был равен 9 битам. В советской ЭВМ Минск-32 использовался 7-битный байт.

Байтовая адресация памяти была впервые применена в системе IBM System/360. В более ранних компьютерах адресовать можно было только целиком машинное слово, состоявшее из нескольких байтов, что затрудняло обработку текстовых данных.

8-битные байты были приняты в System/360, вероятно, из-за использования BCD-формата представления чисел: одна десятичная цифра (0—9) требует 4 бита (тетраду) для хранения; один 8-битный байт может представлять две десятичные цифры. Байты из 6 битов могут хранить только по одной десятичной цифре, два бита остаются незадействованными.

По другой версии, 8-битный размер байта связан с 8-битным же числовым представлением символов в кодировке EBCDIC.

По третьей версии, из-за двоичной системы кодирования в компьютерах наиболее выгодными для аппаратной реализации и удобными для обработки данных являются длины слов, кратные степеням двойки, в том числе и 1 байт = 2 3 = 8 битов . Системы и компьютеры с длинами слов, не кратными числу 2, отпали из-за невыгодности и неудобства.

Постепенно 8-битные байты стали стандартом де-факто; с начала 1970-х в большинстве компьютеров байты состоят из 8 битов , а размер машинного слова кратен 8 битам .

Количество состояний (кодов) в байте [ править | править код ]

Количество состояний (кодов, значений), которое может принимать 1 восьмибитный байт с позиционным кодированием, определяется в комбинаторике. Оно равно количеству размещений с повторениями и вычисляется по формуле:

N p = A ¯ ( n , k ) = A ¯ n k = n k = 2 8 = 256 <displaystyle N_

=<ar >(n,k)=<ar >_^=n^=2^<8>=256>возможных состояний (кодов, значений), где

N p <displaystyle N_

>— количество состояний (кодов, значений) в одном байте;

A ¯ ( n , k ) = A ¯ n k <displaystyle <ar >(n,k)=<ar >_^>

— количество размещений с повторениями;

n <displaystyle n>

— количество состояний (кодов, значений) в одном бите; в бите 2 состояния ( n = 2 );

k <displaystyle k>

— количество битов в байте; в 8-битном байте k = 8 .

Производные единицы [ править | править код ]

Измерения в байтах
ГОСТ 8.417—2002			Приставки СИ		Приставки МЭК
Название	Обозначение	Степень	Название	Степень	Название	Символ		Степень
байт	Б	10 0	—	10 0	байт	B	Б	2 0
килобайт	Кбайт	10 3	кило-	10 3	кибибайт	KiB	КиБ	2 10
мегабайт	Мбайт	10 6	мега-	10 6	мебибайт	MiB	МиБ	2 20
гигабайт	Гбайт	10 9	гига-	10 9	гибибайт	GiB	ГиБ	2 30
терабайт	Тбайт	10 12	тера-	10 12	тебибайт	TiB	ТиБ	2 40
петабайт	Пбайт	10 15	пета-	10 15	пебибайт	PiB	ПиБ	2 50
эксабайт	Эбайт	10 18	экса-	10 18	эксбибайт	EiB	ЭиБ	2 60
зеттабайт	Збайт	10 21	зетта-	10 21	зебибайт	ZiB	ЗиБ	2 70
йоттабайт	Ибайт	10 24	йотта-	10 24	йобибайт	YiB	ЙиБ	2 80

Кратные и дольные приставки для образования производных единиц для байта применяются не как обычно. Уменьшительные приставки не используются совсем, а единицы измерения информации, меньшие, чем байт, называются специальными словами — ниббл (тетрада, полубайт) и бит. Увеличительные приставки кратны либо 1024 = 2 10 , либо 1000 = 10 3 : 1 кибибайт равен 1024 байтам , 1 мебибайт — 1024 кибибайтам или 1024×1024 = 1 048 576 байтам и т. д. для гиби-, теби- и пебибайтов. В свою очередь 1 килобайт равен 1000 байтам , 1 мегабайт — 1000 килобайтам или 1000×1000 = 1 000 000 байтам и т. д. для гига-, тера- и петабайт. Разница между ёмкостями (объёмами), выраженными в кило = 10 3 = 1000 и выраженными в киби = 2 10 = 1024 , возрастает с ростом веса приставки. МЭК рекомендует использовать двоичные приставки — кибибайт, мебибайт, йобибайт и т. п.

Иногда десятичные приставки используются и в прямом смысле, например, при указании ёмкости жёстких дисков: у них гигабайт (гибибайт) может обозначать не 1 073 741 824 = 1024 3 байтов , а миллион килобайтов (кибибайтов), то есть 1 024 000 000 байтов , а то и просто миллиард байтов.

Обозначение [ править | править код ]

Использование русской прописной буквы «Б» для обозначения байта регламентирует Межгосударственный (СНГ) стандарт ГОСТ 8.417-2002 [4] («Единицы величин») в «Приложении А» и Постановление Правительства РФ от 31 октября 2009 г. № 879. Кроме того, констатируется традиция использования приставок СИ вместе с наименованием «байт» для указания множителей, являющихся степенями двойки ( 1 Кбайт = 1024 байт , 1 Мбайт = 1024 Кбайт , 1 Гбайт = 1024 Мбайт и т. д., причём вместо строчной «к» используется прописная «К»), и упоминается, что подобное использование приставок СИ не является корректным. По ГОСТ IEC 60027-2-2015 строчная «к» соответствует 1000 и «Ки» — 1024, так 1 КиБ = 1024 Б, 1 кБ = 1000 Б.

Использование прописной буквы «Б» для обозначения байта соответствует требованиям ГОСТ и позволяет избежать путаницы между сокращениями от байт и бит. Запись со строчной буквой в виде «Кб» (Мб, Гб) для обозначения байта будет не соответствовать международному стандарту IEC (и локализованному по нему ГОСТ). Однако авторы орфографического словаря [5] приводят строчную форму «б» (и «Кб», «Мб», «Гб») для байта, как не образованную от фамилии.

Следует учитывать, что в ГОСТ 8.417, кроме «бит», для бита нет однобуквенного обозначения, поэтому использование записи вроде «Мб» как синонима для «Мбит» не соответствует этому стандарту. Но в некоторых документах используется сокращение b для bit: IEEE 1541-2002, IEEE Std 260.1-2004, в нижнем регистре: ГОСТ Р МЭК 80000-13—2016, ГОСТ IEC 60027-2-2015.

В международном стандарте МЭК IEC 60027-2 от 2005 года [6] для применения в электротехнической и электронной областях рекомендуются обозначения:

bit — для бита;
o, B — для октета, байта. Причём о — единственное указанное обозначение во французском языке.

Склонение [ править | править код ]

Кроме обычной формы родительного падежа множественного числа (байтов, килобайтов, битов) существует счётная форма «байт» [7] , которая используется в сочетании с числительными: 8 байт , 16 килобайт . Счётная форма является разговорной. Точно так же, например, с килограммами: обычная форма родительного падежа употребляется, если нет числительного, а в сочетании с числительным могут быть варианты: 16 килограммов (стилистически нейтральная обычная форма) и 16 килограмм (разговорная счётная форма).

Все мы знаем, что бит — это двоичное число, наименьшая единица измерения количества информации с которой может оперировать вычислительная машина. А кто придумал бит?

БИТ (от англ. BInary digiT – двоичный разряд) , минимальная единица измерения энтропии и количества передаваемой или хранимой информации. В вычислит. технике соответствует одному двоичному разряду, принимающему значение «0» или «1» («ложь» или «истина»). (Большая российская энциклопедия)

Клод Шеннон — человек, который придумал бит

В 1948 году Клод Элвуд Шеннон впервые использовал слово «bit» для обозначения наименьшей единицы количества информации в статье «Математическая теория связи». Происхождение этого слова он приписывал Джону Тьюки, использовавшему сокращение «bit» вместо слов «binary digit» в заметке лаборатории Белла от 9 января 1947 года.

Карьера Клода Шеннона удивительна. Заложив основы теории информации, введя понятия и сформулировав принципы и теоремы, определившие ключевые инженерные решения компьютерного века, он довольно рано отошел от активной научной деятельности и занялся преподаванием и исследованием увлекающих его совсем не серьезных задач.

Шеннон построил несколько жонглирующих машин и даже создал общую теорию жонглирования, которая, впрочем, не помогла ему побить личный рекорд — жонглирование четырьмя мячиками. Еще он испытал свои силы в поэзии, а также разработал разнообразные модели биржи акций и опробовал их (по его словам — успешно) на собственных акциях.

Как говорил сам Шеннон: “Я всегда следовал своим интересам, не думая ни о том, во что они мне обойдутся, ни об их ценности для мира. Я потратил уйму времени на совершенно бесполезные вещи”.

Клод Шеннон родился в 1916 году и вырос в городе Гэйлорде штата Мичиган. Еще в детские годы Клод познакомился как с детальностью технических конструкций, так и с общностью математических принципов.

Он постоянно возился с детекторными приемниками и радиоконструкторами, которые приносил ему отец, помощник судьи, и решал математические задачки и головоломки, которыми снабжала его старшая сестра Кэтрин, ставшая впоследствии профессором математики. Клод полюбил эти два мира, столь несхожие между собой, — технику и математику. Позже, в своей диссертации, защищенной в 1940 году, он доказал, что работу переключателей и реле в электрических схемах можно представить посредством алгебры, изобретенной в середине XIX века английским математиком Джорджем Булем.

“Просто случилось так, что никто другой не был знаком с этими обеими областями одновременно!” — вот так скромно Шеннон объяснил причину своего открытия.

Именно работа Шеннона предопределила путь, по которому с тех пор развивается раздел кибернетики — теория информации.

Благодаря ему, начиная с 50-х годов нашего столетия человечество измеряет информацию так же уверенно, как, скажем, длину какого-либо предмета в метрах или его вес в килограммах. Единицей измерения информации с легкой руки Клода Шеннона стал бит.

Из истории

В 1703 году, в одной из своих работ, Лейбниц пишет, что двоичная система счисления была описана китайским королём (императором) и философом по имени Fu Xi, который жил более, чем за 4000 лет до Лейбница.

Краткого современного англосаксонского названия китайский Liangyi (инь-ян («0»-«1»), китайский двоичный разряд, китайский бит) в то время пока ещё не имел.Китайский двубит — «сы-сян» образующий четыре диграммы, и китайский трибит — «ба-гуа», образующий восемь преднебесных и посленебесных триграмм, в современной англосаксонской терминологии собственных названий до сих пор не имеют.