Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лекция 2 Вычислительные основы информационных технологий.docx

Скачиваний:

Добавлен:

21.03.2016

Размер:

146.14 Кб

Скачать

☆

<<< < Предыдущая 1 2 34 / 64 5 6 > Следующая >>>

2.3. Перевод целых чисел из десятичной системы счисления в системы счисления с другим основанием.

Для осуществления такого перевода необходимо делить число с остатком на основание системы счисления (S = 2; 8; 16) до тех пор, пока частное больше основания системы счисления.

Пример. Число перевести в двоичную систему счисления.

Пример. Число перевести в восьмеричную систему счисления.

Пример. Число перевести в шестнадцатеричную систему счисления.

2.4. Чтобы перевести число из двоичной системы в восьмеричную, его нужно разбить на триады (тройки цифр), начиная с младшего разряда, в случае необходимости дополнив старшую триаду нулями, и каждую триаду заменить соответствующей восьмеричной цифрой (табл. 1).

Пример. Число перевести в восьмеричную систему счисления.

2.5. Чтобы перевести число из двоичной системы в шестнадцатеричную, его нужно разбить на тетрады (четверки цифр), начиная с младшего разряда, в случае необходимости дополнив старшую тетраду нулями, и каждую тетраду заменить соответствующей восьмеричной цифрой (табл. 1).

Пример. Число перевести в шестнадцатеричную систему счисления.

2.6. Для перевода восьмеричного числа в двоичное необходимо каждую цифру заменить эквивалентной ей двоичной триадой.

Пример. Число перевести в двоичную систему счисления.

2.7. Для перевода шестнадцатеричного числа в двоичное необходимо каждую цифру заменить эквивалентной ей двоичной тетрадой.

Пример. Число перевести в двоичную систему счисления.

2.8. При переходе из восьмеричной системы счисления в шестнадцатеричную и обратно, необходим промежуточный перевод чисел в двоичную систему.

Пример 1. Число перевести в восьмеричную систему счисления.

Пример 2. Число перевести в шестнадцатеричную систему счисления.

2.9. Арифметические операции над числами в двоичной системе счисления (таблица 5):

Правила сложения	Правила вычитания	Правила умножения
0 + 0 = 0 0 + 1 = 1 1 + 0 = 1 1 + 1 = 10	0 - 0 = 0 0 - 1 = -1 1 - 0 = 1 1 - 1 = 0	0 * 0 = 0 1 * 0 = 0 0 * 1 = 0 1 * 1 = 1

Примеры

1. Сложить два числа: 1010(2) + 10101(2) = 11111(2)

2. Найти разность двух чисел 10101(2) и 1010(2):

10101(2) - 1010(2) = 1011(2)

3. Умножить два числа 1011(2) и 101(2):

1011(2) * 101(2) = 110111(2)

3. Кодирование информации в ЭВМ

3.1. Кодирование символов. Байт.

На основании одной ячейки информационной ёмкостью 1 бит можно закодировать только 2 различных состояния. Для того чтобы каждый символ, который можно ввести с клавиатуры в латинском регистре, получил свой уникальный двоичный код, требуется 7 бит. На основании последовательности из 7 бит, в соответствии с формулой Хартли, может быть получено N=2⁷=128 различных комбинаций из нулей и единиц, т.е. двоичных кодов. Поставив в соответствие каждому символу его двоичный код, мы получим кодировочную таблицу. Человек оперирует символами, компьютер – их двоичными кодами.

Для латинской раскладки клавиатуры такая кодировочная таблица одна на весь мир, поэтому текст, набранный с использованием латинской раскладки, будет адекватно отображен на любом компьютере. Эта таблица носит название ASCII (American Standard Code of Information Interchange) по-английски произносится [э́ски], по-русски произносится [а́ски]. Ниже приводится вся таблица ASCII, коды в которой указаны в десятичном виде. По ней можно определить, что когда вы вводите с клавиатуры, скажем, символ “*”, компьютер его воспринимает как код 42₁₀, в свою очередь 42₁₀=101010₂ – это и есть двоичный код символа “*”. Коды с 0 по 31 в этой таблице не задействованы.

Таблица 6. Символы ASCII

код	символ	код	символ	код	символ	код	символ	код	символ	код	символ
32	Пробел	48	.	64	@	80	P	96	'	112	p
33	!	49	0	65	A	81	Q	97	a	113	q
34	"	50	1	66	B	82	R	98	b	114	r
35	#	51	2	67	C	83	S	99	c	115	s
36	$	52	3	68	D	84	T	100	d	116	t
37	%	53	4	69	E	85	U	101	e	117	u
38	&	54	5	70	F	86	V	102	f	118	v
39	'	55	6	71	G	87	W	103	g	119	w
40	(	56	7	72	H	88	X	104	h	120	x
41	)	57	8	73	I	89	Y	105	i	121	y
42	*	58	9	74	J	90	Z	106	j	122	z
43	+	59	:	75	K	91	[	107	k	123	{
44	,	60	;	76	L	92	\	108	l	124	\|
45	-	61	<	77	M	93	]	109	m	125	}
46	.	62	>	78	N	94	^	110	n	126	~
47	/	63	?	79	O	95	_	111	o	127	DEL

Чтобы хранить также и коды национальных символов каждой страны (в нашем случае – символов кириллицы) требуется добавить еще 1 бит, что увеличит количество уникальных комбинаций из нулей и единиц вдвое, т.е. в нашем распоряжении дополнительно появится 128 свободных кодов (со 128-го по 255-й), в соответствие которым можно поставить символы русского алфавита.

Таким образом, отведя под хранение информации о коде каждого символа 8 бит, мы получим N=2⁸=256 уникальных двоичных кодов, что достаточно, чтобы закодировать все символы, которые можно ввести с клавиатуры.

Дадим определение базовой единице измерения – байту.

Байт - последовательность из 8 бит.

1 байт = 2³ бит = 8 бит.

На основании одного байта можно получить 2⁸=256 уникальных двоичных кодов.

В современных кодировочных таблицах под хранение информации о коде каждого символа отводится 1 байт.

1 символ = 1 байт.

В байтах измеряется объем данных (V) при их хранении и передаче по каналам связи. Например, текст “Добрый день!” занимает объем равный 12 байтам.

Биты в байте нумеруются с конца с 0-го по 7-й. Минимальная комбинация на основании одного байта – восемь нулей, максимальная – восемь единиц. Рис. 4а.

11111111₂=2⁷+2⁶+2⁵+2⁴+2³+2²+2¹+2⁰=128+64+32+16+8+4+2+1=255₁₀

При хранении на физическом уровне каждый байт может быть реализован, например, на базе восьми конденсаторов, каждый из которых либо разряжен (0), либо заряжен (1). Рис. 4b.


Рис. 4а. Байт: минимальная и максимальная комбинации	Рис. 4b. Байт: соответствие двоичного числа и электрического импульса.

Следует отметить, что на сегодняшний день в использовании не одна, а несколько кодировочных таблиц, включающих коды кириллицы, – это стандарты, выработанные в разные годы и различными учреждениями. В этих таблицах различен порядок, в котором расположены друг за другом символы кирилличного алфавита, поэтому одному и тому же коду соответствуют разные символы. По этой причине, мы иногда сталкиваемся с текстами, которые состоят из русских букв, но в бессмысленной для нас последовательности.

Например, текст “Компьютерные вирусы”, введенный в кодировке Windows-1251 в кодировке КОИ-8 будет отображен так: ”лПНРШАФЕТОШЕ ЧЙТХУЩ”.

Таблица 7. Несоответствие кодов символов в различных кодировках кириллицы.

Код	Windows-1251	КОИ-8	ISO	Под национальные кодировки отданы коды с 128-го по 255-й
192	А	Ю	Р
193	Б	А	С
194	В	б	Т

Эта проблема разрешима - на каждом компьютере найдутся все основные кодировочные таблицы, и если тест выглядит неадекватно, нужно попробовать перекодировать его, просто указав использовать другую кодировочную таблицу. Но наличие такой проблемы, конечно, вносит неудобства.

Используя 8-битную кодировочную таблицу мы не сможем адекватно увидеть на мониторе и тексты, созданные на тех языках, где используются символы, отличные от латинских и кирилличных, например символы с умляутами в немецком языке.

Юникод. UTF-8

Теоретически давно существует решение этих проблем. Оно называется Unicode (Юникод). Unicode – это кодировочная таблица, в которой для кодирования каждого символа используется 2 байта, т.е. 16 бит. На основании такой таблицы может быть закодировано N=2¹⁶=65 536 символов.

Юникод включает практически все современные письменности, в том числе: арабскую, армянскую, бенгальскую, бирманскую, греческую, грузинскую, деванагари, иврит, кириллицу, коптскую, кхмерскую, латинскую, тамильскую, хангыль, хань (Китай, Япония, Корея), чероки, эфиопскую, японскую (катакана, хирагана, кандзи) и другие.

С академической целью добавлены многие исторические письменности, в том числе: древнегреческая, египетские иероглифы, клинопись, письменность майя, этрусский алфавит.

В Юникоде представлен широкий набор математических и музыкальных символов, а также пиктограмм.

Для символов кириллицы в Юникоде выделено два диапазона кодов:

Cyrillic (#0400 — #04FF)

Cyrillic Supplement (#0500 — #052F).

Но внедрение таблицы Unicode в чистом виде сдерживается по той причине, что если код одного символа будет занимать не один байт, а два байта, то для хранения текста понадобится вдвое больше дискового пространства, а для его передачи по каналам связи – вдвое больше времени.

Поэтому сейчас на практике больше распространено представление Юникода UTF-8 (Unicode Transformation Format). UTF-8 обеспечивает наилучшую совместимость с системами, использующими 8-битные символы. Текст, состоящий только из символов с номером меньше 128, при записи в UTF-8 превращается в обычный текст ASCII. Остальные символы Юникода изображаются последовательностями длиной от 2 до 4 байтов. В целом, так как самые распространенные в мире символы – символы латинского алфавита - в UTF-8 по-прежнему занимают 1 байт, такое кодирование экономичнее, чем чистый Юникод.

<<< < Предыдущая 1 2 34 / 64 5 6 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
29.10.2018176.64 Кб18Лекция 15-16.doc
#
22.07.2019470.02 Кб1Лекция 17,18.doc
#
26.09.201956.32 Кб4Лекция 17.doc
#
08.09.2019170.5 Кб11Лекция 1_1 Основы проф инф технологий.doc
#
08.09.2019102.4 Кб1Лекция 1_2 Кодирование и представление информ в...doc
#
21.03.2016146.14 Кб57Лекция 2 Вычислительные основы информационных технологий.docx
#
20.09.20192.68 Mб0лекция 2 ноября 2011.doc
#
16.09.201976.8 Кб0лекция 2-уч-ки г.д.3к12..doc
#
04.08.201969.12 Кб1лекция 27.10.doc
#
14.04.2019159.74 Кб2Лекция 3 Внешние эффекты.doc
#
16.08.2019106.5 Кб12Лекция 3.03 Редактирование и форматирование тек...doc