Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лидовский В.В., Теория информации

.pdf
Скачиваний:
13
Добавлен:
24.03.2015
Размер:
896.19 Кб
Скачать

48.53, 51; 247.

49.DLQ a = 33 = 237.

50.= 21, 124.

51.hH1ihA name="2"ih/AigLAWA 2h/H1i.

87

pRILOVENIE b. uPRAWLQ@]IE KODY ASCII

 

kOD

pOLNOE IMQ

KODA W Unicode

10-J

16-J

kLAWIATURNYJ

(KRATKOE

IMQ W ASCII)

 

 

 

 

 

pEREWOD IMENI KODA | OPISANIE ISPOLXZOWANIQ KODA.

wY[E PREDSTAWLEN [ABLON DLQ SLEDU@]EJ DALEE TABLICY UPRAWLQ@- ]IH SIMWOLOW. pOD KLAWIATURNYM KODOM PODRAZUMEWAETSQ KOMBINACIQ DWUH KLAWI[, Ctrl (Control, W TABLICE \TO ZNAK ^) I PRIWODIMOJ, ODNOWREMENNOE NAVATIE KOTORYH DOLVNO PROIZWODITX SOOTWETSTWU@]IJ KOD.

0 00 ^@ NULL (NUL)

pUSTO | \TOT KOD ISPOLXZUETSQ KAK ZAWER[A@]IJ W PREDSTAWLENII STROK MNOGIMI SISTEMAMI PROGRAMMIROWANIQ, NAPRIMER, sI, PO\TOMU EGO ISPOLXZOWANIE W TEKSTOWYH FAJLAH KRAJNE NEVELATELXNO.

1

01

^A

START OF HEADING (SOH)

nA^ALO ZAGOLOWKA | PRAKTI^ESKI NE ISPOLXZUETSQ.

2

02

^B

START OF TEXT (STX)

nA^ALO TEKSTA | PRAKTI^ESKI NE ISPOLXZUETSQ.

3

03

^C

END OF TEXT (ETX)

kONEC TEKSTA | W Unix I MS-DOS WWOD \TOGO SIMWOLA S KLAWIATURY SLUVIT SIGNALOM DLQ PREKRA]ENIQ WYPOLNENIQ PROGRAMMY.

4

04

^D

END OF TRANSMISSION (EOT)

kONEC PEREDA^I | W Unix I PostScript OZNA^AET KONEC WWODIMYH

DANNYH.

 

 

 

5

05

^E

ENQUIRY (ENQ)

kTO TAM? | PRAKTI^ESKI NE ISPOLXZUETSQ.

6

06

^F

ACKNOWLEDGE (ACK)

pODTWERVDENIE, DA | PRAKTI^ESKI NE ISPOLXZUETSQ.

7

07

^G

BELL (BEL)

zWONOK | PRI EGO PE^ATI NA KONSOLI MS-DOS ILI Unix DOLVEN PROIZWODITXSQ ZWUKOWOJ SIGNAL.

8 08 ^H BACKSPACE (BS)

wOZWRAT NA [AG | OZNA^AET, ^TO SLEDU@]IJ SIMWOL SLEDUET PE^A- TATX S PRED[ESTWU@]EJ POZICII.

9 09 ^I HORISONTAL TABULATION (TAB) gORIZONTALXNAQ TABULQCIQ | PEREHOD NA SLEDU@]U@ POZICI@ TABULQCII.

10 0A ^J LINE FEED (LF)

pODA^A NOWOJ STROKI | PEREHOD NA NOWU@ STROKU. w TEKSTOWYH FAJLAH MS-DOS I Microsoft Windows S SOHRANENIEM TEKU]EJ GORIZONTALXNOJ POZICI@. w TEKSTOWYH FAJLAH Unix S PEREHODOM NA PERWU@ GORIZONTALXNU@ POZICI@.

88

11 0B ^K VERTICAL TABULATION (VT) wERTIKALXNAQ TABULQCIQ | ISPOLXZUETSQ O^ENX REDKO, KAK PRAWILO, PRINTERAMI.

12 0C ^L FORM FEED (FF)

pODA^A NOWOJ FORMY | DLQ KONSOLI, KAK PRAWILO, OZNA^AET O^ISTKU \KRANA, DLQ PRINTERA | ZAWER[ENIE PE^ATI NA TEKU]EM LISTE I ZAPROS NOWOGO.

13 0D ^M CARRIAGE RETURN (CR)

wOZWRAT KARETKI | PEREHOD NA PERWU@ GORIZONTALXNU@ POZICI@ STROKI. w TEKSTOWYH FAJLAH MS-DOS I Microsoft Windows S SOHRANENIEM TEKU]EJ STROKI, A W TEKSTOWYH FAJLAH Macintosh OS S PEREHODOM NA NOWU@ STROKU. w TEKSTOWYH FAJLAH Unix NE ISPOLXZUETSQ.

14 0E ^N SHIFT OUT (SO)

wYHOD | ISPOLXZUETSQ O^ENX REDKO, KAK PRAWILO, PRINTERAMI.

15 0F ^O SHIFT IN (SI)

wHOD | ISPOLXZUETSQ O^ENX REDKO, KAK PRAWILO, PRINTERAMI.

16

10

^P

DATA LINK ESCAPE (DLE)

aWTOREGISTR 1 | PRAKTI^ESKI NE ISPOLXZUETSQ.

17

11

^Q

DEVICE CONTROL ONE (DC1)

iSPOLXZUETSQ NEKOTORYMI TELEKOMMUNIKACIONNYMI PROTOKOLAMI KAK BAJT X-ON.

18

12

^R

DEVICE CONTROL TWO (DC2)

pRAKTI^ESKI NE ISPOLXZUETSQ.

19

13

^S

DEVICE CONTROL THREE (DC3)

iSPOLXZUETSQ NEKOTORYMI TELEKOMMUNIKACIONNYMI PROTOKOLAMI KAK BAJT X-OFF.

20

14

^T

DEVICE CONTROL FOUR (DC4)

pRAKTI^ESKI NE ISPOLXZUETSQ.

21

15

^U

NEGATIVE ACKNOWLEDGE (NAK)

nET | PRAKTI^ESKI NE ISPOLXZUETSQ.

22

16

^V

SYNCHRONOUS IDLE (SYN)

sINHRONIZACIQ | PRAKTI^ESKI NE ISPOLXZUETSQ.

23

17

^W

END OF TRANSMISSION BLOCK (ETB)

kONEC BLOKA | PRAKTI^ESKI NE ISPOLXZUETSQ.

24

18

^X

CANCEL (CAN)

aNNULIROWANIE | ISPOLXZUETSQ O^ENX REDKO, KAK PRAWILO, PRINTERAMI.

25

19

^Y

END OF MEDIUM (EM)

kONEC NOSITELQ | PRAKTI^ESKI NE ISPOLXZUETSQ.

26

1A

^Z

SUBSTITUTE (SUB)

zAMENA | W MS-DOS, Macintosh OS I CP/M | \TO MARKER KONCA TEKSTOWOGO FAJLA.

89

27 1B ^[ ESCAPE (ESC)

aWTOREGISTR 2 | UKAZYWAET NA TO, ^TO NEKOTOROE KOLI^ESTWO KODOW POSLE NEGO I ON SAM OBRAZU@T GRUPPU, RASSMATRIWAEMU@ KAK ODIN KOD.

28

1s

^\

FILE SEPARATOR (FS)

rAZDELITELX FAJLOW | PRAKTI^ESKI NE ISPOLXZUETSQ.

29

1D

^]

GROUP SEPARATOR (GS)

rAZDELITELX GRUPP | PRAKTI^ESKI NE ISPOLXZUETSQ.

30

1E

^^

RECORD SEPARATOR (RS)

rAZDELITELX ZAPISEJ | PRAKTI^ESKI NE ISPOLXZUETSQ.

31

1F

^

 

 

UNIT SEPARATOR (US)

rAZDELITELX \LEMENTOW | PRAKTI^ESKI NE ISPOLXZUETSQ.

127 7F DELETE (DEL)

zABOJ | UDALENIE POSLEDNEGO WIDIMOGO ZNAKA PE^ATAEMOJ STROKI.

w \^ISTO" TEKSTOWYH (plain text) FAJLAH DOPUSTIMY TOLXKO UPRAWLQ@]IE SIMWOLY, OTME^A@]IE KONCY STROK I, KAK PRAWILO, PEREHODY NA POZICII TABULQCII (KOD 9). mARKER KONCA STROKI W Unix | \TO KOD

10, W Macintosh OS | 13, W CP/M, MS-DOS I Microsoft Windows |

POSLEDOWATELXNOSTX 13, 10.

90

pRILOVENIE w. kODIROWKA WIDIMYH SIMWOLOW ASCII

 

kOD

sIMWOL

iMQ SIMWOLA

10-J

16-J

W Unicode 3.2

 

32

 

20

 

SPACE

33

 

21

!

EXCLAMATION MARK

34

 

22

"

QUOTATION MARK

35

 

23

#

NUMBER SIGN

36

 

24

$

DOLLAR SIGN

37

 

25

%

PERCENT SIGN

38

 

26

&

AMPERSAND

39

 

27

 

APOSTROPHE

40

 

28

(

LEFT PARENTHESIS

41

 

29

)

RIGHT PARENTHESIS

42

 

2A

*

ASTERISK

43

 

2B

+

PLUS SIGN

44

 

2C

,

COMMA

45

 

2D

-

HYPHEN-MINUS

46

 

2E

.

FULL STOP

47

 

2F

/

SOLIDUS

48

 

30

0

DIGIT ZERO

49

 

31

1

DIGIT ONE

50

 

32

2

DIGIT TWO

51

 

33

3

DIGIT THREE

52

 

34

4

DIGIT FOUR

53

 

35

5

DIGIT FIVE

54

 

36

6

DIGIT SIX

55

 

37

7

DIGIT SEVEN

56

 

38

8

DIGIT EIGHT

57

 

39

9

DIGIT NINE

58

 

3A

:

COLON

59

 

3B

;

SEMICOLON

60

 

3C

<

LESS-THAN SIGN

61

 

3D

=

EQUALS SIGN

62

 

3E

>

GREATER-THAN SIGN

63

 

3F

?

QUESTION MARK

 

 

 

 

 

91

 

kOD

sIMWOL

iMQ SIMWOLA

10-J

16-J

W Unicode 3.2

 

 

 

 

 

 

 

 

 

 

64

 

40

@

COMMERCIAL AT

65

 

41

A

LATIN CAPITAL LETTER A

66

 

42

B

LATIN CAPITAL LETTER B

67

 

43

C

LATIN CAPITAL LETTER C

68

 

44

D

LATIN CAPITAL LETTER D

69

 

45

E

LATIN CAPITAL LETTER E

70

 

46

F

LATIN CAPITAL LETTER F

71

 

47

G

LATIN CAPITAL LETTER G

72

 

48

H

LATIN CAPITAL LETTER H

73

 

49

I

LATIN CAPITAL LETTER I

74

 

4A

J

LATIN CAPITAL LETTER J

75

 

4B

K

LATIN CAPITAL LETTER K

76

 

4C

L

LATIN CAPITAL LETTER L

77

 

4D

M

LATIN CAPITAL LETTER M

78

 

4E

N

LATIN CAPITAL LETTER N

79

 

4F

O

LATIN CAPITAL LETTER O

80

 

50

P

LATIN CAPITAL LETTER P

81

 

51

Q

LATIN CAPITAL LETTER Q

82

 

52

R

LATIN CAPITAL LETTER R

83

 

53

S

LATIN CAPITAL LETTER S

84

 

54

T

LATIN CAPITAL LETTER T

85

 

55

U

LATIN CAPITAL LETTER U

86

 

56

V

LATIN CAPITAL LETTER V

87

 

57

W

LATIN CAPITAL LETTER W

88

 

58

X

LATIN CAPITAL LETTER X

89

 

59

Y

LATIN CAPITAL LETTER Y

90

 

5A

Z

LATIN CAPITAL LETTER Z

91

 

5B

[

LEFT SQUARE BRACKET

92

 

5C

n

REVERSE SOLIDUS

93

 

5D

]

RIGHT SQUARE BRACKET

94

 

5E

^

CIRCUMFLEX ACCENT

95

 

5F

 

 

 

LOW LINE

 

 

 

 

 

 

 

92

kOD

 

sIMWOL

iMQ SIMWOLA

10-J

16-J

W Unicode 3.2

 

 

 

 

 

 

96

 

60

`

GRAVE ACCENT

97

 

61

a

LATIN SMALL LETTER A

98

 

62

b

LATIN SMALL LETTER B

99

 

63

c

LATIN SMALL LETTER C

100

 

64

d

LATIN SMALL LETTER D

101

 

65

e

LATIN SMALL LETTER E

102

 

66

f

LATIN SMALL LETTER F

103

 

67

g

LATIN SMALL LETTER G

104

 

68

h

LATIN SMALL LETTER H

105

 

69

i

LATIN SMALL LETTER I

106

 

6A

j

LATIN SMALL LETTER J

107

 

6B

k

LATIN SMALL LETTER K

108

 

6C

l

LATIN SMALL LETTER L

109

 

6D

m

LATIN SMALL LETTER M

110

 

6E

n

LATIN SMALL LETTER N

111

 

6F

o

LATIN SMALL LETTER O

112

 

70

p

LATIN SMALL LETTER P

113

 

71

q

LATIN SMALL LETTER Q

114

 

72

r

LATIN SMALL LETTER R

115

 

73

s

LATIN SMALL LETTER S

116

 

74

t

LATIN SMALL LETTER T

117

 

75

u

LATIN SMALL LETTER U

118

 

76

v

LATIN SMALL LETTER V

119

 

77

w

LATIN SMALL LETTER W

120

 

78

x

LATIN SMALL LETTER X

121

 

79

y

LATIN SMALL LETTER Y

122

 

7A

z

LATIN SMALL LETTER Z

123

 

7B

f

LEFT CURLY BRACKET

124

 

7C

|

VERTICAL LINE

125

 

7D

g

RIGHT CURLY BRACKET

126

 

7E

~

TILDE

93

pRILOVENIE g. kODIROWKA BUKW RUSSKOGO ALFAWITA

w NASTOQ]EE WREMQ NAIBOLEE [IROKO ISPOLXZU@TSQ PQTX (!) RAZLI^- NYH TABLIC KODIROWKI DLQ FORMALXNOGO PREDSTAWLENIQ RUSSKIH BUKW:

I. ISO 8859-5 | MEVDUNARODNYJ STANDART;

II.kODOWAQ STRANICA 866 (Microsoft CP866) | ISPOLXZUETSQ W MSDOS;

III. kODOWAQ STRANICA 1251 (Microsoft CP1251) DLQ Microsoft Windows; IV. nA BAZE gost koi-8, koi8-r | PRIMENQETSQ W MIRE Unix;

V. Unicode | ISPOLXZUETSQ W Microsoft Windows, Unix I KLONAH Unix. oSNOWNAQ KODIROWKA gost (GOSUDARSTWENNYJ STANDART sssr) OT 1987 GODA SOZDANA NA OSNOWE REKOMENDACIJ ISO I W DALXNEJ[EM STALA OSNOWOJ DLQ PREDSTAWLENIQ ZNAKOW RUSSKIH BUKW W Unicode. w NEJ I

W KODIROWKAH II, III I V

WSE BUKWY KROME •E I e RASPOLOVENY W ALFA-

WITNOM PORQDKE. nA PRAKTIKE \TU KODIROWKU MOVNO WSTRETITX TOLXKO NA STARYH IBM PC SOWMESTIMYH KOMPX@TERAH es-1840 I W NEKOTORYH PRINTERAH. Internet BRAUZERY OBY^NO PODDERVIWA@T EE NARQDU S KODIROWKAMI II{IV.

kODIROWKA CP866, RAZRABOTANNAQ NA OSNOWE ALXTERNATIWNOJ KODIROWKI gost, SOZDANA SPECIALXNO DLQ os MS-DOS, W KOTOROJ ^ASTO ISPOLXZU@TSQ SIMWOLY PSEWDOGRAFIKI. w \TOJ KODIROWKE \TI SIMWOLY IME@T TE VE KODY, ^TO I W STANDARTNOM IBM PC SOWMESTIMOM KOMPX@- TERE.

aLXTERNATIWNAQ KODIROWKA gost, KOTORAQ IMEET DWA WARIANTA, SOWPADAET S CP866 PO POZICIQM DLQ BUKW RUSSKOGO ALFAWITA I ZNAKAM PSEWDOGRAFIKI. oSNOWNAQ KODIROWKA gost SOWPADAET S ISO 8859-5 TOLX-

, .

KO PO WSEM ZNAKAM RUSSKIH BUKW KROME ZAGLANOJ BUKWY e iSPOLXZOWANIE CP1251 OBUSLOWLENO PO^TI ISKL@^ITELXNO WLIQNI-

EM NA KOMPX@TERNYE TEHNOLOGII RAZRABOTOK FIRMY Microsoft. w NEJ NAIBOLEE POLNO PO SRAWNENI@ S I, II, IV PREDSTAWLENY TAKIE SIMWOLY KAK c , r, , RAZLI^NYE WIDY KAWY^EK I TIRE I T. P.

kODIROWKA koi8-r OSNOWANA NA STANDARTAH PO OBMENU INFORMACIEJ, ISPOLXZUEMYH NA KOMPX@TERAH POD UPRAWLENIEM os Unix, CP/M I NEKOTORYH DRUGIH S SEREDINY 1970-H. w 1993 ONA STANDARTIZIROWANA W

Internet DOKUMENTOM RFC1489.

kODIROWKA Unicode OPIRAETSQ NA KATALOG SIMWOLOW UCS (Universal Character Set) STANDARTA ISO 10646. UCS MOVET SODERVATX DO 231

RAZLI^NYH ZNAKOW. kODY UCS-2 | 2-BAJTNYE, UCS-4 | 4-BAJTNYE. iSPOLXZU@TSQ TAKVE KODY PEREMENNOJ DLINY UTF-8 (Unicode Transfer Format) | 1{6-BAJTNYE, NAIBOLEE SOWMESTIMYE S ASCII, I UTF-16 | 2 ILI 4-BAJTNYE. Unicode W PRIKLADNYH PROGRAMMAH REALIZUETSQ LI[X ^ASTI^NO, I W POLNOM OB_EME POKA NIGDE NE PODDERVIWAETSQ. w Linux

94

ISPOLXZUETSQ UTF-8.

dOSTATO^NO [IROKO ISPOLXZUETSQ KODIROWANIE NA OSNOWE ASCII: VI. nA BAZE koi-7 | MOVNO ISPOLXZOWATX PRI OTSUTSTWII KIRILLI-

^ESKIH [RIFTOW, KOD POLU^AETSQ WY^ITANIEM 128 OT SOOTWETSTWU- @]EGO KODA W koi8-r, ^TO, KAK PRAWILO, DAET KOD LATINSKOJ BUKWY, BLIZKOJ FONETI^ESKI K RUSSKOJ.

w KODIROWKE VI NET WIDIMOGO SIMWOLA DLQ DLQ •.

dALEE SLEDUET TABLICA, W KOTOROJ PREDSTAWLENY WSE PERE^ISLENNYE SPOSOBY KODIROWANIQ BUKW RUSSKOGO ALFAWITA. w \TOJ TABLICE W KOLONKE 1 NAHODQTSQ SIMWOLY BUKW, W KOLONKE 2 ^ASTX NAZWANIQ BUKW W Unicode 3.2 (NAZWANIQ STRO^NYH KIRILLI^ESKIH BUKW NA^INAETSQ SLOWA-

MI CYRILLIC SMALL LETTER, A ZAGLAWNYH | CYRILLIC CAPITAL LETTER, T. O., POLNOE NAZWANIE BUKWY d | CYRILLIC CAPITAL LETTER DE), W KOLONKAH S I PO V KODY DESQTI^NYE I [ESTNADCATERI^NYE SOOTWETSTWU@]IH TABLIC KODIROWKI, A W KOLONKE VI | SIMWOL ASCII DLQ koi-7.

kROME PERE^ISLENNYH MOVNO WSTRETITX E]E ISPOLXZUEMU@ DO WWEDENIQ KODIROWOK gost BOLGARSKU@ KODIROWKU, NAZYWAEMU@ TAKVE MIC, Interprog ILI \STARYJ WARIANT wc an sssr". nA KOMPX@TERAH POD UPRAWLENIEM Macintosh OS ISPOLXZUETSQ TAKVE SWOQ SOBSTWENNAQ TABLICA KODIROWKI DLQ RUSSKIH BUKW, PO SWOEMU NABORU ZNAKOW PO^TI SOWPADA@]AQ S CP1251.

95

1

2

I

 

II

III

IV

 

V

VI

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

A

208

 

D0

160

A0

224

E0

193

C1

1072

 

0430

A

B

BE

209

 

D1

161

A1

225

E1

194

C2

1073

 

0431

B

W

VE

210

 

D2

162

A2

226

E2

215

D7

1074

 

0432

W

G

GHE

211

 

D3

163

A3

227

E3

199

C7

1075

 

0433

G

D

DE

212

 

D4

164

A4

228

E4

196

C4

1076

 

0434

D

E

IE

213

 

D5

165

A5

229

E5

197

C5

1077

 

0435

E

•E

IO

241

 

F1

241

F1

184

B8

163

A3

1105

 

0451

#

V

ZHE

214

 

D6

166

A6

230

E6

214

D6

1078

 

0436

V

Z

ZE

215

 

D7

167

A7

231

E7

218

DA

1079

 

0437

Z

I

I

216

 

D8

168

A8

232

E8

201

C9

1080

 

0438

I

J

SHORT I

217

 

D9

169

A9

233

E9

202

CA

1081

 

0439

J

K

KA

218

 

DA

170

AA

234

EA

203

CB

1082

 

043A

K

L

EL

219

 

DB

171

AB

235

EB

204

CC

1083

 

043B

L

M

EM

220

 

DC

172

AC

236

EC

205

CD

1084

 

043C

M

N

EN

221

 

DD

173

AD

237

ED

206

CE

1085

 

043D

N

O

O

222

 

DE

174

AE

238

EE

207

CF

1086

 

043E

O

P

PE

223

 

DF

175

AF

239

EF

208

D0

1087

 

043F

P

R

ER

224

 

E0

224

E0

240

F0

210

D2

1088

 

0440

R

S

ES

225

 

E1

225

E1

241

F1

211

D3

1089

 

0441

S

T

TE

226

 

E2

226

E2

242

F2

212

D4

1090

 

0442

T

U

U

227

 

E3

227

E3

243

F3

213

D5

1091

 

0443

U

F

EF

228

 

E4

228

E4

244

F4

198

C6

1092

 

0444

F

H

HA

229

 

E5

229

E5

245

F5

200

C8

1093

 

0445

H

C

TSE

230

 

E6

230

E6

246

F6

195

C3

1094

 

0446

C

^

CHE

231

 

E7

231

E7

247

F7

222

DE

1095

 

0447

^

[

SHA

232

 

E8

232

E8

248

F8

219

DB

1096

 

0448

[

]

SHCHA

233

 

E9

233

E9

249

F9

221

DD

1097

 

0449

]

_

HARD SIGN

234

 

EA

234

EA

250

FA

223

DF

1098

 

044A

 

Y

YERU

235

 

EB

235

EB

251

FB

217

D9

1099

 

044B

Y

X

SOFT SIGN

236

 

EC

236

EC

252

FC

216

D8

1100

 

044C

X

\

E

237

 

ED

237

ED

253

FD

220

DC

1101

 

044D

n

@

YU

238

 

EE

238

EE

254

FE

192

C0

1102

 

044E

@

Q

YA

239

 

EF

239

EF

255

FF

209

D1

1103

 

044F

Q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

96