Таблица кодов символов windows 1251: Таблица Windows-1251

Содержание

Таблица Windows-1251

Windows-1251 (cp1251) — это стандартная 8-битная кодировка, разработанная компанией Microsoft. Она содержит практически все символы, которые Вы можете встретить на стандартной русской клавиатуре. Также 1251 имеет символы для таких языков, как белорусский, украинский, болгарский и сербский.

DEC

HEX

СИМВ

DEC

HEX

СИМВ

DEC

HEX

СИМВ

000

00

NOP

086

56

V

171

AB

«

001

01

SOH

087

57

W

172

AC

¬

002

02

STX

088

58

X

173

AD

003

03

ETX

089

59

Y

174

AE

®

004

04

EOT

090

5A

Z

175

AF

Ї

005

05

ENQ

091

5B

[

176

B0

°

006

06

ACK

092

5C

\

177

B1

±

007

07

BEL

093

5D

]

178

B2

І

008

08

BS

094

5E

^

179

B3

і

009

09

Табуляция

095

5F

_

180

B4

ґ

010

0A

LF

096

60

`

181

B5

µ

011

0B

VT

097

61

a

182

B6

012

0C

FF

098

62

b

183

B7

·

013

0D

CR

099

63

c

184

B8

Ё

014

0E

SO

100

64

d

185

B9

015

0F

SI

101

65

e

186

BA

Є

016

10

DLE

102

66

f

187

BB

»

017

11

DC1

103

67

g

188

BC

ј

018

12

DC2

104

68

h

189

BD

Ѕ

019

13

DC3

105

69

i

190

BE

Ѕ

020

14

DC4

106

6A

j

191

BF

Ї

021

15

NAK

107

6B

k

192

C0

А

022

16

SYN

108

6C

l

193

C1

Б

023

17

ETB

109

6D

m

194

C2

В

024

18

CAN

110

6E

n

195

C3

Г

025

19

EM

111

6F

o

196

C4

Д

026

1A

SUB

112

70

p

197

C5

Е

027

1B

ESC

113

71

q

198

C6

Ж

028

1C

FS

114

72

r

199

C7

З

029

1D

GS

115

73

s

200

C8

И

030

1E

RS

116

74

t

201

C9

Й

031

1F

US

117

75

u

202

CA

К

032

20

Пробел

118

76

v

203

CB

Л

033

21

!

119

77

w

204

CC

М

034

22

«

120

78

x

205

CD

Н

035

23

#

121

79

y

206

CE

О

036

24

$

122

7A

z

207

CF

П

037

25

%

123

7B

{

208

D0

Р

038

26

&

124

7C

|

209

D1

С

039

27

125

7D

}

210

D2

Т

040

28

(

126

7E

~

211

D3

У

041

29

)

127

7F



212

D4

Ф

042

2A

*

128

80

Ђ

213

D5

Х

043

2B

+

129

81

Ѓ

214

D6

Ц

044

2C

,

130

82

215

D7

Ч

045

2D

131

83

ѓ

216

D8

Ш

046

2E

.

132

84

217

D9

Щ

047

2F

/

133

85

218

DA

Ъ

048

30

0

134

86

219

DB

Ы

049

31

1

135

87

220

DC

Ь

050

32

2

136

88

221

DD

Э

051

33

3

137

89

222

DE

Ю

052

34

4

138

8A

Љ

223

DF

Я

053

35

5

139

8B

224

E0

а

054

36

6

140

8C

Њ

225

E1

б

055

37

7

141

8D

Ќ

226

E2

в

056

38

8

142

8E

Ћ

227

E3

г

057

39

9

143

8F

Џ

228

E4

д

058

3A

:

144

90

Ђ

229

E5

е

059

3B

;

145

91

230

E6

ж

060

3C

<

146

92

231

E7

з

061

3D

=

147

93

232

E8

и

062

3E

>

148

94

233

E9

й

063

3F

?

149

95

234

EA

к

064

40

@

150

96

235

EB

л

065

41

A

151

97

236

EC

м

066

42

B

152

98 ˜

237

ED

н

067

43

C

153

99

238

EE

о

068

44

D

154

9A

љ

239

EF

п

069

45

E

155

9B

240

F0

р

070

46

F

156

9C

њ

241

F1

с

071

47

G

157

9D

ќ

242

F2

т

072

48

H

158

9E

ћ

243

F3

у

073

49

I

159

9F

џ

244

F4

ф

074

4A

J

160

A0

245

F5

х

075

4B

K

161

A1

Ў

246

F6

ц

076

4C

L

162

A2

ў

247

F7

ч

077

4D

M

163

A3

Ј

248

F8

ш

078

4E

N

164

A4

¤

249

F9

щ

079

4F

O

165

A5

Ґ

250

FA

ъ

080

50

P

166

A6

¦

251

FB

ы

081

51

Q

167

A7

§

252

FC

ь

082

52

R

168

A8

Ё

253

FD

э

083

53

S

169

A9

©

254

FE

ю

084

54

T

170

AA

Є

255

FF

я

085

55

U


Похожие записи:

Таблица ASCII (кодировка Windows-1251)

Таблица ASCII (кодировка Windows-1251)
(0)(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)(13)(14)(15)(16)
(17)(18)(19)(20)(21)(22)(23)(24)(25)(26)(27)(28)(29)(30)(31) (32)!(33)
«(34)#(35)$(36)%(37)&(38)(39)((40))(41)*(42)+(43),(44)(45).(46)/(47)0(48)1(49)2(50)
3(51)4(52)5(53)6(54)7(55)8(56)9(57):(58);(59)(60)=(61)>(62)?(63)@(64)A(65)B(66)C(67)
D(68)E(69)F(70)G(71)H(72)I(73)J(74)K(75)L(76)M(77)N(78)O(79)P(80)Q(81)R(82)S(83)T(84)
U(85)V(86)W(87)X(88)Y(89)Z(90)[(91)\ (92)](93)^(94)_(95)`(96)a(97)b(98)c(99)d(100)e(101)
f(102)g(103)h(104)i(105)j(106)k(107)l(108)m(109)n(110)o(111)p(112)q(113)r(114)s(115)t(116)u(117)v(118)
w(119)x(120)y(121)z(122){(123)|(124)}(125)~(126)(127)Ђ(128)Ѓ(129)(130)ѓ(131)(132)(133)(134)(135)
(136)(137)Љ(138)(139)Њ(140)Ќ(141)Ћ(142)Џ(143)ђ(144)(145)(146)(147)(148)(149)(150)(151)˜(152)
(153)љ(154)(155)њ(156)ќ(157)ћ(158)џ(159) (160)Ў(161)ў(162)Ј(163)¤(164)Ґ(165)¦(166)§(167)Ё(168)©(169)
Є(170)«(171)¬(172)­(173)®(174)Ї(175)°(176)±(177)І(178)і(179)ґ(180)µ(181)(182)·(183)ё(184)(185)є(186)
»(187)ј(188)Ѕ(189)ѕ(190)ї(191)А(192)Б(193)В(194)Г(195)Д(196)Е(197)Ж(198)З(199)И(200)Й(201)К(202)Л(203)
М(204)Н(205)О(206)П(207)Р(208)С(209)Т(210)У(211)Ф(212)Х(213)Ц(214)Ч(215)Ш(216)Щ(217)Ъ(218)Ы(219)Ь(220)
Э(221)Ю(222)Я(223)а(224)б(225)в(226)г(227)д(228)е(229)ж(230)з(231)и(232)й(233)к(234)л(235)м(236)н(237)
о(238)п(239)р(240)с(241)т(242)у(243)ф(244)х(245)ц(246)ч(247)ш(248)щ(249)ъ(250)ы(251)ь(252)э(253)ю(254)
я(255)(256)(257)(258)(259)(260)(261)(262)(263)(264)(265)(266)(267)(268)(269)(270)(271)

— версия для печати
Определение
ASCII (англ. American Standard Code for Information Interchange) — американская стандартная таблица для кодирования печатных символов и некоторых специальных кодов.
Если у вас есть мысли по поводу данной страницы или предложение по созданию математической (см. раздел «Математика») вспомогательной памятки, мы обязательно рассмотрим ваше предложение. Просто воспользуйтесь обратной связью.

© Школяр. Математика (при поддержке «Ветвистого древа») 2009—2016

Таблицы кодировок ASCII, CP1251 (windows1251), ISO-8859-5 — Микроконтроллеры для всех

Таблица ASCII

Таблица ASCII (American standard code for information interchange) является мировым стандартом для кодирования букв английского алфавита, популярных спец символов (! $ # % & и т.д.) и некоторых непечатных символов (например, возврат каретки 0x0D и перенос строки 0х0А).

Таблица создавалась те времена, когда возникла необходимость связать символы и числа. А такое соответствие необходимо было для того что бы с помощью чисел можно было передать текстовое сообщение между разными устройствами с цифровой связью.


Таблица CP1251 (windows-1251)

Эта кодировочная таблица может называться или CP1251 или Windows-1251 Это стандарт кодирования кириллических символов в операционных системах windows с русскоязычным интерфейсом.

Первая часть этой таблицы (до байта 0x7F) повторяет таблицу ASCII, а вторая часть (от 0x80 до 0xFF) кодирует кириллические символы в алфавитном порядке.

CP1251 (windows-1251)

Таблица IS0-8859-5

Эта кодировка применяется в дисплеях Nextion для кодирования кириллических символов.

Стоит обратить внимание, что в данной таблице кириллические символы расположены в алфавитном порядке и сдвинуты ровно на 16 байт по сравнению с кодировочной таблицей windows-1251.


Кодировка UTF-8
(Unicode Transformation Format)

Очень распространенный формат кодирования символов, позволяющий кодировать символы переменным количеством байт.

Например, если для кодирования номера символа требуется 21 бит, то используется 4 байта для кодировки. Если для кодирования достаточно 11 бит, то используют 2 байта. А если номер символа может быть закодирован 7 битами, то используется один байт.

Кодировка UTF-8

Все ASCII символы в кодировке UTF8 закодированы без изменений, то есть 1 байтом, как в стандартной таблице ASCII.

А вот остальные символы закодированы количеством байт от 2 до 4.

Кириллические символы закодированы двумя байтами.

за что отвечает и как работает – WindowsTips.Ru. Новости и советы

В начале 90-х, когда произошел развал СССР и границы России были открыты, к нам стали поступать программные продукты западного производства. Естественно, все они были англоязычными. В это же время начинает развиваться Интернет. Остро встала проблема русификации ресурсов и программ. Тогда и была придумана русская кодировка Windows 1251. Она позволяет корректно отображать буквы славянских алфавитов:

  • русского;
  • украинского;
  • белорусского;
  • сербского;
  • болгарского;
  • македонского.

Разработка велась русским представительством Microsoft совместно с компаниями «Диалог» и «Параграф». За основу были взяты самописные разработки, которые в 1990-91гг имели хождение среди немногочисленных идеологов ИТ в России.

На сегодняшний день разработан более универсальный способ кодировать символы — UTF-8 (Юникод). В нем представлено почти 90% всех программных и веб-ресурсов. Windows 1251 применяется в 1,6% случаев. (Информация по исследованиям Web Technology Surveys)

Кодировка сайта utf 8 или Windows 1251?

Чтобы ответить на этот вопрос, необходимо немного понять, что такое кодировка и чем они отличаются. Текстовая информация, как впрочем, и любая другая, в компьютере хранится в закодированном виде. Нам легче представить ее как числа. Каждый символ может занимать один или более байт. Windows 1251 является однобайтной кодировкой, а UTF-8 восьмибайтной. Это значит, что в Windows 1251 можно закодировать всего 256 символов.
Так как все сводится к двоичной системе исчисления, а байт – это 8 бит (0 и 1), то и максимальное число сочетаний составляет 28 = 256. Юникод позволяет представлять куда большее число символов, да и на каждый может быть выделен больший размер.

Отсюда и следуют преимущества Юникода:

  1. В шапке сайта следует указать кодировку, которая используется. Иначе вместо символов отобразятся «кракозяблы». А Юникод является стандартным для всех браузеров – они ловят его «на лету» как установленный по умолчанию.
  2. Символы сайта останутся одними и теми же, независимо от того, в какой стране загружается ресурс. Это зависит не от географического расположения серверов, а от языка программного обеспечения рабочих станций клиента. Житель Португалии, очевидно, использует клавиатуру и все ПО, включая операционную систему, на родном языке. В его компьютере, скорее всего вообще отсутствует Windows 1251. А если это так, то и сайты на русском языке корректно открываться не будут. Юникод, в свою очередь, «зашит» в любую ОС на любом языке.
  3. UTF-8 позволяет закодировать большее количество символов. На данный момент используется 6 байт из 8-ми, а русские символы кодируются двумя байтами.
    Именно поэтому предпочтительней использовать универсальную кодировку, а не узкоспециализированную, которая применяется только в славянских странах.

Таблица кодировки Windows 1251

Для программистов и разработчиков сайтов бывает необходимо знать номера символов. Для этого используются специальные таблицы кодировки. Ниже представлена таблица для Windows 1251.

Что делать, если слетела кодировка командной строки?

Иногда Вы можете столкнуться с ситуацией, когда в командной строке вместо русских отображаются непонятные символы. Это означает, что возникла проблема кодировки командной строки Windows 7. Почему 7-ка? Потому что, начиная с 8-й версии, используется UTF-8, а в семерке еще Windows 1251.
Единовременно помочь решить проблему может команда chcp 866. Текущий сеанс будет работать корректно. А вот чтобы исправить ошибку кардинально, понадобится реестр.

  1. Нажмите Win+R и наберите команду regedit. Это позволит попасть в редактор реестра.
  2. Перейдите по ветке HKEY_CURRENT_USER\Console и посмотрите, чему равно значение для CodePage. Скорее всего, вы увидите что-то, отличное от 866 (правильный вариант).
  3. Исправьте на 866 в положении «Десятичная».
  4. Закройте и откройте вновь командную строку. Ситуация должна исправиться.

Виды кодировок символов [АйТи бубен]

В общем случае кодировка или кодовая таблица — это однозначное соответствие между подмножеством целых чисел (как правило, идущих подряд) и некоторым набором символов. Ключевым здесь является понятие символа. Символ может быть буквой (а может и не быть), может соответствовать звуку речи (а может и не соответствовать) и может быть представлен графическим знаком (но может обходиться и без какого бы то ни было видимого образа). Символ — это атом смысла, мельчайшая неделимая частица информации.

Так, латинское «А» и кириллическое «А» — это разные символы, потому что они употребляются в разных контекстах и несут в себе разную информацию.

Определяющим для любой кодировки является количество охватываемых ею кодов и, соответственно, символов. Поскольку тексты в компьютере хранятся в виде последовательности байтов, большинство кодировок естественным образом распадаются на однобайтовые, или восьмибитные, способные закодировать не больше 256 символов, и двухбайтовые, или шестнадцатибитные, чья емкость может достигать 65636 знакомест.

Если кодировка ISO 8859-5 для кириллицы так и не прижилась, первая из этой серии — кодировка ISO 8859-1, известная также под именем Latin-1, — сумела стать общепринятым стандартом для кодирования «расширенной» латиницы. В эту кодировку включены почти все символы, употребляющиеся в письменностях западноевропейских языков — французского, немецкого, испанского и т.д.

Внедрение Юникода привело к изменению подхода к традиционным 8-битным кодировкам. Если раньше кодировка задавалась шрифтом, то теперь она задаётся таблицей соответствия между данной кодировкой и Юникодом. Фактически 8-битные кодировки превратились в форму представления некоторого подмножества Юникода. Это намного упростило создание программ, которые должны работать с множеством разных кодировок: теперь, чтобы добавить поддержку ещё одной кодировки, надо всего лишь добавить ещё одну таблицу перекодировки в Юникод.

В 1991 году была предпринята попытка создать единую универсальную двухбайтовую кодировку, охватывающую все алфавиты и иероглифические системы мира. Результатом стал стандарт под названием Unicode, покрывающий не только системы письменности всех живых и большинства мертвых языков мира, но и множество музыкальных, математических, химических и прочих символов. Массовое применение Unicode в документах и программах остается делом будущего, для web- дизайнера эта кодировка имеет особое значение, так как именно она объявлена «стандартной кодировкой документа» в HTML начиная с версии 4.

В ближайшее время все более важную роль будет играть особый формат Unicode (и ISO 10646) под названием UTF-8. Эта «производная» кодировка пользуется для записи символов цепочками байтов различной длины (от одного до шести), которые с помощью несложного алгоритма преобразуются в Unicode- коды, причем более употребительным символам соответствуют более короткие цепочки. Главное достоинство этого формата — совместимость с ASCII не только по значениям кодов, но и по количеству бит на символ, так как для кодирования любого из первых 128 символов в UTF-8 достаточно одного байта (хотя, например, для букв кириллицы нужно уже по два байта).

Для указания кодировки символов web-страницы используются следующие обозначения кодовых таблиц:

На web- странице указать кодировку документа можно двумя cпособами:

Элемент meta является дочерним по отношению к разделу заголовка документа (head) и служит для указания типа и кодировки содержимого страницы. Типом содержимого является структурированный текст в формате html (text/html), используемая кодировка кириллица windows (charset=windows-1251).

Обычно используют оба способа одновременно. Например, для указания кодировки КОИ8 для украинского языка на web-странице, используют следующую структуру документа:

<?xml version="1.0" encoding="KOI8-U"?>
<!DOCTYPE html PUBLIC ... >
<html xmlns="http://www.w3.org/1999/xhtml">
    <head>
        <title>Моя перша сторiнка</title>
        <meta http-equiv="Content-Type"
              content="text/html; charset=KOI8-U" />
    </head>
    ...
</html>

При сохранении текста выбирайте ту же кодировку, что указали на web-странице.

Поэкспериментируйте с различными кодировками, и вы убедитесь, что символы латинского алфавита, цифры и знаки пунктуации передаются без изменений в подавляющем большинстве из них.

Кодирование символов : кодовая страница, ASCII


 

Кодировка символов (часто называемая также кодовой страницей) – это набор числовых значений, которые ставятся в соответствие группе алфавитно-цифровых символов, знаков пунктуации и специальных символов.

Для кодировки символов в Windows используется таблица ASCII (American Standard Code for Interchange of Information).

В ASCII первые 128 символов всех кодовых страниц состоят из базовой таблицы символов. Первые 32 кода базовой таблицы, начиная с нулевого, размещают управляющие коды.

СимволКодКлавишиЗначение
nul0Ctrl + @Нуль
soh1Ctrl + AНачало заголовка
stx2Ctrl + BНачало текста
etx3Ctrl + CКонец текста
eot4Ctrl + DКонец передачи
enq5Ctrl + EЗапрос
ack6Ctrl + FПодтверждение
bel7Ctrl + GСигнал (звонок)
bs8Ctrl + HЗабой (шаг назад)
ht9Ctrl + IГоризонтальная табуляция
lf10Ctrl + JПеревод строки
vt11Ctrl + KВертикальная табуляция
ff12Ctrl + LНовая страница
cr13Ctrl + MВозврат каретки
so14Ctrl + NВыключить сдвиг
si15Ctrl + OВключить сдвиг
dle16Ctrl + PКлюч связи данных
dc117Ctrl + QУправление устройством 1
dc218Ctrl + RУправление устройством 2
dc319Ctrl + SУправление устройством 3
dc420Ctrl + TУправление устройством 4
nak21Ctrl + UОтрицательное подтверждение
syn22Ctrl + VСинхронизация
etb23Ctrl + WКонец передаваемого блока
can24Ctrl + XОтказ
em25Ctrl + YКонец среды
sub26Ctrl + ZЗамена
esc27Ctrl + [Ключ
fs28Ctrl + \Разделитель файлов
gs29Ctrl + ]Разделитель группы
rs30Ctrl + ^Разделитель записей
us31Ctrl + _Разделитель модулей

Базовая таблица кодировки ASCII

32 пробел48 064 @80 P96 `112 p
33 !49 165 A81 Q97 a113 q
34 50 266 B82 R98 b114 r
35 #51 367 C83 S99 c115 s
36 $52 468 D84 T100 d116 t
37 %53 569 E85 U101 e117 u
38 &54 670 F86 V102 f118 v
39 ‘55 771 G87 W103 g119 w
40 (56 872 H88 X104 h120 x
41 )57 973 I89 Y105 i121 y
42 *58 :74 J90 Z106 j122 z
43 +59 ;75 K91 [107 k123 {
44 ,60 <76 L92 \108 l124 |
45 —61 =77 M93 ]109 m125 }
46 .110 n126 ~
47 /63 ?79 O95 _111 o127

Символы с номерами от 128 до 255 представляют собой таблицу расширения и варьируются в зависимости от набора скриптов, представленных кодировкой символов. Набор символов таблицы расширения различается в зависимости от выбранной кодовой страницы:

1251 – кодовая страница Windows

128 Ђ144 Ђ160176 °192 А208 Р224 а240 р
129 Ѓ145 ‘161 Ў177 ±193 Б209 С225 б241 с
130 ‚146 ’162 ў178 I194 В210 Т226 в242 т
131 ѓ147 “163 J179 i195 Г211 У227 г243 у
132 „148 ”164 ¤180 ґ196 Д212 Ф228 д244 ф
133 …149 •165 Ґ181 μ197 Е213 Х229 е245 х
134 †150 –166 ¦182 ¶198 Ж214 Ц230 ж246 ц
135 ‡151 —167 §183 ·199 З215 Ч231 з247 ч
136 €152 □168 Ё184 ё200 И216 Ш232 и248 ш
137 ‰153 ™169 ©185 №201 Й217 Щ233 й249 щ
138 Љ154 љ170 Є186 є202 К218 Ъ234 к250 ъ
139 <155 >171 «187 »203 Л219 Ы235 л251 ы
140 Њ156 њ172 ¬188 j204 М220 Ь236 м252 ь
141 Ќ157 ќ173189 S205 Н221 Э237 н253 э
142 Ћ158 ћ174 ®190 s206 О222 Ю238 о254 ю
143 Џ159 џ175 Ï191 ї207 П223 Я239 п255 я

866 – кодовая страница DOS

128 А144 Р160 а176 ░192 └208 ╨224 р240 ≡Ё
129 Б145 С161 б177 ▒193 ┴209 ╤225 с241 ±ё
130 В146 Т162 в178 ▓194 ┬210 ╥226 т242 ≥
131 Г147 У163 г179 │195 ├211 ╙227 у243 ≤
132 Д148 Ф164 д180 ┤196 ─212 ╘228 ф244 ⌠
133 Е149 Х165 е181 ╡197 ┼213 ╒229 х245 ⌡
134 Ж150 Ц166 ж182 ╢198 ╞214 ╓230 ц246 ¸
135 З151 Ч167 з183 ╖199 ╟215 ╫231 ч247 »
136 И152 Ш168 и184 ╕200 ╚216 ╪232 ш248 °
137 Й153 Щ169 й185 ╣201 ╔217 ┘233 щ249 ·
138 К154 Ъ170 к186 ║202 ╩218 ┌234 ъ250 ∙
139 Л155 Ы171 л187 ╗203 ╦219 █235 ы251 √
140 М156 Ь172 м188 ╝204 ╠220 ▄236 ь252 ⁿ
141 Н157 Э173 н189 ╜205 ═221 ▌237 э253 ²
142 О158 Ю174 о190 ╛206 ╬222 ▐238 ю254 ■
143 П159 Я175 п191 ┐207 ╧223 ▀239 я255

Русские названия основных спецсимволов:

СимволНазвание
`гравис, кавычка, обратный машинописный апостроф
`гравис, кавычка, обратный машинописный апостроф
~тильда
!восклицательный знак
@эт, коммерческое эт, «собака»
#октоторп, решетка, диез
$знак доллара
%процент
^циркумфлекс, знак вставки
&амперсанд
*астериск, звездочка, знак умножения
(левая открывающая круглая скобка
)правая закрывающая круглая скобка
минус, дефис
_знак подчеркивания
=знак равенства
+плюс
[левая открывающая квадратная скобка
]правая закрывающая квадратная скобка
{левая открывающая фигурная скобка
}правая закрывающая фигурная скобка
;точка с запятой
:двоеточие
машинописный апостроф, одинарная кавычка
«двойная кавычка
,запятая
.точка
/слэш, косая черта, знак дроби
<левая открытая угловая скобка, знак меньше
>правая закрытая угловая скобка, знак больше
\обратный слэш, обратная косая черта
|вертикальная черта

Кодировка UNICODE

Юникод (Unicode) — стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода».

В Unicode используются 16-битовые (2-байтовые) коды, что позволяет представить 65536 символов.

Применение стандарта Unicode позволяет закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, при этом становится ненужным переключение кодовых страниц.

Для представления символьных данных в кодировке Unicode используется символьный тип wchar_t.

ASCIIUNICODE
charwchar_t
1 байт2 байта

Тип кодировки задается в свойствах проекта Microsoft Visual Studio:


Многобайтовая кодировка предполагает использование кодировки ASCII.
При этом при построении проекта используется директива условной компиляции, переопределяющая тип TCHAR:

 
 
 
 
 

#ifdef _UNICODE
  typedef wchar_t TCHAR;
#else
  typedef char TCHAR;
#endif

Для перекодирования строки в формат Unicode без изменения кодировки файла используется макроопределение
_T(«строка»)

Прототип макроса содержится в файле tchar.h.


Назад: Представление данных и архитектура ЭВМ

Кодировка windows 1251 в сайтостроении

Кодировка windows 1251 была создана в начале 90 годов для русификации программных продуктов, выпускаемых корпорацией Microsoft:

Кодировка является 8-битной и включает в себя символы славянской группы языков, в которую входят русский, белорусский, украинский, болгарский, македонский, сербский – это дает преимущество перед остальными кириллическими кодировками (ISO 8859-5, KOI8-R, CP866). Однако у 1251-кодировки имеются и весомые недостатки:

  • 0xFF (25510) – это код, который зарезервирован для символа «я». В программах, которые не поддерживают чистый 8-ой бит, часто возникают непредсказуемые проблемы;
  • Нет псевдографики, которая присутствует в KOI8, CP866.

Ниже приведены символы из Code Page 1251 или сокращенно СР1251 (числа под символами являются кодом в шестнадцатеричной системе такого же символа в Юникоде):

Нередко у web-разработчиков и блогеров, обладающих различной квалификацией возникает проблема с кодировкой страниц: вместо подготовленного текста появляются неизвестные, нечитаемые символы. Чтобы разобраться с данной проблемой, необходимо понимать суть термина «кодировка страницы».

Текст в памяти компьютера хранится в виде определенного количества байт, а не в том виде, в котором он отображается в текстовом редакторе. Каждый байт является кодом, который соответствует одному символу. Для того чтобы текст на странице отображался как следует, нужно сообщить браузеру, какую таблицу кодов для расшифровки и отображения он должен использовать.

Таблица кодировок не является универсальной, то есть, для расшифровки текста необходимо использовать ту, которая соответствует кодировке символов:

Для того чтобы html-документ корректно отобразился в браузере, необходимо указать используемую кодировку. Делается это следующим образом:

— между тегом <head> и закрывающим его </head> нужно прописать <meta http-equiv=»Content-Type» content=»text/html; charset=windows-1251″> — исходя из этой строки, браузер будет использовать символы русского алфавита для отображения текста на странице.

Ни для кого не является тайной, что генерация страниц проходит путем выборки и использования какой-то части информации, которая хранится в базе данных. При написании сайта на PHP, чаще всего это mysql:

Нередко при смене хостинга возникает проблема: различные кодировки информации в базе данных и в шаблонах страниц. Из-за этого одна сгенерированная страница может одновременно содержать несколько кодировок. Если информация на сайте представлена в кодировке виндовс 1251, то и чтение из базы данных должно осуществляться с помощью таблицы, в которой представлена win 1251 кодировка.

Для согласования расшифровки необходимо выполнить функцию mysql_query(«SET NAMES cp1251») – это означает, что преобразование из машинного кода будет осуществляться согласно таблице cp1251.

При создании сайта, предварительно настроив кодировки в шаблонах и базах данных, все равно может всплыть проблема некорректного отображения информации в браузере.

Для того чтобы для веб-ресурса была задана кодировка виндовс-1251, необходимо найти (или создать) файл .htaccess. Это файл, который хранит в себе дополнительные настройки и описания конфигураций web-сервера.

В нем для установки кодировки следует прописать следующие строки:

  • DefaultLanguage ru;
  • AddDefaultCharset windows-1251;
  • php_value default_charset «cp1251».

Таким образом, для корректного отображения текста должны совпадать его кодировка и таблица кодов, с помощью которой браузер будет расшифровывать символы. Для текстов, написанных на славянских языках, необходима win 1251 кодировка. Важно помнить, что элементы страниц и баз данных должны быть описаны с помощью одной таблицы кодов.

Таблица сравнения символов

в Windows-1252, ISO-8859-1, ISO-8859-15

Кодировки символов ISO-8859-1, ISO-8859-15 и Windows-1252 очень похожи, и их легко перепутать. Это приводит к нескольким типичным проблемам. Следующая диаграмма показывает различия между этими кодировками и полезна для отладки связанных проблем.

ISO-8859-1 по сравнению с Windows-1252

ISO-8859-1 (также называемый Latin-1) идентичен Windows-1252 (также называемый CP1252), за исключением кодовых точек 128-159 (0x80-0x9F).ISO-8859-1 назначает несколько управляющих кодов в этом диапазоне. Windows-1252 имеет несколько символов, пунктуацию, арифметику и бизнес. символы, присвоенные этим кодовым точкам.

Типичные проблемы
  • Неправильная маркировка текста, закодированного в Windows-1252 как ISO-8859-1, а затем преобразование из ISO-8859-1 в Unicode или другие кодировки приводит к появлению символов в диапазоне 128-159 теряться. Они преобразуются, как если бы они были управляющими кодами, и обычно отображаются в виде белого пространства, специального вопросительного знака, или квадрат, показывающий 4 шестнадцатеричных цифры кодовой точки.
  • Использование шрифта ISO-8859-1, который не имеет правильных глифов для символов Windows-1252 приведет к неправильному отображению символов.
  • HTML и XML используют кодовые точки Unicode в качестве значений в ссылках на числовые символы (NCR). Ссылки на числовые символы — это escape-символы записывается как & # dddd; или & # xhhhh; где десятичные или шестнадцатеричные значения являются кодовыми точками Unicode. Поскольку первые 256 символов в Юникоде идентичны символам в ISO-8859-1, люди привыкают использовать знакомый им кодовый знак для создания NCR.Однако для символов в диапазоне 128–159 в Windows-1252 это неправильные значения. Например, евро (€) в кодовой точке 0x80 в Windows-1252, но в Unicode это U + 20AC. & # x80; является NCR для контрольного кода и не будет отображаться как евро. Правильный NCR — & # x20AC ;.

В сравнительной таблице ниже показаны кодовые точки Unicode, связанные с Windows-1252. символы в диапазоне 128-159.

ISO-8859-1 в сравнении с ISO-8859-15

Эти 2 кодировки идентичны, за исключением 8 кодовых точек, что вызывает путаницу между ними, а также с Windows-1252.Для получения дополнительной информации о ISO-8859-15, см. Сравнение ISO-8859-1 и ISO-8859-15.

Таблица сравнения

Вот символы в диапазоне 128-159 в Windows 1252 с их кодовыми точками Unicode, Значения байтов UTF-8 и кодовые точки ISO-8859-15, если они отличаются от ISO-8859-1.

Примечание по терминологии:

  • NCR = Ссылка на цифровые символы
  • CER = Ссылка на сущность символа
  • CP1252 = Окна-1252
Сравнение символов в Windows-1252, ISO-8859-1, ISO-8859-15
Кодовый пункт UTF-8 байтов NCR * Персонаж CER * или NCR * Имя персонажа
CP1252 * ISO 8859-15 Юникод
(декабрь) (шестигранник) (шестигранник) (шестигранник) # 1 # 2 # 3 (декабрь) (шестигранник)
128 80 A4 20AC E2 82 AC & # 8364; и евро; Знак евро
129 81 НЕ НАЗНАЧЕН
130 82 201A E2 80 9A & # 8218; & sbquo; Одиночный малый 9 кавычки
131 83 192 C6 92 & # 402; ƒ & # x192; Строчная латинская буква F с крючком
132 84 201E E2 80 9E & # 8222; & bdquo; Двойной низкий 9 котировальный знак
133 85 2026 E2 80 A6 & # 8230; & hellip; Горизонтальное многоточие
134 86 2020 E2 80 A0 & # 8224; & кинжал; Кинжал
135 87 2021 E2 80 A1 & # 8225; и кинжал; Двойной кинжал
136 88 2C6 CB 86 & # 710; ˆ & circ; Буква-модификатор Circumflex Accent
137 89 2030 E2 80 B0 & # 8240; & permil; Знак промилле
138 8A A6 160 C5 A0 & # 352; Š и Scaron; Латинская заглавная буква S с кароном
139 2039 E2 80 B9 & # 8249; & lsaquo; Кавычка с одинарным левым углом
140 8C г. до н.э. 152 C5 92 & # 338; Œ и OElig; Лигатура латинской заглавной буквы OE
141 8D НЕ НАЗНАЧЕН
142 8E B4 17D C5 BD & # 381; Ž & # x17D; Латинская заглавная буква Z с кароном
143 8F НЕ НАЗНАЧЕН
144 90 НЕ НАЗНАЧЕН
145 91 2018 E2 80 98 & # 8216; & lsquo; Одинарный кавычка левый
146 92 2019 E2 80 99 & # 8217; & rsquo; Одинарный кавычка, правый
147 93 201C E2 80 9C & # 8220; & ldquo; Двойные кавычки слева
148 94 201D E2 80 9D & # 8221; & rdquo; Двойные кавычки справа
149 95 2022 E2 80 A2 & # 8226; и бык; Пуля
150 96 2013 E2 80 93 & # 8211; & ndash; En Dash
151 97 2014 E2 80 94 & # 8212; & mdash; Em Dash
152 98 2DC CB 9C & # 732; ˜ & тильда; Маленькая тильда
153 99 2122 E2 84 A2 & # 8482; и торговля; Знак товарного знака
154 9A A8 161 C5 A1 & # 353; š & scaron; Строчная латинская буква S с кароном
155 203A E2 80 BA & # 8250; & rsaquo; Одинарный кавычка, указывающая вправо
156 9C BD 153 C5 93 & # 339; œ & oelig; Строчная латинская лигатура OE
157 9D НЕ НАЗНАЧЕН
158 9E B8 17E C5 BE & # 382; × & # x17E; Строчная латинская буква Z с кароном
159 9F BE 178 C5 B8 & # 376; Ÿ и Yuml; Латинская заглавная буква Y с диэрезисом

Дополнительные ссылки

Авторские права © 2010, 2011 Tex Texin.Все права защищены.
вернуться наверх

Кодовая страница Windows 1251

Кодовая страница Windows 1251 Эта страница содержит таблицу кодовой страницы Microsoft Windows 1251 для русского и некоторые другие языки, написанные кириллицей. CP1251 символы включены буквально в скобки слева от каждой строки. Если вы сохраните эту страницу, у вас будет таблица CP1251, которую вы можете использовать для тестирования вашего конфигурация набора символов эмулятора терминала.
Кодовая страница Microsoft Windows 1251
char dec col / row oct hex описание
[] 128 08/00 200 80 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА DJE
[] 129 08/01 201 81 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА GJE
[] 130 08/02 202 82 НИЗКАЯ 9 ОДИНОЧНАЯ ЦИТАТА
[] 131 08/03 203 83 Кирилическая строчная буква GJE
[] 132 08/04 204 84 НИЗКАЯ 9 ДВОЙНАЯ ЦИТАТА
[] 133 08/05 205 85 ЭЛЛИПСИС
[] 134 08/06 206 86 КИНЖАЛ
[] 135 08/07 207 87 ДВОЙНОЙ КИНЖАЛ
[] 136 08/08 210 88 ЕВРО ЗНАК
[] 137 08/09 211 89 ЗА МИЛ ЗНАК
[] 138 08/10 212 8A ЗАГЛАВНАЯ БУКВА LJE
[] 139 08/11 213 8B ЛЕВЫЙ КРОНШТЕЙН ОДИНОЧНОЙ ЦИТАТЫ
[] 140 08/12 214 8C КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА NJE
[] 141 08/13 215 8D КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА KJE
[] 142 08/14 216 8E КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TSHE
[] 143 15.08 217 8F КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ДЖЕ
[] 144 09/00 220 90 КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА DJE
[] 145 09/01 221 91 ВЫСОКАЯ 6 ОДИНОЧНАЯ ЦИТАТА
[] 146 09/02 222 92 ВЫСОКАЯ 9 ОДИНОЧНАЯ ЦИТАТА
[] 147 09/03 223 93 ВЫСОКАЯ 6 ДВОЙНАЯ ЦИТАТА
[] 148 09/04 224 94 ВЫСОКАЯ 9 ДВОЙНАЯ ЦИТАТА
[] 149 09/05 225 95 БОЛЬШАЯ ЦЕНТРАЛЬНАЯ ТОЧКА
[] 150 09/06 226 96 RU ТИП
[] 151 07.09 227 97 EM DASH
[] 152 09/08 230 98 (НЕ ОПРЕДЕЛЕННО)
[] 153 09/09 231 99 ТОВАРНЫЙ ЗНАК
[] 154 09/10 232 9A СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА LJE
[] 155 09/11 233 9B ПРАВЫЙ КРОНШТЕЙН ДЛЯ ОДИНОЧНОЙ ЦИТАТЫ
[] 156 09/12 234 9C КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА NJE
[] 157 09/13 235 9D КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА KJE
[] 158 14.09 236 9E КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TSHE
[] 159 15.09 237 9F КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ДЖЕ
[] 160 10/00 240 A0 НЕПРЕРЫВНОЕ ПРОСТРАНСТВО
[] 161 10/01 241 A1 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА КОРОТКАЯ U
[] 162 10/02 242 A2 КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА КОРОТКАЯ U
[] 163 10/03 243 A3 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА JE
[] 164 10/04 244 ЗНАК ВАЛЮТЫ A4
[] 165 10/05 245 A5 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА GHE С ПОВОРОТОМ
[] 166 10/06 246 A6 СЛОМАННЫЙ БАР
[] 167 10/07 247 A7 ЗНАК ПАРАГРАФА
[] 168 10/08 250 A8 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА IO
[] 169 10/09 251 A9 ЗНАК АВТОРСКОГО ПРАВА
[] 170 10/10 252 AA КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА УКРАИНСКИЙ IE
[] 171 10/11 253 AB ЛЕВЫЙ УГЛОВОЙ ЦИТАТНЫЙ ЗНАК
[] 172 10/12 254 AC NOT SIGN
[] 173 10/13 255 AD МЯГКИЙ ДЕФИС
[] 174 10/14 256 AE ЗНАК ЗАРЕГИСТРИРОВАННОЙ ТОРГОВОЙ МАРКИ
[] 175 10/15 257 AF КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА YI
[] 176 11/00 260 B0 ЗНАК, КОЛЬЦО ВЫШЕ
[] 177 11/01 261 B1 ЗНАК ПЛЮС-МИНУС
[] 178 11/02 262 B2 Кирилическая прописная буква БЕЛОРУССИЯ-УКРАИНСКИЙ ЯЗЫК I
[] 179 11/03 263 B3 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА БЕЛОРУССИЯ-УКРАИНСКИЙ ЯЗЫК I
[] 180 11/04 264 B4 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА GHE С ПОВОРОТОМ
[] 181 11/05 265 B5 МИКРОЗНАК
[] 182 06/11 266 B6 ЗНАК ПИЛКРОУ
[] 183 07/11 267 B7 СРЕДНЯЯ ТОЧКА
[] 184 08/11 270 B8 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА IO
[] 185 11/09 271 B9 ЗНАК NUMERO
[] 186 11/10 272 BA СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА УКРАИНСКИЙ IE
[] 187 11/11 273 BB ЦИТАТНЫЙ ЗНАК ПРАВЫЙ УГОЛ
[] 188 11/12 274 до н.э. СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА JE.
[] 189 11/13 275 BD КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА DZE
[] 190 14/11 276 БЫТЬ СТРОЧНОЙ КИРИЛИЧЕСКОЙ БУКВОЙ DZE
[] 191 15/11 277 BF КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА YI
[] 192 12/00 300 C0 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА A
[] 193 01/12 301 C1 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА БЫТЬ
[] 194 12/02 302 C2 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА VE
[] 195 12/03 303 C3 ЗАГЛАВНАЯ БУКВА GHE
[] 196 12/04 304 C4 ЗАГЛАВНАЯ БУКВА DE
[] 197 12/05 305 C5 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА IE
[] 198 12/06 306 C6 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ZHE
[] 199 12/07 307 C7 ЗАГЛАВНАЯ БУКВА ZE
[] 200 12/08 310 C8 ЗАГЛАВНАЯ БУКВА I
[] 201 12/09 311 C9 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА КОРОТКАЯ I
[] 202 12/10 312 CA КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА KA
[] 203 12/11 313 CB КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EL
[] 204 12/12 314 CC КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EM
[] 205 12/13 315 CD КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EN
[] 206 12/14 316 CE КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА O
[] 207 15/12 317 CF КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА PE
[] 208 13/00 320 D0 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ER
[] 209 13/01 321 D1 ЗАГЛАВНАЯ БУКВА ES
[] 210 13/02 322 D2 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TE
[] 211 13/03 323 D3 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА U
[] 212 13/04 324 D4 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EF
[] 213 13/05 325 D5 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА HA
[] 214 13/06 326 D6 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TSE
[] 215 13/07 327 D7 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА CHE
[] 216 13/08 330 D8 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА SHA
[] 217 13/09 331 D9 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЩА
[] 218 13/10 332 DA КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЖЕСТКИЙ ЗНАК
[] 219 13/11 333 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ДБ ЕРУ
[] 220 13/12 334 DC КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА МЯГКИЙ ЗНАК
[] 221 13/13 335 DD КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА E
[] 222 13/14 336 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА YU
[] 223 13/15 337 DF КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА YA
[] 224 14/00 340 E0 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА A
[] 225 14/01 341 E1 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА BE
[] 226 14/02 342 E2 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА VE
[] 227 14/03 343 E3 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА GHE
[] 228 14/04 344 E4 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА DE
[] 229 14/05 345 E5 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА IE
[] 230 14/06 346 E6 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ZHE
[] 231 14/07 347 E7 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ZE
[] 232 14/08 350 E8 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА I
[] 233 14/09 351 E9 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА КОРОТКАЯ I
[] 234 14/10 352 EA СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА KA
[] 235 14/11 353 EB КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА EL
[] 236 14/12 354 EC КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА EM
[] 237 14/13 355 ED Кирилическая строчная буква EN
[] 238 14/14 356 EE СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА O
[] 239 14/15 357 EF КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА PE
[] 240 15/00 360 F0 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ER
[] 241 15/01 361 F1 КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ES
[] 242 15/02 362 F2 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА TE
[] 243 15/03 363 F3 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА U
[] 244 15/04 364 F4 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА EF
[] 245 15/05 365 F5 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА HA
[] 246 15/06 366 F6 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА TSE
[] 247 15/07 367 F7 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА CHE
[] 248 15/08 370 F8 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА CHA
[] 249 15/09 371 F9 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ЩА
[] 250 15/10 372 FA КИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ЖЕСТКИЙ ЗНАК
[] 251 15/11 373 FB КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА YERU
[] 252 15/12 374 FC КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА МЯГКИЙ ЗНАК
[] 253 15/13 375 FD СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА E
[] 254 15/14 376 FE СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА YU
[] 255 15/15 377 FF СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА YA
 

Франк да Круз, Проект Кермит, Колумбийский университет, Март 2003 г.

PHP: Поддерживаемые кодировки символов — Руководство

В настоящее время следующие кодировки символов поддерживаются mbstring модуль.Любая из этих кодировок символов может быть указано в параметре кодировка параметра mbstring функций.

В этом PHP поддерживаются следующие кодировки символов. расширение:

  • UCS-4 *
  • UCS-4BE
  • UCS-4LE *
  • UCS-2
  • UCS-2BE
  • UCS-2LE
  • UTF-32 *
  • UTF-32BE *
  • UTF-32LE *
  • UTF-16 *
  • UTF-16BE *
  • UTF-16LE *
  • UTF-7
  • UTF7-IMAP
  • UTF-8 *
  • ASCII *
  • EUC-JP *
  • SJIS *
  • eucJP-выигрыш *
  • SJIS-выиграть *
  • ISO-2022-JP
  • ISO-2022-JP-MS
  • CP932
  • CP51932
  • SJIS-mac (псевдоним: MacJapanese)
  • SJIS-Mobile # DOCOMO (псевдоним: SJIS-DOCOMO)
  • SJIS-Mobile # KDDI (псевдоним: SJIS-KDDI)
  • SJIS-Mobile # SOFTBANK (псевдоним: SJIS-SOFTBANK)
  • UTF-8-Mobile # DOCOMO (псевдоним: UTF-8-DOCOMO)
  • UTF-8-Mobile # KDDI-A
  • UTF-8-Mobile # KDDI-B (псевдоним: UTF-8-KDDI)
  • UTF-8-Mobile # SOFTBANK (псевдоним: UTF-8-SOFTBANK)
  • ISO-2022-JP-MOBILE # KDDI (псевдоним: ISO-2022-JP-KDDI)
  • JIS
  • JIS-ms
  • CP50220
  • CP50220raw
  • CP50221
  • CP50222
  • ISO-8859-1 *
  • ISO-8859-2 *
  • ISO-8859-3 *
  • ISO-8859-4 *
  • ISO-8859-5 *
  • ISO-8859-6 *
  • ISO-8859-7 *
  • ISO-8859-8 *
  • ISO-8859-9 *
  • ISO-8859-10 *
  • ISO-8859-13 *
  • ISO-8859-14 *
  • ISO-8859-15 *
  • ISO-8859-16 *
  • байт2be
  • байт2ле
  • byte4be
  • байт4ле
  • BASE64
  • HTML-ENTITIES (псевдоним: HTML)
  • 7 бит
  • 8 бит
  • EUC-CN *
  • CP936
  • ГБ18030
  • Гц
  • EUC-TW *
  • CP950
  • БОЛЬШОЙ-5 *
  • EUC-KR *
  • UHC (псевдоним: CP949)
  • ISO-2022-KR
  • Windows-1251 (псевдоним: CP1251)
  • Windows-1252 (псевдоним: CP1252)
  • CP866 (псевдоним: IBM866)
  • КОИ8-Р *
  • КОИ8-У *
  • ArmSCII-8 (псевдоним: ArmSCII8)

* обозначает кодировки, которые можно использовать также в регулярных выражениях.

Любая запись php.ini , которая принимает имя кодировки также можно использовать значения « авто » и « перевал ». mbstring функций, которые принимают кодировку name также может использовать значение « auto ».

Если задано « проход », ни одного символа преобразование кодировки выполняется.

Если установлено « авто », оно расширяется до список кодировок, определенных в NLS. Например, если для NLS установлено значение Японский , значение предполагается равным « ASCII, JIS, UTF-8, EUC-JP, SJIS ».

См. Также mb_detect_order ()

Модуль ngx_http_charset_module

Модуль ngx_http_charset_module

Модуль ngx_http_charset_module добавляет указанный charset в поле заголовка ответа Content-Type. Кроме того, модуль может конвертировать данные из одной кодировки в другую, с некоторыми ограничениями:

  • конвертация осуществляется в одну сторону — от сервера к клиенту,
  • могут быть преобразованы только однобайтовые кодировки
  • или однобайтовые кодировки в / из UTF-8.
Пример конфигурации
включить conf / koi-win;

кодировка windows-1251;
source_charset koi8-r;
 
Директивы
Синтаксис: кодировка кодировка | с ;
Дефолт:
 charset off; 
Контекст: http , server , location , if in location

Добавляет указанную кодировку в Content-Type. поле заголовка ответа.Если эта кодировка отличается от указанной в директиве source_charset выполняется преобразование.

Параметр off отменяет добавление кодировки. в поле заголовка ответа Content-Type.

Кодировку можно определить с помощью переменной:

charset $ charset;
 

В таком случае должны присутствовать все возможные значения переменной. в конфигурации хотя бы один раз в виде charset_map, charset или source_charset директивы.Для utf-8 , windows-1251 и koi8-r кодировки , достаточно включить файлы conf / koi-win , conf / koi-utf и conf / win-utf в конфигурацию. Для других кодировок просто создание фиктивной таблицы преобразования работает, Например:

charset_map iso-8859-5 _ {}
 

Кроме того, кодировку можно установить в Поле заголовка ответа «X-Accel-Charset». Эту возможность можно отключить с помощью proxy_ignore_headers, fastcgi_ignore_headers, uwsgi_ignore_headers, scgi_ignore_headers, и grpc_ignore_headers директивы.

Синтаксис: charset_map charset1 charset2 {...}
Дефолт:
Контекст: http

Описывает таблицу преобразования из одной кодировки в другую.Таблица обратного преобразования строится с использованием тех же данных. Коды символов даны в шестнадцатеричном формате. Отсутствующие символы в диапазоне 80-FF заменяются на «? ». При преобразовании из UTF-8 символы отсутствуют в однобайтовой кодировке. заменяются на « & # XXXX; ».

Пример:

charset_map koi8-r windows-1251 {
    C0 FE; # маленький ю
    C1 E0; # маленький а
    C2 E1; # маленький б
    C3 F6; # small ts
    ...
}
 

При описании таблицы преобразования в UTF-8 коды для кодировки UTF-8 должны быть приведенным во втором столбце, например:

charset_map koi8-r utf-8 {
    C0 D18E; # маленький ю
    C1 D0B0; # маленький а
    C2 D0B1; # маленький б
    C3 D186; # small ts
    ...
}
 

Полные таблицы преобразования с koi8-r на windows-1251 , а от koi8-r и окна-1251 от до utf-8 предоставлены в файлах раздачи conf / koi-win , conf / koi-utf и conf / win-utf .

Синтаксис: charset_types mime-type ...;
Дефолт:
 charset_types текст / HTML-текст / XML-текст / обычный текст / vnd.wap.wml
приложение / javascript приложение / rss + xml; 
Контекст: http , сервер , расположение

Эта директива появилась в версии 0.7.9.

Включает обработку модуля в ответах с указанными типами MIME в дополнение к « text / html ». Специальное значение « * » соответствует любому типу MIME (0.8.29).

До версии 1.5.4 использовалось « application / x-javascript ». в качестве типа MIME по умолчанию вместо « application / javascript ».
Синтаксис: override_charset на | с ;
Дефолт:
 override_charset off; 
Контекст: http , server , location , if in location

Определяет, нужно ли выполнять преобразование ответов получено от прокси-сервера или сервера FastCGI / uwsgi / SCGI / gRPC когда ответы уже содержат кодировку в «Content-Type» поле заголовка ответа.Если преобразование включено, кодировка указана в полученном ответ используется как кодировка источника.

Следует отметить, что если ответ получен в подзапросе затем преобразование из кодировки ответа в кодировку основного запроса выполняется всегда, независимо от значения override_charset установка директивы.
Синтаксис: кодировка источника кодировка ;
Дефолт:
Контекст: http , server , location , if in location

Определяет исходную кодировку ответа.Если эта кодировка отличается от указанной в директиве charset выполняется преобразование.

Наборы символов

Ссылкаabbaddhandhandaddkana долларов США Руководство пользователя принтера Справочное руководство по языку PostScript Кодирование Справочное руководство по языку PostScript Корпорация Майкрософт Макинтош
US-ASCII US-ASCII 3 ANSI X3.4-1986 [RFC2046] iso-ir-6
ANSI_X3.4-1968
ANSI_X3.4-1986
ISO_646.irv: 1991
ISO646-US
US-ASCII
us
IBM367
cp367
csASCII
ISO-8859-1 ISO_8859-1: 1987 4 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-100
ISO_8859-1
ISO-8859-1
latin1
l1
IBM819
CP819
csISOLatin1
ISO-8859-2 ISO_8859-2: 1987 5 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-101
ISO_8859-2
ISO-8859-2
latin2
l2
csISOLatin2
ISO-8859-3 ISO_8859-3: 1988 6 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-109
ISO_8859-3
ISO-8859-3
latin3
l3
csISOLatin3
ISO-8859-4 ISO_8859-4: 1988 7 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-110
ISO_8859-4
ISO-8859-4
latin4
l4
csISOLatin4
ISO-8859-5 ISO_8859-5: 1988 8 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-144
ISO_8859-5
ISO-8859-5
кириллица
csISOLatinCyrillic
ISO-8859-6 ISO_8859-6: 1987 9 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-127
ISO_8859-6
ISO-8859-6
ECMA-114
ASMO-708
арабский
csISOLatinArabic
ISO-8859-7 ISO_8859-7: 1987 10 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1947] [RFC1345] [Keld_Simonsen] iso-ir-126
ISO_8859-7
ISO-8859-7
ELOT_928
ECMA-118
греческий
греческий8
csISOLatinGreek
ISO-8859-8 ISO_8859-8: 1988 11 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-138
ISO_8859-8
ISO-8859-8
иврит
csISOLatinHebrew
ISO-8859-9 ISO_8859-9: 1989 12 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-148
ISO_8859-9
ISO-8859-9
latin5
l5
csISOLatin5
ISO-8859-10 ISO-8859-10 13 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-157
l6
ISO_8859-10: 1992
csISOLatin6
latin6
ISO_6937-2-добавить 14 [ISO-IR: Международный регистр последовательностей побегов] и ISO 6937-2: 1983
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-142
csISOTextComm
JIS_X0201 15 JIS X 0201-1976.Только один байт, это эквивалентно JIS / Roman (аналогично ASCII) плюс восьмибитная полуширина Катакана [RFC1345] [Keld_Simonsen] X0201
cs HalfWidth, Катакана
JIS_Encoding 16 JIS X 0202-1991. Использует escape-последовательности ISO 2022 для наборы кодов смены, как описано в JIS X 0202-1991. csJISEncoding
Shift_JIS Shift_JIS 17 Эта кодировка является расширением csHalfWidthKatakana, разработанным добавление графических символов в JIS X 0208.CCS являются JIS X0201: 1997 и JIS X0208: 1997. В полное определение приведено в Приложении 1 JIS X0208: 1997. Эта кодировка может использоваться для типа мультимедиа верхнего уровня «текст». MS_Kanji
csShiftJIS
EUC-JP Extended_UNIX_Code_Packed_Format_for_Японский 18 Стандартизован OSF, UNIX International и UNIX Systems Лаборатории Тихого океана.Использует правила ISO 2022 для выбора кодовый набор 0: US-ASCII (один 7-битный набор байтов) кодовый набор 1: JIS X0208-1990 (двойной 8-битный набор байтов) ограничено A0-FF в обоих байтах кодовый набор 2: Катакана половинной ширины (один 7-битный набор байтов) требуя SS2 в качестве префикса символа кодовый набор 3: JIS X0212-1990 (двойной 7-битный набор байтов) ограничено A0-FF в обоих байтах требуя SS3 в качестве префикса символа csEUCPkdFmtЯпонский
EUC-JP
Extended_UNIX_Code_Fixed_Width_for_Japanese 19 Используется в Японии.Каждый символ составляет 2 октета. кодовый набор 0: US-ASCII (один 7-битный набор байтов) 1-й байт = 00 2-й байт = 20-7E кодовый набор 1: JIS X0208-1990 (двойной 7-битный набор байтов) ограничено A0-FF в обоих байтах кодовый набор 2: Катакана половинной ширины (один 7-битный набор байтов) 1-й байт = 00 2-й байт = A0-FF кодовый набор 3: JIS X0212-1990 (двойной 7-битный набор байтов) ограничено A0-FF в первый байт и 21-7E во втором байте csEUCFixWidЯпонский
BS_4730 20 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-4
ISO646-GB
gb
uk
csISO4UnitedKingdom
SEN_850200_C 21 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-11
ISO646-SE2
se2
csISO11ШведскийForNames
IT 22 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-15
ISO646-IT
csISO15 Итальянский
ES 23 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-17
ISO646-ES
csISO17 Испанский
DIN_66003 24 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-21
de
ISO646-DE
csISO21 Немецкий
NS_4551-1 25 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-60
ISO646-NO
no
csISO60ДатскийНорвежский
csISO60Норвежский1
NF_Z_62-010 26 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-69
ISO646-FR
fr
csISO69 Французский
ISO-10646-UTF-1 27 Universal Transfer Format (1), это многобайтовый кодировка, которая является подмножеством ASCII-7. У него нет байта вопросы заказа. csISO10646UTF1
ISO_646.базовый: 1983 28 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen]
csISO646basic1983
ИНВАРИАНТ 29 [RFC1345] [Keld_Simonsen] csINVARIANT
ISO_646.irv: 1983 30 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-2
irv
csISO2IntlRefVersion
NATS-SEFI 31 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-8-1
csNATSSEFI
NATS-SEFI-ADD 32 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-8-2
csNATSSEFIADD
НАЦ-ДАНО 33 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-9-1
csNATSDANO
НАЦ-ДАНО-ДОБАВИТЬ 34 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-9-2
csNATSDANOADD
SEN_850200_B 35 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-10
FI
ISO646-FI
ISO646-SE
se
csISO10 Шведский
КС_С_5601-1987 36 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-149
KS_C_5601-1989
KSC_5601
корейский
csKSC56011987
ISO-2022-KR ISO-2022-KR 37 [RFC1557] (см. Также KS_C_5601-1987) [RFC1557] [Woohyong_Choi] csISO2022KR
EUC-KR EUC-KR 38 [RFC1557] (см. Также KS_C_5861-1992) [RFC1557] [Woohyong_Choi] csEUCKR
ISO-2022-JP ISO-2022-JP 39 [RFC1468] (см. Также [RFC2237]) [RFC1468] [Jun_Murai] csISO2022JP
ISO-2022-JP-2 ISO-2022-JP-2 40 [RFC1554] [RFC1554] [Masataka_Ohta] csISO2022JP2
JIS_C6220-1969-jp 41 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] JIS_C6220-1969
iso-ir-13
катакана
x0201-7
csISO13JISC6220jp
JIS_C6220-1969-ro 42 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-14
jp
ISO646-JP
csISO14JISC6220ro
PT 43 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-16
ISO646-PT
csISO16 Португальский
греческий7-старый 44 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-18
csISO18Greek7Старый
латинско-греческий 45 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-19
csISO19 Латинский греческий
NF_Z_62-010_ (1973) 46 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-25
ISO646-FR1
csISO25 Французский
Latin-greek-1 47 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-27
csISO27LatinGreek1
ISO_5427 48 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-37
csISO5427 Кириллица
JIS_C6226-1978 49 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-42
csISO42JISC62261978
BS_viewdata 50 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-47
csISO47BSViewdata
INIS 51 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-49
csISO49INIS
ИНИС-8 52 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-50
csISO50INIS8
INIS-кириллица 53 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-51
csISO51INIS Кириллица
ISO_5427: 1981 54 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-54
ISO5427 Cyrillic1981
csISO54271981
ISO_5428: 1980 55 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-55
csISO5428 Греческий
ГБ_1988-80 56 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-57
cn
ISO646-CN
csISO57GB1988
ГБ_2312-80 57 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-58
китайский
csISO58GB231280
NS_4551-2 58 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] ISO646-NO2
iso-ir-61
no2
csISO61 Норвежский2
видеотекс-Suppl 59 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-70
csISO70VideotexSupp1
PT2 60 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-84
ISO646-PT2
csISO84 Португальский2
ES2 61 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-85
ISO646-ES2
csISO85 Испанский3
MSZ_7795.3 62 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-86
ISO646-HU
hu
csISO86 Венгерский
JIS_C6226-1983 63 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-87
x0208
JIS_X0208-1983
csISO87JISX0208
греческий7 64 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-88
csISO88 Греческий7
ASMO_449 65 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] ISO_9036
арабский7
iso-ir-89
csISO89ASMO449
iso-ir-90 66 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] csISO90
JIS_C6229-1984-a 67 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-91
jp-ocr-a
csISO91JISC622
JIS_C6229-1984-b 68 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-92
ISO646-JP-OCR-B
jp-ocr-b
csISO92JISC629
JIS_C6229-1984-b-добавить 69 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-93
jp-ocr-b-add
csISO93JIS622
JIS_C6229-1984-ручное 70 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-94
jp-ocr-hand
csISO94JIS622
JIS_C6229-1984-вручную добавить 71 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-95
jp-ocr-hand-add
csISO95JIS622
JIS_C6229-1984-кана 72 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-96
csISO96JISC622
ISO_2033-1983 73 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-98
e13b
csISO2033
ANSI_X3.110-1983 74 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-99
CSA_T500-1983
NAPLPS
csISO99NAPLPS
Т.61-7бит 75 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-102
csISO102T617bit
T.61-8bit 76 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] T.61
iso-ir-103
csISO103T618bit
ECMA-кириллица 77 [реестр ISO] iso-ir-111
KOI8-E
csISO111ECMACyrillic
CSA_Z243.4-1985-1 78 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-121
ISO646-CA
csa7-1
csa71
ca
csISO121 Канадский1
CSA_Z243.4-1985-2 79 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-122
ISO646-CA2
csa7-2
csa72
csISO122 Канадский2
CSA_Z243.4-1985-гр 80 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-123
csISO123CSAZ24341985gr
ISO-8859-6-E ISO_8859-6-E 81 [RFC1556] [RFC1556] [IANA] csISO88596E
ISO-8859-6-E
ISO-8859-6-I ISO_8859-6-I 82 [RFC1556] [RFC1556] [IANA] csISO88596I
ISO-8859-6-I
Т.101-G2 83 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-128
csISO128T101G2
ISO-8859-8-E ISO_8859-8-E 84 [RFC1556] [RFC1556] [Hank_Nussbacher] csISO88598E
ISO-8859-8-E
ISO-8859-8-I ISO_8859-8-I 85 [RFC1556] [RFC1556] [Hank_Nussbacher] csISO88598I
ISO-8859-8-I
CSN_369103 86 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-139
csISO139CSN369103
JUS_I.B1.002 87 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-141
ISO646-YU
js
yu
csISO141JUSIB1002
IEC_P27-1 88 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-143
csISO143IECP271
JUS_I.B1.003-serb 89 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-146
сербский
csISO146 сербский
JUS_I.B1.003-mac 90 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] македонский
iso-ir-147
csISO147 македонский
греческий-ccitt 91 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-150
csISO150
csISO150 Греческий CCITT
NC_NC00-10: 81 92 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] куба
iso-ir-151
ISO646-CU
csISO151Cuba
ISO_6937-2-25 93 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-152
csISO6937Добавить
GOST_19768-74 94 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] СТ_СЕВ_358-88
iso-ir-153
csISO153ГОСТ1976874
ISO_8859-supp 95 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-154
latin1-2-5
csISO8859Supp
ISO_10367-коробка 96 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] iso-ir-155
csISO10367 Коробка
латинский круг 97 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] круг
iso-ir-158
csISO158Lap
JIS_X0212-1990 98 [ISO-IR: Международный регистр последовательностей побегов]
Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония.
[RFC1345] [Keld_Simonsen] x0212
iso-ir-159
csISO159JISX02121990
DS_2089 99 Датский стандарт, DS 2089, февраль 1974 г. [RFC1345] [Keld_Simonsen] DS2089
ISO646-DK
dk
csISO646 Датский
us-dk 100 [RFC1345] [Keld_Simonsen] чешских кроны
dk-us 101 [RFC1345] [Keld_Simonsen] csDKUS
KSC5636 102 [RFC1345] [Keld_Simonsen] ISO646-KR
csKSC5636
UNICODE-1-1-UTF-7 103 [RFC1642] [RFC1642] cs Юникод 11UTF7
ISO-2022-CN 104 [RFC1922] [RFC1922] csISO2022CN
ISO-2022-CN-EXT 105 [RFC1922] [RFC1922] csISO2022CNEXT
UTF-8 106 [RFC3629] [RFC3629] csUTF8
ISO-8859-13 109 ISO См. [Http: // www.iana.org/assignments/charset-reg/ISO-8859-13[Vladas_Tumasonis] csISO885913
ISO-8859-14 110 ISO См. [Http://www.iana.org/assignments/charset-reg/ISO-8859-14] [Keld_Simonsen_2] iso-ir-199
ISO_8859-14: 1998
ISO_8859-14
latin8
iso-celtic
l8
csISO885914
ISO-8859-15 111 ISO См .: [http: // www.iana.org/assignments/charset-reg/ISO-8859-15] ISO_8859-15
Latin-9
csISO885915
ISO-8859-16 112 ISO iso-ir-226
ISO_8859-16: 2001
ISO_8859-16
latin10
l10
csISO885916
ГБК 113 Китайский технический комитет по стандартизации информационных технологий См .: [http: // www.iana.org/assignments/charset-reg/GBK] CP936
MS936
окна-936
csGBK
ГБ18030 114 Китайский технический комитет по стандартизации информационных технологий См .: [http://www.iana.org/assignments/charset-reg/GB18030] csGB18030
OSD_EBCDIC_DF04_15 115 Стандартное кодирование EBCDIC для мэйнфреймов Fujitsu-Siemens См .: [http: // www.iana.org/assignments/charset-reg/OSD-EBCDIC-DF04-15] csOSDEBCDICDF0415
OSD_EBCDIC_DF03_IRV 116 Стандартное кодирование EBCDIC для мэйнфреймов Fujitsu-Siemens См .: [http://www.iana.org/assignments/charset-reg/OSD-EBCDIC-DF03-IRV] csOSDEBCDICDF03IRV
OSD_EBCDIC_DF04_1 117 Стандартное кодирование EBCDIC для мэйнфреймов Fujitsu-Siemens См .: [http: // www.iana.org/assignments/charset-reg/OSD-EBCDIC-DF04-1] csOSDEBCDICDF041
ISO-11548-1 118 См. [Http://www.iana.org/assignments/charset-reg/ISO-11548-1] [Samuel_Thibault] ISO_11548-1
ISO_TR_11548-1
csISO115481
KZ-1048 119 См. [Http: // www.iana.org/assignments/charset-reg/KZ-1048] [Сайран_М_Киккарин] [Алексей_Веремеев] STRK1048-2002
RK1048
csKZ1048
ISO-10646-UCS-2 1000 2-октетная базовая многоязычная плоскость, также известная как Unicode здесь необходимо указать сетевой порядок байтов: стандартный не указывает (это 16-битное целое число) cs, юникод
ISO-10646-UCS-4 1001 полное пространство кода.(тот же комментарий о порядке байтов, это 31-битные числа. csUCS4
ISO-10646-UCS-Basic 1002 ASCII подмножество Unicode. Базовая латынь = сборник 1 См. ISO 10646, Приложение A cs Юникод ASCII
ISO-10646-Unicode-Latin1 1003 ISO Latin-1 подмножество Unicode.Базовая латынь и Latin-1 Дополнение = коллекции 1 и 2. См. ISO 10646, Приложение A. См. [RFC1815]. cs Юникод Латинский 1
ISO-10646
ISO-10646-J-1 1004 ISO 10646 Японский, см. [RFC1815]. csUnicodeЯпонский
ISO-Unicode-IBM-1261 1005 IBM Latin-2, -3, -5, Расширенный набор презентаций, GCSGID: 1261 cs ЮникодIBM1261
ISO-Unicode-IBM-1268 1006 Расширенный набор презентаций IBM Latin-4, GCSGID: 1268 cs ЮникодIBM1268
ISO-Unicode-IBM-1276 1007 IBM Cyrillic Greek Extended Presentation Set, GCSGID: 1276 cs ЮникодIBM1276
ISO-Unicode-IBM-1264 1008 Набор для арабских презентаций IBM, GCSGID: 1264 cs ЮникодIBM1264
ISO-Unicode-IBM-1265 1009 IBM Hebrew Presentation Set, GCSGID: 1265 cs ЮникодIBM1265
UNICODE-1-1 1010 [RFC1641] [RFC1641] cs Юникод 11
SCSU 1011 SCSU См. [Http: // www.iana.org/assignments/charset-reg/SCSU] [Markus_Scherer] csSCSU
UTF-7 1012 [RFC2152] [RFC2152] csUTF7
UTF-16BE 1013 [RFC2781] [RFC2781] csUTF16BE
UTF-16LE 1014 [RFC2781] [RFC2781] csUTF16LE
UTF-16 1015 [RFC2781] [RFC2781] csUTF16
ЦЭСУ-8 1016 [http: // www.unicode.org/unicode/reports/tr26] [Toby_Phipps] csCESU8
csCESU-8
UTF-32 1017 [http://www.unicode.org/unicode/reports/tr19/] [Mark_Davis] csUTF32
UTF-32BE 1018 [http: // www.unicode.org/unicode/reports/tr19/] [Mark_Davis] csUTF32BE
UTF-32LE 1019 [http://www.unicode.org/unicode/reports/tr19/] [Mark_Davis] csUTF32LE
BOCU-1 1020 [http: // www.unicode.org/notes/tn6/] [Markus_Scherer] csBOCU1
csBOCU-1
UTF-7-IMAP 1021 Примечание. Эта кодировка используется для кодирования Unicode в именах почтовых ящиков IMAP; см. раздел 5.1.3 [RFC3501]. Никогда не следует использовать вне этого контекста. Было назначено имя, чтобы обработка кодировки реализации могут ссылаться на него согласованным образом. [Florian_Weimer] csUTF7IMAP
ISO-8859-1-Windows-3.0-Latin-1 2000 Расширенный ISO 8859-1 Latin-1 для Windows 3.0. Идентификатор набора символов PCL: 9U [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] csWindows30Latin1
ISO-8859-1-Окна-3.1-Latin-1 2001 Extended ISO 8859-1 Latin-1 для Windows 3.1. Идентификатор набора символов PCL: 19U [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] csWindows31Latin1
ISO-8859-2-Windows-Latin-2 2002 Расширенный ISO 8859-2. Latin-2 для Windows 3.1. Идентификатор набора символов PCL: 9E [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] csWindows31Latin2
ISO-8859-9-Windows-Latin-5 2003 Расширенный ISO 8859-9. Latin-5 для Windows 3.1 Идентификатор набора символов PCL: 5T [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] csWindows31Latin5
л.с.-Роман8 2004 LaserJet IIP, Номер детали HP 33471-, Hewlet-Packard, июнь 1989 г. [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] [RFC1345] [Keld_Simonsen] roman8
r8
csHPRoman8
Стандартное кодирование Adobe 2005 Идентификатор набора символов PCL: 10J [Adobe Systems Incorporated, Справочник по языку PostScript Руководство, второе издание, издательство Addison-Wesley Publishing Company, Inc., 1990.] cs AdobeStandardEncoding
Вентура-США 2006 Ventura US. ASCII плюс символы, обычно используемые в публикация, например, Pilcrow, авторское право, зарегистрированная, торговая марка, секция, кинжал и двойной кинжал в диапазоне A0 (шестнадцатеричный) в FF (шестнадцатеричный). Идентификатор набора символов PCL: 14J [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] csVenturaUS
Вентура-Интернэшнл 2007 Ventura International. ASCII плюс кодированные символы, похожие к Роману 8. Идентификатор набора символов PCL: 13J [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] csVentura Международный
DEC-MCS 2008 VAX / VMS Руководство пользователя, Номер заказа: AI-Y517A-TE, апрель 1986 г. [RFC1345] [Keld_Simonsen] дек 9 1272 cs DECMCS
IBM850 2009 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp850
850
csPC850 Многоязычный
PC8-датско-норвежский 2012 PC датский норвежский 8-битный компьютер для датского норвежского языка Идентификатор набора символов PCL: 11U [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] csPC8 Датский Норвежский
IBM862 2013 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp862
862
csPC862 Латинский Иврит
PC8-Турецкий 2014 ПК Латинский Турецкий.Идентификатор набора символов PCL: 9T [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] csPC8 Турецкий
Символы IBM 2015 Набор для презентаций, CPGID: 259 [IBM Corporation, «О ТИПЕ: Технический справочник IBM для Core Interchange Digitized Type », номер публикации S544-3708-01] csIBMS Символы
IBM-тайский 2016 Набор для презентаций, CPGID: 838 [IBM Corporation, «О ТИПЕ: Технический справочник IBM для Core Interchange Digitized Type », номер публикации S544-3708-01] csIBM Тайский
HP-Legal 2017 PCL 5 Сравнительное руководство, Hewlett-Packard, Номер детали HP 5961-0510, октябрь 1992 г. Идентификатор набора символов PCL: 1U [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] csHPLegal
HP-Pi-font 2018 PCL 5 Сравнительное руководство, Hewlett-Packard, Номер детали HP 5961-0510, октябрь 1992 г. Идентификатор набора символов PCL: 15U [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] csHPPiFont
HP-Math8 2019 PCL 5 Сравнительное руководство, Hewlett-Packard, Номер детали HP 5961-0510, октябрь 1992 г. Идентификатор набора символов PCL: 8M [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] csHPMath8
Adobe-Symbol-Кодирование 2020 Идентификатор набора символов PCL: 5M [Adobe Systems Incorporated, Справочник по языку PostScript Руководство, второе издание, издательство Addison-Wesley Publishing Company, Inc., 1990.] csHPPSMath
Стол HP-DeskTop 2021 PCL 5 Сравнительное руководство, Hewlett-Packard, Номер детали HP 5961-0510, октябрь 1992 г. Идентификатор набора символов PCL: 7J [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] csHPНастольный компьютер
Вентура-Математика 2022 PCL 5 Сравнительное руководство, Hewlett-Packard, Номер детали HP 5961-0510, октябрь 1992 г. Идентификатор набора символов PCL: 6M [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] csVenturaMath
Издательство Microsoft 2023 PCL 5 Сравнительное руководство, Hewlett-Packard, Номер детали HP 5961-0510, октябрь 1992 г. Идентификатор набора символов PCL: 6J [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] cs
Окна-31J 2024 Windows японская. Дальнейшее расширение Shift_JIS для включения специальных символов NEC (строка 13), NEC выбор расширений IBM (строки с 89 по 92) и IBM разгибания (ряды с 115 по 119). CCS являются JIS X0201: 1997, JIS X0208: 1997 и эти расширения. Эта кодировка может использоваться для типа мультимедиа верхнего уровня «текст», но он имеет ограниченное или специализированное использование (см. [RFC2278]).Идентификатор набора символов PCL: 19K cs Windows 31J
ГБ 2312 ГБ 2312 2025 китайский язык для Китайской Народной Республики (КНР) смешанный один байт, двухбайтовый набор: 20-7E = один байт ASCII A1-FE = двухбайтовый кандзи PRC См. GB 2312-80 Идентификатор набора символов PCL: 18C csGB2312
Большой5 Большой5 2026 Китайский для Тайваня Многобайтовый набор.Идентификатор набора символов PCL: 18T csBig5
Macintosh 2027 Стандарт Unicode версии 1.0, ISBN 0-201-56788-1, октябрь 1991 г. [RFC1345] [Keld_Simonsen]
cs
IBM037 2028 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp037
ebcdic-cp-us
ebcdic-cp-ca
ebcdic-cp-wt
ebcdic-cp-nl
csIBM037
IBM038 2029 IBM 3174 Character Set Ref, GA27-3831-02, март 1990 г. [RFC1345] [Keld_Simonsen] EBCDIC-INT
cp038
csIBM038
IBM273 2030 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] CP273
csIBM273
IBM274 2031 IBM 3174 Character Set Ref, GA27-3831-02, март 1990 г. [RFC1345] [Keld_Simonsen] EBCDIC-BE
CP274
csIBM274
IBM275 2032 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] EBCDIC-BR
cp275
csIBM275
IBM277 2033 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] EBCDIC-CP-DK
EBCDIC-CP-NO
csIBM277
IBM278 2034 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] CP278
ebcdic-cp-fi
ebcdic-cp-se
csIBM278
IBM280 2035 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] CP280
ebcdic-cp-it
csIBM280
IBM281 2036 IBM 3174 Character Set Ref, GA27-3831-02, март 1990 г. [RFC1345] [Keld_Simonsen] EBCDIC-JP-E
cp281
csIBM281
IBM284 2037 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] CP284
ebcdic-cp-es
csIBM284
IBM285 2038 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] CP285
ebcdic-cp-gb
csIBM285
IBM290 2039 IBM 3174 Набор символов Ref, GA27-3831-02, март 1990 г. [RFC1345] [Keld_Simonsen] cp290
EBCDIC-JP-kana
csIBM290
IBM297 2040 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp297
ebcdic-cp-fr
csIBM297
IBM420 2041 IBM NLS RM Vol2 SE09-8002-01, март 1990 г., IBM NLS RM стр. 11-11 [RFC1345] [Keld_Simonsen] cp420
ebcdic-cp-ar1
csIBM420
IBM423 2042 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp423
ebcdic-cp-gr
csIBM423
IBM424 2043 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp424
ebcdic-cp-he
csIBM424
IBM437 2011 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp437
437
csPC8CodePage437
IBM500 2044 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] CP500
ebcdic-cp-be
ebcdic-cp-ch
csIBM500
IBM851 2045 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp851
851
csIBM851
IBM852 2010 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp852
852
csPCp852
IBM855 2046 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp855
855
csIBM855
IBM857 2047 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp857
857
csIBM857
IBM860 2048 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp860
860
csIBM860
IBM861 2049 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp861
861
cp-is
csIBM861
IBM863 2050 Раскладки клавиатуры и кодовые страницы IBM, номер детали 07G4586 июнь 1991 [RFC1345] [Keld_Simonsen] cp863
863
csIBM863
IBM864 2051 Раскладки клавиатуры и кодовые страницы IBM, номер по каталогу 07G4586 июнь 1991 [RFC1345] [Keld_Simonsen] cp864
csIBM864
IBM865 2052 IBM DOS 3.3 Ссылка (сокращенная), 94X9575 (февраль 1987 г.) [RFC1345] [Keld_Simonsen] cp865
865
csIBM865
IBM868 2053 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] CP868
cp-ar
csIBM868
IBM869 2054 Раскладки клавиатуры и кодовые страницы IBM, номер по каталогу 07G4586 июнь 1991 [RFC1345] [Keld_Simonsen] cp869
869
cp-gr
csIBM869
IBM870 2055 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] CP870
ebcdic-cp-roece
ebcdic-cp-yu
csIBM870
IBM871 2056 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] CP871
ebcdic-cp-is
csIBM871
IBM880 2057 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp880
EBCDIC-кириллица
csIBM880
IBM891 2058 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp891
csIBM891
IBM903 2059 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp903
csIBM903
IBM904 2060 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] cp904
904
csIBBM904
IBM905 2061 IBM 3174 Набор символов Ref, GA27-3831-02, март 1990 г. [RFC1345] [Keld_Simonsen] CP905
ebcdic-cp-tr
csIBM905
IBM918 2062 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] CP918
ebcdic-cp-ar2
csIBM918
IBM1026 2063 IBM NLS RM Vol2 SE09-8002-01, март 1990 г. [RFC1345] [Keld_Simonsen] CP1026
csIBM1026
EBCDIC-AT-DE 2064 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csIBMEBCDICATDE
EBCDIC-AT-DE-A 2065 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csEBCDICATDEA
EBCDIC-CA-FR 2066 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csEBCDICCAFR
EBCDIC-DK-NO 2067 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csEBCDICDKNO
EBCDIC-DK-NO-A 2068 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csEBCDICDKNOA
EBCDIC-FI-SE 2069 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csEBCDICFISE
EBCDIC-FI-SE-A 2070 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csEBCDICFISEA
EBCDIC-FR 2071 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csEBCDICFR
EBCDIC-IT 2072 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csEBCDICIT
EBCDIC-PT 2073 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csEBCDICPT
EBCDIC-ES 2074 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csEBCDICES
EBCDIC-ES-A 2075 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csEBCDICESA
EBCDIC-ES-S 2076 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csEBCDICESS
EBCDIC-UK 2077 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csEBCDICUK
EBCDIC-US 2078 IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. [RFC1345] [Keld_Simonsen] csEBCDICUS
НЕИЗВЕСТНО-8BIT 2079 [RFC1428] csНеизвестно 8BiT
MNEMONIC 2080 [RFC1345], также известный как «мнемонический + ascii + 38» [RFC1345] [Keld_Simonsen] cs Мнемоника
MNEM 2081 [RFC1345], также известный как «мнемонический + ascii + 8200» [RFC1345] [Keld_Simonsen] csMnem
VISCII 2082 [RFC1456] [RFC1456] csVISCII
VIQR 2083 [RFC1456] [RFC1456] csVIQR
КОИ8-Р КОИ8-Р 2084 [RFC1489], на основе ГОСТ-19768-74, ISO-6937/8, INIS-Cyrillic, ISO-5427. [RFC1489] csKOI8R
Гц-ГБ-2312 2085 [RFC1842], [RFC1843] [RFC1843] [RFC1842]
IBM866 2086 IBM NLDG, том 2 (SE09-8002-03), август 1994 г. [Rick_Pond] cp866
866
csIBM866
IBM775 2087 HP PCL 5 Сравнительное руководство (P / N 5021-0329), стр. B-13, 1996 [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] cp775
csPC775 Балтик
КОИ8-У 2088 [RFC2319] [RFC2319] csKOI8U
IBM00858 2089 IBM См. [Http://www.iana.org/assignments/charset-reg/IBM00858] [Tamer_Mahdi] CCSID00858
CP00858
PC-Multilingual-850 + евро
csIBM00858
IBM00924 2090 IBM См. [Http: // www.iana.org/assignments/charset-reg/IBM00924] [Tamer_Mahdi] CCSID00924
CP00924
ebcdic-Latin9 — евро
csIBM00924
IBM01140 2091 IBM См. [Http://www.iana.org/assignments/charset-reg/IBM01140] [Tamer_Mahdi] CCSID01140
CP01140
ebcdic-us-37 + евро
csIBM01140
IBM01141 2092 IBM См. [Http: // www.iana.org/assignments/charset-reg/IBM01141] [Tamer_Mahdi] CCSID01141
CP01141
ebcdic-de-273 + евро
csIBM01141
IBM01142 2093 IBM См. [Http://www.iana.org/assignments/charset-reg/IBM01142] [Tamer_Mahdi] CCSID01142
CP01142
ebcdic-dk-277 + евро
ebcdic-no-277 + евро
csIBM01142
IBM01143 2094 IBM См. [Http: // www.iana.org/assignments/charset-reg/IBM01143] [Tamer_Mahdi] CCSID01143
CP01143
ebcdic-fi-278 + евро
ebcdic-se-278 + евро
csIBM01143
IBM01144 2095 IBM См. [Http://www.iana.org/assignments/charset-reg/IBM01144] [Tamer_Mahdi] CCSID01144
CP01144
ebcdic-it-280 + евро
csIBM01144
IBM01145 2096 IBM См. [Http: // www.iana.org/assignments/charset-reg/IBM01145] [Tamer_Mahdi] CCSID01145
CP01145
ebcdic-es-284 + евро
csIBM01145
IBM01146 2097 IBM См. [Http://www.iana.org/assignments/charset-reg/IBM01146] [Tamer_Mahdi] CCSID01146
CP01146
ebcdic-gb-285 + евро
csIBM01146
IBM01147 2098 IBM См. [Http: // www.iana.org/assignments/charset-reg/IBM01147] [Tamer_Mahdi] CCSID01147
CP01147
ebcdic-fr-297 + евро
csIBM01147
IBM01148 2099 IBM См. [Http://www.iana.org/assignments/charset-reg/IBM01148] [Tamer_Mahdi] CCSID01148
CP01148
ebcdic-international-500 + евро
csIBM01148
IBM01149 2100 IBM См. [Http: // www.iana.org/assignments/charset-reg/IBM01149] [Tamer_Mahdi] CCSID01149
CP01149
ebcdic-is-871 + евро
csIBM01149
Big5-HKSCS 2101 См. [Http://www.iana.org/assignments/charset-reg/Big5-HKSCS] [Nicky_Yick] csBig5HKSCS
IBM1047 2102 IBM1047 (EBCDIC Latin 1 / Открытые системы) [http: // www-1.ibm.com/servers/eserver/iseries/software/globalization/pdf/cp01047z.pdf] [Reuel_Robrigado] IBM-1047
csIBM1047
PTCP154 2103 См. [Http://www.iana.org/assignments/charset-reg/PTCP154] [Александр_Усков] csPTCP154
PT154
CP154
Кириллица-азиатская
Амига-1251 2104 См. [Http: // www.amiga.ultranet.ru/Amiga-1251.html] Ami1251
Amiga1251
Ami-1251
csAmiga1251 (Псевдонимы указаны по историческим причинам и не должны использоваться) [Малышев]
KOI7-переключенный 2105 См. [Http://www.iana.org/assignments/charset-reg/KOI7-switched] csKOI7switched
BRF 2106 См. [Http: // www.iana.org/assignments/charset-reg/BRF] [Samuel_Thibault] CSBRF
TSCII 2107 См. [Http://www.iana.org/assignments/charset-reg/TSCII] [Kuppuswamy_Kalyanasu] csTSCII
CP51932 2108 См. [Http: // www.iana.org/assignments/charset-reg/CP51932] [Yui_Naruse] csCP51932
окна-874 2109 См. [Http://www.iana.org/assignments/charset-reg/windows-874] [Shawn_Steele] cswindows874
окна-1250 2250 Microsoft [http: // www.iana.org/assignments/charset-reg/windows-1250] [Катя_Лажинцева] cswindows1250
окна-1251 2251 Microsoft [http://www.iana.org/assignments/charset-reg/windows-1251] [Катя_Лажинцева] cswindows1251
окна-1252 2252 Microsoft [http: // www.iana.org/assignments/charset-reg/windows-1252] [Chris_Wendt] cswindows1252
окна-1253 2253 Microsoft [http://www.iana.org/assignments/charset-reg/windows-1253] [Катя_Лажинцева] cswindows1253
окна-1254 2254 Microsoft [http: // www.iana.org/assignments/charset-reg/windows-1254] [Катя_Лажинцева] cswindows1254
окна-1255 2255 Microsoft [http://www.iana.org/assignments/charset-reg/windows-1255] [Катя_Лажинцева] cswindows1255
окна-1256 2256 Microsoft [http: // www.iana.org/assignments/charset-reg/windows-1256] [Катя_Лажинцева] cswindows1256
окна-1257 2257 Microsoft [http://www.iana.org/assignments/charset-reg/windows-1257] [Катя_Лажинцева] cswindows1257
окна-1258 2258 Microsoft [http: // www.iana.org/assignments/charset-reg/windows-1258] [Катя_Лажинцева] cswindows1258
ТИС-620 2259 Тайский институт промышленных стандартов (TISI) [Trin_Tantsetthi] csTIS620
ISO-8859-11
CP50220 2260 См. [Http: // www.iana.org/assignments/charset-reg/CP50220] [Yui_Naruse] csCP50220

Кодировка 101 — Часть 2: Windows-1252 и UTF-8

Продолжение с Кодировка 101 часть 1

Во второй части будут представлены две наиболее распространенные кодировки, используемые сегодня, и рассмотрены некоторые из их различий.

Различия между разными кодировками

Если бы в свое время вся ИТ-индустрия согласилась на единое кодирование, сейчас с этим было бы гораздо легче справиться.Тем не менее, это не так. На протяжении многих лет различные компании ставили перед собой задачу решить одну и ту же проблему: как представить текст в виде двоичных данных для хранения или передачи. В результате сегодня существует огромное количество систем кодирования. К сожалению, многие из них почти идентичны, что заставляет усомниться в необходимости их существования еще больше.

Многие современные кодировки основаны на кодировке ASCII, но расширяют ее, чтобы включить больше символов. Это означает, что текст, который содержит только символы, присутствующие в стандарте ASCII, часто также может быть декодирован как ASCII, даже если технически он закодирован с использованием другого стандарта.Это связано с тем, что многие более крупные кодировки по-прежнему используют те же коды, что и ASCII для первых 128 символов, но помимо этих символов эти схемы кодирования отличаются в большей или меньшей степени.

Давайте сравним две наиболее распространенные кодировки, используемые для западных языков, Windows-1252 и UTF-8.

Окна-1252

Это кодировка по умолчанию, используемая системами Windows в большинстве западных стран. Это означает, что текстовые данные, созданные программным обеспечением, работающим в таких системах по умолчанию, будут использовать кодировку Windows-1252, если явно не установлено использование другой кодировки.Некоторое программное обеспечение позволяет пользователю выбирать, какую кодировку использовать, некоторые настроены на использование определенной кодировки, а не по умолчанию, а некоторые оставляют это на усмотрение самой системы.

Windows-1252 — это однобайтовая кодировка, что означает, что каждый символ кодируется как однобайтный, так же, как и в ASCII. Однако, поскольку Windows-1252 использует полные 8 бит каждого байта для своих кодовых точек (в отличие от 7-битных кодов ASCII), она содержит 256 кодовых точек по сравнению с 128 ASCII. Первая половина кодовых точек идентична те, которые определены в ASCII, а вторая половина кодирует дополнительные символы, которых нет в наборе символов ASCII.

UTF-8

UTF-8 — это кодировка из стандарта Unicode. UTF означает формат преобразования Unicode, а цифра 8 в конце означает, что это 8-битная кодировка переменной. Это означает, что каждый символ использует не менее 8 бит для своей кодовой точки, но некоторые могут использовать больше. Как и в Windows-1252, первые 128 кодовых точек идентичны ASCII, но выше эти две кодировки значительно отличаются. В то время как Windows-1252 содержит всего 256 кодовых точек, UTF-8 имеет кодовые точки для всего набора символов Unicode.Это делается путем определения некоторых байтовых значений выше 127 в качестве префиксов для дальнейших байтовых значений. Например, символ авторского права (©) кодируется как C2 A9, а знак фунта (£) кодируется как C2 A3. Поскольку байт C2 разработан как байт префикса, это открывает дополнительные 256 2-байтовых кодовых точек с C2 в качестве первого байта.

Этот дизайн означает, что большинство общих символов, используемых в западных языках, занимают только один байт пространства, в то время как многобайтовые кодировки используются реже.В результате UTF-8 может кодировать любой символ, сохраняя при этом относительно небольшой размер данных. Это полезно как для постоянного хранения (файлы небольшого размера), так и для передачи (например, открытия веб-страницы). Из-за этого UTF-8 в настоящее время является наиболее доминирующей кодировкой, используемой во всемирной паутине, и по состоянию на сентябрь 2019 года на ее долю приходилось 94% всех веб-страниц.

Сравнение кодировок

Давайте посмотрим на конкретном примере того, как эти две кодировки отличаются друг от друга. Мы будем использовать слово «Naïveté», которое содержит два символа, отличных от ASCII (у него есть альтернативные варианты написания без них, но пример — это признанное допустимое написание слова на английском языке).

Как мы видим, символы ï и é существуют в обеих кодировках, но кодируются двумя разными способами. В Windows-1252 все символы кодируются с использованием одного байта, поэтому кодировка содержит всего 256 символов. Однако в UTF-8 эти два символа кодируются с использованием 2 байтов каждый. В результате слово занимает на два байта больше при использовании кодировки UTF-8, чем при использовании кодировки Windows-1252.

Итак, разные кодировки обрабатывают одни символы по-разному.В следующей и третьей частях этой серии блогов мы рассмотрим, как это может вызвать у нас проблемы. Найдите здесь «Кодировку 101 — часть 3».

Таблица символов ASCII и ANSI

C Дек Шестнадцатеричный Октябрь Двоичный Сущность Имя
160 A0 240 10100000 & nbs Беспрерывное пространство
¡ 161 A1 241 10100001 & iexcl; Перевернутый восклицательный знак
¢ 162 A2 242 10100010 & cent; Знак центов
£ 163 A3 243 10100011 & фунт; Знак фунта
¤ 164 A4 244 10100100 & curren; Знак валюты
¥ 165 A5 245 10100101 & йен; Знак йены
¦ 166 A6 246 10100110 & brvbar; Сломанный стержень
§ 167 A7 247 10100111 & sect; Знак раздела
¨ 168 A8 250 10101000 & DoubleDot; Диэрезис
© 169 A9 251 10101001 и копия; Знак авторских прав
ª 170 AA 252 10101010 & ordf; Женский порядковый указатель
« 171 AB 253 10101011 & laquo; Двойные угловые кавычки, указывающие влево
¬ 172 AC 254 10101100 & not; Без знака
173 AD 255 10101101 & shy; Мягкий перенос
® 174 AE 256 10101110 & reg; Зарегистрированный знак
¯ 175 AF 257 10101111 & macr; Макрон
° 176 B0 260 10110000 & deg; Знак градуса
± 177 B1 261 10110001 & plusmn; Знак плюс-минус
² 178 B2 262 10110010 & sup2; Верхний индекс два
³ 179 B3 263 10110011 & sup3; Три надстрочных индекса
´ 180 B4 264 10110100 & DiacriticalAcute; Острый акцент
µ 181 B5 265 10110101 & микро; Микро знак
182 B6 266 10110110 и пара; Знак Pilcrow
· 183 B7 267 10110111 & CenterDot; Средняя точка
¸ 184 B8 270 10111000 & Cedilla; Cedilla
¹ 185 B9 271 10111001 & sup1; Верхний индекс один
º 186 BA 272 10111010 & ordm; Мужской порядковый указатель
» 187 BB 273 10111011 & raquo; Двойные угловые кавычки, указывающие вправо
¼ 188 BC 274 10111100 & frac14; Вульгарная фракция одна четверть
½ 189 BD 275 10111101 & половина; Вульгарная фракция, половина
¾ 190 BE 276 10111110 & frac34; Вульгарная фракция три четверти
¿ 191 BF 277 10111111 & iquest; Перевернутый вопросительный знак
À 192 C0 300 11000000 & Agrave; Латинская заглавная буква A с могилой
Á 193 C1 301 11000001 & Aacute; Заглавная латинская буква A с острым ударением
 194 C2 302 11000010 & Acirc; Заглавная латинская буква A с циркумфлексом
à 195 C3 303 11000011 & Atilde; Заглавная латинская буква A с тильдой
Ä 196 C4 304 11000100 & Auml; Заглавная латинская буква A с тремой
Å 197 C5 305 11000101 & Aring; Заглавная латинская буква A с кольцом сверху
Æ 198 C6 306 11000110 & AElig; Заглавная латинская буква AE
Ç 199 C7 307 11000111 & Ccedil; Заглавная латинская буква C с седилем
È 200 C8 310 11001000 & Egrave; Латинская заглавная буква E с могилой
É 201 C9 311 11001001 & Eacute; Заглавная латинская буква E с острым ударением
Ê 202 CA 312 11001010 & Ecirc; Заглавная латинская буква E с циркумфлексом
Ë 203 CB 313 11001011 & Euml; Заглавная латинская буква E с тремой
Ì 204 CC 314 11001100 & Igrave; Латинская заглавная буква I с могилой
Í 205 CD 315 11001101 & Iacute; Заглавная латинская буква I с острым ударением
Î 206 CE 316 11001110 & Icirc; Заглавная латинская буква I с циркумфлексом
Ï 207 CF 317 11001111 & Iuml; Заглавная латинская буква I с тремой
ì 208 D0 320 11010000 & ETH; Заглавная латинская буква Eth
Ñ 209 D1 321 11010001 & Ntilde; Заглавная латинская буква N с тильдой
Ò 210 D2 322 11010010 & Огрейв; Латинская заглавная буква O с могилой
Ó 211 D3 323 11010011 & Oacute; Заглавная латинская буква O с острым ударением
Ô 212 D4 324 11010100 & Ocirc; Заглавная латинская буква O с циркумфлексом
Õ 213 D5 325 11010101 & Otilde; Заглавная латинская буква O с тильдой
Ö 214 D6 326 11010110 & Ouml; Заглавная латинская буква O с тремой
× 215 D7 327 11010111 & раз; Знак умножения
Ø 216 D8 330 11011000 & Oslash; Заглавная латинская буква O со штрихом
Ù 217 D9 331 11011001 & Ugrave; Латинская заглавная буква U с могилой
Ú 218 DA 332 11011010 & Uacute; Латинская заглавная буква U с острым ударением
Û 219 DB 333 11011011 & Ucirc; Заглавная латинская буква U с циркумфлексом
Ü 220 DC 334 11011100 & Uuml; Заглавная латинская буква U с тремой
Ý 221 DD 335 11011101 & Yacute; Заглавная латинская буква Y с острым ударением
Þ 222 DE 336 11011110 & THORN; Заглавная латинская буква Thorn
ß 223 DF 337 11011111 & szlig; Строчная латинская буква с острым концом s
à 224 E0 340 11100000 & agrave; Строчная латинская буква а с тупиком
á 225 E1 341 11100001 & aacute; Строчная латинская буква а с острым ударением
â 226 E2 342 11100010 & acirc; Строчная латинская буква a с циркумфлексом
ã 227 E3 343 11100011 & atilde; Строчная латинская буква a с тильдой
ä 228 E4 344 11100100 & auml; Строчная латинская буква а с тремой
å 229 E5 345 11100101 & aring; Строчная латинская буква a с кольцом сверху
æ 230 E6 346 11100110 & aelig; Строчная латинская буква ae
ç 231 E7 347 11100111 & ccedil; Строчная латинская буква c с седилем
è 232 E8 350 11101000 & egrave; Строчная латинская буква е с тупым ударением
é 233 E9 351 11101001 & eacute; Строчная латинская буква e с острым ударением
ê 234 EA 352 11101010 & ecirc; Строчная латинская буква e с циркумфлексом
ë 235 EB 353 11101011 & euml; Строчная латинская буква e с тремой
ì 236 EC 354 11101100 & igrave; Строчная латинская буква i с могилой
í 237 ED 355 11101101 & iacute; Строчная латинская буква i с острым ударением
î 238 EE 356 11101110 & icirc; Строчная латинская буква i с циркумфлексом
ï 239 EF 357 11101111 & iuml; Строчная латинская буква i с тремой
ð 240 F0 360 11110000 & eth; Строчная латинская буква eth
ñ 241 F1 361 11110001 & ntilde; Строчная латинская буква n с тильдой
ò 242 F2 362 11110010 & ograve; Строчная латинская буква o с могилой
ó 243 F3 363 11110011 & oacute; Строчная латинская буква o с острым ударением
ô 244 F4 364 11110100 & ocirc; Строчная латинская буква o с циркумфлексом
х 245 F5 365 11110101 & otilde; Строчная латинская буква o с тильдой
ö 246 F6 366 11110110 & ouml; Строчная латинская буква o с тремой
÷ 247 F7 367 11110111 & div; Знак деления
ø 248 F8 370 11111000 & oslash; Строчная латинская буква o со штрихом
ù 249 F9 371 11111001 & ugrave; Строчная латинская буква u с могилой
ú 250 FA 372 11111010 & uacute; Строчная латинская буква u с острым ударением
û 251 FB 373 11111011 & ucirc; Строчная латинская буква u с циркумфлексом
ü 252 FC 374 11111100 & uuml; Строчная латинская буква u с тремой
ý 253 FD 375 11111101 & yacute; Строчная латинская буква y с острым ударением
þ 254 FE 376 11111110 & thorn; Строчная латинская буква шип
ÿ 255 FF 377 11111111 & yuml; Строчная латинская буква y с тремой
.
Оставить комментарий

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *