Таблица Windows-1251
Windows-1251 (cp1251) — это стандартная 8-битная кодировка, разработанная компанией Microsoft. Она содержит практически все символы, которые Вы можете встретить на стандартной русской клавиатуре. Также 1251 имеет символы для таких языков, как белорусский, украинский, болгарский и сербский.
DEC | HEX | СИМВ | DEC | HEX | СИМВ | DEC | HEX | СИМВ |
000 | 00 | NOP | 086 | 56 | V | 171 | AB | « |
001 | 01 | SOH | 087 | 57 | W | 172 | AC | ¬ |
002 | 02 | STX | 088 | 58 | X | 173 | AD | |
003 | 03 | ETX | 089 | 59 | Y | 174 | AE | ® |
004 | 04 | EOT | 090 | 5A | Z | 175 | AF | Ї |
005 | 05 | ENQ | 091 | 5B | [ | 176 | B0 | ° |
006 | 06 | ACK | 092 | \ | 177 | B1 | ± | |
007 | 07 | BEL | 093 | 5D | ] | 178 | B2 | І |
008 | 08 | BS | 094 | 5E | ^ | 179 | B3 | і |
009 | 09 | Табуляция | 095 | 5F | _ | 180 | B4 | ґ |
010 | 0A | LF | 096 | 60 | ` | 181 | B5 | µ |
011 | 0B | VT | 097 | 61 | a | 182 | B6 | ¶ |
012 | 0C | FF | 098 | 62 | b | 183 | B7 | · |
013 | 0D | CR | 099 | 63 | c | 184 | B8 | Ё |
014 | 0E | SO | 100 | 64 | d | 185 | B9 | № |
015 | 0F | SI | 101 | 65 | e | 186 | BA | Є |
016 | 10 | DLE | 102 | 66 | f | 187 | BB | » |
017 | 11 | DC1 | 103 | 67 | g | 188 | BC | ј |
018 | 12 | DC2 | 104 | 68 | h | 189 | BD | Ѕ |
019 | 13 | DC3 | 105 | 69 | i | 190 | BE | Ѕ |
020 | 14 | DC4 | 106 | 6A | j | 191 | BF | Ї |
021 | 15 | NAK | 107 | 6B | k | 192 | C0 | А |
022 | 16 | SYN | 108 | 6C | l | 193 | C1 | Б |
023 | 17 | ETB | 109 | 6D | m | 194 | C2 | В |
024 | 18 | CAN | 110 | 6E | n | 195 | C3 | Г |
025 | 19 | EM | 111 | 6F | o | 196 | C4 | Д |
026 | 1A | SUB | 112 | 70 | p | 197 | C5 | Е |
027 | 1B | ESC | 113 | 71 | q | 198 | C6 | Ж |
028 | 1C | FS | 114 | 72 | r | 199 | C7 | З |
029 | 1D | GS | 115 | 73 | s | 200 | C8 | И |
030 | 1E | RS | 116 | 74 | t | 201 | C9 | Й |
031 | 1F | US | 117 | 75 | u | 202 | CA | К |
032 | 20 | Пробел | 118 | 76 | v | 203 | CB | Л |
033 | 21 | ! | 119 | 77 | w | 204 | CC | М |
034 | 22 | « | 120 | 78 | x | 205 | CD | Н |
035 | 23 | # | 121 | 79 | y | 206 | CE | О |
036 | 24 | $ | 122 | 7A | z | 207 | CF | П |
037 | 25 | % | 123 | 7B | { | 208 | D0 | Р |
038 | 26 | & | 124 | 7C | | | 209 | D1 | С |
039 | 27 | ‘ | 125 | 7D | } | 210 | D2 | Т |
040 | 28 | ( | 126 | 7E | ~ | 211 | D3 | У |
041 | 29 | ) | 127 | | 212 | D4 | Ф | |
042 | 2A | * | 128 | 80 | Ђ | 213 | D5 | Х |
043 | 2B | + | 129 | 81 | Ѓ | 214 | D6 | Ц |
044 | 2C | , | 130 | 82 | ‚ | 215 | D7 | Ч |
045 | 2D | — | 131 | 83 | ѓ | 216 | D8 | Ш |
046 | 2E | . | 132 | 84 | „ | 217 | D9 | Щ |
047 | 2F | / | 133 | 85 | … | 218 | DA | Ъ |
048 | 30 | 0 | 134 | 86 | † | 219 | DB | Ы |
049 | 31 | 1 | 135 | 87 | ‡ | 220 | DC | Ь |
050 | 32 | 2 | 136 | 88 | € | 221 | DD | Э |
051 | 33 | 3 | 137 | 89 | ‰ | 222 | DE | Ю |
052 | 34 | 4 | 138 | 8A | Љ | 223 | DF | Я |
053 | 35 | 5 | 139 | 8B | ‹ | 224 | E0 | а |
054 | 36 | 6 | 140 | 8C | Њ | 225 | E1 | б |
055 | 37 | 7 | 141 | 8D | Ќ | 226 | E2 | в |
056 | 38 | 8 | 142 | 8E | Ћ | 227 | E3 | г |
057 | 39 | 9 | 143 | 8F | Џ | 228 | E4 | д |
058 | 3A | : | 144 | 90 | Ђ | 229 | E5 | е |
059 | 3B | ; | 145 | 91 | ‘ | 230 | E6 | ж |
060 | 3C | < | 146 | 92 | ’ | 231 | E7 | з |
061 | 3D | = | 147 | 93 | “ | 232 | E8 | и |
062 | 3E | > | 148 | 94 | ” | 233 | E9 | й |
063 | 3F | ? | 149 | 95 | • | 234 | EA | к |
064 | 40 | @ | 150 | 96 | – | 235 | EB | л |
065 | 41 | A | 151 | 97 | — | 236 | EC | м |
066 | 42 | B | 152 | 98 | 237 | ED | н | |
067 | 43 | C | 153 | 99 | ™ | 238 | EE | о |
068 | 44 | D | 154 | 9A | љ | 239 | EF | п |
069 | 45 | E | 155 | 9B | › | 240 | F0 | р |
070 | 46 | F | 156 | 9C | њ | 241 | F1 | с |
071 | 47 | G | 157 | 9D | ќ | 242 | F2 | т |
072 | 48 | H | 158 | 9E | ћ | 243 | F3 | у |
073 | 49 | I | 159 | 9F | џ | 244 | F4 | ф |
074 | 4A | J | 160 | A0 | 245 | F5 | х | |
075 | 4B | K | 161 | A1 | Ў | 246 | F6 | ц |
076 | 4C | L | 162 | A2 | ў | 247 | F7 | ч |
077 | 4D | M | 163 | A3 | Ј | 248 | F8 | ш |
078 | 4E | N | 164 | A4 | ¤ | 249 | F9 | щ |
079 | 4F | O | 165 | A5 | Ґ | 250 | FA | ъ |
080 | 50 | P | 166 | A6 | ¦ | 251 | FB | ы |
081 | 51 | Q | 167 | A7 | § | 252 | FC | ь |
082 | 52 | R | 168 | A8 | Ё | 253 | FD | э |
083 | 53 | S | 169 | A9 | © | 254 | FE | ю |
084 | 54 | T | 170 | AA | Є | 255 | FF | я |
085 | 55 | U |
Похожие записи:
Таблица ASCII (кодировка Windows-1251)
Таблица ASCII (кодировка Windows-1251)(0) | (1) | (2) | (3) | (4) | (5) | (6) | (7) | (8) | (9) | (10) | (11) | (12) | (13) | (14) | (15) | (16) |
(17) | (18) | (19) | (20) | (21) | (22) | (23) | (24) | (25) | (26) | (27) | (28) | (29) | (30) | (31) | (32) | !(33) |
«(34) | #(35) | $(36) | %(37) | &(38) | ‘(39) | ((40) | )(41) | *(42) | +(43) | ,(44) | —(45) | .(46) | /(47) | 0(48) | 1(49) | 2(50) |
3(51) | 4(52) | 5(53) | 6(54) | 7(55) | 8(56) | 9(57) | :(58) | ;(59) | (60) | =(61) | >(62) | ?(63) | @(64) | A(65) | B(66) | C(67) |
D(68) | E(69) | F(70) | G(71) | H(72) | I(73) | J(74) | K(75) | L(76) | M(77) | N(78) | O(79) | P(80) | Q(81) | R(82) | S(83) | T(84) |
U(85) | V(86) | W(87) | X(88) | Y(89) | Z(90) | [(91) | \ (92) | ](93) | ^(94) | _(95) | `(96) | a(97) | b(98) | c(99) | d(100) | e(101) |
f(102) | g(103) | h(104) | i(105) | j(106) | k(107) | l(108) | m(109) | n(110) | o(111) | p(112) | q(113) | r(114) | s(115) | t(116) | u(117) | v(118) |
w(119) | x(120) | y(121) | z(122) | {(123) | |(124) | }(125) | ~(126) | (127) | Ђ(128) | Ѓ(129) | ‚(130) | ѓ(131) | „(132) | …(133) | †(134) | ‡(135) |
€(136) | ‰(137) | Љ(138) | ‹(139) | Њ(140) | Ќ(141) | Ћ(142) | Џ(143) | ђ(144) | ‘(145) | ’(146) | “(147) | ”(148) | •(149) | –(150) | —(151) | (152) |
™(153) | љ(154) | ›(155) | њ(156) | ќ(157) | ћ(158) | џ(159) | (160) | Ў(161) | ў(162) | Ј(163) | ¤(164) | Ґ(165) | ¦(166) | §(167) | Ё(168) | ©(169) |
Є(170) | «(171) | ¬(172) | (173) | ®(174) | Ї(175) | °(176) | ±(177) | І(178) | і(179) | ґ(180) | µ(181) | ¶(182) | ·(183) | ё(184) | №(185) | є(186) |
»(187) | ј(188) | Ѕ(189) | ѕ(190) | ї(191) | А(192) | Б(193) | В(194) | Г(195) | Д(196) | Е(197) | Ж(198) | З(199) | И(200) | Й(201) | К(202) | Л(203) |
М(204) | Н(205) | О(206) | П(207) | Р(208) | С(209) | Т(210) | У(211) | Ф(212) | Х(213) | Ц(214) | Ч(215) | Ш(216) | Щ(217) | Ъ(218) | Ы(219) | Ь(220) |
Э(221) | Ю(222) | Я(223) | а(224) | б(225) | в(226) | г(227) | д(228) | е(229) | ж(230) | з(231) | и(232) | й(233) | к(234) | л(235) | м(236) | н(237) |
о(238) | п(239) | р(240) | с(241) | т(242) | у(243) | ф(244) | х(245) | ц(246) | ч(247) | ш(248) | щ(249) | ъ(250) | ы(251) | ь(252) | э(253) | ю(254) |
я(255) | (256) | (257) | (258) | (259) | (260) | (261) | (262) | (263) | (264) | (265) | (266) | (267) | (268) | (269) | (270) | (271) |
— версия для печати
- Определение
- ASCII (англ. American Standard Code for Information Interchange) — американская стандартная таблица для кодирования печатных символов и некоторых специальных кодов.
Если у вас есть мысли по поводу данной страницы или предложение по созданию математической (см. раздел «Математика») вспомогательной памятки, мы обязательно рассмотрим ваше предложение. Просто воспользуйтесь обратной связью. |
© Школяр. Математика (при поддержке «Ветвистого древа») 2009—2016
Таблицы кодировок ASCII, CP1251 (windows1251), ISO-8859-5 — Микроконтроллеры для всех
Таблица ASCII
Таблица ASCII (American standard code for information interchange) является мировым стандартом для кодирования букв английского алфавита, популярных спец символов (! $ # % & и т.д.) и некоторых непечатных символов (например, возврат каретки 0x0D и перенос строки 0х0А).
Таблица создавалась те времена, когда возникла необходимость связать символы и числа. А такое соответствие необходимо было для того что бы с помощью чисел можно было передать текстовое сообщение между разными устройствами с цифровой связью.
Таблица CP1251 (windows-1251)
Эта кодировочная таблица может называться или CP1251 или Windows-1251 Это стандарт кодирования кириллических символов в операционных системах windows с русскоязычным интерфейсом.
Первая часть этой таблицы (до байта 0x7F) повторяет таблицу ASCII, а вторая часть (от 0x80 до 0xFF) кодирует кириллические символы в алфавитном порядке.
CP1251 (windows-1251)Таблица IS0-8859-5
Эта кодировка применяется в дисплеях Nextion для кодирования кириллических символов.
Стоит обратить внимание, что в данной таблице кириллические символы расположены в алфавитном порядке и сдвинуты ровно на 16 байт по сравнению с кодировочной таблицей windows-1251.
Кодировка UTF-8
(Unicode Transformation Format)
Очень распространенный формат кодирования символов, позволяющий кодировать символы переменным количеством байт.
Например, если для кодирования номера символа требуется 21 бит, то используется 4 байта для кодировки. Если для кодирования достаточно 11 бит, то используют 2 байта. А если номер символа может быть закодирован 7 битами, то используется один байт.
Кодировка UTF-8Все ASCII символы в кодировке UTF8 закодированы без изменений, то есть 1 байтом, как в стандартной таблице ASCII.
А вот остальные символы закодированы количеством байт от 2 до 4.
Кириллические символы закодированы двумя байтами.
за что отвечает и как работает – WindowsTips.Ru. Новости и советы
В начале 90-х, когда произошел развал СССР и границы России были открыты, к нам стали поступать программные продукты западного производства. Естественно, все они были англоязычными. В это же время начинает развиваться Интернет. Остро встала проблема русификации ресурсов и программ. Тогда и была придумана русская кодировка Windows 1251. Она позволяет корректно отображать буквы славянских алфавитов:
- русского;
- украинского;
- белорусского;
- сербского;
- болгарского;
- македонского.
Разработка велась русским представительством Microsoft совместно с компаниями «Диалог» и «Параграф». За основу были взяты самописные разработки, которые в 1990-91гг имели хождение среди немногочисленных идеологов ИТ в России.
На сегодняшний день разработан более универсальный способ кодировать символы — UTF-8 (Юникод). В нем представлено почти 90% всех программных и веб-ресурсов. Windows 1251 применяется в 1,6% случаев. (Информация по исследованиям Web Technology Surveys)
Кодировка сайта utf 8 или Windows 1251?
Чтобы ответить на этот вопрос, необходимо немного понять, что такое кодировка и чем они отличаются. Текстовая информация, как впрочем, и любая другая, в компьютере хранится в закодированном виде. Нам легче представить ее как числа. Каждый символ может занимать один или более байт. Windows 1251 является однобайтной кодировкой, а UTF-8 восьмибайтной. Это значит, что в Windows 1251 можно закодировать всего 256 символов.
Так как все сводится к двоичной системе исчисления, а байт – это 8 бит (0 и 1), то и максимальное число сочетаний составляет 28 = 256. Юникод позволяет представлять куда большее число символов, да и на каждый может быть выделен больший размер.
Отсюда и следуют преимущества Юникода:
- В шапке сайта следует указать кодировку, которая используется. Иначе вместо символов отобразятся «кракозяблы». А Юникод является стандартным для всех браузеров – они ловят его «на лету» как установленный по умолчанию.
- Символы сайта останутся одними и теми же, независимо от того, в какой стране загружается ресурс. Это зависит не от географического расположения серверов, а от языка программного обеспечения рабочих станций клиента. Житель Португалии, очевидно, использует клавиатуру и все ПО, включая операционную систему, на родном языке. В его компьютере, скорее всего вообще отсутствует Windows 1251. А если это так, то и сайты на русском языке корректно открываться не будут. Юникод, в свою очередь, «зашит» в любую ОС на любом языке.
- UTF-8 позволяет закодировать большее количество символов. На данный момент используется 6 байт из 8-ми, а русские символы кодируются двумя байтами.
Именно поэтому предпочтительней использовать универсальную кодировку, а не узкоспециализированную, которая применяется только в славянских странах.
Таблица кодировки Windows 1251
Для программистов и разработчиков сайтов бывает необходимо знать номера символов. Для этого используются специальные таблицы кодировки. Ниже представлена таблица для Windows 1251.
Что делать, если слетела кодировка командной строки?
Иногда Вы можете столкнуться с ситуацией, когда в командной строке вместо русских отображаются непонятные символы. Это означает, что возникла проблема кодировки командной строки Windows 7. Почему 7-ка? Потому что, начиная с 8-й версии, используется UTF-8, а в семерке еще Windows 1251.
Единовременно помочь решить проблему может команда chcp 866. Текущий сеанс будет работать корректно. А вот чтобы исправить ошибку кардинально, понадобится реестр.
- Нажмите Win+R и наберите команду regedit. Это позволит попасть в редактор реестра.
- Перейдите по ветке HKEY_CURRENT_USER\Console и посмотрите, чему равно значение для CodePage. Скорее всего, вы увидите что-то, отличное от 866 (правильный вариант).
- Исправьте на 866 в положении «Десятичная».
- Закройте и откройте вновь командную строку. Ситуация должна исправиться.
Виды кодировок символов [АйТи бубен]
В общем случае кодировка или кодовая таблица — это однозначное соответствие между подмножеством целых чисел (как правило, идущих подряд) и некоторым набором символов. Ключевым здесь является понятие символа. Символ может быть буквой (а может и не быть), может соответствовать звуку речи (а может и не соответствовать) и может быть представлен графическим знаком (но может обходиться и без какого бы то ни было видимого образа). Символ — это атом смысла, мельчайшая неделимая частица информации.
Так, латинское «А» и кириллическое «А» — это разные символы, потому что они употребляются в разных контекстах и несут в себе разную информацию.
Определяющим для любой кодировки является количество охватываемых ею кодов и, соответственно, символов. Поскольку тексты в компьютере хранятся в виде последовательности байтов, большинство кодировок естественным образом распадаются на однобайтовые, или восьмибитные, способные закодировать не больше 256 символов, и двухбайтовые, или шестнадцатибитные, чья емкость может достигать 65636 знакомест.
Если кодировка ISO 8859-5 для кириллицы так и не прижилась, первая из этой серии — кодировка ISO 8859-1, известная также под именем Latin-1, — сумела стать общепринятым стандартом для кодирования «расширенной» латиницы. В эту кодировку включены почти все символы, употребляющиеся в письменностях западноевропейских языков — французского, немецкого, испанского и т.д.
Внедрение Юникода привело к изменению подхода к традиционным 8-битным кодировкам. Если раньше кодировка задавалась шрифтом, то теперь она задаётся таблицей соответствия между данной кодировкой и Юникодом. Фактически 8-битные кодировки превратились в форму представления некоторого подмножества Юникода. Это намного упростило создание программ, которые должны работать с множеством разных кодировок: теперь, чтобы добавить поддержку ещё одной кодировки, надо всего лишь добавить ещё одну таблицу перекодировки в Юникод.
В 1991 году была предпринята попытка создать единую универсальную двухбайтовую кодировку, охватывающую все алфавиты и иероглифические системы мира. Результатом стал стандарт под названием Unicode, покрывающий не только системы письменности всех живых и большинства мертвых языков мира, но и множество музыкальных, математических, химических и прочих символов. Массовое применение Unicode в документах и программах остается делом будущего, для web- дизайнера эта кодировка имеет особое значение, так как именно она объявлена «стандартной кодировкой документа» в HTML начиная с версии 4.
В ближайшее время все более важную роль будет играть особый формат Unicode (и ISO 10646) под названием UTF-8. Эта «производная» кодировка пользуется для записи символов цепочками байтов различной длины (от одного до шести), которые с помощью несложного алгоритма преобразуются в Unicode- коды, причем более употребительным символам соответствуют более короткие цепочки. Главное достоинство этого формата — совместимость с ASCII не только по значениям кодов, но и по количеству бит на символ, так как для кодирования любого из первых 128 символов в UTF-8 достаточно одного байта (хотя, например, для букв кириллицы нужно уже по два байта).
Для указания кодировки символов web-страницы используются следующие обозначения кодовых таблиц:
На web- странице указать кодировку документа можно двумя cпособами:
Элемент meta является дочерним по отношению к разделу заголовка документа (head) и служит для указания типа и кодировки содержимого страницы. Типом содержимого является структурированный текст в формате html (text/html), используемая кодировка кириллица windows (charset=windows-1251).
Обычно используют оба способа одновременно. Например, для указания кодировки КОИ8 для украинского языка на web-странице, используют следующую структуру документа:
<?xml version="1.0" encoding="KOI8-U"?> <!DOCTYPE html PUBLIC ... > <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>Моя перша сторiнка</title> <meta http-equiv="Content-Type" content="text/html; charset=KOI8-U" /> </head> ... </html>
При сохранении текста выбирайте ту же кодировку, что указали на web-странице.
Поэкспериментируйте с различными кодировками, и вы убедитесь, что символы латинского алфавита, цифры и знаки пунктуации передаются без изменений в подавляющем большинстве из них.
Кодирование символов : кодовая страница, ASCII
Кодировка символов (часто называемая также кодовой страницей) – это набор числовых значений, которые ставятся в соответствие группе алфавитно-цифровых символов, знаков пунктуации и специальных символов.
Для кодировки символов в Windows используется таблица ASCII (American Standard Code for Interchange of Information).
В ASCII первые 128 символов всех кодовых страниц состоят из базовой таблицы символов. Первые 32 кода базовой таблицы, начиная с нулевого, размещают управляющие коды.
Символ | Код | Клавиши | Значение |
nul | 0 | Ctrl + @ | Нуль |
soh | 1 | Ctrl + A | Начало заголовка |
stx | 2 | Ctrl + B | Начало текста |
etx | 3 | Ctrl + C | Конец текста |
eot | 4 | Ctrl + D | Конец передачи |
enq | 5 | Ctrl + E | Запрос |
ack | 6 | Ctrl + F | Подтверждение |
bel | 7 | Ctrl + G | Сигнал (звонок) |
bs | 8 | Ctrl + H | Забой (шаг назад) |
ht | 9 | Ctrl + I | Горизонтальная табуляция |
lf | 10 | Ctrl + J | Перевод строки |
vt | 11 | Ctrl + K | Вертикальная табуляция |
ff | 12 | Ctrl + L | Новая страница |
cr | 13 | Ctrl + M | Возврат каретки |
so | 14 | Ctrl + N | Выключить сдвиг |
si | 15 | Ctrl + O | Включить сдвиг |
dle | 16 | Ctrl + P | Ключ связи данных |
dc1 | 17 | Ctrl + Q | Управление устройством 1 |
dc2 | 18 | Ctrl + R | Управление устройством 2 |
dc3 | 19 | Ctrl + S | Управление устройством 3 |
dc4 | 20 | Ctrl + T | Управление устройством 4 |
nak | 21 | Ctrl + U | Отрицательное подтверждение |
syn | 22 | Ctrl + V | Синхронизация |
etb | 23 | Ctrl + W | Конец передаваемого блока |
can | 24 | Ctrl + X | Отказ |
em | 25 | Ctrl + Y | Конец среды |
sub | 26 | Ctrl + Z | Замена |
esc | 27 | Ctrl + [ | Ключ |
fs | 28 | Ctrl + \ | Разделитель файлов |
gs | 29 | Ctrl + ] | Разделитель группы |
rs | 30 | Ctrl + ^ | Разделитель записей |
us | 31 | Ctrl + _ | Разделитель модулей |
Базовая таблица кодировки ASCII
32 пробел | 48 0 | 64 @ | 80 P | 96 ` | 112 p |
33 ! | 49 1 | 65 A | 81 Q | 97 a | 113 q |
34 “ | 50 2 | 66 B | 82 R | 98 b | 114 r |
35 # | 51 3 | 67 C | 83 S | 99 c | 115 s |
36 $ | 52 4 | 68 D | 84 T | 100 d | 116 t |
37 % | 53 5 | 69 E | 85 U | 101 e | 117 u |
38 & | 54 6 | 70 F | 86 V | 102 f | 118 v |
39 ‘ | 55 7 | 71 G | 87 W | 103 g | 119 w |
40 ( | 56 8 | 72 H | 88 X | 104 h | 120 x |
41 ) | 57 9 | 73 I | 89 Y | 105 i | 121 y |
42 * | 58 : | 74 J | 90 Z | 106 j | 122 z |
43 + | 59 ; | 75 K | 91 [ | 107 k | 123 { |
44 , | 60 < | 76 L | 92 \ | 108 l | 124 | |
45 — | 61 = | 77 M | 93 ] | 109 m | 125 } |
46 . | 110 n | 126 ~ | |||
47 / | 63 ? | 79 O | 95 _ | 111 o | 127 |
Символы с номерами от 128 до 255 представляют собой таблицу расширения и варьируются в зависимости от набора скриптов, представленных кодировкой символов. Набор символов таблицы расширения различается в зависимости от выбранной кодовой страницы:
1251 – кодовая страница Windows
128 Ђ | 144 Ђ | 160 | 176 ° | 192 А | 208 Р | 224 а | 240 р |
129 Ѓ | 145 ‘ | 161 Ў | 177 ± | 193 Б | 209 С | 225 б | 241 с |
130 ‚ | 146 ’ | 162 ў | 178 I | 194 В | 210 Т | 226 в | 242 т |
131 ѓ | 147 “ | 163 J | 179 i | 195 Г | 211 У | 227 г | 243 у |
132 „ | 148 ” | 164 ¤ | 180 ґ | 196 Д | 212 Ф | 228 д | 244 ф |
133 … | 149 • | 165 Ґ | 181 μ | 197 Е | 213 Х | 229 е | 245 х |
134 † | 150 – | 166 ¦ | 182 ¶ | 198 Ж | 214 Ц | 230 ж | 246 ц |
135 ‡ | 151 — | 167 § | 183 · | 199 З | 215 Ч | 231 з | 247 ч |
136 € | 152 □ | 168 Ё | 184 ё | 200 И | 216 Ш | 232 и | 248 ш |
137 ‰ | 153 ™ | 169 © | 185 № | 201 Й | 217 Щ | 233 й | 249 щ |
138 Љ | 154 љ | 170 Є | 186 є | 202 К | 218 Ъ | 234 к | 250 ъ |
139 < | 155 > | 171 « | 187 » | 203 Л | 219 Ы | 235 л | 251 ы |
140 Њ | 156 њ | 172 ¬ | 188 j | 204 М | 220 Ь | 236 м | 252 ь |
141 Ќ | 157 ќ | 173 | 189 S | 205 Н | 221 Э | 237 н | 253 э |
142 Ћ | 158 ћ | 174 ® | 190 s | 206 О | 222 Ю | 238 о | 254 ю |
143 Џ | 159 џ | 175 Ï | 191 ї | 207 П | 223 Я | 239 п | 255 я |
866 – кодовая страница DOS
128 А | 144 Р | 160 а | 176 ░ | 192 └ | 208 ╨ | 224 р | 240 ≡Ё |
129 Б | 145 С | 161 б | 177 ▒ | 193 ┴ | 209 ╤ | 225 с | 241 ±ё |
130 В | 146 Т | 162 в | 178 ▓ | 194 ┬ | 210 ╥ | 226 т | 242 ≥ |
131 Г | 147 У | 163 г | 179 │ | 195 ├ | 211 ╙ | 227 у | 243 ≤ |
132 Д | 148 Ф | 164 д | 180 ┤ | 196 ─ | 212 ╘ | 228 ф | 244 ⌠ |
133 Е | 149 Х | 165 е | 181 ╡ | 197 ┼ | 213 ╒ | 229 х | 245 ⌡ |
134 Ж | 150 Ц | 166 ж | 182 ╢ | 198 ╞ | 214 ╓ | 230 ц | 246 ¸ |
135 З | 151 Ч | 167 з | 183 ╖ | 199 ╟ | 215 ╫ | 231 ч | 247 » |
136 И | 152 Ш | 168 и | 184 ╕ | 200 ╚ | 216 ╪ | 232 ш | 248 ° |
137 Й | 153 Щ | 169 й | 185 ╣ | 201 ╔ | 217 ┘ | 233 щ | 249 · |
138 К | 154 Ъ | 170 к | 186 ║ | 202 ╩ | 218 ┌ | 234 ъ | 250 ∙ |
139 Л | 155 Ы | 171 л | 187 ╗ | 203 ╦ | 219 █ | 235 ы | 251 √ |
140 М | 156 Ь | 172 м | 188 ╝ | 204 ╠ | 220 ▄ | 236 ь | 252 ⁿ |
141 Н | 157 Э | 173 н | 189 ╜ | 205 ═ | 221 ▌ | 237 э | 253 ² |
142 О | 158 Ю | 174 о | 190 ╛ | 206 ╬ | 222 ▐ | 238 ю | 254 ■ |
143 П | 159 Я | 175 п | 191 ┐ | 207 ╧ | 223 ▀ | 239 я | 255 |
Русские названия основных спецсимволов:
Символ | Название |
` | гравис, кавычка, обратный машинописный апостроф |
` | гравис, кавычка, обратный машинописный апостроф |
~ | тильда |
! | восклицательный знак |
@ | эт, коммерческое эт, «собака» |
# | октоторп, решетка, диез |
$ | знак доллара |
% | процент |
^ | циркумфлекс, знак вставки |
& | амперсанд |
* | астериск, звездочка, знак умножения |
( | левая открывающая круглая скобка |
) | правая закрывающая круглая скобка |
— | минус, дефис |
_ | знак подчеркивания |
= | знак равенства |
+ | плюс |
[ | левая открывающая квадратная скобка |
] | правая закрывающая квадратная скобка |
{ | левая открывающая фигурная скобка |
} | правая закрывающая фигурная скобка |
; | точка с запятой |
: | двоеточие |
‘ | машинописный апостроф, одинарная кавычка |
« | двойная кавычка |
, | запятая |
. | точка |
/ | слэш, косая черта, знак дроби |
< | левая открытая угловая скобка, знак меньше |
> | правая закрытая угловая скобка, знак больше |
\ | обратный слэш, обратная косая черта |
| | вертикальная черта |
Кодировка UNICODE
Юникод (Unicode) — стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода».
В Unicode используются 16-битовые (2-байтовые) коды, что позволяет представить 65536 символов.
Применение стандарта Unicode позволяет закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, при этом становится ненужным переключение кодовых страниц.
Для представления символьных данных в кодировке Unicode используется символьный тип wchar_t.
ASCII | UNICODE |
char | wchar_t |
1 байт | 2 байта |
Тип кодировки задается в свойствах проекта Microsoft Visual Studio:
Многобайтовая кодировка предполагает использование кодировки ASCII.
При этом при построении проекта используется директива условной компиляции, переопределяющая тип TCHAR:
#ifdef _UNICODE
typedef wchar_t TCHAR;
#else
typedef char TCHAR;
#endif
Для перекодирования строки в формат Unicode без изменения кодировки файла используется макроопределение
_T(«строка»)
Прототип макроса содержится в файле tchar.h.
Назад: Представление данных и архитектура ЭВМ
Кодировка windows 1251 в сайтостроении
Кодировка windows 1251 была создана в начале 90 годов для русификации программных продуктов, выпускаемых корпорацией Microsoft:
Кодировка является 8-битной и включает в себя символы славянской группы языков, в которую входят русский, белорусский, украинский, болгарский, македонский, сербский – это дает преимущество перед остальными кириллическими кодировками (ISO 8859-5, KOI8-R, CP866). Однако у 1251-кодировки имеются и весомые недостатки:
- 0xFF (25510) – это код, который зарезервирован для символа «я». В программах, которые не поддерживают чистый 8-ой бит, часто возникают непредсказуемые проблемы;
- Нет псевдографики, которая присутствует в KOI8, CP866.
Ниже приведены символы из Code Page 1251 или сокращенно СР1251 (числа под символами являются кодом в шестнадцатеричной системе такого же символа в Юникоде):
Нередко у web-разработчиков и блогеров, обладающих различной квалификацией возникает проблема с кодировкой страниц: вместо подготовленного текста появляются неизвестные, нечитаемые символы. Чтобы разобраться с данной проблемой, необходимо понимать суть термина «кодировка страницы».
Текст в памяти компьютера хранится в виде определенного количества байт, а не в том виде, в котором он отображается в текстовом редакторе. Каждый байт является кодом, который соответствует одному символу. Для того чтобы текст на странице отображался как следует, нужно сообщить браузеру, какую таблицу кодов для расшифровки и отображения он должен использовать.
Таблица кодировок не является универсальной, то есть, для расшифровки текста необходимо использовать ту, которая соответствует кодировке символов:
Для того чтобы html-документ корректно отобразился в браузере, необходимо указать используемую кодировку. Делается это следующим образом:
— между тегом <head> и закрывающим его </head> нужно прописать <meta http-equiv=»Content-Type» content=»text/html; charset=windows-1251″> — исходя из этой строки, браузер будет использовать символы русского алфавита для отображения текста на странице.
Ни для кого не является тайной, что генерация страниц проходит путем выборки и использования какой-то части информации, которая хранится в базе данных. При написании сайта на PHP, чаще всего это mysql:
Нередко при смене хостинга возникает проблема: различные кодировки информации в базе данных и в шаблонах страниц. Из-за этого одна сгенерированная страница может одновременно содержать несколько кодировок. Если информация на сайте представлена в кодировке виндовс 1251, то и чтение из базы данных должно осуществляться с помощью таблицы, в которой представлена win 1251 кодировка.
Для согласования расшифровки необходимо выполнить функцию mysql_query(«SET NAMES cp1251») – это означает, что преобразование из машинного кода будет осуществляться согласно таблице cp1251.
При создании сайта, предварительно настроив кодировки в шаблонах и базах данных, все равно может всплыть проблема некорректного отображения информации в браузере.
Для того чтобы для веб-ресурса была задана кодировка виндовс-1251, необходимо найти (или создать) файл .htaccess. Это файл, который хранит в себе дополнительные настройки и описания конфигураций web-сервера.
В нем для установки кодировки следует прописать следующие строки:
- DefaultLanguage ru;
- AddDefaultCharset windows-1251;
- php_value default_charset «cp1251».
Таким образом, для корректного отображения текста должны совпадать его кодировка и таблица кодов, с помощью которой браузер будет расшифровывать символы. Для текстов, написанных на славянских языках, необходима win 1251 кодировка. Важно помнить, что элементы страниц и баз данных должны быть описаны с помощью одной таблицы кодов.
Таблица сравнения символовв Windows-1252, ISO-8859-1, ISO-8859-15
Кодировки символов ISO-8859-1, ISO-8859-15 и Windows-1252 очень похожи, и их легко перепутать. Это приводит к нескольким типичным проблемам. Следующая диаграмма показывает различия между этими кодировками и полезна для отладки связанных проблем.
ISO-8859-1 по сравнению с Windows-1252
ISO-8859-1 (также называемый Latin-1) идентичен Windows-1252 (также называемый CP1252), за исключением кодовых точек 128-159 (0x80-0x9F).ISO-8859-1 назначает несколько управляющих кодов в этом диапазоне. Windows-1252 имеет несколько символов, пунктуацию, арифметику и бизнес. символы, присвоенные этим кодовым точкам.
Типичные проблемы
- Неправильная маркировка текста, закодированного в Windows-1252 как ISO-8859-1, а затем преобразование из ISO-8859-1 в Unicode или другие кодировки приводит к появлению символов в диапазоне 128-159 теряться. Они преобразуются, как если бы они были управляющими кодами, и обычно отображаются в виде белого пространства, специального вопросительного знака, или квадрат, показывающий 4 шестнадцатеричных цифры кодовой точки. Использование шрифта ISO-8859-1, который не имеет правильных глифов для символов Windows-1252 приведет к неправильному отображению символов.
- HTML и XML используют кодовые точки Unicode в качестве значений в ссылках на числовые символы (NCR). Ссылки на числовые символы — это escape-символы записывается как & # dddd; или & # xhhhh; где десятичные или шестнадцатеричные значения являются кодовыми точками Unicode. Поскольку первые 256 символов в Юникоде идентичны символам в ISO-8859-1, люди привыкают использовать знакомый им кодовый знак для создания NCR.Однако для символов в диапазоне 128–159 в Windows-1252 это неправильные значения. Например, евро (€) в кодовой точке 0x80 в Windows-1252, но в Unicode это U + 20AC. & # x80; является NCR для контрольного кода и не будет отображаться как евро. Правильный NCR — & # x20AC ;.
В сравнительной таблице ниже показаны кодовые точки Unicode, связанные с Windows-1252. символы в диапазоне 128-159.
ISO-8859-1 в сравнении с ISO-8859-15
Эти 2 кодировки идентичны, за исключением 8 кодовых точек, что вызывает путаницу между ними, а также с Windows-1252.Для получения дополнительной информации о ISO-8859-15, см. Сравнение ISO-8859-1 и ISO-8859-15.
Таблица сравнения
Вот символы в диапазоне 128-159 в Windows 1252 с их кодовыми точками Unicode, Значения байтов UTF-8 и кодовые точки ISO-8859-15, если они отличаются от ISO-8859-1.
Примечание по терминологии:
- NCR = Ссылка на цифровые символы
- CER = Ссылка на сущность символа
- CP1252 = Окна-1252
Кодовый пункт | UTF-8 байтов | NCR * | Персонаж | CER * или NCR * | Имя персонажа | |||||
---|---|---|---|---|---|---|---|---|---|---|
CP1252 * | ISO 8859-15 | Юникод | ||||||||
(декабрь) | (шестигранник) | (шестигранник) | (шестигранник) | # 1 | # 2 | # 3 | (декабрь) | (шестигранник) | ||
128 | 80 | A4 | 20AC | E2 | 82 | AC | & # 8364; | € | и евро; | Знак евро |
129 | 81 | НЕ НАЗНАЧЕН | ||||||||
130 | 82 | 201A | E2 | 80 | 9A | & # 8218; | ‚ | & sbquo; | Одиночный малый 9 кавычки | |
131 | 83 | 192 | C6 | 92 | & # 402; | ƒ | & # x192; | Строчная латинская буква F с крючком | ||
132 | 84 | 201E | E2 | 80 | 9E | & # 8222; | „ | & bdquo; | Двойной низкий 9 котировальный знак | |
133 | 85 | 2026 | E2 | 80 | A6 | & # 8230; | … | & hellip; | Горизонтальное многоточие | |
134 | 86 | 2020 | E2 | 80 | A0 | & # 8224; | † | & кинжал; | Кинжал | |
135 | 87 | 2021 | E2 | 80 | A1 | & # 8225; | ‡ | и кинжал; | Двойной кинжал | |
136 | 88 | 2C6 | CB | 86 | & # 710; | ˆ | & circ; | Буква-модификатор Circumflex Accent | ||
137 | 89 | 2030 | E2 | 80 | B0 | & # 8240; | ‰ | & permil; | Знак промилле | |
138 | 8A | A6 | 160 | C5 | A0 | & # 352; | Š | и Scaron; | Латинская заглавная буква S с кароном | |
139 | 8Б | 2039 | E2 | 80 | B9 | & # 8249; | ‹ | & lsaquo; | Кавычка с одинарным левым углом | |
140 | 8C | г. до н.э. | 152 | C5 | 92 | & # 338; | Œ | и OElig; | Лигатура латинской заглавной буквы OE | |
141 | 8D | НЕ НАЗНАЧЕН | ||||||||
142 | 8E | B4 | 17D | C5 | BD | & # 381; | Ž | & # x17D; | Латинская заглавная буква Z с кароном | |
143 | 8F | НЕ НАЗНАЧЕН | ||||||||
144 | 90 | НЕ НАЗНАЧЕН | ||||||||
145 | 91 | 2018 | E2 | 80 | 98 | & # 8216; | ‘ | & lsquo; | Одинарный кавычка левый | |
146 | 92 | 2019 | E2 | 80 | 99 | & # 8217; | ’ | & rsquo; | Одинарный кавычка, правый | |
147 | 93 | 201C | E2 | 80 | 9C | & # 8220; | “ | & ldquo; | Двойные кавычки слева | |
148 | 94 | 201D | E2 | 80 | 9D | & # 8221; | ” | & rdquo; | Двойные кавычки справа | |
149 | 95 | 2022 | E2 | 80 | A2 | & # 8226; | • | и бык; | Пуля | |
150 | 96 | 2013 | E2 | 80 | 93 | & # 8211; | – | & ndash; | En Dash | |
151 | 97 | 2014 | E2 | 80 | 94 | & # 8212; | – | & mdash; | Em Dash | |
152 | 98 | 2DC | CB | 9C | & # 732; | ˜ | & тильда; | Маленькая тильда | ||
153 | 99 | 2122 | E2 | 84 | A2 | & # 8482; | ™ | и торговля; | Знак товарного знака | |
154 | 9A | A8 | 161 | C5 | A1 | & # 353; | š | & scaron; | Строчная латинская буква S с кароном | |
155 | 9Б | 203A | E2 | 80 | BA | & # 8250; | › | & rsaquo; | Одинарный кавычка, указывающая вправо | |
156 | 9C | BD | 153 | C5 | 93 | & # 339; | œ | & oelig; | Строчная латинская лигатура OE | |
157 | 9D | НЕ НАЗНАЧЕН | ||||||||
158 | 9E | B8 | 17E | C5 | BE | & # 382; | × | & # x17E; | Строчная латинская буква Z с кароном | |
159 | 9F | BE | 178 | C5 | B8 | & # 376; | Ÿ | и Yuml; | Латинская заглавная буква Y с диэрезисом |
Дополнительные ссылки
Авторские права © 2010, 2011 Tex Texin.Все права защищены.вернуться наверх
Кодовая страница Windows 1251
Кодовая страница Windows 1251 Эта страница содержит таблицу кодовой страницы Microsoft Windows 1251 для русского и некоторые другие языки, написанные кириллицей. CP1251 символы включены буквально в скобки слева от каждой строки. Если вы сохраните эту страницу, у вас будет таблица CP1251, которую вы можете использовать для тестирования вашего конфигурация набора символов эмулятора терминала.Кодовая страница Microsoft Windows 1251 char dec col / row oct hex описание [] 128 08/00 200 80 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА DJE [] 129 08/01 201 81 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА GJE [] 130 08/02 202 82 НИЗКАЯ 9 ОДИНОЧНАЯ ЦИТАТА [] 131 08/03 203 83 Кирилическая строчная буква GJE [] 132 08/04 204 84 НИЗКАЯ 9 ДВОЙНАЯ ЦИТАТА [] 133 08/05 205 85 ЭЛЛИПСИС [] 134 08/06 206 86 КИНЖАЛ [] 135 08/07 207 87 ДВОЙНОЙ КИНЖАЛ [] 136 08/08 210 88 ЕВРО ЗНАК [] 137 08/09 211 89 ЗА МИЛ ЗНАК [] 138 08/10 212 8A ЗАГЛАВНАЯ БУКВА LJE [] 139 08/11 213 8B ЛЕВЫЙ КРОНШТЕЙН ОДИНОЧНОЙ ЦИТАТЫ [] 140 08/12 214 8C КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА NJE [] 141 08/13 215 8D КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА KJE [] 142 08/14 216 8E КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TSHE [] 143 15.08 217 8F КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ДЖЕ [] 144 09/00 220 90 КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА DJE [] 145 09/01 221 91 ВЫСОКАЯ 6 ОДИНОЧНАЯ ЦИТАТА [] 146 09/02 222 92 ВЫСОКАЯ 9 ОДИНОЧНАЯ ЦИТАТА [] 147 09/03 223 93 ВЫСОКАЯ 6 ДВОЙНАЯ ЦИТАТА [] 148 09/04 224 94 ВЫСОКАЯ 9 ДВОЙНАЯ ЦИТАТА [] 149 09/05 225 95 БОЛЬШАЯ ЦЕНТРАЛЬНАЯ ТОЧКА [] 150 09/06 226 96 RU ТИП [] 151 07.09 227 97 EM DASH [] 152 09/08 230 98 (НЕ ОПРЕДЕЛЕННО) [] 153 09/09 231 99 ТОВАРНЫЙ ЗНАК [] 154 09/10 232 9A СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА LJE [] 155 09/11 233 9B ПРАВЫЙ КРОНШТЕЙН ДЛЯ ОДИНОЧНОЙ ЦИТАТЫ [] 156 09/12 234 9C КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА NJE [] 157 09/13 235 9D КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА KJE [] 158 14.09 236 9E КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TSHE [] 159 15.09 237 9F КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ДЖЕ [] 160 10/00 240 A0 НЕПРЕРЫВНОЕ ПРОСТРАНСТВО [] 161 10/01 241 A1 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА КОРОТКАЯ U [] 162 10/02 242 A2 КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА КОРОТКАЯ U [] 163 10/03 243 A3 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА JE [] 164 10/04 244 ЗНАК ВАЛЮТЫ A4 [] 165 10/05 245 A5 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА GHE С ПОВОРОТОМ [] 166 10/06 246 A6 СЛОМАННЫЙ БАР [] 167 10/07 247 A7 ЗНАК ПАРАГРАФА [] 168 10/08 250 A8 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА IO [] 169 10/09 251 A9 ЗНАК АВТОРСКОГО ПРАВА [] 170 10/10 252 AA КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА УКРАИНСКИЙ IE [] 171 10/11 253 AB ЛЕВЫЙ УГЛОВОЙ ЦИТАТНЫЙ ЗНАК [] 172 10/12 254 AC NOT SIGN [] 173 10/13 255 AD МЯГКИЙ ДЕФИС [] 174 10/14 256 AE ЗНАК ЗАРЕГИСТРИРОВАННОЙ ТОРГОВОЙ МАРКИ [] 175 10/15 257 AF КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА YI [] 176 11/00 260 B0 ЗНАК, КОЛЬЦО ВЫШЕ [] 177 11/01 261 B1 ЗНАК ПЛЮС-МИНУС [] 178 11/02 262 B2 Кирилическая прописная буква БЕЛОРУССИЯ-УКРАИНСКИЙ ЯЗЫК I [] 179 11/03 263 B3 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА БЕЛОРУССИЯ-УКРАИНСКИЙ ЯЗЫК I [] 180 11/04 264 B4 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА GHE С ПОВОРОТОМ [] 181 11/05 265 B5 МИКРОЗНАК [] 182 06/11 266 B6 ЗНАК ПИЛКРОУ [] 183 07/11 267 B7 СРЕДНЯЯ ТОЧКА [] 184 08/11 270 B8 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА IO [] 185 11/09 271 B9 ЗНАК NUMERO [] 186 11/10 272 BA СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА УКРАИНСКИЙ IE [] 187 11/11 273 BB ЦИТАТНЫЙ ЗНАК ПРАВЫЙ УГОЛ [] 188 11/12 274 до н.э. СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА JE. [] 189 11/13 275 BD КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА DZE [] 190 14/11 276 БЫТЬ СТРОЧНОЙ КИРИЛИЧЕСКОЙ БУКВОЙ DZE [] 191 15/11 277 BF КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА YI [] 192 12/00 300 C0 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА A [] 193 01/12 301 C1 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА БЫТЬ [] 194 12/02 302 C2 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА VE [] 195 12/03 303 C3 ЗАГЛАВНАЯ БУКВА GHE [] 196 12/04 304 C4 ЗАГЛАВНАЯ БУКВА DE [] 197 12/05 305 C5 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА IE [] 198 12/06 306 C6 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ZHE [] 199 12/07 307 C7 ЗАГЛАВНАЯ БУКВА ZE [] 200 12/08 310 C8 ЗАГЛАВНАЯ БУКВА I [] 201 12/09 311 C9 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА КОРОТКАЯ I [] 202 12/10 312 CA КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА KA [] 203 12/11 313 CB КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EL [] 204 12/12 314 CC КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EM [] 205 12/13 315 CD КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EN [] 206 12/14 316 CE КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА O [] 207 15/12 317 CF КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА PE [] 208 13/00 320 D0 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ER [] 209 13/01 321 D1 ЗАГЛАВНАЯ БУКВА ES [] 210 13/02 322 D2 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TE [] 211 13/03 323 D3 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА U [] 212 13/04 324 D4 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EF [] 213 13/05 325 D5 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА HA [] 214 13/06 326 D6 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TSE [] 215 13/07 327 D7 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА CHE [] 216 13/08 330 D8 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА SHA [] 217 13/09 331 D9 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЩА [] 218 13/10 332 DA КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЖЕСТКИЙ ЗНАК [] 219 13/11 333 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ДБ ЕРУ [] 220 13/12 334 DC КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА МЯГКИЙ ЗНАК [] 221 13/13 335 DD КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА E [] 222 13/14 336 КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА YU [] 223 13/15 337 DF КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА YA [] 224 14/00 340 E0 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА A [] 225 14/01 341 E1 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА BE [] 226 14/02 342 E2 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА VE [] 227 14/03 343 E3 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА GHE [] 228 14/04 344 E4 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА DE [] 229 14/05 345 E5 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА IE [] 230 14/06 346 E6 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ZHE [] 231 14/07 347 E7 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ZE [] 232 14/08 350 E8 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА I [] 233 14/09 351 E9 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА КОРОТКАЯ I [] 234 14/10 352 EA СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА KA [] 235 14/11 353 EB КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА EL [] 236 14/12 354 EC КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА EM [] 237 14/13 355 ED Кирилическая строчная буква EN [] 238 14/14 356 EE СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА O [] 239 14/15 357 EF КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА PE [] 240 15/00 360 F0 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ER [] 241 15/01 361 F1 КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ES [] 242 15/02 362 F2 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА TE [] 243 15/03 363 F3 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА U [] 244 15/04 364 F4 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА EF [] 245 15/05 365 F5 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА HA [] 246 15/06 366 F6 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА TSE [] 247 15/07 367 F7 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА CHE [] 248 15/08 370 F8 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА CHA [] 249 15/09 371 F9 СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ЩА [] 250 15/10 372 FA КИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ЖЕСТКИЙ ЗНАК [] 251 15/11 373 FB КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА YERU [] 252 15/12 374 FC КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА МЯГКИЙ ЗНАК [] 253 15/13 375 FD СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА E [] 254 15/14 376 FE СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА YU [] 255 15/15 377 FF СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА YA
Франк да Круз, Проект Кермит, Колумбийский университет, Март 2003 г.
PHP: Поддерживаемые кодировки символов — Руководство
В настоящее время следующие кодировки символов поддерживаются mbstring
модуль.Любая из этих кодировок символов
может быть указано в параметре кодировка
параметра mbstring
функций.
В этом PHP поддерживаются следующие кодировки символов. расширение:
- UCS-4 *
- UCS-4BE
- UCS-4LE *
- UCS-2
- UCS-2BE
- UCS-2LE
- UTF-32 *
- UTF-32BE *
- UTF-32LE *
- UTF-16 *
- UTF-16BE *
- UTF-16LE *
- UTF-7
- UTF7-IMAP
- UTF-8 *
- ASCII *
- EUC-JP *
- SJIS *
- eucJP-выигрыш *
- SJIS-выиграть *
- ISO-2022-JP
- ISO-2022-JP-MS
- CP932
- CP51932
- SJIS-mac (псевдоним: MacJapanese)
- SJIS-Mobile # DOCOMO (псевдоним: SJIS-DOCOMO)
- SJIS-Mobile # KDDI (псевдоним: SJIS-KDDI)
- SJIS-Mobile # SOFTBANK (псевдоним: SJIS-SOFTBANK)
- UTF-8-Mobile # DOCOMO (псевдоним: UTF-8-DOCOMO)
- UTF-8-Mobile # KDDI-A
- UTF-8-Mobile # KDDI-B (псевдоним: UTF-8-KDDI)
- UTF-8-Mobile # SOFTBANK (псевдоним: UTF-8-SOFTBANK)
- ISO-2022-JP-MOBILE # KDDI (псевдоним: ISO-2022-JP-KDDI)
- JIS
- JIS-ms
- CP50220
- CP50220raw
- CP50221
- CP50222
- ISO-8859-1 *
- ISO-8859-2 *
- ISO-8859-3 *
- ISO-8859-4 *
- ISO-8859-5 *
- ISO-8859-6 *
- ISO-8859-7 *
- ISO-8859-8 *
- ISO-8859-9 *
- ISO-8859-10 *
- ISO-8859-13 *
- ISO-8859-14 *
- ISO-8859-15 *
- ISO-8859-16 *
- байт2be
- байт2ле
- byte4be
- байт4ле
- BASE64
- HTML-ENTITIES (псевдоним: HTML)
- 7 бит
- 8 бит
- EUC-CN *
- CP936
- ГБ18030
- Гц
- EUC-TW *
- CP950
- БОЛЬШОЙ-5 *
- EUC-KR *
- UHC (псевдоним: CP949)
- ISO-2022-KR
- Windows-1251 (псевдоним: CP1251)
- Windows-1252 (псевдоним: CP1252)
- CP866 (псевдоним: IBM866)
- КОИ8-Р *
- КОИ8-У *
- ArmSCII-8 (псевдоним: ArmSCII8)
* обозначает кодировки, которые можно использовать также в регулярных выражениях.
Любая запись php.ini , которая принимает имя кодировки
также можно использовать значения « авто
» и
« перевал
». mbstring
функций, которые принимают кодировку
name также может использовать значение « auto
».
Если задано « проход
», ни одного символа
преобразование кодировки выполняется.
Если установлено « авто
», оно расширяется до
список кодировок, определенных в NLS.
Например, если для NLS установлено значение Японский
,
значение предполагается равным
« ASCII, JIS, UTF-8, EUC-JP, SJIS
».
См. Также mb_detect_order ()
Модуль ngx_http_charset_module
Модуль ngx_http_charset_module
Модуль ngx_http_charset_module
добавляет указанный
charset в поле заголовка ответа Content-Type.
Кроме того, модуль может конвертировать данные из одной кодировки в другую,
с некоторыми ограничениями:
- конвертация осуществляется в одну сторону — от сервера к клиенту,
- могут быть преобразованы только однобайтовые кодировки
- или однобайтовые кодировки в / из UTF-8.
Пример конфигурации
включить conf / koi-win; кодировка windows-1251; source_charset koi8-r;
Директивы
Синтаксис: | кодировка |
---|---|
Дефолт: | charset off; |
Контекст: | http , server , location , if in location |
Добавляет указанную кодировку в Content-Type. поле заголовка ответа.Если эта кодировка отличается от указанной в директиве source_charset выполняется преобразование.
Параметр off
отменяет добавление кодировки.
в поле заголовка ответа Content-Type.
Кодировку можно определить с помощью переменной:
charset $ charset;
В таком случае должны присутствовать все возможные значения переменной.
в конфигурации хотя бы один раз в виде
charset_map, charset или
source_charset директивы.Для utf-8
, windows-1251
и koi8-r кодировки
, достаточно включить файлы conf / koi-win
, conf / koi-utf
и conf / win-utf
в конфигурацию.
Для других кодировок просто создание фиктивной таблицы преобразования работает,
Например:
charset_map iso-8859-5 _ {}
Кроме того, кодировку можно установить в Поле заголовка ответа «X-Accel-Charset». Эту возможность можно отключить с помощью proxy_ignore_headers, fastcgi_ignore_headers, uwsgi_ignore_headers, scgi_ignore_headers, и grpc_ignore_headers директивы.
Синтаксис: | charset_map |
---|---|
Дефолт: | — |
Контекст: | http |
Описывает таблицу преобразования из одной кодировки в другую.Таблица обратного преобразования строится с использованием тех же данных.
Коды символов даны в шестнадцатеричном формате.
Отсутствующие символы в диапазоне 80-FF заменяются на «?
».
При преобразовании из UTF-8 символы отсутствуют в однобайтовой кодировке.
заменяются на « & # XXXX;
».
Пример:
charset_map koi8-r windows-1251 { C0 FE; # маленький ю C1 E0; # маленький а C2 E1; # маленький б C3 F6; # small ts ... }
При описании таблицы преобразования в UTF-8 коды для кодировки UTF-8 должны быть приведенным во втором столбце, например:
charset_map koi8-r utf-8 { C0 D18E; # маленький ю C1 D0B0; # маленький а C2 D0B1; # маленький б C3 D186; # small ts ... }
Полные таблицы преобразования с koi8-r
на windows-1251
, а от koi8-r
и окна-1251 от
до utf-8
предоставлены в файлах раздачи conf / koi-win
, conf / koi-utf
и conf / win-utf
.
Синтаксис: | charset_types |
---|---|
Дефолт: | charset_types текст / HTML-текст / XML-текст / обычный текст / vnd.wap.wml приложение / javascript приложение / rss + xml; |
Контекст: | http , сервер , расположение |
Эта директива появилась в версии 0.7.9.
Включает обработку модуля в ответах с указанными типами MIME
в дополнение к « text / html
».
Специальное значение « *
» соответствует любому типу MIME (0.8.29).
До версии 1.5.4 использовалось «application / x-javascript
». в качестве типа MIME по умолчанию вместо «application / javascript
».
Синтаксис: | override_charset |
---|---|
Дефолт: | override_charset off; |
Контекст: | http , server , location , if in location |
Определяет, нужно ли выполнять преобразование ответов получено от прокси-сервера или сервера FastCGI / uwsgi / SCGI / gRPC когда ответы уже содержат кодировку в «Content-Type» поле заголовка ответа.Если преобразование включено, кодировка указана в полученном ответ используется как кодировка источника.
Следует отметить, что если ответ получен в подзапросе
затем преобразование из кодировки ответа в кодировку основного запроса
выполняется всегда, независимо от значения override_charset
установка директивы.
Синтаксис: | кодировка источника |
---|---|
Дефолт: | — |
Контекст: | http , server , location , if in location |
Определяет исходную кодировку ответа.Если эта кодировка отличается от указанной в директиве charset выполняется преобразование.
US-ASCII | US-ASCII | 3 | ANSI X3.4-1986 | [RFC2046] | iso-ir-6 ANSI_X3.4-1968 ANSI_X3.4-1986 ISO_646.irv: 1991 ISO646-US US-ASCII us IBM367 cp367 csASCII | |
ISO-8859-1 | ISO_8859-1: 1987 | 4 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-100 ISO_8859-1 ISO-8859-1 latin1 l1 IBM819 CP819 csISOLatin1 | |
ISO-8859-2 | ISO_8859-2: 1987 | 5 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-101 ISO_8859-2 ISO-8859-2 latin2 l2 csISOLatin2 | |
ISO-8859-3 | ISO_8859-3: 1988 | 6 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-109 ISO_8859-3 ISO-8859-3 latin3 l3 csISOLatin3 | |
ISO-8859-4 | ISO_8859-4: 1988 | 7 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-110 ISO_8859-4 ISO-8859-4 latin4 l4 csISOLatin4 | |
ISO-8859-5 | ISO_8859-5: 1988 | 8 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-144 ISO_8859-5 ISO-8859-5 кириллица csISOLatinCyrillic | |
ISO-8859-6 | ISO_8859-6: 1987 | 9 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-127 ISO_8859-6 ISO-8859-6 ECMA-114 ASMO-708 арабский csISOLatinArabic | |
ISO-8859-7 | ISO_8859-7: 1987 | 10 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1947] [RFC1345] [Keld_Simonsen] | iso-ir-126 ISO_8859-7 ISO-8859-7 ELOT_928 ECMA-118 греческий греческий8 csISOLatinGreek | |
ISO-8859-8 | ISO_8859-8: 1988 | 11 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-138 ISO_8859-8 ISO-8859-8 иврит csISOLatinHebrew | |
ISO-8859-9 | ISO_8859-9: 1989 | 12 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-148 ISO_8859-9 ISO-8859-9 latin5 l5 csISOLatin5 | |
ISO-8859-10 | ISO-8859-10 | 13 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-157 l6 ISO_8859-10: 1992 csISOLatin6 latin6 | |
ISO_6937-2-добавить | 14 | [ISO-IR: Международный регистр последовательностей побегов] и ISO 6937-2: 1983 Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-142 csISOTextComm | ||
JIS_X0201 | 15 | JIS X 0201-1976.Только один байт, это эквивалентно JIS / Roman (аналогично ASCII) плюс восьмибитная полуширина Катакана | [RFC1345] [Keld_Simonsen] | X0201 cs HalfWidth, Катакана | ||
JIS_Encoding | 16 | JIS X 0202-1991. Использует escape-последовательности ISO 2022 для наборы кодов смены, как описано в JIS X 0202-1991. | csJISEncoding | |||
Shift_JIS | Shift_JIS | 17 | Эта кодировка является расширением csHalfWidthKatakana, разработанным добавление графических символов в JIS X 0208.CCS являются JIS X0201: 1997 и JIS X0208: 1997. В полное определение приведено в Приложении 1 JIS X0208: 1997. Эта кодировка может использоваться для типа мультимедиа верхнего уровня «текст». | MS_Kanji csShiftJIS | ||
EUC-JP | Extended_UNIX_Code_Packed_Format_for_Японский | 18 | Стандартизован OSF, UNIX International и UNIX Systems Лаборатории Тихого океана.Использует правила ISO 2022 для выбора кодовый набор 0: US-ASCII (один 7-битный набор байтов) кодовый набор 1: JIS X0208-1990 (двойной 8-битный набор байтов) ограничено A0-FF в обоих байтах кодовый набор 2: Катакана половинной ширины (один 7-битный набор байтов) требуя SS2 в качестве префикса символа кодовый набор 3: JIS X0212-1990 (двойной 7-битный набор байтов) ограничено A0-FF в обоих байтах требуя SS3 в качестве префикса символа | csEUCPkdFmtЯпонский EUC-JP | ||
Extended_UNIX_Code_Fixed_Width_for_Japanese | 19 | Используется в Японии.Каждый символ составляет 2 октета. кодовый набор 0: US-ASCII (один 7-битный набор байтов) 1-й байт = 00 2-й байт = 20-7E кодовый набор 1: JIS X0208-1990 (двойной 7-битный набор байтов) ограничено A0-FF в обоих байтах кодовый набор 2: Катакана половинной ширины (один 7-битный набор байтов) 1-й байт = 00 2-й байт = A0-FF кодовый набор 3: JIS X0212-1990 (двойной 7-битный набор байтов) ограничено A0-FF в первый байт и 21-7E во втором байте | csEUCFixWidЯпонский | |||
BS_4730 | 20 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-4 ISO646-GB gb uk csISO4UnitedKingdom | ||
SEN_850200_C | 21 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-11 ISO646-SE2 se2 csISO11ШведскийForNames | ||
IT | 22 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-15 ISO646-IT csISO15 Итальянский | ||
ES | 23 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-17 ISO646-ES csISO17 Испанский | ||
DIN_66003 | 24 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-21 de ISO646-DE csISO21 Немецкий | ||
NS_4551-1 | 25 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-60 ISO646-NO no csISO60ДатскийНорвежский csISO60Норвежский1 | ||
NF_Z_62-010 | 26 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-69 ISO646-FR fr csISO69 Французский | ||
ISO-10646-UTF-1 | 27 | Universal Transfer Format (1), это многобайтовый кодировка, которая является подмножеством ASCII-7. У него нет байта вопросы заказа. | csISO10646UTF1 | |||
ISO_646.базовый: 1983 | 28 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | Ссылка csISO646basic1983 | ||
ИНВАРИАНТ | 29 | [RFC1345] [Keld_Simonsen] | csINVARIANT | |||
ISO_646.irv: 1983 | 30 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-2 irv csISO2IntlRefVersion | ||
NATS-SEFI | 31 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-8-1 csNATSSEFI | ||
NATS-SEFI-ADD | 32 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-8-2 csNATSSEFIADD | ||
НАЦ-ДАНО | 33 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-9-1 csNATSDANO | ||
НАЦ-ДАНО-ДОБАВИТЬ | 34 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-9-2 csNATSDANOADD | ||
SEN_850200_B | 35 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-10 FI ISO646-FI ISO646-SE se csISO10 Шведский | ||
КС_С_5601-1987 | 36 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-149 KS_C_5601-1989 KSC_5601 корейский csKSC56011987 | ||
ISO-2022-KR | ISO-2022-KR | 37 | [RFC1557] (см. Также KS_C_5601-1987) | [RFC1557] [Woohyong_Choi] | csISO2022KR | |
EUC-KR | EUC-KR | 38 | [RFC1557] (см. Также KS_C_5861-1992) | [RFC1557] [Woohyong_Choi] | csEUCKR | |
ISO-2022-JP | ISO-2022-JP | 39 | [RFC1468] (см. Также [RFC2237]) | [RFC1468] [Jun_Murai] | csISO2022JP | |
ISO-2022-JP-2 | ISO-2022-JP-2 | 40 | [RFC1554] | [RFC1554] [Masataka_Ohta] | csISO2022JP2 | |
JIS_C6220-1969-jp | 41 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | JIS_C6220-1969 iso-ir-13 катакана x0201-7 csISO13JISC6220jp | ||
JIS_C6220-1969-ro | 42 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-14 jp ISO646-JP csISO14JISC6220ro | ||
PT | 43 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-16 ISO646-PT csISO16 Португальский | ||
греческий7-старый | 44 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-18 csISO18Greek7Старый | ||
латинско-греческий | 45 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-19 csISO19 Латинский греческий | ||
NF_Z_62-010_ (1973) | 46 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-25 ISO646-FR1 csISO25 Французский | ||
Latin-greek-1 | 47 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-27 csISO27LatinGreek1 | ||
ISO_5427 | 48 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-37 csISO5427 Кириллица | ||
JIS_C6226-1978 | 49 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-42 csISO42JISC62261978 | ||
BS_viewdata | 50 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-47 csISO47BSViewdata | ||
INIS | 51 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-49 csISO49INIS | ||
ИНИС-8 | 52 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-50 csISO50INIS8 | ||
INIS-кириллица | 53 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-51 csISO51INIS Кириллица | ||
ISO_5427: 1981 | 54 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-54 ISO5427 Cyrillic1981 csISO54271981 | ||
ISO_5428: 1980 | 55 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-55 csISO5428 Греческий | ||
ГБ_1988-80 | 56 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-57 cn ISO646-CN csISO57GB1988 | ||
ГБ_2312-80 | 57 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-58 китайский csISO58GB231280 | ||
NS_4551-2 | 58 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | ISO646-NO2 iso-ir-61 no2 csISO61 Норвежский2 | ||
видеотекс-Suppl | 59 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-70 csISO70VideotexSupp1 | ||
PT2 | 60 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-84 ISO646-PT2 csISO84 Португальский2 | ||
ES2 | 61 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-85 ISO646-ES2 csISO85 Испанский3 | ||
MSZ_7795.3 | 62 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-86 ISO646-HU hu csISO86 Венгерский | ||
JIS_C6226-1983 | 63 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-87 x0208 JIS_X0208-1983 csISO87JISX0208 | ||
греческий7 | 64 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-88 csISO88 Греческий7 | ||
ASMO_449 | 65 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | ISO_9036 арабский7 iso-ir-89 csISO89ASMO449 | ||
iso-ir-90 | 66 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | csISO90 | ||
JIS_C6229-1984-a | 67 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-91 jp-ocr-a csISO91JISC622 | a||
JIS_C6229-1984-b | 68 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-92 ISO646-JP-OCR-B jp-ocr-b csISO92JISC629 | b||
JIS_C6229-1984-b-добавить | 69 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-93 jp-ocr-b-add csISO93JIS622 | badd||
JIS_C6229-1984-ручное | 70 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-94 jp-ocr-hand csISO94JIS622 | hand||
JIS_C6229-1984-вручную добавить | 71 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-95 jp-ocr-hand-add csISO95JIS622 | handadd||
JIS_C6229-1984-кана | 72 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-96 csISO96JISC622 | kana||
ISO_2033-1983 | 73 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-98 e13b csISO2033 | ||
ANSI_X3.110-1983 | 74 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-99 CSA_T500-1983 NAPLPS csISO99NAPLPS | ||
Т.61-7бит | 75 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-102 csISO102T617bit | ||
T.61-8bit | 76 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | T.61 iso-ir-103 csISO103T618bit | ||
ECMA-кириллица | 77 | [реестр ISO] | iso-ir-111 KOI8-E csISO111ECMACyrillic | |||
CSA_Z243.4-1985-1 | 78 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-121 ISO646-CA csa7-1 csa71 ca csISO121 Канадский1 | ||
CSA_Z243.4-1985-2 | 79 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-122 ISO646-CA2 csa7-2 csa72 csISO122 Канадский2 | ||
CSA_Z243.4-1985-гр | 80 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-123 csISO123CSAZ24341985gr | ||
ISO-8859-6-E | ISO_8859-6-E | 81 | [RFC1556] | [RFC1556] [IANA] | csISO88596E ISO-8859-6-E | |
ISO-8859-6-I | ISO_8859-6-I | 82 | [RFC1556] | [RFC1556] [IANA] | csISO88596I ISO-8859-6-I | |
Т.101-G2 | 83 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-128 csISO128T101G2 | ||
ISO-8859-8-E | ISO_8859-8-E | 84 | [RFC1556] | [RFC1556] [Hank_Nussbacher] | csISO88598E ISO-8859-8-E | |
ISO-8859-8-I | ISO_8859-8-I | 85 | [RFC1556] | [RFC1556] [Hank_Nussbacher] | csISO88598I ISO-8859-8-I | |
CSN_369103 | 86 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-139 csISO139CSN369103 | ||
JUS_I.B1.002 | 87 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-141 ISO646-YU js yu csISO141JUSIB1002 | ||
IEC_P27-1 | 88 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-143 csISO143IECP271 | ||
JUS_I.B1.003-serb | 89 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-146 сербский csISO146 сербский | ||
JUS_I.B1.003-mac | 90 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | македонский iso-ir-147 csISO147 македонский | ||
греческий-ccitt | 91 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-150 csISO150 csISO150 Греческий CCITT | ||
NC_NC00-10: 81 | 92 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | куба iso-ir-151 ISO646-CU csISO151Cuba | ||
ISO_6937-2-25 | 93 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-152 csISO6937Добавить | ||
GOST_19768-74 | 94 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | СТ_СЕВ_358-88 iso-ir-153 csISO153ГОСТ1976874 | ||
ISO_8859-supp | 95 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-154 latin1-2-5 csISO8859Supp | ||
ISO_10367-коробка | 96 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | iso-ir-155 csISO10367 Коробка | ||
латинский круг | 97 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | круг iso-ir-158 csISO158Lap | ||
JIS_X0212-1990 | 98 | [ISO-IR: Международный регистр последовательностей побегов] Примечание. В настоящее время регистрирующим органом является IPSJ / ITSCJ, Япония. | [RFC1345] [Keld_Simonsen] | x0212 iso-ir-159 csISO159JISX02121990 | ||
DS_2089 | 99 | Датский стандарт, DS 2089, февраль 1974 г. | [RFC1345] [Keld_Simonsen] | DS2089 ISO646-DK dk csISO646 Датский | ||
us-dk | 100 | [RFC1345] [Keld_Simonsen] | чешских кроны | долларов США|||
dk-us | 101 | [RFC1345] [Keld_Simonsen] | csDKUS | |||
KSC5636 | 102 | [RFC1345] [Keld_Simonsen] | ISO646-KR csKSC5636 | |||
UNICODE-1-1-UTF-7 | 103 | [RFC1642] | [RFC1642] | cs Юникод 11UTF7 | ||
ISO-2022-CN | 104 | [RFC1922] | [RFC1922] | csISO2022CN | ||
ISO-2022-CN-EXT | 105 | [RFC1922] | [RFC1922] | csISO2022CNEXT | ||
UTF-8 | 106 | [RFC3629] | [RFC3629] | csUTF8 | ||
ISO-8859-13 | 109 | ISO См. [Http: // www.iana.org/assignments/charset-reg/ISO-8859-13[Vladas_Tumasonis] | csISO885913 | |||
ISO-8859-14 | 110 | ISO См. [Http://www.iana.org/assignments/charset-reg/ISO-8859-14] [Keld_Simonsen_2] | iso-ir-199 ISO_8859-14: 1998 ISO_8859-14 latin8 iso-celtic l8 csISO885914 | |||
ISO-8859-15 | 111 | ISO См .: [http: // www.iana.org/assignments/charset-reg/ISO-8859-15] | ISO_8859-15 Latin-9 csISO885915 | |||
ISO-8859-16 | 112 | ISO | iso-ir-226 ISO_8859-16: 2001 ISO_8859-16 latin10 l10 csISO885916 | |||
ГБК | 113 | Китайский технический комитет по стандартизации информационных технологий См .: [http: // www.iana.org/assignments/charset-reg/GBK] | CP936 MS936 окна-936 csGBK | |||
ГБ18030 | 114 | Китайский технический комитет по стандартизации информационных технологий См .: [http://www.iana.org/assignments/charset-reg/GB18030] | csGB18030 | |||
OSD_EBCDIC_DF04_15 | 115 | Стандартное кодирование EBCDIC для мэйнфреймов Fujitsu-Siemens См .: [http: // www.iana.org/assignments/charset-reg/OSD-EBCDIC-DF04-15] | csOSDEBCDICDF0415 | |||
OSD_EBCDIC_DF03_IRV | 116 | Стандартное кодирование EBCDIC для мэйнфреймов Fujitsu-Siemens См .: [http://www.iana.org/assignments/charset-reg/OSD-EBCDIC-DF03-IRV] | csOSDEBCDICDF03IRV | |||
OSD_EBCDIC_DF04_1 | 117 | Стандартное кодирование EBCDIC для мэйнфреймов Fujitsu-Siemens См .: [http: // www.iana.org/assignments/charset-reg/OSD-EBCDIC-DF04-1] | csOSDEBCDICDF041 | |||
ISO-11548-1 | 118 | См. [Http://www.iana.org/assignments/charset-reg/ISO-11548-1] [Samuel_Thibault] | ISO_11548-1 ISO_TR_11548-1 csISO115481 | |||
KZ-1048 | 119 | См. [Http: // www.iana.org/assignments/charset-reg/KZ-1048] [Сайран_М_Киккарин] [Алексей_Веремеев] | STRK1048-2002 RK1048 csKZ1048 | |||
ISO-10646-UCS-2 | 1000 | 2-октетная базовая многоязычная плоскость, также известная как Unicode здесь необходимо указать сетевой порядок байтов: стандартный не указывает (это 16-битное целое число) | cs, юникод | |||
ISO-10646-UCS-4 | 1001 | полное пространство кода.(тот же комментарий о порядке байтов, это 31-битные числа. | csUCS4 | |||
ISO-10646-UCS-Basic | 1002 | ASCII подмножество Unicode. Базовая латынь = сборник 1 См. ISO 10646, Приложение A | cs Юникод ASCII | |||
ISO-10646-Unicode-Latin1 | 1003 | ISO Latin-1 подмножество Unicode.Базовая латынь и Latin-1 Дополнение = коллекции 1 и 2. См. ISO 10646, Приложение A. См. [RFC1815]. | cs Юникод Латинский 1 ISO-10646 | |||
ISO-10646-J-1 | 1004 | ISO 10646 Японский, см. [RFC1815]. | csUnicodeЯпонский | |||
ISO-Unicode-IBM-1261 | 1005 | IBM Latin-2, -3, -5, Расширенный набор презентаций, GCSGID: 1261 | cs ЮникодIBM1261 | |||
ISO-Unicode-IBM-1268 | 1006 | Расширенный набор презентаций IBM Latin-4, GCSGID: 1268 | cs ЮникодIBM1268 | |||
ISO-Unicode-IBM-1276 | 1007 | IBM Cyrillic Greek Extended Presentation Set, GCSGID: 1276 | cs ЮникодIBM1276 | |||
ISO-Unicode-IBM-1264 | 1008 | Набор для арабских презентаций IBM, GCSGID: 1264 | cs ЮникодIBM1264 | |||
ISO-Unicode-IBM-1265 | 1009 | IBM Hebrew Presentation Set, GCSGID: 1265 | cs ЮникодIBM1265 | |||
UNICODE-1-1 | 1010 | [RFC1641] | [RFC1641] | cs Юникод 11 | ||
SCSU | 1011 | SCSU См. [Http: // www.iana.org/assignments/charset-reg/SCSU] [Markus_Scherer] | csSCSU | |||
UTF-7 | 1012 | [RFC2152] | [RFC2152] | csUTF7 | ||
UTF-16BE | 1013 | [RFC2781] | [RFC2781] | csUTF16BE | ||
UTF-16LE | 1014 | [RFC2781] | [RFC2781] | csUTF16LE | ||
UTF-16 | 1015 | [RFC2781] | [RFC2781] | csUTF16 | ||
ЦЭСУ-8 | 1016 | [http: // www.unicode.org/unicode/reports/tr26] | [Toby_Phipps] | csCESU8 csCESU-8 | ||
UTF-32 | 1017 | [http://www.unicode.org/unicode/reports/tr19/] | [Mark_Davis] | csUTF32 | ||
UTF-32BE | 1018 | [http: // www.unicode.org/unicode/reports/tr19/] | [Mark_Davis] | csUTF32BE | ||
UTF-32LE | 1019 | [http://www.unicode.org/unicode/reports/tr19/] | [Mark_Davis] | csUTF32LE | ||
BOCU-1 | 1020 | [http: // www.unicode.org/notes/tn6/] | [Markus_Scherer] | csBOCU1 csBOCU-1 | ||
UTF-7-IMAP | 1021 | Примечание. Эта кодировка используется для кодирования Unicode в именах почтовых ящиков IMAP; см. раздел 5.1.3 [RFC3501]. Никогда не следует использовать вне этого контекста. Было назначено имя, чтобы обработка кодировки реализации могут ссылаться на него согласованным образом. | [Florian_Weimer] | csUTF7IMAP | ||
ISO-8859-1-Windows-3.0-Latin-1 | 2000 | Расширенный ISO 8859-1 Latin-1 для Windows 3.0. Идентификатор набора символов PCL: 9U | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | csWindows30Latin1 | ||
ISO-8859-1-Окна-3.1-Latin-1 | 2001 | Extended ISO 8859-1 Latin-1 для Windows 3.1. Идентификатор набора символов PCL: 19U | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | csWindows31Latin1 | ||
ISO-8859-2-Windows-Latin-2 | 2002 | Расширенный ISO 8859-2. Latin-2 для Windows 3.1. Идентификатор набора символов PCL: 9E | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | csWindows31Latin2 | ||
ISO-8859-9-Windows-Latin-5 | 2003 | Расширенный ISO 8859-9. Latin-5 для Windows 3.1 Идентификатор набора символов PCL: 5T | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | csWindows31Latin5 | ||
л.с.-Роман8 | 2004 | Руководство пользователя принтераLaserJet IIP, Номер детали HP 33471-, Hewlet-Packard, июнь 1989 г. | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] [RFC1345] [Keld_Simonsen] | roman8 r8 csHPRoman8 | ||
Стандартное кодирование Adobe | 2005 | Справочное руководство по языку PostScriptИдентификатор набора символов PCL: 10J | [Adobe Systems Incorporated, Справочник по языку PostScript Руководство, второе издание, издательство Addison-Wesley Publishing Company, Inc., 1990.] | Кодированиеcs AdobeStandardEncoding | ||
Вентура-США | 2006 | Ventura US. ASCII плюс символы, обычно используемые в публикация, например, Pilcrow, авторское право, зарегистрированная, торговая марка, секция, кинжал и двойной кинжал в диапазоне A0 (шестнадцатеричный) в FF (шестнадцатеричный). Идентификатор набора символов PCL: 14J | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | csVenturaUS | ||
Вентура-Интернэшнл | 2007 | Ventura International. ASCII плюс кодированные символы, похожие к Роману 8. Идентификатор набора символов PCL: 13J | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | csVentura Международный | ||
DEC-MCS | 2008 | VAX / VMS Руководство пользователя, Номер заказа: AI-Y517A-TE, апрель 1986 г. | [RFC1345] [Keld_Simonsen] | дек 9 1272 cs DECMCS | ||
IBM850 | 2009 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp850 850 csPC850 Многоязычный | ||
PC8-датско-норвежский | 2012 | PC датский норвежский 8-битный компьютер для датского норвежского языка Идентификатор набора символов PCL: 11U | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | csPC8 Датский Норвежский | ||
IBM862 | 2013 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp862 862 csPC862 Латинский Иврит | ||
PC8-Турецкий | 2014 | ПК Латинский Турецкий.Идентификатор набора символов PCL: 9T | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | csPC8 Турецкий | ||
Символы IBM | 2015 | Набор для презентаций, CPGID: 259 | [IBM Corporation, «О ТИПЕ: Технический справочник IBM для Core Interchange Digitized Type », номер публикации S544-3708-01] | csIBMS Символы | ||
IBM-тайский | 2016 | Набор для презентаций, CPGID: 838 | [IBM Corporation, «О ТИПЕ: Технический справочник IBM для Core Interchange Digitized Type », номер публикации S544-3708-01] | csIBM Тайский | ||
HP-Legal | 2017 | PCL 5 Сравнительное руководство, Hewlett-Packard, Номер детали HP 5961-0510, октябрь 1992 г. Идентификатор набора символов PCL: 1U | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | csHPLegal | ||
HP-Pi-font | 2018 | PCL 5 Сравнительное руководство, Hewlett-Packard, Номер детали HP 5961-0510, октябрь 1992 г. Идентификатор набора символов PCL: 15U | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | csHPPiFont | ||
HP-Math8 | 2019 | PCL 5 Сравнительное руководство, Hewlett-Packard, Номер детали HP 5961-0510, октябрь 1992 г. Идентификатор набора символов PCL: 8M | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | csHPMath8 | ||
Adobe-Symbol-Кодирование | 2020 | Справочное руководство по языку PostScriptИдентификатор набора символов PCL: 5M | [Adobe Systems Incorporated, Справочник по языку PostScript Руководство, второе издание, издательство Addison-Wesley Publishing Company, Inc., 1990.] | csHPPSMath | ||
Стол HP-DeskTop | 2021 | PCL 5 Сравнительное руководство, Hewlett-Packard, Номер детали HP 5961-0510, октябрь 1992 г. Идентификатор набора символов PCL: 7J | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | csHPНастольный компьютер | ||
Вентура-Математика | 2022 | PCL 5 Сравнительное руководство, Hewlett-Packard, Номер детали HP 5961-0510, октябрь 1992 г. Идентификатор набора символов PCL: 6M | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | csVenturaMath | ||
Издательство Microsoft | 2023 | PCL 5 Сравнительное руководство, Hewlett-Packard, Номер детали HP 5961-0510, октябрь 1992 г. Идентификатор набора символов PCL: 6J | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | Корпорация Майкрософтcs | ||
Окна-31J | 2024 | Windows японская. Дальнейшее расширение Shift_JIS для включения специальных символов NEC (строка 13), NEC выбор расширений IBM (строки с 89 по 92) и IBM разгибания (ряды с 115 по 119). CCS являются JIS X0201: 1997, JIS X0208: 1997 и эти расширения. Эта кодировка может использоваться для типа мультимедиа верхнего уровня «текст», но он имеет ограниченное или специализированное использование (см. [RFC2278]).Идентификатор набора символов PCL: 19K | cs Windows 31J | |||
ГБ 2312 | ГБ 2312 | 2025 | китайский язык для Китайской Народной Республики (КНР) смешанный один байт, двухбайтовый набор: 20-7E = один байт ASCII A1-FE = двухбайтовый кандзи PRC См. GB 2312-80 Идентификатор набора символов PCL: 18C | csGB2312 | ||
Большой5 | Большой5 | 2026 | Китайский для Тайваня Многобайтовый набор.Идентификатор набора символов PCL: 18T | csBig5 | ||
Macintosh | 2027 | Стандарт Unicode версии 1.0, ISBN 0-201-56788-1, октябрь 1991 г. | [RFC1345] [Keld_Simonsen] | Макинтош cs | ||
IBM037 | 2028 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp037 ebcdic-cp-us ebcdic-cp-ca ebcdic-cp-wt ebcdic-cp-nl csIBM037 | ||
IBM038 | 2029 | IBM 3174 Character Set Ref, GA27-3831-02, март 1990 г. | [RFC1345] [Keld_Simonsen] | EBCDIC-INT cp038 csIBM038 | ||
IBM273 | 2030 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | CP273 csIBM273 | ||
IBM274 | 2031 | IBM 3174 Character Set Ref, GA27-3831-02, март 1990 г. | [RFC1345] [Keld_Simonsen] | EBCDIC-BE CP274 csIBM274 | ||
IBM275 | 2032 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | EBCDIC-BR cp275 csIBM275 | ||
IBM277 | 2033 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | EBCDIC-CP-DK EBCDIC-CP-NO csIBM277 | ||
IBM278 | 2034 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | CP278 ebcdic-cp-fi ebcdic-cp-se csIBM278 | ||
IBM280 | 2035 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | CP280 ebcdic-cp-it csIBM280 | ||
IBM281 | 2036 | IBM 3174 Character Set Ref, GA27-3831-02, март 1990 г. | [RFC1345] [Keld_Simonsen] | EBCDIC-JP-E cp281 csIBM281 | ||
IBM284 | 2037 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | CP284 ebcdic-cp-es csIBM284 | ||
IBM285 | 2038 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | CP285 ebcdic-cp-gb csIBM285 | ||
IBM290 | 2039 | IBM 3174 Набор символов Ref, GA27-3831-02, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp290 EBCDIC-JP-kana csIBM290 | ||
IBM297 | 2040 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp297 ebcdic-cp-fr csIBM297 | ||
IBM420 | 2041 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г., IBM NLS RM стр. 11-11 | [RFC1345] [Keld_Simonsen] | cp420 ebcdic-cp-ar1 csIBM420 | ||
IBM423 | 2042 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp423 ebcdic-cp-gr csIBM423 | ||
IBM424 | 2043 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp424 ebcdic-cp-he csIBM424 | ||
IBM437 | 2011 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp437 437 csPC8CodePage437 | ||
IBM500 | 2044 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | CP500 ebcdic-cp-be ebcdic-cp-ch csIBM500 | ||
IBM851 | 2045 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp851 851 csIBM851 | ||
IBM852 | 2010 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp852 852 csPCp852 | ||
IBM855 | 2046 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp855 855 csIBM855 | ||
IBM857 | 2047 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp857 857 csIBM857 | ||
IBM860 | 2048 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp860 860 csIBM860 | ||
IBM861 | 2049 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp861 861 cp-is csIBM861 | ||
IBM863 | 2050 | Раскладки клавиатуры и кодовые страницы IBM, номер детали 07G4586 июнь 1991 | [RFC1345] [Keld_Simonsen] | cp863 863 csIBM863 | ||
IBM864 | 2051 | Раскладки клавиатуры и кодовые страницы IBM, номер по каталогу 07G4586 июнь 1991 | [RFC1345] [Keld_Simonsen] | cp864 csIBM864 | ||
IBM865 | 2052 | IBM DOS 3.3 Ссылка (сокращенная), 94X9575 (февраль 1987 г.) | [RFC1345] [Keld_Simonsen] | cp865 865 csIBM865 | ||
IBM868 | 2053 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | CP868 cp-ar csIBM868 | ||
IBM869 | 2054 | Раскладки клавиатуры и кодовые страницы IBM, номер по каталогу 07G4586 июнь 1991 | [RFC1345] [Keld_Simonsen] | cp869 869 cp-gr csIBM869 | ||
IBM870 | 2055 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | CP870 ebcdic-cp-roece ebcdic-cp-yu csIBM870 | ||
IBM871 | 2056 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | CP871 ebcdic-cp-is csIBM871 | ||
IBM880 | 2057 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp880 EBCDIC-кириллица csIBM880 | ||
IBM891 | 2058 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp891 csIBM891 | ||
IBM903 | 2059 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp903 csIBM903 | ||
IBM904 | 2060 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | cp904 904 csIBBM904 | ||
IBM905 | 2061 | IBM 3174 Набор символов Ref, GA27-3831-02, март 1990 г. | [RFC1345] [Keld_Simonsen] | CP905 ebcdic-cp-tr csIBM905 | ||
IBM918 | 2062 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | CP918 ebcdic-cp-ar2 csIBM918 | ||
IBM1026 | 2063 | IBM NLS RM Vol2 SE09-8002-01, март 1990 г. | [RFC1345] [Keld_Simonsen] | CP1026 csIBM1026 | ||
EBCDIC-AT-DE | 2064 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csIBMEBCDICATDE | ||
EBCDIC-AT-DE-A | 2065 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csEBCDICATDEA | ||
EBCDIC-CA-FR | 2066 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csEBCDICCAFR | ||
EBCDIC-DK-NO | 2067 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csEBCDICDKNO | ||
EBCDIC-DK-NO-A | 2068 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csEBCDICDKNOA | ||
EBCDIC-FI-SE | 2069 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csEBCDICFISE | ||
EBCDIC-FI-SE-A | 2070 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csEBCDICFISEA | ||
EBCDIC-FR | 2071 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csEBCDICFR | ||
EBCDIC-IT | 2072 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csEBCDICIT | ||
EBCDIC-PT | 2073 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csEBCDICPT | ||
EBCDIC-ES | 2074 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csEBCDICES | ||
EBCDIC-ES-A | 2075 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csEBCDICESA | ||
EBCDIC-ES-S | 2076 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csEBCDICESS | ||
EBCDIC-UK | 2077 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csEBCDICUK | ||
EBCDIC-US | 2078 | IBM 3270 Char Set Ref Ch 10, GA27-2837-9, апрель 1987 г. | [RFC1345] [Keld_Simonsen] | csEBCDICUS | ||
НЕИЗВЕСТНО-8BIT | 2079 | [RFC1428] | csНеизвестно 8BiT | |||
MNEMONIC | 2080 | [RFC1345], также известный как «мнемонический + ascii + 38» | [RFC1345] [Keld_Simonsen] | cs Мнемоника | ||
MNEM | 2081 | [RFC1345], также известный как «мнемонический + ascii + 8200» | [RFC1345] [Keld_Simonsen] | csMnem | ||
VISCII | 2082 | [RFC1456] | [RFC1456] | csVISCII | ||
VIQR | 2083 | [RFC1456] | [RFC1456] | csVIQR | ||
КОИ8-Р | КОИ8-Р | 2084 | [RFC1489], на основе ГОСТ-19768-74, ISO-6937/8, INIS-Cyrillic, ISO-5427. | [RFC1489] | csKOI8R | |
Гц-ГБ-2312 | 2085 | [RFC1842], [RFC1843] [RFC1843] [RFC1842] | ||||
IBM866 | 2086 | IBM NLDG, том 2 (SE09-8002-03), август 1994 г. | [Rick_Pond] | cp866 866 csIBM866 | ||
IBM775 | 2087 | HP PCL 5 Сравнительное руководство (P / N 5021-0329), стр. B-13, 1996 | [Компания Hewlett-Packard, «Сравнительное руководство HP PCL 5», (P / N 5021-0329) pp B-13, 1996.] | cp775 csPC775 Балтик | ||
КОИ8-У | 2088 | [RFC2319] | [RFC2319] | csKOI8U | ||
IBM00858 | 2089 | IBM См. [Http://www.iana.org/assignments/charset-reg/IBM00858] [Tamer_Mahdi] | CCSID00858 CP00858 PC-Multilingual-850 + евро csIBM00858 | |||
IBM00924 | 2090 | IBM См. [Http: // www.iana.org/assignments/charset-reg/IBM00924] [Tamer_Mahdi] | CCSID00924 CP00924 ebcdic-Latin9 — евро csIBM00924 | |||
IBM01140 | 2091 | IBM См. [Http://www.iana.org/assignments/charset-reg/IBM01140] [Tamer_Mahdi] | CCSID01140 CP01140 ebcdic-us-37 + евро csIBM01140 | |||
IBM01141 | 2092 | IBM См. [Http: // www.iana.org/assignments/charset-reg/IBM01141] [Tamer_Mahdi] | CCSID01141 CP01141 ebcdic-de-273 + евро csIBM01141 | |||
IBM01142 | 2093 | IBM См. [Http://www.iana.org/assignments/charset-reg/IBM01142] [Tamer_Mahdi] | CCSID01142 CP01142 ebcdic-dk-277 + евро ebcdic-no-277 + евро csIBM01142 | |||
IBM01143 | 2094 | IBM См. [Http: // www.iana.org/assignments/charset-reg/IBM01143] [Tamer_Mahdi] | CCSID01143 CP01143 ebcdic-fi-278 + евро ebcdic-se-278 + евро csIBM01143 | |||
IBM01144 | 2095 | IBM См. [Http://www.iana.org/assignments/charset-reg/IBM01144] [Tamer_Mahdi] | CCSID01144 CP01144 ebcdic-it-280 + евро csIBM01144 | |||
IBM01145 | 2096 | IBM См. [Http: // www.iana.org/assignments/charset-reg/IBM01145] [Tamer_Mahdi] | CCSID01145 CP01145 ebcdic-es-284 + евро csIBM01145 | |||
IBM01146 | 2097 | IBM См. [Http://www.iana.org/assignments/charset-reg/IBM01146] [Tamer_Mahdi] | CCSID01146 CP01146 ebcdic-gb-285 + евро csIBM01146 | |||
IBM01147 | 2098 | IBM См. [Http: // www.iana.org/assignments/charset-reg/IBM01147] [Tamer_Mahdi] | CCSID01147 CP01147 ebcdic-fr-297 + евро csIBM01147 | |||
IBM01148 | 2099 | IBM См. [Http://www.iana.org/assignments/charset-reg/IBM01148] [Tamer_Mahdi] | CCSID01148 CP01148 ebcdic-international-500 + евро csIBM01148 | |||
IBM01149 | 2100 | IBM См. [Http: // www.iana.org/assignments/charset-reg/IBM01149] [Tamer_Mahdi] | CCSID01149 CP01149 ebcdic-is-871 + евро csIBM01149 | |||
Big5-HKSCS | 2101 | См. [Http://www.iana.org/assignments/charset-reg/Big5-HKSCS] | [Nicky_Yick] | csBig5HKSCS | ||
IBM1047 | 2102 | IBM1047 (EBCDIC Latin 1 / Открытые системы) [http: // www-1.ibm.com/servers/eserver/iseries/software/globalization/pdf/cp01047z.pdf] | [Reuel_Robrigado] | IBM-1047 csIBM1047 | ||
PTCP154 | 2103 | См. [Http://www.iana.org/assignments/charset-reg/PTCP154] | [Александр_Усков] | csPTCP154 PT154 CP154 Кириллица-азиатская | ||
Амига-1251 | 2104 | См. [Http: // www.amiga.ultranet.ru/Amiga-1251.html] | Ami1251 Amiga1251 Ami-1251 csAmiga1251 (Псевдонимы указаны по историческим причинам и не должны использоваться) [Малышев] | |||
KOI7-переключенный | 2105 | См. [Http://www.iana.org/assignments/charset-reg/KOI7-switched] | csKOI7switched | |||
BRF | 2106 | См. [Http: // www.iana.org/assignments/charset-reg/BRF] [Samuel_Thibault] | CSBRF | |||
TSCII | 2107 | См. [Http://www.iana.org/assignments/charset-reg/TSCII] [Kuppuswamy_Kalyanasu] | csTSCII | |||
CP51932 | 2108 | См. [Http: // www.iana.org/assignments/charset-reg/CP51932] [Yui_Naruse] | csCP51932 | |||
окна-874 | 2109 | См. [Http://www.iana.org/assignments/charset-reg/windows-874] [Shawn_Steele] | cswindows874 | |||
окна-1250 | 2250 | Microsoft [http: // www.iana.org/assignments/charset-reg/windows-1250] [Катя_Лажинцева] | cswindows1250 | |||
окна-1251 | 2251 | Microsoft [http://www.iana.org/assignments/charset-reg/windows-1251] [Катя_Лажинцева] | cswindows1251 | |||
окна-1252 | 2252 | Microsoft [http: // www.iana.org/assignments/charset-reg/windows-1252] [Chris_Wendt] | cswindows1252 | |||
окна-1253 | 2253 | Microsoft [http://www.iana.org/assignments/charset-reg/windows-1253] [Катя_Лажинцева] | cswindows1253 | |||
окна-1254 | 2254 | Microsoft [http: // www.iana.org/assignments/charset-reg/windows-1254] [Катя_Лажинцева] | cswindows1254 | |||
окна-1255 | 2255 | Microsoft [http://www.iana.org/assignments/charset-reg/windows-1255] [Катя_Лажинцева] | cswindows1255 | |||
окна-1256 | 2256 | Microsoft [http: // www.iana.org/assignments/charset-reg/windows-1256] [Катя_Лажинцева] | cswindows1256 | |||
окна-1257 | 2257 | Microsoft [http://www.iana.org/assignments/charset-reg/windows-1257] [Катя_Лажинцева] | cswindows1257 | |||
окна-1258 | 2258 | Microsoft [http: // www.iana.org/assignments/charset-reg/windows-1258] [Катя_Лажинцева] | cswindows1258 | |||
ТИС-620 | 2259 | Тайский институт промышленных стандартов (TISI) [Trin_Tantsetthi] | csTIS620 ISO-8859-11 | |||
CP50220 | 2260 | См. [Http: // www.iana.org/assignments/charset-reg/CP50220] [Yui_Naruse] | csCP50220 |
Кодировка 101 — Часть 2: Windows-1252 и UTF-8
Продолжение с Кодировка 101 часть 1
Во второй части будут представлены две наиболее распространенные кодировки, используемые сегодня, и рассмотрены некоторые из их различий.
Различия между разными кодировками
Если бы в свое время вся ИТ-индустрия согласилась на единое кодирование, сейчас с этим было бы гораздо легче справиться.Тем не менее, это не так. На протяжении многих лет различные компании ставили перед собой задачу решить одну и ту же проблему: как представить текст в виде двоичных данных для хранения или передачи. В результате сегодня существует огромное количество систем кодирования. К сожалению, многие из них почти идентичны, что заставляет усомниться в необходимости их существования еще больше.
Многие современные кодировки основаны на кодировке ASCII, но расширяют ее, чтобы включить больше символов. Это означает, что текст, который содержит только символы, присутствующие в стандарте ASCII, часто также может быть декодирован как ASCII, даже если технически он закодирован с использованием другого стандарта.Это связано с тем, что многие более крупные кодировки по-прежнему используют те же коды, что и ASCII для первых 128 символов, но помимо этих символов эти схемы кодирования отличаются в большей или меньшей степени.
Давайте сравним две наиболее распространенные кодировки, используемые для западных языков, Windows-1252 и UTF-8.
Окна-1252
Это кодировка по умолчанию, используемая системами Windows в большинстве западных стран. Это означает, что текстовые данные, созданные программным обеспечением, работающим в таких системах по умолчанию, будут использовать кодировку Windows-1252, если явно не установлено использование другой кодировки.Некоторое программное обеспечение позволяет пользователю выбирать, какую кодировку использовать, некоторые настроены на использование определенной кодировки, а не по умолчанию, а некоторые оставляют это на усмотрение самой системы.
Windows-1252 — это однобайтовая кодировка, что означает, что каждый символ кодируется как однобайтный, так же, как и в ASCII. Однако, поскольку Windows-1252 использует полные 8 бит каждого байта для своих кодовых точек (в отличие от 7-битных кодов ASCII), она содержит 256 кодовых точек по сравнению с 128 ASCII. Первая половина кодовых точек идентична те, которые определены в ASCII, а вторая половина кодирует дополнительные символы, которых нет в наборе символов ASCII.
UTF-8
UTF-8 — это кодировка из стандарта Unicode. UTF означает формат преобразования Unicode, а цифра 8 в конце означает, что это 8-битная кодировка переменной. Это означает, что каждый символ использует не менее 8 бит для своей кодовой точки, но некоторые могут использовать больше. Как и в Windows-1252, первые 128 кодовых точек идентичны ASCII, но выше эти две кодировки значительно отличаются. В то время как Windows-1252 содержит всего 256 кодовых точек, UTF-8 имеет кодовые точки для всего набора символов Unicode.Это делается путем определения некоторых байтовых значений выше 127 в качестве префиксов для дальнейших байтовых значений. Например, символ авторского права (©) кодируется как C2 A9, а знак фунта (£) кодируется как C2 A3. Поскольку байт C2 разработан как байт префикса, это открывает дополнительные 256 2-байтовых кодовых точек с C2 в качестве первого байта.
Этот дизайн означает, что большинство общих символов, используемых в западных языках, занимают только один байт пространства, в то время как многобайтовые кодировки используются реже.В результате UTF-8 может кодировать любой символ, сохраняя при этом относительно небольшой размер данных. Это полезно как для постоянного хранения (файлы небольшого размера), так и для передачи (например, открытия веб-страницы). Из-за этого UTF-8 в настоящее время является наиболее доминирующей кодировкой, используемой во всемирной паутине, и по состоянию на сентябрь 2019 года на ее долю приходилось 94% всех веб-страниц.
Сравнение кодировок
Давайте посмотрим на конкретном примере того, как эти две кодировки отличаются друг от друга. Мы будем использовать слово «Naïveté», которое содержит два символа, отличных от ASCII (у него есть альтернативные варианты написания без них, но пример — это признанное допустимое написание слова на английском языке).
Как мы видим, символы ï и é существуют в обеих кодировках, но кодируются двумя разными способами. В Windows-1252 все символы кодируются с использованием одного байта, поэтому кодировка содержит всего 256 символов. Однако в UTF-8 эти два символа кодируются с использованием 2 байтов каждый. В результате слово занимает на два байта больше при использовании кодировки UTF-8, чем при использовании кодировки Windows-1252.
Итак, разные кодировки обрабатывают одни символы по-разному.В следующей и третьей частях этой серии блогов мы рассмотрим, как это может вызвать у нас проблемы. Найдите здесь «Кодировку 101 — часть 3».
C | Дек | Шестнадцатеричный | Октябрь | Двоичный | Сущность | Имя |
---|---|---|---|---|---|---|
160 | A0 | 240 | 10100000 | & nbs | Беспрерывное пространство | |
¡ | 161 | A1 | 241 | 10100001 | & iexcl; | Перевернутый восклицательный знак |
¢ | 162 | A2 | 242 | 10100010 | & cent; | Знак центов |
£ | 163 | A3 | 243 | 10100011 | & фунт; | Знак фунта |
¤ | 164 | A4 | 244 | 10100100 | & curren; | Знак валюты |
¥ | 165 | A5 | 245 | 10100101 | & йен; | Знак йены |
¦ | 166 | A6 | 246 | 10100110 | & brvbar; | Сломанный стержень |
§ | 167 | A7 | 247 | 10100111 | & sect; | Знак раздела |
¨ | 168 | A8 | 250 | 10101000 | & DoubleDot; | Диэрезис |
© | 169 | A9 | 251 | 10101001 | и копия; | Знак авторских прав |
ª | 170 | AA | 252 | 10101010 | & ordf; | Женский порядковый указатель |
« | 171 | AB | 253 | 10101011 | & laquo; | Двойные угловые кавычки, указывающие влево |
¬ | 172 | AC | 254 | 10101100 | & not; | Без знака |
173 | AD | 255 | 10101101 | & shy; | Мягкий перенос | |
® | 174 | AE | 256 | 10101110 | & reg; | Зарегистрированный знак |
¯ | 175 | AF | 257 | 10101111 | & macr; | Макрон |
° | 176 | B0 | 260 | 10110000 | & deg; | Знак градуса |
± | 177 | B1 | 261 | 10110001 | & plusmn; | Знак плюс-минус |
² | 178 | B2 | 262 | 10110010 | & sup2; | Верхний индекс два |
³ | 179 | B3 | 263 | 10110011 | & sup3; | Три надстрочных индекса |
´ | 180 | B4 | 264 | 10110100 | & DiacriticalAcute; | Острый акцент |
µ | 181 | B5 | 265 | 10110101 | & микро; | Микро знак |
¶ | 182 | B6 | 266 | 10110110 | и пара; | Знак Pilcrow |
· | 183 | B7 | 267 | 10110111 | & CenterDot; | Средняя точка |
¸ | 184 | B8 | 270 | 10111000 | & Cedilla; | Cedilla |
¹ | 185 | B9 | 271 | 10111001 | & sup1; | Верхний индекс один |
º | 186 | BA | 272 | 10111010 | & ordm; | Мужской порядковый указатель |
» | 187 | BB | 273 | 10111011 | & raquo; | Двойные угловые кавычки, указывающие вправо |
¼ | 188 | BC | 274 | 10111100 | & frac14; | Вульгарная фракция одна четверть |
½ | 189 | BD | 275 | 10111101 | & половина; | Вульгарная фракция, половина |
¾ | 190 | BE | 276 | 10111110 | & frac34; | Вульгарная фракция три четверти |
¿ | 191 | BF | 277 | 10111111 | & iquest; | Перевернутый вопросительный знак |
À | 192 | C0 | 300 | 11000000 | & Agrave; | Латинская заглавная буква A с могилой |
Á | 193 | C1 | 301 | 11000001 | & Aacute; | Заглавная латинская буква A с острым ударением |
 | 194 | C2 | 302 | 11000010 | & Acirc; | Заглавная латинская буква A с циркумфлексом |
à | 195 | C3 | 303 | 11000011 | & Atilde; | Заглавная латинская буква A с тильдой |
Ä | 196 | C4 | 304 | 11000100 | & Auml; | Заглавная латинская буква A с тремой |
Å | 197 | C5 | 305 | 11000101 | & Aring; | Заглавная латинская буква A с кольцом сверху |
Æ | 198 | C6 | 306 | 11000110 | & AElig; | Заглавная латинская буква AE |
Ç | 199 | C7 | 307 | 11000111 | & Ccedil; | Заглавная латинская буква C с седилем |
È | 200 | C8 | 310 | 11001000 | & Egrave; | Латинская заглавная буква E с могилой |
É | 201 | C9 | 311 | 11001001 | & Eacute; | Заглавная латинская буква E с острым ударением |
Ê | 202 | CA | 312 | 11001010 | & Ecirc; | Заглавная латинская буква E с циркумфлексом |
Ë | 203 | CB | 313 | 11001011 | & Euml; | Заглавная латинская буква E с тремой |
Ì | 204 | CC | 314 | 11001100 | & Igrave; | Латинская заглавная буква I с могилой |
Í | 205 | CD | 315 | 11001101 | & Iacute; | Заглавная латинская буква I с острым ударением |
Î | 206 | CE | 316 | 11001110 | & Icirc; | Заглавная латинская буква I с циркумфлексом |
Ï | 207 | CF | 317 | 11001111 | & Iuml; | Заглавная латинская буква I с тремой |
ì | 208 | D0 | 320 | 11010000 | & ETH; | Заглавная латинская буква Eth |
Ñ | 209 | D1 | 321 | 11010001 | & Ntilde; | Заглавная латинская буква N с тильдой |
Ò | 210 | D2 | 322 | 11010010 | & Огрейв; | Латинская заглавная буква O с могилой |
Ó | 211 | D3 | 323 | 11010011 | & Oacute; | Заглавная латинская буква O с острым ударением |
Ô | 212 | D4 | 324 | 11010100 | & Ocirc; | Заглавная латинская буква O с циркумфлексом |
Õ | 213 | D5 | 325 | 11010101 | & Otilde; | Заглавная латинская буква O с тильдой |
Ö | 214 | D6 | 326 | 11010110 | & Ouml; | Заглавная латинская буква O с тремой |
× | 215 | D7 | 327 | 11010111 | & раз; | Знак умножения |
Ø | 216 | D8 | 330 | 11011000 | & Oslash; | Заглавная латинская буква O со штрихом |
Ù | 217 | D9 | 331 | 11011001 | & Ugrave; | Латинская заглавная буква U с могилой |
Ú | 218 | DA | 332 | 11011010 | & Uacute; | Латинская заглавная буква U с острым ударением |
Û | 219 | DB | 333 | 11011011 | & Ucirc; | Заглавная латинская буква U с циркумфлексом |
Ü | 220 | DC | 334 | 11011100 | & Uuml; | Заглавная латинская буква U с тремой |
Ý | 221 | DD | 335 | 11011101 | & Yacute; | Заглавная латинская буква Y с острым ударением |
Þ | 222 | DE | 336 | 11011110 | & THORN; | Заглавная латинская буква Thorn |
ß | 223 | DF | 337 | 11011111 | & szlig; | Строчная латинская буква с острым концом s |
à | 224 | E0 | 340 | 11100000 | & agrave; | Строчная латинская буква а с тупиком |
á | 225 | E1 | 341 | 11100001 | & aacute; | Строчная латинская буква а с острым ударением |
â | 226 | E2 | 342 | 11100010 | & acirc; | Строчная латинская буква a с циркумфлексом |
ã | 227 | E3 | 343 | 11100011 | & atilde; | Строчная латинская буква a с тильдой |
ä | 228 | E4 | 344 | 11100100 | & auml; | Строчная латинская буква а с тремой |
å | 229 | E5 | 345 | 11100101 | & aring; | Строчная латинская буква a с кольцом сверху |
æ | 230 | E6 | 346 | 11100110 | & aelig; | Строчная латинская буква ae |
ç | 231 | E7 | 347 | 11100111 | & ccedil; | Строчная латинская буква c с седилем |
è | 232 | E8 | 350 | 11101000 | & egrave; | Строчная латинская буква е с тупым ударением |
é | 233 | E9 | 351 | 11101001 | & eacute; | Строчная латинская буква e с острым ударением |
ê | 234 | EA | 352 | 11101010 | & ecirc; | Строчная латинская буква e с циркумфлексом |
ë | 235 | EB | 353 | 11101011 | & euml; | Строчная латинская буква e с тремой |
ì | 236 | EC | 354 | 11101100 | & igrave; | Строчная латинская буква i с могилой |
í | 237 | ED | 355 | 11101101 | & iacute; | Строчная латинская буква i с острым ударением |
î | 238 | EE | 356 | 11101110 | & icirc; | Строчная латинская буква i с циркумфлексом |
ï | 239 | EF | 357 | 11101111 | & iuml; | Строчная латинская буква i с тремой |
ð | 240 | F0 | 360 | 11110000 | & eth; | Строчная латинская буква eth |
ñ | 241 | F1 | 361 | 11110001 | & ntilde; | Строчная латинская буква n с тильдой |
ò | 242 | F2 | 362 | 11110010 | & ograve; | Строчная латинская буква o с могилой |
ó | 243 | F3 | 363 | 11110011 | & oacute; | Строчная латинская буква o с острым ударением |
ô | 244 | F4 | 364 | 11110100 | & ocirc; | Строчная латинская буква o с циркумфлексом |
х | 245 | F5 | 365 | 11110101 | & otilde; | Строчная латинская буква o с тильдой |
ö | 246 | F6 | 366 | 11110110 | & ouml; | Строчная латинская буква o с тремой |
÷ | 247 | F7 | 367 | 11110111 | & div; | Знак деления |
ø | 248 | F8 | 370 | 11111000 | & oslash; | Строчная латинская буква o со штрихом |
ù | 249 | F9 | 371 | 11111001 | & ugrave; | Строчная латинская буква u с могилой |
ú | 250 | FA | 372 | 11111010 | & uacute; | Строчная латинская буква u с острым ударением |
û | 251 | FB | 373 | 11111011 | & ucirc; | Строчная латинская буква u с циркумфлексом |
ü | 252 | FC | 374 | 11111100 | & uuml; | Строчная латинская буква u с тремой |
ý | 253 | FD | 375 | 11111101 | & yacute; | Строчная латинская буква y с острым ударением |
þ | 254 | FE | 376 | 11111110 | & thorn; | Строчная латинская буква шип |
ÿ | 255 | FF | 377 | 11111111 | & yuml; | Строчная латинская буква y с тремой |