Таблица кодов символов Windows-1251
Windows-1251 — набор символов и кодировка, являющаяся стандартной 8-битной кодировкой для всех русских версий Microsoft Windows. Данная кодировка пользуется довольно большой популярностью в восточно-европейских странах. Windows-1251 выгодно отличается от других 8-битных кириллических кодировок (таких как CP866, KOI8-R и ISO 8859-5) наличием практически всех символов, использующихся в традиционной русской типографике для обычного текста (отсутствует только знак ударения). Кириллические символы идут в алфавитном порядке.
Windows-1251 также содержит все символы для близких к русскому языку языков: белорусского, украинского, сербского, македонского и болгарского.
На практике этого оказалось достаточно, чтобы кодировка Windows-1251 закрепилась в интернете вплоть до распространения UTF-8.
Dec | Hex | Символ | Dec | Hex | Символ | |
---|---|---|---|---|---|---|
000 | 00 | NOP | 128 | 80 | Ђ | |
001 | 01 | SOH | 129 | 81 | Ѓ | |
002 | 02 | STX | 130 | 82 | ‚ | |
003 | 03 | ETX | 131 | 83 | ѓ | |
004 | 04 | EOT | 132 | 84 | „ | |
005 | 05 | ENQ | 133 | 85 | … | |
006 | 06 | ACK | 134 | 86 | † | |
007 | 07 | BEL | 135 | 87 | ‡ | |
008 | 08 | BS | 136 | 88 | € | |
009 | 09 | TAB | 137 | 89 | ‰ | |
010 | 0A | LF | 138 | 8A | Љ | |
011 | 0B | VT | 139 | 8B | ‹ | |
012 | 0C | FF | 140 | 8C | Њ | |
013 | 0D | CR | 141 | 8D | Ќ | |
014 | 0E | SO | 142 | 8E | Ћ | |
015 | 0F | SI | 143 | 8F | Џ | |
016 | 10 | DLE | 144 | 90 | ђ | |
017 | 11 | DC1 | 145 | 91 | ‘ | |
018 | 12 | DC2 | 146 | 92 | ’ | |
13 | DC3 | 147 | 93 | “ | ||
020 | 14 | DC4 | 148 | 94 | ” | |
021 | 15 | NAK | 149 | 95 | • | |
022 | 16 | SYN | 150 | 96 | – | |
023 | 17 | ETB | 151 | 97 | — | |
024 | 18 | CAN | 152 | 98 | ||
025 | 19 | EM | 153 | 99 | ™ | |
026 | 1A | SUB | 154 | 9A | љ | |
027 | 1B | ESC | 155 | 9B | › | |
028 | 1C | FS | 156 | 9C | њ | |
029 | 1D | GS | 157 | 9D | ќ | |
030 | 1E | RS | 158 | 9E | ћ | |
031 | 1F | US | 159 | 9F | џ | |
032 | 20 | SP | 160 | A0 | ||
033 | 21 | ! | 161 | A1 | Ў | |
034 | 22 | « | 162 | A2 | ў | |
035 | 23 | # | 163 | A3 | Ћ | |
036 | 24 | $ | 164 | A4 | ¤ | |
037 | 25 | % | 165 | A5 | Ґ | |
038 | 26 | & | 166 | A6 | ¦ | |
039 | 27 | ‘ | 167 | A7 | § | |
040 | 28 | ( | 168 | A8 | Ё | |
041 | 29 | ) | 169 | A9 | © | |
042 | 2A | * | 170 | AA | Є | |
043 | 2B | + | 171 | AB | « | |
044 | 2C | , | 172 | AC | ¬ | |
045 | 2D | — | 173 | AD | | |
046 | 2E | . | 174 | AE | ® | |
047 | 2F | / | 175 | AF | Ї | |
048 | 30 | 0 | 176 | B0 | ° | |
049 | 31 | 1 | 177 | B1 | ± | |
050 | 32 | 2 | 178 | B2 | І | |
051 | 33 | 3 | 179 | B3 | і | |
052 | 34 | 4 | 180 | B4 | ґ | |
053 | 35 | 5 | 181 | B5 | µ | |
054 | 36 | 6 | 182 | B6 | ¶ | |
055 | 37 | 7 | 183 | B7 | · | |
056 | 38 | 8 | 184 | B8 | ё | |
057 | 39 | 9 | 185 | B9 | № | |
058 | 3A | : | 186 | BA | є | |
059 | 3B | ; | 187 | BB | » | |
060 | 3C | < | 188 | BC | ј | |
061 | 3D | = | 189 | BD | Ѕ | |
062 | 3E | > | 190 | BE | ѕ | |
063 | 3F | ? | 191 | BF | ї | |
064 | 40 | @ | 192 | C0 | А | |
065 | 41 | A | 193 | C1 | Б | |
066 | 42 | B | 194 | C2 | В | |
067 | 43 | C | 195 | C3 | Г | |
068 | 44 | D | 196 | C4 | Д | |
069 | 45 | E | 197 | C5 | Е | |
070 | 46 | F | 198 | C6 | Ж | |
071 | 47 | G | 199 | C7 | З | |
072 | 48 | H | 200 | C8 | И | |
073 | 49 | I | 201 | C9 | Й | |
074 | 4A | J | 202 | CA | К | |
075 | 4B | K | 203 | CB | Л | |
076 | 4C | L | 204 | CC | М | |
077 | 4D | M | 205 | CD | Н | |
078 | 4E | N | 206 | CE | О | |
079 | 4F | O | 207 | CF | П | |
080 | 50 | P | 208 | D0 | Р | |
081 | 51 | Q | 209 | D1 | С | |
082 | 52 | R | 210 | D2 | Т | |
083 | 53 | S | 211 | D3 | У | |
084 | 54 | T | 212 | D4 | Ф | |
085 | 55 | U | 213 | D5 | Х | |
086 | 56 | V | 214 | D6 | Ц | |
087 | 57 | W | 215 | D7 | Ч | |
088 | 58 | X | 216 | D8 | Ш | |
089 | 59 | Y | 217 | D9 | Щ | |
090 | 5A | Z | 218 | DA | Ъ | |
091 | 5B | [ | 219 | DB | Ы | |
092 | 5C | \ | 220 | DC | Ь | |
093 | 5D | ] | 221 | DD | Э | |
094 | 5E | ^ | 222 | DE | Ю | |
095 | 5F | _ | 223 | DF | Я | |
096 | 60 | ` | 224 | E0 | а | |
097 | 61 | a | 225 | E1 | б | |
098 | 62 | b | 226 | E2 | в | |
099 | 63 | c | 227 | E3 | г | |
100 | 64 | d | 228 | E4 | д | |
101 | 65 | e | 229 | E5 | е | |
102 | 66 | f | 230 | E6 | ж | |
103 | 67 | g | 231 | E7 | з | |
104 | 68 | h | 232 | E8 | и | |
105 | 69 | i | 233 | E9 | й | |
106 | 6A | j | 234 | EA | к | |
107 | 6B | k | 235 | EB | л | |
108 | 6C | l | 236 | EC | м | |
109 | 6D | m | 237 | ED | н | |
110 | 6E | n | 238 | EE | о | |
111 | 6F | o | 239 | EF | п | |
112 | 70 | p | 240 | F0 | р | |
113 | 71 | q | 241 | F1 | с | |
114 | 72 | r | 242 | F2 | т | |
115 | 73 | s | 243 | F3 | у | |
116 | 74 | t | 244 | F4 | ф | |
117 | 75 | u | 245 | F5 | х | |
118 | 76 | v | 246 | F6 | ц | |
119 | 77 | w | 247 | F7 | ч | |
120 | 78 | x | 248 | F8 | ш | |
121 | 79 | y | 249 | F9 | щ | |
122 | 7A | z | 250 | FA | ъ | |
123 | 7B | { | 251 | FB | ы | |
124 | 7C | | | 252 | FC | ь | |
125 | 7D | } | 253 | FD | э | |
126 | 7E | ~ | 254 | FE | ю | |
127 | 7F | DEL | 255 | FF | я |
Описание специальных (управляющих) символов
Первоначально управляющие символы таблицы ASCII (диапазон 00-31, плюс 127) были разработаны для того, чтобы управлять устройствами аппаратных средств, таких как телетайп, ввод данных на перфоленту и др.
Управляющие символы (кроме горизонтальной табуляции, перевода строки и возврата каретки) не используются в HTML-документах.
Код | Описание |
---|---|
NUL, 00 | Null, пустой |
SOH, 01 | Start Of Heading, начало заголовка |
STX, 02 | Start of TeXt, начало текста |
ETX, 03 | End of TeXt, конец текста |
EOT, 04 | End of Transmission, конец передачи |
ENQ, 05 | Enquire. Прошу подтверждения |
ACK, 06 | Acknowledgement. Подтверждаю |
BEL, 07 | Bell, звонок |
BS, 08 | Backspace, возврат на один символ назад |
TAB, 09 | Tab, горизонтальная табуляция |
LF, 0A | Line Feed, перевод строки Сейчас в большинстве языков программирования обозначается как \n |
VT, 0B | Vertical Tab, вертикальная табуляция |
FF, 0C | Form Feed, прогон страницы, новая страница |
CR, 0D | Carriage Return, возврат каретки Сейчас в большинстве языков программирования обозначается как \r |
SO, 0E | Shift Out, изменить цвет красящей ленты в печатающем устройстве |
SI, 0F | Shift In, вернуть цвет красящей ленты в печатающем устройстве обратно |
DLE, 10 | Data Link Escape, переключение канала на передачу данных |
DC1, 11 DC2, 12 DC3, 13 DC4, 14 | Device Control, символы управления устройствами |
NAK, 15 | Negative Acknowledgment, не подтверждаю |
SYN, 16 | Synchronization. Символ синхронизации |
ETB, 17 | End of Text Block, конец текстового блока |
CAN, 18 | Cancel, отмена переданного ранее |
EM, 19 | End of Medium, конец носителя данных |
SUB, 1A | Substitute, подставить. Ставится на месте символа, значение которого было потеряно или испорчено при передаче |
ESC, 1B | Escape Управляющая последовательность |
FS, 1C | File Separator, разделитель файлов |
GS, 1D | Group Separator, разделитель групп |
RS, 1E | Record Separator, разделитель записей |
US, 1F | Unit Separator, разделитель юнитов |
DEL, 7F | Delete, стереть последний символ. |
Смотрите также:
URL коды символов ACSII
URL коды символов UTF-8 диапазон от U+0400 до U+04FF
HTML Кодирование URL
Таблица кодов символов кирилицы UTF-8
за что отвечает и как работает – WindowsTips.
Ru. Новости и советыВ начале 90-х, когда произошел развал СССР и границы России были открыты, к нам стали поступать программные продукты западного производства. Естественно, все они были англоязычными. В это же время начинает развиваться Интернет. Остро встала проблема русификации ресурсов и программ. Тогда и была придумана русская кодировка Windows 1251. Она позволяет корректно отображать буквы славянских алфавитов:
- русского;
- украинского;
- белорусского;
- сербского;
- болгарского;
- македонского.
Разработка велась русским представительством Microsoft совместно с компаниями «Диалог» и «Параграф». За основу были взяты самописные разработки, которые в 1990-91гг имели хождение среди немногочисленных идеологов ИТ в России.
На сегодняшний день разработан более универсальный способ кодировать символы — UTF-8 (Юникод). В нем представлено почти 90% всех программных и веб-ресурсов. Windows 1251 применяется в 1,6% случаев. (Информация по исследованиям Web Technology Surveys)
Кодировка сайта utf 8 или Windows 1251?
Чтобы ответить на этот вопрос, необходимо немного понять, что такое кодировка и чем они отличаются. Текстовая информация, как впрочем, и любая другая, в компьютере хранится в закодированном виде. Нам легче представить ее как числа. Каждый символ может занимать один или более байт. Windows 1251 является однобайтной кодировкой, а UTF-8 восьмибайтной. Это значит, что в Windows 1251 можно закодировать всего 256 символов.
Так как все сводится к двоичной системе исчисления, а байт – это 8 бит (0 и 1), то и максимальное число сочетаний составляет 28 = 256. Юникод позволяет представлять куда большее число символов, да и на каждый может быть выделен больший размер.
Отсюда и следуют преимущества Юникода:
- В шапке сайта следует указать кодировку, которая используется. Иначе вместо символов отобразятся «кракозяблы». А Юникод является стандартным для всех браузеров – они ловят его «на лету» как установленный по умолчанию.
- Символы сайта останутся одними и теми же, независимо от того, в какой стране загружается ресурс. Это зависит не от географического расположения серверов, а от языка программного обеспечения рабочих станций клиента. Житель Португалии, очевидно, использует клавиатуру и все ПО, включая операционную систему, на родном языке. В его компьютере, скорее всего вообще отсутствует Windows 1251. А если это так, то и сайты на русском языке корректно открываться не будут. Юникод, в свою очередь, «зашит» в любую ОС на любом языке.
- UTF-8 позволяет закодировать большее количество символов. На данный момент используется 6 байт из 8-ми, а русские символы кодируются двумя байтами.
Именно поэтому предпочтительней использовать универсальную кодировку, а не узкоспециализированную, которая применяется только в славянских странах.
Таблица кодировки Windows 1251
Для программистов и разработчиков сайтов бывает необходимо знать номера символов. Для этого используются специальные таблицы кодировки. Ниже представлена таблица для Windows 1251.
Что делать, если слетела кодировка командной строки?
Иногда Вы можете столкнуться с ситуацией, когда в командной строке вместо русских отображаются непонятные символы. Это означает, что возникла проблема кодировки командной строки Windows 7. Почему 7-ка? Потому что, начиная с 8-й версии, используется UTF-8, а в семерке еще Windows 1251.
Единовременно помочь решить проблему может команда chcp 866. Текущий сеанс будет работать корректно. А вот чтобы исправить ошибку кардинально, понадобится реестр.
- Нажмите Win+R и наберите команду regedit. Это позволит попасть в редактор реестра.
- Перейдите по ветке HKEY_CURRENT_USER\Console и посмотрите, чему равно значение для CodePage. Скорее всего, вы увидите что-то, отличное от 866 (правильный вариант).
- Исправьте на 866 в положении «Десятичная».
- Закройте и откройте вновь командную строку. Ситуация должна исправиться.
Таблица Windows-1251
Windows-1251 (cp1251) — это стандартная 8-битная кодировка, разработанная компанией Microsoft. Она содержит практически все символы, которые Вы можете встретить на стандартной русской клавиатуре. Также 1251 имеет символы для таких языков, как белорусский, украинский, болгарский и сербский.
DEC | HEX | СИМВ | DEC | HEX | СИМВ | DEC | HEX | СИМВ |
000 | 00 | NOP | 086 | 56 | V | 171 | AB | « |
001 | 01 | SOH | 087 | 57 | W | 172 | AC | ¬ |
002 | 02 | STX | 088 | 58 | X | 173 | AD | |
003 | 03 | ETX | 089 | 59 | Y | 174 | AE | ® |
004 | 04 | EOT | 090 | 5A | Z | 175 | AF | Ї |
005 | 05 | ENQ | 091 | 5B | [ | 176 | B0 | ° |
006 | 06 | ACK | 092 | 5C | \ | 177 | B1 | ± |
007 | 07 | BEL | 093 | 5D | ] | 178 | B2 | І |
008 | 08 | BS | 094 | 5E | ^ | 179 | B3 | і |
009 | 09 | Табуляция | 095 | 5F | _ | 180 | B4 | ґ |
010 | 0A | LF | 096 | 60 | ` | 181 | B5 | µ |
011 | 0B | VT | 097 | 61 | a | 182 | B6 | ¶ |
012 | 0C | FF | 098 | 62 | b | 183 | B7 | · |
013 | 0D | CR | 099 | 63 | c | 184 | B8 | Ё |
014 | 0E | SO | 100 | 64 | d | 185 | B9 | № |
015 | 0F | SI | 101 | 65 | e | 186 | BA | Є |
016 | 10 | DLE | 102 | 66 | f | 187 | BB | » |
017 | 11 | DC1 | 103 | 67 | g | 188 | BC | ј |
018 | 12 | DC2 | 104 | 68 | h | 189 | BD | Ѕ |
019 | 13 | DC3 | 105 | 69 | i | 190 | BE | Ѕ |
020 | 14 | DC4 | 106 | 6A | j | 191 | BF | Ї |
021 | 15 | NAK | 107 | 6B | k | 192 | C0 | А |
022 | 16 | SYN | 108 | 6C | l | 193 | C1 | Б |
023 | 17 | ETB | 109 | 6D | m | 194 | C2 | В |
024 | 18 | CAN | 110 | 6E | n | 195 | C3 | Г |
025 | 19 | EM | 111 | 6F | o | 196 | C4 | Д |
026 | 1A | SUB | 112 | 70 | p | 197 | C5 | Е |
027 | 1B | ESC | 113 | 71 | q | 198 | C6 | Ж |
028 | 1C | FS | 114 | 72 | r | 199 | C7 | З |
029 | 1D | GS | 115 | 73 | s | 200 | C8 | И |
030 | 1E | RS | 116 | 74 | t | 201 | C9 | Й |
031 | 1F | US | 117 | 75 | u | 202 | CA | К |
032 | 20 | Пробел | 118 | 76 | v | 203 | CB | Л |
033 | 21 | ! | 119 | 77 | w | 204 | CC | М |
034 | 22 | « | 120 | 78 | x | 205 | CD | Н |
035 | 23 | # | 121 | 79 | y | 206 | CE | О |
036 | 24 | $ | 122 | 7A | z | 207 | CF | П |
037 | 25 | % | 123 | 7B | { | 208 | D0 | Р |
038 | 26 | & | 124 | 7C | | | 209 | D1 | С |
039 | 27 | ‘ | 125 | 7D | } | 210 | D2 | Т |
040 | 28 | ( | 126 | 7E | ~ | 211 | D3 | У |
041 | 29 | ) | 127 | 7F | | 212 | D4 | Ф |
042 | 2A | * | 128 | 80 | Ђ | 213 | D5 | Х |
043 | 2B | + | 129 | 81 | Ѓ | 214 | D6 | Ц |
044 | 2C | , | 130 | 82 | ‚ | 215 | D7 | Ч |
045 | 2D | — | 131 | 83 | ѓ | 216 | D8 | Ш |
046 | 2E | . | 132 | 84 | „ | 217 | D9 | Щ |
047 | 2F | / | 133 | 85 | … | 218 | DA | Ъ |
048 | 30 | 0 | 134 | 86 | † | 219 | DB | Ы |
049 | 31 | 1 | 135 | 87 | ‡ | 220 | DC | Ь |
050 | 32 | 2 | 136 | 88 | € | 221 | DD | Э |
051 | 33 | 3 | 137 | 89 | ‰ | 222 | DE | Ю |
052 | 34 | 4 | 138 | 8A | Љ | 223 | DF | Я |
053 | 35 | 5 | 139 | 8B | ‹ | 224 | E0 | а |
054 | 36 | 6 | 140 | 8C | Њ | 225 | E1 | б |
055 | 37 | 7 | 141 | 8D | Ќ | 226 | E2 | в |
056 | 38 | 8 | 142 | 8E | Ћ | 227 | E3 | г |
057 | 39 | 9 | 143 | 8F | Џ | 228 | E4 | д |
058 | 3A | : | 144 | 90 | Ђ | 229 | E5 | е |
059 | 3B | ; | 145 | 91 | ‘ | 230 | E6 | ж |
060 | 3C | < | 146 | 92 | ’ | 231 | E7 | з |
061 | 3D | = | 147 | 93 | “ | 232 | E8 | и |
062 | 3E | > | 148 | 94 | ” | 233 | E9 | й |
063 | 3F | ? | 149 | 95 | • | 234 | EA | к |
064 | 40 | @ | 150 | 96 | – | 235 | EB | л |
065 | 41 | A | 151 | 97 | — | 236 | EC | м |
066 | 42 | B | 152 | 98 | 237 | ED | н | |
067 | 43 | C | 153 | 99 | ™ | 238 | EE | о |
068 | 44 | D | 154 | 9A | љ | 239 | EF | п |
069 | 45 | E | 155 | 9B | › | 240 | F0 | р |
070 | 46 | F | 156 | 9C | њ | 241 | F1 | с |
071 | 47 | G | 157 | 9D | ќ | 242 | F2 | т |
072 | 48 | H | 158 | 9E | ћ | 243 | F3 | у |
073 | 49 | I | 159 | 9F | џ | 244 | F4 | ф |
074 | 4A | J | 160 | A0 | 245 | F5 | х | |
075 | 4B | K | 161 | A1 | Ў | 246 | F6 | ц |
076 | 4C | L | 162 | A2 | ў | 247 | F7 | ч |
077 | 4D | M | 163 | A3 | Ј | 248 | F8 | ш |
078 | 4E | N | 164 | A4 | ¤ | 249 | F9 | щ |
079 | 4F | O | 165 | A5 | Ґ | 250 | FA | ъ |
080 | 50 | P | 166 | A6 | ¦ | 251 | FB | ы |
081 | 51 | Q | 167 | A7 | § | 252 | FC | ь |
082 | 52 | R | 168 | A8 | Ё | 253 | FD | э |
083 | 53 | S | 169 | A9 | © | 254 | FE | ю |
084 | 54 | T | 170 | AA | Є | 255 | FF | я |
085 | 55 | U |
Похожие записи:
Кодировка windows 1251 в сайтостроении
Кодировка windows 1251 была создана в начале 90 годов для русификации программных продуктов, выпускаемых корпорацией Microsoft:
Кодировка является 8-битной и включает в себя символы славянской группы языков, в которую входят русский, белорусский, украинский, болгарский, македонский, сербский – это дает преимущество перед остальными кириллическими кодировками (ISO 8859-5, KOI8-R, CP866). Однако у 1251-кодировки имеются и весомые недостатки:
- 0xFF (25510) – это код, который зарезервирован для символа «я». В программах, которые не поддерживают чистый 8-ой бит, часто возникают непредсказуемые проблемы;
- Нет псевдографики, которая присутствует в KOI8, CP866.
Ниже приведены символы из Code Page 1251 или сокращенно СР1251 (числа под символами являются кодом в шестнадцатеричной системе такого же символа в Юникоде):
Нередко у web-разработчиков и блогеров, обладающих различной квалификацией возникает проблема с кодировкой страниц: вместо подготовленного текста появляются неизвестные, нечитаемые символы. Чтобы разобраться с данной проблемой, необходимо понимать суть термина «кодировка страницы».
Текст в памяти компьютера хранится в виде определенного количества байт, а не в том виде, в котором он отображается в текстовом редакторе. Каждый байт является кодом, который соответствует одному символу. Для того чтобы текст на странице отображался как следует, нужно сообщить браузеру, какую таблицу кодов для расшифровки и отображения он должен использовать.
Таблица кодировок не является универсальной, то есть, для расшифровки текста необходимо использовать ту, которая соответствует кодировке символов:
Для того чтобы html-документ корректно отобразился в браузере, необходимо указать используемую кодировку. Делается это следующим образом:
— между тегом <head> и закрывающим его </head> нужно прописать <meta http-equiv=»Content-Type» content=»text/html; charset=windows-1251″> — исходя из этой строки, браузер будет использовать символы русского алфавита для отображения текста на странице.
Ни для кого не является тайной, что генерация страниц проходит путем выборки и использования какой-то части информации, которая хранится в базе данных. При написании сайта на PHP, чаще всего это mysql:
Нередко при смене хостинга возникает проблема: различные кодировки информации в базе данных и в шаблонах страниц. Из-за этого одна сгенерированная страница может одновременно содержать несколько кодировок. Если информация на сайте представлена в кодировке виндовс 1251, то и чтение из базы данных должно осуществляться с помощью таблицы, в которой представлена win 1251 кодировка.
Для согласования расшифровки необходимо выполнить функцию mysql_query(«SET NAMES cp1251») – это означает, что преобразование из машинного кода будет осуществляться согласно таблице cp1251.
При создании сайта, предварительно настроив кодировки в шаблонах и базах данных, все равно может всплыть проблема некорректного отображения информации в браузере.
Для того чтобы для веб-ресурса была задана кодировка виндовс-1251, необходимо найти (или создать) файл .htaccess. Это файл, который хранит в себе дополнительные настройки и описания конфигураций web-сервера.
В нем для установки кодировки следует прописать следующие строки:
- DefaultLanguage ru;
- AddDefaultCharset windows-1251;
- php_value default_charset «cp1251».
Таким образом, для корректного отображения текста должны совпадать его кодировка и таблица кодов, с помощью которой браузер будет расшифровывать символы. Для текстов, написанных на славянских языках, необходима win 1251 кодировка. Важно помнить, что элементы страниц и баз данных должны быть описаны с помощью одной таблицы кодов.
html — Отличие кодировки windows-1251 от utf-8
html — Отличие кодировки windows-1251 от utf-8 — Stack Overflow на русскомStack Overflow на русском — это сайт вопросов и ответов для программистов. Присоединяйтесь! Регистрация займёт не больше минуты.
Присоединиться к сообществуЛюбой может задать вопрос
Любой может ответить
Лучшие ответы получают голоса и поднимаются наверх
Вопрос задан
Просмотрен 25k раз
Чем отличается и когда и где лучше применять один или другой:
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
Mirdin5,76211 золотой знак1919 серебряных знаков2929 бронзовых знаков
задан 28 окт ’11 в 17:11
ZowZow2,4082020 золотых знаков4343 серебряных знака8888 бронзовых знаков
5Разница в том, что на UTF-8 — два байта, а на windows-1251 — один байт. Поэтому текст в Юникоде больше места занимает. А вообще при прочих равных лучше всегда использовать UTF-8 это сильно облегчает разработку под разные языки.
ответ дан 28 окт ’11 в 18:24
stanislavstanislav33.6k2222 золотых знака8787 серебряных знаков206206 бронзовых знаков
6 Вопрос с повышенной активностью. Заработайте 10 репутации, чтобы ответить на этот вопрос. Ограничение по репутации помогает защитить этот вопрос от спама и недопустимых ответов.lang-html
Stack Overflow на русском лучше работает с включенным JavaScriptВаша конфиденциальность
Нажимая «Принять все файлы cookie» вы соглашаетесь, что Stack Exchange может хранить файлы cookie на вашем устройстве и раскрывать информацию в соответствии с нашей [Политикой в отношении файлов cookie] (https://stackoverflow.com/legal/cookie-policy).
Принять все файлы cookie Настроить параметры
Таблица ASCII (кодировка Windows-1251)
Таблица ASCII (кодировка Windows-1251)(0) | (1) | (2) | (3) | (4) | (5) | (6) | (7) | (8) | (9) | (10) | (11) | (12) | (13) | (14) | (15) | (16) |
(17) | (18) | (19) | (20) | (21) | (22) | (23) | (24) | (25) | (26) | (27) | (28) | (29) | (30) | (31) | (32) | !(33) |
«(34) | #(35) | $(36) | %(37) | &(38) | ‘(39) | ((40) | )(41) | *(42) | +(43) | ,(44) | —(45) | .(46) | /(47) | 0(48) | 1(49) | 2(50) |
3(51) | 4(52) | 5(53) | 6(54) | 7(55) | 8(56) | 9(57) | :(58) | ;(59) | (60) | =(61) | >(62) | ?(63) | @(64) | A(65) | B(66) | C(67) |
D(68) | E(69) | F(70) | G(71) | H(72) | I(73) | J(74) | K(75) | L(76) | M(77) | N(78) | O(79) | P(80) | Q(81) | R(82) | S(83) | T(84) |
U(85) | V(86) | W(87) | X(88) | Y(89) | Z(90) | [(91) | \ (92) | ](93) | ^(94) | _(95) | `(96) | a(97) | b(98) | c(99) | d(100) | e(101) |
f(102) | g(103) | h(104) | i(105) | j(106) | k(107) | l(108) | m(109) | n(110) | o(111) | p(112) | q(113) | r(114) | s(115) | t(116) | u(117) | v(118) |
w(119) | x(120) | y(121) | z(122) | {(123) | |(124) | }(125) | ~(126) | (127) | Ђ(128) | Ѓ(129) | ‚(130) | ѓ(131) | „(132) | …(133) | †(134) | ‡(135) |
€(136) | ‰(137) | Љ(138) | ‹(139) | Њ(140) | Ќ(141) | Ћ(142) | Џ(143) | ђ(144) | ‘(145) | ’(146) | “(147) | ”(148) | •(149) | –(150) | —(151) | (152) |
™(153) | љ(154) | ›(155) | њ(156) | ќ(157) | ћ(158) | џ(159) | (160) | Ў(161) | ў(162) | Ј(163) | ¤(164) | Ґ(165) | ¦(166) | §(167) | Ё(168) | ©(169) |
Є(170) | «(171) | ¬(172) | (173) | ®(174) | Ї(175) | °(176) | ±(177) | І(178) | і(179) | ґ(180) | µ(181) | ¶(182) | ·(183) | ё(184) | №(185) | є(186) |
»(187) | ј(188) | Ѕ(189) | ѕ(190) | ї(191) | А(192) | Б(193) | В(194) | Г(195) | Д(196) | Е(197) | Ж(198) | З(199) | И(200) | Й(201) | К(202) | Л(203) |
М(204) | Н(205) | О(206) | П(207) | Р(208) | С(209) | Т(210) | У(211) | Ф(212) | Х(213) | Ц(214) | Ч(215) | Ш(216) | Щ(217) | Ъ(218) | Ы(219) | Ь(220) |
Э(221) | Ю(222) | Я(223) | а(224) | б(225) | в(226) | г(227) | д(228) | е(229) | ж(230) | з(231) | и(232) | й(233) | к(234) | л(235) | м(236) | н(237) |
о(238) | п(239) | р(240) | с(241) | т(242) | у(243) | ф(244) | х(245) | ц(246) | ч(247) | ш(248) | щ(249) | ъ(250) | ы(251) | ь(252) | э(253) | ю(254) |
я(255) | (256) | (257) | (258) | (259) | (260) | (261) | (262) | (263) | (264) | (265) | (266) | (267) | (268) | (269) | (270) | (271) |
— версия для печати
- Определение
- ASCII (англ. American Standard Code for Information Interchange) — американская стандартная таблица для кодирования печатных символов и некоторых специальных кодов.
Если у вас есть мысли по поводу данной страницы или предложение по созданию математической (см. раздел «Математика») вспомогательной памятки, мы обязательно рассмотрим ваше предложение. Просто воспользуйтесь обратной связью. |
© Школяр. Математика (при поддержке «Ветвистого древа») 2009—2016
Решаем проблему с кодировкой приложений Windows
Октябрь6
Проблемы кодировки в Windows — довольно большая головная боль для многих любителей и поклонников этой операционки. Иногда приходится изрядно помучиться и попотеть прежде чем удается решить проблему с кодировкой. Выяснить причину, зачастую. еще сложнее. но тут вообще мало кто заморачивается…главное ведь устранить неполадку, а уж почему возникла — вопрос давно ушедших дней)
Особенно сильно проблема с кодировкой стала актуальна после выхода новой Windows 10. Микрософты опять что-то перемудрили и в итоге, в некоторых приложениях вместо языка одни кракозябры. Но все решаемо
На самом деле причин сброса или изменения кодировки может быть довольно большое множество. Но основные из них, это:
— обновление системы
— установка какого-то системного патча
— действие вируса
— обновление до windows 10
— кривые шаловливые руки и непомерная любознательность ( самая распространенная причина всех бед в windows )
Восстановление кодировки
Тем не менее, раз уж данная проблема возникла, нужно ее решать. Ниже приведены скрины, любезно предоставленные одним человеком с одного популярного форума. На них можно посмотреть без риска и экспериментов на собственной системе, ‘что будет если сменить кодировку’. Все шрифты представлены как совершенно нечитаемые арабские кракозябры.
При всем, казалось бы, диком ужасе ситуации, решается данная проблема весьма несложно:
заходим в Панель управления->Язык и региональные стандарты->Закладка «Дополнительно»->Язык программ не поддерживающих Юникод. Меняем язык с Русского на Английский, перезагружаем компьютер, снова меняем на русский и опять перезагружаем компьютер. Снова наслаждаемся красивыми родными шрифтами!
В windows 10 кодировка привязывается глобально к общему языку системы. Поэтому если у вас проблемы с отображением шрифтов, то нужно пройти: Пуск -> Параметры -> Время и Язык -> Регион и язык -> Дополнительные настройки даты и времени, региональные параметры -> и посмотреть настройки в пунктах: Язык и Региональные стандарты.
Другие статьи
Copyright © 2013-2017. All rights reserved.
Каноническое имя для java.nio API | Каноническое имя для API java.io и API java.lang | Псевдоним или псевдоним | Описание |
---|---|---|---|
ЦЭСУ-8 | CESU8 | CESU8 CSCESU-8 | Юникод CESU-8 |
IBM00858 | Cp858 | cp858 858 PC-Multilingual-850 + евро cp00858 ccsid00858 | Вариант CP850 с символом евро |
IBM437 | Cp437 | ibm437 437 ibm-437 cspc8codepage437 cp437 windows-437 | MS-DOS США, Австралия, Новая Зеландия, Южная Африка |
IBM775 | Cp775 | ibm-775 ibm775 775 cp775 | PC Baltic |
IBM850 | Cp850 | cp850 cspc850 многоязычный ibm850 850 ibm-850 | MS-DOS Latin-1 |
IBM852 | Cp852 | csPCp852 ibm-852 ibm852 852 cp852 | MS-DOS Latin-2 |
IBM855 | Cp855 | ibm855 855 IBM-855 cp855 cspcp855 | IBM Кириллица |
IBM857 | Cp857 | ibm857 857 cp857 csIBM857 ibm-857 | IBM Турецкий |
IBM862 | Cp862 | csIBM862 cp862 ibm862 862 cspc862latinhebrew ibm-862 | PC Еврейский |
IBM866 | Cp866 | ibm866 866 ibm-866 csIBM866 cp866 | MS-DOS Русский |
ISO-8859-1 | ISO8859_1 | 819 ISO8859-1 l1 ISO_8859-1: 1987 ISO_8859-1 8859_1 iso-ir-100 latin1 cp819 ISO8859_1 IBM819 ISO_8859_1 IBM-819 csISOLatin1 | ISO-8859-1, латинский алфавит No.1 |
ISO-8859-2 | ISO8859_2 | ISO8859-2 ibm912 l2 ISO_8859-2 8859_2 cp912 ISO_8859-2: 1987 iso8859_2 iso-ir-101 latin2 912 csISOLatin2 ibm-912 | Латинский алфавит № 2 |
ISO-8859-4 | ISO8859_4 | 8859_4 латинский4 l4 cp914 ISO_8859-4: 1988 ibm914 ISO_8859-4 iso-ir-110 iso8859_4 csISOLatin4 iso8859-4 914 ibm-914 | Латинский алфавит № 4 |
ISO-8859-5 | ISO8859_5 | ISO_8859-5: 1988 csISOLatinCyrillic iso-ir-144 iso8859_5 cp915 8859_5 ibm-915 ISO_8859-5 ibm915 915 кириллица ISO8859-5 | Латинский алфавит / кириллица |
ISO-8859-7 | ISO8859_7 | греческий 8859_7 греческий8 ibm813 ISO_8859-7 iso8859_7 ELOT_928 cp813 ISO_8859-7: 1987 sun_eu_greek csISOLatinGreek iso-ir-126813 iso8859-7 ECMA-118 ibm-813 | Латинский / греческий алфавит (ISO-8859-7: 2003) |
ISO-8859-9 | ISO8859_9 | ibm-920 ISO_8859-9 8859_9 ISO_8859-9: 1989 ibm920 latin5 l5 iso8859_9 cp920 920 iso-ir-148 ISO8859-9 csISOLatin5 | Латинский алфавит No.5 |
ISO-8859-13 | ISO8859_13 | iso_8859-13 ISO8859-13 iso8859_13 8859_13 | Латинский алфавит № 7 |
ISO-8859-15 | ISO8859_15 | ISO8859-15 LATIN0 ISO8859_15_FDIS ISO8859_15 cp923 8859_15 L9 ISO-8859-15 IBM923 csISOlatin9 ISO_8859-15 IBM-923 csISOlatin0 923 LATIN9 | Латинский алфавит № 9 |
КОИ8-Р | KOI8_R | koi8_r koi8 cskoi8r | КОИ8-Р, Россия |
КОИ8-У | КОИ8_У | koi8_u | КОИ8-У, Украинский |
US-ASCII | ASCII | ANSI_X3.4-1968 cp367 csASCII iso-ir-6 ASCII iso_646.irv: 1983 ANSI_X3.4-1986 ascii7 по умолчанию ISO_646.irv: 1991 ISO646-US IBM367 646 us | Американский стандартный код для обмена информацией |
UTF-8 | UTF8 | юникод-1-1-utf-8 UTF8 | Восьмибитный формат преобразования Unicode (или UCS) |
UTF-16 | UTF-16 | UTF_16 юникод utf16 UnicodeBig | Шестнадцатиразрядный формат преобразования Unicode (или UCS), порядок байтов идентифицируется необязательной меткой порядка байтов |
UTF-16BE | UnicodeBig Без маркировки | X-UTF-16BE UTF_16BE ISO-10646-UCS-2 UnicodeBigUnmarked | Шестнадцатиразрядный формат преобразования Unicode (или UCS), прямой порядок байтов порядок байтов |
UTF-16LE | UnicodeLittleUnmarked | UnicodeLittleUnmarked UTF_16LE X-UTF-16LE | Шестнадцатибитный формат преобразования Unicode (или UCS), порядок байтов с прямым порядком байтов |
UTF-32 | UTF_32 | UTF_32 UTF32 | 32-битный формат преобразования Unicode (или UCS), порядок байтов идентифицируется необязательной меткой порядка байтов |
UTF-32BE | UTF_32BE | X-UTF-32BE UTF_32BE | 32-битный формат преобразования Unicode (или UCS), с прямым порядком байтов заказ |
UTF-32LE | UTF_32LE | X-UTF-32LE UTF_32LE | 32-битный формат преобразования Unicode (или UCS), прямой порядок байтов порядок байтов |
x-UTF-32BE-BOM | UTF_32BE_BOM | UTF_32BE_BOM UTF-32BE-BOM | 32-битный формат преобразования Unicode (или UCS), с прямым порядком байтов порядок, с пометкой порядка байтов |
x-UTF-32LE-BOM | UTF_32LE_BOM | UTF_32LE_BOM UTF-32LE-BOM | 32-битный формат преобразования Unicode (или UCS), прямой порядок байтов порядок байтов с отметкой порядка байтов |
окна-1250 | Cp1250 | cp1250 cp5346 | Окна Восточноевропейская |
окна-1251 | Cp1251 | cp5347 ansi-1251 cp1251 | Окна Кириллица |
окна-1252 | Cp1252 | cp5348 cp1252 | Окна Latin-1 |
окна-1253 | Cp1253 | cp1253 cp5349 | Окна Греческая |
окна-1254 | Cp1254 | cp1254 cp5350 | Окна Турецкая |
окна-1257 | Cp1257 | cp1257 cp5353 | Окна Балтика |
Нет в наличии | UnicodeBig | Не доступен | Шестнадцатибитный формат преобразования Unicode (или UCS), прямой порядок байтов порядок байтов с отметкой порядка байтов |
x-IBM737 | Cp737 | cp737 ibm737 737 ibm-737 | PC Греческий |
x-IBM874 | Cp874 | ibm-874 ibm874 874 cp874 | IBM Тайский |
x-UTF-16LE-BOM | Юникод, Литтл | Юникод, Литтл | Шестнадцатибитный формат преобразования Unicode (или UCS), порядок байтов с прямым порядком байтов, с меткой порядка байтов |
Каноническое имя для java.nio API | Каноническое имя для API java.io и API java.lang | Псевдоним или псевдоним | Описание |
Большой5 | Большой5 | csBig5 | Big5, традиционный китайский |
Big5-HKSCS | Big5_HKSCS | big5-hkscs big5hk Big5_HKSCS big5hkscs | Big5 с расширениями для Гонконга, традиционный китайский (включая редакцию 2001 г.) |
EUC-JP | EUC_JP | csEUCPkdFmtjapanese x-euc-jp eucjis Extended_UNIX_Code_Packed_Format_for_Японский euc_jp eucjp x-eucjp | JISX 0201, 0208 и 0212, кодировка EUC, японская |
EUC-KR | EUC_KR | ksc5601-1987 csEUCKR ksc5601_1987 ksc5601 5601 euc_kr ksc_5601 ks_c_5601-1987 euckr | KS C 5601, кодировка EUC, корейский язык |
ГБ18030 | ГБ18030 | гб18030-2000 | Упрощенный китайский, стандарт КНР |
ГБ 2312 | EUC_CN | GB2312 EUC-CN X-EUC-CN EUCCN EUC_CN GB2312-80 GB2312-1980 | GB2312, кодировка EUC, упрощенный китайский |
ГБК | ГБК | CP936 окна-936 | GBK, упрощенный китайский |
IBM-Thai | Cp838 | ibm-838 ibm838 838 cp838 | IBM Thailand расширенный SBCS |
IBM01140 | Cp1140 | cp1140 1140 cp01140 ebcdic-us-037 + евро ccsid01140 | Вариант Cp037 с символом евро |
IBM01141 | Cp1141 | 1141 cp1141 cp01141 ccsid01141 ebcdic-de-273 + евро | Вариант Cp273 с символом евро |
IBM01142 | Cp1142 | 1142 cp1142 cp01142 ccsid01142 ebcdic-no-277 + евро ebcdic-dk-277 + евро | Вариант Cp277 с символом евро |
IBM01143 | Cp1143 | 1143 cp01143 ccsid01143 cp1143 ebcdic-fi-278 + евро ebcdic-se-278 + евро | Вариант Cp278 с символом евро |
IBM01144 | Cp1144 | cp01144 ccsid01144 ebcdic-it-280 + евро cp1144 1144 | Вариант Cp280 с символом евро |
IBM01145 | Cp1145 | ccsid01145 ebcdic-es-284 + евро 1145 cp1145 cp01145 | Вариант CP284 с символом евро |
IBM01146 | Cp1146 | ebcdic-gb-285 + евро 1146 cp1146 cp01146 ccsid01146 | Вариант CP285 с символом евро |
IBM01147 | Cp1147 | cp1147 1147 cp01147 ccsid01147 ebcdic-fr-277 + евро | Вариант Cp297 с символом евро |
IBM01148 | Cp1148 | cp1148 ebcdic-international-500 + евро 1148 cp01148 ccsid01148 | Вариант CP500 с символом евро |
IBM01149 | Cp1149 | ebcdic-s-871 + евро 1149 cp1149 cp01149 ccsid01149 | Вариант Cp871 с символом евро |
IBM037 | Cp037 | cp037 ibm037 ibm-037 csIBM037 ebcdic-cp-us ebcdic-cp-ca ebcdic-cp-nl ebcdic-cp-wt 037 cpibm37 cs-ebcdic-cp-wt ibm-37 cs-ebcdic-cp-us cs-ebcdic-cp-ca cs-ebcdic-cp-nl | США, Канада (двуязычный, французский), Нидерланды, Португалия, Бразилия, Австралия |
IBM1026 | Cp1026 | cp1026 ibm-1026 1026 ibm1026 | IBM Latin-5, Турция |
IBM1047 | Cp1047 | ibm-1047 1047 cp1047 | Набор символов Latin-1 для хостов EBCDIC |
IBM273 | Cp273 | ibm-273 ibm273 273 cp273 | IBM Австрия, Германия |
IBM277 | Cp277 | ibm277 277 cp277 ibm-277 | IBM Дания, Норвегия |
IBM278 | Cp278 | cp278 278 ibm-278 ebcdic-cp-se csIBM278 ibm278 ebcdic-sv | IBM Финляндия, Швеция |
IBM280 | Cp280 | ibm280 280 cp280 ibm-280 | IBM Италия |
IBM284 | Cp284 | csIBM284 ibm-284 cpibm284 ibm284 284 cp284 | IBM Каталонский / Испания, испанский Латинская Америка |
IBM285 | Cp285 | csIBM285 cp285 ebcdic-gb ibm-285 cpibm285 ibm285 285 ebcdic-cp-gb | IBM Великобритания, Ирландия |
IBM290 | Cp290 | ibm290 290 cp290 EBCDIC-JP-кана csIBM290 ibm-290 | IBM Japanese Katakana Host Extended SBCS |
IBM297 | Cp297 | 297 csIBM297 cp297 ibm297 ibm-297 cpibm297 ebcdic-cp-fr | IBM Франция |
IBM420 | Cp420 | ibm420 420 cp420 csIBM420 ibm-420 ebcdic-cp-ar1 | IBM арабский |
IBM424 | Cp424 | ebcdic-cp-he csIBM424 ibm-424 ibm424 424 cp424 | IBM Еврейский |
IBM500 | Cp500 | ibm-500 ibm500 500 ebcdic-cp-bh ebcdic-cp-ch csIBM500 cp500 | EBCDIC 500V1 |
IBM860 | Cp860 | ibm860 860 cp860 csIBM860 ibm-860 | MS-DOS Португальский |
IBM861 | Cp861 | cp861 ibm861 861 ibm-861 cp-is csIBM861 | MS-DOS Исландский |
IBM863 | Cp863 | csIBM863 ibm-863 ibm863 863 cp863 | MS-DOS Канадский французский |
IBM864 | Cp864 | csIBM864 ibm-864 ibm864 864 cp864 | PC Арабский |
IBM865 | Cp865 | ibm-865 csIBM865 cp865 ibm865 865 | MS-DOS Nordic |
IBM868 | Cp868 | ibm868 868 cp868 csIBM868 ibm-868 cp-ar | MS-DOS Пакистан |
IBM869 | Cp869 | cp869 ibm869 869 ibm-869 cp-gr csIBM869 | IBM Современный греческий |
IBM870 | Cp870 | 870 cp870 csIBM870 ibm-870 ibm870 ebcdic-cp-roece ebcdic-cp-yu | IBM Multilingual Latin-2 |
IBM871 | Cp871 | ibm871 871 cp871 ebcdic-cp-is csIBM871 ibm-871 | IBM Исландия |
IBM918 | Cp918 | 918 ibm-918 ebcdic-cp-ar2 cp918 | IBM, Пакистан (урду) |
ISO-2022-CN | ISO2022CN | csISO2022CN ISO2022CN | GB2312 и CNS11643 в форме ISO 2022 CN, упрощенной и Традиционный китайский (только преобразование в Unicode) |
ISO-2022-JP | ISO2022JP | csjisencoding iso2022jp jis_encoding jis csISO2022JP | JIS X 0201, 0208, в форме ISO 2022, японский |
ISO-2022-JP-2 | ISO2022JP2 | csISO2022JP2 iso2022jp2 | JIS X 0201, 0208, 0212 в форме ISO 2022, японский |
ISO-2022-KR | ISO2022KR | csISO2022KR ISO2022KR | ISO 2022 KR, корейский |
ISO-8859-3 | ISO8859_3 | ISO8859-3 ibm913 8859_3 l3 cp913 ISO_8859-3 iso8859_3 latin3 csISOLatin3 913 ISO_8859-3: 1988 ibm-913 iso-ir-109 | Латинский алфавит No.3 |
ISO-8859-6 | ISO8859_6 | ASMO-708 8859_6 iso8859_6 ISO_8859-6 csISOLatin Арабский ibm1089 арабский ibm-1089 1089 ECMA-114 iso-ir-127 ISO_8859-6: 1987 ISO8859-6 cp1089 | Латинский / арабский алфавит |
ISO-8859-8 | ISO8859_8 | 8859_8 ISO_8859-8 ISO_8859-8: 1988 cp916 iso-ir-138 ISO8859-8 иврит iso8859_8 ibm-916 csISOLatin иврит 916 ibm916 | Латинский / еврейский алфавит |
JIS_X0201 | JIS_X0201 | JIS0201 csHalfWidthKatakana X0201 JIS_X0201 | JIS X 0201 |
JIS_X0212-1990 | JIS_X0212-1990 | JIS0212 iso-ir-159 x0212 jis_x0212-1990 csISO159JISX02121990 | JIS X 0212 |
Shift_JIS | SJIS | shift_jis x-sjis sjis shift-jis ms_kanji csShiftJIS | Shift-JIS, японский |
ТИС-620 | TIS620 | тис620 тис620.2533 | TIS620, тайский |
окна-1255 | Cp1255 | cp1255 | Windows Иврит |
окна-1256 | Cp1256 | cp1256 | Windows Арабский |
окна-1258 | Cp1258 | cp1258 | Windows Вьетнамский |
окна-31j | MS932 | MS932 Windows-932 CSWindows31J | Окна японские |
x-Big5-Solaris | Big5_Solaris | Big5_Solaris | Big5 с семью дополнительными отображениями идеограммы Ханзи для Solaris zh_TW.BIG5 язык |
x-euc-jp-linux | EUC_JP_LINUX | euc_jp_linux euc-jp-linux | JISX 0201, 0208, кодировка EUC, японская |
x-EUC-TW | EUC_TW | euctw cns11643 EUC-TW euc_tw | CNS11643 (плоскость 1-7,15), кодировка EUC, традиционный китайский |
x-eucJP-Open | EUC_JP_Solaris | eucJP-open EUC_JP_Solaris | JISX 0201, 0208, 0212, кодировка EUC, японская |
х-IBM1006 | Cp1006 | ibm1006 ibm-1006 1006 cp1006 | IBM AIX Пакистан (урду) |
x-IBM1025 | Cp1025 | ibm-1025 1025 cp1025 ibm1025 | IBM Multilingual Cyrillic: Болгария, Босния, Герцеговина, Македония (БЮР) |
x-IBM1046 | Cp1046 | ibm1046 ibm-1046 1046 cp1046 | IBM Arabic — Windows |
х-IBM1097 | Cp1097 | ibm1097 ibm-1097 1097 cp1097 | IBM Иран (фарси) / персидский |
x-IBM1098 | Cp1098 | ibm-1098 1098 cp1098 ibm1098 | IBM Иран (фарси) / персидский (ПК) |
х-IBM1112 | Cp1112 | ibm1112 ibm-1112 1112 cp1112 | IBM Латвия, Литва |
х-IBM1122 | Cp1122 | cp1122 ibm1122 ibm-1122 1122 | IBM Эстония |
x-IBM1123 | Cp1123 | ibm1123 ibm-1123 1123 cp1123 | IBM Украина |
x-IBM1124 | Cp1124 | ibm-1124 1124 cp1124 ibm1124 | IBM AIX Украина |
x-IBM1166 | Cp1166 | cp1166 ibm1166 ibm-1166 1166 | IBM Cyrillic Multilingual с евро для Казахстана |
x-IBM1364 | Cp1364 | cp1364 ibm1364 ibm-1364 1364 | IBM EBCDIC KS X 1005-1 |
х-IBM1381 | Cp1381 | cp1381 ibm-1381 1381 ibm1381 | IBM OS / 2, DOS Китайская Народная Республика (КНР) |
x-IBM1383 | Cp 1383 | ibm1383 ibm-1383 1383 cp1383 | IBM AIX Китайская Народная Республика (КНР) |
х-IBM300 | CP300 | cp300 ibm300 300 ibm-300 | IBM Японский двухбайтовый латинский хост |
x-IBM33722 | Cp33722 | 33722 ibm-33722 cp33722 ibm33722 ibm-5050 ibm-33722_vascii_vpua | IBM-eucJP — японский (расширенный набор 5050) |
x-IBM833 | Cp833 | ibm833 cp833 ibm-833 | IBM Korean Host Extended SBCS |
x-IBM834 | Cp834 | ibm834 834 cp834 ibm-834 | IBM EBCDIC DBCS-only Korean |
x-IBM856 | Cp856 | ibm856 856 cp856 ibm-856 | IBM Еврейский |
x-IBM875 | Cp875 | ibm-875 ibm875 875 cp875 | IBM Греческий |
х-IBM921 | Cp921 | ibm921 921 ibm-921 cp921 | IBM Латвия, Литва (AIX, DOS) |
x-IBM922 | Cp922 | ibm922 922 cp922 ibm-922 | IBM Эстония (AIX, DOS) |
x-IBM930 | Cp930 | ibm-930 ibm930 930 cp930 | Катакана и кандзи (японский), смешанные с 4370 УДК, расширенный набор из 5026 |
x-IBM933 | Cp933 | ibm933 933 cp933 ibm-933 | Корейский смешанный с 1880 УДК, расширенный набор 5029 |
x-IBM935 | Cp935 | cp935 ibm935 935 ibm-935 | Узел на упрощенном китайском, смешанный с 1880 UDC, расширенный набор 5031 |
x-IBM937 | Cp937 | ibm-937 ibm937 937 cp937 | Традиционный китайский хост, соединенный с 6204 UDC, расширенный набор 5033 |
x-IBM939 | Cp939 | ibm-939 cp939 ibm939 939 | (Японские латинские кандзи), смешанные с 4370 УДК, расширенный набор 5035 |
х-IBM942 | Cp942 | ibm-942 cp942 ibm942 942 | IBM OS / 2 Japanese, расширенный набор Cp932 |
х-IBM942C | Cp942C | ibm942C cp942C ibm-942C 942C | Вариант Cp942 |
x-IBM943 | Cp943 | ibm943 943 ibm-943 cp943 | IBM OS / 2 Japanese, расширенный набор Cp932 и Shift-JIS |
x-IBM943C | Cp943C | 943C cp943C ibm943C ibm-943C | Вариант Cp943 |
x-IBM948 | Cp948 | ibm-948 ibm948 948 cp948 | OS / 2 Китайский (Тайвань) расширенный набор 938 |
x-IBM949 | Cp949 | ibm-949 ibm949 949 cp949 | ПК Корейский |
x-IBM949C | Cp949C | ibm949C ibm-949C cp949C 949C | Вариант Cp949 |
х-IBM950 | CP950 | cp950 ibm950 950 ibm-950 | ПК Китайский (Гонконг, Тайвань) |
x-IBM964 | Cp964 | ibm-964 cp964 ibm964 964 | AIX китайский (Тайвань) |
x-IBM970 | Cp970 | ibm970 ibm-eucKR 970 cp970 ibm-970 | AIX корейский |
x-ISCII91 | ISCII91 | ISCII91 iso-ir-153 iscii ST_SEV_358-88 csISO153GOST1976874 | ISCII91 кодировка индийских скриптов |
х-ISO2022-CN-CNS | ISO2022_CN_CNS | Не доступен | CNS11643 в форме ISO 2022 CN, традиционный китайский (преобразование только из Unicode) |
x-ISO2022-CN-GB | ISO2022_CN_GB | Не доступен | GB2312 в форме ISO 2022 CN, упрощенный китайский (преобразование из Только Unicode) |
x-iso-8859-11 | х-iso-8859-11 | iso-8859-11 iso8859_11 | Латинский / тайский алфавит |
x-JIS0208 | х-JIS0208 | JIS0208 JIS_C6226-1983 iso-ir-87 x0208 JIS_X0208-1983 csISO87JISX0208 | JIS X 0208 |
x-JISAutoDetect | JISAutoDetect | JISAutoDetect | Обнаруживает и преобразует Shift-JIS, EUC-JP, ISO 2022 JP (преобразование только в Unicode) |
x-Johab | x-Johab | ms1361 ksc5601_1992 johab ksc5601-1992 | Корейский, набор символов Джохаб |
x-Mac Арабский | Макарабский | Макарабский | Macintosh Арабский |
x-MacCentralEurope | MacCentralEurope | MacCentralEurope | Macintosh Latin-2 |
x-MacCroatian | МакКроат | МакКроат | Macintosh Хорватский |
х-MacCyrillic | MacCyrillic | MacCyrillic | Macintosh Кириллица |
х-MacDingbat | MacDingbat | MacDingbat | Macintosh Dingbat |
x-MacGreek | MacGreek | MacGreek | Macintosh Греческий |
x-Mac Иврит | MacHebrew | MacHebrew | Macintosh Иврит |
x-MacIceland | MacIceland | MacIceland | Macintosh Исландия |
x-MacRoman | MacRoman | MacRoman | Macintosh Roman |
x-Mac Румыния | MacRomania | MacRomania | Macintosh Румыния |
x-MacSymbol | MacSymbol | MacSymbol | Символ Macintosh |
x-MacThai | MacThai | MacThai | Тайский Macintosh |
x-Mac Турецкий | MacTurkish | MacTurkish | Macintosh Турецкий |
x-Mac Украина | Mac Украина | Mac Украина | Macintosh Украина |
x-MS932_0213 | x-MS950-HKSCS MS950_HKSCS | Не доступен | Shift_JISX0213 Windows MS932 вариант |
x-MS950-HKSCS | MS950_HKSCS | MS950_HKSCS | Windows Традиционный китайский с расширениями для Гонконга |
х-MS950-HKSCS-XP | x-mswin-936 MS936 | MS950_HKSCS_XP | HKSCS Windows XP вариант |
x-mswin-936 | MS936 | мс936 мс_936 | Windows (упрощенный китайский) |
x-PCK | PCK | уп | Версия Shift_JIS для Solaris |
x-SJIS_0213 | x-SJIS_0213 | Не доступен | Shift_JISX0213 |
x-окна-50220 | Cp50220 | cp50220 ms50220 | Кодовая страница Windows 50220 (7-битная реализация) |
x-windows-50221 | Cp50221 | cp50221 ms50221 | Кодовая страница Windows 50221 (7-разрядная реализация) |
x-окна-874 | MS874 | мс-874 мс874 окна-874 | Windows тайский |
x-windows-949 | MS949 | windows949 ms949 windows-949 ms_949 | Windows корейский |
x-окна-950 | MS950 | ms950 windows-950 | Windows Традиционный китайский |
x-windows-iso2022jp | x-windows-iso2022jp | окна-iso2022jp | Вариант ISO-2022-JP (на основе MS932) |
Кодировка 101 — Часть 2: Windows-1252 vs.UTF-8
Продолжение с Кодировка 101 часть 1
Во второй части будут представлены две наиболее распространенные кодировки, используемые сегодня, и рассмотрены некоторые из их различий.
Различия между разными кодировками
Если бы в свое время вся ИТ-индустрия согласилась на единое кодирование, сейчас с этим было бы гораздо легче справиться. Тем не менее, это не так. На протяжении многих лет различные компании ставили перед собой задачу решить одну и ту же проблему: как представить текст в виде двоичных данных для хранения или передачи.В результате сегодня существует огромное количество систем кодирования. К сожалению, многие из них почти идентичны, что заставляет усомниться в необходимости их существования еще больше.
Многие современные кодировки основаны на кодировке ASCII, но расширяют ее, чтобы включить больше символов. Это означает, что текст, который содержит только символы, присутствующие в стандарте ASCII, часто также может быть декодирован как ASCII, даже если технически он закодирован с использованием другого стандарта. Это связано с тем, что многие более крупные кодировки по-прежнему используют те же коды, что и ASCII для первых 128 символов, но помимо этих символов эти схемы кодирования отличаются в большей или меньшей степени.
Давайте сравним две наиболее распространенные кодировки, используемые для западных языков, Windows-1252 и UTF-8.
Окна-1252
Это кодировка по умолчанию, используемая системами Windows в большинстве западных стран. Это означает, что текстовые данные, созданные программным обеспечением, работающим в таких системах по умолчанию, будут использовать кодировку Windows-1252, если явно не установлено использование другой кодировки. Некоторое программное обеспечение позволяет пользователю выбирать, какую кодировку использовать, некоторые настроены на использование определенной кодировки, а не по умолчанию, а некоторые оставляют это на усмотрение самой системы.
Windows-1252 — это однобайтовая кодировка, что означает, что каждый символ кодируется как однобайтный, так же, как и в ASCII. Однако, поскольку Windows-1252 использует полные 8 бит каждого байта для своих кодовых точек (в отличие от 7-битных кодов ASCII), она содержит 256 кодовых точек по сравнению с 128 ASCII. Первая половина кодовых точек идентична те, которые определены в ASCII, а вторая половина кодирует дополнительные символы, которых нет в наборе символов ASCII.
UTF-8
UTF-8 — это кодировка из стандарта Unicode.UTF означает формат преобразования Unicode, а цифра 8 в конце означает, что это 8-битная кодировка переменной. Это означает, что каждый символ использует не менее 8 бит для своей кодовой точки, но некоторые могут использовать больше. Как и в Windows-1252, первые 128 кодовых точек идентичны ASCII, но выше эти две кодировки значительно отличаются. В то время как Windows-1252 содержит всего 256 кодовых точек, UTF-8 имеет кодовые точки для всего набора символов Unicode. Это делается путем определения некоторых байтовых значений выше 127 в качестве префиксов для дальнейших байтовых значений.Например, символ авторского права (©) кодируется как C2 A9, а знак фунта (£) кодируется как C2 A3. Поскольку байт C2 разработан как префиксный байт, это открывает дополнительные 256 2-байтовых кодовых точек с C2 в качестве первого байта.
Этот дизайн означает, что большинство общих символов, используемых в западных языках, занимают только один байт пространства, в то время как многобайтовые кодировки используются реже. В результате UTF-8 может кодировать любой символ, сохраняя при этом относительно небольшой размер данных.Это полезно как для постоянного хранения (файлы небольшого размера), так и для передачи (например, открытия веб-страницы). Из-за этого UTF-8 в настоящее время является наиболее доминирующей кодировкой, используемой во всемирной паутине, и по состоянию на сентябрь 2019 года на ее долю приходилось 94% всех веб-страниц.
Сравнение кодировок
Давайте посмотрим на конкретном примере того, как эти две кодировки отличаются друг от друга. Мы будем использовать слово «Naïveté», которое содержит два символа, отличных от ASCII (у него есть альтернативные варианты написания без них, но в качестве примера используется признанное допустимое написание слова на английском языке).
Как мы видим, символы ï и é существуют в обеих кодировках, но кодируются двумя разными способами. В Windows-1252 все символы кодируются с использованием одного байта, поэтому кодировка содержит всего 256 символов. Однако в UTF-8 эти два символа кодируются с использованием 2 байтов каждый. В результате слово занимает на два байта больше при использовании кодировки UTF-8, чем при использовании кодировки Windows-1252.
Итак, разные кодировки обрабатывают некоторые символы по-разному.В следующей и третьей частях этой серии блогов мы рассмотрим, как это может вызвать у нас проблемы. Найдите здесь «Кодировку 101 — часть 3».
окна-1251 — нпм
windows-1251 — это надежная реализация JavaScript кодировки символов windows-1251, как определено стандартом кодирования.
Эта кодировка известна под следующими именами: cp1251, windows-1251 и x-cp1251.
Установка
Через npm:
npm установить windows-1251
В браузере:
В Node.js, io.js, Narwhal и RingoJS:
var windows1251 = require ('windows-1251');
В Rhino:
Использование загрузчика AMD, например RequireJS:
требуется (
{
'пути': {
'windows-1251': 'путь / к / windows-1251'
}
},
['windows-1251'],
функция (windows1251) {
console.log (windows1251);
}
);
API
окна1251.версия
Строка, представляющая семантический номер версии.
окна1251 ярлыки
Массив строк, каждая из которых представляет метку для данной кодировки.
windows1251.encode (ввод, опции)
Эта функция принимает простую текстовую строку (параметр input
) и кодирует ее в соответствии с windows-1251. Возвращаемое значение — это «байтовая строка», то есть строка, каждый элемент которой представляет октет согласно windows-1251.
const encodedData = windows1251.encode (текст);
Дополнительный объект options и его свойство
mode
можно использовать для установки режима ошибки. Для кодирования режим ошибки может быть «фатальный»
(по умолчанию) или «html»
.
const encodedData = windows1251.encode (текст, {
'mode': 'html'
});
windows1251.decode (ввод, опции)
Эта функция принимает байтовую строку (параметр input
) и декодирует ее в соответствии с windows-1251.
const text = windows1251.decode (encodedData);
Дополнительный объект options и его свойство
mode
можно использовать для установки режима ошибки. Для декодирования режим ошибки может быть «замена»
(по умолчанию) или «фатальный»
.
const text = windows1251.decode (encodedData, {
'mode': 'fatal'
});
Для декодирования буфера (например, из fs.readFile
) используйте буфер .toString ('binary')
, чтобы получить строку байтов, которую принимает decode
.
Поддержка
windows-1251 предназначен для работы как минимум в Node.js v0.10.0, io.js v1.0.0, Narwhal 0.3.2, RingoJS 0.8-0.11, PhantomJS 1.9.0, Rhino 1.7RC4, а также в старых и современные версии Chrome, Firefox, Safari, Opera, Edge и Internet Explorer.
Банкноты
Доступны аналогичные модули для других однобайтовых устаревших кодировок.
Автор
Лицензия
windows-1251 доступен по лицензии MIT.
Значения кодировки | Программируемая поисковая система | Разработчики Google
На этой странице перечислены типы кодирования, которые можно использовать для окна поиска и страницы результатов. Кодировка сообщает компьютерам, как хранить и передавать текст по сети.
UTF-8, который является типом кодировки по умолчанию, лучше всего работает в подавляющем большинстве случаев. Фактически, многие проблемы с текстом на странице результатов можно решить, сохранив значение UTF-8
. Единственный раз, когда вам нужно изменить значение кодировки для страницы результатов и окна поиска, - это когда веб-страница хостинга не в UTF-8.Кодировка для программируемой поисковой системы должна соответствовать кодировке вашей веб-страницы.
Вы можете определить кодировку либо на панели управления, либо в файле контекста. На вкладке панели управления вы выбираете язык в раскрывающемся списке Кодировка поисковой системы . В файле контекста вы определяете значение атрибута encoding
элемента CustomSearchEngine
, как в следующем примере:
В следующей таблице перечислены значения, которые можно использовать с атрибутом кодировка
.
Примечание: Если вы не укажете тип кодировки, программируемая поисковая система будет использовать UTF-8
в качестве значения по умолчанию.
Тип кодирования | Стоимость |
---|---|
Юникод (UTF-8) | UTF-8 |
Арабский (Windows-1256) | окна-1256 |
Центральноевропейская Latin-2 (ISO-8859-2) | ISO-8859-2 |
Центральноевропейская (Windows-1250) | окна-1250 |
Центральноевропейская (CP852) | cp852 |
Китайский упрощенный (GB2312) | ГБ2312 |
Китайский упрощенный (GB18030) | ГБ18030 |
Традиционный китайский (Big5) | большой5 |
Кириллица (ISO-8859-5) | ISO-8859-5 |
Кириллица (KOI8-R) | КОИ8-Р |
Кириллица (Windows-1251) | окна-1251 |
Кириллица / Русский (CP-866) | сп-866 |
Греческий (ISO-8859-7) | ISO-8859-7 |
Еврейский (ISO-8859-8-I) | ISO-8859-8-I |
Иврит (Windows-1255) | окна-1255 |
Японский (Shift_JIS) | Shift_JIS |
Японский (EUC-JP) | EUC-JP |
Японский (ISO-2022-JP) | ISO-2022-JP |
Корейский (EUC-KR) | EUC-KR |
Скандинавская Latin-6 (ISO-8859-10) | ISO-8859-10 |
Южноевропейская Latin-3 (ISO-8859-3) | ISO-8859-3 |
Турецкая Latin-5 (ISO-8859-9) | ISO-8859-9 |
Турецкий (Windows-1254) | окна-1254 |
Вьетнамский (Windows-1258) | окна-1258 |
Западноевропейская Latin-1 (ISO-8859-1) | ISO-8859-1 |
Западноевропейская Latin-9 (ISO-8859-15) | ISO-8859-15 |
Наверх
Добавление поддержки параметров кодирования XML
Добавление поддержки параметров кодирования XMLОткрыть тему с навигацией
InstallShield 2014 г.
InstallShield позволяет указать, какой тип кодировки следует использовать для файла XML.Этот параметр доступен на вкладке «Дополнительно» при выборе файла XML в представлении «Изменения файла XML». Если тип кодировки, который вы хотите использовать, не включен в список доступных параметров кодирования, вы можете изменить один из файлов, установленных во вложенной папке папки InstallShield Program Files, чтобы добавить дополнительные параметры. Вы можете добавить любую кодировку, поддерживаемую MSXML. Следующие инструкции объясняют, как это сделать.
Внимание! Следующие инструкции требуют изменения настроек.xml, который устанавливается вместе с InstallShield. Этот файл содержит важные данные; если он отредактирован неправильно, это может привести к сбою работы InstallShield. Будьте предельно осторожны при редактировании этого файла.
Чтобы добавить дополнительные параметры кодирования в список «Кодировка» на вкладке «Дополнительно» в представлении «Изменения файла XML»:
2. | Найдите настройки.xml, который устанавливается вместе с InstallShield. Settings.xml устанавливается в одно из следующих мест, в зависимости от языковой версии InstallShield, которую вы используете: |
• | Английский - InstallShield Program Files Folder \ System \ 0409 |
• | Японский - Папка файлов программы InstallShield \ System \ 0411 |
3. | Создайте резервную копию файла Settings.xml на тот случай, если позже вам потребуется вернуться к исходной версии. |
4. | Используйте текстовый редактор или редактор XML-файлов, чтобы открыть файл Settings.xml. |
5. | Найдите элемент ISXML и его дочерние элементы. Выглядят они примерно так: |
<Кодировки>
6. | Между открывающим и закрывающим тегами Encodings добавьте новую строку, например: |
, где Type_of_Encoding указывает кодировку, которая должна быть доступна. Это должно быть значение, которое InstallShield должен использовать для атрибута кодировки вашего XML-документа.
7. | Сохраните файл Settings.xml. |
8. | Убедитесь, что ваш XML-код правильно сформирован; если он неправильно сформирован, у вас могут возникнуть проблемы с использованием InstallShield. В большинстве случаев вы можете определить неправильно сформированный XML-код, открыв файл Settings.xml в Internet Explorer. Вы должны иметь возможность расширять и сжимать элементы |
В следующий раз, когда вы откроете представление изменений XML-файла в InstallShield, вы увидите тип кодировки, который вы добавили, как один из доступных вариантов в кодировке, используемой для нового списка файлов на вкладке «Дополнительно» для XML-файла в представление «Изменения файла XML».
См. Также
Вкладка Advanced для файла XML
Настройка дополнительных параметров для InstallShield
" unicode-1-1-utf-8 ", " utf-8 ", " utf8 " | 'utf-8' |
" 866 ", " cp866 ", " csibm866 ",
« ibm866 » | 'ibm866' |
" цисолатин2 ", " iso-8859-2 ",
« iso-ir-101 », « iso8859-2 », « iso88592 »,
« iso_8859-2 », « iso_8859-2: 1987 », « l2 »,
« латин 2 » | 'iso-8859-2' |
" цисолатин3 ", " iso-8859-3 ",
« iso-ir-109 », « iso8859-3 », « iso88593 »,
« iso_8859-3 », « iso_8859-3: 1988 », « l3 »,
« латин3 » | 'iso-8859-3' |
" цисолатин4 ", " iso-8859-4 ",
« iso-ir-110 », « iso8859-4 », « iso88594 »,
« iso_8859-4 », « iso_8859-4: 1988 », « l4 »,
« латин 4 » | 'iso-8859-4' |
" цисолатинцирилловая ", " кириллица ",
« iso-8859-5 », « iso-ir-144 », « iso88595 »,
« iso_8859-5 », « iso_8859-5: 1988 » | 'iso-8859-5' |
« арабский », « asmo-708 », « csiso88596e »,
« csiso88596i », « csisolatinarabic »,
« ecma-114 », « iso-8859-6 »,
« iso-8859-6-e », « iso-8859-6-i »,
« iso-ir-127 », « iso8859-6 », « iso88596 »,
« iso_8859-6 », « iso_8859-6: 1987 » | 'iso-8859-6' |
" csisolatingreek ", " ecma-118 ",
" elot_928 ", " greek ", " greek8 ",
« iso-8859-7 », « iso-ir-126 »,
« iso8859-7 », « iso88597 », « iso_8859-7 »,
« iso_8859-7: 1987 », « sun_eu_greek » | 'iso-8859-7' |
" csiso88598e ", " csisolatinhebrew ",
« иврит », « iso-8859-8 », « iso-8859-8-e »,
« iso-ir-138 », « iso8859-8 », « iso88598 »,
« iso_8859-8 », « iso_8859-8: 1988 »,
« визуал » | 'iso-8859-8' |
" csiso88598i ", " iso-8859-8-i ",
« логический » | 'iso-8859-8i' |
" цисолатин6 ", " iso-8859-10 ",
« iso-ir-157 », « iso8859-10 »,
« iso885910 », « l6 », « latin6 » | 'iso-8859-10' |
" iso-8859-13 ", " iso8859-13 ",
« iso885913 » | 'iso-8859-13' |
" iso-8859-14 ", " iso8859-14 ",
« iso885914 » | 'iso-8859-14' |
" цисолатин9 ", " iso-8859-15 ",
« iso8859-15 », « iso885915 », « l9 »,
« латин9 » | 'iso-8859-15' |
" iso-8859-16 " | 'iso-8859-16' |
" cskoi8r ", " koi ", " koi8 ",
« кои8-р », « кои8_р » | 'кои8-р' |
" кои8-у " | 'кои8-у' |
" csmacintosh ", " mac ", " macintosh ",
" x-mac-roman " | "Macintosh" |
" дос-874 ", " iso-8859-11 ",
« iso8859-11 », « iso885911 », « tis-620 »,
« окна-874 » | 'окна-874' |
" cp1250 ", " windows-1250 ", " x-cp1250 " | 'окна-1250' |
" cp1251 ", " windows-1251 ", " x-cp1251 " | 'окна-1251' |
" ansi_x3.4-1968 "," ascii "," cp1252 ",
« cp819 », « csisolatin1 », « ibm819 »,
« iso-8859-1 », « iso-ir-100 »,
« iso8859-1 », « iso88591 », « iso_8859-1 »,
« iso_8859-1: 1987 », « l1 », « latin1 »,
« us-ascii », « windows-1252 », « x-cp1252 » | 'окна-1252' |
" cp1253 ", " windows-1253 ", " x-cp1253 " | 'окна-1253' |
" cp1254 ", " csisolatin5 ",
« iso-8859-9 », « iso-ir-148 »,
« iso8859-9 », « iso88599 », « iso_8859-9 »,
« iso_8859-9: 1989 », « l5 », « latin5 »,
« windows-1254 », « x-cp1254 » | 'окна-1254' |
" cp1255 ", " windows-1255 ", " x-cp1255 " | 'окна-1255' |
" cp1256 ", " windows-1256 ", " x-cp1256 " | 'окна-1256' |
" cp1257 ", " windows-1257 ", " x-cp1257 " | 'окна-1257' |
" cp1258 ", " windows-1258 ", " x-cp1258 " | 'окна-1258' |
" x-mac-cyrillic ", " x-mac-ukrainian " | 'x-mac-cyrillic' |
" китайский ", " csgb2312 ",
« csiso58gb231280 », « gb2312 », « gb_2312 »,
« ГБ_2312-80 », « ГБК », « iso-ir-58 »,
" x-gbk " | 'gbk' |
" gb18030 " | 'gb18030' |
" hz-gb-2312 " | 'гз-гб-2312' |
" big5 ", " big5-hkscs ", " cn-big5 ",
« csbig5 », « x-x-big5 » | 'большой5' |
" cseucpkdfmtjapanese ", " euc-jp ",
" x-euc-jp " | 'euc-jp' |
" Примечание : Firefox принимал | 'iso-2022-jp' |
" csshiftjis ", " ms_kanji ",
« shift-jis », « shift_jis », « sjis »,
« windows-31j », « x-sjis » | 'shift-jis' |
" cseuckr ", " csksc56011987 ", " euc-kr ",
« iso-ir-149 », « корейский »,
« ks_c_5601-1987 », « ks_c_5601-1989 »,
« ksc5601 », « ksc_5601 », « windows-949 » | 'euc-kr' |
" csiso2022kr ", " iso-2022-kr " | 'iso-2022-kr' |
" utf-16be " | 'УТФ-16БЭ' |
" utf-16 ", " utf-16le " | 'УТФ-16ЛЕ' |
" Определяется пользователем x " | 'x-определяемый пользователем' |
" iso-2022-cn ", " iso-2022-cn-ext " | 'замена' |
charmap · уп.go.dev
Charmap - это 8-битная кодировка набора символов.
var CodePage037 * Charmap = & codePage037
CodePage037 - это кодировка IBM Code Page 037.
var CodePage1047 * Charmap = & codePage1047
CodePage1047 - это кодировка IBM Code Page 1047.
var CodePage1140 * Charmap = & codePage1140
CodePage1140 - это кодировка IBM Code Page 1140.
var CodePage437 * Charmap = & codePage437
CodePage437 - это кодировка IBM Code Page 437.
var CodePage850 * Charmap = & codePage850
CodePage850 - это кодировка IBM Code Page 850.
var CodePage852 * Charmap = & codePage852
CodePage852 - это кодировка IBM Code Page 852.
var CodePage855 * Charmap = & codePage855
CodePage855 - это кодировка IBM Code Page 855.
var CodePage858 * Charmap = & codePage858
CodePage858 - это кодировка 858 кодовой страницы Windows.
var CodePage860 * Charmap = & codePage860
CodePage860 - это кодировка IBM Code Page 860.
var CodePage862 * Charmap = & codePage862
CodePage862 - это кодировка IBM Code Page 862.
var CodePage863 * Charmap = & codePage863
CodePage863 - это кодировка IBM Code Page 863.
var CodePage865 * Charmap = & codePage865
CodePage865 - это кодировка IBM Code Page 865.
var CodePage866 * Charmap = & codePage866
CodePage866 - это кодировка IBM Code Page 866.
var ISO8859_1 * Charmap = & iso8859_1
ISO8859_1 - это кодировка ISO 8859-1.
var ISO8859_10 * Charmap = & iso8859_10
ISO8859_10 - это кодировка ISO 8859-10.
var ISO8859_13 * Charmap = & iso8859_13
ISO8859_13 - это кодировка ISO 8859-13.
var ISO8859_14 * Charmap = & iso8859_14
ISO8859_14 - это кодировка ISO 8859-14.
var ISO8859_15 * Charmap = & iso8859_15
ISO8859_15 - это кодировка ISO 8859-15.
var ISO8859_16 * Charmap = & iso8859_16
ISO8859_16 - это кодировка ISO 8859-16.
var ISO8859_2 * Charmap = & iso8859_2
ISO8859_2 - это кодировка ISO 8859-2.
var ISO8859_3 * Charmap = & iso8859_3
ISO8859_3 - это кодировка ISO 8859-3.
var ISO8859_4 * Charmap = & iso8859_4
ISO8859_4 - это кодировка ISO 8859-4.
var ISO8859_5 * Charmap = & iso8859_5
ISO8859_5 - это кодировка ISO 8859-5.
var ISO8859_6 * Charmap = & iso8859_6
ISO8859_6 - это кодировка ISO 8859-6.
var ISO8859_7 * Charmap = & iso8859_7
ISO8859_7 - это кодировка ISO 8859-7.
var ISO8859_8 * Charmap = & iso8859_8
ISO8859_8 - это кодировка ISO 8859-8.
var ISO8859_9 * Charmap = & iso8859_9
ISO8859_9 - это кодировка ISO 8859-9.
KOI8R - это кодировка KOI8-R.
KOI8U - это кодировка KOI8-U.
var Macintosh * Charmap = & macintosh
Macintosh - это кодировка Macintosh.
var MacintoshCyrillic * Charmap = & macintoshCyrillic
MacintoshCyrillic - это кодировка кириллицы Macintosh.
var Windows1250 * Charmap = & windows1250
Windows1250 - это кодировка Windows 1250.
var Windows1251 * Charmap = & windows1251
Windows1251 - это кодировка Windows 1251.
var Windows1252 * Charmap = & windows1252
Windows1252 - это кодировка Windows 1252.
var Windows1253 * Charmap = & windows1253
Windows1253 - это кодировка Windows 1253.
var Windows1254 * Charmap = & windows1254
Windows1254 - это кодировка Windows 1254.
var Windows1255 * Charmap = & windows1255
Windows1255 - это кодировка Windows 1255.
var Windows1256 * Charmap = & windows1256
Windows1256 - это кодировка Windows 1256.
var Windows1257 * Charmap = & windows1257
Windows1257 - это кодировка Windows 1257.
var Windows1258 * Charmap = & windows1258
Windows1258 - это кодировка Windows 1258.
var Windows874 * Charmap = & windows874
Windows874 - это кодировка Windows 874.
DecodeByte возвращает декодирование руны Charmap байта b.
EncodeRune возвращает байтовую кодировку Charmap руны r. хорошо ли r входит в репертуар Charmap. Если нет, b устанавливается на Charmap's байт замены. Часто это заменяющий символ ASCII '\ x1a'.
ID реализует внутренний интерфейс.
NewDecoder реализует интерфейс encoding.Encoding.
NewEncoder реализует интерфейс encoding.Encoding.
String возвращает имя Charmap.
.