Таблица кодировки windows: Кодировки UTF-8, Windows-1251, CP-866…. или русский язык в Arduino IDE

Кодировка (128–255) | Microsoft Learn

Twitter LinkedIn Facebook Адрес электронной почты

  • Статья
  • Чтение занимает 2 мин
КодЗнакКодЗнакКодЗнакКодЗнак
128160[пространство]192À224à
129161¡193Á225á
130162¢194Â226â
131.163£195Ã227ã
132164¤196Ä228ä
133165¥197Å229å
134166¦198Æ230æ
135167
§
199Ç231ç
136ˆ168¨200È232è
137169©201É233é
138Š170ª202Ê234ê
139171«203Ë235ë
140Œ172¬204Ì236ì
141173­205Í237í
142Ž174®206Î238î
143175¯207Ï239ï
144176°208Ð240ð
145
177±209Ñ241ñ
146178²210Ò242ò
147179³211Ó243ó
148180´212Ô244ô
149181µ213Õ245õ
150182214Ö246ö
151183·215×247÷
152˜184¸216Ø248ø
153185¹217Ù249ù
154š186º218 Ú250ú
155187»219Û251û
156œ188¼220Ü252ü
157189½221Ý253ý
158ž190¾222.254.
159Ÿ191¿223ß255ÿ

Character 160 — это пространство без перерыва. Символ 173 — это мягкий дефис. Некоторые символы не поддерживаются microsoft Windows (символы 129, 141, 143, 144 и 157).

В таблице приведены значения Windows по умолчанию. Однако значения в кодировке ANSI после кода 127 определяются кодовой страницей конкретной операционной системы.

  • Функция Chr

Поддержка и обратная связь

Есть вопросы или отзывы, касающиеся Office VBA или этой статьи? Руководство по другим способам получения поддержки и отправки отзывов см. в статье Поддержка Office VBA и обратная связь.

1253 | это… Что такое Windows-1253?

Кодировка Windows-1253 используется в Microsoft Windows для представления современного греческого языка (но не древнегреческого). Расположение букв совпадает с ISO 8859-7, за исключением Ά; также отличается расположение многих небуквенных символов.

Эта кодировка включает одновременно букву мю (μ, 0xEC) и значок микро (µ, 0xB5), хотя стандарт Юникода рекомендует при наличии возможности использовать только букву мю.[1]

Содержание

  • 1 Таблицы
    • 1.1 Кодировка Windows-1253
  • 2 Ссылки
  • 3 Примечания

Таблицы

Нижняя часть таблицы кодировки (латиница) полностью соответствует кодировке ASCII. Числа под буквами обозначают 16-ричный код подходящего символа в Юникоде.

Кодировка Windows-1253

.0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F
 
8.
 

20AC
 
201A
ƒ
192

201E

2026

2020

2021
 
2030
 
2039
    
 
9.
 
 
2018

2019

201C

201D

2022

2013

2014
 
2122
 
203A
    
 
A.
 
 
A0
΅
385
Ά
386
£
A3
¤
A4
¥
A5
¦
A6
§
A7
¨
A8
©
A9
 «
AB
¬
AC
­
AD
®
AE

2015
 
B.
 
°
B0
±
B1
²
B2
³
B3
΄
384
µ
B5

B6
·
B7
Έ
388
Ή
389
Ί
38A
»
BB
Ό
38C
½
BD
Ύ
38E
Ώ
38F
 
C.
 
ΐ
390
Α
391
Β
392
Γ
393
Δ
394
Ε
395
Ζ
396
Η
397
Θ
398
Ι
399
Κ
39A
Λ
39B
Μ
39C
Ν
39D
Ξ
39E
Ο
39F
 
D.
 
Π
3A0
Ρ
3A1
 Σ
3A3
Τ
3A4
Υ
3A5
Φ
3A6
Χ
3A7
Ψ
3A8
Ω
3A9
Ϊ
3AA
Ϋ
3AB
ά
3AC
έ
3AD
ή
3AE
ί
3AF
 
E.
 
ΰ
3B0
α
3B1
β
3B2
γ
3B3
δ
3B4
ε
3B5
ζ
3B6
η
3B7
θ
3B8
ι
3B9
κ
3BA
λ
3BB
μ
3BC
ν
3BD
ξ
3BE
ο
3BF
 
F.
 
π
3C0
ρ
3C1
ς
3C2
σ
3C3
τ
3C4
υ
3C5
φ
3C6
χ
3C7
ψ
3C8
ω
3C9
ϊ
3CA
ϋ
3CB
ό
3CC
ύ
3CD
ώ
3CE
 

Ссылки

  • Официальная таблица CP1253 на сайте www.
    unicode.org

Примечания

  1. Unicode Technical Report #25

Кодовые таблицы символов в Windows
1250 | 1251 | 1252 | 1253 | 1254 | 1255 | 1256 | 1257 | 1258

Кодировки символов
Основы →алфавит • текст ( файл • данные ) • набор символов • конверсия
Исторические кодировки →Докомп.: семафорная (Макарова) • Морзе • Бодо • МТК-2Комп.: 6 бит • УПП • RADIX-50 • EBCDIC ( ДКОИ-8 ) • КОИ-7 • ISO 646
совре-
менное
8-битное
представ-
ление
символы →ASCII ( управляющие • печатные )не-ASCII ( псевдографика )
8бит. код.стр.Разные →   Кириллица: КОИ-8 • ГОСТ 19768-87 • MacCyrillic
ISO 8859 →1(лат. ) 2 3 4 5(кир.) 6 7 8 9 10 11 12 13 14 15(€) 16
Windows →1250 1251(кир.) 1252 1253 1254 1255 1256 1257 1258 | WGL4
IBM&DOS →437 • 850 • 852 • 855 • 866 «альт.» • ( МИК ) • ( НИИ ЭВМ )
Много-
байтные
Традиционные →DBCS ( GB2312 ) • HTML
Unicode →UTF-16 • UTF-8 • список символов ( кириллица )
Связанные
темы →
интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • кракозябры • транслит • нестандартные шрифты • текст как изображениеУтилиты: iconv • recode

Полный список символов для windows-1252

НОЛЬ (U+0000) 00
НАЧАЛО ЗАГОЛОВКА (U+0001) 01
НАЧАЛО ТЕКСТА (U+0002) 02
КОНЕЦ ТЕКСТА (U+0003) 03
КОНЕЦ ПЕРЕДАЧИ (U+0004) 04
ЗАПРОС (U+0005) 05
ПОДТВЕРЖДЕНИЕ (U+0006) 06
ЗВОНОК (U+0007) 07
НАЗАД (U+0008) 08
ТАБЛИЦА СИМВОЛОВ (U+0009) 09
ПЕРЕВОД СТРОКИ (LF) (U+000A)
ТАБЛИЦА СТРОК (U+000B) 0b
ПОДАЧА ФОРМЫ (FF) (U+000C)
ВОЗВРАТ КАРЕТКИ (CR) (U+000D)
ВЫХОД (U+000E)
ПЕРЕКЛЮЧЕНИЕ В (U+000F) 0f
ESCAPE КАНАЛА ПЕРЕДАЧИ ДАННЫХ (U+0010) 10
КОНТРОЛЬ УСТРОЙСТВА ОДИН (U+0011) 11
УПРАВЛЕНИЕ УСТРОЙСТВОМ ДВА (U+0012) 12
КОНТРОЛЬ УСТРОЙСТВА ТРИ (U+0013) 13
КОНТРОЛЬ УСТРОЙСТВА ЧЕТЫРЕ (U+0014) 14
ОТРИЦАТЕЛЬНОЕ ПОДТВЕРЖДЕНИЕ (U+0015) 15
СИНХРОННЫЙ ХОЛОСТОЙ ХОД (U+0016) 16
КОНЕЦ БЛОКА ПЕРЕДАЧ (U+0017) 17
ОТМЕНА (U+0018) 18
КОНЕЦ СРЕДСТВА (U+0019) 19
ЗАМЕНА (U+001A)
ПОБЕГ (U+001B)
РАЗДЕЛИТЕЛЬ ИНФОРМАЦИИ ЧЕТЫРЕ (U+001C)
РАЗДЕЛИТЕЛЬ ИНФОРМАЦИИ ТРИ (U+001D)
ИНФОРМАЦИОННЫЙ РАЗДЕЛИТЕЛЬ ДВА (U+001E) 1e
РАЗДЕЛИТЕЛЬ ИНФОРМАЦИИ ОДИН (U+001F)
ПРОБЕЛ (U+0020) 20
! ВОСКЛИЦАТЕЛЬНЫЙ ЗНАК (U+0021) 21
» КАвычки (U+0022) 22
# ЗНАК НОМЕРА (U+0023) 23
$ ЗНАК ДОЛЛАРА (U+0024) 24
% ЗНАК ПРОЦЕНТА (U+0025) 25
и АМПЕРСАНД (U+0026) 26
АПОСТРОФ (U+0027) 27
( ЛЕВАЯ СКОБКА (U+0028) 28
) ПРАВАЯ СКОБКА (U+0029) 29
* ЗВЕЗДОЧКА (U+002A)
+ ЗНАК ПЛЮС (U+002B)
, ЗАПЯТАЯ (U+002C)
ДЕФИС-МИНУС (U+002D)
. ПОЛНАЯ СТОП (U+002E)
/ СОЛИДУС (U+002F)
0 ЦИФРА НОЛЬ (U+0030) 30
1 ЦИФРА ЕДИНИЦА (U+0031) 31
2 ДВА ЦИФРА (U+0032) 32
3 ЦИФРА ТРИ (U+0033) 33
4 ЦИФРА ЧЕТЫРЕ (U+0034) 34
5 ЦИФРА ПЯТЬ (U+0035) 35
6 ЦИФРА ШЕСТЬ (U+0036) 36
7 ЦИФРА СЕДЬМАЯ (U+0037) 37
8 ЦИФРА ВОСЕМЬ (U+0038) 38
9 ЦИФРА ДЕВЯТЬ (U+0039) 39
: ТОЛСТАЯ (U+003A)
; ТОЧКА С ЗАПЯТОЙ (U+003B)
< ЗНАК МЕНЬШЕ (U+003C)
= ЗНАК РАВНО (U+003D)
> ЗНАК БОЛЬШЕ (U+003E)
? ВОПРОСИТЕЛЬНЫЙ ЗНАК (U+003F) 3f
@ КОММЕРЧЕСКИЙ АТ (U + 0040) 40
А ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА A (U+0041) 41
Б ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА B (U+0042) 42
С ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА C (U+0043) 43
Д ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА D (U+0044) 44
Е ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА E (U+0045) 45
Ф ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА F (U+0046) 46
Г ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА G (U+0047) 47
Н ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА H (U+0048) 48
я ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА I (U+0049) 49
Дж ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА J (U+004A)
К ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА K (U+004B)
Л ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА L (U+004C)
М ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА M (U+004D)
Н ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА N (U+004E)
О ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА O (U+004F) 4f
Р ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА P (U+0050) 50
В ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА Q (U+0051) 51
Р ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА R (U+0052) 52
С ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА S (U+0053) 53
Т ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА T (U+0054) 54
У ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА U (U+0055) 55
В ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА V (U+0056) 56
Вт ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА W (U+0057) 57
Х ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА X (U+0058) 58
Д ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА Y (U+0059) 59
З ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА Z (U+005A) 5а 9 ЦИРКУМФЛЕКС АКЦЕНТ (U+005E) 5e
_ НИЗКАЯ ЛИНИЯ (U+005F)
` ГРЕЙВ АКЦЕНТ (U+0060) 60
и СТРОЧНАЯ ЛАТИНСКАЯ БУКВА A (U+0061) 61
б СТРОЧНАЯ ЛАТИНСКАЯ БУКВА B (U+0062) 62
с СТРОЧНАЯ ЛАТИНСКАЯ БУКВА C (U+0063) 63
г СТРОЧНАЯ ЛАТИНСКАЯ БУКВА D (U+0064) 64
и СТРОЧНАЯ ЛАТИНСКАЯ БУКВА E (U+0065) 65
ф СТРОЧНАЯ ЛАТИНСКАЯ БУКВА F (U+0066) 66
г СТРОЧНАЯ ЛАТИНСКАЯ БУКВА G (U+0067) 67
ч СТРОЧНАЯ ЛАТИНСКАЯ БУКВА H (U+0068) 68
и СТРОЧНАЯ ЛАТИНСКАЯ БУКВА I (U+0069) 69
и СТРОЧНАЯ ЛАТИНСКАЯ БУКВА J (U+006A)
к СТРОЧНАЯ ЛАТИНСКАЯ БУКВА K (U+006B)
л СТРОЧНАЯ ЛАТИНСКАЯ БУКВА L (U+006C)
м СТРОЧНАЯ ЛАТИНСКАЯ БУКВА M (U+006D)
СТРОЧНАЯ ЛАТИНСКАЯ БУКВА N (U+006E)
или СТРОЧНАЯ ЛАТИНСКАЯ БУКВА O (U+006F) 6f
р СТРОЧНАЯ ЛАТИНСКАЯ БУКВА P (U+0070) 70
q СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Q (U+0071) 71
р СТРОЧНАЯ ЛАТИНСКАЯ БУКВА R (U+0072) 72
с СТРОЧНАЯ ЛАТИНСКАЯ БУКВА S (U+0073) 73
т СТРОЧНАЯ ЛАТИНСКАЯ БУКВА T (U+0074) 74
и СТРОЧНАЯ ЛАТИНСКАЯ БУКВА U (U+0075) 75
против СТРОЧНАЯ ЛАТИНСКАЯ БУКВА V (U+0076) 76
с СТРОЧНАЯ ЛАТИНСКАЯ БУКВА W (U+0077) 77
х СТРОЧНАЯ ЛАТИНСКАЯ БУКВА X (U+0078) 78
у СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Y (U+0079) 79
с СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Z (U+007A)
{ ЛЕВАЯ ФИГУРНАЯ СКОБКА (U+007B)
| ВЕРТИКАЛЬНАЯ ЛИНИЯ (U+007C)
} ПРАВАЯ ФИГУРНАЯ СКОБКА (U+007D)
~ ТИЛЬДА (U+007E)
УДАЛИТЬ (U+007F) 7f
  НЕРАЗРЫВНЫЙ ПРОБЕЛ (U+00A0) а0
¡ ПЕРЕВЕРНУТЫЙ ВОСКЛИЦАТЕЛЬНЫЙ ЗНАК (U+00A1) а1
¢ ЗНАК ЦЕНТА (U+00A2) а2
£ ЗНАК ФУНТА (U+00A3) а3
¤ ЗНАК ВАЛЮТЫ (U+00A4) а4
¥ ЗНАК ЙЕНЫ (U+00A5) а5
¦ СЛОМАННЫЙ БАР (U+00A6) а6
§ ЗНАК СЕКЦИИ (U+00A7) а7
¨ ДИЭРЕЗИС (U+00A8) а8
© ЗНАК АВТОРСКОГО ПРАВА (U+00A9) а9
ª ПОКАЗАТЕЛЬ ОРДИНАЛА ЖЕНСКОГО РОДА (U+00AA) аа
« ДВУХУГОЛЬНАЯ КАВАКА, УКАЗЫВАЮЩАЯ ВЛЕВО (U+00AB) аб
¬ НЕ ЗНАК (U+00AC) ак
МЯГКИЙ ДЕФИС (U+00AD) объявление
® ЗАРЕГИСТРИРОВАННЫЙ ЗНАК (U+00AE)
¯ МАКРОН (U+00AF) и
° ЗНАК СТЕПЕНИ (U+00B0) б0
± ЗНАК ПЛЮС-МИНУС (U+00B1) б1
² НАДПИСЬ ДВА (U+00B2) б2
³ НАДПИСЬ ТРИ (U+00B3) б3
´ ОСТРЫЙ АКЦЕНТ (U+00B4) б4
µ МИКРОЗНАК (U+00B5) б5
ЗНАК ПОДУШКИ (U+00B6) б6
· СРЕДНЯЯ ТОЧКА (U+00B7) б7
¸ СЕДИЛЬЯ (U+00B8) б8
НАДПИСЬ ОДИН (U+00B9) б9
º МУЖСКОЙ ОРДИНАЛЬНЫЙ ИНДИКАТОР (U+00BA) ба
» ДВОЙНАЯ УГЛОВАЯ КАВАЧКА, УКАЗЫВАЮЩАЯ ВПРАВО (U+00BB) бб
= ВУЛЬГАРНАЯ Дробь ОДНА ЧЕТВЕРТЬ (U+00BC) до н. э.
½ ВУЛЬГАРНАЯ Дробь ОДНА ПОЛОВИНА (U+00BD) бд
¾ ВУЛЬГАРНАЯ Дробь ТРИ ЧЕТВЕРТИ (U+00BE) будет
À ПЕРЕВЕРНУТЫЙ ВОПРОСИТЕЛЬНЫЙ ЗНАК (U+00BF) бф
À ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА A С ГРАВОЙ (U+00C0) с0
Á ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА A С АКТУАЛЬНОЙ (U+00C1) с1
 ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА A С CIRCUMFLEX (U+00C2) с2
à ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА A С ТИЛЬДОЙ (U+00C3) с3
Ä ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА А С ДИЕРЕЗИСОМ (U+00C4) с4
Å ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА A С КОЛЬЦОМ ВЫШЕ (U+00C5) с5
Æ ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА AE (U+00C6) с6
Ç ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА C С СЕДИЛЬЕЙ (U+00C7) с7
È ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА E С ГРАВОЙ (U+00C8) с8
É ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА E С ОСТРОЙ (U+00C9) с9
К ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА E С CIRCUMFLEX (U+00CA) примерно
Х ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА E С ДИЕРЕЗИСОМ (U+00CB) кб
М ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА I С ГРАВОЙ (U+00CC) куб. см
Х ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА I С ОСТРОЙ (U+00CD) компакт-диск
О ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА I С CIRCUMFLEX (U+00CE)
О ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА I С ДИЕРЕЗИСОМ (U+00CF) в сравнении с
Р ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА ETH (U+00D0) д0
С ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА N С ТИЛЬДОЙ (U+00D1) д1
Т ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА O С ГРАВОЙ (U+00D2) д2
О ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА O С ОСТРОЙ (U+00D3) д3
Ô ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА O С CIRCUMFLEX (U+00D4) d4
Х ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА O С ТИЛЬДОЙ (U+00D5) d5
Ö ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА O С ДИЕРЕЗИСОМ (U+00D6) к6
× ЗНАК УМНОЖЕНИЯ (U+00D7) к7
Ø ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА O С ШТРИХОМ (U+00D8) к8
Ù ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА U С ГРАВОЙ (U+00D9) к9
У ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА U С ОСТРОЙ (U+00DA) да
О ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА U С CIRCUMFLEX (U+00DB) дб
О ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА U С ДИЕРЕЗИСОМ (U+00DC) постоянный ток
О ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА Y С ОСТРОЙ БУКВОЙ (U+00DD) дд
Þ ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА ТОРН (U+00DE) из
ß СТРОЧНАЯ ЛАТИНСКАЯ БУКВА S (U+00DF) дф
и СТРОЧНАЯ ЛАТИНСКАЯ БУКВА A С ГРАВОЙ (U+00E0) е0
á СТРОЧНАЯ ЛАТИНСКАЯ БУКВА A С АКТУАЛЬНОЙ (U+00E1) е1
â СТРОЧНАЯ ЛАТИНСКАЯ БУКВА A С CIRCUMFLEX (U+00E2) е2
ã СТРОЧНАЯ ЛАТИНСКАЯ БУКВА A С ТИЛЬДОЙ (U+00E3) е3
ä СТРОЧНАЯ ЛАТИНСКАЯ БУКВА A С ДИЕРЕЗИСОМ (U+00E4) e4
х СТРОЧНАЯ ЛАТИНСКАЯ БУКВА A С КОЛЬЦОМ ВЫШЕ (U+00E5) e5
æ СТРОЧНАЯ ЛАТИНСКАЯ БУКВА AE (U+00E6) е6
и СТРОЧНАЯ ЛАТИНСКАЯ БУКВА C С СЕДИЛЬЕЙ (U+00E7) е7
и СТРОЧНАЯ ЛАТИНСКАЯ БУКВА E С ГРАВОЙ (U+00E8) е8
и СТРОЧНАЯ ЛАТИНСКАЯ БУКВА E С АКТУАЛЬНОЙ (U+00E9) e9
ê СТРОЧНАЯ ЛАТИНСКАЯ БУКВА E С CIRCUMFLEX (U+00EA) шт.
СТРОЧНАЯ ЛАТИНСКАЯ БУКВА E С ДИЕРЕЗИСОМ (U+00EB) эб
х СТРОЧНАЯ ЛАТИНСКАЯ БУКВА I С ГРАВОЙ (U+00EC) эк
и СТРОЧНАЯ ЛАТИНСКАЯ БУКВА I С ОСТРОЙ БУКВОЙ (U+00ED) изд
î СТРОЧНАЯ ЛАТИНСКАЯ БУКВА I С CIRCUMFLEX (U+00EE) ее
ï СТРОЧНАЯ ЛАТИНСКАЯ БУКВА I С ДИЕРЕЗИСОМ (U+00EF) или
ð СТРОЧНАЯ ЛАТИНСКАЯ БУКВА ETH (U+00F0) ф0
СТРОЧНАЯ ЛАТИНСКАЯ БУКВА N С ТИЛЬДОЙ (U+00F1) ф1
ò СТРОЧНАЯ ЛАТИНСКАЯ БУКВА O С ГРАВОЙ (U+00F2) ф2
СТРОЧНАЯ ЛАТИНСКАЯ БУКВА O С АКТУАЛЬНОЙ (U+00F3) ф3
х СТРОЧНАЯ ЛАТИНСКАЯ БУКВА O С CIRCUMFLEX (U+00F4) ф4
х СТРОЧНАЯ ЛАТИНСКАЯ БУКВА O С ТИЛЬДОЙ (U+00F5) ф5
ö СТРОЧНАЯ ЛАТИНСКАЯ БУКВА O С ДИЕРЕЗИСОМ (U+00F6) ф6
÷ ЗНАК ОТДЕЛЕНИЯ (U+00F7) ф7
ø СТРОЧНАЯ ЛАТИНСКАЯ БУКВА O С ШТРИХОМ (U+00F8) ф8
Х ЛАТИНСКАЯ СТРОЧНАЯ БУКВА U С ГРАВОЙ (U+00F9) ф9
ú СТРОЧНАЯ ЛАТИНСКАЯ БУКВА U С ОСТРОЙ БУКВОЙ (U+00FA) ФА
х СТРОЧНАЯ ЛАТИНСКАЯ БУКВА U С CIRCUMFLEX (U+00FB) фб
ü СТРОЧНАЯ ЛАТИНСКАЯ БУКВА U С ДИЕРЕЗИСОМ (U+00FC) фк
х СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Y С АКТУАЛЬНОЙ (U+00FD) фд
+ ЛАТИНСКАЯ СТРОЧНАЯ БУКВА ТОРН (U+00FE) и
ÿ СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Y С ДИЕРЕЗИСОМ (U+00FF) и далее
ЛАТИНСКАЯ ЗАГЛАВНАЯ ЛИГАТУРА OE (U+0152)
ЛАТИНСКАЯ МАЛАЯ ЛИГАТУРА OE (U+0153)
Ш ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА S С КАРОНОМ (U+0160)
š СТРОЧНАЯ ЛАТИНСКАЯ БУКВА S С КАРОНОМ (U+0161)
Ÿ ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА Y С ДИЕРЕЗИСОМ (U+0178)
Ž ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА Z С КАРОНОМ (U+017D) 8e
ž СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Z С КАРОНОМ (U+017E)
ƒ СТРОЧНАЯ ЛАТИНСКАЯ БУКВА F С КРЮЧКОМ (U+0192) 83
ˆ БУКВА МОДИФИКАТОРА CIRCUMFLEX АКЦЕНТ (U+02C6) 88
~ МАЛЕНЬКАЯ ТИЛЬДА (U+02DC) 98
ТИРЕ (U+2013) 96
ЭМ ТИРЕ (U+2014) 97
ЛЕВАЯ ОДИНАРНАЯ КАВАТЫ (U+2018) 91
ПРАВАЯ ОДИНАРНАЯ КАВАТЫ (U+2019) 92
ОДИНАРНАЯ МАЛАЯ-9 КАВАТЫ (U+201A) 82
» ЛЕВАЯ ДВОЙНАЯ КАВАТЫ (U+201C) 93
ПРАВАЯ ДВОЙНАЯ КАВАТЫ (U+201D) 94
ДВОЙНАЯ МЛАДШАЯ-9 КАВАТЫ (U+201E) 84
КИНЖАЛ (U+2020) 86
ДВОЙНОЙ КИНЖАЛ (U+2021) 87
ПУЛЯ (U+2022) 95
ГОРИЗОНТАЛЬНЫЙ ЭЛЛИПСИС (U+2026) 85
ПРОМЫШЛЕННЫЙ ЗНАК (U+2030) 89
ОДИНАРНЫЙ УГОЛ, НАПРАВЛЯЮЩИЙ ВЛЕВО КАВАТЫ (U+2039)
ОДИНОЧНЫЙ УГОЛ, НАПРАВЛЯЮЩИЙ ВПРАВО КАвычки (U+203A)
ЗНАК ЕВРО (U+20AC) 80
ЗНАК ТОРГОВОЙ МАРКИ (U+2122) 99

Кодовые страницы — приложения Win32

  • Статья
  • 5 минут на чтение

Большинство приложений, написанных сегодня, обрабатывают символьные данные в основном как Unicode, используя кодировку UTF-16. Однако многие устаревшие приложения продолжают использовать наборы символов на основе кодовых страниц. Даже новым приложениям иногда приходится работать с кодовыми страницами, часто по одной из следующих причин:

  • Для связи с устаревшими приложениями.
  • Для связи со старыми почтовыми серверами и серверами новостей, которые не всегда могут поддерживать Unicode.
  • Для связи с консолью Windows в устаревших целях. (Консоль поддерживает Unicode, но некоторые устаревшие инструменты приложений командной строки могут не поддерживаться.)
  • г.

Примечание

Новые приложения Windows должны использовать Unicode, чтобы избежать несоответствий различных кодовых страниц и упростить локализацию.

 

Каждая кодовая страница представлена ​​идентификатором кодовой страницы, например 1252, и обрабатывается функциями API Unicode и набора символов. Список поддерживаемых идентификаторов кодовых страниц см. в разделе Идентификаторы кодовых страниц. Справочник «Кодовые страницы» в Глобальном центре разработчиков Microsoft Go дает полное описание многих кодовых страниц.

Кодовые страницы Windows, обычно называемые «кодовыми страницами ANSI», представляют собой кодовые страницы, для которых значения, отличные от ASCII (значения больше 127), представляют международные символы. Эти кодовые страницы изначально используются в Windows Me, а также доступны в Windows NT и более поздних версиях.

Примечание

Первоначально кодовая страница Windows 1252, кодовая страница, обычно используемая для английского и других западноевропейских языков, была основана на проекте Американского национального института стандартов (ANSI). Этот проект в конечном итоге стал ISO 8859.-1, но кодовая страница Windows 1252 была реализована до того, как стандарт стал окончательным, и не совсем совпадает с ISO 8859-1.

 

Многие функции Windows API имеют версии «A» (ANSI) и «W» (широкий, Unicode). Версия «A» обрабатывает текст на основе кодовых страниц Windows, а версия «W» обрабатывает текст в формате Unicode. См. Типы данных Windows для строк и Соглашения для прототипов функций.

Кодовые страницы Windows также иногда называют «активными кодовыми страницами» или «системными активными кодовыми страницами». В операционной системе Windows всегда есть одна активная в данный момент кодовая страница Windows. Все версии функций API ANSI используют текущую активную кодовую страницу.

Кодовые страницы производителей оригинального оборудования (OEM) — это кодовые страницы, для которых значения, отличные от ASCII, представляют символы рисования линий и пунктуации. Эти кодовые страницы изначально использовались для MS-DOS и до сих пор используются для консольных приложений. Они также используются для нерасширенных имен файлов в файловых системах FAT12, FAT16 и FAT32, как описано в разделе Наборы символов, используемые в именах файлов. Обычной кодовой страницей OEM для английского языка является кодовая страница 437.

Как для кодовых страниц Windows, так и для кодовых страниц OEM кодовые значения от 0x00 до 0x7F соответствуют 7-битному набору символов ASCII. Кодовые значения от 0x00 до 0x19и 0x7F всегда представляют собой стандартные управляющие символы, а от 0x20 до 0x7E представляют стандартизированные отображаемые символы. Символы, представленные остальными кодами, от 0x80 до 0xff, различаются в зависимости от набора символов. Каждый набор символов включает различные специальные символы, обычно настроенные для языка или группы языков. Кодовая страница Windows 1252 и кодовая страница OEM 437 обычно используются в США.

Помимо кодовых страниц Windows и OEM, ваши приложения могут использовать неродные кодовые страницы. Примерами являются кодовые страницы EBCDIC и Macintosh.

Две кодировки Unicode (UTF-7 и UTF-8) реализованы как кодовые страницы. Как и другие кодовые страницы, каждая страница известна по числовому идентификатору и может обрабатываться многими из тех же функций API Unicode и набора символов.

Кодовые страницы могут быть либо страницами с набором однобайтовых символов (SBCS), либо страницами с набором двухбайтовых символов (DBCS). На страницах SBCS каждый байт напрямую кодирует один символ, так что можно представить ровно 256 различных символов (включая управляющие символы, буквы, цифры, знаки препинания, символы и т.п.). Кодовые страницы DBCS используются для таких языков, как японский и китайский. В такой кодовой странице некоторые символы имеют двухбайтовую кодировку с определенными значениями байтов (всегда значения больше 127), выступающими в качестве «начальных байтов». Вместо того, чтобы кодировать символы сами по себе, начальные байты могут быть сопоставлены с символом только в сочетании с «конечным байтом».

Некоторые устаревшие протоколы требуют использования кодовых страниц SBCS и DBCS. Каждая кодовая страница SBCS/DBCS поддерживает разные символы, но ни одна кодовая страница не поддерживает весь набор символов, предоставляемых Unicode. Каждая кодовая страница SBCS/DBCS поддерживает разные подмножества, закодированные по-разному.

Примечание

Данные, преобразованные из одной кодовой страницы SBCS или DBCS в другую, могут быть повреждены, поскольку одно и то же значение данных на разных кодовых страницах может кодировать разные символы. Данные, преобразованные из Unicode в SBCS или DBCS, могут быть потеряны, так как данная кодовая страница может не соответствовать каждому символу, используемому в этих конкретных данных Unicode.

 

В дополнение к кодовым страницам SBCS и DBCS в ваших приложениях доступны кодовые страницы многобайтовых наборов символов 52936, 54936, 51949 и 5022x, в которых используется подход, аналогичный подходу для DBCS. Однако кодовая страница многобайтового набора символов выходит за рамки двухбайтовых кодировок некоторых символов. UTF-7 и UTF-8 используют аналогичный подход для кодирования Unicode на основе 7-битных и 8-битных байтов соответственно. Дополнительные сведения см. в разделе Юникод.

Несколько функций Unicode и наборов символов позволяют вашим приложениям обрабатывать кодовые страницы. Приложение может использовать GetCPInfo и GetCPInfoEx Функции для получения информации о кодовой странице. Эта информация включает символ по умолчанию, используемый, когда символ в преобразованной строке не имеет соответствующей записи на кодовой странице.

Приложение может использовать функции MultiByteToWideChar и WideCharToMultiByte для преобразования между строками на основе кодовых страниц Windows и строк Unicode. Хотя их имена относятся к «MultiByte», эти функции одинаково хорошо работают с кодовыми страницами SBCS, DBCS и многобайтовыми наборами символов.

Примечание

WideCharToMultiByte могут быть потеряны некоторые данные, если предоставленная кодовая страница не может представить все символы в строке Unicode.

 

Ваше приложение может выполнять преобразование между кодовыми страницами Windows и кодовыми страницами OEM с помощью стандартных функций библиотеки времени выполнения C.

Оставить комментарий

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *