python — Проблема с отображением кодировки cp1251 в ссылке: программа = %EF%F0%EE%E3%F0%E0%EC%EC%E0
Вопрос задан
Изменён 2 года 3 месяца назад
Просмотрен 634 раза
Столкнулся с проблемой, при написании парсера на python3. В ссылке(поиск по сайту — www.site.com/search=) можно подставлять как русские, так и английские значения и, если со вторыми проблем нет, то русский поиск раскладывается в cp1251
Пример:
слово — программа = %EF%F0%EE%E3%F0%E0%EC%EC%E0
а в python3:
x = "программа" x=x.encode("CP1251")
получается байт строка —
b’\xef\xf0\xee\xe3\xf0\xe0\xec\xec\xe0′
как это возможно привести к нужному виду?
- python
- python-3.
x
- cp1251
слово — программа = %EF%F0%EE%E3%F0%E0%EC%EC%E0
Это специальное представление символов для URL (Percent encoding), оно не имеет отношения к кодировке Windows-1251 и вообще к символьным кодировкам. Из encode
ожидаемо возвращается массив байтов — символы исходной строки переводятся в байты в соответствии с заданной кодировкой.
Для корректного преобразования можете использовать urllib.parse.quote
:
from urllib.parse import quote x = quote('программа')
Такой же вопрос в английской версии: How to percent-encode URL parameters in Python?
5Как уже написали, это называется Percent encoding
, которое представляет символы в ascii, если они к ней не относятся (все-таки интернет появился до Unicode)
Поэтому латиница не закодировалась в Percent encoding
:
from urllib.parse import quote print(quote('программа')) # '%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0' print(quote('program')) # 'program'
Покажу пример использования:
from urllib.parse import quote url = 'www.site.com/search=' + quote('программа') from urllib.request import urlopen rs = urlopen(url) # ...
Но есть модуль, который не входит в стандартную библиотеку – requests
. Он достаточно умный, чтобы сам кодировать не ascii символы:
# pip install requests import requests url = 'www.site.com/search=' + 'программа' rs = requests.get(url)3
Зарегистрируйтесь или войдите
Регистрация через Google Регистрация через FacebookОтправить без регистрации
ПочтаНеобходима, но никому не показывается
Отправить без регистрации
ПочтаНеобходима, но никому не показывается
By clicking “Отправить ответ”, you agree to our terms of service and acknowledge that you have read and understand our privacy policy and code of conduct.
bash — Перекодирование koi-8 в cp1251
#!/bin/bash function koiwin { num=( 30 00 01 22 04 05 20 03 21 08 09 10 11 12 13 14 \ 15 31 16 17 18 19 06 02 28 27 07 24 29 25 23 26 ) for i in ${num[*]}; do low=$low"\3$i" up=$up"\3`expr $i + 40`" done echo $up$low return } if test $# -lt 2 then echo "Usage: `basename $0` input.koi output.win table"; exit −7 fi if ! test -f $1 then echo "$1: No such regular file" >&2; exit 2 fi if ! test -f $3 then echo "$3: No such regular file" >&2; exit 2 fi if ! test -r $1 then echo "$1: Permission denied to read" >&2; exit 13 fi if ! test -r $3 then echo "$3: Permission denied to read" >&2; exit 13 fi curdir=`pwd` outdir=`expr $2 : '\(.*/\)' \| $curdir` if [ ! -w $outdir -a ! -e $2 ] then echo "$outdir: Permission denied to write" >&2; exit -13 fi if test -d $2 then echo "$2: Is directory" >&2; exit 21 fi if [ -e $2 -a ! -w $2 ] then echo $2: Permission denied to rewrite; exit 13 fi cat $1 | tr "\300-\337\340-\377" `koiwin` > $2 exit 0
сделал скрипт, на выход кракозябры, не понимаю почему
- bash
- cp1251
вы неправильно перекодируете.
num=(36 00 01 26 04 05 24 03 25 10 11 12 13 14 15 \ 16 17 37 20 21 22 23 06 02 34 33 07 30 35 31 27 32)
вы упустили буквы
ёЁ
, которые в этих кодировках будут иметь такие восьмиричные коды:$ echo -n ёЁ | iconv -t koi8r | od -A n -b 243 263 $ echo -n ёЁ | iconv -t cp1251 | od -A n -b 270 250
без лишнего мусора скрипт будет выглядеть, например, так:
#!/bin/bash function koiwin { num=(36 00 01 26 04 05 24 03 25 10 11 12 13 14 15 16 \ 17 37 20 21 22 23 06 02 34 33 07 30 35 31 27 32) for i in ${num[*]}; do low="$low\3$i" up="$up\3$(expr $i + 40)" done # ёЁ up="\250$up" low="\270$low" echo $up$low } tr "\263\300-\337\243\340-\377" $(koiwin)
читает строку в кодировке koi8r из stdin, записывает строку в кодировке cp1251 в stdout.
Зарегистрируйтесь или войдите
Регистрация через Google Регистрация через Facebook Регистрация через почтуОтправить без регистрации
ПочтаНеобходима, но никому не показывается
Отправить без регистрации
ПочтаНеобходима, но никому не показывается
By clicking “Отправить ответ”, you agree to our terms of service and acknowledge that you have read and understand our privacy policy and code of conduct.
Windows-1251
Windows-1251Кодировка ( CCS ) Windows-1251 (CP1251.TXT).
# # Имя: cp1251 в таблицу Unicode # Версия Юникода: 2.0 # Версия таблицы: 2.01 # Формат таблицы: Формат A # Дата: 15.04.98 # # Контакт: [email protected] # # Общие примечания: нет # # Формат: три столбца, разделенных табуляцией. # Столбец №1 — это код cp1251 (в шестнадцатеричном формате) # Столбец № 2 — это Unicode (в шестнадцатеричном формате 0xXXXX) # Столбец №3 — это имя Unicode (после знака комментария '#') # # Записи идут в порядке cp1251 # 0x00 0x0000 #НОЛЬ 0x01 0x0001 # НАЧАЛО ЗАГОЛОВКА 0x02 0x0002 # НАЧАЛО ТЕКСТА 0x03 0x0003 #КОНЕЦ ТЕКСТА 0x04 0x0004 # КОНЕЦ ПЕРЕДАЧИ 0x05 0x0005 # ЗАПРОС 0x06 0x0006 # ПОДТВЕРЖДЕНИЕ 0x07 0x0007 # ЗВОНОК 0x08 0x0008 # НАЗАД 0x090x0009 # ГОРИЗОНТАЛЬНАЯ ТАБЛИЦА 0x0A 0x000A # ПЕРЕВОД СТРОКИ 0x0B 0x000B #ВЕРТИКАЛЬНАЯ ТАБУЛЯЦИЯ 0x0C 0x000C #ПОДАЧА ФОРМЫ 0x0D 0x000D #ВОЗВРАТ КАРЕТКИ 0x0E 0x000E #СМЕЩЕНИЕ ВНЕ 0x0F 0x000F #СМЕЩЕНИЕ В 0x10 0x0010 # ESCAPE КАНАЛА ДАННЫХ 0x11 0x0011 #УПРАВЛЕНИЕ УСТРОЙСТВОМ ОДИН 0x12 0x0012 #УПРАВЛЕНИЕ УСТРОЙСТВОМ ДВА 0x13 0x0013 #УПРАВЛЕНИЕ УСТРОЙСТВОМ ТРИ 0x14 0x0014 #УПРАВЛЕНИЕ УСТРОЙСТВОМ ЧЕТЫРЕ 0x15 0x0015 #ОТРИЦАТЕЛЬНОЕ ПОДТВЕРЖДЕНИЕ 0x16 0x0016 #СИНХРОННЫЙ ПРОСТОЙ 0x17 0x0017 # КОНЕЦ БЛОКА ПЕРЕДАЧИ 0x18 0x0018 #ОТМЕНА 0x190x0019 #КОНЕЦ СРЕДСТВА 0x1A 0x001A #ЗАМЕНИТЬ 0x1B 0x001B #ESCAPE 0x1C 0x001C # РАЗДЕЛИТЕЛЬ ФАЙЛОВ 0x1D 0x001D # РАЗДЕЛИТЕЛЬ ГРУПП 0x1E 0x001E #РАЗДЕЛИТЕЛЬ ЗАПИСИ 0x1F 0x001F #РАЗДЕЛИТЕЛЬ БЛОК 0x20 0x0020 #ПРОБЕЛ 0x21 0x0021 #ВОСКЛИЦАТЕЛЬНЫЙ ЗНАК 0x22 0x0022 #КАТЫЧКА 0x23 0x0023 # ЗНАК НОМЕРА 0x24 0x0024 #ЗНАК ДОЛЛАРА 0x25 0x0025 # ЗНАК ПРОЦЕНТА 0x26 0x0026 #АМПЕРСАНД 0x27 0x0027 #АПОСТРФ 0x28 0x0028 # ЛЕВАЯ СКОБКА 0x290x0029 #ПРАВАЯ СКОБКА 0x2A 0x002A #ЗВЕЗДОЧКА 0x2B 0x002B # ЗНАК ПЛЮС 0x2C 0x002C # ЗАПЯТАЯ 0x2D 0x002D #ДЕФИС-МИНУС 0x2E 0x002E #ПОЛНАЯ СТОП 0x2F 0x002F #СОЛИДУС 0x30 0x0030 #ЦИФРА НОЛЬ 0x31 0x0031 # ЦИФРА ОДИН 0x32 0x0032 # ВТОРАЯ ЦИФРА 0x33 0x0033 # ЦИФРА ТРИ 0x34 0x0034 #ЧЕТВЕРТАЯ ЦИФРА 0x35 0x0035 #ЦИФРА ПЯТАЯ 0x36 0x0036 #ЦИФРА ШЕСТЬ 0x37 0x0037 # ЦИФРА СЕДЬМАЯ 0x38 0x0038 #ЦИФРА ВОСЕМЬ 0x39 0x0039 #ЦИФРА ДЕВЯТЬ 0x3A 0x003A #COLON 0x3B 0x003B # ТОЧКА С ЗАПЯТОЙ 0x3C 0x003C # ЗНАК МЕНЬШЕ 0x3D 0x003D #ЗНАК РАВНО 0x3E 0x003E # ЗНАК БОЛЬШЕ 0x3F 0x003F #ВОПРОСИТЕЛЬНЫЙ ЗНАК 0x40 0x0040 #КОММЕРЧЕСКИЙ В 0x41 0x0041 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА A 0x42 0x0042 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА B 0x43 0x0043 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА C 0x44 0x0044 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА D 0x45 0x0045 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА E 0x46 0x0046 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА F 0x47 0x0047 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА G 0x48 0x0048 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА H 0x490x0049 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА I 0x4A 0x004A #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА J 0x4B 0x004B #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА K 0x4C 0x004C #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА L 0x4D 0x004D #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА M 0x4E 0x004E #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА N 0x4F 0x004F #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА O 0x50 0x0050 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА P 0x51 0x0051 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА Q 0x52 0x0052 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА R 0x53 0x0053 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА S 0x54 0x0054 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА T 0x55 0x0055 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА U 0x56 0x0056 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА V 0x57 0x0057 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА W 0x58 0x0058 #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА X 0x590x0059 # ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА Y 0x5A 0x005A #ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА Z 0x5B 0x005B # ЛЕВАЯ КВАДРАТНАЯ СКОБКА 0x5C 0x005C #ОБРАТНОЕ СОЛИДУС 0x5D 0x005D #ПРАВАЯ КВАДРАТНАЯ СКОБКА 0x5E 0x005E #ЦИРКУМФЛЕКС АКЦЕНТ 0x5F 0x005F #НИЗКАЯ ЛИНИЯ 0x60 0x0060 #МОГИЛЬНЫЙ АКЦЕНТ 0x61 0x0061 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА A 0x62 0x0062 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА B 0x63 0x0063 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА C 0x64 0x0064 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА D 0x65 0x0065 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА E 0x66 0x0066 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА F 0x67 0x0067 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА G 0x68 0x0068 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА H 0x690x0069 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА I 0x6A 0x006A # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА J 0x6B 0x006B # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА K 0x6C 0x006C # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА L 0x6D 0x006D # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА M 0x6E 0x006E # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА N 0x6F 0x006F # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА O 0x70 0x0070 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА P 0x71 0x0071 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Q 0x72 0x0072 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА R 0x73 0x0073 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА S 0x74 0x0074 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Т 0x75 0x0075 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА U 0x76 0x0076 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА V 0x77 0x0077 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА W 0x78 0x0078 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА X 0x790x0079 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Y 0x7A 0x007A # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Z 0x7B 0x007B # ЛЕВАЯ ФИГУРНАЯ СКОБКА 0x7C 0x007C #ВЕРТИКАЛЬНАЯ ЛИНИЯ 0x7D 0x007D #ПРАВАЯ ФИГУРНАЯ СКОБКА 0x7E 0x007E #ТИЛЬДА 0x7F 0x007F #УДАЛИТЬ 0x80 0x0402 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА DJE 0x81 0x0403 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА GJE 0x82 0x201A # ОДИНОЧНАЯ МЛАДШАЯ-9 КАВАТЫ 0x83 0x0453 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА GJE 0x84 0x201E #ДВОЙНАЯ МЛАДШАЯ-9 КАВАТЫ 0x85 0x2026 #ГОРИЗОНТАЛЬНЫЙ ЭЛЛИПСИС 0x86 0x2020 # КИНЖАЛ 0x87 0x2021 # ДВОЙНОЙ КИНЖАЛ 0x88 0x20AC #ЗНАК ЕВРО 0x890x2030 #ПРОМЫШЛЕННЫЙ ЗНАК 0x8A 0x0409 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА LJE 0x8B 0x2039 #ОДИНАРНЫЙ УГОЛ, НАПРАВЛЕННЫЙ ВЛЕВО КАВАТЫ 0x8C 0x040A #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА NJE 0x8D 0x040C #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА KJE 0x8E 0x040B #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЦШЕ 0x8F 0x040F #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ДЖЕ 0x90 0x0452 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА DJE 0x91 0x2018 # ЛЕВАЯ ОДИНАРНАЯ КАВАТЫ 0x92 0x2019 #ПРАВАЯ ОДИНАРНАЯ КАВАТЫ 0x93 0x201C #ЛЕВАЯ ДВОЙНАЯ КАВАТЫ 0x94 0x201D #ПРАВАЯ ДВОЙНАЯ КАПОТА 0x95 0x2022 #ПУЛЯ 0x96 0x2013 #EN ТИРЕ 0x97 0x2014 #ЭМ ТИРЕ 0x98 # НЕОПРЕДЕЛЕНО 0x99 0x2122 # ЗНАК ТОРГОВОЙ МАРКИ 0x9A 0x0459 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА LJE 0x9B 0x203A #ОДИНОЧНЫЙ УГОЛ, УКАЗЫВАЮЩИЙ ВПРАВО КАВАТЫ 0x9C 0x045A #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА NJE 0x9D 0x045C #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА KJE 0x9E 0x045B #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ЦШЕ 0x9F 0x045F #СТРОЧНАЯ БУКВА ДЖЕ 0xA0 0x00A0 #БЕЗ РАЗРЫВА ПРОБЕЛ 0xA1 0x040E #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА КОРОТКАЯ U 0xA2 0x045E #КИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА КОРОТКАЯ U 0xA3 0x0408 # ЗАГЛАВНАЯ БУКВА JE 0xA4 0x00A4 #ЗНАК ВАЛЮТЫ 0xA5 0x0490 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА GHE С ВВЕРХОМ 0xA6 0x00A6 # Сломанная полоса 0xA7 0x00A7 # ЗНАК СЕКЦИИ 0xA8 0x0401 # ЗАГЛАВНАЯ БУКВА IO 0xA9 0x00A9 # ЗНАК АВТОРСКОГО ПРАВА 0xAA 0x0404 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА УКРАИНСКИЙ IE 0xAB 0x00AB #НАПРАВЛЯЮЩАЯ ВЛЕВО ДВУХУГОЛЬНАЯ КАВАЧКА 0xAC 0x00AC # НЕ ЗНАК 0xAD 0x00AD #МЯГКИЙ ДЕФЕС 0xAE 0x00AE ЗНАК ЗАРЕГИСТРИРОВАННЫЙ # 0xAF 0x0407 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЙИ 0xB0 0x00B0 #ЗНАК СТЕПЕНИ 0xB1 0x00B1 # ЗНАК ПЛЮС-МИНУС 0xB2 0x0406 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА БЕЛОРУССКО-УКРАИНСКАЯ I 0xB3 0x0456 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА БЕЛОРУССКО-УКРАИНСКАЯ I 0xB4 0x0491 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА GHE С ПЕРЕВЕРТОМ ВВЕРХ 0xB5 0x00B5 #МИКРОЗНАК 0xB6 0x00B6 ЗНАК #ПИЛКРОУ 0xB7 0x00B7 #СРЕДНЯЯ ТОЧКА 0xB8 0x0451 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА IO 0xB9 0x2116 # ЗНАК ЦИФРЫ 0xBA 0x0454 #СТРОЧНАЯ КИРИЛЛИЧНАЯ УКРАИНСКАЯ БУКВА IE 0xBB 0x00BB # ДВУХУГОЛЬНАЯ КАВАЧКА, УКАЗЫВАЮЩАЯ ВПРАВО 0xBC 0x0458 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА JE 0xBD 0x0405 # ЗАГЛАВНАЯ БУКВА ДЗЕ 0xBE 0x0455 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ДЗЕ 0xBF 0x0457 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ЙИ 0xC0 0x0410 # ЗАГЛАВНАЯ БУКВА A 0xC1 0x0411 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА BE 0xC2 0x0412 # ЗАГЛАВНАЯ БУКВА VE 0xC3 0x0413 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА GHE 0xC4 0x0414 # ЗАГЛАВНАЯ БУКВА DE 0xC5 0x0415 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА IE 0xC6 0x0416 # ЗАГЛАВНАЯ БУКВА ЖЕ 0xC7 0x0417 # ЗАГЛАВНАЯ БУКВА ZE 0xC8 0x0418 # ЗАГЛАВНАЯ БУКВА I 0xC90x0419 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА КОРОТКАЯ I 0xCA 0x041A #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА КА 0xCB 0x041B #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EL 0xCC 0x041C #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EM 0xCD 0x041D #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EN 0xCE 0x041E #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА O 0xCF 0x041F #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА PE 0xD0 0x0420 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ER 0xD1 0x0421 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ES 0xD2 0x0422 # ЗАГЛАВНАЯ БУКВА TE 0xD3 0x0423 # ЗАГЛАВНАЯ БУКВА U 0xD4 0x0424 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EF 0xD5 0x0425 # ЗАГЛАВНАЯ БУКВА HA 0xD6 0x0426 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TSE 0xD7 0x0427 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЧЕ 0xD8 0x0428 #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ША 0xD90x0429 # ЗАГЛАВНАЯ БУКВА ЩА 0xDA 0x042A #ПРОГЛАВНАЯ БУКВА КИРИЛЛИЧЕСКИЙ ЖЕСТКИЙ ЗНАК 0xDB 0x042B #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЕРУ 0xDC 0x042C #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА МЯГКИЙ ЗНАК 0xDD 0x042D #КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА E 0xDE 0x042E # ЗАГЛАВНАЯ БУКВА Ю 0xDF 0x042F # ЗАГЛАВНАЯ БУКВА YA 0xE0 0x0430 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА A 0xE1 0x0431 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА BE 0xE2 0x0432 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА VE 0xE3 0x0433 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА GHE 0xE4 0x0434 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА DE 0xE5 0x0435 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА IE 0xE6 0x0436 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ЖЕ 0xE7 0x0437 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ZE 0xE8 0x0438 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА I 0xE90x0439 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА КОРОТКАЯ I 0xEA 0x043A #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА КА 0xEB 0x043B #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА EL 0xEC 0x043C #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА EM 0xED 0x043D #СТРОЧНАЯ БУКВА EN 0xEE 0x043E #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА O 0xEF 0x043F #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА PE 0xF0 0x0440 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ER 0xF1 0x0441 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ES 0xF2 0x0442 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА TE 0xF3 0x0443 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА U 0xF4 0x0444 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА EF 0xF5 0x0445 # СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА HA 0xF6 0x0446 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ТСЭ 0xF7 0x0447 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ЧЕ 0xF8 0x0448 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ША 0xF90x0449 #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ЩА 0xFA 0x044A #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ЖЕСТКИЙ ЗНАК 0xFB 0x044B #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ЕРУ 0xFC 0x044C #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА МЯГКИЙ ЗНАК 0xFD 0x044D #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА E 0xFE 0x044E #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА Ю 0xFF 0x044F #СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА Я
Ubuntu Manpage: cp1251 — набор символов CP 1251, закодированный в восьмеричной, десятичной и шестнадцатеричной системе счисления
Предоставлено: manpages_3.
ИМЯ
cp1251 - набор символов CP 1251, закодированный в восьмеричной, десятичной и шестнадцатеричной системе счисления.ОПИСАНИЕ
Кодовые страницы Windows включают несколько 8-битных расширений набора символов ASCII (также известный как ISO 646-IRV). CP 1251 кодирует символы, используемые в кириллице. В следующей таблице показаны символы в CP 1251, которые доступны для печати и не перечислены в страницу руководства ascii (7). В четвертом столбце будут отображаться только правильные глифы в среда настроена для CP 1251. Октябрь Декабрь Шестнадцатеричный Символ Описание ──────────────────────────────────────── ────────── ──────────────────── 200 128 80 ЗАГЛАВНАЯ БУКВА DJE 201 12981 КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА GJE 202 130 82 ОДИНАРНАЯ МЛАДШАЯ-9 КАВАТЫ 203 131 83 СТРОЧНАЯ БУКВА ГЖЕ 204 132 84 ДВОЙНАЯ МЛАДШАЯ-9 КАВАТЫ 205 133 85 ГОРИЗОНТАЛЬНЫЙ ЭЛЛИПСИС 206 134 86 КИНЖАЛ 207 135 87 ДВОЙНОЙ КИНЖАЛ 210 136 88 ЗНАК ЕВРО 211 137 89 НА ТЫСЯЧУ ЗНАКОВ 212 138 8A ЗАГЛАВНАЯ БУКВА LJE 213 139 8B ОДИНОЧНЫЙ УГОЛ, УКАЗЫВАЮЩИЙ ВЛЕВО КАвычки 214 140 8C КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА NJE 215 141 8D ЗАГЛАВНАЯ БУКВА KJE 216 142 8E ЗАГЛАВНАЯ БУКВА ТШЕ 217 143 8F ЗАГЛАВНАЯ БУКВА ДЖЕ 220 144 90 СТРОЧНАЯ БУКВА DJE 221 145 91 ЛЕВАЯ ОДИНАРНАЯ КАВАТЫ 222 146 92 ПРАВАЯ ОДИНАРНАЯ КАВАКА 223 147 93 ЛЕВАЯ ДВОЙНАЯ КАВАТЫ 224 148 94 ПРАВАЯ ДВОЙНАЯ КАВАЧКА 225 149 95 ПУЛЯ 226 150 96 РУКОЯТКА 227 151 97 ЭМ ТИРЕ 230 152 98 НЕОПРЕДЕЛЕН 231 153 99 ЗНАК ТОРГОВОЙ МАРКИ 232 154 9A СТРОЧНАЯ БУКВА LJE 233 155 9B ОДИНОЧНЫЙ УГОЛ, УКАЗЫВАЮЩИЙ ВПРАВО КАвычки 234 156 9C СТРОЧНАЯ БУКВА NJE 235 157 9D СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА KJE 236 158 9E СТРОЧНАЯ БУКВА ТШЕ 237 159 9F СТРОЧНАЯ БУКВА ДЖЕ 240 160 A0 НЕРАЗРЫВНЫЙ ПРОБЕЛ 241 161 A1 ¡ КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА U 242 162 A2 ¢ СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА U 243 163 A3 £ ЗАГЛАВНАЯ БУКВА JE 244 164 A4 ¤ ЗНАК ВАЛЮТЫ 245 165 A5 ¥ ЗАГЛАВНАЯ БУКВА GHE С ПЕРЕВЕРТОМ 246 166 A6 ¦ Сломанный стержень 247 167 A7 § ЗНАК РАЗДЕЛА 250 168 A8 ¨ ЗАГЛАВНАЯ БУКВА IO 251 169A9 © ЗНАК АВТОРСКОГО ПРАВА 252 170 АА ª ЗАГЛАВНАЯ БУКВА УКРАИНСКИЙ ИЕ 253 171 AB « ДВУХУГОЛЬНАЯ КАВАЧКА, УКАЗЫВАЮЩАЯ ВЛЕВО 254 172 AC ¬ НЕ ЗНАК 255 173 ОБЪЯВЛЕНИЕ МЯГКИЙ ДЕФЕС 256 174 ЗАРЕГИСТРИРОВАННЫЙ ЗНАК AE ® 257 175 AF ¯ ЗАГЛАВНАЯ БУКВА ЙИ 260 176 B0 ЗНАК ГРАДУСОВ 261 177 B1 ± ЗНАК ПЛЮС-МИНУС 262 178 B2 ² ЗАГЛАВНАЯ БУКВА БЕЛОРУССКИЙ-УКРАИНСКИЙ I 263 179B3 ³ СТРОЧНАЯ КИРИЛЛИЧНАЯ БЕЛОРУССКАЯ-УКРАИНСКАЯ БУКВА I 264 180 B4 ´ СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА GHE С ПЕРЕВЕРТОМ 265 181 B5 µ МИКРОЗНАК 266 182 B6 ¶ ЗНАК НАШИВКИ 267 183 B7 · СРЕДНЯЯ ТОЧКА 270 184 B8 ¸ СТРОЧНАЯ БУКВА IO 271 185 B9 ¹ ЗНАК ЦИФРЫ 272 186 ВА º КИРИЛЛИЧЕСКАЯ СТРОЧНАЯ УКРАИНСКАЯ БУКВА IE 273 187 BB » ДВУХУГОЛЬНАЯ КАВАЧКА, УКАЗЫВАЮЩАЯ ВПРАВО 274 188 г.ПРИМЕЧАНИЯдо н.э. ¼ СТРОЧНАЯ БУКВА ДЖЕ 275 189BD ½ ЗАГЛАВНАЯ БУКВА ДЗЕ 276 190 БЭ ¾ СТРОЧНАЯ БУКВА ДЗЕ 277 191 БФ ¿ СТРОЧНАЯ БУКВА ЙИ 300 192 C0 À ЗАГЛАВНАЯ БУКВА A 301 193 C1 Á ЗАГЛАВНАЯ БУКВА BE 302 194 C2 Â ЗАГЛАВНАЯ БУКВА VE 303 195 C3 Ã ЗАГЛАВНАЯ БУКВА GHE 304 196 C4 Ä ЗАГЛАВНАЯ БУКВА DE 305 197 C5 Å ЗАГЛАВНАЯ БУКВА IE 306 198 C6 Æ ЗАГЛАВНАЯ БУКВА ЖЕ 307 199 C7 v ЗАГЛАВНАЯ БУКВА ZE 310 200 C8 È ЗАГЛАВНАЯ БУКВА I 311 201 C9 É ЗАГЛАВНАЯ БУКВА КОРОТКАЯ I 312 202 CA Ê ЗАГЛАВНАЯ БУКВА КА 313 203 CB Ë ЗАГЛАВНАЯ БУКВА EL 314 204 CC Ì ЗАГЛАВНАЯ БУКВА EM 315 205 CD Í ЗАГЛАВНАЯ БУКВА RU 316 206 CE Î ЗАГЛАВНАЯ БУКВА O 317 207 CF Ï ЗАГЛАВНАЯ БУКВА PE 320 208 D0 Ð ЗАГЛАВНАЯ БУКВА ER 321 209D1 Ñ ЗАГЛАВНАЯ БУКВА ES 322 210 D2 Ò ЗАГЛАВНАЯ БУКВА TE 323 211 D3 Ó ЗАГЛАВНАЯ БУКВА U 324 212 D4 Ô ЗАГЛАВНАЯ БУКВА EF 325 213 D5 Õ ЗАГЛАВНАЯ БУКВА HA 326 214 D6 Ö ЗАГЛАВНАЯ БУКВА ТСЭ 327 215 D7 × ЗАГЛАВНАЯ БУКВА ЧЕ 330 216 D8 Ø ЗАГЛАВНАЯ БУКВА ША 331 217 D9 Ù ЗАГЛАВНАЯ БУКВА ЩА 332 218 DA Ú КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ПРОЧНЫЙ ЗНАК 333 219DB Û ЗАГЛАВНАЯ БУКВА ЕРУ 334 220 DC Ü КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА МЯГКИЙ ЗНАК 335 221 DD Ý ЗАГЛАВНАЯ БУКВА E 336 222 DE Þ ЗАГЛАВНАЯ БУКВА Ю 337 223 DF ß ЗАГЛАВНАЯ БУКВА Я 340 224 E0 à КИРИЛЛИЧНАЯ СТРОЧНАЯ БУКВА A 341 225 E1 á СТРОЧНАЯ БУКВА BE 342 226 E2 â Кириллическая СТРОЧНАЯ БУКВА VE 343 227 E3 ã СТРОЧНАЯ БУКВА GHE 344 228 E4 ä СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА DE 345 229E5 å СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА IE 346 230 E6 æ СТРОЧНАЯ БУКВА ЖЕ 347 231 E7 ç СТРОЧНАЯ БУКВА ZE 350 232 E8 è СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА I 351 233 E9 é СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА КОРОТКАЯ I 352 234 EA ê СТРОЧНАЯ БУКВА KA 353 235 EB ë СТРОЧНАЯ БУКВА EL 354 236 EC ì СТРОЧНАЯ БУКВА EM 355 237 ED í СТРОЧНАЯ БУКВА EN 356 238 EE î СТРОЧНАЯ БУКВА О 357 239EF ï СТРОЧНАЯ БУКВА PE 360 240 F0 ð СТРОЧНАЯ БУКВА ER 361 241 F1 – СТРОЧНАЯ БУКВА ES 362 242 F2 ò СТРОЧНАЯ БУКВА TE 363 243 F3 — СТРОЧНАЯ БУКВА U 364 244 F4 ô СТРОЧНАЯ БУКВА EF 365 245 F5 х Кириллическая СТРОЧНАЯ БУКВА HA 366 246 F6 ö СТРОЧНАЯ БУКВА ТСЕ 367 247 F7 ÷ СТРОЧНАЯ БУКВА ЧЕ 370 248 F8 ø СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ША 371 249F9 ù СТРОЧНАЯ БУКВА ЩА 372 250 FA ú СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА ПРОЧНЫЙ ЗНАК 373 251 FB û СТРОЧНАЯ БУКВА ЕРУ 374 252 FC ü МЯГКИЙ ЗНАК СТРОЧНОЙ БУКВЫ КИРИЛЛИЦЫ 375 253 FD ý СТРОЧНАЯ БУКВА E 376 254 ФЭ þ СТРОЧНАЯ БУКВА Ю 377 255 FF ÿ СТРОЧНАЯ БУКВА Я
CP 1251 также известен как кириллица Windows.