Таблица виндовс 1251: Кодировка виндовс 1251 таблица.

Содержание

Windows 1251 — это… Что такое Windows 1251?

  • Windows-1251 — (a.k.a. code page CP1251) is a popular 8 bit character encoding, designed to cover languages that use the Cyrillic alphabet such as Russian, Bulgarian, Serbian Cyrillic and other languages. It is the most widely used for encoding the Bulgarian,… …   Wikipedia

  • Windows-1251 — набор символов и кодировка, являющаяся стандартной 8 битной кодировкой для всех русских версий Microsoft Windows. Пользуется довольно большой популярностью. Была создана на базе кодировок, использовавшихся в ранних «самопальных» русификаторах… …   Википедия

  • Windows-1251 — (a.k.a. CP1251) es un popular juego de caracteres de 8 bits, diseñado para cubrir lenguajes que usan el alfabeto cirilico como son el lenguaje Ruso y otros lenguajes. Este es la codifiación más ampliamente usada para codificar Búlgaro, Serbio y… …   Wikipedia Español

  • Windows-1251 — Windows Codepages 874  Thai 932  Japanisch 936  Vereinfachtes Chinesisch 949  Koreanisch 950  Traditionelles Chinesisch 1250  Mitteleuropäisch 1251  Kyrillisch 1252 …   Deutsch Wikipedia

  • Windows (значения) — Windows: Microsoft Windows  семейство проприетарных операционных систем корпорации Microsoft, ориентированных на применение графического интерфейса при управлении. Windows (клавиша)  клавиша на клавиатурах ПК совместимых компьютеров,… …   Википедия

  • Windows-1252 — ISO 8859 1 Latin 1, Westeuropäisch 2 Latin 2, Mitteleuropäisch 3 Latin 3, Südeuropäisch 4 Latin 4, Baltisch 5 Kyrillisch 6 Arabisch 7 Griechisch 8 …   Deutsch Wikipedia

  • Windows-1252 — ISO/IEC 8859 1 (также известная как ISO 8859 1 и Latin 1) кодовая страница, предназначенная для западноевропейских языков; она базируется на символьном наборе популярных в прошлом терминалов ISO 8859. ISO 8859 1 кодировка, зарегистрированная… …   Википедия

  • Windows code page — Windows code pages are sets of characters or code pages (known as character encodings in other operating systems) used in Microsoft Windows from the 1980s and 1990s. Windows code pages were gradually superseded when Unicode was implemented in… …   Wikipedia

  • Windows Glyph List 4 — (сокр. WGL4, также известен как Общеевропейский набор символов англ. Pan European character set) определённый компанией Майкрософт набор из 652 типографических символов Юникода, призванный помочь разработчикам шрифтов в обеспечении… …   Википедия

  • Windows-1254 — Windows 1254  кодовая страница, используемая Microsoft Windows для представления турецкого языка. Символы с кодами от A0 до FF совместимы с ISO 8859 9. Для современных приложений UTF 8 предпочтительней windows 1254. Таблица кодов Символы с… …   Википедия

  • htaccess кодировка windows 1251 — ComputerMaker.info

    Автор admin На чтение 5 мин.

    Кодировка windows 1251 была создана в начале 90 годов для русификации программных продуктов, выпускаемых корпорацией Microsoft :


    Кодировка является 8-битной и включает в себя символы славянской группы языков, в которую входят русский, белорусский, украинский, болгарский, македонский, сербский – это дает преимущество перед остальными кириллическими кодировками ( ISO 8859-5, KOI8-R, CP866 ). Однако у 1251-кодировки имеются и весомые недостатки:

    • 0xFF (25510) – это код, который зарезервирован для символа «я». В программах, которые не поддерживают чистый 8-ой бит, часто возникают непредсказуемые проблемы;
    • Нет псевдографики, которая присутствует в KOI8 , CP866 .

    Ниже приведены символы из Code Page 1251 или сокращенно СР1251 ( числа под символами являются кодом в шестнадцатеричной системе такого же символа в Юникоде ):

    Кодировка windows 1251 в html

    Нередко у web-разработчиков и блогеров, обладающих различной квалификацией возникает проблема с кодировкой страниц: вместо подготовленного текста появляются неизвестные, нечитаемые символы. Чтобы разобраться с данной проблемой, необходимо понимать суть термина « кодировка страницы ».

    Текст в памяти компьютера хранится в виде определенного количества байт, а не в том виде, в котором он отображается в текстовом редакторе. Каждый байт является кодом, который соответствует одному символу. Для того чтобы текст на странице отображался как следует, нужно сообщить браузеру, какую таблицу кодов для расшифровки и отображения он должен использовать.

    Таблица кодировок не является универсальной, то есть, для расшифровки текста необходимо использовать ту, которая соответствует кодировке символов:


    Для того чтобы html-документ корректно отобразился в браузере, необходимо указать используемую кодировку. Делается это следующим образом:

    — между тегом и закрывающим его нужно прописать — исходя из этой строки, браузер будет использовать символы русского алфавита для отображения текста на странице.

    Кодировка windows 1251 в PHP

    Ни для кого не является тайной, что генерация страниц проходит путем выборки и использования какой-то части информации, которая хранится в базе данных. При написании сайта на PHP , чаще всего это mysql :


    Нередко при смене хостинга возникает проблема: различные кодировки информации в базе данных и в шаблонах страниц. Из-за этого одна сгенерированная страница может одновременно содержать несколько кодировок. Если информация на сайте представлена в кодировке виндовс 1251 , то и чтение из базы данных должно осуществляться с помощью таблицы, в которой представлена win 1251 кодировка.

    Для согласования расшифровки необходимо выполнить функцию mysql_query(«SET NAMES cp1251») – это означает, что преобразование из машинного кода будет осуществляться согласно таблице cp1251 .

    Кодировка windows 1251 в htaccess

    При создании сайта, предварительно настроив кодировки в шаблонах и базах данных, все равно может всплыть проблема некорректного отображения информации в браузере.

    Для того чтобы для веб-ресурса была задана кодировка виндовс-1251 , необходимо найти ( или создать ) файл .htaccess . Это файл, который хранит в себе дополнительные настройки и описания конфигураций web-сервера.

    В нем для установки кодировки следует прописать следующие строки:

    • DefaultLanguage ru;
    • AddDefaultCharset windows-1251;
    • php_value default_charset «cp1251».

    Таким образом, для корректного отображения текста должны совпадать его кодировка и таблица кодов, с помощью которой браузер будет расшифровывать символы. Для текстов, написанных на славянских языках, необходима win 1251 кодировка. Важно помнить, что элементы страниц и баз данных должны быть описаны с помощью одной таблицы кодов.

    Одна из самых частых проблем сайта — это его кодировка. И несмотря на это многие Web-мастера продолжают утверждать, что браузер сам выбирает кодировку. Действительно, он выбирает кодировку сам, но делает это не всегда правильно. Вот это и есть самая распространнёная ошибка с кодировкой: сайт в кодировке, допустим,

    UTF-8, а браузер настойчиво выбирает windows-1251. Вот как задать жёстко кодировку через файл htaccess, я расскажу в этой небольшой статье.

    Для того, чтобы задать кодировку файла в htaccess достаточно написать в нём всего одну строчку:

    Если Вам нужна windows-1251, то тогда так:

    Всего одна строчка и теперь браузер, независимо от своего предпочтения, будет выбирать указанную кодировку. Сразу говорю, данный способ — это действительно мощный. Вы должны понимать, что раз браузер неправильно распознаёт кодировку Вашего сайта (игнорируя даже мета-тег «ContentType«), значит, на то есть свои причины, поэтому внимательно проверьте: везде ли всё хорошо отображается.

    Надеюсь, что этой статьей я помог Вам решить проблему с кодировкой. А в следующей статье я расскажу о проблеме, связанной с

    кодировкой базы данных. Это тоже весьма частая проблема, которую многие не могут решить.

    Копирование материалов разрешается только с указанием автора (Михаил Русаков) и индексируемой прямой ссылкой на сайт (http://myrusakov.ru)!

    Добавляйтесь ко мне в друзья ВКонтакте: http://vk.com/myrusakov.
    Если Вы хотите дать оценку мне и моей работе, то напишите её в моей группе: http://vk.com/rusakovmy.

    Если Вы не хотите пропустить новые материалы на сайте,
    то Вы можете подписаться на обновления: Подписаться на обновления

    Если у Вас остались какие-либо вопросы, либо у Вас есть желание высказаться по поводу этой статьи, то Вы можете оставить свой комментарий внизу страницы.

    Порекомендуйте эту статью друзьям:

    Если Вам понравился сайт, то разместите ссылку на него (у себя на сайте, на форуме, в контакте):

    Она выглядит вот так:

  • BB-код ссылки для форумов (например, можете поставить её в подписи):
  • Комментарии ( 14 ):

    Фух норм инструкция, а то вроде все UTF 8, а браузер кракозябры показывает

    Русская кодировка через .htaccess | Хостинг сайтов. Качественный виртуальный хостинг сайтов

    Работа с ISPmanager

    Работа с биллингом

    Работа с сайтами

    Немного о доменах

    Способы оплаты хостинга

    Работа с различными CMS

    Еще на платном виртуальном хостинге trust-host.ru

    Очень часто встречаются ошибки в виде крокозябр, вопросиков и непонятных символов на сайтах, вместо нормально текста.
    это можно поправить через .htaccess

    Отображение не нужной кодировки связанно с тем что, на сервере по умолчанию допустим стоит универсальная кодировка utf-8, а на сайте используется windows-1251.

    Наша цель заставить обрабатывать сервер указанные сайты в нужной нам кодировке, для этого пишем в файле .htaccess

    Поддержка Работа с сайтами

    Выбор кодировки текста при открытии и сохранении файлов

    Как правило, при совместной работе с текстовыми файлами нет необходимости вникать в технические аспекты хранения текста. Однако если необходимо поделиться файлом с человеком, который работает с текстами на других языках, скачать текстовый файл из Интернета или открыть его на компьютере с другой операционной системой, может потребоваться задать кодировку при его открытии или сохранении.

    Когда вы открываете текстовый файл в Microsoft Word или другой программе (например, на компьютере, язык операционной системы на котором отличается от того, на котором написан текст в файле), кодировка помогает программе определить, в каком виде нужно вывести текст на экран, чтобы его можно было прочитать.

    В этой статье

    Общие сведения о кодировке текста

    То, что отображается на экране как текст, фактически хранится в текстовом файле в виде числового значения. Компьютер преобразует числические значения в видимые символы. Для этого используется кодикон.

    Кодировка — это схема нумерации, согласно которой каждому текстовому символу в наборе соответствует определенное числовое значение. Кодировка может содержать буквы, цифры и другие символы. В различных языках часто используются разные наборы символов, поэтому многие из существующих кодировок предназначены для отображения наборов символов соответствующих языков.

    Различные кодировки для разных алфавитов

    Сведения о кодировке, сохраняемые с текстовым файлом, используются компьютером для вывода текста на экран. Например, в кодировке «Кириллица (Windows)» знаку «Й» соответствует числовое значение 201. Когда вы открываете файл, содержащий этот знак, на компьютере, на котором используется кодировка «Кириллица (Windows)», компьютер считывает число 201 и выводит на экран знак «Й».

    Однако если тот же файл открыть на компьютере, на котором по умолчанию используется другая кодировка, на экран будет выведен знак, соответствующий числу 201 в этой кодировке. Например, если на компьютере используется кодировка «Западноевропейская (Windows)», знак «Й» из исходного текстового файла на основе кириллицы будет отображен как «É», поскольку именно этому знаку соответствует число 201 в данной кодировке.

    Юникод: единая кодировка для разных алфавитов

    Чтобы избежать проблем с кодированием и декодированием текстовых файлов, можно сохранять их в Юникоде. В состав этой кодировки входит большинство знаков из всех языков, которые обычно используются на современных компьютерах.

    Так как Word работает на базе Юникода, все файлы в нем автоматически сохраняются в этой кодировке. Файлы в Юникоде можно открывать на любом компьютере с операционной системой на английском языке независимо от языка текста. Кроме того, на таком компьютере можно сохранять в Юникоде файлы, содержащие знаки, которых нет в западноевропейских алфавитах (например, греческие, кириллические, арабские или японские).

    К началу страницы

    Выбор кодировки при открытии файла

    Если в открытом файле текст искажен или выводится в виде вопросительных знаков либо квадратиков, возможно, Word неправильно определил кодировку. Вы можете указать кодировку, которую следует использовать для отображения (декодирования) текста.

    1. Откройте вкладку Файл.

    2. Нажмите кнопку Параметры.

    3. Нажмите кнопку Дополнительно.

    4. Перейдите к разделу Общие и установите флажокПодтверждать преобразование формата файла при открытии.

      Примечание: Если установлен этот флажок, Word отображает диалоговое окно Преобразование файла при каждом открытии файла в формате, отличном от формата Word (то есть файла, который не имеет расширения DOC, DOT, DOCX, DOCM, DOTX или DOTM). Если вы часто работаете с такими файлами, но вам обычно не требуется выбирать кодировку, не забудьте отключить этот параметр, чтобы это диалоговое окно не выводилось.

    5. Закройте, а затем снова откройте файл.

    6. В диалоговом окне Преобразование файла выберите пункт Кодированный текст.

    7. В диалоговом окне Преобразование файла установите переключатель Другая и выберите нужную кодировку из списка.

      В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.

    Если почти весь текст выглядит одинаково (например, в виде квадратов или точек), возможно, на компьютере не установлен нужный шрифт. В таком случае можно установить дополнительные шрифты.

    Чтобы установить дополнительные шрифты, сделайте следующее:

    1. Нажмите кнопку Пуск и выберите пункт Панель управления.

    2. Выполните одно из указанных ниже действий.

      В Windows 7

      1. На панели управления выберите раздел Удаление программы.

      2. В списке программ щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.

      В Windows Vista

      1. На панели управления выберите раздел Удаление программы.

      2. В списке программ щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.

      В Windows XP

      1. На панели управления щелкните элемент Установка и удаление программ.

      2. В списке Установленные программы щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.

    3. В группе Изменение установки Microsoft Office нажмите кнопку Добавить или удалить компоненты и затем нажмите кнопку Продолжить.

    4. В разделе Параметры установки разверните элемент Общие средства Office, а затем — Многоязыковая поддержка.

    5. Выберите нужный шрифт, щелкните стрелку рядом с ним и выберите пункт Запускать с моего компьютера.

    Совет: При открытии текстового файла в той или иной кодировке в Word используются шрифты, определенные в диалоговом окне Параметры веб-документа. (Чтобы вызвать диалоговое окно Параметры веб-документа, нажмите кнопку Microsoft Office, затем щелкните Параметры Word и выберите категорию Дополнительно. В разделе Общие нажмите кнопку Параметры веб-документа.) С помощью параметров на вкладке Шрифты диалогового окна Параметры веб-документа можно настроить шрифт для каждой кодировки.

    К началу страницы

    Выбор кодировки при сохранении файла

    Если не выбрать кодировку при сохранении файла, будет использоваться Юникод. Как правило, рекомендуется применять Юникод, так как он поддерживает большинство символов большинства языков.

    Если документ планируется открывать в программе, которая не поддерживает Юникод, вы можете выбрать нужную кодировку. Например, в операционной системе на английском языке можно создать документ на китайском (традиционное письмо) с использованием Юникода. Однако если такой документ будет открываться в программе, которая поддерживает китайский язык, но не поддерживает Юникод, файл можно сохранить в кодировке «Китайская традиционная (Big5)». В результате текст будет отображаться правильно при открытии документа в программе, поддерживающей китайский язык (традиционное письмо).

    Примечание: Так как Юникод — это наиболее полный стандарт, при сохранении текста в других кодировках некоторые знаки могут не отображаться. Предположим, например, что документ в Юникоде содержит текст на иврите и языке с кириллицей. Если сохранить файл в кодировке «Кириллица (Windows)», текст на иврите не отобразится, а если сохранить его в кодировке «Иврит (Windows)», то не будет отображаться кириллический текст.

    Если выбрать стандарт кодировки, который не поддерживает некоторые символы в файле, Word пометит их красным. Вы можете просмотреть текст в выбранной кодировке перед сохранением файла.

    При сохранении файла в виде кодированного текста из него удаляется текст, для которого выбран шрифт Symbol, а также коды полей.

    Выбор кодировки

    1. Откройте вкладку Файл.

    2. Выберите пункт Сохранить как.

      Чтобы сохранить файл в другой папке, найдите и откройте ее.

    3. В поле Имя файла введите имя нового файла.

    4. В поле Тип файла выберите Обычный текст.

    5. Нажмите кнопку Сохранить.

    6. Если появится диалоговое окно Microsoft Office Word — проверка совместимости, нажмите кнопку Продолжить.

    7. В диалоговом окне Преобразование файла выберите подходящую кодировку.

      • Чтобы использовать стандартную кодировку, выберите параметр Windows (по умолчанию).

      • Чтобы использовать кодировку MS-DOS, выберите параметр MS-DOS.

      • Чтобы задать другую кодировку, установите переключатель Другая и выберите нужный пункт в списке. В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.

        Примечание: Чтобы увеличить область отображения документа, можно изменить размер диалогового окна Преобразование файла.

    8. Если появилось сообщение «Текст, выделенный красным, невозможно правильно сохранить в выбранной кодировке», можно выбрать другую кодировку или установить флажок Разрешить подстановку знаков.

      Если разрешена подстановка знаков, знаки, которые невозможно отобразить, будут заменены ближайшими эквивалентными символами в выбранной кодировке. Например, многоточие заменяется тремя точками, а угловые кавычки — прямыми.

      Если в выбранной кодировке нет эквивалентных знаков для символов, выделенных красным цветом, они будут сохранены как внеконтекстные (например, в виде вопросительных знаков).

    9. Если документ будет открываться в программе, в которой текст не переносится с одной строки на другую, вы можете включить в нем жесткие разрывы строк. Для этого установите флажок Вставлять разрывы строк и укажите нужное обозначение разрыва (возврат каретки (CR), перевод строки (LF) или оба значения) в поле Завершать строки.

    К началу страницы

    Поиск кодировок, доступных в Word

    Word распознает несколько кодировок и поддерживает кодировки, которые входят в состав системного программного обеспечения.

    Ниже приведен список письменностей и связанных с ними кодировок (кодовых страниц).

    Система письменности

    Кодировки

    Используемый шрифт

    Многоязычная

    Юникод (UCS-2 с прямым и обратным порядком байтов, UTF-8, UTF-7)

    Стандартный шрифт для стиля «Обычный» локализованной версии Word

    Арабская

    Windows 1256, ASMO 708

    Courier New

    Китайская (упрощенное письмо)

    GB2312, GBK, EUC-CN, ISO-2022-CN, HZ

    SimSun

    Китайская (традиционное письмо)

    BIG5, EUC-TW, ISO-2022-TW

    MingLiU

    Кириллица

    Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866

    Courier New

    Английская, западноевропейская и другие, основанные на латинице

    Windows 1250, 1252-1254, 1257, ISO8859-x

    Courier New

    Греческая

    Windows 1253

    Courier New

    Иврит

    Windows 1255

    Courier New

    Японская

    Shift-JIS, ISO-2022-JP (JIS), EUC-JP

    MS Mincho

    Корейская

    Wansung, Johab, ISO-2022-KR, EUC-KR

    Malgun Gothic

    Тайская

    Windows 874

    Tahoma

    Вьетнамская

    Windows 1258

    Courier New

    Индийские: тамильская

    ISCII 57004

    Latha

    Индийские: непальская

    ISCII 57002 (деванагари)

    Mangal

    Индийские: конкани

    ISCII 57002 (деванагари)

    Mangal

    Индийские: хинди

    ISCII 57002 (деванагари)

    Mangal

    Индийские: ассамская

    ISCII 57006

    Индийские: бенгальская

    ISCII 57003

    Индийские: гуджарати

    ISCII 57010

    Индийские: каннада

    ISCII 57008

    Индийские: малаялам

    ISCII 57009

    Индийские: ория

    ISCII 57007

    Индийские: маратхи

    ISCII 57002 (деванагари)

    Индийские: панджаби

    ISCII 57011

    Индийские: санскрит

    ISCII 57002 (деванагари)

    Индийские: телугу

    ISCII 57005

    • Для использования индийских языков необходима их поддержка в операционной системе и наличие соответствующих шрифтов OpenType.

    • Для непальского, ассамского, бенгальского, гуджарати, малаялам и ория доступна только ограниченная поддержка.

    К началу страницы

    что это и как используется

    Здравствуйте, уважаемые читатели моего блога. Сегодня мы поговорим с вами про кодировку. Если вы читали мою статью о том, как посмотреть код страницы в браузере, то знаете, что любой документ в интернете хранится не в том виде, в каком мы привыкли его видеть. Он записан при помощи непонятных человеку символов и знаков. С текстом все точно также.

    Существует несколько кодировок, а потому, иногда увидев непонятные символы при открытии книги в мобильном приложении или запилив статью на сайт, вы, поменяв кое-какие значения в настройках, увидите привычный глазу алфавит.

    Кодировка windows-1251 – что это такое, какое значение она имеет при создании сайта, какие символы будут доступны и является ли она лучшим решением на сегодняшний день? Обо всем этом в сегодняшней статье. Как всегда, простым языком, максимально понятно и с минимальным количеством терминов.

    Немного теории

    Любой документ на компьютере или в интернете, как я уже сказал, хранится в виде двоичного кода. К примеру, если вы используете кодировку ASCII, то буква «К» будет записана как 10001010, а windows 1251 под этим числом скрывается символ – Љ. В итоге, если браузер или программа обратится к другой таблице и считает вместо ASCII коды windows 1251, то читатель увидит совершенно непонятные ему символ.

    Логичен вопрос, нафига было придумывать множество таблиц с кодами? Дело в том, что помимо русского алфавита существует еще и английский, немецкий, китайский. По некоторым подсчетам, существует около 200 000 символов. Хотя, я не очень доверяю этой статистике, вспоминая про японский.

    Не забывайте, что для заглавной и строчной буквы нужно придумать свой код, есть запятые, тире и так далее.

    Чем больше в таблице символов, тем длиннее код каждого из них, а значит и вес документа становится больше.

    Представьте, если бы одна книга весила 4 Гб! Она бы очень долго загружалась, занимала все свободное место на компьютере. Решение о скачивании представлялось бы делом нелегким.

    Если вспомнить о сайтах, то вообще страшно подумать, что бы произошло. Каждая страничка открывалась даже на скоростном оптоволокне по часу с лишним! Думаю, мобильные телефоны можно было бы смело выкидывать. Пользоваться ими на улице даже с 4G? Сомневаюсь.

    По этим причинам каждый программист в свое время старался придумать свою таблицу символов. Чтобы было удобно для использования и вес сохранялся оптимальным.

    Microsoft, к примеру, для русскоязычного сегмента создали windows-1251. В ней, конечно же, есть свои достоинства и недостатки. Как и у любого другого продукта.

    Сейчас уже, лишь 2% всех страниц в интернете написано на 1251. Большинство веб-мастеров используют UTF-8. Почему так?

    Недостатки и достоинства

    UTF-8, в отличие от windows-1251 универсальная кодировка, в ней содержатся буквы различных алфавитов. Существует даже UTF-128, где есть вообще все языки – теулу, суахили, лаосский, мальтийский и так далее.

    UTF-8 победнее, буквы занимают в разы меньше места и занимают всего один байт памяти, как и в 1251. В УТФ есть редкие символы из других языков или специальные символы. Они-то и весят по 5-6 байтов, но в документе используются крайне редко.

    Эта кодировка более продумана, а потому ее использует большинство приложений по умолчанию. То есть, если вы не указываете программе, какую кодировку вы используете, то первым делом он проверит именно UTF-8 .

    Когда вы создаете html документ для сайта, то указываете браузерам на какую таблицу им обращать внимание при расшифровке записей.

    Для этого необходимо вставить в тег head следующие данные. После символов «charset=» идет либо утф, либо виндовс, как в примере ниже.

    <meta http-equiv="Content-Type" content="text/html; charset=windows-1251">

    <meta http-equiv=»Content-Type» content=»text/html; charset=windows-1251″>

    Если в дальнейшем вы захотите что-то поменять и вставить фразу на албанском, используя эту таблицу расшифровок, то ничего не получится, ведь этого языка кодировка не поддерживает. UTF‑8 без проблем позволит вам это сделать.

    Если вас заинтересовало правильное создание сайта, то я могу порекомендовать вам курс Михаила Русакова «Создание и Раскрутка сайта от А до Я».

    Он содержит в себе очень много – 256 уроков, затрагивающих HTML, CSS, JavaScript, PHP, MySQL и XML. Помимо языков программирования вы сможете понять как монетизировать сайт, то есть скорее и больше получать прибыль. Один из немногих курсов, в котором было бы так подробно разъяснено все, что нужно.

    Сам я вот уже год обучаюсь в школе блоггеров Александра Борисова. Это занимает в разы больше времени, конца и края пока не видно, но зато не менее исчерпывающе и дисциплинирует. Мотивирует продолжать разработку.

    Ну а если возникают вопросы, не нужно искать по интернету. Всегда есть грамотный наставник.

    Что-то я отошел от темы. Давайте вернемся к кодировкам.

    Базы банных

    Когда речь идет о php, все вообще страшно. Я уже рассказывал про базы данных, они используются для ускорения работы сайта. Обычно, вы к ним не обращаетесь, но когда появляется необходимость в переносе сайта становится не по себе.

    Сложности случаются у всех, не важно какой у вас опыт работы, стаж и выслуга лет. Некоторые странички в базе могут содержать в себе все доступные символы для виндовс-1251, другие, к примеру, в шаблонах страниц, в другой кодировке.

    Пока не нужен перенос все работает и функционирует, хоть и не совсем правильно. Но после переезда начинаются неприятности. В идеале вы должны использовать либо только УТФ, либо виндовс-1251, но по факту всегда и у всех случаются вот такие недочеты.

    Чтобы расшифровка согласовалась необходимо вписать код mysql_query(«SET NAMES cp1251»). В этом случае преобразование будет осуществлять по другому протоколу – cp1251.

    Htaccess

    Если на сайте вы настойчиво решили использовать именно 1251, то вам следует найти или создать файл htaccess. Он отвечает за настройки конфигурации. В него придется добавить еще три строчки, чтобы все сошлось.

    DefaultLanguage ru;
    AddDefaultCharset windows-1251;
    php_value default_charset "cp1251"

    DefaultLanguage ru; AddDefaultCharset windows-1251; php_value default_charset «cp1251»

    Я все же настоятельно рекомендую вам задумать о использовании UTF-8. Он более популярен, прост и богат. Какие бы решения вы не приняли сейчас, важно, чтобы впоследствии можно было все исправить. Добавить англоязычную версию сайта на этой кодировке будет в разы проще. Ничего не нужно исправлять.

    Решение остается за вами. Подписывайтесь на рассылку, чтобы узнавать как можно быстрее создавать правильные сайты, где учиться, чтобы не повторять чужих ошибок, а также какие блоггеры получают больше посетителей.

    До новых встреч и удачи в ваших начинаниях.

    набор символов CP 1251 в восьмеричном, десятичном и

    В следующей таблице показаны символы из набора CP 1251, являющиеся печатными и отсутствующие в справочной странице

    (7).

    ВосДесШесСимвОписание

    20012880ЂКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ДЕРВЬ
    20112981ЃКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ГЕ
    20213082ОДИНОЧНАЯ LOW-9/НИЖНЯЯ КАВЫЧКА
    20313183ѓКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ГЕ
    20413284ДВОЙНАЯ LOW-9/НИЖНЯЯ КАВЫЧКА
    20513385ГОРИЗОНТАЛЬНЫЙ ЭЛЛИПС
    20613486ТИПОГРАФСКИЙ КРЕСТИК
    20713587ДВОЙНОЙ КРЕСТИК
    21013688СИМВОЛ ЕВРО
    21113789ЗНАК ПРОМИЛЛЕ
    2121388AЉКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЛЕ
    2131398BОДИНОЧНАЯ ОТКРЫВАЮЩАЯ УГЛОВАЯ КАВЫЧКА
    2141408CЊКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА НЬЕ
    2151418DЌКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА КЭ
    2161428EЋКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ГЕРВЬ
    2171438FЏКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ДЖЕ
    22014490ђКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ДЬЖЕ
    22114591ОТКРЫВАЮЩАЯ ОДИНАРНАЯ КАВЫЧКА
    22214692ЗАКРЫВАЮЩАЯ ОДИНАРНАЯ КАВЫЧКА
    22314793ОТКРЫВАЮЩАЯ ДВОЙНАЯ КАВЫЧКА
    22414894ЗАКРЫВАЮЩАЯ ДВОЙНАЯ КАВЫЧКА
    22514995МЕТКА В ЦЕНТРЕ
    22615096СРЕДНЕЕ ТИРЕ
    22715197ДЛИННОЕ ТИРЕ
    23015298НЕ ОПРЕДЕЛЕНО
    23115399ЗНАК ТОРГОВОЙ МАРКИ
    2321549AљКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ЛЕ
    2331559BОДИНОЧНАЯ ЗАКРЫВАЮЩАЯ УГЛОВАЯ КАВЫЧКА
    2341569CњКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА НЬЕ
    2351579DќКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА КЭ
    2361589EћКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ГЕРВЬ
    2371599FџКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ДЖЕ
    240160A0 НЕРАЗРЫВНЫЙ ПРОБЕЛ
    241161A1ЎКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА У КРАТКОЕ
    242162A2ўКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА У КРАТКОЕ
    243163A3ЈКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЙЕ
    244164A4¤СИМВОЛ ВАЛЮТЫ
    245165A5ҐКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Г С ПОДЪЁМОМ
    246166A6¦ИЗЛОМАННАЯ ВЕРТИКАЛЬНАЯ ЧЕРТА
    247167A7§СИМВОЛ ПАРАГРАФА
    250168A8ЁКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Ё
    251169A9©ЗНАК ОХРАНЫ АВТОРСКОГО ПРАВА
    252170AAЄКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ УКРАИНСКАЯ БУКВА ЯКОРНОЕ Е
    253171AB«ОТКРЫВАЮЩАЯ ЛЕВАЯ КАВЫЧКА «ЁЛОЧКА»
    254172AC¬ЗНАК ОТРИЦАНИЯ
    255173AD­МЯГКИЙ ПЕРЕНОС
    256174AE®ЗАРЕГИСТРИРОВАННЫЙ ТОВАРНЫЙ ЗНАК
    257175AFЇКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЙИ
    260176B0°СИМВОЛ ГРАДУСА
    261177B1±ЗНАК ПЛЮС-МИНУС
    262178B2І КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА
    БЕЛОРУССКО-УКРАИНСКАЯ І
    263179B3іКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА
    БЕЛОРУССКО-УКРАИНСКАЯ И
    264180B4ґКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Г С ПОДЪЁМОМ
    265181B5µЗНАК МИКРО
    266182B6ЗНАК АБЗАЦА
    267183B7·ТОЧКА В ЦЕНТРЕ
    270184B8ёКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Ё
    271185B9ЗНАК НОМЕРА
    272186BAєКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА УКРАИНСКОЕ ЯКОРНОЕ Е
    273187BB»ЗАКРЫВАЮЩАЯ КАВЫЧКА «ЁЛОЧКА»
    274188BCјКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ЙЕ
    275189BDЅКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ДЗЕ
    276190BEѕКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ДЗЕ
    277191BFїКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ЙИ
    300192C0АКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА А
    301193C1БКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Б
    302194C2ВКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА В
    303195C3ГКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Г
    304196C4ДКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Д
    305197C5ЕКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Е
    306198C6ЖКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Ж
    307199C7ЗКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА З
    310200C8ИКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА И
    311201C9ЙКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Й
    312202CAККИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА К
    313203CBЛКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Л
    314204CCМКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА М
    315205CDНКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Н
    316206CEОКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА О
    317207CFПКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА П
    320208D0РКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Р
    321209D1СКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА С
    322210D2ТКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Т
    323211D3УКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА У
    324212D4ФКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Ф
    325213D5ХКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Х
    326214D6ЦКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Ц
    327215D7ЧКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Ч
    330216D8ШКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Ш
    331217D9ЩКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Щ
    332218DAЪКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ТВЁРДЫЙ ЗНАК
    333219DBЫКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Ы
    334220DCЬКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА МЯГКИЙ ЗНАК
    335221DDЭКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Э
    336222DEЮКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Ю
    337223DFЯКИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА Я
    340224E0аКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА А
    341225E1бКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Б
    342226E2вКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА В
    343227E3гКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Г
    344228E4дКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Д
    345229E5еКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Е
    346230E6жКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Ж
    347231E7зКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА З
    350232E8иКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА И
    351233E9йКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Й
    352234EAкКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА К
    353235EBлКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Л
    354236ECмКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА М
    355237EDнКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Н
    356238EEоКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА О
    357239EFпКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА П
    360240F0рКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Р
    361241F1сКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА С
    362242F2тКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Т
    363243F3уКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА У
    364244F4фКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Ф
    365245F5хКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Х
    366246F6цКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Ц
    367247F7чКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Ч
    370248F8шКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Ш
    371249F9щКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Щ
    372250FAъКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ТВЁРДЫЙ ЗНАК
    373251FBыКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Ы
    374252FCьКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА МЯГКИЙ ЗНАК
    375253FDэКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Э
    376254FEюКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Ю
    377255FFяКИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА Я

    Windows-1251

    Windows-1251 (a.k.a. code page CP1251) is a popular 8-bit character encoding, designed to cover languages that use the Cyrillic alphabet such as Russian, Bulgarian, Serbian Cyrillic and other languages. It is the most widely used for encoding the Bulgarian, Serbian and Macedonian languages.

    In modern applications, Unicode is a preferred character set.

    Windows-1251 and KOI8-R (or its Ukrainian variant KOI8-U) are much more commonly used than ISO 8859-5, which never really caught on. In the future, both may eventually give way to Unicode.

    Codepage layout

    The following table shows Windows-1251. Each character is shown with its decimal code and its Unicode equivalent.

    Windows-1251
    —0—1—2—3—4—5—6—7—8—9—A—B—C—D—E—F
     
    0−
     
    NUL
    0000
    0
    SOH
    0001
    1
    STX
    0002
    2
    ETX
    0003
    3
    EOT
    0004
    4
    ENQ
    0005
    5
    ACK
    0006
    6
    BEL
    0007
    7
    BS
    0008
    8
    HT
    0009
    9
    LF
    000A
    10
    VT
    000B
    11
    FF
    000C
    12
    CR
    000D
    13
    SO
    000E
    14
    SI
    000F
    15
     
    1−
     
    DLE
    0010
    16
    DC1
    0011
    17
    DC2
    0012
    18
    DC3
    0013
    19
    DC4
    0014
    20
    NAK
    0015
    21
    SYN
    0016
    22
    ETB
    0017
    23
    CAN
    0018
    24
    EM
    0019
    25
    SUB
    001A
    26
    ESC
    001B
    27
    FS
    001C
    28
    GS
    001D
    29
    RS
    001E
    30
    US
    001F
    31
     
    2−
     
    SP
    0020
    32
    !
    0021
    33
    «
    0022
    34
    #
    0023
    35
    $
    0024
    36
    %
    0025
    37
    &
    0026
    38

    0027
    39
    (
    0028
    40
    )
    0029
    41
    *
    002A
    42
    +
    002B
    43
    ,
    002C
    44

    002D
    45
    .
    002E
    46
    /
    002F
    47
     
    3−
     
    0
    0030
    48
    1
    0031
    49
    2
    0032
    50
    3
    0033
    51
    4
    0034
    52
    5
    0035
    53
    6
    0036
    54
    7
    0037
    55
    8
    0038
    56
    9
    0039
    57
    :
    003A
    58
    ;
    003B
    59
    <
    003C
    60
    =
    003D
    61
    >
    003E
    62
    ?
    003F
    63
     
    4−
     
    @
    0040
    64
    A
    0041
    65
    B
    0042
    66
    C
    0043
    67
    D
    0044
    68
    E
    0045
    69
    F
    0046
    70
    G
    0047
    71
    H
    0048
    72
    I
    0049
    73
    J
    004A
    74
    K
    004B
    75
    L
    004C
    76
    M
    004D
    77
    N
    004E
    78
    O
    004F
    79
     
    5−
     
    P
    0050
    80
    Q
    0051
    81
    R
    0052
    82
    S
    0053
    83
    T
    0054
    84
    U
    0055
    85
    V
    0056
    86
    W
    0057
    87
    X
    0058
    88
    Y
    0059
    89
    Z
    005A
    90
    [
    005B
    91
    \
    005C
    92
    ]
    005D
    93
    ^
    005E
    94
    _
    005F
    95
     
    6−
     
    `
    0060
    96
    a
    0061
    97
    b
    0062
    98
    c
    0063
    99
    d
    0064
    100
    e
    0065
    101
    f
    0066
    102
    g
    0067
    103
    h
    0068
    104
    i
    0069
    105
    j
    006A
    106
    k
    006B
    107
    l
    006C
    108
    m
    006D
    109
    n
    006E
    110
    o
    006F
    111
     
    7−
     
    p
    0070
    112
    q
    0071
    113
    r
    0072
    114
    s
    0073
    115
    t
    0074
    116
    u
    0075
    117
    v
    0076
    118
    w
    0077
    119
    x
    0078
    120
    y
    0079
    121
    z
    007A
    122
    {
    007B
    123
    |
    007C
    124
    }
    007D
    125
    ~
    007E
    126
    DEL
    007F
    127
     
    8−
     
    Ђ
    0402
    128
    Ѓ
    0403
    129

    201A
    130
    ѓ
    0453
    131

    201E
    132

    2026
    133

    2020
    134

    2021
    135

    20AC
    136

    2030
    137
    Љ
    0409
    138

    2039
    139
    Њ
    040A
    140
    Ќ
    040C
    141
    Ћ
    040B
    142
    Џ
    040F
    143
     
    9−
     
    ђ
    0452
    144

    2018
    145

    2019
    146

    201C
    147

    201D
    148

    2022
    149

    2013
    150

    2014
    151

    152


    2122
    153
    љ
    0459
    154

    203A
    155
    њ
    045A
    156
    ќ
    045C
    157
    ћ
    045B
    158
    џ
    045F
    159
     
    A−
     
    NBSP
    00A0
    160
    Ў
    040E
    161
    ў
    045E
    162
    Ј
    0408
    163
    ¤
    00A4
    164
    Ґ
    0490
    165
    ¦
    00A6
    166
    §
    00A7
    167
    Ё
    0401
    168
    ©
    00A9
    169
    Є
    0404
    170
    «
    00AB
    171
    ¬
    00AC
    172
    SHY
    00AD
    173
    ®
    00AE
    174
    Ї
    0407
    175
     
    B−
     
    °
    00B0
    176
    ±
    00B1
    177
    І
    0406
    178
    і
    0456
    179
    ґ
    0491
    180
    µ
    00B5
    181

    00B6
    182
    ·
    00B7
    183
    ё
    0451
    184

    2116
    185
    є
    0454
    186
    »
    00BB
    187
    ј
    0458
    188
    Ѕ
    0405
    189
    ѕ
    0455
    190
    ї
    0457
    191
     
    C−
     
    А
    0410
    192
    Б
    0411
    193
    В
    0412
    194
    Г
    0413
    195
    Д
    0414
    196
    Е
    0415
    197
    Ж
    0416
    198
    З
    0417
    199
    И
    0418
    200
    Й
    0419
    201
    К
    041A
    202
    Л
    041B
    203
    М
    041C
    204
    Н
    041D
    205
    О
    041E
    206
    П
    041F
    207
     
    D−
     
    Р
    0420
    208
    С
    0421
    209
    Т
    0422
    210
    У
    0423
    211
    Ф
    0424
    212
    Х
    0425
    213
    Ц
    0426
    214
    Ч
    0427
    215
    Ш
    0428
    216
    Щ
    0429
    217
    Ъ
    042A
    218
    Ы
    042B
    219
    Ь
    042C
    220
    Э
    042D
    221
    Ю
    042E
    222
    Я
    042F
    223
     
    E−
     
    а
    0430
    224
    б
    0431
    225
    в
    0432
    226
    г
    0433
    227
    д
    0434
    228
    е
    0435
    229
    ж
    0436
    230
    з
    0437
    231
    и
    0438
    232
    й
    0439
    233
    к
    043A
    234
    л
    043B
    235
    м
    043C
    236
    н
    043D
    237
    о
    043E
    238
    п
    043F
    239
     
    F−
     
    р
    0440
    240
    с
    0441
    241
    т
    0442
    242
    у
    0443
    243
    ф
    0444
    244
    х
    0445
    245
    ц
    0446
    246
    ч
    0447
    247
    ш
    0448
    248
    щ
    0449
    249
    ъ
    044A
    250
    ы
    044B
    251
    ь
    044C
    252
    э
    044D
    253
    ю
    044E
    254
    я
    044F
    255

    In the table above, 20 is the regular SPACE character, A0 is the NO-BREAK SPACE, and AD is SOFT HYPHEN.

    External links

    Кодировка Windows-1251

    Следующие таблицы содержат все допустимые значения параметра charset в метаописателе HTML-документов <META http-equiv=»Content-Type» content=»text/html; charset=идентификатор»> и в атрибуте encoding пролога XML-документов.

    Для каждой кодировки приведены ее название, рекомендуемый в MIME идентификатор, допустимые синонимы этого идентификатора и номер соответствующей кодовой страницы в Windows.

    См. также WDH+: О кодировках символов и Unicode и письменности мира.

    Таблица П7.1. Стандартные кодировки символов

    Наименование

    Идентификатор

    Синонимы

    Кодовая страница

    Unicode (UTF-7)

    utf-7

    csUnicode11UTF7, unicode-utf_7, unicode-1-1-utf-7, unicode-2-0-utf-7, x-unicode-2-0-utf-7

    65000

    Unicode (UTF-8)

    utf-8

    unicode-utf_8, unicode-utf_8-1_1, unicode-1-1-utf-8, unicode-2-0-utf-8, x-unicode-2-0-utf-8

    65001

    Unicode (UTF-16)

    unicode-utf_16

    csUnicode11, csUnicodeASCII, csUnicodeLatin1, ISO-10646-UCS-2, ISO-10646-UCS-BASIC, ISO-10646-Unicode-Latin1, ISO-10646, ISO-10646-J-1, unicode-utf_16-1.1

     

    Unicode (UTF-32)

    unicode-utf_32

    ISO-10646-UCS-4

     

    Арабский (ASMO 708)

    ASMO-708

     

    708

    Арабский (DOS)

    DOS-720

     

    720

    Арабский (ISO)

    iso-8859-6

    csISOLatinArabic, iso-ir-127, ISO_8859-6, ISO_8859-6:1987, iso-8859_6-1999, ECMA-114, arabic

    28596

    Арабский (Windows)

    windows-1256

    cp1256, windows-1256-2000

    1256

    Балтийские языки (Latin-4)

    iso-8859-4

    csISOLatin4, iso-ir-110, ISO_8859-4, ISO_8859-4:1988, iso-8859_4-1988, l4, latin4

    28594

    Балтийские языки (Windows)

    windows-1257

    windows-1257-2000

    1257

    Вьетнамский (Windows)

    windows-1258

    windows-1258-2000

    1258

    Греческий (ISO)

    iso-8859-7

    csISOLatinGreek, iso-ir-126, ISO_8859-7, ISO_8859-7:1987, iso-8859_7-1987, ECMA-118, ELOT_928, greek, greek8

    28597

    Греческий (Windows)

    windows-1253

    windows-1253-2000, x-cp1253

    1253

    Европа (Latin-3)

    iso-8859-3

    iso-8859_3-1999

    28593

    Европа (Latin-6)

    iso-8859-10

    iso-8859_10-1999

     

    Европа (Latin-7)

    iso-8859-13

    iso-8859_13-1999

     

    Европа (Latin-9)

    iso-8859-15

    iso-8859_15-1999

    28605

    Западная Европа (ASCII)

    us-ascii

    ANSI_X3.4-1968, ANSI_X3.4-1986, cp367, csASCII, IBM367, iso-ir-6, ISO646-US, ISO_646.irv:1991, ascii, us, us-ascii-1968, x-ansi

    20127

    Западная Европа (Latin-1)

    iso-8859-1

    cp819, ibm819, iso-ir-100, iso8859-1, iso_8859-1, iso_8859-1:1987, iso-8859_1-1998, ISO-8859-1-Windows-3.0-Latin-1, ISO-8859-1-Windows-3.1-Latin-1, latin1, l1

    29591

    Западная Европа (Mac)

    mac-roman-2000

    x-mac-roman

    10000

    Западная Европа (Windows)

    windows-1252

     

    1252

    Иврит (DOS)

    DOS-862

     

    862

    Иврит (ISO–визуальный)

    iso-8859-8

    csISOLatinHebrew, iso-ir-138, ISO_8859-8, iso-8859_8-1999, ISO-8859-8 Visual, visual, hebrew

    28598

    Иврит (ISO–логический)

    iso-8859-8-i

     

    38598

    Иврит (Windows)

    windows-1255

    ISO_8859-8:1988, iso-ir-138, logical, windows-1255-2000

    1255

    Кельтские языки (Latin-8)

    iso-8859-14

    iso-8859_14-1999

     

    Кириллица (DOS)

    cp866

    ibm866

    866

    Кириллица (ISO)

    iso-8859-5

    csISOLatinCyrillic, iso-ir-144, ISO_8859-5, ISO_8859-5:1988, iso-8859_5-1999, cyrillic

    28595

    Кириллица (Mac)

    mac-cyrillic-2000

    x-mac-cyrillic

    10007

    Кириллица (Windows)

    windows-1251

    csWindows31Latin5, iso-8859-5-windows-latin-5, windows-1251-2000, x-cp1251

    1251

    Кириллица (КОИ8-Р)

    koi8-r

    csKOI8R, koi, ru-koi8_r-2000

    20866

    Китайский – традиционное письмо (EUC)

    x-euc-tw

    osf-euc_tw-2000

    51950

    Китайский – традиционное письмо (Windows)

    big5

    csBig5, CN-Big5, windows-950, windows-950-2000, x-x-big5

    950

    Китайский – упрощенное письмо (GB2312)

    gb2312

    csGB2312, csISO58GB23128, iso-ir-58, GB2312, GBK, GB_2312-80, gb-3212-2000, chinese, CN-GB, CN-GB-ISOIR165

    936

    Китайский – упрощенное письмо (HZ)

    hz-gb-2312

     

    52936

    Корейский (EUC)

    euc-kr

    csEUCKR, ks_c_5601, kcs5601, osf-euc_kr-2000

    51949

    Корейский (ISO)

    iso-2022-kr

    csISO2022KR, posix-2022_kr

    50225

    Корейский (Windows)

    ks_c_5601-1987

    csKSC56011987, korean, windows-949, windows-949-2000

    949

    Тайский (Windows)

    iso-8859-11

    windows-874, windows-874-2000

    874

    Турецкий (ISO)

    iso-8859-9

    csISOLatin5, iso-ir-148, l5, ISO_8859-9, ISO_8859-9:1989, iso-8859_9-1999, latin5

    28599

    Турецкий (Windows)

    windows-1254

    windows-1254-2000, x-cp1254

    1254

    Украинский (КОИ8-У)

    koi8-u

     

    21866

    Центральная Европа (DOS)

    ibm852

    cp852

    852

    Центральная Европа (Latin-2)

    iso-8859-2

    csISOLatin2, iso-ir-101, iso8859-2, iso_8859-2, iso_8859-2:1987, iso_8859_2-1999, ISO-8859-2-Windows-Latin-2, l2, latin2

    28592

    Центральная Европа (Mac)

    mac-ce-2000

    x-mac-ce

    10029

    Центральная Европа (Windows)

    windows-1250

    x-cp1250

    1250

    Японский (EUC)

    euc-jp

    csEUCPkdFmtJapanese, Extended_UNIX_Code_Packed_Format_for_Japanese, osf-euc_jp-2000, x-euc, x-euc-jp

    51932

    Японский (JIS)

    iso-2022-jp

    csISO2022JP, csISO2022JP2, iso-2022-jp-2, posix-2022_jp-2000

    50220

    Японский (JIS – допускающий однобайтовую кану – SO/SI)

    iso-2022-jp

    csISO2022JP, _iso-2022-jp$SIO

    50222

    Японский (JIS – допускающий однобайтовую кану)

    csISO2022JP

    _iso-2022-jp$ESC

    50221

    Японский (Windows)

    shift_jis

    csShiftJIS, csWindows31J, ms_Kanji, shift-jis, x-ms-cp932, x-sjis, Windows-31J, windows-932-2000

    932

    Таблица П7.2. Нестандартные кодировки символов в Internet Explorer

    Наименование

    Идентификатор

    Кодовая страница

    Unicode

    unicode

    1200

    Unicode (левый байт старший)

    unicodeFEFF

    1201

    Определенный пользователем

    x-user-defined

    50000

    Автоматический выбор

    _autodetect_all

    50001

    Корейский (автовыбор)

    _autodetect_kr

    50949

    Японский (автовыбор)

    _autodetect

    50932

    windows-1251.txt

    windows-1251.txt
    #
    # Имя: cp1251 в таблицу Unicode
    # Версия Unicode: 2.0
    # Версия таблицы: 2.01
    # Формат таблицы: Формат A
    # Дата: 15.04.98
    #
    # Контакт: [email protected]
    #
    # Общие примечания: нет
    #
    # Формат: три столбца, разделенных табуляцией
    # Столбец # 1 - это код cp1251 (в шестнадцатеричном формате)
    # Столбец №2 - это Юникод (в шестнадцатеричном виде 0xXXXX)
    # Столбец # 3 - это имя Unicode (после знака комментария '#')
    #
    # Записи в порядке cp1251
    #
    0x00 0x0000 # ПУСТО
    0x01 0x0001 # НАЧАЛО ЗАГОЛОВКИ
    0x02 0x0002 # НАЧАЛО ТЕКСТА
    0x03 0x0003 # КОНЕЦ ТЕКСТА
    0x04 0x0004 # КОНЕЦ ПЕРЕДАЧИ
    0x05 0x0005 # ЗАПРОС
    0x06 0x0006 # ПОДПИСАТЬСЯ
    0x07 0x0007 # БЕЛЛ
    0x08 0x0008 #BACKSPACE
    0x09 0x0009 # ГОРИЗОНТАЛЬНАЯ ТАБЛИЦА
    0x0A 0x000A # ЛИНИЯ ПОДАЧИ
    0x0B 0x000B # ВЕРТИКАЛЬНАЯ ТАБЛИЦА
    0x0C 0x000C # ФОРМА ПОДАЧИ
    0x0D 0x000D # ВОЗВРАТ ЗАРЯДА
    0x0E 0x000E # ПЕРЕМЕЩЕНИЕ
    0x0F 0x000F #SHIFT IN
    0x10 0x0010 # ОТКЛЮЧЕНИЕ СВЯЗИ ДАННЫХ
    0x11 0x0011 # УПРАВЛЕНИЕ УСТРОЙСТВОМ ОДИН
    0x12 0x0012 # УПРАВЛЕНИЕ УСТРОЙСТВОМ ДВА
    0x13 0x0013 # УПРАВЛЕНИЕ УСТРОЙСТВОМ ТРИ
    0x14 0x0014 # УПРАВЛЕНИЕ УСТРОЙСТВОМ ЧЕТВЕРТОЕ
    0x15 0x0015 # ОТРИЦАТЕЛЬНОЕ ПОДТВЕРЖДЕНИЕ
    0x16 0x0016 # СИНХРОННЫЙ ПРОХОЖДЕНИЕ
    0x17 0x0017 # КОНЕЦ БЛОКА ПЕРЕДАЧИ
    0x18 0x0018 # ОТМЕНА
    0x19 0x0019 # КОНЕЦ СРЕДЫ
    0x1A 0x001A # ПОДСТАВИТЬ
    0x1B 0x001B # ЭСКЕЙП
    0x1C 0x001C # РАЗДЕЛИТЕЛЬ ФАЙЛОВ
    0x1D 0x001D # СЕПАРАТОР ГРУПП
    0x1E 0x001E # ЗАПИСЬ СЕПАРАТОР
    0x1F 0x001F # РАЗДЕЛИТЕЛЬ
    0x20 0x0020 # ПРОБЕЛ
    0x21 0x0021 # восклицательный знак
    0x22 0x0022 # ЦИТАТНЫЙ ЗНАК
    0x23 0x0023 # НОМЕРНЫЙ ЗНАК
    0x24 0x0024 # ЗНАК ДОЛЛАР
    0x25 0x0025 # ЗНАК ПЕРСОНА
    0x26 0x0026 # АМПЕРСАНД
    0x27 0x0027 # АПОСТРОФ
    0x28 0x0028 # ЛЕВЫЙ ПАРЕНТЕЗ
    0x29 0x0029 # ПРАВИЛЬНЫЙ ПАРЕНТЕЗ
    0x2A 0x002A # АСТЕРИСК
    0x2B 0x002B # ПОДПИСАТЬСЯ
    0x2C 0x002C #COMMA
    0x2D 0x002D # ДЕФИС-МИНУС
    0x2E 0x002E # ПОЛНАЯ ОСТАНОВКА
    0x2F 0x002F # СОЛИДУС
    0x30 0x0030 # ЦИФРОВОЙ НУЛЬ
    0x31 0x0031 # ЦИФРА ОДИН
    0x32 0x0032 # ДВА ЦИФРА
    0x33 0x0033 # ЦИФРА ТРИ
    0x34 0x0034 # ЦИФРА ЧЕТЫРЕ
    0x35 0x0035 # ЦИФРОВАЯ ПЯТЬ
    0x36 0x0036 # ШЕСТЬ ЦИФРОВ
    0x37 0x0037 # ЦИФРОВАЯ СЕМЬ
    0x38 0x0038 # ЦИФРА ВОСЕМЬ
    0x39 0x0039 # ЦИФРА ДЕВЯТЬ
    0x3A 0x003A # КОЛОН
    0x3B 0x003B # СЕМИКОЛОН
    0x3C 0x003C # МЕНЬШЕ ЗНАКА
    0x3D 0x003D # ЗНАК РАВНО
    0x3E 0x003E # БОЛЬШЕ, ЧЕМ ЗНАК
    0x3F 0x003F # ЗНАК ВОПРОСА
    0x40 0x0040 # КОММЕРЧЕСКИЙ AT
    0x41 0x0041 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА A
    0x42 0x0042 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА B
    0x43 0x0043 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА C
    0x44 0x0044 # ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА D
    0x45 0x0045 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА E
    0x46 0x0046 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА F
    0x47 0x0047 # ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА G
    0x48 0x0048 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА H
    0x49 0x0049 # ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА I
    0x4A 0x004A # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА J
    0x4B 0x004B # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА K
    0x4C 0x004C # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА L
    0x4D 0x004D # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА M
    0x4E 0x004E # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА N
    0x4F 0x004F # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА O
    0x50 0x0050 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА P
    0x51 0x0051 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА Q
    0x52 0x0052 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА R
    0x53 0x0053 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА S
    0x54 0x0054 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА T
    0x55 0x0055 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА U
    0x56 0x0056 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА V
    0x57 0x0057 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА W
    0x58 0x0058 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА X
    0x59 0x0059 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА Y
    0x5A 0x005A # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА Z
    0x5B 0x005B # КВАДРАТНЫЙ КРОНШТЕЙН ЛЕВОЙ
    0x5C 0x005C # ОБРАТНЫЙ СОЛИД
    0x5D 0x005D # ПРАВЫЙ КВАДРАТНЫЙ КРОНШТЕЙН
    0x5E 0x005E #CIRCUMFLEX ACCENT
    0x5F 0x005F # НИЗКАЯ СТРОКА
    0x60 0x0060 # GRAVE ACCENT
    0x61 0x0061 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА A
    0x62 0x0062 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА B
    0x63 0x0063 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА C
    0x64 0x0064 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА D
    0x65 0x0065 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА E
    0x66 0x0066 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА F
    0x67 0x0067 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА G
    0x68 0x0068 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА H
    0x69 0x0069 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА I
    0x6A 0x006A # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА J
    0x6B 0x006B # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА K
    0x6C 0x006C # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА L
    0x6D 0x006D # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА M
    0x6E 0x006E # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА N
    0x6F 0x006F # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА O
    0x70 0x0070 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА P
    0x71 0x0071 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Q
    0x72 0x0072 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА R
    0x73 0x0073 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА S
    0x74 0x0074 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА T
    0x75 0x0075 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА U
    0x76 0x0076 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА V
    0x77 0x0077 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА W
    0x78 0x0078 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА X
    0x79 0x0079 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Y
    0x7A 0x007A # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Z
    0x7B 0x007B # ЛЕВАЯ КУРСОВАЯ КРОНШТЕЙН
    0x7C 0x007C # ВЕРТИКАЛЬНАЯ ЛИНИЯ
    0x7D 0x007D # ПРАВЫЙ ИЗГОЛЬНЫЙ КРОНШТЕЙН
    0x7E 0x007E # ТИЛЬДА
    0x7F 0x007F # УДАЛИТЬ
    0x80 0x0402 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА DJE
    0x81 0x0403 # КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА GJE
    0x82 0x201A # ОДИН ЦИТАТНЫЙ МАРК НИЗКОГО-9
    0x83 0x0453 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА GJE
    0x84 0x201E #DOUBLE LOW-9 QUOTATION MARK
    0x85 0x2026 # ГОРИЗОНТАЛЬНЫЙ ЭЛЛИПСИС
    0x86 0x2020 # КИНЖАЛ
    0x87 0x2021 # ДВОЙНОЙ КИНЖАЛ
    0x88 0x20AC # ЗНАК ЕВРО
    0x89 0x2030 # ЗАПИСЬ МИЛЛЯ
    0x8A 0x0409 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА LJE
    0x8B 0x2039 # ОДИН ЛЕВЫЙ УГОЛ ЦИТАТЫ
    0x8C 0x040A # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА NJE
    0x8D 0x040C # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА KJE
    0x8E 0x040B # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TSHE
    0x8F 0x040F # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ДЖЕ
    0x90 0x0452 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА DJE
    0x91 0x2018 # ЛЕВАЯ ОДИНАРНАЯ ЦИТАТА
    0x92 0x2019 # ПРАВАЯ ОДИНАРНАЯ ЦИТАТА
    0x93 0x201C # ЛЕВАЯ МАРКА ДВОЙНОЙ ЦИТАТЫ
    0x94 0x201D # ПРАВАЯ ДВОЙНАЯ ЦИТАТА
    0x95 0x2022 # БЮЛЛЕТЕНЬ
    0x96 0x2013 #EN DASH
    0x97 0x2014 #EM DASH
    0x98 # НЕОПРЕДЕЛЕННО
    0x99 0x2122 # ТОВАРНЫЙ ЗНАК
    0x9A 0x0459 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА LJE
    0x9B 0x203A # ОДИН УГОЛ ВПРАВО ЦИТАТНЫЙ МАРК
    0x9C 0x045A # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА NJE
    0x9D 0x045C # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА KJE
    0x9E 0x045B # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА TSHE
    0x9F 0x045F # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ДЖЕ
    0xA0 0x00A0 # ПРОБЕЛ БЕЗ ПЕРЕРЫВА
    0xA1 0x040E # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА КОРОТКАЯ U
    0xA2 0x045E # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА КОРОТКАЯ U
    0xA3 0x0408 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА JE
    0xA4 0x00A4 # ЗНАК ВАЛЮТЫ
    0xA5 0x0490 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА GHE С ПОВОРОТОМ
    0xA6 0x00A6 # Сломанная полоса
    0xA7 0x00A7 # ЗНАК РАЗДЕЛА
    0xA8 0x0401 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА IO
    0xA9 0x00A9 # ЗНАК АВТОРСКОГО ПРАВА
    0xAA 0x0404 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА УКРАИНСКИЙ IE
    0xAB 0x00AB # ДВОЙНОЙ УГЛОВОЙ ЦИТАТНЫЙ МАРК, УКАЗАННЫЙ ВЛЕВО
    0xAC 0x00AC # НЕ ПОДПИСАТЬ
    0xAD 0x00AD # МЯГКИЙ ДЕФИС
    0xAE 0x00AE # ЗАПИСАННЫЙ ЗНАК
    0xAF 0x0407 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА YI
    0xB0 0x00B0 # ЗНАК СТЕПЕНИ
    0xB1 0x00B1 # ЗНАК ПЛЮС-МИНУС
    0xB2 0x0406 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА БЕЛОРУССКО-УКРАИНСКАЯ I
    0xB3 0x0456 # КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА БЕЛОРУССКО-УКРАИНСКАЯ I
    0xB4 0x0491 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА GHE С ПОВОРОТОМ
    0xB5 0x00B5 # ЗНАК МИКРО
    0xB6 0x00B6 # ЗНАК ПИЛКРОУ
    0xB7 0x00B7 # СРЕДНЯЯ ТОЧКА
    0xB8 0x0451 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА IO
    0xB9 0x2116 # ЗНАК ЧИСЛА
    0xBA 0x0454 # КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА УКРАИНСКИЙ IE
    0xBB 0x00BB # ДВОЙНОЙ УГОЛ ЦИТАТЫ, УКАЗЫВАЮЩИЙ ВПРАВО
    0xBC 0x0458 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА JE
    0xBD 0x0405 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА DZE
    0xBE 0x0455 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА DZE
    0xBF 0x0457 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА YI
    0xC0 0x0410 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА A
    0xC1 0x0411 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА BE
    0xC2 0x0412 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА VE
    0xC3 0x0413 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА GHE
    0xC4 0x0414 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА DE
    0xC5 0x0415 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА IE
    0xC6 0x0416 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ZHE
    0xC7 0x0417 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ZE
    0xC8 0x0418 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА I
    0xC9 0x0419 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА КОРОТКАЯ I
    0xCA 0x041A # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА KA
    0xCB 0x041B # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EL
    0xCC 0x041C # КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EM
    0xCD 0x041D # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EN
    0xCE 0x041E # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА O
    0xCF 0x041F # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА PE
    0xD0 0x0420 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ER
    0xD1 0x0421 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ES
    0xD2 0x0422 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TE
    0xD3 0x0423 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА U
    0xD4 0x0424 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EF
    0xD5 0x0425 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА HA
    0xD6 0x0426 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TSE
    0xD7 0x0427 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА CHE
    0xD8 0x0428 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА SHA
    0xD9 0x0429 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЩА
    0xDA 0x042A # КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЖЕСТКИЙ ЗНАК
    0xDB 0x042B # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЙЕРУ
    0xDC 0x042C # КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА МЯГКИЙ ЗНАК
    0xDD 0x042D # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА E
    0xDE 0x042E # КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА YU
    0xDF 0x042F # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА YA
    0xE0 0x0430 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА A
    0xE1 0x0431 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА BE
    0xE2 0x0432 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА VE
    0xE3 0x0433 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА GHE
    0xE4 0x0434 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА DE
    0xE5 0x0435 # КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА IE
    0xE6 0x0436 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ZHE
    0xE7 0x0437 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ZE
    0xE8 0x0438 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА I
    0xE9 0x0439 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА КОРОТКАЯ I
    0xEA 0x043A # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА KA
    0xEB 0x043B # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА EL
    0xEC 0x043C # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА EM
    0xED 0x043D # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА EN
    0xEE 0x043E # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА O
    0xEF 0x043F # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА PE
    0xF0 0x0440 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ER
    0xF1 0x0441 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ES
    0xF2 0x0442 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА TE
    0xF3 0x0443 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА U
    0xF4 0x0444 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА EF
    0xF5 0x0445 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА HA
    0xF6 0x0446 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА TSE
    0xF7 0x0447 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА CHE
    0xF8 0x0448 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА SHA
    0xF9 0x0449 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ЩА
    0xFA 0x044A # КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ЖЕСТКИЙ ЗНАК
    0xFB 0x044B # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ЕРУ
    0xFC 0x044C # КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА МЯГКИЙ ЗНАК
    0xFD 0x044D # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА E
    0xFE 0x044E # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА YU
    0xFF 0x044F # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА YA
     

    Кодировки API кодирования — веб-API

    « unicode-1-1-utf-8 », « utf-8 », « utf8 » 'УТФ-8'
    « 866 », « cp866 », « csibm866 », « ibm866 » 'ibm866'
    « цисолатин2 », « iso-8859-2 », « iso-ir-101 », « iso8859-2 », « iso88592 », « iso_8859-2 », « iso_8859-2: 1987 », « l2 », « latin2 » 'iso-8859-2'
    « цисолатин3 », « iso-8859-3 », « iso-ir-109 », « iso8859-3 », « iso88593 », « iso_8859-3 », « iso_8859-3: 1988 », « l3 », « latin3 » 'iso-8859-3'
    « цисолатин4 », « iso-8859-4 », « iso-ir-110 », « iso8859-4 », « iso88594 », « iso_8859-4 », « iso_8859-4: 1988 », « l4 », « latin4 » 'iso-8859-4'
    « кириллица «, « кириллица «, « iso-8859-5 », « iso-ir-144 », « iso88595 », « iso_8859-5 », « iso_8859-5: 1988 » 'iso-8859-5'
    « арабский «, « asmo-708 «, « csiso88596e », « csiso88596i », « цисолатинарабик », « ecma-114 », « iso-8859-6 », « iso-8859-6-e », « iso-8859-6-i », « iso-ir-127 », « iso8859-6 », « iso88596 », « iso_8859-6 », « iso_8859-6: 1987 » 'iso-8859-6'
    « цисолатингрик », « экма-118 », « elot_928 «, « greek «, « greek8 «, « iso-8859-7 », « iso-ir-126 », « iso8859-7 », « iso88597 », « iso_8859-7 », « iso_8859-7: 1987 », « sun_eu_greek » 'iso-8859-7'
    « csiso88598e », « csisolatinhebrew », « иврит », « iso-8859-8 », « iso-8859-8-e », « iso-ir-138 », « iso8859-8 », « iso88598 », « iso_8859-8 », « iso_8859-8: 1988 », « визуал » 'iso-8859-8'
    « csiso88598i », « iso-8859-8-i », « логический » 'iso-8859-8i'
    « цисолатин6 », « iso-8859-10 », « iso-ir-157 », « iso8859-10 », « iso885910 », « l6 », « latin6 » 'iso-8859-10'
    « iso-8859-13 », « iso8859-13 », « iso885913 » 'iso-8859-13'
    « iso-8859-14 », « iso8859-14 », « iso885914 » 'iso-8859-14'
    « цисолатин9 », « iso-8859-15 », « iso8859-15 », « iso885915 », « l9 », « латин9 » 'iso-8859-15'
    « iso-8859-16 » 'iso-8859-16'
    « кои8р », « кои », « кои8 », « кои8-р », « кои8_р » 'КОИ8-Р'
    « кои8-у » 'КОИ8-У'
    « csmacintosh », « mac », « macintosh », « x-mac-roman » «Macintosh»
    « дос-874 », « исо-8859-11 », « iso8859-11 », « iso885911 », « тис-620 », « окна-874 » 'окна-874'
    « cp1250 », « windows-1250 », « x-cp1250 » 'окна-1250'
    « cp1251 », « windows-1251 », « x-cp1251 » 'окна-1251'
    « ansi_x3.4-1968 «,» ascii «, « cp1252 », « cp819 », « csisolatin1 », « ibm819 », « iso-8859-1 », « iso-ir-100 », « iso8859-1 », « iso88591 », « iso_8859-1 », « iso_8859-1: 1987 », « l1 », « latin1 «, « us-ascii «, « windows-1252 «, « x-cp1252 » 'окна-1252'
    « cp1253 », « windows-1253 », « x-cp1253 » 'окна-1253'
    « cp1254 », « csisolatin5 », « iso-8859-9 », « iso-ir-148 », « iso8859-9 », « iso88599 », « iso_8859-9 », « iso_8859-9: 1989 », « l5 «, « latin5 «, « windows-1254 «, « x-cp1254 » 'окна-1254'
    « cp1255 «, « windows-1255 «, « x-cp1255 » 'окна-1255'
    « cp1256 », « windows-1256 », « x-cp1256 » 'окна-1256'
    « cp1257 », « windows-1257 », « x-cp1257 » 'окна-1257'
    « cp1258 », « windows-1258 », « x-cp1258 » 'окна-1258'
    « x-mac-cyrillic «, « x-mac-ukrainian » 'x-mac-cyrillic'
    « китайский », « csgb2312 », « csiso58gb231280 », « gb2312 », « gb_2312 », « gb_2312-80 », « gbk », « iso-ir-58 », « x-gbk » 'GBK'
    « gb18030 » 'gb18030'
    « hz-gb-2312 » 'hz-gb-2312'
    « big5 », « big5-hkscs », « cn-big5 », « csbig5 », « x-x-big5 » 'большой5'
    « cseucpkdfmtjapanese «, « euc-jp «, « x-euc-jp » 'euc-jp'
    « csiso2022jp «, « iso-2022-jp » 'iso-2022-jp'
    « csshiftjis «, « ms_kanji «, « shift-jis », « shift_jis », « sjis », « windows-31j «, « x-sjis » Shift-jis
    « cseuckr «, « csksc56011987 «, « euc-kr », « iso-ir-149 », « корейский », « ks_c_5601-1987 », « ks_c_5601-1989 », « ksc5601 », « ksc_5601 », «Окна -949 » 'euc-kr'
    « csiso2022kr «, « iso-2022-kr » 'iso-2022-kr'
    « utf-16be » «УТФ-16БЭ»
    « utf-16 », « utf-16le » утф-16ле
    « x определяется пользователем » 'пользовательский x'
    « iso-2022-cn », « iso-2022-cn-ext » 'замена'

    libcodesets / windows-1251.txt на главном сервере · jens-maus / libcodesets · GitHub

    Стандарт = windows-1251
    AltStandard = CP1251
    Имя = windows-1251
    Characterization = _ («Кириллица (Windows)»)
    Только чтение = 1
    #
    # Имя: cp1251 в таблицу Unicode
    # Версия Unicode: 2.0
    # Версия стола: 2.01
    # Формат таблицы: Формат A
    # Дата: 15.04.98
    #
    # Контактное лицо: [email protected]
    #
    # Общие примечания: нет
    #
    # Формат: три столбца, разделенных табуляцией
    # Столбец # 1 — это код cp1251 (в шестнадцатеричном формате)
    # Столбец 2 — это Unicode (в шестнадцатеричном виде 0xXXXX)
    # Столбец # 3 — это имя Unicode (после знака комментария ‘#’)
    #
    # Записи в порядке cp1251
    #
    0x00 0x0000 #NULL
    0x01 0x0001 # НАЧАЛО ЗАГОЛОВКИ
    0x02 0x0002 # НАЧАЛО ТЕКСТА
    0x03 0x0003 # КОНЕЦ ТЕКСТА
    0x04 0x0004 # КОНЕЦ ПЕРЕДАЧИ
    0x05 0x0005 # ЗАПРОС
    0x06 0x0006 # ПОДПИСАТЬСЯ
    0x07 0x0007 #BELL
    0x08 0x0008 #BACKSPACE
    0x09 0x0009 # ГОРИЗОНТАЛЬНАЯ ТАБЛИЦА
    0x0A 0x000A # ЛИНИЯ ПОДАЧИ
    0x0B 0x000B # ВЕРТИКАЛЬНАЯ ТАБЛИЦА
    0x0C 0x000C # ПОДАЧА ФОРМЫ
    0x0D 0x000D # ВОЗВРАТ МАШИНЫ
    0x0E 0x000E # СДВИГАТЬ
    0x0F 0x000F # СДВИГ В
    0x10 0x0010 # ДАННЫЕ ПРЕРЫВАТЬ ССЫЛКУ
    0x11 0x0011 # УПРАВЛЕНИЕ УСТРОЙСТВОМ ОДИН
    0x12 0x0012 # УПРАВЛЕНИЕ УСТРОЙСТВОМ ДВА
    0x13 0x0013 # ТРИ УПРАВЛЕНИЯ УСТРОЙСТВОМ
    0x14 0x0014 # УПРАВЛЕНИЕ УСТРОЙСТВОМ ЧЕТВЕРТОЕ
    0x15 0x0015 # ОТРИЦАТЕЛЬНОЕ ПОДТВЕРЖДЕНИЕ
    0x16 0x0016 # СИНХРОННЫЙ ПРОХОЖДЕНИЕ
    0x17 0x0017 # КОНЕЦ БЛОКА ПЕРЕДАЧ
    0x18 0x0018 # ОТМЕНА
    0x19 0x0019 # КОНЕЦ СРЕДЫ
    0x1A 0x001A # ПОДСТАВИТЬ
    0x1B 0x001B # ЭСКЕЙП
    0x1C 0x001C # РАЗДЕЛИТЕЛЬ ФАЙЛОВ
    0x1D 0x001D # СЕПАРАТОР ГРУПП
    0x1E 0x001E # РАЗДЕЛИТЕЛЬ ЗАПИСИ
    0x1F 0x001F # СЕПАРАТОР УСТРОЙСТВА
    0x20 0x0020 # ПРОБЕЛ
    0x21 0x0021 # восклицательный знак
    0x22 0x0022 # ЦИТАТНЫЙ ЗНАК
    0x23 0x0023 # НОМЕРНЫЙ ЗНАК
    0x24 0x0024 # ЗНАК ДОЛЛАР
    0x25 0x0025 # ЗНАК ПРОЦЕССА
    0x26 0x0026 # АМПЕРСАНД
    0x27 0x0027 #APOSTROPHE
    0x28 0x0028 # ЛЕВЫЙ ПАРЕНТЕЗ
    0x29 0x0029 # ПРАВЫЙ ПАРЕНТЕЗ
    0x2A 0x002A #ASTERISK
    0x2B 0x002B # ПОДПИСАТЬСЯ
    0x2C 0x002C #COMMA
    0x2D 0x002D # ДЕФЕН-МИНУС
    0x2E 0x002E # ПОЛНАЯ ОСТАНОВКА
    0x2F 0x002F #SOLIDUS
    0x30 0x0030 # ЦИФРОВОЙ НОЛЬ
    0x31 0x0031 # ЦИФРОВОЙ ОДИН
    0x32 0x0032 # ДВА ЦИФРА
    0x33 0x0033 # ТРИ ЦИФРЫ
    0x34 0x0034 # ЦИФРА ЧЕТЫРЕ
    0x35 0x0035 # ЦИФРОВАЯ ПЯТЬ
    0x36 0x0036 # ШЕСТЬ ЦИФРОВ
    0x37 0x0037 # СЕМЬ ЦИФРОВ
    0x38 0x0038 # ВОСЕМЬ ЦИФРОВАЯ
    0x39 0x0039 # ДЕВЯТЬ ЦИФРОВ
    0x3A 0x003A # КОЛОНКА
    0x3B 0x003B # СЕМИКОЛОН
    0x3C 0x003C # МЕНЬШЕ ЗНАКА
    0x3D 0x003D # ЗНАК РАВНО
    0x3E 0x003E # БОЛЬШЕ, ЧЕМ ЗНАК
    0x3F 0x003F # ЗНАК ВОПРОСА
    0x40 0x0040 # КОММЕРЧЕСКИЙ AT
    0x41 0x0041 # ЗАГЛАВНАЯ БУКВА A
    0x42 0x0042 # ЗАГЛАВНАЯ БУКВА B
    0x43 0x0043 # ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА C
    0x44 0x0044 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА D
    0x45 0x0045 # ЗАГЛАВНАЯ БУКВА E
    0x46 0x0046 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА F
    0x47 0x0047 # ЗАГЛАВНАЯ БУКВА G
    0x48 0x0048 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА H
    0x49 0x0049 # ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА I
    0x4A 0x004A # ЗАГЛАВНАЯ БУКВА J
    0x4B 0x004B # ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА K
    0x4C 0x004C # ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА L
    0x4D 0x004D # ЗАГЛАВНАЯ БУКВА M
    0x4E 0x004E # ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА N
    0x4F 0x004F # ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА O
    0x50 0x0050 # ЗАГЛАВНАЯ БУКВА P
    0x51 0x0051 # ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА Q
    0x52 0x0052 # ЗАГЛАВНАЯ БУКВА R
    0x53 0x0053 # ЗАГЛАВНАЯ БУКВА S
    0x54 0x0054 # ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА T
    0x55 0x0055 # ЗАГЛАВНАЯ БУКВА U
    0x56 0x0056 # ЗАГЛАВНАЯ БУКВА V
    0x57 0x0057 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА W
    0x58 0x0058 # ЗАГЛАВНАЯ ЛАТИНСКАЯ БУКВА X
    0x59 0x0059 # ЗАГЛАВНАЯ БУКВА Y
    0x5A 0x005A # ЗАГЛАВНАЯ БУКВА Z
    0x5B 0x005B # КВАДРАТНЫЙ КРОНШТЕЙН ЛЕВЫЙ
    0x5C 0x005C # ОБРАТНЫЙ SOLIDUS
    0x5D 0x005D # КРОНШТЕЙН ПРАВЫЙ КВАДРАТНЫЙ
    0x5E 0x005E #CIRCUMFLEX ACCENT
    0x5F 0x005F # НИЗКАЯ СТРОКА
    0x60 0x0060 # GRAVE ACCENT
    0x61 0x0061 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА A
    0x62 0x0062 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА B
    0x63 0x0063 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА C
    0x64 0x0064 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА D
    0x65 0x0065 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА E
    0x66 0x0066 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА F
    0x67 0x0067 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА G
    0x68 0x0068 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА H
    0x69 0x0069 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА I
    0x6A 0x006A # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА J
    0x6B 0x006B # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА K
    0x6C 0x006C # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА L
    0x6D 0x006D # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА M
    0x6E 0x006E # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА N
    0x6F 0x006F # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА O
    0x70 0x0070 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА P
    0x71 0x0071 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Q
    0x72 0x0072 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА R
    0x73 0x0073 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА S
    0x74 0x0074 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА T
    0x75 0x0075 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА U
    0x76 0x0076 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА V
    0x77 0x0077 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА W
    0x78 0x0078 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА X
    0x79 0x0079 # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Y
    0x7A 0x007A # СТРОЧНАЯ ЛАТИНСКАЯ БУКВА Z
    0x7B 0x007B # КРОНШТЕЙН ЛЕВЫЙ ИЗОЛИРУЮЩИЙ
    0x7C 0x007C # ВЕРТИКАЛЬНАЯ ЛИНИЯ
    0x7D 0x007D # ПРЯМОЙ КРОНШТЕЙН
    0x7E 0x007E # ТИЛЬДА
    0x7F 0x007F #DELETE
    0x80 0x0402 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА DJE
    0x81 0x0403 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА GJE
    0x82 0x201A # ОДИН НИЗКИЙ-9 ЦИТАТНЫЙ ЗНАК
    0x83 0x0453 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА GJE
    0x84 0x201E # DOUBLE LOW-9 QUOTATION MARK
    0x85 0x2026 # ГОРИЗОНТАЛЬНЫЙ ЭЛЛИПСИС
    0x86 0x2020 # КИНТАКТ
    0x87 0x2021 # ДВОЙНОЙ КИНЖАЛ
    0x88 0x20AC # ЗНАК ЕВРО
    0x89 0x2030 ЗНАК # ЗАПРЕЩАЕТСЯ
    0x8A 0x0409 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА LJE
    0x8B 0x2039 # ОДИН ЛЕВЫЙ УГОЛ ЦИТАТНЫЙ ЗНАК
    0x8C 0x040A # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА NJE
    0x8D 0x040C # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА KJE
    0x8E 0x040B # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TSHE
    0x8F 0x040F # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА DZHE
    0x90 0x0452 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА DJE
    0x91 0x2018 # ЛЕВАЯ ОДИНАРНАЯ ЦИФРОВАЯ МАРКА
    0x92 0x2019 # ПРАВЫЙ ЗНАК ОДНОЙ ЦИТАТЫ
    0x93 0x201C # ЛЕВЫЙ ДВОЙНОЙ ЗНАК
    0x94 0x201D # ПРАВЫЙ ДВОЙНОЙ ЗНАК
    0x95 0x2022 # БЮЛЛЕТЕНЬ
    0x96 0x2013 #EN DASH
    0x97 0x2014 #EM DASH
    0x98 # НЕОПРЕДЕЛЕННЫЙ
    0x99 0x2122 # ТОВАРНЫЙ ЗНАК
    0x9A 0x0459 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА LJE
    0x9B 0x203A # ОДИН УГОЛ ВПРАВО ЦИТАТНЫЙ МАРК
    0x9C 0x045A # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА NJE
    0x9D 0x045C # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА KJE
    0x9E 0x045B # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА TSHE
    0x9F 0x045F # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА DZHE
    0xA0 0x00A0 # ПРОБЕЛ ПЕРЕДАЧИ
    0xA1 0x040E # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА КОРОТКАЯ U
    0xA2 0x045E # КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА КОРОТКАЯ U
    0xA3 0x0408 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА JE
    0xA4 0x00A4 # ЗНАК ВАЛЮТЫ
    0xA5 0x0490 # КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА GHE С ПОВОРОТОМ
    0xA6 0x00A6 # СЛОМАННАЯ ПАНЕЛЬ
    0xA7 0x00A7 # ЗНАК РАЗДЕЛА
    0xA8 0x0401 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА IO
    0xA9 0x00A9 # ЗНАК АВТОРСКИХ ПРАВ
    0xAA 0x0404 # КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА УКРАИНСКИЙ IE
    0xAB 0x00AB # ДВОЙНОЙ УГЛОВОЙ ЦИТАТНЫЙ МАРК ВЛЕВО
    0xAC 0x00AC # НЕТ ЗНАКА
    0xAD 0x00AD # SOFT HYPHEN
    0xAE 0x00AE # ЗАПИСЬ
    0xAF 0x0407 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА YI
    0xB0 0x00B0 # ЗНАК СТЕПЕНИ
    0xB1 0x00B1 # ЗНАК ПЛЮС-МИНУС
    0xB2 0x0406 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА БЕЛОРУССКО-УКРАИНСКАЯ I
    0xB3 0x0456 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА БЕЛОРУССКО-УКРАИНСКАЯ I
    0xB4 0x0491 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА GHE С ПОВОРОТОМ
    0xB5 0x00B5 # ЗНАК МИКРО
    0xB6 0x00B6 # ЗНАК ПИЛКРОУ
    0xB7 0x00B7 # СРЕДНЯЯ ТОЧКА
    0xB8 0x0451 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА IO
    0xB9 0x2116 # ЧИСЛО ЗНАКА
    0xBA 0x0454 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА УКРАИНСКИЙ IE
    0xBB 0x00BB # ДВОЙНОЙ УГЛОВОЙ ЦИТАТНЫЙ ЗНАК ВПРАВО
    0xBC 0x0458 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА JE
    0xBD 0x0405 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА DZE
    0xBE 0x0455 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА DZE
    0xBF 0x0457 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА YI
    0xC0 0x0410 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА A
    0xC1 0x0411 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА BE
    0xC2 0x0412 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА VE
    0xC3 0x0413 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА GHE
    0xC4 0x0414 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА DE
    0xC5 0x0415 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА IE
    0xC6 0x0416 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ZHE
    0xC7 0x0417 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ZE
    0xC8 0x0418 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА I
    0xC9 0x0419 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА КОРОТКАЯ I
    0xCA 0x041A # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА KA
    0xCB 0x041B # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EL
    0xCC 0x041C # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EM
    0xCD 0x041D # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EN
    0xCE 0x041E # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА O
    0xCF 0x041F # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА PE
    0xD0 0x0420 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ER
    0xD1 0x0421 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ES
    0xD2 0x0422 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TE
    0xD3 0x0423 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА U
    0xD4 0x0424 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА EF
    0xD5 0x0425 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА HA
    0xD6 0x0426 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА TSE
    0xD7 0x0427 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА CHE
    0xD8 0x0428 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА SHA
    0xD9 0x0429 # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЩА
    0xDA 0x042A # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ЖЕСТКИЙ ЗНАК
    0xDB 0x042B # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА YERU
    0xDC 0x042C # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА МЯГКИЙ ЗНАК
    0xDD 0x042D # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА E
    0xDE 0x042E # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА YU
    0xDF 0x042F # КИРИЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА YA
    0xE0 0x0430 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА A
    0xE1 0x0431 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА BE
    0xE2 0x0432 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА VE
    0xE3 0x0433 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА GHE
    0xE4 0x0434 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА DE
    0xE5 0x0435 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА IE
    0xE6 0x0436 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ZHE
    0xE7 0x0437 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ZE
    0xE8 0x0438 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА I
    0xE9 0x0439 # КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА КОРОТКАЯ I
    0xEA 0x043A # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА KA
    0xEB 0x043B # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА EL
    0xEC 0x043C # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА EM
    0xED 0x043D # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА EN
    0xEE 0x043E # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА O
    0xEF 0x043F # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА PE
    0xF0 0x0440 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ER
    0xF1 0x0441 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ES
    0xF2 0x0442 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА TE
    0xF3 0x0443 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА U
    0xF4 0x0444 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА EF
    0xF5 0x0445 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА HA
    0xF6 0x0446 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА TSE
    0xF7 0x0447 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА CHE
    0xF8 0x0448 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА SHA
    0xF9 0x0449 # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА ЩА
    0xFA 0x044A # КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА ЖЕСТКИЙ ЗНАК
    0xFB 0x044B # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА YERU
    0xFC 0x044C # КИРИЛИЧЕСКАЯ СТРОЧНАЯ БУКВА МЯГКИЙ ЗНАК
    0xFD 0x044D # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА E
    0xFE 0x044E # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА YU
    0xFF 0x044F # СТРОЧНАЯ КИРИЛИЧЕСКАЯ БУКВА YA

    404 | Микро Фокус

  • Профессиональные услуги

    Сформируйте свою стратегию и преобразуйте гибридную ИТ-среду.


  • Профессиональные услуги по продуктам
  • Аналитика и большие данные

    Помогите вам внедрить безопасность во всю цепочку создания стоимости ИТ и наладить сотрудничество между ИТ-подразделениями, приложениями и службами безопасности.

  • Компьютерная безопасность

    Помогите вам быстрее реагировать и получить конкурентное преимущество благодаря гибкости предприятия.

  • DevOps

    Ускорьте получение результатов гибридного облака с помощью услуг по консультированию, трансформации и внедрению.

  • Консультации по цепочке создания стоимости IT4IT

    Службы управления приложениями, которые позволяют поручить управление решениями экспертам, разбирающимся в вашей среде.

  • Управление доставкой приложений

    Услуги стратегического консалтинга для разработки вашей программы цифровой трансформации.

  • Жизненный цикл мобильного приложения

    Полнофункциональное моделирование сценариев использования с встроенной интеграцией всего портфеля программного обеспечения Micro Focus, демонстрирующее реальные сценарии использования

  • Управление гибридным облаком и брокерские услуги

    Услуги экспертной аналитики безопасности, которые помогут вам быстро спроектировать, развернуть и проверить реализацию технологии безопасности Micro Focus.

  • Автоматизация ЦОД

    Служба интеграции и управления службами, которая оптимизирует доставку, гарантии и управление в условиях нескольких поставщиков.

  • Управление операциями

    Анализируйте большие данные с помощью аналитики в реальном времени и ищите неструктурированные данные.

  • Управление услугами

    Анализируйте большие данные с помощью аналитики в реальном времени и ищите неструктурированные данные.

  • Vertica

    Анализируйте большие данные с помощью аналитики в реальном времени и ищите неструктурированные данные.

  • Глобальная аутентификация продукта

    Мобильные услуги, которые обеспечивают производительность и ускоряют вывод на рынок без ущерба для качества.

  • Управляемые службы

    Анализируйте большие данные с помощью аналитики в реальном времени и ищите неструктурированные данные.

  • Модельные офисы

    Комплексные услуги по работе с большими данными для продвижения вашего предприятия.

  • поддерживаемых кодировок

    поддерживаемых кодировок

    Классы java.io.InputStreamReader, java.io.OutputStreamWriter, java.lang.String, а классы в пакете java.nio.charset могут конвертировать между Unicode и рядом других кодировок символов. Поддерживаемые кодировки различаются между различными реализациями Платформа Java 2. В java.lang спецификация пакета и описание класса для java.nio.charset.Charset перечислить кодировки, которые реализация платформы Java 2, Standard Edition, v. 1.4.2 является требуется для поддержки.

    Sun’s Java 2 Software Development Kit, Standard Edition, v.1.4.2 для всех платформ (Solaris TM операционная среда, Linux и Microsoft Windows) и Java 2 Среда выполнения, стандартная версия, версия 1.4.2 для Solaris и Linux поддерживают все кодировки, показанные на этой странице. Среда выполнения Sun Java 2 Можно установить Environment, Standard Edition, v. 1.4.2 для Windows как полная международная версия или как европейский язык версия. Установщик J2RE по умолчанию устанавливает европейские языки. версия, если он распознает, что операционная система хоста поддерживает только Европейские языки.Если установщик распознает, что любой другой язык необходим, или если пользователь запрашивает поддержку для неевропейских языков в индивидуальной установке, полный международный версия установлена. Версия для европейских языков поддерживает только кодировки, указанные в первой таблице. Международная версия (который включает файл lib / charsets.jar) поддерживает все кодировки, показанные на этой странице.

    В следующих таблицах показаны наборы кодировок, поддерживаемые J2SE. 1.4.2. Канонические имена, используемые новым java.API-интерфейсы nio используются во многих случаи не такие, как те, которые используются в API java.io и java.lang.

    Базовый набор кодировок (содержится в lib / rt.jar)
    Поддерживается java.nio, java.io и java.lang API

    Каноническое имя для API java.nio

    Каноническое имя для API java.io и java.lang

    Описание

    US-ASCII

    ASCII

    Американский стандартный код для обмена информацией

    окна-1250

    Cp1250

    Windows Восточноевропейская

    окна-1251

    Cp1251

    Windows кириллица

    окна-1252

    Cp1252

    Windows Latin-1

    окна-1253

    Cp1253

    Windows Греческий

    окна-1254

    Cp1254

    Windows Турецкая

    окна-1257

    Cp1257

    Windows Baltic

    ISO-8859-1

    ISO8859_1

    ISO 8859-1, латинский алфавит No.1

    ISO-8859-2

    ISO8859_2

    Латинский алфавит № 2

    ISO-8859-4

    ISO8859_4

    Латинский алфавит № 4

    ISO-8859-5

    ISO8859_5

    Латинский / кириллица

    ISO-8859-7

    ISO8859_7

    Латинский / греческий алфавит

    ISO-8859-9

    ISO8859_9

    Латинский алфавит No.5

    ISO-8859-13

    ISO8859_13

    Латинский алфавит № 7

    ISO-8859-15

    ISO8859_15

    Латинский алфавит № 9

    КОИ8-Р

    KOI8_R

    КОИ8-Р, Россия

    UTF-8

    UTF8

    Восьмибитный формат преобразования UCS

    UTF-16

    UTF-16

    Шестнадцатиразрядный формат преобразования UCS, порядок байтов идентифицируется необязательной меткой порядка байтов

    UTF-16BE

    UnicodeBigUnmarked

    Шестнадцатиразрядный формат преобразования Unicode, прямой порядок байтов порядок байтов

    UTF-16LE

    UnicodeLittleUnmarked

    Шестнадцатиразрядный формат преобразования Unicode, прямой порядок байтов порядок байтов

    Нет в наличии

    UnicodeBig

    Шестнадцатиразрядный формат преобразования Unicode, прямой порядок байтов порядок байтов с отметкой порядка байтов

    Нет в наличии

    UnicodeLittle

    Шестнадцатиразрядный формат преобразования Unicode, прямой порядок байтов порядок байтов с отметкой порядка байтов

    Расширенный набор кодировок (содержится в lib / кодировки.jar)
    Поддерживается java.nio, java.io и java.lang API

    Каноническое имя для API java.nio

    Каноническое имя для API java.io и java.lang

    Описание

    окна-1255

    Cp1255

    Windows Иврит

    окна-1256

    Cp1256

    Windows арабский

    окна-1258

    Cp1258

    Windows Вьетнамский

    ISO-8859-3

    ISO8859_3

    Латинский алфавит No.3

    ISO-8859-6

    ISO8859_6

    Латинский / арабский алфавит

    ISO-8859-8

    ISO8859_8

    Латинский / Ивритский алфавит

    окна-31j

    MS932

    Windows Японский

    EUC-JP

    EUC_JP

    JISX 0201, 0208 и 0212, кодировка EUC, японский язык

    x-EUC-JP-LINUX

    EUC_JP_LINUX

    JISX 0201, 0208, кодировка EUC, японский язык

    Shift_JIS

    SJIS

    Shift-JIS, японский

    ISO-2022-JP

    ISO2022JP

    JIS X 0201, 0208, в форме ISO 2022, японский

    x-mswin-936

    MS936

    Windows (упрощенный китайский)

    ГБ18030

    ГБ18030

    Упрощенный китайский, стандарт КНР

    х-EUC-CN

    EUC_CN

    GB2312, кодировка EUC, упрощенный китайский

    ГБК

    ГБК

    GBK, упрощенный китайский

    ISCII91

    ISCII91

    ISCII91 кодировка индийских скриптов

    x-окна-949

    MS949

    Windows Корейский

    EUC-KR

    EUC_KR

    KS C 5601, кодировка EUC, корейский

    ISO-2022-KR

    ISO2022KR

    ISO 2022 KR, корейский

    x-окна-950

    MS950

    Windows Традиционный китайский

    х-MS950-HKSCS

    MS950_HKSCS

    Windows Традиционный китайский с расширениями Гонконга

    х-EUC-TW

    EUC_TW

    CNS11643 (плоскость 1-3), кодировка EUC, традиционный китайский

    Big5

    Big5

    Big5, традиционный китайский

    Big5-HKSCS

    Big5_HKSCS

    Big5 с расширениями Гонконга, традиционный китайский

    ТИС-620

    TIS620

    TIS620, тайский

    Расширенный Набор кодировок (содержится в lib / charsets.jar)
    Поддерживается java.io и java.lang API

    Каноническое имя

    Описание

    Big5_Solaris

    Big5 с семью дополнительными символами идеограммы Hanzi сопоставления для локали Solaris zh_TW.BIG5

    Cp037

    США, Канада (двуязычный, французский), Нидерланды, Португалия, Бразилия, Австралия

    Cp273

    IBM Австрия, Германия

    Cp277

    IBM Дания, Норвегия

    Cp278

    IBM Финляндия, Швеция

    Cp280

    IBM Италия

    Cp284

    IBM Каталонский / Испания, испанский Латинская Америка

    Cp285

    IBM Великобритания, Ирландия

    Cp297

    IBM Франция

    Cp420

    IBM арабский

    Cp424

    IBM Иврит

    Cp437

    MS-DOS США, Австралия, Новая Зеландия, Юг Африке

    Cp500

    EBCDIC 500V1

    Cp737

    PC Греческий

    Cp775

    ПК Балтика

    Cp838

    IBM Thailand расширенный SBCS

    Cp850

    MS-DOS Latin-1

    Cp852

    MS-DOS Latin-2

    Cp855

    IBM Cyrillic

    Cp856

    IBM Иврит

    Cp857

    IBM Турецкий

    Cp858

    Вариант CP850 с символом евро

    Cp860

    MS-DOS португальский

    Cp861

    MS-DOS Исландский

    Cp862

    PC Иврит

    Cp863

    MS-DOS Канадский французский

    Cp864

    PC Арабский

    Cp865

    MS-DOS Nordic

    Cp866

    MS-DOS Русский

    Cp868

    MS-DOS Пакистан

    Cp869

    IBM Современный греческий

    Cp870

    IBM Multilingual Latin-2

    Cp871

    IBM Исландия

    Cp874

    IBM Thai

    Cp875

    IBM греческий

    Cp918

    IBM, Пакистан (урду)

    Cp921

    IBM Латвия, Литва (AIX, DOS)

    Cp922

    IBM, Эстония (AIX, DOS)

    Cp930

    Катакана и кандзи (японский), смешанные с 4370 УДК, надмножество 5026

    Cp933

    Корейский смешанный с 1880 УДК, расширенный набор из 5029

    Cp935

    Узел на упрощенном китайском, смешанный с 1880 UDC, расширенный набор 5031

    Cp937

    Традиционный китайский хост, соединенный с 6204 UDC, расширенный набор из 5033

    Cp939

    Японские латинские кандзи смешанные с 4370 UDC, расширенный набор 5035

    Cp942

    IBM OS / 2 Японский, расширенный набор Cp932

    Cp942C

    Вариант Cp942

    Cp943

    IBM OS / 2 Japanese, расширенный набор Cp932 и Shift-JIS

    Cp943C

    Вариант Cp943

    Cp948

    OS / 2 Китайский (Тайвань) расширенный набор 938

    Cp949

    PC Корейский

    Cp949C

    Вариант Cp949

    Cp950

    ПК китайский (Гонконг, Тайвань)

    Cp964

    AIX китайский (Тайвань)

    Cp970

    AIX корейский

    Cp1006

    IBM AIX Пакистан (урду)

    Cp1025

    IBM Multilingual Cyrillic: Болгария, Босния, Герцеговина, Македония (БЮР)

    Cp1026

    IBM Latin-5, Турция

    Cp1046

    IBM Arabic — Windows

    Cp1047

    Набор символов Latin-1 для хостов EBCDIC

    Cp1097

    IBM Иран (фарси) / персидский

    Cp1098

    IBM Иран (фарси) / персидский (ПК)

    Cp1112

    IBM Латвия, Литва

    Cp1122

    IBM Эстония

    Cp1123

    IBM Украина

    Cp1124

    IBM AIX Украина

    Cp1140

    Вариант Cp037 с символом евро

    Cp1141

    Вариант Cp273 с символом евро

    Cp1142

    Вариант Cp277 с символом евро

    Cp1143

    Вариант Cp278 с символом евро

    Cp1144

    Вариант CP280 с символом евро

    Cp1145

    Вариант CP284 с символом евро

    Cp1146

    Вариант CP285 с символом евро

    Cp1147

    Вариант Cp297 с символом евро

    Cp1148

    Вариант CP500 с символом евро

    Cp1149

    Вариант Cp871 с символом евро

    Cp1381

    IBM OS / 2, DOS Китайская Народная Республика (КНР)

    Cp1383

    IBM AIX Китайская Народная Республика (КНР)

    Cp33722

    IBM-eucJP — японский (расширенный набор 5050)

    ISO2022_CN_CNS

    CNS11643 в форме ISO 2022 CN, традиционный китайский (только преобразование из Unicode)

    ISO2022_CN_GB

    GB2312 в форме ISO 2022 CN, упрощенный китайский (только преобразование из Unicode)

    JISAutoDetect

    Обнаруживает и преобразует Shift-JIS, EUC-JP, ISO 2022 JP (преобразование только в Unicode)

    MS874

    Windows Тайский

    Макарабский

    Macintosh арабский

    MacCentralEurope

    Macintosh Latin-2

    Макхорватский

    Macintosh Хорватский

    MacCyrillic

    Macintosh Кириллица

    MacDingbat

    Macintosh Dingbat

    MacGreek

    Macintosh Греческий

    MacHebrew

    Macintosh Иврит

    MacIceland

    Macintosh Исландия

    MacRoman

    Macintosh Roman

    MacRomania

    Macintosh Румыния

    MacSymbol

    Символ Macintosh

    MacThai

    Macintosh Thai

    MacTurkish (турецкий)

    Macintosh Турецкий

    Mac Украина

    Macintosh Украина


    Поддерживаемые наборы символов и сопоставления

    Наборы символов

    MariaDB 10.2 поддерживает следующие наборы символов:

    Обратите внимание, что Mroonga Storage Engine поддерживает только ограниченное количество наборов символов. См. Доступные наборы символов Mroonga.

    Вы можете увидеть, какие наборы символов доступны в конкретной версии, запустив оператор SHOW CHARACTER SET или запросив таблицу CHARACTER_SETS информационной схемы.

    Сопоставления

    MariaDB поддерживает следующие сопоставления:

     SHOW COLLATION;
    + ------------------------------ + ---------- + ------ + --------- + ---------- + --------- +
    | Сортировка | Кодировка | Id | По умолчанию | Скомпилировано | Сортлен |
    + ------------------------------ + ---------- + ------ + --------- + ---------- + --------- +
    | big5_chinese_ci | big5 | 1 | Да | Да | 1 |
    | big5_bin | big5 | 84 | | Да | 1 |
    | big5_chinese_nopad_ci | big5 | 1025 | | Да | 1 |
    | big5_nopad_bin | big5 | 1108 | | Да | 1 |
    | dec8_swedish_ci | dec8 | 3 | Да | Да | 1 |
    | dec8_bin | dec8 | 69 | | Да | 1 |
    | dec8_swedish_nopad_ci | dec8 | 1027 | | Да | 1 |
    | dec8_nopad_bin | dec8 | 1093 | | Да | 1 |
    | cp850_general_ci | cp850 | 4 | Да | Да | 1 |
    | cp850_bin | cp850 | 80 | | Да | 1 |
    | cp850_general_nopad_ci | cp850 | 1028 | | Да | 1 |
    | cp850_nopad_bin | cp850 | 1104 | | Да | 1 |
    | hp8_english_ci | hp8 | 6 | Да | Да | 1 |
    | hp8_bin | hp8 | 72 | | Да | 1 |
    | hp8_english_nopad_ci | hp8 | 1030 | | Да | 1 |
    | hp8_nopad_bin | hp8 | 1096 | | Да | 1 |
    | koi8r_general_ci | koi8r | 7 | Да | Да | 1 |
    | koi8r_bin | koi8r | 74 | | Да | 1 |
    | koi8r_general_nopad_ci | koi8r | 1031 | | Да | 1 |
    | koi8r_nopad_bin | koi8r | 1098 | | Да | 1 |
    | latin1_german1_ci | latin1 | 5 | | Да | 1 |
    | latin1_swedish_ci | latin1 | 8 | Да | Да | 1 |
    | latin1_danish_ci | latin1 | 15 | | Да | 1 |
    | latin1_german2_ci | latin1 | 31 | | Да | 2 |
    | latin1_bin | latin1 | 47 | | Да | 1 |
    | latin1_general_ci | latin1 | 48 | | Да | 1 |
    | latin1_general_cs | latin1 | 49 | | Да | 1 |
    | latin1_spanish_ci | latin1 | 94 | | Да | 1 |
    | latin1_swedish_nopad_ci | latin1 | 1032 | | Да | 1 |
    | latin1_nopad_bin | latin1 | 1071 | | Да | 1 |
    | latin2_czech_cs | latin2 | 2 | | Да | 4 |
    | latin2_general_ci | latin2 | 9 | Да | Да | 1 |
    | latin2_hungarian_ci | latin2 | 21 | | Да | 1 |
    | latin2_croatian_ci | latin2 | 27 | | Да | 1 |
    | latin2_bin | latin2 | 77 | | Да | 1 |
    | latin2_general_nopad_ci | latin2 | 1033 | | Да | 1 |
    | latin2_nopad_bin | latin2 | 1101 | | Да | 1 |
    | swe7_swedish_ci | swe7 | 10 | Да | Да | 1 |
    | swe7_bin | swe7 | 82 | | Да | 1 |
    | swe7_swedish_nopad_ci | swe7 | 1034 | | Да | 1 |
    | swe7_nopad_bin | swe7 | 1106 | | Да | 1 |
    | ascii_general_ci | ascii | 11 | Да | Да | 1 |
    | ascii_bin | ascii | 65 | | Да | 1 |
    | ascii_general_nopad_ci | ascii | 1035 | | Да | 1 |
    | ascii_nopad_bin | ascii | 1089 | | Да | 1 |
    | ujis_japanese_ci | уджи | 12 | Да | Да | 1 |
    | ujis_bin | уджи | 91 | | Да | 1 |
    | ujis_japanese_nopad_ci | уджи | 1036 | | Да | 1 |
    | ujis_nopad_bin | уджи | 1115 | | Да | 1 |
    | sjis_japanese_ci | sjis | 13 | Да | Да | 1 |
    | sjis_bin | sjis | 88 | | Да | 1 |
    | sjis_japanese_nopad_ci | sjis | 1037 | | Да | 1 |
    | sjis_nopad_bin | sjis | 1112 | | Да | 1 |
    | hebrew_general_ci | иврит | 16 | Да | Да | 1 |
    | hebrew_bin | иврит | 71 | | Да | 1 |
    | hebrew_general_nopad_ci | иврит | 1040 | | Да | 1 |
    | hebrew_nopad_bin | иврит | 1095 | | Да | 1 |
    | tis620_thai_ci | tis620 | 18 | Да | Да | 4 |
    | tis620_bin | tis620 | 89 | | Да | 1 |
    | tis620_thai_nopad_ci | tis620 | 1042 | | Да | 4 |
    | tis620_nopad_bin | tis620 | 1113 | | Да | 1 |
    | euckr_korean_ci | euckr | 19 | Да | Да | 1 |
    | euckr_bin | euckr | 85 | | Да | 1 |
    | euckr_korean_nopad_ci | euckr | 1043 | | Да | 1 |
    | euckr_nopad_bin | euckr | 1109 | | Да | 1 |
    | koi8u_general_ci | koi8u | 22 | Да | Да | 1 |
    | koi8u_bin | koi8u | 75 | | Да | 1 |
    | koi8u_general_nopad_ci | koi8u | 1046 | | Да | 1 |
    | koi8u_nopad_bin | koi8u | 1099 | | Да | 1 |
    | gb2312_chinese_ci | gb2312 | 24 | Да | Да | 1 |
    | gb2312_bin | gb2312 | 86 | | Да | 1 |
    | gb2312_chinese_nopad_ci | gb2312 | 1048 | | Да | 1 |
    | gb2312_nopad_bin | gb2312 | 1110 | | Да | 1 |
    | greek_general_ci | греческий | 25 | Да | Да | 1 |
    | greek_bin | греческий | 70 | | Да | 1 |
    | greek_general_nopad_ci | греческий | 1049 | | Да | 1 |
    | greek_nopad_bin | греческий | 1094 | | Да | 1 |
    | cp1250_general_ci | cp1250 | 26 | Да | Да | 1 |
    | cp1250_czech_cs | cp1250 | 34 | | Да | 2 |
    | cp1250_croatian_ci | cp1250 | 44 | | Да | 1 |
    | cp1250_bin | cp1250 | 66 | | Да | 1 |
    | cp1250_polish_ci | cp1250 | 99 | | Да | 1 |
    | cp1250_general_nopad_ci | cp1250 | 1050 | | Да | 1 |
    | cp1250_nopad_bin | cp1250 | 1090 | | Да | 1 |
    | gbk_chinese_ci | gbk | 28 | Да | Да | 1 |
    | gbk_bin | gbk | 87 | | Да | 1 |
    | gbk_chinese_nopad_ci | gbk | 1052 | | Да | 1 |
    | gbk_nopad_bin | gbk | 1111 | | Да | 1 |
    | latin5_turkish_ci | latin5 | 30 | Да | Да | 1 |
    | latin5_bin | latin5 | 78 | | Да | 1 |
    | latin5_turkish_nopad_ci | latin5 | 1054 | | Да | 1 |
    | latin5_nopad_bin | latin5 | 1102 | | Да | 1 |
    | armcii8_general_ci | armcii8 | 32 | Да | Да | 1 |
    | armcii8_bin | armcii8 | 64 | | Да | 1 |
    | armcii8_general_nopad_ci | armcii8 | 1056 | | Да | 1 |
    | armcii8_nopad_bin | armcii8 | 1088 | | Да | 1 |
    | utf8_general_ci | utf8 | 33 | Да | Да | 1 |
    | utf8_bin | utf8 | 83 | | Да | 1 |
    | utf8_unicode_ci | utf8 | 192 | | Да | 8 |
    | utf8_icelandic_ci | utf8 | 193 | | Да | 8 |
    | utf8_latvian_ci | utf8 | 194 | | Да | 8 |
    | utf8_romanian_ci | utf8 | 195 | | Да | 8 |
    | utf8_slovenian_ci | utf8 | 196 | | Да | 8 |
    | utf8_polish_ci | utf8 | 197 | | Да | 8 |
    | utf8_estonian_ci | utf8 | 198 | | Да | 8 |
    | utf8_spanish_ci | utf8 | 199 | | Да | 8 |
    | utf8_swedish_ci | utf8 | 200 | | Да | 8 |
    | utf8_turkish_ci | utf8 | 201 | | Да | 8 |
    | utf8_czech_ci | utf8 | 202 | | Да | 8 |
    | utf8_danish_ci | utf8 | 203 | | Да | 8 |
    | utf8_lithuanian_ci | utf8 | 204 | | Да | 8 |
    | utf8_sofa_ci | utf8 | 205 | | Да | 8 |
    | utf8_spanish3_ci | utf8 | 206 | | Да | 8 |
    | utf8_roman_ci | utf8 | 207 | | Да | 8 |
    | utf8_persian_ci | utf8 | 208 | | Да | 8 |
    | utf8_esperanto_ci | utf8 | 209 | | Да | 8 |
    | utf8_hungarian_ci | utf8 | 210 | | Да | 8 |
    | utf8_sinhala_ci | utf8 | 211 | | Да | 8 |
    | utf8_german2_ci | utf8 | 212 | | Да | 8 |
    | utf8_croatian_mysql561_ci | utf8 | 213 | | Да | 8 |
    | utf8_unicode_520_ci | utf8 | 214 | | Да | 8 |
    | utf8_vietnamese_ci | utf8 | 215 | | Да | 8 |
    | utf8_general_mysql500_ci | utf8 | 223 | | Да | 1 |
    | utf8_croatian_ci | utf8 | 576 | | Да | 8 |
    | utf8_myanmar_ci | utf8 | 577 | | Да | 8 |
    | utf8_thai_520_w2 | utf8 | 578 | | Да | 4 |
    | utf8_general_nopad_ci | utf8 | 1057 | | Да | 1 |
    | utf8_nopad_bin | utf8 | 1107 | | Да | 1 |
    | utf8_unicode_nopad_ci | utf8 | 1216 | | Да | 8 |
    | utf8_unicode_520_nopad_ci | utf8 | 1238 | | Да | 8 |
    | ucs2_general_ci | ucs2 | 35 | Да | Да | 1 |
    | ucs2_bin | ucs2 | 90 | | Да | 1 |
    | ucs2_unicode_ci | ucs2 | 128 | | Да | 8 |
    | ucs2_icelandic_ci | ucs2 | 129 | | Да | 8 |
    | ucs2_latvian_ci | ucs2 | 130 | | Да | 8 |
    | ucs2_romanian_ci | ucs2 | 131 | | Да | 8 |
    | ucs2_slovenian_ci | ucs2 | 132 | | Да | 8 |
    | ucs2_polish_ci | ucs2 | 133 | | Да | 8 |
    | ucs2_estonian_ci | ucs2 | 134 | | Да | 8 |
    | ucs2_spanish_ci | ucs2 | 135 | | Да | 8 |
    | ucs2_swedish_ci | ucs2 | 136 | | Да | 8 |
    | ucs2_turkish_ci | ucs2 | 137 | | Да | 8 |
    | ucs2_czech_ci | ucs2 | 138 | | Да | 8 |
    | ucs2_danish_ci | ucs2 | 139 | | Да | 8 |
    | ucs2_lithuanian_ci | ucs2 | 140 | | Да | 8 |
    | ucs2_sofa_ci | ucs2 | 141 | | Да | 8 |
    | ucs2_spanish3_ci | ucs2 | 142 | | Да | 8 |
    | ucs2_roman_ci | ucs2 | 143 | | Да | 8 |
    | ucs2_persian_ci | ucs2 | 144 | | Да | 8 |
    | ucs2_esperanto_ci | ucs2 | 145 | | Да | 8 |
    | ucs2_hungarian_ci | ucs2 | 146 | | Да | 8 |
    | ucs2_sinhala_ci | ucs2 | 147 | | Да | 8 |
    | ucs2_german2_ci | ucs2 | 148 | | Да | 8 |
    | ucs2_croatian_mysql561_ci | ucs2 | 149 | | Да | 8 |
    | ucs2_unicode_520_ci | ucs2 | 150 | | Да | 8 |
    | ucs2_vietnamese_ci | ucs2 | 151 | | Да | 8 |
    | ucs2_general_mysql500_ci | ucs2 | 159 | | Да | 1 |
    | ucs2_croatian_ci | ucs2 | 640 | | Да | 8 |
    | ucs2_myanmar_ci | ucs2 | 641 | | Да | 8 |
    | ucs2_thai_520_w2 | ucs2 | 642 | | Да | 4 |
    | ucs2_general_nopad_ci | ucs2 | 1059 | | Да | 1 |
    | ucs2_nopad_bin | ucs2 | 1114 | | Да | 1 |
    | ucs2_unicode_nopad_ci | ucs2 | 1152 | | Да | 8 |
    | ucs2_unicode_520_nopad_ci | ucs2 | 1174 | | Да | 8 |
    | cp866_general_ci | cp866 | 36 | Да | Да | 1 |
    | cp866_bin | cp866 | 68 | | Да | 1 |
    | cp866_general_nopad_ci | cp866 | 1060 | | Да | 1 |
    | cp866_nopad_bin | cp866 | 1092 | | Да | 1 |
    | keybcs2_general_ci | keybcs2 | 37 | Да | Да | 1 |
    | keybcs2_bin | keybcs2 | 73 | | Да | 1 |
    | keybcs2_general_nopad_ci | keybcs2 | 1061 | | Да | 1 |
    | keybcs2_nopad_bin | keybcs2 | 1097 | | Да | 1 |
    | macce_general_ci | macce | 38 | Да | Да | 1 |
    | macce_bin | macce | 43 | | Да | 1 |
    | macce_general_nopad_ci | macce | 1062 | | Да | 1 |
    | macce_nopad_bin | macce | 1067 | | Да | 1 |
    | macroman_general_ci | макроман | 39 | Да | Да | 1 |
    | macroman_bin | макроман | 53 | | Да | 1 |
    | macroman_general_nopad_ci | макроман | 1063 | | Да | 1 |
    | macroman_nopad_bin | макроман | 1077 | | Да | 1 |
    | cp852_general_ci | cp852 | 40 | Да | Да | 1 |
    | cp852_bin | cp852 | 81 | | Да | 1 |
    | cp852_general_nopad_ci | cp852 | 1064 | | Да | 1 |
    | cp852_nopad_bin | cp852 | 1105 | | Да | 1 |
    | latin7_estonian_cs | latin7 | 20 | | Да | 1 |
    | latin7_general_ci | latin7 | 41 | Да | Да | 1 |
    | latin7_general_cs | latin7 | 42 | | Да | 1 |
    | latin7_bin | latin7 | 79 | | Да | 1 |
    | latin7_general_nopad_ci | latin7 | 1065 | | Да | 1 |
    | latin7_nopad_bin | latin7 | 1103 | | Да | 1 |
    | utf8mb4_general_ci | utf8mb4 | 45 | Да | Да | 1 |
    | utf8mb4_bin | utf8mb4 | 46 | | Да | 1 |
    | utf8mb4_unicode_ci | utf8mb4 | 224 | | Да | 8 |
    | utf8mb4_icelandic_ci | utf8mb4 | 225 | | Да | 8 |
    | utf8mb4_latvian_ci | utf8mb4 | 226 | | Да | 8 |
    | utf8mb4_romanian_ci | utf8mb4 | 227 | | Да | 8 |
    | utf8mb4_slovenian_ci | utf8mb4 | 228 | | Да | 8 |
    | utf8mb4_polish_ci | utf8mb4 | 229 | | Да | 8 |
    | utf8mb4_estonian_ci | utf8mb4 | 230 | | Да | 8 |
    | utf8mb4_spanish_ci | utf8mb4 | 231 | | Да | 8 |
    | utf8mb4_swedish_ci | utf8mb4 | 232 | | Да | 8 |
    | utf8mb4_turkish_ci | utf8mb4 | 233 | | Да | 8 |
    | utf8mb4_czech_ci | utf8mb4 | 234 | | Да | 8 |
    | utf8mb4_danish_ci | utf8mb4 | 235 | | Да | 8 |
    | utf8mb4_lithuanian_ci | utf8mb4 | 236 | | Да | 8 |
    | utf8mb4_sofa_ci | utf8mb4 | 237 | | Да | 8 |
    | utf8mb4_spanish3_ci | utf8mb4 | 238 | | Да | 8 |
    | utf8mb4_roman_ci | utf8mb4 | 239 | | Да | 8 |
    | utf8mb4_persian_ci | utf8mb4 | 240 | | Да | 8 |
    | utf8mb4_esperanto_ci | utf8mb4 | 241 | | Да | 8 |
    | utf8mb4_hungarian_ci | utf8mb4 | 242 | | Да | 8 |
    | utf8mb4_sinhala_ci | utf8mb4 | 243 | | Да | 8 |
    | utf8mb4_german2_ci | utf8mb4 | 244 | | Да | 8 |
    | utf8mb4_croatian_mysql561_ci | utf8mb4 | 245 | | Да | 8 |
    | utf8mb4_unicode_520_ci | utf8mb4 | 246 | | Да | 8 |
    | utf8mb4_vietnamese_ci | utf8mb4 | 247 | | Да | 8 |
    | utf8mb4_croatian_ci | utf8mb4 | 608 | | Да | 8 |
    | utf8mb4_myanmar_ci | utf8mb4 | 609 | | Да | 8 |
    | utf8mb4_thai_520_w2 | utf8mb4 | 610 | | Да | 4 |
    | utf8mb4_general_nopad_ci | utf8mb4 | 1069 | | Да | 1 |
    | utf8mb4_nopad_bin | utf8mb4 | 1070 | | Да | 1 |
    | utf8mb4_unicode_nopad_ci | utf8mb4 | 1248 | | Да | 8 |
    | utf8mb4_unicode_520_nopad_ci | utf8mb4 | 1270 | | Да | 8 |
    | cp1251_bulgarian_ci | cp1251 | 14 | | Да | 1 |
    | cp1251_ukrainian_ci | cp1251 | 23 | | Да | 1 |
    | cp1251_bin | cp1251 | 50 | | Да | 1 |
    | cp1251_general_ci | cp1251 | 51 | Да | Да | 1 |
    | cp1251_general_cs | cp1251 | 52 | | Да | 1 |
    | cp1251_nopad_bin | cp1251 | 1074 | | Да | 1 |
    | cp1251_general_nopad_ci | cp1251 | 1075 | | Да | 1 |
    | utf16_general_ci | utf16 | 54 | Да | Да | 1 |
    | utf16_bin | utf16 | 55 | | Да | 1 |
    | utf16_unicode_ci | utf16 | 101 | | Да | 8 |
    | utf16_icelandic_ci | utf16 | 102 | | Да | 8 |
    | utf16_latvian_ci | utf16 | 103 | | Да | 8 |
    | utf16_romanian_ci | utf16 | 104 | | Да | 8 |
    | utf16_slovenian_ci | utf16 | 105 | | Да | 8 |
    | utf16_polish_ci | utf16 | 106 | | Да | 8 |
    | utf16_estonian_ci | utf16 | 107 | | Да | 8 |
    | utf16_spanish_ci | utf16 | 108 | | Да | 8 |
    | utf16_swedish_ci | utf16 | 109 | | Да | 8 |
    | utf16_turkish_ci | utf16 | 110 | | Да | 8 |
    | utf16_czech_ci | utf16 | 111 | | Да | 8 |
    | utf16_danish_ci | utf16 | 112 | | Да | 8 |
    | utf16_lithuanian_ci | utf16 | 113 | | Да | 8 |
    | utf16_sofa_ci | utf16 | 114 | | Да | 8 |
    | utf16_spanish3_ci | utf16 | 115 | | Да | 8 |
    | utf16_roman_ci | utf16 | 116 | | Да | 8 |
    | utf16_persian_ci | utf16 | 117 | | Да | 8 |
    | utf16_esperanto_ci | utf16 | 118 | | Да | 8 |
    | utf16_hungarian_ci | utf16 | 119 | | Да | 8 |
    | utf16_sinhala_ci | utf16 | 120 | | Да | 8 |
    | utf16_german2_ci | utf16 | 121 | | Да | 8 |
    | utf16_croatian_mysql561_ci | utf16 | 122 | | Да | 8 |
    | utf16_unicode_520_ci | utf16 | 123 | | Да | 8 |
    | utf16_vietnamese_ci | utf16 | 124 | | Да | 8 |
    | utf16_croatian_ci | utf16 | 672 | | Да | 8 |
    | utf16_myanmar_ci | utf16 | 673 | | Да | 8 |
    | utf16_thai_520_w2 | utf16 | 674 | | Да | 4 |
    | utf16_general_nopad_ci | utf16 | 1078 | | Да | 1 |
    | utf16_nopad_bin | utf16 | 1079 | | Да | 1 |
    | utf16_unicode_nopad_ci | utf16 | 1125 | | Да | 8 |
    | utf16_unicode_520_nopad_ci | utf16 | 1147 | | Да | 8 |
    | utf16le_general_ci | utf16le | 56 | Да | Да | 1 |
    | utf16le_bin | utf16le | 62 | | Да | 1 |
    | utf16le_general_nopad_ci | utf16le | 1080 | | Да | 1 |
    | utf16le_nopad_bin | utf16le | 1086 | | Да | 1 |
    | cp1256_general_ci | cp1256 | 57 | Да | Да | 1 |
    | cp1256_bin | cp1256 | 67 | | Да | 1 |
    | cp1256_general_nopad_ci | cp1256 | 1081 | | Да | 1 |
    | cp1256_nopad_bin | cp1256 | 1091 | | Да | 1 |
    | cp1257_lithuanian_ci | cp1257 | 29 | | Да | 1 |
    | cp1257_bin | cp1257 | 58 | | Да | 1 |
    | cp1257_general_ci | cp1257 | 59 | Да | Да | 1 |
    | cp1257_nopad_bin | cp1257 | 1082 | | Да | 1 |
    | cp1257_general_nopad_ci | cp1257 | 1083 | | Да | 1 |
    | utf32_general_ci | utf32 | 60 | Да | Да | 1 |
    | utf32_bin | utf32 | 61 | | Да | 1 |
    | utf32_unicode_ci | utf32 | 160 | | Да | 8 |
    | utf32_icelandic_ci | utf32 | 161 | | Да | 8 |
    | utf32_latvian_ci | utf32 | 162 | | Да | 8 |
    | utf32_romanian_ci | utf32 | 163 | | Да | 8 |
    | utf32_slovenian_ci | utf32 | 164 | | Да | 8 |
    | utf32_polish_ci | utf32 | 165 | | Да | 8 |
    | utf32_estonian_ci | utf32 | 166 | | Да | 8 |
    | utf32_spanish_ci | utf32 | 167 | | Да | 8 |
    | utf32_swedish_ci | utf32 | 168 | | Да | 8 |
    | utf32_turkish_ci | utf32 | 169 | | Да | 8 |
    | utf32_czech_ci | utf32 | 170 | | Да | 8 |
    | utf32_danish_ci | utf32 | 171 | | Да | 8 |
    | utf32_lithuanian_ci | utf32 | 172 | | Да | 8 |
    | utf32_s Slovak_ci | utf32 | 173 | | Да | 8 |
    | utf32_spanish3_ci | utf32 | 174 | | Да | 8 |
    | utf32_roman_ci | utf32 | 175 | | Да | 8 |
    | utf32_persian_ci | utf32 | 176 | | Да | 8 |
    | utf32_esperanto_ci | utf32 | 177 | | Да | 8 |
    | utf32_hungarian_ci | utf32 | 178 | | Да | 8 |
    | utf32_sinhala_ci | utf32 | 179 | | Да | 8 |
    | utf32_german2_ci | utf32 | 180 | | Да | 8 |
    | utf32_croatian_mysql561_ci | utf32 | 181 | | Да | 8 |
    | utf32_unicode_520_ci | utf32 | 182 | | Да | 8 |
    | utf32_vietnamese_ci | utf32 | 183 | | Да | 8 |
    | utf32_croatian_ci | utf32 | 736 | | Да | 8 |
    | utf32_myanmar_ci | utf32 | 737 | | Да | 8 |
    | utf32_thai_520_w2 | utf32 | 738 | | Да | 4 |
    | utf32_general_nopad_ci | utf32 | 1084 | | Да | 1 |
    | utf32_nopad_bin | utf32 | 1085 | | Да | 1 |
    | utf32_unicode_nopad_ci | utf32 | 1184 | | Да | 8 |
    | utf32_unicode_520_nopad_ci | utf32 | 1206 | | Да | 8 |
    | двоичный | двоичный | 63 | Да | Да | 1 |
    | geostd8_general_ci | geostd8 | 92 | Да | Да | 1 |
    | geostd8_bin | geostd8 | 93 | | Да | 1 |
    | geostd8_general_nopad_ci | geostd8 | 1116 | | Да | 1 |
    | geostd8_nopad_bin | geostd8 | 1117 | | Да | 1 |
    | cp932_japanese_ci | cp932 | 95 | Да | Да | 1 |
    | cp932_bin | cp932 | 96 | | Да | 1 |
    | cp932_japanese_nopad_ci | cp932 | 1119 | | Да | 1 |
    | cp932_nopad_bin | cp932 | 1120 | | Да | 1 |
    | eucjpms_japanese_ci | eucjpms | 97 | Да | Да | 1 |
    | eucjpms_bin | eucjpms | 98 | | Да | 1 |
    | eucjpms_japanese_nopad_ci | eucjpms | 1121 | | Да | 1 |
    | eucjpms_nopad_bin | eucjpms | 1122 | | Да | 1 |
    + ------------------------------ + ---------- + ------ + --------- + ---------- + --------- +
    322 ряда в наборе (0.00 сек)
     

    Начиная с MariaDB 10.6.1, сопоставления utf8 * , перечисленные выше, переименованы в utf8mb3 * .

    ci ‘ в конце имени сортировки указывает сортировка нечувствительна к регистру. « cs » в конце Имя сортировки указывает, что сортировка чувствительна к регистру. « nopad » как часть имени указывает, что сопоставление имеет тип NO PAD в отличие от PADSPACE (см. Ниже).

    NO PAD сопоставления

    MariaDB начиная с 10.2

    До MariaDB 10.1 все сопоставления имели тип PADSPACE . Начиная с MariaDB 10.2 доступно 88 новых сопоставлений NO PAD . NO PAD При сопоставлении конечные пробелы рассматриваются как обычные символы. Вы можете получить список всего этого, запросив таблицу COLLATIONS информационной схемы следующим образом:

     ВЫБРАТЬ имя_сопоставления ИЗ information_schema.COLLATIONS
    ГДЕ collation_name LIKE "% nopad%";
    + ------------------------------ +
    | collation_name |
    + ------------------------------ +
    | big5_chinese_nopad_ci |
    | big5_nopad_bin |
    ...
     

    Изменения

    • MariaDB 10.6.1 изменил набор символов utf8 по умолчанию на псевдоним для utf8mb3, а не наоборот. Его можно настроить так, чтобы он подразумевал utf8mb4 , изменив значение системной переменной old_mode.
    • MariaDB 10.2.2 добавил 88 NO PAD сопоставлений.
    • MariaDB 10.1.15 добавила сопоставления utf8_thai_520_w2 , utf8mb4_thai_520_w2 , ucs2_thai_520_w2 , utf16_thai_520_w2 и utf32_thai_12520_
    • MariaDB 10.0.7 добавила сопоставления utf8_myanmar_ci , ucs2_myanmar_ci , utf8mb4_myanmar_ci , utf16_myanmar_ci и utf32_myanmar_ci .
    • MariaDB 10.0.5 добавила сопоставления utf8_german2_ci , utf8mb4_german2_ci , ucs2_german2_ci , utf16_german2_ci и utf32_german2_ci .
    • MariaDB 5.1.41 добавил патч сортировки для Хорватии из Александра Баркова, чтобы исправить некоторые проблемы с Хорватский набор символов и запросы LIKE .Этот патч добавлен utf8_croatian_ci и ucs2_croatian_ci сопоставления с MariaDB.

    См. Также

    Windows-1251

    Windows-1251 (a.k.a. CP1251 ) является популярным 8-битным символом, разработанным для кубических языков, которые используются на английском языке и других языках. Este es la codifiación más ampiamente usada para codificar Búlgaro, Serbio y lenguajes Macedonio.

    В следующей таблице показан Windows-1251.Каждый символ отображается с его десятичным кодом и его эквивалентом в Юникоде.

    В приведенной выше таблице 20 - это обычный ПРОБЕЛ, A0 - это ПРОБЕЛ БЕЗ РАЗРЫВА, а AD - МЯГКИЙ ДЕФИС.

    Оставить комментарий

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *

    © 2019 Штирлиц Сеть печатных салонов в Перми

    Цифровая печать, цветное и черно-белое копирование документов, сканирование документов, ризография в Перми.

    Окна-1252 (CP1252)
    —0 —1 —2 —3 —4 —5 —6 —7 —8 —9 —А —B —C —D —E —F
    0- NUL
    0000
    0
    SOH
    0001
    1
    STX
    0002
    2
    ETX
    0003
    3
    EOT
    0004
    4
    ENQ
    0005
    5
    ACK
    0006
    6
    БЕЛ
    0007
    7
    BS
    0008
    8
    HT
    0009
    9
    LF
    000A
    10
    VT
    000B
    11
    ФФ
    000C
    12
    CR
    000D
    13
    СО
    000E
    14
    SI
    000F
    15
    1- DLE
    0010
    16
    DC1
    0011
    17
    DC2
    0012
    18
    DC3
    0013
    19
    DC4
    0014
    20
    НАК
    0015
    21
    SYN
    0016
    22
    ETB
    0017
    23
    CAN
    0018
    24
    EM
    0019
    25
    SUB
    001A
    26
    ESC
    001B
    27
    ФС
    001C
    28
    GS
    001D
    29
    RS
    001E
    30
    США
    001F
    31
    2- SP
    0020
    32
    !
    0021
    33
    "
    0022
    34
    #
    0023
    35
    $
    0024
    36
    %
    0025
    37
    и
    0026
    38
    '
    0027
    39
    (
    0028
    40
    )
    0029
    41
    *
    002A
    42
    +
    002B
    43
    ,
    002C
    44

    002D
    45
    .
    002E
    46
    /
    002F
    47
    3- 0
    0030
    48
    1
    0031
    49
    2
    0032
    50
    3
    0033
    51
    4
    0034
    52
    5
    0035
    53
    6
    0036
    54
    7
    0037
    55
    8
    0038
    56
    9
    0039
    57
    :
    003A
    58
    ;
    003B
    59
    <
    003C
    60
    =
    003D
    61
    >
    003E
    62
    ?
    003F
    63
    4- @
    0040
    64
    А
    0041
    65
    B
    0042
    66
    С
    0043
    67
    D
    0044
    68
    E
    0045
    69
    Ф
    0046
    70
    G
    0047
    71
    H
    0048
    72
    I
    0049
    73
    Дж
    004A
    74
    К
    004B
    75
    л
    004C
    76
    M
    004D
    77
    N
    004E
    78
    O
    004F
    79
    5- П
    0050
    80
    Q
    0051
    81
    р
    0052
    82
    S
    0053
    83
    т
    0054
    84
    U
    0055
    85
    В
    0056
    86
    Вт
    0057
    87
    Х
    0058
    88
    Y
    0059
    89
    Z
    005A
    90
    [
    005B
    91
    \
    005C
    92
    ]
    005D
    93
    ^
    005E
    94
    _
    005F
    95
    6- `
    0060
    96
    а
    0061
    97
    б
    0062
    98
    с
    0063
    99
    д
    0064
    100
    e
    0065
    101
    ф
    0066
    102
    г
    0067
    103
    ч
    0068
    104
    i
    0069
    105
    j
    006A
    106
    к
    006B
    107
    л
    006C
    108
    м
    006D
    109
    n
    006E
    110
    o
    006F
    111
    7- п.
    0070
    112
    q
    0071
    113
    р
    0072
    114
    с
    0073
    115
    т
    0074
    116
    u
    0075
    117
    v
    0076
    118
    Вт
    0077
    119
    x
    0078
    120
    л
    0079
    121
    z
    007A
    122
    {
    007B
    123
    |
    007C
    124
    }
    007D
    125
    ~
    007E
    126
    DEL
    007F
    127
    Plantilla: Chset-левый Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3
    Plantilla: Chset-левый Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-undef | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3
    Plantilla: Chset-левый Плантилья: Chset-color-punct | Плантилья: Chset-ctrl3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Plantilla: Цветной набор микросхем | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-ctrl3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3
    Plantilla: Chset-левый Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-punct | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3
    Plantilla: Chset-левый Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3
    Plantilla: Chset-левый Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3
    Plantilla: Chset-левый Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3
    Plantilla: Chset-левый Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3 Плантилья: Chset-color-intl | Плантилья: Chset-cell3