Кодировка виндовс 1251 таблица: Windows 1251 сколько бит на символ

Windows-1251 — Циклопедия

Материал из Циклопедии

Перейти к: навигация, поиск

Эта статья в настоящее время активно дополняется.
Не вносите сюда изменений до тех пор, пока это объявление не будет убрано.


Windows-1251 — цифровая (компьютерная) кодировка, расширяющая ASCII для представления букв кириллицы и других символов. Самая популярная в Интернете однобайтовая (чисто 8-битная) кодировка кириллицы и вторая по используемости однобайтовая кодировка символов вообще после Windows-1252. Является одной из кодовых страниц для операционной системы Windows; под тем же номером внесена в каталог корпорации IBM.[1] На UNIX-системах называется «CP1251»; исторически называлась «кириллицей Windows» или «кириллицей Microsoft».

Содержание

  • 1 Набор и расположение символов
  • 2 Использование
    • 2.1 В Интернете
    • 2.
      2 В Microsoft Windows
    • 2.3 В прочих контекстах
  • 3 История создания, варианты и модификации
  • 4 Интересные факты
  • 5 Ссылки

Набор и расположение символов[править]

Основой для Windows-1251 служит кодовая страница западной латиницы Windows-1252, вторая половина кодовой таблицы которой освобождена от специфичных для латиницы букв и ряда подобных им знаков, а также нескольких таких (малоиспользуемых в кириллической типографике) символов, как простые двоичные дроби. Однако, свои места сохраняют символы «©», «®» и «™». Остаются нетронутыми не только все ASCII-символы, но и несколько (уточнить) позиций типографики. Это обеспечивает некоторую меру совместимости страницы 1251 с Windows-1252 и ею подобными: хотя при чтении записанного в Windows-1251 текста при установленной странице 1252 (или наоборот) и будут испорчены буквы, то хотя бы сохранят свой вид тире, кавычки-ёлочки, кривые апострофы и т.п. Знак евро «€», являющийся позднейшим добавлением в Windows, находится в Windows-1251 на 0x88 (136,

\210) в отличие от 0x80 (128, \200) в 1252 и большинстве других страниц Windows.

Использование[править]

В Интернете[править]

Наличие в кодовой странице множества символов типографики (что не имеет места ни в «альтернативной» кодировке, ни в KOI8, ни тем более в ISO 8859-5) сделало весьма удобным представление свёрстанного кириллического текста в Windows-1251 независимо от операционной системы потребителя. Это обеспечило уверенное доминирование Windows-1251 в кириллическом секторе WWW на протяжение примерно двенадцати лет. При этом в электронной почте и сообщениях NNTP преобладала KOI8-R (и её модификации) ввиду особенностей передачи данных по некоторым каналам. С конца 2000-х годов главной кодировкой Интернета становится UTF-8, в том числе для кириллической письменности.

По тем же причинам, что и вышеназванные, Windows-1251 имела широкое использование в IRC и используется (в русскоязычной среде) до сих пор. Ограничения протокола делают нежелательным полный переход на UTF-8 (или какую-либо многобайтную кодировку вообще).

В Microsoft Windows[править]

Служила локализацией для использующих кириллицу славянских языков и некоторых других (перечислить) как до введения в Windows Юникода, так и после — ради поддержания приложений, работающих через старый 8-битный API. Информацию о кодовой странице можно найти в реестре в разделе «HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage\», ключах «1251» и (при наличии локали) «ACP».

В прочих контекстах[править]

Кроме использования кода 0xFF (255, \377) для строчной буквы «я», нет противопоказаний для использования Windows-1251 в системах UNIX. Современные системы (большинство разновидностей GNU/Linux, FreeBSD и т.д.) позволяют без установки стороннего ПО собрать локаль с кодировкой CP1251.

История создания, варианты и модификации[править]

Ни CP866 (разновидность «альтернативной» кодировки), уже поддерживаемая ПО от Microsoft, ни KOI8-R разработчиков Windows не удовлетворили ввиду отсутствия многих полезных символов типографики. Их место во второй половине кодовых таблиц CP866 и KOI8-R занимает псевдографика, бесполезная в графической среде Windows. Как указано выше, расположение символов Windows-1251 обусловлено частичной совместимостью с Windows-1252, разработанной ранее.

В течение 1990-х годов и до 2002 года были разработаны несколько модификаций кодировки для поддержки алфавитов, не полностью покрываемых исходной кодовой страницей Windows-1251.

Интересные факты[править]

  • Номера кодовых страниц Windows назначаются не в порядке создания. Кодировка из страницы 1252 присутствовала в ПО Windows изначально, а 1250 (центральноевропейская латиница) и 1251 появились позже — во время Windows 3.1.
  1. ↑ ftp://ftp.software.ibm.com/software/globalization/gcoc/attachments/CP01251.txt
  • http://dibr.nnov.ru/use012.html — версия истории создания Windows-1251, опубликованная в фидоэхе SU.LAN неким Igor V. Semenyuk.
  • http://web.archive.org/web/20140606085903/http://msdn.microsoft.com/ru-RU/goglobal/cc305144.aspx
Кодировки символов
ОсновыАлфавит • текст • набор символов • конверсия
Исторические кодировкиДокомп. :семафорная (Макарова) • Морзе • Бодо • МТК-2
Комп.:6-битная • УПП • RADIX-50 • EBCDIC ( ДКОИ-8 ) • КОИ-7 • ISO 646
современное
8-битное
представление
символы ASCII ( управляющие • печатные )
8-битные код.стр.ISO 8859 • кириллица (КОИ-8 • ГОСТ 19768-87 • MacCyrillic)
Windows1250 • 1251 (кир.) • 1252 • 1253 • 1254 • 1255 • 1256 • 1257 • 1258 • WGL4
IBM & DOS437 • 850 • 852 • 855 • 866 «альт.» • МИК • НИИ ЭВМ
МногобайтныеТрадиционныеDBCS ( GB 2312 ) • HTML
UnicodeUTF • список символов (кириллица • латиница)
Связанные темыинтерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • кракозябры • транслит • нестандартные шрифты

О проблемах понимания русского языка | Мир ПК

«Носителями» кодовых страниц в Windows являются шрифты. Программа «Таблица символов» позволяет рассмотреть первые 256 символов, которые отображаются с помощью данного шрифта. Одни из них, соответствующие кодовой странице Windows-1251, применяются для передачи текста, другие — математические, а третьи — просто значки для «разукрашивания» документа, хранящиеся в специальных шрифтах.

Шрифты

«Носителями» кодовых страниц в Windows являются шрифты. Программа «Таблица символов» позволяет рассмотреть первые 256 символов, которые отображаются с помощью данного шрифта. Одни из них, соответствующие кодовой странице Windows-1251, применяются для передачи текста, другие — математические, а третьи — просто значки для «разукрашивания» документа, хранящиеся в специальных шрифтах.

Пользователь может выбирать любой шрифт, работая практически во всех текстовых редакторах в среде Windows, за исключением Блокнота. Так, если для текста задать какой-нибудь символьный шрифт, например Wingdings, то получится последовательность значков вроде: , соответствующих кодам стоявших на их местах букв.

Unicode

При использовании ранних версий ОС Windows в одну кодовую страницу нельзя было поместить больше 255 символов, поэтому был разработан новый стандарт таблицы символов — Unicode. Согласно ему каждый символ кодировался не восемью, а шестнадцатью битами информации, что позволяло получить до 65 536 знаков. Чтобы обеспечивалась совместимость со старыми стандартами, первые 256 символов Unicode соответствовали типовой кодовой таблице, а остальные предназначались для букв и знаков различных языков. В шрифте Unicode помещается несколько кодовых страниц сразу.

Содержимое Unicode-шрифта Times New Roman

Чтобы программы, не поддерживающие стандарт Unicode (например, Microsoft Word 6.0), могли работать с новыми шрифтами, ОС выполняет так называемую «подстановку шрифтов», т. е. «раскладывает» шрифт Unicode на отдельные кодовые страницы и выбирает ту, которая подходит установленной в системе. Параметры подстановки прописываются в системном реестре и в файле Win.ini, указывая программам, где искать соответствующие нужной кодовой странице символы.

Иногда возникает ситуация, когда в Word 97 текст на экране отображается корректно, а на принтер выводится последовательность каких-то квадратиков. Это происходит из-за того, что одни компоненты (Word 97) поддерживают новый стандарт, а другие нет. Чтобы разрешить такую проблему, следует установить новые драйверы к принтеру или в разделе KEY_CURRENT_USERSoftwareMicrosoftOffice8.0Word системного реестра создать новую строковую переменную Flags со значением 8192, либо в разделе Font Substitution для всех русских букв тех шрифтов, при распечатке которых выводятся квадратики, написать: Font,0=Font,204 и Font,204=Font,204. То же самое надо проделать и в Win.ini.

Параметры подстановки шрифтов прописываются в системном реестре и в файле Win.ini

KOI-8

«Всемирная паутина» появилась и начала развиваться в Америке, поэтому вся система почтовых серверов была предназначена для работы с почтой англоязычных пользователей. Сначала по электронной почте отправлялись лишь текстовые сообщения, поэтому почтовые программы составлялись с использованием первой половины кодовой страницы — семибитной кодировки. Из-за этого те письма, в которых содержались символы с кодами, превышающими число 127, обрабатываться не могли. Чтобы они все же проходили через семибитные почтовые серверы, символы принудительно приводились к семибитному виду: обнулялся первый бит, указывающий на половину их кодовой страницы. Например, символ «е» (русская буква «е») переходил в «f», а символ «ш» — в «y».

На обоих экранах обведено указание на кодировку письма

По-разному можно было выйти из сложившегося положения. Во-первых, что самое распространенное, писать письмо, используя транслитерацию, т. е. latinskimi bukvami. Хотя текст при этом выглядел некрасиво и плохо читался, сообщение всегда доходило в исходном виде. Поскольку не все почтовые серверы были семибитные, то была создана специальная кодировка под названием KOI-8 для электронной почты. Она отличалась тем, что на места кодов символов, превышающих 127, были проставлены русские символы, похожие по звучанию на английские, соответствующие кодам символов, номера которых были меньше на 128. Например, коды 225, 226, 227, 228 соответствовали символам «а», «б», «ц», «д», которые при семибитном преобразовании перешли бы в коды 97, 98, 99, 100 английских букв «a», «b», «c», «d». Слово «привет», написанное в такой кодировке, пройдя через семибитный почтовый сервер, преобразовалось бы в PRIWET.

Так как системы на основе Unix в основном были рассчитаны на работу с электронной почтой и международными сетями, новая кодировка стала стандартом для них. Чтобы облегчить переписку между пользователями разных типов ПК и ОС, KOI-8 была принята в качестве универсальной, т. е. любая почтовая программа обязана была уметь читать и отправлять в ней сообщения.

Слишком умные серверы

Наличие пяти различных кодировок для русского языка создавало определенные трудности, например потребовались специальные программы-перекодировщики. Однако самой большой проблемой стали российские почтовые серверы.

Казалось бы, нужно лишь одно — чтобы серверы обрабатывали сообщения в восьмибитных кодировках. Тогда тексты в любой кодировке всегда читались бы принимающей стороной с помощью программы, умеющей работать с ней. Но, увы, не все оказалось так просто. В некоторые почтовые серверы была встроена возможность автоматической перекодировки поступающих писем — вероятно, для определенной «стандартизации». Если поступало сообщение в кодировке Windows-1251 и сервер его так и воспринимал, то оно перекодировалось в KOI-8 и отправлялось дальше. Кодировка письма обычно указывалась в заголовке или прямо в тексте.

Обведено указание на систему конвертации бинарных файлов

Русифицированная версия Microsoft Outlook Express 5.0 по умолчанию для всех отправляемых сообщений ставит кодировку KOI-8 и отправляет их именно в ней. Однако некоторые почтовые программы могут делать ошибки, например письмо написано в KOI-8, а в заголовке письма проставляется, что оно имеет кодировку Windows-1251. Если такое письмо будет отправлено адресату, то оно не сможет сразу же правильно отобразиться в его почтовой программе — на экране появится мешанина из символов. Поскольку почти все почтовые программы позволяют просматривать одно и то же письмо в разных кодировках, то получатель прочитать его все же сможет, выбрав правильную кодировку. Но если письмо с не соответствующим содержанию заголовком попадет на перекодирующий почтовый сервер, то ситуация осложнится. По заголовку сервер решит, что раз оно написано в Windows-1251, как было указано, то его нужно перекодировать в стандартную для Сети (по мнению сервера и его создателей) кодировку KOI-8. Сообщение будет преобразовано из Windows-1251 в KOI-8, т. е. будут заменены соответствующие коды символов. Однако письмо-то уже изначально было в KOI-8! И что же получается? Автор письма написал фразу «Добро пожаловать», которая в KOI-8 записалась как «дНАПН ОНФЮКНБЮРЭ». А сервер снова перекодировал ее, но уже из Windows-1251 в KOI-8. В результате получилось: «Дмюом нмтчймачпщ», и понять что-либо стало уже невозможно. Если же на пути письма попалось несколько перекодирующих почтовых серверов, то его дешифрация становится крайне сложной задачей.

Вложенные файлы

Изначально по электронной почте нельзя было пересылать вложенные файлы (обычно это архивы), которые представляют собой двоичные данные, т. е. не раскладываются на вразумительную последовательность символов. Безусловно, можно было принудительно разбить последовательность данных в файле на группы по восемь бит и попытаться перевести их в текст. Можно проделать подобный эксперимент, переименовав какой-либо исполняемый файл или архив в файл с расширением «.txt» и загрузив его в Word 6.0 или 97. Однако после преобразований пересылаемая программа вряд ли бы заработала, а архив открылся бы, ведь их код стал бы испорченным и практически не поддавался бы восстановлению. Поэтому были разработаны специальные системы вложений в почтовые сообщения, основанные на конвертации двоичных данных в набор символов с кодами от 33 до 127. Впоследствии они могут быть подвергнуты обратному преобразованию. Было разработано несколько таких систем, самые распространенные из них — uuencode и base64. Почтовая программа, умеющая работать с вложениями, перед отправлением письма конвертировала вложенные файлы в одну из таких кодировочных систем (помещая перед вложением соответствующее указание), а после получения письма превращала вложенный фрагмент в исходный двоичный файл.

Вот, например, фрагмент письма с вложением, просматриваемый с помощью функции Microsoft Outlook Express «Свойства?Подробности?Исходное сообщение».

К этому письму приложен архив 999.zip, а также указан способ конвертации вложения — base64. Дальше идет набор символов первой половины кодовой таблицы — можно с уверенностью утверждать, что он пройдет через любые почтовые серверы неизмененным. При получении такого письма Outlook Express распознает наличие вставки base64, отобразит вложенный файл на панели вложений и позволит сохранить его на жесткий диск или прочитать, подвергнув обратному преобразованию из base64.

Таким образом, из-за наличия пяти кодовых страниц для русского языка требуется обеспечить две возможности. Во-первых, чтение текста, написанного в соответствии с одной кодовой страницей, в ОС с другой кодовой страницей, например текстов MS-DOS в Windows 95, во-вторых, расшифровку неоднократно перекодированных электронных писем. Чтобы решить эти проблемы, можно использовать специальные программы или компоненты программных пакетов. В следующей статье будет рассказано о некоторых из них.

Окончание в следующем номере.
Антон Александрович Орлов,
[email protected],
http://antorlov.chat.ru.

русский язык в браузерах/почте/новостях под Windows

русский язык в браузерах/почте/новостях под Windows

Примечание. На этой странице обсуждается только платформа MS Windows.
Для других платформ, таких как UNIX или Mac, пожалуйста,
см. раздел моего сайта под названием «Еще русификация ( Q&A , ссылки)»

Важно!   На этой странице приведены инструкции по настройке для некоторых приложения , такие как браузеры, программы электронной почты и т. д.
Но прежде чем настраивать некоторые программы для Windows

, вам необходимо настроить саму Windows :

  • Пожалуйста, , а не прочитайте эту страницу, связанную с приложением пока не активируете кириллические шрифты в своей версии MS Windows и ознакомьтесь с кодировками кириллицы используется под MS Windows.
    Вышеупомянутые темы рассматриваются в разделе моего сайта под названием «кириллица шрифты и кодировки под виндой»
  • Если собираетесь пишите по русски в некоторых программах кроме чтения русского, тогда, пожалуйста, сделайте , а не , прочитайте эту страницу, связанную с приложением, пока не активируете Русская клавиатура инструменты в вашей винде. Он покрыт раздел моего сайта под названием «Ввод русского языка на любой клавиатуре: стандартная и фонетическая раскладка»


СОДЕРЖАНИЕ
  • Кириллица (русская) в Mozilla, Firefox, Thunderbird, Netscape 6,7
    Это отдельная страница.
  • Кириллица (русская) в MS Internet Explorer
    • Настройка MS Internet Explorer вер. 5 или выше
    • Настройка MS Internet Explorer 4
    • Настройка MS Internet Explorer 3.02
    • Internet Explorer вер. 3 и 4 : Ссылки на темы, которые обсуждались здесь , а не
      ( Почта и Новости инструменты)
  • Тестовые страницы кириллицы для браузеров : проверьте Настройка Internet Explorer или Netscape/Mozilla для кириллицы (русской).
  • Кириллица (русская) в Web Mail например Yahoo!Mail
    То есть когда вы работаете со своей почтой на
    Web странице
    в браузере, а не с помощью реальной электронной почты программа например скажем Outlook Express
    • Русский язык в Web-сервисах типа Yahoo!Mail
    • Кириллица (русская) в GMail (Google Mail)
      Это отдельная страница.
  • Кириллица (русская) в Outlook Express вер. 5 или выше
    Это отдельная страница.
  • Кириллица (русская) в MS Outlook 2000 и новее
    Это отдельная страница.
  • Кириллица (русская) в группах новостей через службы Google Groups
    Это отдельная страница.

Русский язык в MS Internet Explorer ver. 5 или выше
ПРИМЕЧАНИЕ.
В последнее время было много жалоб на то, что НЕЛЬЗЯ писать на русском языке в Internet Explorer — в полях ввода текста на веб-страницах.

Пользователь обычным образом вводит русский текст, но на экране видит что-то вроде этого:
………………. 38B5 G09=8:C

Это , а не , связанный с настройкой кириллицы на вашем компьютере.
Это означает, что плагин, подключенный к вашему браузеру, вызывает такие вещи.
У меня есть страница, на которой я собираю соответствующую информацию и предлагаю некоторые решения:

Internet Explorer: тарабарщина на дисплее при наборе русского


Напоминание:   нет причин читать о настройке за эту программу если вы еще не узнали о самой винде — Кириллица шрифты и русские кодировки . Это описано в разделе моего сайта под названием «Кириллица шрифты и кодировки под Windows».
То есть предполагается, что ваши кириллические шрифты активированы и становятся знаком с кириллицей , кодировки используются под MS Windows.

Также предполагается, что у вас русская клавиатура инструменты активированы как описано в разделе «Набор русского языка на любой клавиатуре: стандартная и фонетическая раскладка» моего сайта, если вы собираетесь на напишите по-русски, скажем, на поисковике в Интернете.


Я несколько раз читал, что пользователь должен отключить следующую функцию для нормальной работы с Русские сайты:
Просмотр/Кодирование — снять галочку «Автовыбор»

В Internet Explorer больше нечего настраивать, он готов к просмотр русских сайтов (то есть настройка Windows сама — Кириллические шрифты и, при необходимости, клавиатурные инструменты — позволяет Internet Explorer успешно работать с русскоязычными сайтами).

Теперь при просмотре русскоязычных веб-сайтов вы сможете выбрать кириллическую кодировку (если сайт не сделал это за вас, позволив вашему браузеру знаю, что такое кодировка):

  • для страниц Windows-1251: Вид/Кодировка/ Кириллица (Windows)
  • для страниц KOI8-R: Вид / Кодировка / Кириллица (KOI8-R)

Вы можете использовать мои тестовые страницы главы 4 этой страницы, чтобы убедиться в этом.


Следующий раздел посвящен MS Internet Explorer ver. 4 .

к оглавлению


Русский язык в MS Internet Explorer 4

Вот шаги для единовременной начальной настройки MS Internet Explorer 4. для русского:

  • перейдите в Вид / Свойства обозревателя / Общие / Шрифты
  • в окне Наборы символов выберите «Кириллица»
  • в окне «Пропорциональный шрифт» выберите «Arial»
  • в окне «Шрифт фиксированной ширины» выберите «Courier New»
  • в окне «Набор символов» выберите «Кириллица (Windows)»
  • в списке «Кириллица по умолчанию» выберите «Кириллица» по умолчанию
  • нажмите OK (дважды)

Теперь при просмотре российских веб-сайтов вы сможете выбрать кириллическая кодировка:

  • для Windows-1251 страниц: Вид / Шрифт / Кириллица (Windows)
  • для страниц KOI8-R: Вид / Шрифт / Кириллица (KOI8-R)

Вы можете использовать мои тестовые страницы главы 4 этой страницы, чтобы убедиться в этом.


Следующий раздел посвящен MS IE 3.02 .

к оглавлению


Русский язык в MS Internet Explorer 3.02
Примечание. Не знаю, работает ли русский язык в более ранних версиях MS IE, чем 3.02.
  • Настройка MS IE 3.02 под Windows 95/98/ME или Windows NT 4.0
  • Настройка MS IE 3.02 под Windows 3.1 или 3.11

MS IE 3.02 под Windows 95/98/ME или Windows NT 4.0
Для MS IE 3.02 требуется около дополнительных программ для кириллицы — «общеевропейская» версия Microsoft
«Многоязычная поддержка Internet Explorer 3.0 для Windows 95 и NT 4.0»,
предлагается в виде самораспаковывающегося архивного файла ie3lpkpe.exe .

Вы можете загрузить файл ie3lpkpe.exe с одного из следующих сайтов
(на сайте Microsoft , а не этот файл больше нет — IE3 слишком стар, поэтому я даю несколько сайтов, потому что некоторые из них могут подписаться на Microsoft и удалить этот файл с их сайта) :

  • FTP-сайт Калифорнийского технологического института
  • FTP-сайт Netvigator. com
  • Mldnet.com FTP-сайт
  • Gamma.ru FTP сайт
  • Vol.net FTP-сайт

После того, как вы получите этот файл, вам нужно его выполнить (достаточно дважды щелкнуть по нему в проводнике Windows) и следуйте инструкциям по установке.
Затем перезагрузите компьютер.

MS IE 3.02 теперь готов к работе с российскими веб-сайтами — найдите глобус значок в правом нижнем углу, если это окно, и нажмите на него. Вы увидите доступные кодировки , в том числе две используемые для русского языка —
Кириллица(Windows-1251) и кириллица(KOI8-R).


MS IE 3.02 под Windows 3.1 или 3.11
Под Windows 3.1/3.11 нужно установить в IE 3.02 те бесплатные не Microsoft русские шрифты, которые предлагались в раздел моего сайта называется «Кириллические шрифты и кодировки под Windows»:
«ЕР Букинист 1251» и «ЕР Курьер 1251».

Вот шаги для выбора этих шрифтов в MS IE 3. 02, но я не уверен что это 100% правильно. Если нет, то должно быть что-то очень похожее на это:

  • в меню IE выберите View/Options/
  • Откройте там вкладку под названием «Общие»
  • Нажмите кнопку «Настройки шрифта» в правом нижнем углу.
  • В окне «Наборы символов» установить курсор на «Кириллица» .
    Ниже IE покажет вам шрифты, выбранные в данный момент для этого набора символов.
  • Выберите ниже:
    • Пропорциональный шрифт: «ЭР Букинист 1251»
    • Шрифт фиксированной ширины: «ER Kurier 1251»
    • Кодировка MIME: Windows-1251

К оглавлению


IE вер. 3 и 4: Ссылки на темы, которые были
, а не , обсуждались здесь
  • Лично я не знаю, как использовать Mail/News в Internet Explorer ver. 3 и 4.

    В отличие от Netscape, сам MS IE не может работать с почтой/новостями. (это одна из основных причин, почему лично я работаю в основном с Netscape) .
    MS IE использует других программ для следующих функций:

    • MS Internet Mail с более ранними версиями MS IE
    • Outlook Express 4 с MS IE 4
      или же
    • какую-нибудь стороннюю программу, например, Eudora для электронной почты и Агент Forte для телеконференций

    Я лично не знаю, как настроить все эти партнерские программы для русского, поэтому даю каких-то ссылок на чужие инструкции.

  • Internet Explorer 3 и 4 : как заполнять формы на русскоязычных веб-страницах.
    Насколько я слышал, в старых версиях MS IE часто бывают траблы в этой области, а у меня нет любую конкретную информацию. Опять же, я даю ссылки, связанные с IE.

Это ссылки на ресурсы, которые могут помочь вам настроить MS IE и его партнерские программы для Русского (если вы не нашли что-то на странице, вы всегда можете обратиться к автору сайта, например, по электронной почте) :

Инструкция
Автор

«Поддержка русского языка», на русском

Корпорация Майкрософт.

Русский в Форте Агент ( на русском языке )

К.Казарновский, Россия

‘Русский в Юдора

LvNet-Телепорт, Латвия
‘KOI8-R plug-in for Eudora ‘ ( по-русски )

Е.Суровегин, Россия

Если вы не нашли ответа на свой кириллический вопрос ни на моем странице, ни на перечисленных выше страницах, то см. ниже список из следующих русский язык Группы новостей (дискуссионные группы, форумы), где вы можете найти ответ или задать свой вопрос.

  1. Бесплатный сервер новостей Microsoft Corp.:
    • microsoft.public.ru.russian.inetexplorer
    • microsoft.public.ru.russian.outlookexpress
    • microsoft. public.ru.russian.office
    • microsoft.public.ru.russian.outlook
    • microsoft.public.ru.russian.windows
    • microsoft.public.ru.win98
    • microsoft.public.ru.russian.windows2000
  2. Русские группы новостей (форумы) Relcom.* и Fido7.*
    • relcom.comp.os.windows
    • relcom.comp.os.windows.nt
    • фидо7.su.win95.чайник
    • fido7.ru.windows.f2000
    • fido7.ru.windows.nt.chainik
    • fido7.ru.windows.nt
    • fido7.ru.internet.chainik
    • fido7.ru.интернет
    • fido7.ru.internet.www
    • fido7.ru.dtp.шрифты

      Web разработка :

    • fido7.ru.html.chainik
    • fido7.ru.html.profy
    • fido7.ru.java.chainik
    • fido7.ru.javascript
    • fido7.ru.xml

Примечание. Некоторые группы новостей могут быть недоступны на Новости сервер вашего интернет-провайдера. В таком случае вы можете воспользоваться бесплатным новостным услуга, предоставляемая Talk.ru, где можно прочитать группу новостей (форум) или задайте свой вопрос там.


Кириллица

Тестовые страницы для вашего браузера
проверьте настройку кириллицы, которую вы выполнили для Internet Explorer или Netscape
Напоминание:  Нет причин читать о настройке этих программ если вы еще не узнали о самой винде — Кириллица шрифты и русские кодировки . Это описано в разделе моего сайта под названием «Кириллические шрифты и кодировки под Windows».
То есть предполагается, что ваши кириллические шрифты активированы и становятся знаком с кириллицей 9Кодировки 0007
используются в MS Windows.

Также предполагается, что у вас русская клавиатура инструменты активированы как описано в разделе «Набор русского языка на любой клавиатуре: стандартная и фонетическая раскладка» моего сайта, если вы собираетесь на напишите по-русски в форме ввода текста на моих Тестовых страницах.


Я использую русский в качестве примера ниже, но насколько я знаю, то же самое применимо и к другим кириллическим языкам.

Если русскоязычная страница имеет , а не , укажите, какая кириллица кодировка (набор символов, кодирование) он использует, затем попробуйте использовать обе Windows-1251 и KOI8-R, одну за другой, пока не увидите нормальный русский текст.
Мои страницы такого типа — нужно вручную переключитесь на нужную кириллическую кодировку через меню вашего браузера.

После того, как вы настроите свой браузер на кириллицу согласно инструкции этой страницы вы можете переключить свой браузер на нужный набор символов кириллицы Кодировка и используйте мои тестовые страницы для проверки ваших настроек.

Шаги использования меню браузера для переключения на нужна кириллица кодировка были приведены выше, в главе, посвященной MS Internet Explorer, и главе, посвященной Netscape, но я повторю их здесь (новейшие версии указаны первыми) :

  • MS Internet Explorer 5 и выше:
    • Windows-1251 :   Вид/Кодировка/Кириллица (Windows)
    • KOI8-R :   Вид/Кодировка/Кириллица (KOI8-R)
  • MS Internet Explorer 4 :
    • Windows-1251 :   Вид/Шрифт/Кириллический алфавит (Windows)
    • KOI8-R :   Вид / Шрифт / Кириллица (KOI8-R)
  • Netscape 6,7 и Mozilla :
    • Windows-1251 :   Вид / Кодировка символов / Кириллица (Windows-1251)
    • KOI8-R :   Вид / Кодировка символов / Кириллица (KOI8-R)
  • Netscape 4. x :
    • Windows-1251 :  вид/набор символов/кириллица (Windows-1251)
    • KOI8-R :   Вид / Набор символов / Кириллица (KOI8-R)
  • Netscape 4.0x (4.0 — 4.08):
    • Windows-1251 :   Вид/Кодировка/Кириллица (Windows-1251)
    • KOI8-R :   Вид/Кодировка/Кириллица(KOI8-R)
  • Нетскейп 3 :
    • Windows-1251 :   Параметры / Кодировка документа / Кириллица (Win1251)
    • KOI8-R :   Опции / Кодировка документа / Кириллица (KOI8-R)
  • MS Internet Explorer 3.02 :
    нажав на значок в виде земного шара в правом нижнем углу и выбор кириллицы (Windows-1251) или кириллицы (KOI8-R)

Итак, если вы закончили настройку кириллицы для своего браузера, то проверить это сейчас.
Я подготовил 2 тестовые страницы на русском языке — в кодировке KOI8-R и CP-1251(win) .
Эти тестовые страницы позволяют проверить как пропорциональную (переменная ширина), так и шрифты и Фиксированные шрифты .

Мои тестовые страницы позволяют также проверить формы — они находятся внизу каждой тестовой страницы.

К переключив ваш браузер на соответствующий кодировка (набор символов, кодировка) , проверьте русский язык на странице и в форме страницы :

  • Windows-1251 Русский Тестовая страница
  • KOI8-R Русский Тестовая страница


 

Буквы кириллицы в

Заголовке страницы (верхняя синяя строка)

Во многих случаях вы можете НЕ видеть читаемый русский язык в Заголовке страницы (верхняя синяя линия) если у тебя нерусская МС винда.
Это потому, что браузеры используют системный шрифт для отображения этой строки заголовка. при этом обычно в нерусской операционке всего несистемных шрифта («Arial» и т.д.) содержат буквы кириллицы.

Например, MS Internet Explorer вер. 5 и выше (а также Netscape версии 7.1 и выше и Mozilla версии 1.4 и выше)
может показать такое название только под Windows 2000/XP а не под Windows 95/98/ME/NT, в то время как Netscape 4.x — 7.0x вообще не сможет этого сделать.

Вот моя тестовая страница (написана действительно для проблемы с закладками в Netscape — это текст заголовка который идет в закладки) , который показывает такой заголовок и объясняет, что:

  • Заголовок с русским (windows-1251) текстом

Но даже если мои страниц были Хорошо, иногда вы можете увидеть нечитаемая кириллическая страница где-то в Интернете:

Кодировка правильная, но страница не читается. Почему?

Итак, вы пытались вручную переключить на кириллицу, но страница до сих пор нечитаемо. Причиной этого может быть одна из следующих ситуации (при условии, что вы уже правильно настроили браузер для кириллицы):

К оглавлению


Кириллица (русская) в

Веб-почта , например Yahoo!Mail

То есть, когда вы работаете с электронной почтой на веб-странице в браузере, а не с помощью реальной электронной почты программа например скажем Outlook Express

Предполагается, что у вас есть русская клавиатура , инструменты активированы, как описано в «Набор русского языка на любой клавиатуре: стандартная и фонетическая раскладка» раздел моего сайта, если вы собираетесь пишем по русски.


В отличие от реальных программ электронной почты , перечисленных в оглавлении этой страницы — такие как Outlook Express, MS Outlook, Почтовый компонент Netscape/Mozilla — где пользователь может вносить изменения в конфигурацию, Почтовые веб-службы , такие как Yahoo!Mail, Hotmail и т. д. — имеют свои правила работы с кириллицей (русскими).

1. Отправка электронной почты на русском языке с использованием сервиса Web-mail

В отличие от современных веб-сервисов электронной почты, таких как Yahoo!Mail или HotMail, старые такие сервисы, как, например, Mail2web.com, требуют для нормальной отправки электронной почты на русском языке:
перед вводом русского текста пользователь должен выбрать русскую кодировку в меню браузера, например, «Кириллица(Windows)», и только потом начинайте печатать.

В настоящее время Yahoo!Mail всегда использует кодировку Unicode (UTF-8) для всех без исключения сообщение, которое вы отправляете.

Сможет ли получатель прочитать такое русское электронное письмо
(где русский текст представлен как текст в кодировке UTF-8 и не как текст какой-то русской кодировки)
или нет, зависит от программного обеспечения, которое он использует.
Yahoo!Mail формирует правильный системный заголовок со спецификацией кодировки:
. кодировка = utf-8

Современные программы электронной почты, такие как Outlook Express, Mozilla (Thunderbird), MS Outlook, прекрасно отображают такое входящее письмо UTF-8, а также современные Web-сервисы, такие как GMail или сама Yahoo!Mail или HotMail.

2. Получение электронной почты на русском языке с использованием сервиса Web-mail

В отличие от современных веб-сервисов электронной почты, таких как Yahoo!Mail или HotMail, старые службы, такие как, например, Mail2web.com, требуют для чтения входящей русской электронной почты:

Yahoo!Mail работает с входящим русским (польским, греческим и т.д.) письмом следующим образом:

он всегда использует кодировку UTF-8, то есть преобразует все входящие сообщения электронной почты в кодировку UTF-8.

Следовательно:

  • бесполезно пытаться изменить кодировку в меню вашего браузера — либо русский читается сразу либо вообще не читается.
  • Если сообщение электронной почты было отправлено на Yahoo!Mail из современной программы Mail с правильным системным заголовком — заголовок MIME с указанной кодировкой, например как кодировка = windows-1251 для почты России в Кодировка «Кириллица, Windows-1251»,
    то Yahoo!Mail сразу отобразит читаемый русский текст :

    во-первых, зная кодировку этого входящего электронного письма, Yahoo!Mail преобразует текст в кодировку UTF-8 , то есть, используя приведенный выше пример, Yahoo!Mail выполнит преобразование
    «Кириллица (Windows)» —> UTF-8

    а затем покажет текст на своей странице UTF-8.

  • Во всех остальных случаях (см. ниже) письмо будет НЕчитаемо, просто какая-то тарабарщина. Случаи могут быть:
    1. электронное письмо было отправлено из Outlook Express, где отправитель НЕ изменил настройки по умолчанию.
      Настройки по умолчанию (в Tools/Options/Send): «нет MIME-заголовка, используйте Uuencode», то есть электронные письма отправляются без MIME-заголовка и, следовательно, НЕТ спецификации кодировки!
      (чтобы правильно настроить Outlook Express, Mozilla Mail или Thunderbird, пожалуйста, см. раздел этого сайта «Кириллица(русская) в браузерах/почте/новостях»

      Таким образом, Yahoo!Mail получает электронное письмо, кодировка которого неизвестна. Таким образом, Yahoo! Mail предполагает, что кодировка «западноевропейская» и выполняет — на русском тексте! — преобразование в UTF-8 по схеме
      «западноевропейский» —> UTF-8

      Очевидно, что искажает все буквы кириллицы!

      Более того, поскольку теперь это текст UTF-8 на странице UTF-8, а не русская или, скажем, немецкая страница, тогда нет смысла пытаться изменить кодировку в меню браузера — текст UTF-8 будет 9Изменение 0007 вместо , почтовое сообщение остается нечитаемым.

    2. электронная почта была отправлена ​​не из настоящей почтовой программы, а с помощью веб-интерфейса. почтовая служба, такая как Mail2Web.com

      Такие услуги:

      • либо вообще не формируют MIME-заголовок и поэтому буквы не указывают их кодировка, что эффективно приводит к проблеме, описанной в (1) выше — нечитаемый текст

        или же

      • как Mail2Web. com, форма неверный MIME-заголовок, всегда указывая там «Западная» кодировка (iso-8859-1), даже если в букве есть русская или польская или греческая или любой другой текст.

        Тогда Yahoo!Mail будет использовать — на русском тексте — неправильное преобразование кодировки
        «западноевропейский» —> UTF-8

        что также приводит к результату случая (1) — нечитаемый текст.


Отказ от ответственности
Эта страница является результатом моего личного исследования, не связан с компанией, в которой я работаю.

Автор не гарантирует и не может гарантировать информацию, документацию или программное обеспечение, включенное в этот документ, или производительность или полученные результаты используя эту информацию, документацию или программное обеспечение.
Данная информация, документация и программное обеспечение предоставляются » как «.

Оставить комментарий

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *