1 2 3 4
1 2 3 4 ©dereksiz.org 2023 әкімшілігінің қараңыз | Басты бет |
Как изменить кодировку в Блокноте: стандарты и способы
Иногда при открытии текстового файла в блокноте можно увидеть «кракозябры» — так называют нечитаемые символы. Причина их появления кроется в несовпадении кодировок открываемого документа и используемой по умолчанию в операционной системе. Чтобы прочитать данный файл, необходимо знать, как изменить кодировку в блокноте.
Содержание статьи
- Таблицы кодировок русской раскладки клавиатуры
- Создание нового текстового документа в Windows
- Смена кодировки текстового файла с помощью Блокнота в Windows
- Как сменить кодировку в Блокноте по умолчанию
- Как сменить кодировку с ANSI на другую с помощью внешних программ
- Notepad++
- Akelpad
- Комментарии пользователей
Таблицы кодировок русской раскладки клавиатуры
Компьютер воспринимает любую информацию в двоичном коде. Чтобы машина поняла вводимый символ, необходимо сопоставить его с определенной цифровой последовательностью. Первой таблицей стала ASCII — для кодировки использовался 1 байт информации, всего можно было описать с ее помощью 128 символов, включавших в себя латинские буквы, цифры, знаки пунктуации.
Однако, подобное сопоставление не учитывало множество национальных языков. Были созданы отдельные разновидности ASCII, но система получалась слишком громоздкой и неудобной.
Следующим шагом стало изобретение таблицы ANSI, которая сейчас используется по умолчанию в системе Windows. Это расширенная версия ASCII, совмещающая множество различных языков.
Внимание! ANSI — это совокупность различных наборов символов. Для разных групп языков используется собственная кодировка. Для русского и других алфавитов, использующих кириллицу, устанавливается вариант Windows-1251. Реальный вид кодировки прописывается в реестре системы с помощью средств ОС Windows.
У ANSI есть «конкурент» — Unicode. Этот набор символов установлен по умолчанию на компьютерах с ОС типа «*nix», например Linux, Unix. Так как эти системы являются бесплатными и имеют открытый код, то большинство серверов используют их. Наиболее распространенной версией Unicode является UTF-8.
Текст, написанный на UTF-8, не будет распознан в ANSI, и пользователь получит «кракозябры». Чтобы прочитать данный файл или создать новый документ на UTF-8 в OS Windows необходимо знать, как изменить кодировку текста в блокноте.
Создание нового текстового документа в Windows
Создать документ можно с помощью встроенного текстового редактора Notepad или «Блокнот». Существует несколько способов:
- Вызвать меню «Выполнить», нажав одновременно на клавиши Win и R. В появившемся окне вписать «notepad. exe» и подтвердить.
- Кликнуть ПКМ по рабочему столу, выбрать в окне пункт «Создать» или «New». Затем в контекстном меню кликнуть ЛКМ по строке «Текстовой документ» или «Text document».
- После проведенных действий откроется страница приложения «Блокнот», где можно создавать простейшие тексты.
Процесс создания текстового документа с помощью редактора «Блокнот» одинаков для актуальных версий ОС Windows.
Смена кодировки текстового файла с помощью Блокнота в Windows
После того, как все необходимые данные были внесены в текстовой файл, можно сохранить его, изменив кодировку. Для этого необходимо воспользоваться следующим алгоритмом действий:
- Кликнуть по пункту «Файл» в левом верхнем углу редактора и выбрать строку «Сохранить как …».
- Появится окно с опциями сохранения файла. В нижней части кликнуть по пункту «Кодировка» и выбрать один из вариантов, например. UTF-8.
- После выбора необходимой кодировки, нажать на «Сохранить».
- Если файл был создан ранее, то система спросит разрешение на перезапись. Подтвердить изменения.
С помощью описанного способа можно также изменить кодировку в Блокноте Windows 10 и 11.
Как сменить кодировку в Блокноте по умолчанию
Стандартно редактор «Блокнот» в Windows настроен на сохранение документов в кодировке ANSI. Это значит, что все текстовые файлы с русской речью создаются в Windows-1251. Иногда необходимо знать, как изменить кодировку файла в блокноте так, чтобы вновь создаваемые документы имели по умолчанию другой набор символов, например UTF-8. Для этого нужно проделать следующие изменения в системе:
- Создать и сохранить документ в стандарте UTF-8, назвав его, например, UTF-new.txt.
- Переместить файл в папку, находящуюся по следующему адресу: C:\Windows\ShellNew
- Открыть реестр Windows. Для этого необходимо вызвать окно «Выполнить» с помощью одновременного нажатия клавиш Win и R. Затем вписать в него команду «regedit» и подтвердить.
- В реестре нужно найти ветвь HKEY_CLASSES_ROOT / .txt / ShellNew /
- Создать в ней строковый параметр с именем «FileName», а в качестве значения указать «UTF-new.txt» — имя файла, созданного ранее.
После проведенных действий вновь создаваемые документы будут кодироваться в UTF-8.
Внимание! Подобным образом меняется по умолчанию набор символов для текстовых файлов, создающихся с помощью контекстного меню, например, на рабочем столе. Если сначала открывается Блокнот, а уже в нем создаются документы, то стандартно опять будет кодировка ANSI.
Как сменить кодировку с ANSI на другую с помощью внешних программ
Возможности Блокнота ограничены — он не может открыть файлы больших размеров, также недоступны для редактора некоторые кодировки, например, DOS 866. В этом случае можно прибегнуть к помощи сторонних приложений.
Notepad++
Один из самых универсальных текстовых редакторов. Скачать его можно бесплатно. Поддерживает большое количество кодировок и множеством дополнительных функций. Чтобы выбрать необходимый набор символов, нужно открыть пункт «Кодировки» и выполнить действия, показанные на рисунке.
Также легко можно изменить существующую кодировку на другую.
Akelpad
Продвинутая версия стандартного Блокнота. Скачать программу можно также бесплатно. Чтобы открыть файл в нужной кодировке, необходимо запустить приложение, затем:
- Кликнуть по пункту «Файл» и нажать на «Открыть…»
- Убрать галочку с чек-бокса «Автовыбор» и указать нужную кодировку.
- Можно изменить кодировку файла при необходимости, выбрав в пункте «Файл» опцию «Сохранить как…».
Приложение Akelpad имеет больше вариантов для изменения кодировки, чем стандартное приложение и Notepad++.
Изменить кодировку Блокнота бывает необходимо, если нужный файл имеет другую систему набора символов, например, UTF-8. Встроенный редактор имеет небольшие возможности. Поэтому иногда нужно прибегнуть к помощи сторонних приложений, если размер текста велик или используется редкая кодировка. Также можно настроить Windows на создание по умолчанию файлов в отличной от ANSI кодировке.
Как определить набор символов, используемый Windows на тайваньском языке?
спросил
Изменено 7 лет, 3 месяца назад
Просмотрено 864 раза
Я использую Windows 7 Home в Тайваньский на работе, и знание используемого набора символов имело бы для меня неоценимое значение.
- Как определить набор символов, используемый Windows на тайваньском языке?
Я читал, что кодовая страница Microsoft 950
является известным вариантом кодировки символов Taiwan Big5
(википедия), но я хочу быть уверенным.
Если поможет, вот скриншот шрифта по умолчанию, используемого в блокноте: (изображение скопировано из этой исходной ссылки):
- windows-7
- кодировка символов
- китайский
- набор символов
По справочнику API поддержки национальных языков (NLS), Китайский (Тайвань) Идентификатор LCID/культуры: 0x0404
(= 1028
в десятичном формате). Кодовая страница OEM
, а также кодовая страница ANSI
: 950
. Вы можете убедиться в этом с помощью команды PowerShell
Get-Culture | Format-Custom -Property TextInfo
или, если китайский (Тайвань) не , язык вашей системы:
[System.Globalization.CultureInfo]::GetCultureInfo(0x0404) | ` Format-Custom -Property TextInfo
Выход :
класс CultureInfo { ТекстИнфо = класс ТекстИнфо { АНСИкодепаже = 950 ОЕМкодепаже = 950 МакКодПейдж = 10002 EBCDICCodePage = 500 LCID = 1028 CultureName = zh-TW ТолькоЧитать = Истина Разделитель списка = , ИсправоЛефт = Ложь } }
В другой статье Microsoft кодовая страница 950
называется Традиционный китайский Big5.
Зарегистрируйтесь или войдите в систему
Зарегистрируйтесь с помощью Google Зарегистрироваться через Facebook Зарегистрируйтесь, используя электронную почту и парольОпубликовать как гость
Электронная почтаТребуется, но не отображается
Опубликовать как гость
Электронная почтаТребуется, но не отображается
Нажимая «Опубликовать свой ответ», вы соглашаетесь с нашими условиями обслуживания и подтверждаете, что прочитали и поняли нашу политику конфиденциальности и кодекс поведения.
окон — Изменяет ли буфер обмена кодировку символов?
спросил
Изменено 2 года, 2 месяца назад
Просмотрено 1к раз
У меня проблема, связанная с UTF8, в программном обеспечении — оно жалуется, что некоторый текст, содержащий специальные символы, не является допустимым UTF8. Но всякий раз, когда я копирую и вставляю его в онлайн-инструмент проверки или в электронное письмо в группе пользователей, он сообщает как действительный UTF8.
Есть подозрение, что это может быть какой-то старый формат до UTF8, но мне интересно, как только он попадет в буфер обмена или вставится в мой браузер, он будет преобразован в UTF8? Это первый вопрос.
«Оскорбительный» текст представлен на веб-странице HTTP, поэтому, во-вторых, как я могу окончательно увидеть, что обслуживается, как именно представлены специальные символы?
- windows
- google-chrome
- буфер обмена
- кодировка символов
Буфер обмена содержит копию, а затем позже вставляет ее в принимающее приложение.
Буфер обмена не меняет кодировку символов или другие атрибуты по пути.
Старые специальные символы могут вызывать проблемы как в исходном, так и в принимающем приложении, поэтому вам следует обновить эти символы.
API буфера обмена в Windows может выполнять преобразование между многими форматами, но не все форматы.