Атрибут lang | htmlbook.ru
Internet Explorer | Chrome | Opera | Safari | Firefox | Android | iOS |
6.0+ | 1.0+ | 3.5+ | 1.0+ | 1.0+ | 1.0+ | 1.0+ |
Описание
Текст документа может быть набран как на одном языке, так и содержать вставки на других языках, которые могут различаться по своим правилам оформления текста. Например, для русского, немецкого и английского языка характерны разные кавычки, в которые берется цитата. Чтобы указать язык, на котором написан текст внутри текущего элемента и применяется атрибут lang. Браузер использует его значение для правильного отображения некоторых символов.
Синтаксис
lang="код языка"
Значения
См. коды языков
Значение по умолчанию
Нет.
Применяется к тегам
<a>, <abbr>, <acronym>, <address>, <applet>, <area>, <b>, <basefont>, <bdo><bgsound>, <big>, <blockquote>, <body>, <br>, <button>, <caption>, <center>, <cite>, <code>, <col>, <colgroup>, <dd>, <del>, <dfn>, <dir>, <div>, <dl>, <dt>, <em>, <embed>, <fieldset>, <font>, <form>, <frame>, <h2>, <h3>, <h4>, <h5>, <h5>, <h6>, <hr>, <i>, <iframe>, <img>, <input>, <ins>, <isindex>, <kbd>, <label>, <legend>, <li>, <link>, <map>, <marquee>, <menu>, <nobr>, <object>, <ol>, <option>, <p>, <plaintext>, <pre>, <q>, <s>, <samp>, <select>, <small>, <span>, <strike>, <strong>, <sub>, <sup>, <table>, <tbody>, <td>, <textarea>, <tfoot>, <th>, <thead>, <tr>, <tt>, <u>, <ul>, <var>, <wbr>, <xmp>
Пример
HTML5IECrOpSaFx
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<title>Атрибут lang</title>
<style>
p {
font-size: 130%; /* Размер текста */
}
q:lang(de) {
quotes: "\201E" "\201C"; /* Вид кавычек для немецкого языка */
}
q:lang(en) {
quotes: "\201C" "\201D"; /* Вид кавычек для английского языка */
}
q:lang(fr), q:lang(ru) { /* Вид кавычек для русского и французского языка */
quotes: "\00AB" "\00BB";
}
</style>
</head>
<body>
<p>Цитата на французском языке: <q lang="fr">Ce que femme veut, Dieu le veut</q>.</p>
<p>Цитата на немецком: <q lang="de">Der Mensch, versuche die Gotter nicht</q>.</p>
<p>Цитата на английском: <q lang="en">То be or not to be</q>.</p>
</body>
</html>
Результат данного примера показан на рис. 1. Для отображения типовых кавычек в примере используется стилевое свойство quotes, а само переключение языка и соответствующего вида кавычек происходит через атрибут lang, добавляемый к тегу <q>.
Рис. 1. Вид кавычек для разных языков
HTML head lang ru en коды языка
Коды языка ISO
Атрибут HTML lang может использоваться для объявления языка веб-страницы или части веб-страницы. Это предназначено для оказания помощи поисковых систем и браузеров.
В соответствии с рекомендацией W3C необходимо объявить основной язык для каждой веб-страницы с атрибутом lang внутри тега <html>, например:
<html lang=»en»>
…
</html>
Для русского языка
<html lang=»ru»>
…
</html>
В XHTML язык объявляется внутри тега <html> следующим образом:
<html xmlns=»http://www.w3.org/1999/xhtml» lang=»en» xml:lang=»en»>
…
</html>
ISO 639-1 Коды языков
ISO 639-1 Определяет аббревиатуры для языков.
В HTML и XHTML их можно использовать в атрибутах lang и XML: lang.
Смотрите также: Следующая ссылка на коды стран.
Язык | ISO Код |
---|---|
Абхазии | ab |
Afar | aa |
Afrikaans | af |
Akan | ak |
Albanian | sq |
Amharic | am |
Arabic | ar |
Aragonese | an |
Armenian | hy |
Assamese | as |
Avaric | av |
Avestan | ae |
Aymara | ay |
Azerbaijani | az |
Bambara | bm |
Bashkir | ba |
Basque | eu |
Belarusian | be |
Bengali (Bangla) | bn |
Bihari | bh |
Bislama | bi |
Bosnian | bs |
Breton | br |
Bulgarian | bg |
Burmese | my |
Catalan | ca |
Chamorro | ch |
Chechen | ce |
Chichewa, Chewa, Nyanja | ny |
Chinese | zh |
Chinese (Simplified) | zh-Hans |
Chinese (Traditional) | zh-Hant |
Chuvash | cv |
Cornish | kw |
Corsican | co |
Cree | cr |
Croatian | hr |
Czech | cs |
Danish | da |
Divehi, Dhivehi, Maldivian | dv |
Dutch | nl |
Dzongkha | dz |
English | en |
Esperanto | eo |
Estonian | et |
Ewe | ee |
Faroese | fo |
Fijian | fj |
Finnish | fi |
French | fr |
Fula, Fulah, Pulaar, Pular | ff |
Galician | gl |
Gaelic (Scottish) | gd |
Gaelic (Manx) | gv |
Georgian | ka |
German | de |
Greek | el |
Greenlandic | kl |
Guarani | gn |
Gujarati | gu |
Haitian Creole | ht |
Hausa | ha |
Hebrew | he |
Herero | hz |
Hindi | hi |
Hiri Motu | ho |
Hungarian | hu |
Icelandic | is |
Ido | io |
Igbo | ig |
Indonesian | id, in |
Interlingua | ia |
Interlingue | ie |
Inuktitut | iu |
Inupiak | ik |
Irish | ga |
Italian | it |
Japanese | ja |
Javanese | jv |
Kalaallisut, Greenlandic | kl |
Kannada | kn |
Kanuri | kr |
Kashmiri | ks |
Kazakh | kk |
Khmer | km |
Kikuyu | ki |
Kinyarwanda (Rwanda) | rw |
Kirundi | rn |
Kyrgyz | ky |
Komi | kv |
Kongo | kg |
Korean | ko |
Kurdish | ku |
Kwanyama | kj |
Lao | lo |
Latin | la |
Latvian (Lettish) | lv |
Limburgish ( Limburger) | li |
Lingala | ln |
Lithuanian | lt |
Luga-Katanga | lu |
Luganda, Ganda | lg |
Luxembourgish | lb |
Manx | gv |
Macedonian | mk |
Malagasy | mg |
Malay | ms |
Malayalam | ml |
Maltese | mt |
Maori | mi |
Marathi | mr |
Marshallese | mh |
Moldavian | mo |
Mongolian | mn |
Nauru | na |
Navajo | nv |
Ndonga | ng |
Northern Ndebele | nd |
Nepali | ne |
Norwegian | no |
Norwegian bokmål | nb |
Norwegian nynorsk | nn |
Nuosu | ii |
Occitan | oc |
Ojibwe | oj |
Old Church Slavonic, Old Bulgarian | cu |
Oriya | or |
Oromo (Afaan Oromo) | om |
Ossetian | os |
Pāli | pi |
Pashto, Pushto | ps |
Persian (Farsi) | fa |
Polish | pl |
Portuguese | pt |
Punjabi (Eastern) | pa |
Quechua | qu |
Romansh | rm |
Romanian | ro |
Russian | Русский | ru |
Sami | se |
Samoan | sm |
Sango | sg |
Sanskrit | sa |
Serbian | sr |
Serbo-Croatian | sh |
Sesotho | st |
Setswana | tn |
Shona | sn |
Sichuan Yi | ii |
Sindhi | sd |
Sinhalese | si |
Siswati | ss |
Slovak | sk |
Slovenian | sl |
Somali | so |
Southern Ndebele | nr |
Spanish | es |
Sundanese | su |
Swahili (Kiswahili) | sw |
Swati | ss |
Swedish | sv |
Tagalog | tl |
Tahitian | ty |
Tajik | tg |
Tamil | ta |
Tatar | tt |
Telugu | te |
Thai | th |
Tibetan | bo |
Tigrinya | ti |
Tonga | to |
ts | |
Turkish | tr |
Turkmen | tk |
Twi | tw |
Uyghur | ug |
Ukrainian | uk |
Urdu | ur |
Uzbek | uz |
Venda | ve |
Vietnamese | vi |
Volapük | vo |
Wallon | wa |
Welsh | cy |
Wolof | wo |
Western Frisian | fy |
Xhosa | xh |
Yiddish | yi, ji |
Yoruba | yo |
Zhuang, Chuang | za |
Zulu | zu |
Сайт не отображает русский шрифт
Добрый вечер и другого времени суток! Ко мне на почту и в комментарии на сайте неоднократно поступают вопросы, типа «Почему не отображается русский шрифт на сайт» или «Я прописал в html файле русский текст, а он выводиться кракозябрами. Что делать?». Поэтому я решил посвятить этой теме урок. В этом уроке я расскажу, что нужно делать, если русский кириллический шрифт не отображается у вас на сайте или отображается, но коряво (непонятными символами).
Сразу скажу, что все эти проблемы связаны в первую очередь с кодировкой самого сайта. Я буду учить вас тому, что сам знаю и как делаю именно я (потому что каждый web-разработчик приходит к решение проблемы по разному и на счет кодировки, в частности, у каждого свое мнение на это счет). Итак, начнем!
P.S. Если вы всерьез решили заниматься web-разработкой, советую установить html редактор Notepad, зарегистировать пока самый простой и дешовый шаровый хостинг (советую ihc) и читать много документации по html и css.
Если у вас не отображается русский кириллический шрифт на сайте
1. Открываем html файл в Notepad, нажимаем Ctrl-A (выделяем весь код)
2. Заходим в «Кодировки» и выбираем «Кодировать в Utf-8»
3. Сохраняем файл и теперь можем писать на русском языке и у нас будет все нормально отображаться.
Если же вы скачали готовый шаблон
1. Повторить все то, что я описал выше!
2. Убрать все подключаемые шрифты.
Пример:
<!-- Cufon -->
<script src="js/cufon-yui.js" type="text/javascript"></script>
<script src="js/bebas-neue_400.font.js" type="text/javascript"></script>
<!-- /Cufon -->
3. Заменить в css файле в body, h2, h3 и так далее на классический web-шрифт, типа:
font-family: Tahoma, Arial, Helvetica, sans-serif;
4. Можно подключить нестандартные шрифты
Также можно подключить нестандартные (но обязательно с поддержкой русского кириллического) шрифты. Вот отличный сервис, где вы можете скачать русские шрифты для своего сайта.
Надеюсь я вам помог. До новых постов!
Помогла статья? Угости чашечкой кофе =)
lang — HTML | MDN
Глобальный атрибут lang
помогает определить язык элемента: язык, на котором написаны нередактируемые элементы, или язык, на котором пользователем должны быть написаны редактируемые элементы. Атрибут содержит единственный “языковой тег” (language tag
) в формате, определённом в Tags for Identifying Languages (BCP47).
The source for this interactive example is stored in a GitHub repository. If you’d like to contribute to the interactive examples project, please clone https://github.com/mdn/interactive-examples and send us a pull request.
Если значение атрибута — пустая строка (lang=""
), язык устанавливается, как неизвестный. Если тег языка недействителен согласно BCP47, он устанавливается, как недействительный.
Подробный синтаксис BCP47 достаточно подробен, чтобы отмечать специфичные языковые диалекты, но в большинстве случаев его использование намного проще.
Языковой тег состоит из языковых вложенных тегов, разделённых дефисом, где каждый вложенный тег указывает на определённое свойство языка. 3 наиболее распространённых вложенных тега:
- Языковой подтег
- Обязателен. Двух-или-трёх-символьный код, определяющий базовый язык, обычно записываемый в нижнем регистре. К примеру, код английского языка является
en
, а для Бадеши —bdz
. - Подтег скрипта
- Необязателен. Данный подтег определяет систему записи, и всегда состоящий из 4 символов с первой заглавной буквой. К примеру, французский язык Брайля — это
fr-Brai
, аja-Kana
— это японский язык, написанный с использованием алфавита Катакана (Katakana). Если язык написан типичным способом, например, английский с латинским алфавитом, нет необходимости использовать данный подтег. - Подтег региона
- Необязателен. Данный подтег определяет диалект основного языка из определённого места и состоит из двух букв в ALLCAPS, соответствующих коду страны, или трёх цифр, соответствующих региону, который не относится к стране. К примеру,
es-ES
— это испанский язык, на котором разговаривают в Испании, аes-013
означает испанский язык, на котором разговаривают в Центральной Америке. “Международный испанский” было бы простоes
.
Подтег скрипта предшествует подтегу региона, если присутствуют оба тега — ru-Cyrl-BY
— это русский язык, написанный кириллицей, на котором разговаривают в Беларуси.
Чтобы найти правильный подтег кода языка, используйте the Language Subtag Lookup.
Даже если указан атрибут lang, то он может не учитываться, поскольку атрибут xml:lang имеет приоритет над lang.
Для псевдокласса CSS :lang
, два недопустимых названия языка будут разными, если их имена различны. Хотя, :lang(es)
соответствует обоим lang="es-ES"
и lang="es-419"
, но :lang(xyzzy)
не соответствует lang="xyzzy-Zorp!"
.
Кракозябры на сайте — 6 проблем и их решения
Когда я только начинал изучать тему разработки сайтов, кракозябры были одной из моих постоянных проблем. Создал HTML-страницу — в браузере кракозябры, установил денвер и попробовал создать сайт на PHP — снова вместо букв кракозябры. Скачал иностранную тему, подключился к базе данных — та же проблема.
На своих сайтах я обычно использую UTF-8 (это такая кодировка текста, она ещё называется юникод), соответственно она будет присутствовать во всех примерах в этой статье.
1. UTF-8 без BOM
Начнём с самой простой проблемы. Вы создали какой-то HTML-файл, открыли его в браузере и получили:
Кракозябры (проблема с кодировкой).Проблема актуальна в основном для пользователей Windows, на маке я с таким ни разу не сталкивался.
Решение проблемы зависит в основном от того, каким редактором вы пользуетесь. Для пользователей Windows я рекомендую бесплатный офигительный Notepad++.
Значит, открываем файл в Notepad++ и переходим в Кодировки > Преобразовать в UTF-8 без BOM. Вопрос — почему без BOM? Потому что с BOM у вас будут постоянно вставляться пустые символы (на самом деле они не пустые, у них тоже есть своя функция, но нам она в данном случае не нужна) куда не надо, а для PHP это уже критично.
2. Мета тег charset
Если вы сделали то, что я описывал в предыдущем шаге и ваша проблема не разрешилась, тогда самое время испробовать второй метод устранения кракозябров.
Всё, что нам требуется, это вставить следующий код между тегами <head>
сайта. Прежде всего проверьте, возможно этот метатег у вас уже присутствует. Если да, то посмотрите какое у него стоит значение параметра charset.
В темах WordPress обычно этот тег уже имеется по умолчанию и выглядит следующим образом:
<meta charset="<?php bloginfo('charset'); ?>" />
3. .htaccess
Если русские буквы до сих пор отображаются кракозябрами, тогда открываем ваш .htaccess
, который лежит в корне сайта и вставляем туда с новой строки это:
4. Заголовки сервера через header()
Ещё один способ определения кодировки. На этот раз через PHP. На WordPress никогда не приходилось им пользоваться.
header('Content-Type: text/html; charset=utf-8');
Важно! Этот код должен вставляться до того, как будет что-либо выведено на странице сайта, иначе — ошибка.
5. Проблемы с последним символом при обрезке строки
На многих сайтах встречаются блоки с популярными записями, последними комментариями, отзывами и так далее. Обычно в таких обзорных блоках выводится часть записи/комментария/отзыва и кнопка «читать далее». Так вот, для того, чтобы вывести первые несколько предложений или первые несколько слов текста, используется функция PHP substr()
. Конечно же в основном я имею ввиду англоязычные темы, которых так много в интернете. Даже если у этих тем есть локализация — то есть вроде бы она на русском — переведена админка, переведён практически весь сайт, но при этом мы встречаем такие вот косяки:
Как решить эту проблему?
Легко — всё что нам нужно, это найти функцию substr()
в коде и поменять её на mb_substr()
.
Если после этого у вас полезут ошибки на сайт, то скорее всего multibyte-функции не поддерживаются вашим хостингом, первое, что вам следует сделать, это написать в супорт и спросить, нельзя ли их подключить на ваш аккаунт. Если нет, меняем хостинг, например на тот, которым пользуюсь я.
6. MySQL
У меня не раз бывало такое, что я подключался к MySQL, вытаскивал какие-нибудь данные, и при их выводе на сайте, текст отображался кракозябрами.
Такое может произойти, если кодировка вашего сайта не совпадает с кодировкой базы данных, к которой вы подключаетесь. В WordPress обычно таких проблем не бывает.
Для того, чтобы исправить это, после подключения к БД, делаем следующее:
mysql_query("SET NAMES 'UTF8'");
Если ни один из вышеперечисленных методов вам не помог, оставляйте комментарий и попробуем вместе разобраться.
Миша
Впервые познакомился с WordPress в 2009 году. Организатор и спикер на конференциях WordCamp. Преподаватель в школе Нетология.
Если вам нужна помощь с сайтом или разработка с нуля на WordPress / WooCommerce — пишите. Я и моя команда будем рады вам помочь!
Тег | Краткое описание |
---|---|
<!—…—> | Комментарий. Подробнее |
<!DOCTYPE> | Определяет тип документа. Подробнее |
<a> | Ссылка, гиперссылка, якорь. Подробнее |
<abbr> | Определяет текст как аббревиатуру. Подробнее |
<address> | Контактная информация автора или владельца документа. Подробнее |
<area> | Определяет область на карте-изображении |
<article> | Статья |
<aside> | Контент в стороне (содержимое не является основным на странице по смыслу) |
<audio> | Позволяет вставить воспроизводимый аудио файл. Подробнее |
<b> | Полужирный текст. Подробнее |
<base> | Задает базовый URL или атрибут target для относительных ссылок в документе. Подробнее |
<bdi> | Область, где написание текста может имееть другое направления. Подробнее |
<bdo> | Устанавливает направление написания текста. В отличии от <bdi> направление указывается физическое направление Подробнее |
<blockquote> | Цитата. Подробнее |
<body> | Указывает область body документа. Подробнее |
<br> | Перенос строки. Подробнее |
<button> | Кликабельная кнопка. Подробнее |
<canvas> | Используется для рисовании графики с помощью скриптов |
<caption> | Подпись таблицы. Подробнее |
<cite> | Сноска на название материала. Подробнее |
<code> | Используется для вставки компьютерного кода в текстовом виде. Подробнее |
<col> | Задает характеристики колонок в таблице. Подробнее |
<colgroup> | Определяет группу из одной или более колонок таблицы для форматирования. Подробнее |
<datalist> | Используется для определения предопределенных вариантов на выбор при вводе в текстовом поле. Подробнее |
<dd> | Определяет описание термина из тега <dt> в списке терминов <dl>. Подробнее |
<del> | Текст, который удален в новой версии документа. Подробнее |
<details> | Определяет дополнительную информацию, которую пользователь может просмотреть или скрыть. Подробнее |
<dfn> | Указывает, что содержимое является термином. Подробнее |
<dialog> | Определяет диалоговое окно или интерактивный элемент |
<div> | Блочный элемент — один из основных элементов верстки. Подробнее |
<dl> | Определяет список определений. Подробнее |
<dt> | Название термина в списке определений <dl>. Подробнее |
<em> | выделенный по смыслу текст (обычно, текст выделенный курсивом). Подробнее |
<embed> | Контейнер для внешнего приложения |
<fieldset> | Группа связанных элементов в форме. Подробнее |
<figcaption> | Заголовок для <figure> элемента |
<figure> | Определяет автономную группу из нескольких элементов (например картинка с подписью) |
<footer> | Нижний колонтитул |
<form> | Определяет форму пользовательского ввода. Подробнее |
<h2> — <h6> | Заголовки HTML разного уровня: <h2>, <h3>, <h4>, <h5>, <h5>, <h6>. Подробнее |
<head> | Указывает область head документа. Подробнее |
<header> | Блок заголовка |
<hr> | Горизонтальная линия — тематический разделитель. Подробнее |
<html> | Корневой элемент. Сообщает браузеру, что данный документ является HTML документом. Подробнее |
<i> | Выделяет текст курсивом. Подробнее |
<iframe> | Определяет встроенный фрейм |
<img> | Изображение, картинка. Подробнее |
<input> | Поле для ввода, элемент формы. Подробнее |
<ins> | Текст, который был добавлен в новой версии документа. Подробнее |
<kbd> | Текст введенный с клавиатуры или названия кнопок клавиатуры. Обычно выделен моноширинным шрифтом. Подробнее |
<label> | Метка для поля ввода. Обычно содержит подпись поля. Подробнее |
<legend> | Заголовок элементов <fieldset>. Подробнее |
<li> | Элемент списка. Подробнее |
<link> | Определяет привязку внешнего ресурса (чаще всего, привязку таблицы стилей CSS). Подробнее |
<main> | Основной контент |
<map> | Контейнер для <area>. Определяет пользовательскую карту на изображении |
<mark> | Выделенный текст (обычно с помощью подсветки фона). Подробнее |
<menu> | Контейнер для списка пунктов меню |
<menuitem> | Определяет элементы, которые пользователь может вызвать из контекстного меню |
<meta> | Используется для определения мета-данных документа. Подробнее |
<meter> | Измеритель значений в заданном диапазоне |
<nav> | Контейнер для навигационных элементов |
<noscript> | Альтернативный контент для пользователей, отключивших скрипты |
<object> | Определяет встроенный объект |
<ol> | Определяет нумерованный список. Подробнее |
<optgroup> | Определяет группу связанных вариантов в выпадающем списке. Дает название группы. Подробнее |
<option> | Параметр (вариант выбора) в выпадающем списке. Подробнее |
<output> | Результат вычислений. Подробнее |
<p> | Абзац. Подробнее |
<param> | Задает параметры для встроенных объектов |
<picture> | Контейнер для нескольких изображений |
<pre> | Предварительно отформатированный текст. Подробнее |
<progress> | Индикатор выполнения (прогресса) |
<q> | Цитата в тексте. Подробнее |
<rp> | Альтернативный текст, если браузер не поддерживает тег <ruby>. Подробнее |
<rt> | Аннотация к содержимому тега <ruby>. Подробнее |
<ruby> | Контейнер для символов и их расшифровки (в основном для Восточно-азиатских символов, иероглифов). Подробнее |
<s> | Перечеркнутый текст. Подробнее |
<samp> | Текст, являющийся результатом выполнения компьютерной программы (обычно выводится моноширинным шрифтом). Подробнее |
<script> | Определяет скрипт или подключение скрипта из внешнего ресурса. Подробнее |
<section> | Раздел |
<select> | Определяет выпадающий список или список с множественным выбором. Подробнее |
<small> | Текст шрифтом меньшего размера. Подробнее |
<source> | Определяет ресурс для тегов <video>, <audio> и <picture>. Подробнее |
<span> | Строчный элемент. Подробнее |
<strong> | Текст, выделенный по значению. Обычно отображается полужирным. Подробнее |
<style> | Определяет контейнер для определения CSS стилей документа. Подробнее |
<sub> | Отображает текст в виде нижнего индекса. Подробнее |
<summary> | Заголовок внутри тега <details>. Подробнее |
<sup> | Отображает текст в виде верхнего индекса. Подробнее |
<table> | Определяет таблицу. Подробнее |
<tbody> | Определяет область контента в таблице. Подробнее |
<td> | Ячейка в таблице <table>. Подробнее |
<textarea> | Многострочное поле для ввода. Подробнее |
<tfoot> | Определяет группу строк в нижней части таблицы <table> — нижний колонтитул. Подробнее |
<th> | Ячейка — заголовок в таблице <table>. Подробнее |
<thead> | Определяет группу строк в верхней части таблицы <table> — верхний колонтитул. Подробнее |
<time> | Дата и/или время. Подробнее |
<title> | Заголовок HTML документа. Подробнее |
<tr> | Определяет строку в таблице. Подробнее |
<track> | Определяет текстовую дорожку для тегов <video> и <audio> Подробнее |
<ul> | Определяет маркированный список. Подробнее |
<var> | Используется для обозначения содержимого тега как переменной. Подробнее |
<video> | Позволяет вставить воспроизводимое видео. Подробнее |
<wbr> | Место, где допускается перенос строки. Подробнее |
Коды для обозначения языков | HTML справочник
Код языка, подразумевает собой сокращенное наименование, состоящее из двух букв которые определяют язык содержимого внутри элемента. Если у языка есть диалект, то через дефис добавляют еще две буквы (например, США lang =»en-us»).
Основная функция глобального атрибута lang определить язык содержимого внутри HTML элемента. Например, атрибут lang, применённый к тегу <html> указывает язык содержимого веб-страницы (для всего текста на странице).
Старайтесь всегда объявлять язык страницы — это важно для приложений, читающих с экрана, для поисковых систем, для осуществления правильной расстановки переносов, выбора необходимого набора кавычек браузером (вид может зависеть от языка), проверки орфографии и пунктуации и так далее.
Атрибут имеет следующий синтаксис:
lang = "Код языка"
Пример использования атрибута в мультиязычном документе:
<!DOCTYPE html> <html lang = "ru"> <!-- указывает язык содержимого веб-страницы --> <head> <title>Пример использования атрибута lang</title> </head> <body> <p lang = "es"> ¿Por qué necesita una traducción? </p> <!-- Этот параграф интерпретируется как испанский --> <p>И дальше по тексту интерпретация языка продолжается на русском <p> </body> </html>
В этом примере основной язык документа является русский («ru»), а один абзац объявлен на испанском языке («es»).
Таблица содержит регистрацию двухбуквенных кодов (ISO 639-1):
Название языка | Код |
---|---|
Abkhaz | ab |
Afar | aa |
Afrikaans | af |
Akan | ak |
Albanian | sq |
Amharic | am |
Arabic | ar |
Aragonese | an |
Armenian | hy |
Assamese | as |
Avaric | av |
Avestan | ae |
Aymara | ay |
Azerbaijani | az |
Bambara | bm |
Bashkir | ba |
Basque | eu |
Belarusian | be |
Bengali, Bangla | bn |
Bihari | bh |
Bislama | bi |
Bosnian | bs |
Breton | br |
Bulgarian | bg |
Burmese | my |
Catalan | ca |
Chamorro | ch |
Chechen | ce |
Chichewa, Chewa, Nyanja | ny |
Chinese | zh |
Chuvash | cv |
Cornish | kw |
Corsican | co |
Cree | cr |
Croatian | hr |
Czech | cs |
Danish | da |
Divehi, Dhivehi, Maldivian | dv |
Dutch | nl |
Dzongkha | dz |
Eastern Punjabi, Eastern Panjabi | pa |
English | en |
Esperanto | eo |
Estonian | et |
Ewe | ee |
Faroese | fo |
Fijian | fj |
Finnish | fi |
French | fr |
Fula, Fulah, Pulaar, Pular | ff |
Galician | gl |
Ganda | lg |
Georgian | ka |
German | de |
Greek | el |
Guaraní | gn |
Gujarati | gu |
Haitian, Haitian Creole | ht |
Hausa | ha |
Hebrew | he |
Herero | hz |
Hindi | hi |
Hiri Motu | ho |
Hungarian | hu |
Icelandic | is |
Ido | io |
Igbo | ig |
Indonesian | id |
Interlingua | ia |
Interlingue | ie |
Inuktitut | iu |
Inupiaq | ik |
Irish | ga |
Italian | it |
Japanese | ja |
Javanese | jv |
Kalaallisut, Greenlandic | kl |
Kannada | kn |
Kanuri | kr |
Kashmiri | ks |
Kazakh | kk |
Khmer | km |
Kikuyu, Gikuyu | ki |
Kinyarwanda | rw |
Kirundi | rn |
Komi | kv |
Kongo | kg |
Korean | ko |
Kurdish | ku |
Kwanyama, Kuanyama | kj |
Kyrgyz | ky |
Lao | lo |
Latin | la |
Latvian | lv |
Limburgish, Limburgan, Limburger | li |
Lingala | ln |
Lithuanian | lt |
Luba-Katanga | lu |
Luxembourgish, Letzeburgesch | lb |
Macedonian | mk |
Malagasy | mg |
Malay | ms |
Malayalam | ml |
Maltese | mt |
Manx | gv |
Marathi | mr |
Marshallese | mh |
Mongolian | mn |
Māori | mi |
Nauruan | na |
Navajo, Navaho | nv |
Ndonga | ng |
Nepali | ne |
Northern Ndebele | nd |
Northern Sami | se |
Norwegian | no |
Norwegian Bokmål | nb |
Norwegian Nynorsk | nn |
Nuosu | ii |
Occitan | oc |
Ojibwe, Ojibwa | oj |
Old Church Slavonic, Church Slavonic, Old Bulgarian | cu |
Oriya | or |
Oromo | om |
Ossetian, Ossetic | os |
Pashto, Pushto | ps |
Persian (Farsi) | fa |
Polish | pl |
Portuguese | pt |
Pāli | pi |
Quechua | qu |
Romanian | ro |
Romansh | rm |
Russian | ru |
Samoan | sm |
Sango | sg |
Sanskrit (Saṁskṛta) | sa |
Sardinian | sc |
Scottish Gaelic, Gaelic | gd |
Serbian | sr |
Shona | sn |
Sindhi | sd |
Sinhalese, Sinhala | si |
Slovak | sk |
Slovene | sl |
Somali | so |
Southern Ndebele | nr |
Southern Sotho | st |
Spanish | es |
Sundanese | su |
Swahili | sw |
Swati | ss |
Swedish | sv |
Tagalog | tl |
Tahitian | ty |
Tajik | tg |
Tamil | ta |
Tatar | tt |
Telugu | te |
Thai | th |
Tibetan Standard, Tibetan, Central | bo |
Tigrinya | ti |
Tonga | to |
Tsonga | ts |
Tswana | tn |
Turkish | tr |
Turkmen | tk |
Twi | tw |
Ukrainian | uk |
Urdu | ur |
Uyghur | ug |
Uzbek | uz |
Venda | ve |
Vietnamese | vi |
Volapük | vo |
Walloon | wa |
Welsh | cy |
Western Frisian | fy |
Western Frisian | wo |
Xhosa | xh |
Yiddish | yi |
Yoruba | yo |
Zhuang, Chuang | za |
Zulu | zu |
HTML-коды для символов греческого языка
Даже если ваш сайт написан только на английском языке и не включает многоязычные переводы, вам может потребоваться добавить символы греческого языка на этот сайт на определенных страницах или для определенных слов.
В приведенный ниже список включены коды HTML, необходимые для использования греческих символов, которые не входят в стандартный набор символов и не встречаются на клавишах клавиатуры. Не все браузеры поддерживают все эти коды (в основном, старые браузеры могут вызывать проблемы; новые браузеры подойдут), поэтому обязательно проверьте свои HTML-коды перед их использованием.
Некоторые греческие символы могут быть частью набора символов Unicode, поэтому вам необходимо указать это в заголовке ваших документов:
data-type = «code»>
Вот различные символы, которые вам могут понадобиться.
Дисплей | Товарный код | Десятичный код | Шестнадцатеричный код | Описание |
---|---|---|---|---|
Α | и альфа; | & # 913; | & # x391; | Капитал Альфа |
α | & альфа; | & # 945; | & # x3b1; | Строчная Alpha |
Β | и бета; | & # 914; | & # x392; | Капитал бета |
β | и бета; | & # 946; | & # x3B2; | Строчная бета |
Г | и гамма; | & # 915; | & # x393; | Capital Gamma |
γ | & гамма; | & # 947; | & # x3B3; | Гамма в нижнем регистре |
Δ | и Дельта; | & # 916; | & # x394; | Капитал Дельта |
δ | & дельта; | & # 948; | & # x3B4; | Дельта строчная |
Ε | и Эпсилон; | & # 917; | & # x395; | Капитал Эпсилон |
ε | & epsilon; | & # 949; | & # x3B5; | Строчные буквы Epsilon |
Ζ | и Zeta; | & # 918; | & # x396; | Capital Zeta |
ζ | & zeta; | & # 950; | & # x3B6; | Строчная Zeta |
Η | и эта; | & # 919; | & # x397; | Capital Eta |
η | & eta; | & # 951; | & # x3B7; | Строчная Eta |
Θ | и Theta; | & # 920; | & # x398; | Капитал Тета |
θ | & theta; | & # 952; | & # x3B8; | Строчная Тета |
Ι | и йота; | & # 921; | & # x399; | Капитал Йота |
ι | и йота; | & # 953; | & # x3B9; | Строчная Йота |
Κ | и Каппа; | & # 922; | & # x39A; | Капитал Каппа |
κ | & каппа; | & # 954; | & # x3BA; | Каппа строчная |
Λ | и лямбда; | & # 923; | & # x39B; | Заглавная лямбда |
λ | & лямбда; | & # 955; | & # x3BB; | Лямбда в нижнем регистре |
Μ | и Mu; | & # 924; | & # x39C; | Capital Mu |
мкм | & mu; | & # 956; | & # x3BC; | Строчная Mu |
Ν | и Nu; | & # 925; | & # x39D; | Capital Nu |
ν | & nu; | & # 957; | & # x3BD; | Строчная Nu |
Ξ | и Си; | & # 926; | & # x39E; | Капитал Си |
ξ | и xi; | & # 958; | & # x3BE; | Строчная Xi |
Ο | и Omicron; | & # 927; | & # x39F; | Капитал Омикрон |
ο | & omicron; | & # 959; | & # x3BF; | Строчная Omicron |
Π | и Pi; | & # 928; | & # x3A0; | Капитал Пи |
π | & pi; | & # 960; | & # x3C0; | Строчная Пи |
Ρ | и Rho; | & # 929; | & # x3A1; | Capital Rho |
ρ | & rho; | & # 961; | & # x3C1; | Строчная Rho |
Σ | и Sigma; | & # 931; | & # x3A3; | Капитал Сигма |
σ | & сигма; | & # 963; | & # x3C3; | Строчная сигма |
ς | & sigmaf; | & # 962; | & # x3C4; | Строчная заключительная сигма |
Τ | и тау; | & # 932; | & # x3A4; | Капитал Тау |
τ | & тау; | & # 964; | & # x3C4; | Строчная Тау |
Υ | и ипсилон; | & # 933; | & # x3A5; | Капитал Ипсилон |
υ | и ипсилон; | & # 965; | & # x3C5; | Ипсилон строчные |
Φ | и Phi; | & # 934; | & # x3A6; | Capital Phi |
φ | & phi; | & # 966; | & # x3C6; | Строчная фи |
Χ | и Чи; | & # 935; | & # x3A7; | Capital Chi |
χ | и чи; | & # 967; | & # x3C7; | Чи строчная |
Ψ | & Psi; | & # 936; | & # x3A8; | Заглавная буква Psi |
ψ | & psi; | & # 968; | & # x3C8; | Строчная Psi |
Ом | и Омега; | & # 937; | & # x3A9; | Капитал Омега |
ω | & омега; | & # 969; | & # x3C9; | Строчная Омега |
Использовать эти символы просто.В разметке HTML вы должны разместить эти коды специальных символов там, где вы хотите, чтобы отображался греческий символ. Они используются аналогично другим кодам специальных символов HTML, которые позволяют добавлять символы, которых также нет на традиционной клавиатуре, и поэтому их нельзя просто ввести в HTML для отображения на веб-странице.
Помните, что эти коды символов могут использоваться на англоязычном веб-сайте, если вам нужно отобразить слово с одним из этих символов. Эти символы также будут использоваться в HTML, который фактически отображал полные греческие переводы, независимо от того, действительно ли вы кодировали эти веб-страницы вручную и имели полную греческую версию сайта, или если вы использовали более автоматизированный подход к многоязычным веб-страницам и перешли с таким решением, как Google Translate.
Отредактировал Джереми Жирар
Поскольку российские войска остаются у границы с Украиной, официальные лица Байдена видят сообщение
ВАШИНГТОН — Россия вывела всего несколько тысяч военнослужащих с границы с Украиной, заявили высокопоставленные официальные лица администрации Байдена, несмотря на сигналы из Москвы в прошлом месяце о снижении напряженности. в нестабильной области.
Высокопоставленные представители министерства обороны заявили, что около 80 000 российских военнослужащих оставались на различных участках границы страны с Украиной, что по-прежнему является крупнейшей силой, которую Россия скопила там с тех пор, как Москва аннексировала Крым в 2014 году.
Российские военные действительно приказали некоторым подразделениям вернуться в свои казармы к 1 мая — и они действительно отошли от границы, — заявили официальные лица. Но многие подразделения оставили свои грузовики и бронетехнику, сигнал о том, что они могут вернуться, если президент России Владимир Путин решит развернуть их снова.
Президент Байден заявил во вторник, что он «надеялся и ожидал», что он встретится с г-ном Путиным во время июньской поездки в Европу, включая участие в саммите НАТО в Брюсселе.Администрация объединила предложение о встрече, что является важным символом продолжающегося влияния Москвы на мировой арене, с ужесточением санкций в отношении России за ее кибератаки, вмешательство в выборы, угрозы в адрес Украины и отравление лидера оппозиции Алексея А. Навального. .
Представители администрации заявили, что они воспринимают постоянное присутствие войск на границе с Украиной как сообщение от г-на Путина о том, что он может сопоставить — и, по сути, превзойти — количество военнослужащих, принимающих участие в учениях США и НАТО в Европе.Учения под руководством США под названием Defender Europe официально начались во вторник. В него входят около 28 000 военнослужащих из Соединенных Штатов и европейских союзников, участвующих в маневрах в течение следующих двух месяцев через Албанию и другие части Восточной Европы у порога г-на Путина. А в следующем месяце НАТО проведет еще одно учение под названием «Стойкий защитник 21» в Румынии и Португалии.
Военные аналитики отметили, что развертывание войск г-на Путина явно предназначалось для того, чтобы быть видимым, как попытка поиграть мускулами и часть стандартной оперативной процедуры Кремля, особенно в начале нового американского президентства.По словам официальных лиц, Путин вполне может искать способы проверить решимость Байдена. Но опасность состоит в том, что любое наращивание военной мощи может выйти из-под контроля или спровоцировать более глубокий кризис.
«Для всех совещательных стратегий существует постоянный риск того, что что-то пойдет не так, сигналы будут неправильно истолкованы», — сказал Ян Лессер, вице-президент Немецкого фонда Маршалла. «Самолет мог быть сбит. Что-то могло случиться ».
Американские официальные лица говорят, что они не уверены в том, что именно г-н.Цели Путина заключаются в увеличении численности войск или в его решении пока не полностью выполнять объявление о выводе войск. Эта двусмысленность могла быть частью расчетов российского лидера.
«Они сохранили довольно смертоносные силы в регионе и отвели лишь некоторые силы», — сказал генерал-майор Майкл С. Репасс, бывший командующий силами специальных операций США в Европе, который теперь является советником по специальным операциям НАТО. в Украину.
«Это говорит мне о том, что они могут захотеть вернуться позже, когда время и обстоятельства будут более выгодными для России», — сказал генерал Репасс.«Это повторится снова».
Государственный секретарь Энтони Дж. Блинкен прибудет в Киев в четверг, чтобы «подтвердить непоколебимую поддержку США суверенитета и территориальной целостности Украины перед лицом продолжающейся агрессии России», — заявил официальный представитель Госдепартамента Нед Прайс. Но г-н Блинкен также будет искать способы снизить температуру в регионе, заявили официальные лица. Он расскажет об амбициях Украины в отношении НАТО — Киев хочет присоединиться к альянсу, что вызовет гнев в Москве.
«Крупные учения НАТО почти наверняка повлияли на решение России сохранить значительное присутствие войск на российско-украинской границе», — сказал Джеймс Дж. Ставридис, адмирал в отставке и бывший командующий НАТО. «Послание Владимира Путина простое: Украине не следует даже думать о членстве в НАТО. НАТО не должно его предлагать. Любое движение в этом направлении приведет к вмешательству России ».
Некоторые американские официальные лица говорят, что развертывание войск в основном направлено на то, чтобы показать блеф Соединенных Штатов и Европы — и дать понять Киеву пределы поддержки Запада.По словам этих официальных лиц, Россия хочет вызвать реакцию Запада, но реакцию, которая не оправдает надежд украинского правительства.
Россия, возможно, уже достигла этой цели. Соединенные Штаты заявили, что готовы ввести новые санкции против Москвы, и выразили решительную поддержку Украине. Но администрация г-на Байдена не предприняла никаких шагов для продвижения к членству в НАТО или значительного увеличения военной помощи Киеву.
Водоснабжение Крыма остается ключевым моментом трений.Если Россия вторгнется на территорию, которая больше контролируется Украиной, это может быть связано с ослаблением жесткого контроля над крымским водоснабжением, который Украина ввела после аннексии 2014 года.
Высокопоставленные американские чиновники считают, что вторжение в систему водоснабжения остается реальной угрозой. Москва играла с границами оккупированных территорий в других местах; Российские войска регулярно меняют границу своего контроля на оккупированные части Грузии.
Но проблема с водой назревает уже семь лет, и Россия никогда не делала таких шагов, чтобы захватить контроль над водоснабжением.Переезд из Крыма в другие части украинской территории вызвал бы резкую реакцию со стороны международного сообщества, и российские власти должны были бы решить, стоит ли это затрат, как в финансовом, так и в дипломатическом плане.
Андреа Кендалл-Тейлор, научный сотрудник Центра новой американской безопасности и бывший высокопоставленный сотрудник разведки, специализирующийся на России, сказала, что любая операция Москвы по установлению контроля над водоснабжением будет затруднена. «Это требует, чтобы российские войска захватили его, разместили в нем гарнизон и сохранили контроль над ним, что в долгосрочной перспективе будет дорого обходиться», — сказала она.
Москва была напугана предполагаемым переходом украинского правительства к более антироссийской политике, сказала г-жа Кендалл-Тейлор. «Действия России в первую очередь направлены на то, чтобы оказать давление на украинцев, а также попытаться выявить пределы того, что США и Европа будут делать для Украины», — сказала она.
Администрация Байдена может увеличить военную помощь Украине для противодействия Москве. Но это, опять же, требует уравновешивания, заявили высокопоставленные представители администрации. Хитрость заключается в том, чтобы укрепить украинскую армию так, чтобы вторжение России выглядело утомительным, но не в усилении вооруженных сил до такой степени, что Россия почувствует угрозу и должна действовать.
Эрик Шмитт предоставил отчеты.
ISO-8859-1 | ISO8859-1 | Западноевропейская, Latin-1. |
ISO-8859-5 | ISO8859-5 | Малоиспользуемая кириллица (латиница / кириллица). |
ISO-8859-15 | ISO8859-15 | Западноевропейская, Latin-9. Добавляет знак евро, французский и финский буквы отсутствуют в Latin-1 (ISO-8859-1). |
UTF-8 | Многобайтный 8-битный Unicode, совместимый с ASCII. | |
cp866 | ibm866, 866 | Кириллица, специфичная для DOS. |
cp1251 | Windows-1251, Win-1251, 1251 | Кириллица, специфичная для Windows. |
cp1252 | Окна-1252, 1252 | Специальная кодировка Windows для западноевропейских языков. |
КОИ8-Р | koi8-ru, koi8r | Русский. |
BIG5 | 950 | Традиционный китайский, в основном используемый на Тайване. |
ГБ 2312 | 936 | Упрощенный китайский, национальный стандартный набор символов. |
BIG5-HKSCS | Big5 с расширениями Гонконга, традиционный китайский. | |
Shift_JIS | SJIS, SJIS-выигрыш, cp932, 932 | Японский |
EUC-JP | EUCJP, eucJP-победа | Японский |
MacRoman | Кодировка, которая использовалась Mac OS. | |
'' | Пустая строка активирует обнаружение по кодировке скрипта (многобайтный Zend), default_charset и текущий локаль (см. nl_langinfo () и setlocale ()) в этом порядке.Не рекомендуется. |
Транслитерация украинского и русского
Транслитерация украинского и русского языковТранслитерация украинского языка
на курсах славянского факультета Университета ТоронтоВ научном дискурсе приемлемы только две стандартные системы транслитерации с украинского на английский. Это система, разработанная Библиотекой Конгресса США и Международной системой (также называемой научной или европейской системой), которая свободно основана на Международном фонетическом алфавите.Система Библиотеки Конгресса требует лигатуры (надстрочные дуги над буквами) для тех кириллических символов, которые отображаются более чем одним латинским символом. Однако эти лигатуры на самом деле используются редко, и без них допустимо работать. В противном случае эти две схемы являются обязательными в форме, представленной ниже.
Вы можете ознакомиться с таблицами романизации Библиотеки Конгресса здесь.
Типографская аккуратность требует визуализации мягкого знака как штрих, а не изогнутой одинарной кавычки (одинарная умная или «фигурная» кавычка), а жесткого знака как двойного штриха (двойная кавычка пишущей машинки), а не изогнутой закрытой кавычки. (двойная умная или «фигурная» цитата).Для этого в текстовом процессоре (Word или Windows WordPerfect) необходимо временно отключить функцию преобразования «прямых» кавычек в «фигурные». В WordPerfect выберите Инструменты ==> Быстрое исправление ==> Умные цитаты. В Word выберите Инструменты ==> Автозамена ==> Автоформат при вводе. Поскольку вы отключите эту функцию только для ввода одного символа (одинарная или двойная кавычка), а затем снова включите ее, удобно написать макрос, который делает это. Имейте в виду, что если вы включите эти простые числа в любую операцию поиска и замены, они будут автоматически преобразованы в «фигурные» кавычки.В WP5.1 нет функции SmartQuotes.
Специальные символы в таблицах ниже доступны как в Word, так и в WordPerfect (и других текстовых редакторах). В Word перейдите к Вставить ==> Символ и прокрутите окно вниз, чтобы перейти к расширенному латинскому набору A, который содержит эти символы. В WordPerfect введите Control-W (Control-V в WP5.1) для доступа к Insert ==> Symbol и выберите из многонационального набора.
Таблица транслитерации кириллицы | ||||||||||
УКРАИНСКИЙ | РУССКИЙ | |||||||||
Кириллица | Международная система | Библиотека Конгресса | Международный фонетический алфавит | Библиотека Конгресса19 | Аа | а | а | а | ||
Б | b | b | b | b | ||||||
В | v | v | v | v | ||||||
h | h | g | g | |||||||
Ґ | g | g | — | — | ||||||
d | г | г | г | |||||||
e | e | e | e | |||||||
Є | je | ie | — | — | ||||||
ž (z hacek) | zh | ž (z hacek) | zh | |||||||
‡ | z | z | z | z | ||||||
ˆ | y | y | i | i | ||||||
І | i | i | i | i | ||||||
Ї | ji | ї или i | — | — | ||||||
j | i | j | i | |||||||
k | k | k | k | |||||||
Л | л | л | л | л | ||||||
М | м | м | м | м | ||||||
Н | n | n | n | n | ||||||
О | o | o | o | o | ||||||
П | p | p | p | p | ||||||
P | r | r | r | r | ||||||
С | s | s | s | s | ||||||
T | т | т | т | т | ||||||
u | u | u | u | |||||||
f | f | f | f | |||||||
Х | x | kh | x | kh | ||||||
Ц | c | ts | c | ts | ||||||
× | č (c hacek) | ch | č (c hacek) | ch | ||||||
Ø | š (s hacek) | sh | š (s hacek) | sh | ||||||
Щ | šč (s hacek c hacek) | shch | šč (s hacek c hacek) | shch | ||||||
Ю | ju | iu | ju | iu | ||||||
Я | ja | ia | ja | ia | ||||||
Ü | ‘ | ‘ | ‘ | ‘ | ||||||
‘ | « | » | « | » | ||||||
Ё | — | — | ë (e диэрезис) | ë e диэрезис | ||||||
E | — | — | ė (e dot) | ė (e dot) | ||||||
Ъ | — | — | « | » | ||||||
Ы | 9 0034 —— | y | y |
Информация о языке и направление текста
Информация о языке и направление текстаВ этом разделе документа обсуждаются два важных вопроса, которые влияют на интернационализация HTML: указание языка ( lang атрибут) и направление ( dir attribute) текста в документе.
Определения атрибутов- язык = код языка [CI]
- Этот атрибут определяет базовый язык значений атрибутов элемента. и текстовое содержимое. Значение этого атрибута по умолчанию неизвестно.
Информация о языке указывается через lang атрибут может использоваться пользовательским агентом для управления рендерингом в различных способами. Некоторые ситуации, когда может быть полезна предоставленная автором информация о языке включают:
- Помощь поисковым системам
- Вспомогательные синтезаторы речи
- Помощь пользовательскому агенту в выборе вариантов глифов для высококачественной типографики
- Помощь пользовательскому агенту в выборе набора кавычек
- Помощь пользовательскому агенту в принятии решений относительно расстановки переносов, лигатур и интервалов
- Вспомогательные средства проверки орфографии и грамматики
Атрибут lang определяет язык содержимого элемента и значения атрибутов; актуально ли это для данного атрибута зависит от синтаксиса и семантики атрибута и вовлеченная операция.
Назначение атрибута lang — позволить агентам пользователя отображать контент, более значимый на основе общепринятой культурной практики для данного язык. Это не означает, что пользовательские агенты должны отображать символы, которые нетипичны для определенного языка в менее значимом смысле; пользовательские агенты должен сделать все возможное, чтобы отобразить всех персонажей, независимо от значения, указанного в lang .
Например, если символы греческого алфавита появляются в середине Текст на английском языке:
Ее сверхспособности были результатом & gamma; -radiation,пояснил он.
пользовательский агент (1) должен попытаться отобразить англоязычный контент в подходящем способ (например, в обращении с кавычками) и (2) должны попытаться отобразить γ, даже если это не английский символ.
См. Раздел не отображаемые символы для соответствующей информации.
8.1.1 Коды языков
Значение атрибута lang — это код языка, который определяет естественный язык, на котором говорят, пишутся или иным образом используется для общения информация среди людей.Компьютерные языки явно исключены из языковые коды.
[RFC1766] определяет и объясняет коды языков, которые должны использоваться в HTML. документы.
Вкратце, языковые коды состоят из основного кода и, возможно, пустого серия субкодов:
language-code = primary-code (субкод "-") *
Вот несколько примеров кодов языков:
- «en»: английский
- «en-US»: английская версия для США.
- «en-cockney»: английская версия кокни.
- «и-навахо»: язык навахо, на котором говорят некоторые коренные американцы.
- «x-klingon»: основной тег «x» указывает на экспериментальный язык. тег
Двухбуквенные первичные коды зарезервированы для языка [ISO639]. сокращения. Двухбуквенные коды включают fr (французский), de (немецкий), it (итальянский), nl (голландский), el (греческий), es (испанский), pt (португальский), ar (арабский), he (Иврит), ru (русский), zh (китайский), ja (японский), hi (хинди), ur (урду) и са (санскрит).
Любой двухбуквенный субкод считается страной [ISO3166]. код.
8.1.2 Наследование кодов языков
Элемент наследует информацию о коде языка согласно следующему порядок приоритета (от самого высокого к низшему):
В этом примере основным языком документа является французский («fr»). Один абзац объявляется на испанском («es»), после чего основной язык возвращается на французский. Следующий абзац включает встроенный японский («ja») фраза, после которой основной язык возвращается на французский.
<ГОЛОВА>Документ многоязычный <ТЕЛО> ... Интерпретируется как французский ...... Переводится как испанский ...
... Снова интерпретируется как французский ...
... Французский текст прерван некоторыми Японский Здесь снова начинается французский ...