Иллюстрированный самоучитель по Adobe Golive


Используемые символы


А теперь обратимся к политике используемых символов в HTML. Как известно, в компьютерах каждый символ все-таки на самом деле является неким числом. И операционная система при дакэбражеши текста выводит уже символ, соответствующий какому-либо числу. Таблица соответствия чисел и символов называется кодировкой. Но дело в том, что кодировок только для русскоязычных символов уже не менее пяти. И если браузер не распознает, какая кодировка использована гфи создании Web-страницы, то вместо текста пользователь увидит мешанину непонятных символов. Каждый, наверное, с этим встречался. Поэтому в каждый браузер встроена функция смены кодировки отображаемой Web-страницы. Однако язык HTML обладает возможностями указания используемой кодировки, чтобы браузер не пытался распознать ее самостоятельно. Для этих целей используется уже знакомый нам тег <meta>. Дело в том, что среди предбпределенных переменных протокола HTTP есть переменная с наименованием Сontent-Type. Она задает тип содержимого Web-страницы и дополнительно позволяет указывать наименование применяемой кодировки. Полностью соответствующая конструкция выглядит так:

<МЕТА. http-equiv="Content-Type" content="text/html;
charset=ISO-8858-5">

В приведенном примере видно, что значение переменной состоит из двух частей, разделенных знаком точки с запятой. Первая часть говорит о том, что данный документ является обычным текстом с тегами HTML, а вторая часть указывает используемую кодировку. При этом использование слова charset является обязательным. А, после знака равенства указывается уже само название кодировки. В примере использовано стандартная кодировка, утвержденная Международной Организацией по Стандартизации (ISO) с поддержкой кириллицы. Однако вместо нее можно использовать стандартную кириллическую кодировку Windows или КОИ-8.
Также следует указать, что браузеры не могут обычным порядком отображать некоторые символы, которые встречаются в тексте. Так, если браузер в тексте встретит знак неравенства "меньше", то он просто интерпретирует его как открывающую скобку для тега.


А так как стандартного тега за этим знаком не последует, то некоторая часть текста будет просто проигнорирована и не отображена. Более того, некоторые специализированные европейские символы просто отсутствуют на клавиатуре, и их будет затруднительно .вставить в текст содержимого Web-страницы. Проблему необходимо было решить. И выход был найден.
Вместо самих символов в текст подставлялись последовательности, которые можно было уже нормально интерпретировать. Так, знак неравенства "меньше", он же — открывающая угловая скобка, заменяется на последовательность &it;, В данном случае вся последовательность заключена в кавычки, начинается она со знака амперсанта, а заканчивается знаком точки с запятой. Подобные последовательности перекочевали и в язык следующего поколения — XML, и получили название "eatities", что в русскоязычной литературе переводят как "сущности". Перевод, конечно, правильный, но, к сожалению, ничуть не разъясняет суть дела. Проще и, наверное, правильней называть эти сущности текстовыми подстановками. Список текстовых подстановок используемых в HTML приведен в табл. 1.1.

Таблица 1.1. Текстовые подстановки

Символы

Описание
&lt; Знак неравенства "меньше" (<)
&gt ;

Знак неравенства "больше" (>),
&amp; Знак амперсанта (&)
&quot; Знак кавычек
&Agrave Прописная А, тупое ударение
&Aacute Прописная А, сильное ударение
&Acirc Прописная А, диакритическое ударение
&Atilde Прописная А, тильда
&Auml Прописная А, умляут
&Aring Прописная А, звонко» произношение
&agrave Строчная а, тупое ударение
&acute Строчная а, сильное ударение
&acirc Строчная а, диакритическое ударение
&atilde Строчная а, тильда
&auml Строчная а, умляут
&aring Строчная а, звонкое произношение
&Aelig Прописные АЕ, дифтонг
&aelig Строчные ае, дифтонг
&Ccedil Прописная С, седиль
&ccedil Строчная с, седиль
&Egrave Прописная Е, тупое ударение
&Eacute Прописная Е, сильное ударение
&Ecirc Прописная Е, диакритическое ударение
&Еuml Прописная Е, умляут
&egrave Строчная е, тупое ударение
&eacute Строчная е, сильное ударение
&ecirc Строчная е, диакритическое ударение
&euml Строчная е, умляут
&Iacute Прописная I, сильное ударение
&Igrave Прописная I, тупое ударение
&Iuml Прописная I, умляут
&iacute Строчная i, сильное ударение
&igrave Строчная i, тупое ударение
&ticirc Строчная i, диакритическое ударение
&iuml Строчная i, умляут
&ETH Сочетание Eth
&eth Строчные eth
&Ntilde Прописная N, тильда
&ntilde Строчная п, тильда
&Ograve Прописная О, тупое ударение
&Oacute, Прописная О, сильное ударение
&0circ . Прописная О, диакритическое ударение
&0tilde Прописная 0, тильда
&Ouml Прописная О, умляут
&Oslash Прописная О, слэш
&ograve Строчная о, тупое ударение
&oacute Строчная о, сильное ударение
&ocirc Строчная о, диакритическое ударение
&otilde Строчная о, тильда ,
&ouml Строчная о, умляут
&oslash Строчная о, слэш
&Ugrave Прописная U, тупое ударение
&Uacute Прописная U, сильное ударение
&Ucirc Прописная U, диакритическое ударение
&Uuml Прописная U, умляут
&ugrave Строчная и, тупое ударение
&uacute Строчная и, сильное ударение
&ucirc Строчная и, диакритическое ударение
&uuml Строчная и, умляут
&Yacute Прописная Y, сильное ударение
&yacute Строчная у, сильное ударение
&reg Зарегистрированная торговая марка — Trademark
scopy Права собственности - Copyright
Snbsp Неразделяемый пробел
Но подстановки бывают не только текстовыми. Мы можем воспользоваться подстановкой для вставки в текст любогр символа из текущей кодировки, если нам известен его числовой код. Для этого используется конструкция "&#числовой_код;". В подобном формате численных подстановок используется запись числового кода в десятичном виде. Если необходимо использовать шестнадцатеричную запись, то подстановка примет следующий вид: "&#хчисловой_код;", т. е. после знака решетки добавляется латинский символ "икс".



Содержание раздела