4.1.2. Структура языка HTML.
HTML –язык гипертекстовой разметки - состоит из операторов (тегов), которые
окружают некоторый текстовый или графический объект, определяя его расположение,
форму, размеры, цвет, параметры анимации и т.д.
Современные средства разработки страниц типа Microsoft FrontPage дают
возможность из готовых текстовых и графических объектов с помощью кнопок и команд
меню оформить страницы, автоматически расставляя нужные теги.
Однако большинство Web-мастеров используют для своей работы и редакторы, и
написание текстов непосредственно на HTML, чаще всего в "Блокноте" (Notepad) из
Windows.
Документ должен начинаться тегом <HTML> и заканчиваться закрывающим тегом
</HTML>. Между ними должны находится теги <HEAD> открывающий и </HEAD>
закрывающий с названием и заголовком, а также <BODY> открывающий и </BODY>
закрывающий с текстом страницы. Название страницы на латинском языке
ограничивается тегами <TITLE> открывающий и </TITLE> закрывающий.
Таким образом, страница имеет вид:
<HTML> <HEAD> <TITLE> Welcome to my home page </TITLE> </HEAD> <BODY>
Содержимое странички </BODY> </HTML>
В заголовке страницы между тегами <HEAD> и </HEAD> можно указывать тег
<META>. Тег <META> содержит определенную информацию о страничке, на которой он
находится. В нем может содержаться информация, предписывающая броузеру
просматривать эту web-страницу в той или иной кодировке или загружать через
определенное время другую страницу, информация об авторе, о программе, создавшей эту
страницу. Кроме того, тег <META> помогает в навигации в Интернете, т.к. большинство
поисковых систем обрабатывают информацию, специально вставленную в этот тег.
Поэтому рекомендуется использовать этот тег для увеличения посещаемости странички.
Тег имеет очень широкую область применения. Наиболее важные аспекты его применения
перечислены ниже.
В HTML используется набор 8-разрядных однобайтовых символов ISO 8859/1,
который также известен как Латинский алфавит № 1(Latin-1). Это набор из 256 символов,
который содержит много графических элементов и символов с диакритическими знаками,
необходимых для текстов на большинстве европейских языков, в том числе и на
английском. Младшие 128 кодов символов ISO 8859/1 практически те же, что и в ASCII, и
этот поднабор иногда называют International Reference Version, или ISO-646. На практике
из-за ограниченного набора символов клавиатуры и в целях переносимости на другие
процессоры и платформы большинство документов HTML содержат знаки только из
первой половины кодовой таблицы ASCII. В издательской деятельности часто
необходимы многие иные символы, например с диакритическими знаками или
преобразованные другим способом, значки валют, торговой марки и копирайта, не
входящие в набор ASCII. Кроме того, в языке HTML символы угловых скобок < и >
используются как символы, открывающие и закрывающие тег, поэтому они не могут
использоваться в тексте (например для отображения математических выражений). Та же
проблема и с символами "(кавычка) и &(амперсанд). Для отображения таких символов
используются так называемые "escape-последовательности", которые могут
использоваться для кодирования символов, не входящих в таблицу ASCII и входящих в
команды HTML. В спецификациях HTML эти escape-последовательности называются
символьными объектами (character entities).
Escape-последовательность: < > & ".
Отображаемый символ: < > & "
Специальные символы могут также кодироваться цифровой escape-
последовательностью, где число соответствует коду символа ISO 8859.