Общая структура HTML документа. Базовая структура HTML страницы

Если открыть любую веб-страницу, то она будет содержать в себе типичные элементы, которые не меняются от вида и направленности сайта. В примере 4.1 показан код простого документа, содержащего основные теги.

Пример 4.1. Исходный код веб-страницы

Пример веб-страницы Заголовок

Первый абзац.

Второй абзац.

Скопируйте содержимое данного примера и сохраните его в папке c:\www\ под именем example41.html. После этого запустите браузер и откройте файл через пункт меню Файл > Открыть файл (Ctrl+O) . В диалоговом окне выбора документа укажите файл example41.html. В браузере откроется веб-страница, показанная на рис. 4.1.

Рис. 4.1. Результат выполнения примера

Элемент предназначен для указания типа текущего документа - DTD (document type definition, описание типа документа). Это необходимо, чтобы браузер понимал, как следует интерпретировать текущую веб-страницу, ведь HTML существует в нескольких версиях, кроме того, имеется XHTML (EXtensible HyperText Markup Language, расширенный язык разметки гипертекста), похожий на HTML, но различающийся с ним по синтаксису. Чтобы браузер «не путался» и понимал, согласно какому стандарту отображать веб-страницу и необходимо в первой строке кода задавать .

Существует несколько видов , они различаются в зависимости от версии HTML, на которую ориентированы. В табл. 4.1. приведены основные типы документов с их описанием.

Табл. 4.1. Допустимые DTD DOCTYPE Описание
HTML 4.01
Строгий синтаксис HTML.
Переходный синтаксис HTML.
В HTML-документе применяются фреймы.
HTML 5
В этой версии HTML только один доктайп.
XHTML 1.0
Строгий синтаксис XHTML.
Переходный синтаксис XHTML.
Документ написан на XHTML и содержит фреймы.
XHTML 1.1
Разработчики XHTML 1.1 предполагают, что он постепенно вытеснит HTML. Как видите, никакого деления на виды это определение не имеет, поскольку синтаксис один и подчиняется четким правилам.

Разница между строгим и переходным описанием документа состоит в различном подходе к написанию кода документа. Строгий HTML требует жесткого соблюдения спецификации HTML и не прощает ошибок. Переходный HTML более «спокойно» относится к некоторым огрехам кода, поэтому этот тип в определенных случаях использовать предпочтительнее.

Например, в строгом HTML и XHTML непременно требуется наличие тега , а в переходном HTML его можно опустить и не указывать. При этом помним, что браузер в любом случае покажет документ, независимо от того, соответствует он синтаксису или нет. Подобная проверка осуществляется при помощи валидатора и предназначена в первую очередь для разработчиков, чтобы отслеживать ошибки в документе.

В дальнейшем будем применять преимущественно строгий , кроме случаев, когда это оговаривается особо. Это позволит нам избегать типичных ошибок и приучит к написанию синтаксически правильного кода.

Часто можно встретить код HTML вообще без использования , веб-страница в подобном случае все равно будет показана. Тем не менее, может получиться, что один и тот же документ отображается в браузере по-разному при использовании и без него. Кроме того, браузеры могут по-своему показывать такие документы, в итоге страница «рассыплется», т.е. будет отображаться совсем не так, как это требуется разработчику. Чтобы не произошло подобных ситуаций, всегда добавляйте в начало документа.

Тег определяет начало HTML-файла, внутри него хранится заголовок ( ) и тело документа ( ).

Заголовок документа, как еще называют блок , может содержать текст и теги, но содержимое этого раздела не показывается напрямую на странице, за исключением контейнера .

Тег является универсальным и добавляет целый класс возможностей, в частности, с помощью метатегов, как обобщенно называют этот тег, можно изменять кодировку страницы, добавлять ключевые слова, описание документа и многое другое. Чтобы браузер понимал, что имеет дело с кодировкой UTF-8 (Unicode transformation format, формат преобразования Юникод) и добавляется данная строка.

Пример веб-страницы

Тег определяет заголовок веб-страницы, это один из важных элементов предназначенный для решения множества задач. В операционной системе Windows текст заголовка отображается в левом верхнем углу окна браузера (рис. 4.2).

Рис. 4.2. Вид заголовка в браузере

Тег является обязательным и должен непременно присутствовать в коде документа.

Обязательно следует добавлять закрывающий тег , чтобы показать, что блок заголовка документа завершен.

Тело документа предназначено для размещения тегов и содержательной части веб-страницы.

Заголовок

HTML предлагает шесть текстовых заголовков разного уровня, которые показывают относительную важность секции, расположенной после заголовка. Так, тег представляет собой наиболее важный заголовок первого уровня, а тег служит для обозначения заголовка шестого уровня и является наименее значительным. По умолчанию, заголовок первого уровня отображается самым крупным шрифтом жирного начертания, заголовки последующего уровня по размеру меньше. Теги ... относятся к блочным элементам, они всегда начинаются с новой строки, а после них другие элементы отображаются на следующей строке. Кроме того, перед заголовком и после него добавляется пустое пространство.

Некоторый текст можно спрятать от показа в браузере, сделав его комментарием. Хотя такой текст пользователь не увидит, он все равно будет передаваться в документе, так что, посмотрев исходный код, можно обнаружить скрытые заметки.

Как и любой другой язык программирования, HTML подразумевает некую стандартизированную структуру построения программы, в данном случае - html-документа. Такая структура описывает очередность следования ряда обязательных блоков, которые содержат непосредственно программный код.

Директивы HTML называются «теги» (от англ. tag - отметка). Теги HTML заключаются в угловые скобки, синтаксис их записи в общем виде выглядит как . Все объекты, не заключенные в угловые скобки , интерпретатор воспринимает как текстовые элементы , отображая их на экране компьютера «как есть».

Структура документа HTML выглядит следующим образом (рис. 13).

Рис. 13. Структура HTML документа

У HTML имеется еще одна значительная особенность, отличающая его от других языков программирования: практически все теги данного языка, за исключением некоторых отдельно оговоренных случаев, парные. Такая пара состоит из «открывающего» и «закрывающего» тега, которые отличаются лишь наличием в последнем символа «/» Все, что расположено между откры­вающим и закрывающим тегом, обрабатывается интерпретатором согласно ал­горитму, присвоенному данному конкретному тегу. В общем виде програм-мная строка HTML с открывающим и закрывающим тегами выглядит так:

обрабатываемое значение

Данное свойство HTML позволяет использовать принцип вложения одного тега в другой, когда обрабатываемым значением одной команды может служить другая команда. Вот простой пример вложения двух тегов друг в друга:

обрабатываемое значение

При работе с кодом HTML необходимо запомнить одно простое правило: если где-то в тексте программы встречается открывающий тег, обязательно должен присутствовать и закрывающий. Несоблюдение этого правила вызовет ошибку при обработке такого документа интерпретатором броузера.

Основной, глобальной конструкцией внутреннего кода Web-страницы является «Документ HTML». Для определения этой конструкции существует специальная команда, призванная «объяснить» броузеру, что он имеет дело именно с документом HTML, а не с текстовым или, например, графическим файлом. Такая команда называется «тег верхнего уровня» и записывается как:

Содержимое

Тег верхнего уровня парный, причем его содержимое как раз и есть весь код HTML, составляющий документ. Открывающий тег записывается самой первой строкой html-документа, а закрывающий - самой последней.

Следующим элементом является «Заголовок документа» . Заголовок Web-страницы содержит исчерпывающую информацию о самом документе, а иногда также специальные директивы транслятора, подсказывающие встроенному в броузер интерпретатору HTML правила, по которым следует обрабатывать составляющий страницу код. Cодержимое заголовка не отображается в броузере и не влияет на внешний вид документа. Это служебная информация, которая необходима для корректной работы броузера. Синтаксис тега заголовка в общем виде выглядит так:



Содержимое

Раздел HEAD следует в html-документе непосредственно за тегом и является второй обязательной командой, которую необходимо включать в код Web-страницы.

«Внешний заголовок» является вложенной командой тега . Мнемоника внешнего заголовка записывается следующим образом:

Внешний заголовок

Внешний заголовок отображается в верхнем поле броузера в качестве названия страницы при ее открытии . Значение тега подставляется по умолчанию в соответствующее диалоговое окно, когда пользователь заносит документ в папку «избранное».

Последняя структурная составляющая кода web-страницы - «Тело документа» . Тело документа, описываемое тегами , включает в себя весь основной код разметки страницы, который и определяет отображение html-документа на экране монитора. Основной текст, иллюстрации, элементы навигации и все, что вы хотите продемонстрировать посетителям вашего сайта, размещается внутри данного тега.

Таким образом, обязательные элементы кода документа HTML выглядят так:

Название страницы

HTML - это язык разметки сайта. Многие считают его программированием, но это не так. В HTML нет никаких переменных, вычислений, массивов и других элементов, присутствующих в любом языке программирования.

Пользуясь HTML, разработчик может создать только внешний вид сайта. Важно понимать, что ни один сайт не существует без разметки. HTML является базой создания веб-страниц. Весь остальной функционал добавляется различными языками программирования.

Создание html-документа

Создать простую страничку сайта можно в любом редакторе. Подойдет даже "Блокнот". Для начинающего разработчика рекомендуется использовать другие редакторы, у которых есть функции автоподстановки и другие подсказки. Благодаря этому можно создавать готовые таблицы, ссылки, изображения и другие элементы. А в "Блокноте" каждую букву приходится писать вручную.

Как правило, "Блокнот" используют только в тех случаях, когда под рукой нет других инструментов. Сначала создается текстовый документ, а потом сохраняется в формате html. Все страницы сайта должны быть с расширением html.

Язык html является иерархичным. То есть существует специальная структура html-документа. Что это такое? Рассмотрим ниже для наглядности.

Структура html-документа. Пример

Структура всегда одна и та же. Если вы захотите поменять что-то, браузер не сможет это обработать. В результате вы не получите то, что задумали.

На рисунке выше указана структура любого html-файла. Первый пункт указывает на тип файла. Этот тег указывается один раз. Если вы будете использовать специальные редакторы, то вся структура создастся автоматически. Вам нужно будет подправить стандартные значения.

Структура html-документа - основные теги:

Из этих трех тегов состоит каркас всего сайта. Обратите внимание на рисунок. Все эти теги имеют закрывающийся тег со знаком “/”. Если вы пишете от руки, привыкайте ставить сразу оба тега - открывающий и закрывающий.

Выше было сказано, что страницы сайтов имеют расширение.html. То есть если вы создадите текстовый документ, но при этом напишете правильный код, браузер всё равно отобразит вам просто текст. Никакого преобразования кода не будет.

Раздел head

На рисунке под пунктом 3 указан раздел head. В этом разделе указывается служебная информация. Например, можно указать кодировку (пункт 4) и заголовок страницы (пункт 5).

Заголовок должен быть всегда. Без него ни один поисковик не сможет определить название контента (текста) на веб-странице. А это плохо для продвижения сайта. Более того, в браузере наверху не будет указан заголовок страницы. Это неудобство для пользователя.

Структура html-документа такова, что указывается только в разделе head. Если тег указать в разделе body или после него, то обработчик на него не обратит внимания.

Кроме этого, в разделе head указывается информация для подключения скриптов, файлов стилей, инструкции для поисковых систем или любые другие данные, которые пользователь не должен видеть, но они важны для браузера или программистов.

Подключение стилей

Структура html-документа позволяет подключать стили различными способами. Более того, их можно писать индивидуально в каждом элементе. Но данный способ не рекомендуется, поскольку код становится слишком большим и неудобным.

Подключается файл следующим образом.

В атрибуте href указывается путь до файла. Если в пути будет ошибка, то стили не загрузятся. Также обязателен атрибут type, который указывает, что это файл css.

Другим вариантом является определение стилей прямо в разделе head.

Но этот вариант также не очень рекомендуется. Эти методы сильно отличаются тем, что файл css может быть одним для всего сайта, и все изменения в нем будут мгновенно применяться ко всем страницам. А если вы используете метод, который указан на рисунке выше, то вам придется вносить изменения во все существующие страницы сайта.

Если создаваемый класс будет использоваться только на одной странице, тогда этот вариант вам подходит.

Подключение скриптов

Скрипты подключаются следующим образом.

Здесь обязательны два атрибута: type и src. В первом указываем, что это файл Javascript, а второй - где расположен файл. Если вы допустите опечатку, то ничего работать не будет.

Раздел body

Структура html-документа такова, что размещать содержание, которое будет видно пользователю, нужно только в разделе body. Название тега говорит само за себя.

Здесь указывается весь основной код страницы, который может включать неограниченное число элементов. Но чем длиннее код, тем дольше он будет обрабатываться.

Рассмотрим самые основные теги, которые можно использовать в области body. Основных не так много. Все остальные вы будете узнавать по мере роста ваших знаний и практики.

Основные теги

Структура html-документа требует обязательного порядка написания элементов. Теги всегда должны по краям обрамляться скобками . Без этого браузер не поймет, что это тег. После открывающейся скобки всегда следует имя элемента (тега). Если вы допустите пробел между < и именем, то браузер посчитает это текстом.

Рассмотрим на примере тега изображения. Обратите внимание, что этот тег не закрывающийся, в отличие от ссылок, абзаца и многих других.

Порядок атрибутов не имеет значения. Но их написание (оформление) очень важно. Всегда сначала идет имя атрибута, потом знак равенства, затем в кавычках пишется значение атрибута. Значение может быть разным - цифровое или текстовое.

Атрибут src во всех тегах указывает путь файла, который нужно подгружать. Атрибут alt во всех элементах указывает короткое описание. В данном случае загружается фотография bird.jpg с описанием - фотография птицы.

Кроме этого, в можно было указать размеры, только ширину или высоту, заголовок, выравнивание, класс стиля или рамку.

Рассмотрим другие основные теги, которые указываются в разделе body.

Назначение

Изображения

Перенос текста на новую строку

Жирный текст

Перечеркнутый текст

Подчеркнутый текст

Как всё это можно представить в голове

Начинающие разработчики не всегда сразу могут представить всё это умозрительно. Посмотрите несколько примеров структуры веб-страниц, и тогда вам точно станет понятно.

1.2.2 Структура HTML документаHTML документ состоит из трех основных разделов:
> Раздел HTML документа: Каждый HTML документ должен начинаться открывающим HTML тегом и заканчиваться закрывающим HTML тегом.
.
Эти теги говорят браузеру, о том, что тот текст, который находится между этими двумя тегами является HTML документом.
> Раздел Заголовка (Header Section): раздел начинается с тега и заканчивается тегом . Этот раздел содержит название документа, которое отображается в строке заголовка Web страницы. Сам заголовок включен внутрь тега TITLE, который начинается с и закрывается -
Заголовок имеет очень важное значение. На веб-сайтах часто используются закладки, чтобы отметить этот узел web. Броузер использует "заголовок", чтобы сохранить эту закладку. Также, когда пользователи ищут информацию, заголовок Web-страницы часто является ключевым словом, по которому пользователь осуществляет поиск.
> Раздел тела документа (BODY Section): этот раздел следует после раздела заголовка. Раздел тела документа содержит текст, картинки и ссылки, которые должны отображаться на Web странице. Раздел тела документа начинается с тега и заканчивается тегом .
Пример 2:

Welcome to the world of HTML

This is going to be real fun


Рисунок 1.4 Пример 2
Абзацы
Вы обратили внимание на тег, , в Примере 2? Тег определяет абзац (paragraph).
Когда Вы пишете текст, вы разбиваете содержимое на последовательность параграфов. Абзацы помогают определить логическую структуру документа и применить некоторое форатирорвание к содержимому документа. Тег используется, чтобы отметить начало нового параграфа. Структура HTML-документа

Основные понятия HTML

HTML (HyperText Markup Language) - язык разметки гипертекста - предназначен для создания Web-страниц.

Под гипертекстом в этом случае понимается текст, связанный с другими текстами указателями-ссылками.

HTML представляет собой достаточно простой набор кодов, которые описывают структуру документа. HTML позволяет выделить в тексте отдельные логические части (заголовки, абзацы, списки и т.д.), поместить на Web-страницу подготовленную фотографию или картинку, организовать на странице ссылки для связи с другими документами.

HTML не задает конкретные и точные атрибуты форматирования документа. Конкретный вид документа окончательно определяет только браузер на компьютере пользователя Интернета.

HTML также не является языком программирования, но web-страницы могут включать в себя встроенные программы - скрипты на языках Javascript и Visual Basic Script и программы - апплеты на языке Java .

HTML-документ представляет собой текстовый ASCII-файл, содержащий собственно текст, который должен быть отображен в окне браузера, и команды разметки – HTML-тэги, определяющие внешний вид документа при его интерпретации в окне браузера.

Основными компонентами HTML являются:

HTML-код – уникальная последовательность символов, благодаря которой веб - страница приобретает свой неповторимый внешний вид. Код для веб - страницы – все равно, что ДНК для человека.

Код любой веб - страницы можно просмотреть тремя способами:

1) Вызвать контекстное меню браузера, и выбрать пункт о просмотре исходного кода.

2) Нажать сочетание клавиш Ctrl+U.

3) Открыть страницу с помощью блокнота.

Второй способ не работает в Internet Explorer. А последний способ доступен только в том случае, если страница сохранена на носителе вашего компьютера.

Элемент

Элемент – это основа HTML , звено для построения кода, его неделимая единица. Любой код, который вы напишете для создания веб - страницы, будет состоять из элементов.

Элемент HTML представляет собой символ или сочетание символов.

Примеры элементов: p, br, h1, img, meta, table, strong, address, basefont

Набор применяемых в HTML элементов строго ограничен. В своем коде вы можете использовать только их.

Тегом называется элемент, заключенный в угловые скобки. В коде страниц пишутся именно теги, а не сами элементы. Регистр букв в написании тегов не имеет никакого значения. Т.е. записи и абсолютно идентичны.

HTML-тэг записывается в угловых скобках (< >) и состоит из имени, за которым может следовать список атрибутов (для большинства тэгов необязательный). Имена и атрибуты представляют собой английские слова и аббревиатуры и почти всегда их смысл прозрачен. Записывать тэги можно в любом регистре – прописными или строчными буквами.

Тэги можно разделить на две большие группы.

Тэги одной группы, называемые контейнерами , воздействуют на часть документа, заключенную между ними. Они имеют два компонента: открывающий (начальный) и закрывающий (конечный). Закрывающий тэг имеет то же название, что и открывающий, но перед его названием ставится косая черта (символ /). Между открывающим и закрывающим тэгами могут располагаться текст или другие тэги.

Автономные (одиночные) тэги не имеют конечного компонента. Они вызывают однократное действие или при их интерпретации в отображаемый документ вставляется тот или иной объект. Например, тэг вызывает вставку рисунка из файла pict.gif, расположенного в той же папке, что и сам HTML-документ.

Тэги могут иметь уточняющие параметры – атрибуты. Атрибуты позволяют регулировать способ отображения информации, добавляемой с помощью тега. Атрибуты записываются внутри автономного тэга, а в контейнере только в открывающей части. В списке атрибуты отделяются друг от друга пробелами. Последовательность атрибутов не существенна. Значения атрибутов указываются после знака равенства в кавычках.

Примеры тэгов с атрибутами:

– задает светло-синий фон для документа,

текст – парный тэг, дает указание браузеру вывести заключенный в "контейнер" текст символами, увеличенными относительно базового размера (SIZE="+2") и красного цвета (COLOR="RED").

Структура HTML-документа

Документ HTML всегда начинается с тега и заканчивается закрывающим тегом .

Внутри документа выделяют два основных раздела: раздел заголовков и тело документа, идущие друг за другом.

Раздел заголовков содержит описание параметров, используемых при отображении документа, но не отображающихся непосредственно в окне обозревателя.

Каждый HTML-документ должен иметь заголовок, он показывается отдельно и используется, прежде всего, для идентификации документа (например, при поиске). Тег заголовочной части документа должен быть использован сразу после тэга и более нигде в теле документа. Данный тег представляет собой общее описание документа. Заголовок должен описывать цель документа и содержать не больше 5-6 слов. Практически во всех браузерах заголовок документа виден в верхней части экрана (окна).

Заголовок окна Web - страницы устанавливается внутри контейнера .

Тег предназначен для хранения других элементов, цель которых - помочь браузеру в работе с данными. Также внутри контейнера находятся метатеги, которые используются для хранения информации предназначенной для браузеров и поисковых систем. Например, механизмы поисковых систем обращаются к метатегам для получения описания сайта, ключевых слов и других данных.

Содержимое тега не отображается напрямую на веб-странице, за исключением тега устанавливающего заголовок окна Web - страницы.

Заголовок

Внутри контейнера допускается размещать следующие элементы: , , , , , , , .

Синтаксис:

Раздел тела документа содержит текст, предназначенный для отображения обозревателя, и тэги, указывающие на способ форматирования текста, определяющие графическое оформление документа, задающие параметры гиперссылок и т.д.

Элемент предназначен для хранения содержания Web - страницы (контента), отображаемого в окне браузера. Информацию, которую следует выводить в документе, следует располагать именно внутри контейнера . К такой информации относится текст, изображения, теги, скрипты JavaScript и т.д.

Тег также применяется для определения цветов ссылок и текста на Web - странице.

Часто тег используется для размещения обработчика событий, например, onload , которое выполняется после того, как документ завершил загрузку в текущее окно или фрейм.

Открывающий и закрывающий теги на Web - странице не являются обязательными, однако хорошим стилем считается их использование, чтобы определить начало и конец HTML - документа.

Простейший документ HTML, содержащий все теги, определяющие структуру, имеет вид:

Метатеги

Кроме элемента ... , заголовок может содержать мета – теги ... .

Метатеги - это теги языка HTML, содержащие различную служебную информацию. - тег используется в пределах заголовка страницы и предназначен для того, чтобы включить любую полезную информацию, не определенную другими HTML тегами. Такая информация может быть извлечена серверами/клиентами для использования в идентификации, индексации и создании каталогов страниц. Метатеги размещаются в заголовке страницы (между тегами и ) и имеют формат:

Условно метатеги можно разделить на три группы:

Открывающий тэг включает пары имя = значение, описывающие свойства документа, например, авторство, список ключевых слов и т.д. Эти данные используются также поисковыми серверами при индексации документов.

Тип и кодировка документа: META HTTP-EQUIV = "CONTENT-TYPE"

- кодировка Windows.

Основное назначение этого тега - сообщение браузеру об используемой кодировке. Использовать метатег content-type надо только с учетом некоторых нюансов.

Кодировка символов текста должна соответствовать кодировке, указанной в теге.

Сервер не должен менять кодировку текста при обработке запроса браузера.

Если сервер меняет кодировку текста, он должен скорректировать или удалить мета тег content-type.

Несоблюдение этих требований может привести к следующему: Web - сервер автоматически определит кодировку запроса клиента и отдаст страничку браузеру перекодированной. Браузер, в свою очередь, будет читать документ в соответствии с метатегом content-type. И если кодировки не совпадут, то прочитать документ можно будет только после ряда замысловатых манипуляций.

Некоторые из возможных типов кодировки:

· ISO-8859-1- Latin-1, для большинства западноевропейских языков;

· Windows-1251- Кириллица (Windows);

· KOI8-r- Кириллица (КОИ8-Р);

· cp866- Кириллица (DOS);

· Windows-1252- Западная Европа (Windows);

· Windows-1250- Центральная Европа (Windows).



 

Пожалуйста, поделитесь этим материалом в социальных сетях, если он оказался полезен!