ЭЛЕКТРОННАЯ БИБЛИОТЕКА КОАПП |
Сборники Художественной, Технической, Справочной, Английской, Нормативной, Исторической, и др. литературы. |
Спецификация языка HTMLmailto:radik@binep.ac.ru?Subject='From CIT-FORUM.COM' Сервер FREEnet Web Сентябрь 8, 1995 г. Реферат: Документ содержит русский перевод черновой версии спецификации языка гипертекстовой разметки HTML. Перевод выполнен по заказу корпорации " Университетские сети знаний" (УНИКОР) для проведения работ по проекту "Instauratio Magna" , в рамках программы Госкомвуза "Национальная академическая система баз данных и баз знаний высшей школы России". Допустимое использованиеТекст перевода и его отдельные части могут свободно распространяться и быть использованы организациями и отдельными лицами в целях создания и развития информационных систем и средств обработки информации. Не допускается коммерческое использование текста и его отдельных частей, а также распространение его в измененном виде.Примечания редактораПеревод спецификации HTML производился в 1994 году и некоторая информация на момент публикации устарела. По этой причине в оригинальный текст включены примечания (замкнуты в скобках и помечены, как "прим. ред."). Некоторые из них вынесены из текста и размещаются в конце данного документа в разделе "Изменения и дополнения".Текст перевода
Представление текстовой и метаинформации
Проекты Internet являются рабочими документами, действительными не более шести месяцев. Проекты Internet могут быть отменены, обновлены или заменены другими документами в любой момент. Нежелательно делать ссылки на проекты Internet или упоминать их иначе как "рабочие проекты" или "проекты в процессе разработки". Нет ограничений на распространение этого документа. Данный документ является проектом стандарта для обмена информацией в сетях. Желательно посылать Ваши комментарии по адресу timbl@info.cern.ch или же на обсуждение в www-talk@info.cern.ch . Данный текст является версией 1.2 рассматриваемого проекта. Этот документ доступен в гипертекстовом виде в системе World-Wide Web http://info.cern.ch/hypertext/WWW/MarkUp/HTML.html (прим. ред. 1) Язык разметки гипертекста (HyperText Markup Language - HTML) можно использовать для представления:
Описание языка HTML ссылается на спецификацию URL в документах RFC. Реализацию анализаторов и генераторов языка HTML можно найти на различных W3 серверах, в программах просмотра, среди общедоступного исходного кода программы W3. Они также могут быть созданы с использованием различных общедоступных анализаторов SGML, таких, как [SGMLS]. HTML относится к документам типа SGML с очень обобщенной семантикой, пригодной для кодирования информации, получаемой от большого набора прикладных программ. Этот язык является более общим, чем многие другие специфические реализации языка SGML, и вместе с тем он полностью сохраняет независимость от конкретных устройств. Данная спецификация языка использует нижеприведенные слова в заранее определенном значении.
Параграфы, этого документа, отмеченные как замечания, не являются обязательной частью спецификации HTML, а всего лишь пояснением к нему.
Подтип языка HTML определяется как:
Базовый набор символов (SGML BASESET) для языка HTML - это ISO Latin-1. На данный набор могут ссылаться любые обращения к символам. Набор символов, реальный используемый при кодировке HTML документа, может быть ISO Latin 1, или же его 7-битная часть, являющаяся набором ASCII-кодов. HTML документу нет нужды включать какие-либо символы, чей десятичный код превышает 127. Возможно, что такой механизм пересылки, как электронная почта, наложит ограничения на количество битов в байтах кодировки документа, хотя протокол HTTP, используемый в программе W3, всегда позволяет передавать 8-битные данные. Если документ HTML кодируется с использованием 7-битных символов, то для кодировки символов из верхней половины набора ISO Latin-1 могут использоваться механизмы обращений по числовому значению и обращения к объектам. Таким образом, могут быть приготовлены документы, пригодные к пересылке по системам с 7-битными ограничениями. Язык разметки гипертекста (HyperText Makeup Language - HTML) формулируется в терминах языка стандартной обобщенной разметки (Standard Generalized Markup Language - SGML) []. Язык SGML представляет собой метод создания структурированных документов, а также языков для их разметки. В языке SGML каждый документ имеет три части:
Все документы типа HTML придерживаются единых деклараций языка SGML и пролога. Следовательно, реализации программы WorldWide Web в общем случае лишь передают и сохраняют ту часть документа HTML, которая содержит данные. Чтобы создать для обработки на анализаторе SGML объект с документом, необходимо поставить текст HTML DTD перед имеющимися данными. И наоборот, для реализации анализатора языка HTML необходимо лишь воссоздать те части анализатора SGML, которые необходимы для разбора данных, появляющихся вслед за разбором деклараций HTML DTD. Данные представляют собой иерархию элементов. Каждый элемент имеет имя, атрибуты и несет некую информацию. Большинство элементов представлены в документе в виде начальной метки, указывающей имя и атрибуты. Далее следует собственно содержание элемента. И наконец, заканчивает все это конечная метка. Например, <HTML> <TITLE> Простой блок данных </TITLE> <H1> Пример структуры </H1> Обычный параграф <P> <UL> <LI>Первая запись, включающая <A NAME="URI"> текст </A> <LI>Вторая запись </UL> </HTML>(прим.ред. 2) Некоторые элементы языка (такие как P, LI) являются пустыми. Они не имеют поля данных, и ограничиваются лишь начальной меткой. В остальных элементах поле данных представляет собой набор символов
и вложенных элементов. Заметим, что описание HTML DTD фактически накладывает
некие ограничения на количество допустимых вложений - большинство элементов
не могут быть вложены в другие элементы. Ни один из элементов не может
быть вложенным сам в себя рекурсивным образом. Анкеры и выделенные символы
могут быть помещены в другие конструкции.
Каждый элемент начинается с метки, меткой же и заканчивается каждый непустой элемент. Начальные метки выделяются символами < и >, а конечные - символами </ и >. Значение атрибута указывается в виде строки, заключенной в одинарные или двойные кавычки. Чтобы определить значение атрибута, осуществляется анализ данной строки в формате RCDATA (см. ниже). Например, такой подход позволяет представлять символы кавычек в значении атрибута как обращения к символам по числовому значению. Длина строки со значением атрибута после такого анализа не должна превышать 1024 символов.
Например: <!ELEMENT HR - 0 EMPTY> Это означает, что
Ключевое слово CDATA указывает на то, что элемент содержит текст. Текстом
считается любая информация, расположенная до метки завершения. Например,
декларация
Встреченная в тексте комбинация </ идентифицируется как начальный
ограничитель завершающей метки только тогда, когда за ней следует буква.
Но как только начальный ограничитель завершающей метки опознан, текст элемента
CDATA завершается. Следующий пример содержит ошибку:
<!ELEMENT TITLE - - RCDATA> могут содержать любой набор символов в своем тексте. <title>You can even represent </end> tags in RCDATA </title> В декларациях HTML DTD объявлены объекты для символов "менее, чем", "больше, чем" и "амперсанд", а также для каждого символа из набора ISO Latin 1. Так что Вам предоставляется возможность обращаться к символам не только по номеру, но и по имени. Если за строкой & следует буква или цифра, то это обозначает обращение
к объекту. За разграничителем должны следовать имя объекта и точка с запятой.
Например,
Замечание.
Например, декларация
<head>
<!ELEMENT PRE - - (#PCDATA | A | B | I | U | P)+> <!ATTLIST PRE WIDTH NUMBER #implied > Это означает, что элемент PRE состоит из одного или нескольких элементов
или текстов A, B, I, U или P. Пример PRE элемента:
Содержимое предыдущего элемента PRE рассматривается как
Если Вы хотите включить в HTML документ комментарий таким образом, чтобы
он игнорировался анализатором, поставьте перед ним и после него ограничители
<!-- и --> соответственно. Весь текст, расположенный между начальным
ограничителем и символами --, будет игнорироваться. Следовательно, комментарии
не могут быть вложенными. В заключительном ограничителе между -- и символом
> можно вставлять пробелы (но в начальном ограничителе между <! и --
вставки не допускаются). Например,
В языке SGML есть несколько конструкций, которые в HTML будут нежелательны или воспринимаются как ошибка. Ограничитель
Документы старого типа могут содержать лишь данные обычных элементов HEAD и BODY, причем в любом порядке. Это осуждается, но тем не менее, анализаторы должны воспринимать такое построение документа. Обратите внимание также на статус элементов. HEAD Нижеприведенные элементы определяют общие свойства документа. Они должны появляться в элементе HEAD. Порядок элементов значения не имеет.
В противоположность элементу HEAD элемент BODY содержит всю ту информацию, из которой собственно и состоит рассматриваемый документ. Порядок следования элементов здесь именно тот, в каком они предстают перед читателем. См. далее список элементов, применимых в пределах элемента BODY. Анкер - это некий текст, который указывает на начало и/или конец связи в гипертексте. Текст между открывающей и закрывающей метками определяет начало связи или указываемое ею место (или и то, и другое вместе). Метка анкера может иметь следующие атрибуты:
Все приведенные выше атрибуты являются необязательными, хотя для того, чтобы анкер действовал, нужны NAME и HREF. См. также описание LINK. Пример использования анкеров See <A HREF="http://info.cern.ch/">CERN</A>'s information for more details. A <A NAME=serious>serious</A> crime is one which is associated with imprisonment. The Organization may refuse employment to anyone convicted of a <a href="#serious">serious</A> crime. Замечание 1. Универсальные номера для ресурсов (Universal resource numbers
- URN) должны обеспечивать распознавание документа в случае обнаружения
его дубликатов. Должно существовать программное обеспечение клиента, осуществляющее
отсев копий для уже имеющейся информации.
Замечание 2. Атрибут названия для связей (TITLE).
Анкеры и связи используют атрибут метода для указания действий, которые клиент может применять к объектам. Эти действия более точно формулируются в HTTP протоколе, если таковой применяется. Однако этот атрибут, как и атрибут TITLE, в силу некоторых причин может использоваться для повышения информативности соединения. Например, программа чтения может вызывать различные способы визуализации информации в зависимости от разрешенного в атрибуте метода (например, клиент, осуществляющий поиск, может пользоваться различными иконами). Данный элемент предназначен для указания адреса, подписей, авторства и т.д. Элемент появляется часто в начале или конце документа. Типовая обработка элемента. Обычно элемент адреса использует наклонный
шрифт, а также его текст может быть выровнен по правой границе листа. Элемент
адреса применяет символ конца параграфа. Разбивка элемента адреса на отдельные
параграфы не приводит к появлению в самом тексте документа каких-либо пустых
мест. Примеры использования
<ADDRESS>
Элемент BASE позволяет документу самому назначать URL в случаях, когда он может быть прочтен извне (либо переназначить URL, если это необходимо. Прим.ред). Метки URL в документе могут иметь сокращенную форму и указывать смещение относительно некого базового адреса. Где бы не был указан базовый адрес, для работы с сокращенными URL читатель будет применять главный URL, используемый для адресации документа в целом. Элемент BASE может иметь только один атрибут - HREF. (Данный элемент применяется только в элементе HEAD. Прим.ред.) Типовая обработка элемента. Типовая обработка может заключаться в дополнительном смещении текста влево или вправо и/или в использовании наклонного шрифта. Элемент BLOCKQUOTE приводит к разбиению текста на параграфы, а также обычно к появлению пустой строки или пробелов между выделенным блоком и предшествующим/ последующим текстом. Обработка с единым шрифтом может, к примеру, привести к появлению в начале строки символа ">", что соответствует стилю выделения в системе Internet почты. Пример:
Обрабатывается до шести уровней заголовков (Заметим, что узел в гипертексте, как правило, нуждается в меньшем количестве уровней, чем сочинение, чья структура целиком определяется применением заголовков). Элемент заголовка несет в себе все изменения шрифтов, разбиение на параграфы до и после, пробелы, необходимые, например, для обработки заголовка. Язык HTML не требует применения иных средств для выделения символов или разбивки текста на параграфы. Заголовок H1 относится к самому верхнему уровню и рекомендуется в качестве начального для узла в гипертексте. Предполагается, что текст первого заголовка будет соответствовать запросам клиента, уже производящего анализ связанной с этим узлом информации. Это отличает заголовок (heading) от названия (title), которое должно характеризовать данный узел в более широком плане. Элементы заголовка: <H1>, <H2>, <H3>, <H4>, <H5>, <H6>. Было бы отклонением от правил при переходе от заголовка к заголовку пропускать какой-либо уровень, например, ставить после элемента H1 сразу элемент H3. Хотя такая практика и не запрещена, но нежелательна и может привести к странным результатам при написании других реализаций языка HTML. Пример
Замечание об анализаторах. Анализаторы не должны накладывать какие-либо ограничения на порядок элементов-заголовков, даже если при переходе с заголовка на заголовок допускается пропуск промежуточных уровней. (прим.ред. 7) Типовые методы обработки
Эти типовые значения являются всего лишь указанием для анализатора в программе просмотра гипертекста. Клиент может получить опции для самостоятельной настройки стилей. Но при написании документов Вы должны исходить из того, что где бы ни появился элемент заголовка, он будет иметь именно тот эффект, как описано выше. Программа обработки гипертекста обязана автоматически вставлять пробел между элементами, так что необязательно и даже неправильно будет ставить после элемента заголовка символ конца параграфа. IMG: Встроенные изображения Элемент IMG позволяет вставлять информацию из другого документа. Последний обычно является иконкой, маленькой картинкой и т.д. Элемент IMG не предназначен для вставки дополнительного HTML текста. Те анализаторы гипертекста, которые не могут показывать встроенные изображения, элементы IMG игнорируют. Авторам документов следует взять на заметку, что некоторые анализаторы могут показывать (или печатать на принтере) связанные с данным документом изображения, но не встроенные. Если изображение имеет большое значение, может оказаться более разумным создать с ним связь, нежели делать это изображение встроенным в гипертекст. Если же изображение является в значительной степени декоративным, более удобным будет применение элемента IMG. Элемент IMG является пустым (не имеет заключительной метки) и имеет два атрибута:
В тексте анкеров допускается применение элементов IMG. Пример
Заметим, что эта метка обычно автоматически генерируется сервером. Если метка ISINDEX добавлена в документ HTML вручную, то сделавший это клиент предполагает, что данный сервер способен осуществлять поиск в этом документе. Ведь очевидно, что сервер должен обладать такой возможностью: простое добавление элементов <ISINDEX> в документ не способствует успешному выполнению запросов на поиск, если сервер не обладает требуемым для поиска инструментарием! Как правило, элемент используется для указания авторства, соответствующих индексных указателей, словарей, предыдущих и последующих версий документа и т.д. Связи могут формировать некую статичную ветвящуюся структуру, где рассматриваемый документ идентифицируется, например, ссылкой на "родительский", "последующий" и "предыдущий" документы. Серверы также могут не препятствовать установлению ссылок теми клиентами, которые не имеют прав на внесение изменений в сам текст документа.
Эти элементы должны появляться в словаре парами. Появление элемента DT без сопровождающего DD недопустимо. Элемент DL может иметь только один вид атрибута
Типовой метод обработки Пары элементов DT, DD в списке определений начинаются с одной и той же строки. В каждой паре элемент DT стоит слева и занимает примерно треть места на дисплее. Элемент DD стоит справа и занимает оставшиеся две трети. Термин DT обычно занимает достаточно мало места, чтобы уместиться в выделенной ему колонке. Если же термин длиннее, то он будет продолжен на этой строке далее. В этом случае текст элемента DD будет смещен на одну строку вниз, с тем, чтобы не пересечься с термином DT. Либо термин DT может быть разбит на несколько строк в левой колонке. Как правило, даже несмотря на присутствие атрибута COMPACT, между следующими друг за другом парами DT и DD остаются пробелы. Атрибут COMPACT применяется для списков, имеющих большой размер и/или использующих пары элементов DT, DD, которые занимают лишь одну-две строки. Конечно, программа обработки может самостоятельно фиксировать такие случаи и принимать соответствующие решения, что следует поощрять. Атрибут COMPACT может также уменьшать левую колонку (колонку терминов - DT). Пример использования
<DL COMPACT>
Список - это последовательность параграфов, каждому из которых может
предшествовать специальная метка или очередной номер. Синтаксис списка:
Открывающими метками для списка могут быть UL, OL, MENU или DIR. Сразу за открывающей меткой должен следовать первый элемент списка. Типовая обработка Здесь мы не определяем порядок воспроизведения списков, однако должны быть четко оговорены размеченный список для случая неупорядоченных списков и очередь нумерованных параграфов для упорядоченного списка. Среди других возможностей для интерактивного показа списков - встроенные панели скроллинга для ускоренного просмотра. Список элементов, имеющих типовые алгоритмы обработки:
Пример использования
< MENU >
< DIR >
Пустой элемент P служит разделителем параграфов. Конкретная процедура обработки (отступы, инструкции и т.д.) здесь не оговаривается и может зависеть от наличия иных меток, стилей и т.д. Метка <P> ставится между двумя частями текста для их разделения. Нет нужды применять <P> для создания пустого места вокруг заголовка, списка, адреса или выделенных элементов, которые уже сами по себе предполагают наличие разделителей параграфов. Создание пустых мест вокруг перечисленных элементов - обязанность программы обработки. Соседство метки разделителя параграфов и такого элемента, который сам автоматически создает разделители параграфов, может привести к непредсказуемым последствиям. Следует избегать того, чтобы метке разделителя параграфов предшествовал или следовал за ней такой элемент. Типовая обработка Обычно метка <P> создает небольшой вертикальный пропуск между параграфами (одна строка или полстроки). Этого не происходит (как правило) в тексте элементов ADDRESS и (даже) PRE. В некоторых версиях в обычном тексте метка <P> может также создавать небольшой отступ слева в первой строке открываемого ею параграфа. Примеры использования
Примеры ошибок
В языке HTML предварительно отформатированный текст отображается в виде текста, использующего шрифт фиксированной ширины. Необязательный атрибут этого элемента
В пределах элемента PRE:
<PRE WIDTH="80"> This is an example line </PRE> Замечание: выделение текста В пределах предварительно отформатированного элемента горизонтальное смещение должно осуществляться на определенное количество позиций, чья ширина соответствует ширине символа. Это может препятствовать или даже блокировать специальные смещения выделенных элементов. Замечание: границы строки Вышеупомянутый термин "переход на начало следующей строки" не должен восприниматься как предположение о том, что программа обработки предварительно форматированного текста не может применять (фиксированный) левый отступ. Конечно, левый сдвиг ограничен затребованной шириной строки. Примеры использования Примеры приемлемых названий
Примеры неприемлемых заголовков Заголовок, имеющий смысл лишь в случае привязки к конкретному контексту
Все метки выделения имеют соответствующие им завершающие метки, как в этом примере This is <EM>emphasized</EM> text. Практическая реализация одних стилей выделения более очевидна. Для других - менее. Логические стили можно применять в любом месте, если, к примеру, нет нужды ссылаться в тексте на процедуру форматирования (например, "обязательно использование наклонного шрифта для отдельных частей текста"). Замечание Анализаторы, не способные изобразить какой-либо стиль выделения символов, могут представить его с некоторой потерей качества изображения с применением альтернативного стиля или стиля по умолчанию. Некоторые версии анализаторов могут игнорировать все метки, так что поставщикам информации желательно не придавать меткам выделения большую смысловую нагрузку. Имена для этих элементов заимствованы у макросов TeXInfo. Физические стили (лучше использовать термин - типографические. Прим.ред.)
Логические стили
Пример использования
Пустая метка PLAINTEXT завершает документ на языке HTML. Позади этой метки уже не ставятся какие-либо записи на языке SGML. Вместо этого, по старому соглашению протокола HTTP, за меткой Plaintext следует ASCII текст (в стандарте MIME тип данных "text/plain"). Пример использования элемента
Эта метка позволяет читать остаток файла более эффективно и без какого-либо дополнительного анализа. Элемент Plaintext применяется исключительно в целях оптимизации. Заключительная метка у данного элемента отсутствует. Остаток файла не содержит также каких-либо записей на языке SGML. Данные элементы еще находят применение и должны распознаваться применяющимися
в настоящее время анализаторами. С другой стороны, новые серверы должны
использовать вместо этих элементов элемент <PRE>. Стили XMP и LISTING
позволяют включать в документ отдельный кусок текста, состоящий из символов
фиксированной ширины. Синтаксис элементов
Текст, заключенный между начальной и конечной метками, будет изображен с применением шрифта с фиксированной шириной символов. Поэтому будет соблюдаться любое форматирование текста в следующих друг за другом строках, выполненное символами пробела. Между открывающей и закрывающей метками имеет место следующее:
Как и все остальные, эти элементы могут игнорироваться, если нет соответствующего программного обеспечения. Следует заменять их более информативными элементами - см. Выделение символов. Примеры использования
(В последних версиях спецификации HTML этот элемент устранен. прим.ред.) Такой формат текста не поддерживается языком SGML и, таким образом, не является интерпретацией языка HTML. Поставщикам информации следует помнить о том, что разработчики могут менять интерпретацию завершающих меток, вероятно встречающихся в этих элементах. В языке HTML применяются нижеуказанные имена объектов. Этим именам всегда предшествует амперсанд (&), а за ними следует точка с запятой. Объекты представляют конкретные графические символы, имеющие определенное значение при разметке, или же они не относятся к символам, которые не могут быть напечатаны иным образом.
Кроме этих символов допустимы обращения с применением имен из нижеприведенной таблицы к любой из букв набора ISO Latin-1. Данный список заимствован из документа "ISO 8879:1986//ENTITIES Added Latin 1//EN".
HTML DTD ----------------------------------------------------------------
-- Document Type Definition for the HyperText Markup Language as used by the World Wide Web application (HTML DTD). NOTE: This is a definition of HTML with respect to SGML, and assumes an understanding of SGML terms. -- CHARSET BASESET "ISO 646:1983//CHARSET International Reference Version (IRV)//ESC 2/5 4/0" DESCSET 0 9 UNUSED 9 2 9 11 2 UNUSED 13 1 13 14 18 UNUSED 32 95 32 127 1 UNUSED BASESET "ISO Registration Number 100//CHARSET ECMA-94 Right Part of Latin Alphabet Nr. 1//ESC 2/13 4/1" DESCSET 128 32 UNUSED 160 95 32 255 1 UNUSED CAPACITY SGMLREF TOTALCAP 150000 GRPCAP 150000 SCOPE DOCUMENT SYNTAX SHUNCHAR CONTROLS 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 127 255 BASESET "ISO 646:1983//CHARSET International Reference Version (IRV)//ESC 2/5 4/0" DESCSET 0 128 0 FUNCTION RE 13 RS 10 SPACE 32 TAB SEPCHAR 9 NAMING LCNMSTRT "" UCNMSTRT "" LCNMCHAR ".-" UCNMCHAR ".-" NAMECASE GENERAL YES ENTITY NO DELIM GENERAL SGMLREF SHORTREF SGMLREF NAMES SGMLREF QUANTITY SGMLREF NAMELEN 34 TAGLVL 100 LITLEN 1024 GRPGTCNT 150 GRPCNT 64 FEATURES MINIMIZE DATATAG NO OMITTAG NO RANK NO SHORTTAG NO LINK SIMPLE NO IMPLICIT NO EXPLICIT NO OTHER CONCUR NO SUBDOC NO FORMAL YES APPINFO NONE > <!DOCTYPE HTML [ <!-- Jul 1 93 --> <!-- Regarding clause 6.1, SGML Document: [1] SGML document = SGML document entity, (SGML subdocument entity | SGML text entity | non-SGML data entity)* The role of SGML document entity is filled by this DTD, followed by the conventional HTML data stream. --> <!-- DTD definitions --> <!ENTITY % heading "H1|H2|H3|H4|H5|H6" > <!ENTITY % list "UL|OL|DIR|MENU"> <!ENTITY % literal "XMP|LISTING"> <!ENTITY % headelement "TITLE|NEXTID|ISINDEX" > <!ENTITY % bodyelement "P | %heading | %list | DL | HEADERS | ADDRESS | PRE | BLOCKQUOTE | %literal"> <!ENTITY % oldstyle "%headelement | %bodyelement | #PCDATA"> <!ENTITY % URL "CDATA" -- The term URL means a CDATA attribute whose value is a Uniform Resource Locator, as defined. (A URN may also be usable here when defined.) --> <!ENTITY % linkattributes "NAME NMTOKEN #IMPLIED HREF %URL; #IMPLIED REL CDATA #IMPLIED -- forward relationship type -- REV CDATA #IMPLIED -- reversed relationship type to referent data: PARENT CHILD, SIBLING, NEXT, TOP, DEFINITION, UPDATE, ORIGINAL etc. -- URN CDATA #IMPLIED -- universal resource number -- TITLE CDATA #IMPLIED -- advisory only -- METHODS NAMES #IMPLIED -- supported public methods of the object: TEXTSEARCH, GET, HEAD, ... -- "> <!-- Document Element --> <!ELEMENT HTML O O (( HEAD | BODY | %oldstyle)*, PLAINTEXT?)> <!ELEMENT HEAD - - (TITLE? & ISINDEX? & NEXTID? & LINK* & BASE?)> <!ELEMENT TITLE - - RCDATA -- The TITLE element is not considered part of the flow of text. It should be displayed, for example as the page header or window title. --> <!ELEMENT ISINDEX - O EMPTY -- WWW clients should offer the option to perform a search on documents containing ISINDEX. --> <!ELEMENT NEXTID - O EMPTY> <!ATTLIST NEXTID N NAME #REQUIRED -- The number should be a name suitable for use for the ID of a new element. When used, the value has its numeric part incremented. EG Z67 becomes Z68 --> <!ELEMENT LINK - O EMPTY> <!ATTLIST LINK %linkattributes> <!ELEMENT BASE - O EMPTY -- Reference context for URLS --> <!ATTLIST BASE HREF %URL; #IMPLIED > <!ENTITY % inline "EM | TT | STRONG | B | I | U | CODE | SAMP | KBD | KEY | VAR | DFN | CITE " > <!ELEMENT (%inline;) - - (#PCDATA)> <!ENTITY % text "#PCDATA | IMG | %inline;"> <!ENTITY % htext "A | %text"> <!ELEMENT BODY - - (%bodyelement|%htext;)*> <!ELEMENT A - - (%text)> <!ATTLIST A %linkattributes; > <!ELEMENT IMG - O EMPTY -- Embedded image --> <!ATTLIST IMG SRC %URL; #IMPLIED -- URL of document to embed -- > <!ELEMENT P - O EMPTY -- separates paragraphs --> <!ELEMENT ( %heading ) - - (%htext;)+> <!ELEMENT DL - - (DT | DD | P | %htext;)*> <!-- Content should match ((DT,(%htext;)+)+,(DD,(%htext;)+)) But mixed content is messy. --> <!ELEMENT DT - O EMPTY> <!ELEMENT DD - O EMPTY> <!ELEMENT (UL|OL) - - (%htext;|LI|P)+> <!ELEMENT (DIR|MENU) - - (%htext;|LI)+> <!-- Content should match ((LI,(%htext;)+)+) But mixed content is messy. --> <!ATTLIST (%list) COMPACT NAME #IMPLIED -- COMPACT, etc.-- > <!ELEMENT LI - O EMPTY> <!ELEMENT BLOCKQUOTE - - (%htext;|P)+ -- for quoting some other source --> <!ELEMENT ADDRESS - - (%htext;|P)+> <!ELEMENT PRE - - (#PCDATA|%inline|A|P)+> <!ATTLIST PRE WIDTH NUMBER #implied > <!-- Mnemonic character entities. --> <!ENTITY AElig "Æ" -- capital AE diphthong (ligature) --> <!ENTITY Aacute "Á" -- capital A, acute accent --> <!ENTITY Acirc "Â" -- capital A, circumflex accent --> <!ENTITY Agrave "À" -- capital A, grave accent --> <!ENTITY Aring "Å" -- capital A, ring --> <!ENTITY Atilde "Ã" -- capital A, tilde --> <!ENTITY Auml "Ä" -- capital A, dieresis or umlaut mark --> <!ENTITY Ccedil "Ç" -- capital C, cedilla --> <!ENTITY ETH "Ð" -- capital Eth, Icelandic --> <!ENTITY Eacute "É" -- capital E, acute accent --> <!ENTITY Ecirc "Ê" -- capital E, circumflex accent --> <!ENTITY Egrave "È" -- capital E, grave accent --> <!ENTITY Euml "Ë" -- capital E, dieresis or umlaut mark --> <!ENTITY Iacute "Í" -- capital I, acute accent --> <!ENTITY Icirc "Î" -- capital I, circumflex accent --> <!ENTITY Igrave "Ì" -- capital I, grave accent --> <!ENTITY Iuml "Ï" -- capital I, dieresis or umlaut mark --> <!ENTITY Ntilde "Ñ" -- capital N, tilde --> <!ENTITY Oacute "Ó" -- capital O, acute accent --> <!ENTITY Ocirc "Ô" -- capital O, circumflex accent --> <!ENTITY Ograve "Ò" -- capital O, grave accent --> <!ENTITY Oslash "Ø" -- capital O, slash --> <!ENTITY Otilde "Õ" -- capital O, tilde --> <!ENTITY Ouml "Ö" -- capital O, dieresis or umlaut mark --> <!ENTITY THORN "Þ" -- capital THORN, Icelandic --> <!ENTITY Uacute "Ú" -- capital U, acute accent --> <!ENTITY Ucirc "Û" -- capital U, circumflex accent --> <!ENTITY Ugrave "Ù" -- capital U, grave accent --> <!ENTITY Uuml "Ü" -- capital U, dieresis or umlaut mark --> <!ENTITY Yacute "Ý" -- capital Y, acute accent --> <!ENTITY aacute "á" -- small a, acute accent --> <!ENTITY acirc "â" -- small a, circumflex accent --> <!ENTITY aelig "æ" -- small ae diphthong (ligature) --> <!ENTITY agrave "à" -- small a, grave accent --> <!ENTITY amp "&" -- ampersand --> <!ENTITY aring "å" -- small a, ring --> <!ENTITY atilde "ã" -- small a, tilde --> <!ENTITY auml "ä" -- small a, dieresis or umlaut mark --> <!ENTITY ccedil "ç" -- small c, cedilla --> <!ENTITY eacute "é" -- small e, acute accent --> <!ENTITY ecirc "ê" -- small e, circumflex accent --> <!ENTITY egrave "è" -- small e, grave accent --> <!ENTITY eth "ð" -- small eth, Icelandic --> <!ENTITY euml "ë" -- small e, dieresis or umlaut mark --> <!ENTITY gt ">" -- greater than --> <!ENTITY iacute "í" -- small i, acute accent --> <!ENTITY icirc "î" -- small i, circumflex accent --> <!ENTITY igrave "ì" -- small i, grave accent --> <!ENTITY iuml "ï" -- small i, dieresis or umlaut mark --> <!ENTITY lt "<" -- less than --> <!ENTITY ntilde "ñ" -- small n, tilde --> <!ENTITY oacute "ó" -- small o, acute accent --> <!ENTITY ocirc "ô" -- small o, circumflex accent --> <!ENTITY ograve "ò" -- small o, grave accent --> <!ENTITY oslash "ø" -- small o, slash --> <!ENTITY otilde "õ" -- small o, tilde --> <!ENTITY ouml "ö" -- small o, dieresis or umlaut mark --> <!ENTITY szlig "ß" -- small sharp s, German (sz ligature) --> <!ENTITY thorn "þ" -- small thorn, Icelandic --> <!ENTITY uacute "ú" -- small u, acute accent --> <!ENTITY ucirc "û" -- small u, circumflex accent --> <!ENTITY ugrave "ù" -- small u, grave accent --> <!ENTITY uuml "ü" -- small u, dieresis or umlaut mark --> <!ENTITY yacute "ý" -- small y, acute accent --> <!ENTITY yuml "ÿ" -- small y, dieresis or umlaut mark --> <!-- deprecated elements --> <!ELEMENT (%literal) - - CDATA> <!ELEMENT PLAINTEXT - O EMPTY> <!-- Local Variables: --> <!-- mode: sgml --> <!-- compile-command: "sgmls -s -p " --> <!-- end: --> ]>---------------------------------------------------------------- между документами или их частями Статус. Приведенный в этой главе список не является частью стандарта. Его назначение - иллюстрация примеров использования взаимоотношений, а также создание основы для дальнейшего совершенствования языка. Дополнение к этому списку будет осуществляться после регистрации в комитете по языку HTML. При проведении исследований к списку также можно добавлять новые значения, при условии, что их имя начинается с комбинации "X-". Значения атрибута REL для связи в гипертексте имеют именно тот смысл, который мы определили в данном описании, и могут быть обработаны особым образом прикладными программами, использующими язык HTML. Описываемые здесь взаимоотношения определяют связи не просто между анкерами в документах. Они описывают связи между самими документами, как большими независимыми блоками информации, как между объектами. Если некое значение используется для описания взаимоотношения между анкерами, но не между документами, предполагается, что тем не менее указанная семантика применима к упомянутым документам. В последующем описании A - это документ, инициирующий связи, а B - это документ, на который ссылается атрибут HREF анкера. Если взаимоотношение между документами в гипертексте называется ациклическим, то это значит, что оно не содержит цепочек связей, которые, начавшись на каком-либо документе, могли бы вновь на него вернуться. Поэтому связи такого типа могут использоваться для формирования ветвящихся структур. USEINDEX (использование в качестве индекса) В данной ситуации пользователь, читающий документ A, может вызвать функцию поиска. B - это документ, содержащий связную индексную информацию, используемую такой функцией. Документ A может содержать любое количество индексных связей, что позволяет осуществлять поиск на нескольких условиях индексации в зависимости от решения клиента. Документ B должен поддерживать работу поиска в соответствии с протоколом доступа. USEGLOSSARY (использование в качестве словаря) B - это документ, содержащий индексную информацию, которая должна использоваться для удовлетворения запросов о переводе, сделанных в основном документе (как правило, запрос делается при двойном щелчке над словом, которое не находится в пределах анкера). Документ может иметь любое количество связей со словарем. ANNOTATION (аннотация) Информация в документе B является дополнением к документу A и носит вспомогательный характер. Например, аннотация используется клиентом для написания своего рода сносок или иных критических замечаний к документам других людей. Пример: взаимосвязь между блоком новостей и составляющими его статьями. Ациклическая взаимосвязь. REPLY (ответ) Подобна аннотации, однако условия, чтобы документ B служил дополнением к документу A, не ставится. Документы A и B равноправны. Пример: связь между почтовым сообщением и ответом на него, между заметкой с новостями и откликом на нее. Ациклическая взаимосвязь. EMBED (вставка) Если появилась связь такого типа, то информация с узла на ее конце вставляется в исходный документ при его просмотре. Ациклическая взаимосвязь. PRECEDES (предшествование) В упорядоченной структуре, сформированной авторами, документу A предшествует документ B, а за документом B всегда следует документ A. Ациклическая взаимосвязь. Документ может иметь не более одной связи для такого взаимоотношения и/или на него может быть сделана только одна такая ссылка. Замечание: Такое взаимоотношение может управлять вспомогательными средствами навигации, формировать материал для печати и т.д. Совместно с понятием "поддокумент" оно может использоваться для создания ветвящейся структуры, такой как книжка для печати, формирующая гипертекстовой документ. Такой документ может содержать только одну такую ветвящуюся структуру. SUBDOCUMENT (поддокумент) Согласно иерархии, определенной автором, документ B является составной частью документа A. Ациклическое взаимоотношение. PRESENT (присутствие) Если в системе присутствует документ A, то должен присутствовать и документ B. Это подразумевает, что если программа обнаружила документ A, то она должна обязательно найти и документ B. SEARCH (поиск) Когда обнаружена связь такого типа, а документ B в системе отсутствует, последний должен быть найден. Иными словами, когда программа клиента обнаруживает связь, клиенту немедленно предоставляется панель поиска, а на ней искомый текст. Затем осуществляется поиск без промежуточного восстановления и презентации узла B. SUPERSEDES (обновление) Документ B является старой версией документа A. Ациклическое взаимоотношение. HISTORY (история) Документ B представляет собой список версий документа A. Навстречу этой связи из документа A должна существовать связь документа B с документом A и всеми известными его версиями. Эти взаимоотношения выражают семантику не для самих документов, а для затронутых ими тем. INCLUDES (составная часть) Документ A включает документ B, документ B является составной частью документа A. Например, личность, чье описание дано в документе A, состоит в группе, описываемой документом B. Ациклическое взаимоотношение MADE (создание) Например, личность, чье описание дано в узле A, является автором документа B или отвечает за его содержание. Сведения такого типа могут применяться для целей защиты информации, для посылки сообщений авторам и т.д. INTERESTED (заинтересованность) Например, личность, чье описание дано в документе A, выражает заинтересованность в информации из узла B. Данная информация может применяться также для осведомления читателей о произведенных изменениях.
Данный документ был подготовлен при участии и с помощью многих людей, пользующихся данной сетью. Дэн Коннолли (Dan Connolly) приготовил дескриптор DTD, а также часть языков HTML и SGML во время работы в корпорации Convex Computer по адресу 3000 Waterview Parkway Richardson, TX 75083. В настоящее время он работает в Atrium Technology Inc. и не является последним редактором документа.
Изменения и дополнения
Новое местонахождение документов: http://www.acl.lanl.gov/HTML_WG/archives.html
|