История гипертекста и язык разметки HTML

В 1986 г. Международная организация по стандартизации ISO одобрила стандарт SGML ISO-8879. Основанный на языке GML, он позволил отказаться от конкретных способов представления информации и сосредоточить усилия на продумывании структуры документов с помощью правил определения собственных тегов форматирования, их атрибутов и синтаксиса использования. Для создания конкретных прикладных наборов тегов было введено понятие “SGML-приложение”. Так, популярный сегодня язык разметки гипертекста HTML является SGML-приложением.

SGML оказался очень мощным и универсальным. Он требовал точного описания всех нюансов создаваемого синтаксиса документа и подробных правил формирования тегов. В рамках SGML была изобретена концепция DTD (Document Type Definition) — определение типа документа. Она позволила связать конкретные синтаксические правила разбора с заданными способами организации структуры документов, после чего многие компании приступили к активной разработке программ анализа SGML-текстов.

Следующий год вошел в компьютерную историю первой международной конференцией по гипертексту Hypertext’87 и выходом гипертекстовой системы Hypercard для широкого круга пользователей. Ее автором был Билл Аткинсон, сотрудник Apple Computers, разработчик первого графического редактора MacPaint. Он начал создавать Hypercard для собственных нужд, чтобы отслеживать появление своих статей в прессе. Затем Аткинсона заинтересовали алгоритмы эффективного поиска и упаковки данных, и он решил реализовать новые замыслы в общедоступном пакете. Этот фанатичный программист, любимым языком которого был ассемблер, поднимался ежедневно в четыре утра и ухитрился перенести каталог из ста тысяч книжных карт библиотеки Лос-Гейтос в формат Hypercard, в результате чего поиск в Hypercard по запросу к 15-мегабайтной БД сократился с 10 мин до 2 с.

Эта система быстро завоевала популярность у пользователей Apple и устанавливалась на каждый компьютер Mac.

Судьба же системы Xanadu Теодора Нельсона оказалась менее удачной. В 1988 г. компания Autodesk купила основанную им фирму Xanadu Operating, но потеряла интерес к проекту и закрыла его через пять лет.

1989 г. известен появлением идеи Всемирной Сети. Она была предложена (а реализована через два года) Тимом Бернсом Ли, программистом Европейского центра ядерных исследований CERN, расположенного в Женеве. Тогда же он создал и новое SGML-приложение, известное сегодня как язык разметки HTML. А сам SGML расширился стандартизованной ISO таблицей стилей DSSSL (ISO 10179), позволившей дополнять описания структуры SGML-документа независимыми от платформы способами его представления на экране. Через год Бернс Ли написал на Objective-C первый браузер для компьютера NeXT. Браузер включал в себя также первый редактор HTML-документов. А в декабре 1990-го в СССР при Министерстве связи был открыт Научно-технический центр гиперинформационных технологий, известный как ГНТЦ “Гинтех”.

Популярность Сети росла. На следующий год Роберт Каилау, коллега Бернса Ли, сделал браузер Samba для Мака. В Ленинградском электротехническом институте появилась первая версия пакета “ГиперМетод” для DOS одноименной фирмы (которая, кстати, на основе своих разработок устроила к 300-летнему юбилею Санкт-Петербурга живую Интернет-трансляцию с художественной подсветкой самой высокой в городе 310-метровой телевизионной башни).

В 1992 г. Том Брюс распространил первый браузер Cello для компьютеров класса IBM PC, после чего множество компаний начали выпускать собственные Интернет-навигаторы. Это привело к массовой нестыковке, потому что каждый производитель браузеров старался дополнить тогда еще крайне ограниченный HTML своим набором тегов.

В феврале 1993 г. в Национальном центре суперкомпьютерных приложений США под руководством Марка Андриссена был создан браузер Mosaic для Unix, знаменитый первым графическим интерфейсом среди себе подобных. Летом Марк подготовил версии для Мака и Windows. А на следующий год группа разработчиков Mosaic, возглавляемая Джеймсом Кларком, создала собственную корпорацию Netscape Communications (которая вскоре потрясла Уолл-стрит самыми быстрыми в мире темпами роста) и затем выпустила коммерческий браузер Netscape. Современное название Netscape Navigator 2.0 он получил со второй версии, когда в действовавший стандарт HTML эта корпорация добавила множество новых тегов.

Ведущие информационные корпорации, недовольные неразберихой тегов HTML, сформировали в декабре 1994 г. консорциум WWW (W3C), быстро взявший под свой контроль работу практически над всеми стандартами важнейших технологий Сети. Надо отметить, что формально W3C выпускает только рекомендации и некоторые компании их игнорируют, но в целом рекомендации W3C признаются всем рынком в качестве стандартов.

Тем временем была утверждена версия HTML 2.0 — такую ответственность взяла на себя Международная комиссия по стандартам в Интернете (Internet Engineering Task Force), разрабатывавшая сетевые протоколы. Но HTML 2.0 все же оставался SGML-приложением, ориентированным не на более востребованные в практических Web-проектах задачи форматирования текста, а на построение структуры документа.

В феврале 1996 г. Билл Гейтс провозгласил: “HTML стал нашим типом данных”. Это было объявлением войны новому конкуренту, Netscape. Интересно, что всего пару лет назад эксперты Microsoft предлагали руководству обратить серьезное внимание на Интернет, но тогда амбициозные менеджеры корпорации их не послушали. Теперь пришла пора наверстывать упущенное. Впрочем, ошибки допустили и конкуренты Microsoft. Джеймс Кларк не догадался выкупить исключительные права на браузер Mosaic, и его исходные тексты через фирму Spyglass приобрела Microsoft. В результате появившиеся летом обновленные браузеры Netscape Navigator 3.0 и Internet Explorer 3.0 оказались основанными на одном ядре, причем в последнем пакете была реализована поддержка всех тегов конкурента. С этого момента чаша весов стала неуклонно склоняться в его пользу. Вдобавок Microsoft решила распространять Internet Explorer бесплатно, и рыночная доля Netscape Navigator стремительно пошла вниз.

Между тем Дэйв Рэггетт, специалист W3C, трудился над третьей версией HTML 3.0 (известной также как HTML+). Эта спецификация из-за конкуренции между производителями Web-приложений, оказывавших давление на W3C, так и не была закончена, а консорциум сосредоточил усилия не на технологической, а на политической стороне вопроса, стараясь примирить враждовавших разработчиков браузеров. В результате была достигнута договоренность о выпуске в январе 1997-го стандарта HTML 3.2, объединившего наборы тегов, поддерживаемые и Netscape Navigator, и Internet Explorer. На скорейшем выходе HTML 3.2 настаивали также IBM, Novell и Sun.

Не выдержав давления софтверной империи Билла Гейтса, Netscape стала допускать новые ошибки. Все еще веря в собственное влияние на рынок, она не отнеслась с должным вниманием к новой технологии Cascading Style Sheets (CSS, аналог таблиц стилей DSSSL, только для HTML), реализовав ее поддержку в виде не очень удобной технологии JASS (JavaScript Accessible Style Sheets), требовавшей знания программирования. Microsoft же, наоборот, выделила возможность создания сценариев в HTML-документах, предложив пользователям сразу два скрипт-языка — JScript и VBScript. Эта корпорация также начала финансировать подразделение W3C, ответственное за разработку новых рекомендаций HTML, фактически взяв под свой контроль процесс стандартизации браузеров.

CSS мгновенно завоевала популярность. Она позволила разделять логическую структуру HTML-документов и способы их форматирования и отображения на экране. При этом технология CSS оказалась весьма гибкой и дала возможность создавать вложенные (каскадные) стили с иерархической системой подчинения и наследования возможностей. Симпатии пользователей окончательно переместились к браузеру Internet Explorer. А компания Netscape была куплена сетевым гигантом America Online за 8,98 млрд. долл.

Продолжалась подготовка нового стандарта HTML 4.0. Его рабочая версия стала доступной 8 июня 1997 г., а в декабре появилась и официальная рекомендация W3C. Война браузеров и наборов тегов закончилась, поэтому HTML 4.0 оказался на удивление стабильным. Он действует до сего дня, вышла только одна небольшая промежуточная версия 4.01 с исправленными ошибками спецификации. Интересно, что HTML 4 был снова признан W3C языком логической разметки, хотя всего три года назад казалось, что главное назначение этого языка — форматирование документов. Но теперь существовала технология CSS, по поводу которой W3C высказалась однозначно: все, что связано с визуальными аспектами отображения HTML-документа, разработчики должны выносить в CSS-таблицы.

В конце 90-х годов быстро набрал популярность новый язык разметки — XML (о нем будет рассказано в следующий раз). Он представляет собой упрощенный вариант SGML и также позволяет создавать пользовательские XML-приложения.

26 января 2000 г. вышла спецификация нового языка разметки XHTML 1.0, в которую консорциум W3C предложил переносить существующие HTML-материалы. Она была названа “переформулировкой HTML 4.0 в виде приложения XML 1.0” (хотя ранее HTML считался приложением SGML). Разработчики дополнительно получили три DTD-документа для описания типов, определяемых требованиями HTML 4, поэтому теперь можно обрабатывать XHTML-файлы с помощью практически любых XML-анализаторов. Очень важной оказалась возможность создания в XHTML-приложении собственных тегов (ведь XHTML основывается на XML). Да и компании, производящие интеллектуальные телефоны с возможностью выхода в Интернет, пообещали поддержать XHTML в микробраузерах. А W3C назвал XHTML технологией, предназначенной для мягкого перехода с HTML на XML.

 

Программа World Wide Web инициирует каналы передачи связной информации по всему земному шару. Язык HTML предоставляет простой формат для предоставления этой информации. Требуется, чтобы все программы, совместимые с WWW, могли поддерживать язык HTML. Программа WWW использует протокол Internet(протокол передачи гипертекста - HTML), который позволяет передавать кодированную информацию между клиентом и сервером.

Гипертекст и гипермедиа являются для Web фундаментальными технологиями. Гипертекст– это лёгкая в использовании, однако чрезвычайно мощная система связанных слов и фраз, позволяющая осуществлять навигацию между страницами. Эти слова представляют собой перекрёстные ссылки на другие слова на других страницах и обычно выделяются на странице Web более ярким цветом.

Гипермедиа – это среда, основанная на внутренних взаимосвязях. Если немного развить концепцию гипертекста, включив в неё фотографии, видео и звук, получим то, что известно как гипермедиа.

Обычно они присутствуют в каждой странице Web и понятны каждому браузеру Web. Без гипертекста и гипермедиа не было бы World Wide Web.

Язык разметки гипертекста, более известный как HTML, играет роль клея, связывающего Web в единое целое. Каждая страница в Web создана с использованием HTML, поскольку данный язык предоставляет возможности для работы с гипертекстом и гипермедиа. И хотя HTML действительно является языком, это не тот язык, который ассоциируется с компьютерами и разработкой программного обеспечения.

Язык разметки гипертекста формулируется в терминах языка стандартной общей разметки (Standard Generalized Markup Language - SGML). Язык SGML представляет собой метод создания структурированных документов, а также языков для их разметки. Этот язык можно считать противоположностью настоящим языкам программирования, таким, как C, Pascal. Он прост в изучении и использовании; это не столько язык, сколько метод представления документов.

SGML – это глобальный стандарт для описания языков (таких, как HTML). Документы SGML являются программно- и аппаратно-независимыми, они не привязаны к какой-либо конкретной программе, компьютеру или устройству вывода. SGML был одобрен ISO (International Standard Organization – Международная организация стандартов) в 1986г. и является стандартом для многих коммерческих и государственных систем создания документов.

В языке SGML каждый документ имеет три части:

Декларация языка SGML, привязывающие к определённым значениям параметры обработки, а также имена синтаксиса. Например, декларация SGML в описании типа документа HTML объявляет, что строка, с которой начинается метка, - это </, а максимальная длина имени составляет 40 символов.

Пролог, состоящий из одной или нескольких деклараций о типе документа. Они представляют типы элементов, взаимосвязи между элементами и их атрибуты, а также условные обозначения, которые могут быть задействованы при разметке. Декларация HTML DTD, например, указывает, что элемент HEAD содержит, по крайней мере, один элемент TITLE. Данные состоят из разметки документа и собственно информации.

Термин HTML используется для обозначения как типа документа, так и языка разметки для кодировки документов данного типа.

Документ HTML – это обычный текстовый файл, а окончательный вид документа зависит от магических последовательностей символов, вправленных в «настоящий» текст. Подготовка документа в HTML больше похожа на составление программы, чем на работу в настольной издательской системе, поскольку она представляет собой бесконечный цикл переделок исходного HTML-текста в текстовом редакторе, загрузки файла в программу просмотра Web для проверки, как файл выглядит и печатается, определения, в чем состоят проблемы, и возврата в текстовый редактор для внесения исправлений.

Язык разметки гипертекста можно использовать для представления:

· гипертекстовых новостей, почты, сопровождающей информации и сопутствующей гиперсреды;

· меню с опциями;

· результатов запросов к базам данных;

· простых структурированных документов со встроенной графикой;

· гипертекстовых обзоров имеющейся информации.

Язык разметки гипертекста определяет формальный набор правил и процедур для электронной интерпретации и представления подготовительного текста. За основу модели разметки документов в HTML принята теговая модель.

Теговая модель описывает документ как совокупность контейнеров, каждый из которых начинается и заканчивается тегами. Т. е. документ HTML представляет собой не что иное, как обычный ASCII-файл с добавленными в него управляющими HTML-кодами (тегами). Структура HTML-документа и контейнеров языка даёт специальные возможности поисковым машинам WWW для наиболее эффективного поиска информации.

Теги, ограничивающие контейнер, определяют область действия правил интерпретации текстовых элементов документа. Типичным примером такого рода является тег стиля Italic, который определяет область отображения курсива.

Команды форматирования языка HTML, называемые управляющими кодами (tag), представляют собой просто зарезервированные последовательности символов, начинающиеся с < (знака меньше) и заканчивающиеся > (знаком больше). Управляющиеся коды HTML нечувствительны к регистру в отличие от escape-последовательностей специальных символов HTML.








Дата добавления: 2015-09-14; просмотров: 1623;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.014 сек.