Семантика - система правил толкования отдельных языковых конструкций. Семантика определяет смысловое значение предложений языка.
КОНЦЕПЦИЯ СЕМАНТИЧЕСКОГО WEB
Сегодня Интернет, в частности Всемирная паутина (Веб, Web), занимает значительное место во всех сферах человеческой деятельности, от образования и науки – до развлечений и рекламы. Вместе с этим, рост объемов информационного наполнения, порожденный популярностью и дешевизной веб-технологий, а также формат представления информации в сети, ориентированный преимущественно на людей и только в некоторых случаях допускает автоматическую обработку программными агентами, приводит к ряду проблем относительно его дальнейшего развития и использования.
Одна из этих проблем касается поиска необходимой пользователю информации, - объемы веб-ресурсов не позволяют оперативно обновлять базу данных информационно-поисковых систем, а вторая – касается выделения “семантики” из большого количества информации. Например, по названию какой-либо конкретной статьи, представленной в Internet, можно найти сотни ссылок на эту статью, в массиве которых сама статья теряется.
Поэтому последующее развитие Internet многие ученые связывают с концепцией Семантического Веб (Semantic Web), которая во многом благодаря унификации обмена данными вероятно даст возможность интегрировать в Internet даже объекты реального мира [1].
Целью изучения дисциплины "Семантический WEB и языки информационного обмена" является ознакомление с современными направлениями развития Web-технологий, в частности концепцией сети нового поколения, которая получила название «Семантический Web», основными языками информационного обмена и их использованием.
Сначала вспомним, в чем разница между понятиями Интернет и Web (WWW)?
Интернет: сеть компьютеров, которые соединены каналами и используют для связи протоколы (TCP/IP). Изобретатели: Vint Cerf и Robert Kahn
Web: сеть сайтов, которые используют гиперссылки для переходов от страницы к странице. Изобретатель: Tim Berners-Lee.
Современная концепция семантического Web
Что же такое “Семантический Web”, почему он так называется, какое его назначение и возможно практическое приложение сегодня и в будущем? Попробуем найти ответы на эти вопросы, но сначала дадим определение (неформальное) понятий синтаксис и семантика.
Синтаксис - набор правил построения фраз языка, что позволяет определить, осмысленные предложения на этом языке.
Семантика - система правил толкования отдельных языковых конструкций. Семантика определяет смысловое значение предложений языка.
Традиционный Web является синтаксическим и представляет собой множество HTML-документов, распределенных в сети и связанных гипертекстовыми ссылками.
Традиционный Web базируется на стандартах языка HTML.
Теперь попробуем дать определение Семантического Web.
Электронная энциклопедия wiki (http://ru.wikipedia.org/wiki/) дает следующее определение Семантического Web:
Семантическая паутина (Semantic Web) — часть глобальной концепции развития сети Интернет, целью которой является реализация возможности машинной обработки информации, доступной во Всемирной паутине. Основной акцент концепции делается на работе с метаданными, которые однозначно характеризуют свойства и содержание ресурсов Всемирной паутины, вместо используемого в настоящее время текстового анализа документов.
Концепцию семантического Web предложил Тим Бернерс-Ли, который назвал его «следующим шагом в развитии Всемирной паутины». В семантической паутине предусматривается использование, во-первых, универсальных идентификаторов ресурсов (URI), а во-вторых — онтологий и языков описания метаданных.
Эта концепция была принята и продвигается W3С. Для ее внедрения предусматривается создание сети документов, которые содержат метаданные о ресурсах Всемирной паутины и существуют параллельно с ними. В то время как сами ресурсы предназначены для восприятия человеком, метаданные используются машинами (поисковыми роботами и другими интеллектуальными агентами) для проведения однозначных логических выводов о свойствах этих ресурсов.
Основная идея этого проекта заключается в организации такого представления данных в сети, чтобы допускалась не только их визуализация, но и их эффективная автоматическая обработка программами разных производителей. Путем таких радикальных превращений концепции уже традиционного Web предусматривается превращение его в систему семантического уровня. По замыслу творцов Семантический Web должен обеспечить “понимание” информации компьютерами, выделение ими наиболее соответствующих по тем или иным критериям данных, и уже после этого – предоставление информации пользователям.
При автоматической обработке информации в рамках Семантического Web сервисы, которые взаимодействуют друг с другом, на основе анализа содержательных связей между объектами и понятиями, которые сохраняются в Сети, должны отбирать лишь ту информацию, которая будет реально полезна пользователям.
Таким образом, семантическую паутину можно рассматривать как надстройку над существующей Всемирной паутиной, которая призвана сделать размещенную в ней информацию понятнее для компьютеров. Машинная обработка возможна в семантической паутине благодаря двум ее важнейшим характеристикам:
- Использование универсальных идентификаторов ресурсов (URI). Традиционная схема использования таких идентификаторов в современном Интернете сводится к установке ссылок на адресуемый объект. Очевидным свойством такой ссылки является возможность «загрузки» объекта, на который она указывает. Таким объектом может быть веб-страница, файл произвольного содержимого, фрагмент веб-страницы, а также неявное указание на обращение к реально существующему физическому ресурсу по протоколу, отличающемуся от HTTP (например, ссылка mailto:). Концепция семантической паутины расширяет это понятие, включая у него ресурсы, недоступные для скачивания. Ресурсами, которые адресуются с помощью URI могут быть, например, отдельные люди, города и другие географические места, художественные артефакты и так далее. К идентификатору предъявляются несколько простых требований: он должен быть строкой определенного формата, уникальным, а также указывать на реально существующий объект.
- Использование онтологий и языков описания метаданных. Современные методы автоматической обработки данных, доступных в Интернете, как правило, базируются на частотном и лексическом анализе текстового содержимого, который прежде всего предназначен для восприятия человеком. В семантической паутине предлагается использовать форматы описаний, доступные для машинной обработки.
Таким образом, в настоящий момент в исследованиях семантического WEB прослеживаются два основных направления:
1. Разработка новых языков представления данных. На сегодняшний день такими языками являются Расширяемый Язык Разметки XML (eXtensible Markup Language) и Средства Описания Ресурсов RDF (Resource Description Framework). Существует также ряд других форматов, однако XML и RDF предоставляют больше возможностей, потому они имеют статус рекомендаций W3C.
2. Разработка онтологии понятий предметных областей. Это направление близко к области искусственного интеллекта, и называется онтологическим подходом. Он включает средства аннотирования документов, которыми могли бы воспользоваться компьютерные программы - веб-сервиси и агенты при обработке сложных запросов пользователя.
Эти два направления Семантического Веб используют три основных языка:
- спецификация XML, которая позволяет определить синтаксис и структуру документов;
- механизм описания ресурсов RDF, что обеспечивает модель кодировки для значений, определенных в онтологии;
- и, наконец, язык сетевой онтологии OWL (Ontology Web Language) на основе стандарта XML, предназначенный для описания классов и отношений между ними, которые свойственны как сетевым документам, так и приложениям. OWL обеспечивает более полную автоматическую обработку сетевого контента, чем та, которую поддерживают XML и RDF, оказывая вместе с формальной семантикой дополнительную семантическую поддержку. При этом сама онтология образует систему, которая состоит из наборов понятий и утверждений об этих понятиях, на основе которых можно строить классы, объекты и отношения. Отдельная онтология определяет семантику конкретной предметной области и способствует установлению связей между значениями ее элементов.
Дата добавления: 2016-04-14; просмотров: 1262;