Семантика - система правил толкования отдельных языковых конструкций. Семантика определяет смысловое значение предложений языка.

КОНЦЕПЦИЯ СЕМАНТИЧЕСКОГО WEB

Сегодня Интернет, в частности Всемирная паутина (Веб, Web), занимает значительное место во всех сферах человеческой деятельности, от образования и науки – до развлечений и рекламы. Вместе с этим, рост объемов информационного наполнения, порожденный популярностью и дешевизной веб-технологий, а также формат представления информации в сети, ориентированный преимущественно на людей и только в некоторых случаях допускает автоматическую обработку программными агентами, приводит к ряду проблем относительно его дальнейшего развития и использования.

Одна из этих проблем касается поиска необходимой пользователю информации, - объемы веб-ресурсов не позволяют оперативно обновлять базу данных информационно-поисковых систем, а вторая – касается выделения “семантики” из большого количества информации. Например, по названию какой-либо конкретной статьи, представленной в Internet, можно найти сотни ссылок на эту статью, в массиве которых сама статья теряется.

Поэтому последующее развитие Internet многие ученые связывают с концепцией Семантического Веб (Semantic Web), которая во многом благодаря унификации обмена данными вероятно даст возможность интегрировать в Internet даже объекты реального мира [1].

Целью изучения дисциплины "Семантический WEB и языки информационного обмена" является ознакомление с современными направлениями развития Web-технологий, в частности концепцией сети нового поколения, которая получила название «Семантический Web», основными языками информационного обмена и их использованием.

Сначала вспомним, в чем разница между понятиями Интернет и Web (WWW)?

Интернет: сеть компьютеров, которые соединены каналами и используют для связи протоколы (TCP/IP). Изобретатели: Vint Cerf и Robert Kahn

Web: сеть сайтов, которые используют гиперссылки для переходов от страницы к странице. Изобретатель: Tim Berners-Lee.

 

Современная концепция семантического Web

Что же такое “Семантический Web”, почему он так называется, какое его назначение и возможно практическое приложение сегодня и в будущем? Попробуем найти ответы на эти вопросы, но сначала дадим определение (неформальное) понятий синтаксис и семантика.

Синтаксис - набор правил построения фраз языка, что позволяет определить, осмысленные предложения на этом языке.

Семантика - система правил толкования отдельных языковых конструкций. Семантика определяет смысловое значение предложений языка.

 

Традиционный Web является синтаксическим и представляет собой множество HTML-документов, распределенных в сети и связанных гипертекстовыми ссылками.

Традиционный Web базируется на стандартах языка HTML.

 

Теперь попробуем дать определение Семантического Web.

Электронная энциклопедия wiki (http://ru.wikipedia.org/wiki/) дает следующее определение Семантического Web:

Семантическая паутина (Semantic Web) — часть глобальной концепции развития сети Интернет, целью которой является реализация возможности машинной обработки информации, доступной во Всемирной паутине. Основной акцент концепции делается на работе с метаданными, которые однозначно характеризуют свойства и содержание ресурсов Всемирной паутины, вместо используемого в настоящее время текстового анализа документов.

 

Концепцию семантического Web предложил Тим Бернерс-Ли, который назвал его «следующим шагом в развитии Всемирной паутины». В семантической паутине предусматривается использование, во-первых, универсальных идентификаторов ресурсов (URI), а во-вторых — онтологий и языков описания метаданных.

Эта концепция была принята и продвигается W3С. Для ее внедрения предусматривается создание сети документов, которые содержат метаданные о ресурсах Всемирной паутины и существуют параллельно с ними. В то время как сами ресурсы предназначены для восприятия человеком, метаданные используются машинами (поисковыми роботами и другими интеллектуальными агентами) для проведения однозначных логических выводов о свойствах этих ресурсов.

Основная идея этого проекта заключается в организации такого представления данных в сети, чтобы допускалась не только их визуализация, но и их эффективная автоматическая обработка программами разных производителей. Путем таких радикальных превращений концепции уже традиционного Web предусматривается превращение его в систему семантического уровня. По замыслу творцов Семантический Web должен обеспечить “понимание” информации компьютерами, выделение ими наиболее соответствующих по тем или иным критериям данных, и уже после этого – предоставление информации пользователям.

При автоматической обработке информации в рамках Семантического Web сервисы, которые взаимодействуют друг с другом, на основе анализа содержательных связей между объектами и понятиями, которые сохраняются в Сети, должны отбирать лишь ту информацию, которая будет реально полезна пользователям.

 

Таким образом, семантическую паутину можно рассматривать как надстройку над существующей Всемирной паутиной, которая призвана сделать размещенную в ней информацию понятнее для компьютеров. Машинная обработка возможна в семантической паутине благодаря двум ее важнейшим характеристикам:

  • Использование универсальных идентификаторов ресурсов (URI). Традиционная схема использования таких идентификаторов в современном Интернете сводится к установке ссылок на адресуемый объект. Очевидным свойством такой ссылки является возможность «загрузки» объекта, на который она указывает. Таким объектом может быть веб-страница, файл произвольного содержимого, фрагмент веб-страницы, а также неявное указание на обращение к реально существующему физическому ресурсу по протоколу, отличающемуся от HTTP (например, ссылка mailto:). Концепция семантической паутины расширяет это понятие, включая у него ресурсы, недоступные для скачивания. Ресурсами, которые адресуются с помощью URI могут быть, например, отдельные люди, города и другие географические места, художественные артефакты и так далее. К идентификатору предъявляются несколько простых требований: он должен быть строкой определенного формата, уникальным, а также указывать на реально существующий объект.
  • Использование онтологий и языков описания метаданных. Современные методы автоматической обработки данных, доступных в Интернете, как правило, базируются на частотном и лексическом анализе текстового содержимого, который прежде всего предназначен для восприятия человеком. В семантической паутине предлагается использовать форматы описаний, доступные для машинной обработки.

 

Таким образом, в настоящий момент в исследованиях семантического WEB прослеживаются два основных направления:

1. Разработка новых языков представления данных. На сегодняшний день такими языками являются Расширяемый Язык Разметки XML (eXtensible Markup Language) и Средства Описания Ресурсов RDF (Resource Description Framework). Существует также ряд других форматов, однако XML и RDF предоставляют больше возможностей, потому они имеют статус рекомендаций W3C.

2. Разработка онтологии понятий предметных областей. Это направление близко к области искусственного интеллекта, и называется онтологическим подходом. Он включает средства аннотирования документов, которыми могли бы воспользоваться компьютерные программы - веб-сервиси и агенты при обработке сложных запросов пользователя.

Эти два направления Семантического Веб используют три основных языка:

- спецификация XML, которая позволяет определить синтаксис и структуру документов;

- механизм описания ресурсов RDF, что обеспечивает модель кодировки для значений, определенных в онтологии;

- и, наконец, язык сетевой онтологии OWL (Ontology Web Language) на основе стандарта XML, предназначенный для описания классов и отношений между ними, которые свойственны как сетевым документам, так и приложениям. OWL обеспечивает более полную автоматическую обработку сетевого контента, чем та, которую поддерживают XML и RDF, оказывая вместе с формальной семантикой дополнительную семантическую поддержку. При этом сама онтология образует систему, которая состоит из наборов понятий и утверждений об этих понятиях, на основе которых можно строить классы, объекты и отношения. Отдельная онтология определяет семантику конкретной предметной области и способствует установлению связей между значениями ее элементов.

 








Дата добавления: 2016-04-14; просмотров: 1262;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.011 сек.