Компоненты Semantic Web
Техническую часть Semantic Web составляет семейство стандартов на языки описания, включающее XML, XML Schema, RDF, RDF Schema, OWL, а также некоторые другие. Располагая их в порядке повышения уровня абстракции, реализуемого тем или иным языком, получаем [7].
XML предоставляет синтаксис для определения структуры документа, подлежащего машинной обработке. Синтаксис XML не несет семантической нагрузки.
XML Schemaопределяет ограничения на структуру XML-документа, для того, чтобы обеспечить предсказуемость обработки. Стандартный синтаксический анализатор языка XML в состоянии проверить произвольный XML-документ на соответствие его структуры, так называемой схеме документа, описанной в XML Schema.
RDF представляет собой простой способ описания экземплярных данных в формате субъект-отношение предикат-объект, в котором в качестве любого элемента этой тройки используются только идентификаторы ресурсов. Существует стандартизованное отображение этих троек на XML-документы предопределенной структуры (т.е. консорциумом W3 определена схема XML-документов, содержащих RDF-описания), а также на другие форматы представления (например, в нотацию N3).
RDF Schema (RDF-S) описывает набор атрибутов (здесь их точнее назвать отношениями), таких, как rdfs:Class, для определения новых типов RDF-данных. Языком поддерживается также отношение наследования типов rdfs:subClassOf. Таким образом, RDF Schema описывает свойства, классы и иерархии ресурсов RDF.
OWL (Web Ontology Language) расширяет возможности по описанию новых типов (в частности, добавлением перечислений), а также позволяет описывать новые типы данных RDF Schema в терминах уже существующих (например, определять тип, являющийся пересечением или объединением двух существующих). OWL используется для точного представления значений терминов в словарях и описания взаимосвязей между этими терминами. Это представление терминов и их взаимосвязей называется онтологией. OWL имеет больше механизмов для выражения значений, чем XML, RDF и RDF-S, и он превосходит эти языки по возможности представлять контент, который могут интерпретировать машины.
Вышеперечисленные стандарты можно увидеть на рис. 3.
Рис. 3. Рекомендации W3C касательно Semantic Web
Также стоит выделить следующие технологии.
Унифицированные (или универсальные) идентификаторы ресурсов (URI) – это короткие символьные строки, которые идентифицируют ресурсы в Веб: документы, изображения, загружаемые файлы, сервисы, электронные почтовые ящики и т. п. URI (URL) обеспечивают программам простой доступ к указанным ресурсам.
SPARQL –язык запросов к документам RDF и протокол передачи данных.
В дальнейших лекциях на более подробном уровне рассматриваются некоторые из данных технологий.
Лекция 4
Дата добавления: 2015-12-08; просмотров: 625;