Представление знаний в компьютере
Информация, с которой имеют дело компьютеры, разделяется на процедурную и декларативную. Процедурная информация выражена в программах, которые выполняются в процессе решения задач, декларативная - в данных, с которыми эти программы работают. В любом случае во внутреннем формате, т.е. на физическом уровне, и программы, и данные представлены в двоичной системе счисления. Это соответствует принципу двоичной системы счисления, введенному в проекте Принстонской машины. Тем не менее, в современной информатике разделяют знания и данные, когда говорят о декларативной информации (объединим знания и данные в понятие информационной единицы). Отличия знаний от данных заключаются в следующих свойствах знаний:
1) внутренняя интерпретируемость. Каждая информационная единица должна иметь уникальное имя, по которому ее находит некоторая процедура обработки или которое использует в запросах пользователь. При переходе к знаниям в память ЭВМ вводится информация о некоторой протоструктуре информационных единиц. В ней указано, в каких элементах памяти компьютера хранятся сведения о конкретных данных, характеризующих предметную область, например, о фамилиях, номерах зачетных книжек. При этом должны быть заданы специальные словари, в которых перечислены имеющиеся в памяти системы данные. Все эти атрибуты могут играть роль имен данных, по которым можно осуществлять поиск нужной информации. В настоящее время СУБД обеспечивают реализацию внутренней интерпретируемости всех информационных единиц, хранящихся в базе данных: имена столбцов являются атрибутами отношений, имена которых указаны в строках. Вместе с информационной единицей в ЭВМ также хранится система имен, принятая для нее в той или иной предметной области. Это позволяет ЭВМ «знать» что хранится в ее памяти и уметь отвечать на вопросы;
2) структурированность(внутренняя связь). Это свойство можно рассматривать как свойство декомпозиции сложных объектов на более простые и установления связей между простыми объектами. Для этого используются иерархические отношения: «род-вид», «класс-подкласс», «часть-целое» и т.п. Отношения этого вида встречаются в иерархических, сетевых, а также и в табличных (реляционных) структурах данных.
Например, для учебного процесса имеет место следующая структура учебной нагрузки студента (рисунок 5.1):
Учебная нагрузка
аудиторная неаудиторная
упражнения лекции лабораторные семинары курсовое самостоятельная
занятия проектирование работа
Рисунок 5.1 – Структура понятия «Учебная нагрузка»
3) связность. Знания отражают закономерности относительно фактов, процессов, явлений и причинно-следственные связи между ними. Семантика этих закономерностей может носить декларативный или процедурный характер. Это свойство практически не имеет аналогов в структурах данных.
Например, две или более информационные единицы могут быть связаны отношением "одновременно", две информационные единицы - отношением "причина - следствие" или отношением "быть рядом". Приведенные отношения характеризуют декларативные знания. Если между двумя информационными единицами установлено отношение "аргумент - функция", то оно характеризует процедурное знание, связанное с вычислением определенных функций. Между информационными единицами могут устанавливаться и иные связи, например, определяющие порядок выбора информационных единиц из памяти или указывающие на то, что две информационные единицы несовместимы друг с другом в одном описании.
4) наличие семантического пространства с метрикой (шкалирование пространства или семантическая метрика). На множестве информационных единиц в некоторых случаях полезно задавать отношение, характеризующее ситуационную близость информационных единиц, т.е. силу ассоциативной связи между информационными единицами. Такое отношение, называемое отношением релевантности, дает возможность выделять в информационной базе некоторые типовые ситуации (например, "экзамен", "учебное занятие"). Отношение релевантности при работе с информационными единицами позволяет находить знания, близкие к уже найденным.
Для фиксации соотношений различных данных используют шкалы. Типичными являются:
Ø метрические – простейшие. С их помощью устанавливаются количественные соотношения и порядок данных. Например, шкала оценок:
|
Ø размытые порядковые. Например, шкала оценки качества учебы студента включает следующие качественные оценки, которые называются лингвистическими переменными:
плохо слабо удовлетворительно хорошо отлично превосходно
Бывает важным связать метрические и размытые порядковые шкалы (говорят – определить значения лингвистических переменных на терм-множествах). Для этого поступают одним из способов:
· порядковую шкалу равномерноразбивают на столько делений, сколько их у метрической шкалы, и устанавливают взаимно-однозначное соответствие между ними;
· привлекают экспертов для разбиения порядковой шкалы на деления и для установления отношения соответствия между метрической и порядковой шкалами;
· используют функцию принадлежности m, которая вводится в теории нечетких множеств, для связывания двух шкал. Тогда, например, mотлично(5) = 1, mотлично(4) = 0,3;
5) активность. С момента появления ЭВМ и разделения используемых в ней информационных единиц на данные и команды создалась ситуация, при которой данные пассивны, а команды активны. Все процессы, протекающие в ЭВМ, инициируются командами, а данные используются этими командами лишь в случае необходимости. При работе со знаниями эта ситуация не приемлема. Как и у человека, в знаниях актуализации тех или иных действий способствуют другие знания, имеющиеся в системе. Таким образом, выполнение программ должно инициироваться текущим состоянием информационной базы. Появление в базе фактов или описаний событий, установление связей может стать источником активности системы. Те или иные процедуры должны активизироваться из-за возникновения некоторой ситуации в данных.
Например, появление в БД факта о том, что студент Х получил двойку по экзамену Y должно вызывать процедуру подготовки приказа на его отчисление.
Существуют два типа методов представления знанийв компьютере: формальные и неформальные (семантические, реляционные) модели.
В отличие от формальных моделей, в основе которых лежит строгая математическая теория, неформальные модели такой теории не придерживаются. Каждая неформальная модель годится только для конкретной предметной области и поэтому не обладает универсальностью, которая присуща моделям формальным. Получение новых знаний (логический вывод) в формальных системах строг и корректен, поскольку подчинен жестким аксиоматическим правилам. Вывод в неформальных системах во многом определяется самим исследователем, который и отвечает за его корректность. Каждому из методов представления знаний соответствует свой способ описания знаний: продукционная модель, сетевая модель, фреймовая модель, логическая модель.
Дата добавления: 2015-02-05; просмотров: 1406;