База знаний и данных
Однозначного определения понятия "знания" не существует. Поэтому будем придерживаться подхода, при котором новое понятие раскрывается через набор его специфических характеристик. Прежде чем раскрыть эти характеристики, введем некоторые предварительные понятия.
Переменная- это объект с априорно неизвестным значением. Часто отождествляют все три понятия:
<переменная> = <о6ъект> = <неизвестное значение>.
Переменная может быть связанной и несвязанной (свободной). В последнем случае переменной не приписано какое-либо конкретное значение. Естественно рассматривать само значение как другой объект определенного типа. С этой точки зрения связанная переменная представляет пару <V1, V2> с исходным объектом V1, представляющим имя переменной, и производным объектом V2, представляющим значение переменной. При этом, как правило, не имеет значения конкретный вид объекта V2. Так, пара <Х, "Петр"> интерпретируется как переменная X, связанная со значением символьной константы "Петр".
Некоторые трудности возникают, когда V2 представляет так называемое автоопределение (рекурсивное определение), например
<Х, Х2 - Х +1 >,
или, в более обычной форме X = Х2 - X + 1. Если последнее интерпретируется как уравнение, то можно вывести, что X = 1.
Если последнее требуется интерпретировать как подстановку (для Х), то следовало писать
< Х, ²X2 - Х +1²> или <X, Y2 - Y + 1>.
В последнем случае необходимо обеспечить допустимость использования замены. Например, недопустима замена X = Y в формулеln(X - Y) = ln(X + Y), что приводит к ln 0 = ln 2Y.
Константа,очевидно, может быть представлена как пара <С, С>,где Ссуть конкретный объект. Обозначение <V, V>со связанной переменной V суть также пример константы. Характеристиками знаний являются следующие.
1. Внутренняя интерпретируемость знанийотождествляется нами с наличием некоторой функции (способа) связывания переменных с теми или иными значениями или иначе, - способом порождения пар <Vi, Vj>. Такая функция или способ называется также интерпретирующей функцией (или просто интерпретацией).
Поскольку данные - это пары вида <С, С>,где С- константа, то, очевидно, для них не требуется интерпретирующая функция (т.к. данные представляют сами себя).
2. Вторая характерная черта знаний - рекурсивная структурированность и связность.Рекурсивная структурированность определяется через понятие концепта. Концепт есть семантическое целое понятий. Понятие Р1 и Р2 образуют семантическое целое, если имеет место какое-то из перечисленных условий:
(А) Р1 и Р2 связаны друг с другом как отношение и один из его аргументов;
(В) Р1 и Р2 связаны друг с другом как действие и его носитель или субъект;
(С) Р1 и Р2 связаны друг с другом как функция и ее аргумент (объект и его свойство).
По индукции следует, что множество P = {P1, P2, ..., Pn} понятий образует семантическое целое, если каждый Рi в Р образует семантическое целое как минимум с одним из Рj, где Pj Î P/{Pi}.
Концепт С есть упорядоченное множество Сi , где Сi - семантическое целое, содержащееся в семантическом целом, представляющем С.
Рассмотрим концепт С: "Студент Петр сдает экзамен по химии". Здесь можно выделить следующие семантические целые:
С1 = <Студент Петр> (объект Петр; свойство -студент)
С2 = <Петр сдает экзамен> (объект Петр; действие - сдает экзамен)
С3 = <Экзамен по химии> (объект экзамен; свойство - по химии)
Таким образом, исходный концепт С образован простым объединением
C = C1 È C2 È C3.
Отметим, что результат не зависит от порядка слагаемых, т.е.
C = C1 È C2 È C3 = C2 È C1 È C3 = C3 È C2 È C1 и т.д.
Рекурсивность операции объединения È показывается элементарно через тождество
Æ È X = X
{a} È X = {a, X} (1.2)
{a, Y} È X = {a} È {X È Y}
3. Семантическое пространство с метрикой.Это свойство знаний связано с возможностью их измерения в системе оценок (метрики) [истинно, ложь]. В системе с нечеткой логикой используется бесконечное множество оценок истинности знания. Например, заключение ЭС вида "завтра ожидается дождь с вероятностью 0,8" не является ни строго истинным, ни строго ложным, т.е. характеризуется определенной степенью правдоподобия.
4. Активность знаний.Это свойство знаний "адаптироваться" под изменяющиеся факты (т.е. способность к обучению и самокоррекции).
5. Функциональная целостность.Под функциональной целостностью знаний понимается их непротиворечивость, независимость исходных посылок и разрешимость. Поскольку понятия непротиворечивости и разрешимости являются фундаментальными понятиями логики, то их рассмотрение вынесено в самостоятельные подразделы. Ограничимся здесь указанием на то, что непротиворечивость знаний означает невозможность появления в базе знаний двух взаимоисключающих фактов и (типа "пациент жив" и "пациент мертв"). Хотя принципиально возможно рассуждение на основе противоречивых посылок, т.к. в настоящее время не существует развитой теории для этого случая. Поэтому мы придерживаемся требований классической логики.
Требование разрешимости заключается в том, что любое истинное знание, формализуемое в базе знаний системы, может быть выведено в ней с помощью машины вывода. Требование разрешимости, к сожалению, не всегда выполнимо. В частности, как показал А. Черч, неразрешима в общем случае логика предикатов, о которой пойдет речь немного ниже.
6. Независимостьозначает невозможность вывода единого знания из другого формальным способом.
7. Ситуативность.Наличие ситуативных связей определяет совместимость тех или иных знаний, хранимых в памяти. В качестве таких связей могут выступать отношения времени, места, действия, причины и пр. Для нас важны модели представления знаний в ЭВМ. При этом основными требованиями к представлению знаний являются однородность представления, простота понимания, непротиворечивость и полнота. В существующей практике получили наибольшее распространение следующие модели знаний:
- логическая;
- модель, основанная на использовании правил (продукционная модель);
- фреймы;
- семантические сети.
Понятие модели
В математике моделью (или реляционной системой) называется некоторое множество М с заданным на нем набором отношений {r1, r2, ..., rn}.Как известно,отношение математически представляется в следующей форме: имя_отношения (список_аргументов).
Когда идет речь о модели знаний, то отнюдь необязательно, чтобы множество М было однородно (состояло только из объектов одной природы). Например, отношение "быть владельцем (х, у)" устанавливает, что х есть владелец у, а экземпляр такого отношения
быть_владельцем (Иван, книга)
имеет дело с объектами разной природы. Важно подчеркнуть, что в общем случае отношение предполагает некоторую процедуру (называемую разрешающей процедурой), которая устанавливает истинность или ложность отношения. Такая процедура может задаваться алгоритмом, правилами, таблицами и иными способами. При этом, всегда стоит вопрос об эффективности (и даже существовании) разрешающей процедуры.
Логические модели
Поскольку логика является основой рассуждений, то ее роль в механизмах вывода является центральной. В самом общем виде логическая модель знаний - это конечное или бесконечное множество отношений логики предикатов первого порядка, называемых просто логическими формулами формул (конечное или бесконечное) логики предикатов первого порядка ( или просто логических формул). Каждая формула логической модели может иметь лишь два значения - истина или ложь.
Для записи формул используется язык, содержащий алфавит и множество правил, согласно которым образуются (правильно построенные) формулы.
Язык логики предикатов задается следующим образом. Алфавит содержит следующие классы символов:
a) переменные, обозначаемые через x, y, z, v, u, ...,
b) константы, обозначаемые посредством a, b, c, d, ...,
c) функциональные символы, представляемые как f, g, h, ...,
d) символы отношений p, q, r, s, ...,
e) символы пропозициональных констант: TRUE (истина) и FALSE (ложь)
f) логические операторы (связки): - (отрицание, НЕ), Ú (дизъюнкция, ИЛИ), & (конъюнкция, И), ® ( импликация, ЕСЛИ ...ТО), « ( эквиваленция, ЕСЛИ И ТОЛЬКО ЕСЛИ)
g) кванторы: $ (существование), " (всеобщности)
h) круглые скобки (,) и запятую ",".
Для конъюнкции используется также символ Ù, а для эквиваленции « или º.
Каждый символ функции и отношения характеризуется числом аргументов данной функции (отношения) называемым местностью (арностью). Например, функция sin(х) является одноместной, f(x2, x, c)- трехместной и т.п.
Далее определим класс термов:
a) переменная есть терм;
b) константа есть терм;
c) если f есть n - местная функция и t1, ..., tn - термы, f(t1, ..., tn) суть также терм.
Логическая формула задается следующей схемой:
a) если p - n - местное отношение и t1, ..., tn - термы, то p(t1, ..., tn) есть формула (называемая атомарной)
b) пропозициональные константы TRUE и FALSE суть формулы
c) если F и G формулы, то формулами также являются ( ), (FÚ G), (F & С), (F®С), (F«С)
d) если F - формула и х - переменная, то ($ х F )и ("х Р ) - также формулы.
Для упрощения записи логических формул часто отбрасывают скобки, используя отношение порядка (старшинства) между логическими операторами и кванторами. Так, будем считать, что -, $, " связывают сильнее, чем &, который в свою очередь связывает сильнее оператора Ú, а последний связывает сильнее, чем операторы ®, «.
Поэтому формулу
("y ("x ((p(x) & ( (y)))® ( (x)Ú (AÚB))))) (1.3)
можно представить в виде
"y ("x (p(x) & ( (y))® (x)Ú AÚB) (1.4)
Рассмотрим, как представляются знания о предметной области на основе логических формул. Предложение: " Для всех х, если х студент, то сдает экзамены х " может быть представлено как
"x (P(x) ® Q(x)),
где Р- эквивалентно Студент;
Q - эквивалентно Сдает-экзамены.
Следовательно, в эквивалентной нотации, можно записать: "x (Студент (x) ® Сдает-экзамены (x)).
Предложение: "Только артисты восхищаются артистами" получает представление в виде:
" x" y (B(y, x) & A(x)® A(y)),
где А(х) - "x есть артист", В(у, х) - "у восхищается х".
Утверждение ассоциативности арифметической операции сложения имеет следующее формальное представление:
" x" y" z ((x +y) + z = x + (y + z))
Отметим, что последнее выражение с точки зрения правил построения формул логики предикатов следовало записать в виде:
" x" y" z E ((fadd(fadd(x, y), z) fadd(x, fadd(y, z)))),
где Е - предикат равенства ( = );
fadd - двухместная функция сложения;
fadd (t1, t2) - терм, представляющий сумму термов t1 и t2.
Как видим, последнее представление значительно менее наглядное.
Отличительными чертами логических моделей являются единственность теоретического обоснования и возможность реализации системы формально точных определений и выводов. Основными задачами, решаемыми на логических моделях, являются следующие:
- установить или опровергнуть выводимость некоторой формулы (в общем случае эта задача алгоритмически неразрешима);
- доказательство полноты/неполноты некоторой формально логической системы, представленной множеством логических формул;
- установление выполнимости системы логических формул (нахождение интерпретирующей функции) или отыскание контрпримера, опровергающего их;
- определение следствий из заданной системы формул;
- доказательство эквивалентности двух формально-логических систем;
- поиск решения задачи на основе доказательства теоремы существования решения и др.
Дата добавления: 2016-03-05; просмотров: 1157;