Искусственный интеллект

Идеи моделирования человеческого разума известны с древнейших времен. Впервые об этом упоминается в сочинении философа и теолога Раймунда Луллия (около 1235 – 1315) «Великое искусство», который не только высказал идею логической машины для решения разнообразных задач, но и попытался ее реализовать. Рене Декарт (1596 – 1650) и Готфрид Вильгельм Лейбниц (1646 – 1716) независимо друг от друга развивали учение о прирожденной способности ума к познанию и всеобщих и необходимых истин логики и математики, работали над созданием универсального языка классификации всех знаний. Именно на этих идеях базируются теоретические основы создания искусственного интеллекта. Толчком к дальнейшему развитию модели человеческого мышления стало появление в 40-х гг. ХХ в. ЭВМ. В 1948 г. американский ученый Норберт Винер (1894 – 1964) сформулировал основные положения новой науки – кибернетики. В 1956 г. признано новое научное направление, связанное с машинным моделированием человеческих, интеллектуальных функций, и названное искусственным интеллектом.

Вскоре эта отрасль разделилась на два направления: нейрокибернетику и кибернетику «черного ящика».

Нейрокибернетика обратилась к структуре человеческого мозга, как единственно мыслящему объекту и занялась его аппаратным моделированием. Нейрокибернетика занимается созданием элементов, аналогичных нейронам (связанным друг с другом нервным клеткам, составляющим основу мозга), и их объединением в функционирующие системы, названные нейросетями. В середине 80-х гг. ХХ в. в Японии был создан первый нейрокомьютер, моделирующий структуру человеческого мозга. Его основная область применения – распознавание образов.

Для кибернетики «черного ящика» структура модели не важна, важна ее реакция на заданные входные данные. На выходе модель должна реагировать как человеческий мозг. Ученые этого направления занимаются разработкой алгоритмов решения интеллектуальных задач для имеющихся вычислительных систем. Наиболее значимые результаты:

Модель лабиринтного поиска (конец 50-х гг.), в которой рассматривается граф состояний объекта и в нем происходит поиск оптимального пути от входных данных к результирующим. На практике эта модель не нашла широкого применения.

Эвристическое программирование (начало 60-х гг.) разрабатывало стратегии действий на основе заранее известных заданных правил (эвристик). Эвристика – теоретически не обоснованное правило, позволяющее уменьшить количество переборов в поиске оптимального пути.

Методы математической логики. Метод резолюций, позволяющий на основе определенных аксиом автоматически доказывать теоремы. В 1973 г. создан язык логического программирования Пролог, позволяющий обрабатывать символьную информацию.

С середины 70-х гг. реализуется идея моделирования конкретных знаний специалистов- экспертов. В США появляются первые экспертные системы. Возникает новая технология искусственного интеллекта, основанная на представлении и использовании знаний. С середины 80-х гг. искусственный интеллект коммерциализируется. Растут капиталовложения в эту отрасль, появляются промышленные системы, повышается интерес к самообучающимся системам.

База знаний

База знаний – основа любой интеллектуальной системы. В ней хранятся знания, представляющие собой выявленные закономерности предметной области (принципы, связи, законы), позволяющие решать задачи в этой предметной области. Знания – хорошо структурированные данные, или данные о данных (метаданные). С точки зрения искусственного интеллекта знания определяют как формализованную информацию, на которую ссылаются в процессе логического вывода. Существует множество моделей представления знаний, но большинство из них относятся к следующим классам: логические модели; продукционные модели; семантические сети; фреймовые модели.

Формальные логические модели основаны на классическом исчислении предикатов первого порядка, когда предметная область описывается в виде набора аксиом. Вся информация, необходимая для решения задач, рассматривается как совокупность правил и утверждений, которые представляются как формулы в некоторой логике предикатов. Знания отражают совокупность таких формул, а получение новых знаний сводится к реализации процедур логического вывода. Эта логическая модель применима в основном в исследовательских «идеальных» системах, так как предъявляет высокие требования и ограничения предметной области. В промышленных экспертных системах используются ее различные модификации и расширения.

Исследования процессов принятия решения человеком показали, что рассуждая и принимая решение, человек использует продукционные правила (от английского production – правило вывода, порождающее правило). Продукционная модель, основанная на правилах, позволяет представить знания в виде предложений: ЕСЛИ (список условий), ТО (следует выполнить перечень действий). Условие – это предложение, по которому происходит поиск в базе знаний, а действие есть некоторая операция, выполняемая при успешно осуществленном поиске. Действия могут быть как промежуточными, выступающими далее как условия, так и целевыми, завершающими работу ИС. В продукционной модели база знаний состоит из совокупности правил. Программа, управляющая перебором правил, называется машиной вывода. Механизм выводов связывает знания и создает из их последовательности заключение. Вывод бывает прямой (метод сопоставления, от данных к поиску цели) или обратный (метод генерации гипотезы и ее проверки, от цели к данным).

Продукционная модель наглядная, модульная, легко вносятся дополнения и изменения, имеет простой механизм логического вывода, чаще всего используется в промышленных экспертных системах.

Семантика – это наука, исследующая свойства знаков и знаковых систем, их смысловую связь с реальными объектами. Семантическая сеть – это ориентированный граф, вершины которого есть понятия, а дуги – отношения между ними (рис. 4.4.1).

Студент

Технический университет

учится

например имеет частью

Фак-т «информатики»

Кафедра «Моделирование ИС»

Попов

имеет

учится

частью

изучает ведет

Программирование

Учебная дисциплина

это

Рис. 4.4.1. Семантическая сеть

Достоинствами сетевых моделей являются: большие выразительные возможности; наглядность системы знаний, представленной графически; близость структуры сети, представляющей систему знаний, семантической структуре фраз на естественном языке; соответствие современным представлениям об организации долговременной памяти человека. К недостаткам можно отнести то, что сетевая модель не содержит ясного представления о структуре предметной области, которая ей соответствует, поэтому ее формирование и модификация затруднительны; сетевые модели представляют собой пассивные структуры, для их обработки используется специальный аппарат формального вывода. Проблема поиска решения в базе знаний типа семантической сети сводится к задаче поиска фрагмента сети, соответствующего некоторой подсети поставленной задачи, что, в свою очередь, говорит еще об одном недостатке модели – сложности поиска вывода на семантических сетях.

Сетевые модели являются наглядным и достаточно универсальным средством представления знаний. Однако их формализация в конкретных моделях представления, использования и модификации знаний представляет достаточно трудоемкий процесс, особенно при наличии множественных отношений между понятиями.

Термин фрейм (от анг. frame – каркас, рамка) предложен для обозначения структуры единицы знаний, которую можно описать некоторой совокупностью понятий, для ее пространственного восприятия. Фрейм имеет определенную внутреннюю структуру, состоящую из совокупности элементов, называемых слотами. Каждый слот, в свою очередь, представляется определенной структурой данных, процедурой, или может быть связан с другим фреймом. Фреймовая модель представляет собой систематизированную в виде единой теории технологическую модель памяти человека и его сознания. В отличие от других моделей во фреймах фиксируется жесткая структура.

Важным свойством фреймов является наследование свойств, заимствованных из теории семантических сетей. Наследование происходит по АКО – связям (A-Kind-Of= это). Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуется, т.е. переносятся значения аналогичных слотов. Например, в сети фреймов на рис. 4.4.2. «конструктор» наследует свойства фреймов «инженер» и «человек», которые стоят на более высоком уровне иерархии. Модель фреймов достаточно универсальна, позволяет отобразить все многообразие знаний о мире через:

· Фреймы – структуры, для обозначения объектов и понятий (лекция, конспект, кафедра);

· Фреймы – роли (студент, преподаватель, декан);

· Фреймы – сценарии (сдача экзамена, празднование именин, получение стипендии);

· Фреймы – ситуации (тревога, рабочий режим учебного дня) и др.

Человек

АКО умеет

млекопитающее

Инженер

АКО Возраст Имеет

Конструктор