Для поддержки принятия решений
В базе данных интегрированной корпоративной информационной системы накапливается огромный объем информации. Перед менеджерами предприятия встает вопрос: как и для каких целей использовать это море информации? Чаще всего пользователи ограничиваются простыми запросами, например: выдать отчет по всем заказчикам, задерживающим по данным на сегодняшний день оплату отгруженной в их адрес продукции. Но можно поставить и более сложное задание: каков информационный «портрет» (т.е. характерные черты) заказчика, задерживающего оплату? Кто по преимуществу эти заказчики: крупные или малые предприятия? К какой отрасли они чаще всего относятся - транспортники, сельхозпроизводители, связисты? В каких регионах находятся? Есть ли сезонные закономерности в поведении таких недобросовестных заказчиков? И самое главное - есть ли ассоциации (т.е. одновременное присутствие) между перечисленными атрибутами предприятий?
Если удастся получить такой информационный «портрет», то может быть принято решение об особом порядке взаимоотношений с подобными заказчиками - например, требовать от них полную предоплату за выполнение заказа. Вторая задача на два порядка сложнее первой. Если первую задачу можно решить, используя стандартный аппарат запросов к базам данных, то для решения второй придется применить методы интеллектуального анализа данных. Однако результаты решения и первой, и второй задачи можно использовать для поддержки принятия решений.
Выделяют три основные технологии поддержки принятия управленческих решений на основе накопленной информации [29,30]:
- технологии, ориентированные на оперативную (транзакционную) обработку данных и реализованные в большинстве транзакционных систем (OLTP). Сфера действия таких технологий - область детализированных данных. Классические реляционные СУБД нормально справляются с подобными задачами, поэтому в подробном их рассмотрении нет необходимости;
- технологии OLAP (On-line Analytical Processing – интерактивная аналитическая обработка данных), ориентированные на область агрегированных показателей;
- технологии интеллектуальной обработки данных, ориентированные на область закономерностей. Интеллектуальная обработка проводится методами интеллектуального анализа данных (ИАД, в западной литературе - Data Mining [20]). С помощью этих технологий решаются задачи поиска функциональных и логических закономерностей в накопленной информации, объяснения аномалий в данных. Итак, по очереди.
Технологии OLAP основаны на понятии хранилище данных, которое определено родоначальником этого направления Биллом Инмоном (W. Inmon) как «предметно-ориентированное, интегрированное, поддерживающее хронологию собрание данных для поддержки процесса принятия управленческих решений».
Данные в хранилище поступают из оперативных систем (OLTP-систем), из внешних источников, например статистических отчетов, «скачанных» из Интернета прайс-листов других компаний и т.п. Зачем создавать хранилища данных, ведь информация и так находится в файлах оперативных систем? Еще несколько лет назад в качестве главных причин назывались различие форматов хранящихся данных, их разрозненность, локализация в разных местах корпоративной сети. Действительно, до 1998-2000 гг. хранение всех данных на центральном сервере БД было редким явлением.
Сейчас в связи с интенсивным внедрением ИКИС положение меняется. Однако принципиальны такие причины необходимости создания хранилищ данных:
- сложные аналитические запросы к оперативным данным «забирают» ресурсы сервера и тормозят работу информационной системы;
- оперативные данные мало пригодны для непосредственного сложного анализа;
- системы OLTP предназначены для оперативной обработки данных, поэтому они не приспособлены для хранения информации за длительный (более нескольких месяцев) период, в то время как для OLAP интересен анализ объекта «в исторической ретроспективе».
Оперативные корпоративные данные, а также данные из различных внешних источников «очищаются», интегрируются, «складываются» в хранилище, затем готовятся для OLAP-анализа и ИАД.
В основе OLAP лежит наглядная модель данных, организуемая самим пользователем в виде многомерных кубов (гиперкубов).
Осями многомерной системы координат служат атрибуты анализируемого бизнес-процесса (измерения). Данные, количественно характеризующие бизнес-процесс, называются мерами.
Наличие в ERP-системе «встроенной OLAP-аналитики» станет в ближайшие годы важным конкурентным преимуществом ИКИС.
Технологии интеллектуальной обработки данных (ИАД)
ИАД - это процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации). Большинство методов ИАД было первоначально разработано в рамках теории искусственного интеллекта (ИИ) в 70-80-х гг. XX в., но получило распространение только в последние годы, когда проблема обработки быстро растущих объемов корпоративных данных потребовала их использования в качестве надстройки над хранилищами данных.
«Сырьем» для ИАД могут быть плоские таблицы реляционных СУБД. Именно с них и начиналась история ИАД. Во многих случаях более эффективным является применение ИАД к данным, полученным после обработки с помощью OLAP-технологий.
Задачи ИАД классифицируются прежде всего по типам извлекаемой информации, т.е. по видам находимых закономерностей.
Выделяют следующие пять видов.
1. Классификация - позволяет выявить признаки, характеризующие однотипные группы объектов (классы), для того чтобы по известным значениям этих характеристик можно было отнести новый объект к тому или иному классу. Предполагается, что характеристики классов заранее (до анализа) известны. В качестве методов решения задачи классификации применяют алгоритм ближайшего соседа (Nearest Neighbor), индукцию деревьев решений, «обучаемые учителем» нейронные сети [11,21,30].
2. Кластеризация - распространение идеи классификации на более сложный случай, когда сами классы не предопределены. В результате выполнения процедуры кластеризации исходные данные разбиваются на однородные группы (кластеры). Это позволяет предприятию выработать по отношению к каждой из групп (например, к группам покупателей) определенную политику. Задача кластеризации значительно сложнее задачи классификации.
В настоящее время наиболее часто задачи кластеризации решаются методом «обучения без учителя» специального вида нейронных сетей - сетей Кохонена [11,21].
3. Выявление ассоциаций. Ассоциация - закономерность в данных, фиксирующая наступление двух (или более) одновременных событий. Типичный пример ассоциации исследуется в задаче определения пар одновременно покупаемых продуктов (телевизоры и DVD-проигрыватели, зубные пасты и зубные щетки и т.д.).
4. Выявление последовательностей. Последовательность – закономерность в данных, фиксирующая наступление событий не одновременно, а с некоторым определенным разрывом во времени.
Таким образом, ассоциация есть частный случай последовательности с нулевым временным лагом. Так, например, если DVD-проигрыватель не был куплен вместе с телевизором, то в течение месяца после покупки нового телевизора покупка DVD-проигрывателя производится в 51% случаев [30].
5. Прогнозирование - формализованная процедура предсказания, которая на основе исследования текущих и прошлых данных позволяет оценить будущие значения числовых показателей.
В задачах подобного типа наиболее часто используются традиционные методы математической статистики, а также нейронные сети. Из всего многообразия методов, применяемых для решения задач ИАД, наиболее часто применяются нейронные сети (более правильно говорить об искусственных нейронных сетях (ИНС)), моделируемые на ПК, и системы поиска логических правил в данных.
Контрольные вопросы и задачи
10.1. В чём заключается сущность подхода к реализации методологии «синхронное планирование и оптимизация» (СПО) ?
10.2. Охарактеризуйте взаимодействие систем СПО и ERP.
10.3. Дайте краткую характеристику современных технологий, используемых для поддержки принятия управленческих решений.
10.4. На чём основаны технологии OLAP ?
10.5. Назовите основные причины необходимости создания хранилищ данных.
10.6. Дайте определение технологий интеллектуальной обработки данных (ИАД).
Дата добавления: 2015-10-13; просмотров: 796;