Системы бизнес-аналитики
Системы класса Business intelligence (BI) - это информационные системы, предназначенные для построения отчетов и анализа информации о деятельности предприятия и его окружения в ходе работы над задачами, связанными с принятием решений на основе фактических данных. Системы BI включают также инструменты, используемые для преобразования, хранения, моделирования, доставки и трассировки информации. BI-технологии позволяют анализировать большие объемы информации, заостряя внимание пользователей лишь на ключевых факторах эффективности, моделируя исход различных вариантов действий, отслеживая результаты принятия тех или иных решений. С помощью ИС этого класса лица, принимающие решения, должны при использовании подходящих технологий получать нужные сведения и в нужное время.
Другие возможные и часто встречающиеся переводы термина на русский язык - бизнес-анализ и интеллектуальный анализ данных.
Использование программ финансового анализа позволяет организации:
• ускорить и упростить процесс получения прогнозов развития финансовой ситуации на предприятии. Компьютерная техника позволяет проводить сложные математические вычисления в максимально короткий промежуток времени, причем исключается «человеческий фактор» - ошибки, которые может сделать человек по невнимательности;
• иметь подготовленные на единой методологической основе варианты последствий управленческих решений. Использование комплекса компьютерных моделей позволит формировать единую стратегию финансового управления на предприятии и является стимулом к формированию аналитической службы предприятия как единого законченного подразделения;
• оптимизировать процесс обработки и получения необходимой финансовой информации. Данные для анализа экспортируются из программ бухгалтерского учета, обрабатываются, и сразу же выносится заключение о финансовом состоянии и прогнозная динамика на будущее как в табличной форме, так и, как правило, в виде графиков и диаграмм.
В основе технологии BI лежит организация доступа конечных пользователей и анализ структурированных количественных по своей природе данных и информации о бизнесе. BI порождает итерационный процесс бизнес-пользователя, включающий доступ к данным и их анализ, и тем самым, проявление интуиции, формирование заключений, нахождение взаимосвязей, чтобы эффективно изменять предприятие в положительную сторону. BI имеет широкий спектр пользователей на предприятии, включая руководителей и аналитиков.
Сегодня BI-системы, как правило, включают следующие инструменты: генераторы запросов и отчетов, инструменты добычи данных (data mining), инструменты оперативной аналитической обработки (OLAP) и др.
Генераторы запросов и отчетов - инструменты, предоставляющие пользователям доступ к базам данных, выполняющие некоторый анализ и формирующие отчеты. Запросы могут быть как незапланированными, так и иметь регламентный характер. Современные BI-системы имеют возможности создания рассылок, публикации отчетов на Web, механизмы извещения о событиях или отклонениях.
Добыча данных (data mining) представляет собой процесс обнаружения скрытых корреляций, тенденций, шаблонов, связей и категорий между переменными в больших массивах необработанных данных. Она выполняется путем тщательного исследования данных с использованием технологий распознавания шаблонов, а также статистических и математических методов. При разведке данных многократно выполняются различные операции и преобразования над сырыми данными (отбор признаков, стратификация (расслаивание), кластеризация, визуализация и регрессия), которые предназначены:
1) для нахождения представлений, которые являются интуитивно понятными для людей, которые, в свою очередь, лучше понимают бизнес-процессы, лежащие в основе их деятельности;
2) для нахождения моделей, которые могут предсказать результат или значение определенных ситуаций, используя исторические или субъективные данные.
Английский термин «data mining» не имеет однозначного перевода на русский язык (добыча данных, вскрытие данных, разведка данных, информационная проходка, извлечение данных/информации) поэтому в большинстве случаев используется в оригинале. Наиболее удачным непрямым переводом считается термин «интеллектуальный анализ данных» (ИАД).
Важное положение data mining - нетривиальность разыскиваемых шаблонов. Это означает, что найденные шаблоны должны отражать неочевидные, неожиданные регулярности в данных, составляющие так называемые скрытые знания.
Инструменты data mining позволяют решать следующие задачи:
• классификация - отнесение входного вектора (объекта, события, наблюдения) к одному из заранее известных классов;
• кластеризация - разделение множества входных векторов на группы (кластеры) по степени «похожести» друг на друга;
• сокращение описания - для визуализации данных, лаконизма моделей, упрощения счета и интерпретации, сжатия объемов собираемой и хранимой информации;
• ассоциация - поиск повторяющихся образцов. Например, поиск «устойчивых связей в корзине покупателя» (англ. market basket analysis) -вместе с пивом часто покупают орешки;
• прогнозирование;
• анализ отклонений - например, выявление нетипичной сетевой активности позволяет обнаружить вредоносные программы;
• визуализация - наглядное пользователю представление данных. OLAP (англ. online analytical processing, аналитическая обработка в
реальном времени) - технология обработки информации, включающая составление и динамическую публикацию отчетов и документов. Используется аналитиками для быстрой обработки сложных запросов к базе данных.
Причина использования OLAP для обработки запросов - это скорость. Реляционные базы данных хранят сущности в отдельных таблицах, которые обычно хорошо нормализованы. Эта структура удобна для операционных баз данных, но сложные многотабличные запросы в ней выполняются относительно медленно. Более хорошей моделью для запросов, а не для изменения, является пространственная база данных. OLAP делает мгновенный снимок реляционной базы и структурирует ее в пространственную модель для запросов. Заявленное время обработки запросов в OLAP составляет около 0,1% от аналогичных запросов в реляционную базу данных.
OLAP-структура, созданная из рабочих данных, называется OLAP-куб. Куб создается из соединения таблиц с применением схемы звезды. В центре «звезды» находится таблица фактов, которая содержит ключевые факты, по которым делаются запросы. Множественные таблицы с измерениями присоединены к таблице фактов. Эти таблицы показывают, как могут анализироваться агрегированные реляционные данные. Количество возможных агрегирований определяется количеством способов, которыми первоначальные данные могут быть иерархически отображены.
Пример OLAP-куба представлен на рис. 1.
Каждый срез такого отчета-куба называется измерением. Средства OLAP позволяют исследовать данные по различным произвольным измерениям. Пользователи могут выбрать, какие показатели анализировать, какие измерения и как отображать в отчете, обменять строки и столбцы, сделать срезы и вырезки («slice&dice»), чтобы сконцентрироваться на определенной комбинации размерностей. Можно изменять детальность данных, двигаясь по уровням с помощью детализации и укрупнения («drill down/roll up»), а также кросс-детализации («drill across») через другие измерения.
Рис. 1. OLAP-куб
Отметим, что в отличие от использования OLAP разведка данных в значительно меньшей степени направляется пользователем, вместо этого полагается на специализированные алгоритмы, которые устанавливают соотношение информации и помогают распознать важные (и ранее неизвестные) тенденции, свободные от предвзятости и предположений пользователя. Средства data mining отличаются от средств OLAP тем, что вместо проверки предполагаемых взаимозависимостей, они на основе имеющихся данных могут производить модели, позволяющие количественно оценить степень влияния исследуемых факторов. Кроме того, средства data mining позволяют создавать новые гипотезы о характере неизвестных, но реально существующих отношений в данных (таблица 1).
Кроме перечисленных инструментов, в состав BI могут входить следующие средства анализа: пакеты статистического анализа и анализ временных рядов и оценки рисков; средства моделирования; пакеты для нейронных сетей; средства нечеткой логики и экспертные системы. Дополнительно нужно отметить средства для графического оформления результатов: средства деловой и научно-технической графики; «приборные доски», средства визуализации многомерных данных.
Таблица 1. Примеры формулировок задач при использовании методов OLAP и Data Mining
OLAP | Data Mining |
Каковы средние показатели травматизма для курящих и некурящих? | Какие факторы лучше всего предсказывают несчастные случаи? |
Каковы средние размеры телефонных счетов существующих клиентов в сравнении со счетами бывших клиентов (отказавшихся от услуг телефонной компании)? | Какие характеристики отличают клиентов, которые, по всей вероятности, собираются отказаться от услуг телефонной компании? |
Какова средняя величина ежедневных покупок по украденной и не украденной кредитной карточке? | Какие схемы покупок характерны для мошенничества с кредитными карточками? |
Несмотря на то, что модуль финансового планирования с системами бизнес-аналитики стал устанавливаться уже на системах MRP-II, многие российские предприятия предпочитают пользоваться отечественными разработками систем BI, которые лучше ориентированы под отечественные условия ведения бизнеса. В качестве примера систем бизнес-аналитики отметим российские разработки «ИНЭК-Аналитик», «Audit Expert», «Альт-Финансы», «АБФИ-Предприятие» и западные «титаны» рынка - Business Objects, Cognos, OLAP-сервисы MS SQL Server и др.
Дата добавления: 2019-07-26; просмотров: 642;