Интегрированная система комплексного статистического анализа и обработки данных STATISTICA
Пакет STATISTICA является интегрированной системой комплексного статистического анализа и обработки данных в среде Windows. Пакет содержит следующие основные компоненты, объединенные в рамках одной системы:
1. Электронные таблицы для ввода и задания исходных данных, а также специальные таблицы для вывода численных результатов анализа;
2. Мощная графическая системы для визуализации данных и результатов статистического анализа;
3. Набор специализированных статистических модулей, в которых собраны группы логически связанных между собой статистических процедур;
4. Специальный инструментарий для подготовки отчетов;
5. Встроенные языки программирования, которые позволяют пользователю расширить стандартные возможности системы.
Версия ПСП STATISTICA 5.0. вышла в конце 1995 года и отличается более удобным пользовательским интерфейсом, а также наличием некоторых дополнительных модулей. При описании ПСП STATISTICA мы будем ориентироваться именно на эту версию.
Пакет STATISTICA включает в себя следующие специализированные модули:
1. Основные статистики и таблицы;
2. Непараметрическая статистика;
3. Дисперсионный анализ;
4. Множественная регрессия;
5. Нелинейное оценивание;
6. Анализ временных рядов и прогнозирование;
7. Кластерный анализ;
8. Факторный анализ;
9. Дискриминантный функциональный анализ;
10.Анализ длительностей жизни;
11.Каноническая корреляция;
12.Моделирование структурных уравнений;
13.Контроль качества;
14.Анализ процессов;
15.Планирование эксперимента (этот и два предыдущих модуля объединены в группу «Промышленная статистика»).
Из приведенного перечня понятно, что, по сравнению с ПСП SPSS Base 8.0, пакет STATISTICA 5.0 имеет более широкую сферу применения, однако в плане основных статистических процедур анализа оба пакета во многом идентичны. Так, в ПСП STATISTICA в состав модуля «Основные статистики и таблицы» входят те же группы статистических процедур дескриптивной статистики, что и в SPSS: описательные статистики, группировки, разведочный анализ.
Идентичны и функции этих процедур: в ПСП STATISTICA можно вычислить практически все описательные статистики, включая медиану, моду, квартили, процентили, средние и стандартные отклонения, доверительные интервалы для среднего, коэффициенты асимметрии, эксцесса и т.п. Проведению разведочного анализа способствует широкий выбор графиков, в том числе ящичковые диаграммы (боксплоты). Практически все описательные статистики могут быть вычислены для данных, разделенных на группы с помощью одной или нескольких группирующих переменных.
Проблеме классификации в ПСП STATISTICA вообще уделено большое внимание. В частности, предусмотрена возможность классификации непрерывных переменных (область значений переменной может быть разбита на требуемое число интервалов). Способы группировки могут быть различными и включать, в том числе, логические отношения (что весьма существенно для решения задач в области эмпирической социологии). Дополнительно имеется специальная процедура иерархической классификации, которая позволяет использовать до шести классифицирующих переменных.
Удобным инструментом в ПСП STATISTICA для интерактивного графического анализа данных является т.н. кисть. Она позволяет, например, выделить интересующий исследователя диапазон точек на матричном графике и визуально оценить их взаимосвязь с другими переменными, выполнить анализ диаграммы рассеяния на наличие выбросов и т.п.
Опыт показал, что целесообразно использовать одновременно оба пакета анализа данных — STATISTICA и SPSS, отлично дополняющих друг друга. Так, некоторые процедуры кластерного анализа лучше выполнять с помощью ПСП STATISTICA (построение дендрограмм), в то время как сам анализ удобнее провести в пакете SPSS. Это же касается некоторых особенностей процедур факторного и дискриминантного анализа, сравнения средних и т.п. Речь не идет о сравнении численных результатов различных процедур — алгоритмы обоих пакетов практически идентичны. Но имеются особенности этих двух пакетов, которые делают их неповторимыми, и мы будем отмечать их по ходу изложения материала лекций.
Дата добавления: 2018-06-28; просмотров: 389;