Пакеты статистических программ

Анализ данных сейчас трудно представить без компьютеров. В то же время в отношении компьютерных программ, предназначенных для анализа данных, прогресс наблюдается скорее в совершенствовании пакетов, чем в алгоритмах разнообразных процедур. Имеется не так много фирм, специализирующихся на разработке пакетов анализа данных и на протяжении многих лет постоянно совершенствующих свои программные продукты, поэтому в данной лекции мы будем использовать как достаточно «старые», так и новейшие работы по данному вопросу.

Все программы анализа данных можно подразделить на универсальные и специализированные. Первые называют также пакетами статистических программ (ПСП); они содержат большое число разнообразных процедур, каждая из которых предназначена для реализации определенного класса методов (описательная статистика, регрессионный, кластерный, факторный и другие виды анализа). Эти пакеты позволяют проводить комплексный статистический анализ, начиная от управления данными и расчета выборочных характеристик исходных признаков и заканчивая использованием разнообразных «тонких» методов. Именно такие ПСП рекомендуются для выполнения большинства работ по анализу данных в области управления.

Специализированные программы предназначены для глубокой обработки данных лишь какими-либо видами статистической обработки — обработка динамических рядов, кластерный анализ и т.п. Их применение в сфере управления весьма ограничено.

Краткое описание универсальных пакетов статистического анализа данных можно найти в книгах и статьях, приведенных в списке литературы к лекции. Изложенные в них рекомендации по выбору ПСП в определенной степени зависят от склонности и даже личных интересов авторов, тем не менее большинство отмечают такие пакеты программ анализа данных, как SPSS, SAS, BMDP, STATISTICA, STATGRAPHICS.

Популярным среди специалистов пакетом является SPSS (Statistical Package for the Social Sciences) — комплекс программ анализа данных общественных наук. Пакет разработан Норманом Ни и его сотрудниками из National Opinion Research Center at the University of Chicago. Система SPSS развивается, начиная с 1975 года, и в настоящее время, помимо базового модуля, имеет большое количество специализированных модулей (SPSS Professional Statistics, SPSS Advanced Statistics, SPSS Categories, SPSS Tables, SPSS Trends, SPSS Exact Tests, SPSS CHAID и другие). В настоящее время в продаже в России имеется уже версия 11.0 этого пакета; автором использовалась версия пакета SPSS Base 8.0 для Windows 95, вышедшая в 1997 г., а также русифицированная версия, используемая Орловским комитетом по статистике. Система также имеет макроязык типа Visual Basic, который позволяет автоматизировать процесс обработки данных.

Для системы SPSS, являющейся «стандартом де факто» для специалистов, работающих в государственных и региональных органах статистики, имеются руководства по эксплуатации и применению на русском языке, поставляемые фирмой СПСС Русь вместе с пакетом SPSS Base 8.0 для Windows.

Программы SAS (Statistical Analysis System) — наиболее дорогие профессиональные программы, включающие мощные процедуры анализа данных, большинство из которых в силу их сложности доступны только математикам высокой квалификации. Интерес к этим пакетам обусловлен также и тем, что фирма-разработчик (SAS Institute, США) успешно работает в области создания систем обработки данных большого объема (а это — не столь далекое будущее науки и практики управления).

Среди зарубежных исследователей широко распространен ПСП BMDP (Biomedical Computer Programs), разработанный под руководством У. Диксона в ВЦ Медицинского центра Калифорнийского университета в Лос-Анджелесе, США. Первая версия этого пакета (BMD) появилась в 1991 г. и в 1975 г. сменилась новой версией BMDP. Пакет схож с SPSS по своей направленности на обработку разнообразных, в том числе номинальных данных. Многие процедуры из BMDP вошли в SAS.

ПСП STATISTICA является интегрированной системой для комплексного статистического анализа и обработки данных в среде Windows и непрерывно совершенствуется фирмой StatSoft Inc. (США), начиная с первой версии 1991 года. Автором в работах по анализу данных использовались версии ППП STATISTICA 4.3 и 5.0 (последняя вышла в конце 1995 года). В программу включен внутренний язык программирования Statistica BASIC, который позволяет наращивать систему и осуществлять автоматизацию рутинных процессов обработки (управление системой в пакетном режиме также возможно с помощью командного языка SCL — STATISTICA Command Language).

В 1998 г. вышло второе издание учебного пособия по системе STATISTICA на русском языке, в котором рассматриваются технологии статистической обработки данных, материалы по инсталляции системы, приведено детальное описание пользовательского интерфейса.

ПСП STATGRAPHICS является также зарубежной разработкой, относящейся к классу популярных пакетов анализа данных. По своим возможностям он близок к пакету SPSS, но документация к нему не столь корректна, в частности, отсутствуют некоторые необходимые сведения типа списка формул.

Из пакетов отечественной разработки можно указать статистические системы «Мезозавр», «Эвриста», STADIA. По своему интерфейсу они, однако, уступают описанным выше ПСП; представление об их возможностях можно получить из публикации А.П. Кулаичева.

В данной лекции описаны возможности и особенности двух ПСП — SPSS и STATISTICA. В лекциях, посвященных изложению различных методов анализа данных в управлении, наряду с примерами их применения, нами будут также приводиться указания по использованию различных процедур программ STATISTICA и SPSS, что поможет читателю самостоятельно разобраться и в других статистических пакетах.

 








Дата добавления: 2018-06-28; просмотров: 865;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.004 сек.