Графическое представление и первичная обработка фондовых данных.

 

1.1. Общие сведения.

Термин «первичные данные» - это об­щий термин, относящийся к группе сводных показателей, каж­дый из которых одним числом определяет какое-либо качество совокупности данных. Например, при анализе рын­ка ценных бумаг часто необходимо подсчитать некоторую форму среднего значения группы активов или среднюю цену активов в данном периоде. Также финансовым аналитикам часто приходится измерять, как рассеяны доходности и цены фондовых инструментов. На практике часто требуется узнать, как распределены доходности и цены симметрично вокруг средней величины, имеется ли скошенность в распреде­лении доходов и имеет ли их распределение пик, выраженный больше или меньше, чем предполагалось.

Статистики определяют средние значения как показатели центра распределения. Статистические показатели, которые опи­сывают или измеряют, как данные распределены вокруг сред­него значения, известны как показатели вариации. Величины, определяющие симметричность данных, называются показателя­ми асимметрии или мерами скошенности, а выражающие пиковость данных - показателями эксцесса.

Данные могут иметь различный вид, который иногда диктует выбор методов статистического анализа или, по меньшей мере, влияет на него. Таким образом, до начала изучения различных методов стати­стического анализа следует рассмотреть различные виды данных.

Непрерывные и дискретные данные.

Данные могут быть классифицированы как непрерывные и дис­кретные. Непрерывные данные могут принимать любые значения на множестве действительных чисел, т.е. они измеряются на не­прерывной шкале, а их значения ограничены только степенью точности. Типичным примером является процентная ставка до­хода по инвестициям. Она может составлять 12%, 12,3% или во­обще 12,0675%. Данные, относящиеся ко времени, расстоянию и скорости, также попадают в эту категорию.

Дискретные данные связаны с процессом счета. Например, число финансовых сделок дискретно, потому что их половины или четверти не имеют рационального смысла. Данные, связан­ные с ценами активов, могут быть дискретными из-за установ­ленных на индивидуальных рынках правил котировки и мини­мальных ценовых изменений. Например, в Великобритании го­сударственные облигации котируются в тридцать вторых (1/32) долях фунта. Следовательно, ценовые данные здесь дискретны и изменяются только в тридцать вторых долях или кратных им значениях. Рынки корпоративных облигаций, акций, фьючерсов и опционов служат другими примерами, где правила минималь­ных ценовых изменений определяют дискретность данных.

Данные кросс-секций ивременных рядов.

Кросс-секционные (cross-sectional)данные представляют собой информацию в группе переменных в каждый отдельный момент времени. Например, данные, связанные с ценами акций каждой из входящих в расчет, например, индекса FTSE 100 в конкретный момент времени, явля­ются кросс-секционными. Списки цен акций, процентных ста­вок или обменных курсов, публикуемые в деловых разделах га­зет, также представляют собой кросс-секционные данные, пото­му что относятся к ценам или ставкам нескольких переменных (акций, валют и т. п.) в данный момент времени.

Временные ряды отражают колебания какой-либо перемен­ной на промежутке времени. Например, данные о цене акции, обменном курсе валюты или уровне индекса за каждый день (неделю или месяц) в течение некоторого интервала времени будут ежедневным (еженедельным или ежемесячным) временным рядом. Временной ряд - этопоследовательность упорядочен­ных во времени числовых показателей,характеризующих уровень

Всякий временной ряд включает два обязательных элемен­та: во-первых, время и, во-вторых, конкретное значение пока­зателя, или уровень ряда. Временные ряды различаются по следующим признакам:

1) по времени - моментные и интервальные. Интерваль­ный ряд - последовательность, в которой уровень явления относят к результату, накопленному или вновь произ­веденному за определенный интервал времени. Таковы, напри­мер, ряды показателей объема продукции предприятия по месяцам года, количества отработанных человеко-дней по отдельным пе­риодам (месяцам, кварталам, полугодиям, годам, пятилетиям и т.п.) и т.д. Если же уровень ряда характеризует изучаемое явле­ние в конкретный момент времени, то совокупность уровней об­разует моментами ряд. Примерами моментных рядов могут быть последовательность показателей численности населения на начало года, поголовье скота в фермерских хозяйствах на 1 сентября и т.д. Важное отличие моментных рядов от интервальных состоит в том, что сумма уровней интервального ряда дает вполне реальный показатель – общий выпуск продукции за год (пятилетие, десятилетие), общие затраты рабочего времени, общин объем продаж акций и т.д., сумма же уровней моментного ряда иногда и подсчитывается, но реального содер­жания, как правило, не имеет;

2) по форме представления уровней – ряды абсолютных, относительных и средних величин;

3) по расстоянию между датами или интервалами времени выделяют полные и неполные временные ряды. Полные ряды имеют место, когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами, неполные - когда принцип равных интервалов не соблюдается;

4) по содержанию показателей - ряды частных и агрегированных показателей. Частные показатели характеризуют изучаемое явление односторонне, изолированно. Например, среднесуточный объем выпуска промышленной продукции дает возможность оцепить динамику промышленного производства, численность граждан, состоящих на учете в службе занятости;
показывает эффективность социальной политики государства;
остатки наличных денег у населения и вклады населения в бан­ках отражают платежеспособность населения и т.д. Агрегированные показатели основаны на част­ных показателях и характеризуют изучаемый процесс комплек­сно. Так, чтобы иметь представление о состоянии фондового рынка России в целом, необходимо определять агрегированный пока­затель экономической конъюнктуры, включающий в себя и вы­шеперечисленные частные показатели. Широкое применение агрегированных показателей стало возможным с развитием факторного и компонентного анализа.

Важнейшим условием правильного формирования времен­ных рядов является сопоставимость уровней, образующих ряд. Уровни ряда, подлежащие изучению, должны быть однородны по экономическому содержанию, учитывать существо изучае­мого явления и цель исследования.

Статистические данные, представленные в виде временных рядов, должны быть сопоставимы по территории, кругу охва­тываемых объектов, единицам измерения, моменту регистрации, методике расчета, ценам, достоверности.

Несопоставимость по территории возникает в результате изменений границ стран, регионов, хозяйств и т.п. Для приведе­ния данных к сравнимому виду производится пересчет прежних данных с учетом новых границ.

Полнота охвата различных частей явления - важнейшее условие сопоставимости уровней ряда.

Познание закономерностей изменения фондовых переменных во времени – сложная и трудоемкая процедура исследования, так как любое изу­чаемое явление формирует множество факторов, действующих в разных направлениях. По характеру непосредственного воздействия эти факторы могут быть разделены на две группы. К первой группе относятся факторы, определяющие основную тенденцию динамики (рост или снижение уровнен). Вторая группа факторов, вызывающая случайные колебания, откло­няет уровни от тенденции то в одном, то в другом направле­нии. Например, тенденция динамики объемов продаж ценных бумаг на фондовой бирже связана с укреплением экономики страны, с прогрессом развития информационных каналов связи, с совершенствованием организации и управления производством тех предприятий, чьи ценные бумаги представлены на рынке. Колеблемость динамики вызвана влиянием, например, мирового фондового рынка, неустойчивостью валютного курса и цен на сырье, неожиданными политическими решениями экономических вопросов.

При статистическом изучении динамики необходимо четко разделять два основных ее элемента - тенденцию и колеблемость, чтобы дать каждому из них количественную характери­стику с помощью специальных показателей.

Основной тенденцией, или трендом, называется характери­стика процесса изменения явления за длительное время, осво­божденная от случайных колебаний, создаваемых второй группой факторов. В отличие от тенденции колеблемостью следует называть отклонения уровней отдельных периодов вре­мени от тенденции динамики (тренда).

 

Сгруппированные и несгруппированные данные.

Только когда обрабатывается небольшое количество исходных данных, они могут быть оставлены в необработанном или не­сгруппированномвиде, при этом знакомящиеся с ними будут в состоянии их усвоить. Понятно, что когда набор данных велик, необходимо изложить его в виде таблицы для лучшего восприятия. Данные в таблице могут разбиваться на группы и объединяться в интервалы. Пример сгруппированных непрерывных данных показан в табл. 1.1.

Таблица 1.1

Представление сгруппированных данных.

Месячный доход Число наблюдений Относительная частота
До -8%
Более -8% и до -7% 0,039216
Более-7% и до -6% 0,019608
Более -6% и до -5% 0,098039
Более -5% и до -4% 0,039216
Более -4% и до - 3% 0,039216
Более -3% и до -2% 0,058824
Более -2% и до -1% 0,058824
Более - 1% и до 0% 0,098039
Более 0% и до + 1% 0,058824
Более + 1%идо + 2% 0,137255
Более + 2% и до + 3% 0,078431
Более. + 3% и до + 4%. 0,058824
Более + 4% и до + 5% 0,078431
Более + 5% и до + 6% 0,019608
Более + 6% и до + 7% 0,039216
Более + 7% и до + 8%
Более + 8% и до + 9%
Более + 9% и до + 10 0,039216
Более + 10% и до + 11%
Более + 11%идо+ 12% 0,039216
Итого

При группировке данных необходимо уделить особое внима­ние интервалам. Во-первых, они не должны перекрываться. Во-вторых, они должны быть одинаковых размеров, если не сущест­вует специфической потребности в выделении данных в рамках какой-либо "подгруппы", либо если данные в группе настолько малочисленны, что могут быть безопасно слиты с предыдущей или последующей группой без потери информации. В-третьих, интервалы не должны быть столь большими, чтобы скрывать характерные изменения в рамках группы. И, наконец, число ин­тервалов должно быть компромиссом между необходимостью передачи деталей и возможностью для аналитика охватить эти детали.

 

1.2. Представление данных.

 

В этом разделе рассмотрим следующие методы представления данных:

· графики распределения значений;

· графики распределения относительных частот;

· графики распределения накопленных частот или огивы;

· гистограммы.

 

График распределения значений.

 

Для построения графика распределения значений число наблюде­ний откладывается по вертикальной оси, а интервалы (доходы) - по горизонтальной. Затем отмечается каждая из частот и составля­ется диаграмма, как на рис. 1.1. Высота каждого столбика представляет число наблюдений в рамках каждого интервала.

Рис. 1.1. График распределения значений.

 

График распределения относительных частот.

 

Чтобы получить относительные частоты для группы данных, не­обходимо число наблюдений в каждой группе разделить на общее число единиц совокупности. После этого распределение относи­тельных частот можно изобразить графически способом, анало­гичным для распределения частот. Получим диаграмму, пока­занную на рис. 1.2.

Рис. 1.2. График распределения относительных частот.

 

График распределения накопленных частот, или огива.

 

Для построения графиков распределения накопленных частот накопленное значение откладывается по вертикали, а величина интервалов – по горизонтали. Огивы строятся нанесением на ось абсцисс данных в возрас­тающем порядке, и в случае сгруппированных данных нанесени­ем частот напротив верхней границы интервала. Это проиллюст­рировано на рис. 1.3.

Рис. 1.3. Огива данных, представленных в таблице 1.1.

 

Гистограмма.

Следующим шагом в представлении относительного распределе­ния будет его отображение не высотой, а площадью столбиков. Данное графическое представление известно как гистограмма. Гистограмма должна быть построена так, чтобы площадь ка­ждого "столбика" представляла относительную частоту распреде­ления, а общая их площадь составляла 100% распределения. Можно кратко изложить всю эту процедуру, сказав, что при построении гистограммы должен быть определен размер интер­вала. Затем рассчитывается высота каждого столбика делением относительной частоты на число единиц в конкретном интерва­ле. Потому высота "столбиков", относящихся к интервалам, кото­рые уже, будет больше, а относящихся к тем, которые шире, будет меньше.

 

1.3. Описательные статистические показатели.

 

Для представления обобщающих показателей, предположим, до­ходности активов, цен активов или числа финансовых операций, мы используем показатели центра распределения, показатели вариа­ции, показатели скошенности (асимметрии) и показатели эксцесса.

Средние величины позволяют сделать вывод о центральном или наиболее общем значении, найденном для совокупности данных, меры рассеяния (вариации) показывают, как данные распределе­ны вокруг средней. Показатели скошенности (асимметрии) иллюстрируют степень левосторонней асимметрии, т.е. отрицательной, или правосторонней, т.е. положительной, в распределении частот. Показатели эксцесса определяют уровень островершинности или плосковершинности распределения частот.

Поясним понятие моментов. Момент k-го порядка относи­тельно исходной величины А находится как

(1.1).

Если А = 0 и k = 1, то мы получим среднюю арифметическую. Поэтому средняя арифме­тическая иногда называется моментом первого порядка относитель­но нуля. Если же величина А сама является средней арифме­тической и k=2, мы имеем момент второго порядка относительно средней (центральный момент второго порядка), известный как дисперсия, и характеризующий вариацию признака. При А, равном средней, и k = 3 получаем момент третьего порядка относительно средней (центральный момент третьего порядка), который является мерой скошенности, а если k = 4, то определяется момент четвертого порядка относительно средней (центральный момент четвертого порядка), измеряющий эксцесс.

 

Показатели центра распределения.

Практически каждый человек знаком с понятием средней величины, будь это "средний" размер остатка по кредитной карте, "среднее" число операций по счету и т.д. Фактически существует несколько показателей "средней", которые особенно интересны в сфере финансов. Это:

· мода;

· медиана;

· средняя арифметическая;

· средняя геометрическая.

Мода - это наиболее часто наблюдаемая величина изучаемой переменной. Для ее иллюстрации рассмотрим следующие дан­ные, которые показывают цену акции, выраженную в рублях, в течение 15-дневного периода:

100, 120, 90, 80, 100, 150, 140, 120, 110, 100, 120, 120, 100, 120, 110.

Модой, т.е. наиболее часто повторяющимся наблюдением, является величина 120.

Медиана - это значение наблюдения, которое находится в сере­дине ранжированного ряда данных, т.е. наблюдение, занимаю­щее срединное положение.

Медиана для несгруппированных данных. Для определения ме­дианы в случае несгруппированных данных мы сначала должны расположить их в возрастающем порядке. Покажем это на при­мере, использованном при рассмотрении моды

80, 90, 100, 100, 100, 100, 110, 110, 120, 120, 120, 120, 120, 140, 150.

Так как присутствуют 15 наблюдений, медианой является значение восьмого наблюдения, т.е. величина признака, равная 110.

Если бы в примере было четное число наблюдений, то отсут­ствовало бы "срединное" наблюдение, поэтому была бы рассчитана средняя из двух значений, стоящих посередине. Ре­зультатом может являться число, не присутствующее на самом деле в ряду данных.

Средняя арифметическая - наиболее часто используемый пока­затель центра распределения, именно ее большинство людей рассматривают в качестве средней.

Средняя арифметическая для несгруппированных данных. Средние показатели динамики - средний уровень ряда, сред­ние абсолютные изменения и ускорения, средние темпы роста - характеризуют тенденцию. Они необходимы при обобщении характеристик тенденции за длительный период, по различным периодам; они незаменимы при сравнении развития за неодинаковые по длительности отрезки времени и при выборе ана­литического выражения тренда. При наличии в динамическом ряду существенных колебании уровней определение средних по­казателей тенденции требует применения специальных методов статистики. В дан­ном разделе рассматриваются только математические свойства средних показателей динамики и простейшие приемы их вычисления, применимые на практике к рядам со слабой ко­леблемостью.

Средняя арифметическая рассчитывается суммированием всех значений отдельных наблюдений и последующим делением по­лученной суммы на количество наблюдений. Например, допус­тим, что мы желаем подсчитать среднюю арифметическую цены какого-либо актива в течение пяти дней. В данный период мы наблюдаем следующие цены

225 225 240 215 230

Найдем среднюю арифметическую, складывая эти пять значений и деля сумму на число наблюдений. В формализован­ном виде средняя арифметическая выглядит так:

(1.2).

Здесь показано, что - это сумма (отдельных наблюдений X), поделенная на количество наблюдений. Греческая заглавная буква сигма ( ) - оператор суммирования, означает, что все необходи­мо сложить вместе. Так как в нашем примере всего пять , то опе­ратор суммирования будет выглядеть следующим образом , показывая, что первые пять должны быть сложены друг с другом. Сейчас мы можем подсчитать среднюю арифметическую пя­ти цен ценной бумаги: (225 + 225 + 240 + 215 + 230)/5 = 227.

Таким образом, средняя арифметическая цена равняется 227.

В моментном ряду смысл среднего уровня заключается в том, что он характеризует уже не состояние объекта в отдельные моменты, а его среднее, обобщенное состояние между на­чальным и конечным моментами учета. Из этого следует, что уровни, относящиеся к начальному и конечному моментам, иг­рают не ту роль, что уровни, относящиеся к моментам внутри изучаемого отрезка времени. Начальный и конечный уровни находятся на границе изучаемого интервала, они наполовину относятся к предыдущему и последующему интервалам и лишь наполовину к изучаемому. Уровни, относящиеся к моментам внутри осредняемого интервала, целиком относятся только к нему. Отсюда получаем особую форму средней арифметичес­кой величины, называемой хронологической средней:

(1.3).

Проблема вычисления среднего уровня моментного ряда при неравных промежутках между моментами является спорной и здесь не рассматривается. Если известны точные даты изменения уровней моментного ряда, то средний уровень определяется как

(1.4).

Средний абсолютный прирост(абсолютное изменение)определяется как простая арифметическая средняя из абсолютных изменений за равные промежутки времени (цепных абсолютных изменений) или как частное от деления базисного абсолютного изменения на число осредняемых отрезков времени от базисно­го до сравниваемого периода:

(1.5).

Средняя арифметическая для сгруппированных данных.Часто верхние и нижние пределы крайних интервалов остаются откры­тыми. Следовательно, необходимо сделать допущение о границах интервалов. Это допущение должно базироваться на характери­стиках анализируемых данных. Например, данные из табл. 1.2. относятся к рыночной цене акции, которую наблюдали некоторое время аналитики. Нижний интервал обозначен "До 260 руб.", а верхний - "Более 550 руб.".

Таблица 1.2.

Интервалы цен некоторой акции.

Интервал Среднее значение
До 260 руб. 215 руб.
От 260 до 400 руб. 330 руб.
От 400 до 550 руб. 475 руб.
Более 550 руб. 585 руб.
Итого  

 

Средняя арифметическая для сгруппированных данных нахо­дится с помощью следующей формулы

(1.6)

где - центральное значение каждого интервала; - количество наблюдений в каждом интервале; т - число интервалов; п - общее количество наблюдений или единиц совокупности.

Используя приведенные выше данные, рассчитаем среднюю арифметическую рыночной цены акции:

руб.

Альтернативным показателем средней арифметической, особен­но хорошо подходящим для измерения средних темпов роста, является средняя геометрическая. Для иллюстрации этого сначала предположим, что фондовый индекс изменялся со следующими годовыми темпами прироста в течение пяти лет: + 10%, + 20%, + 15%, -30%, + 20%. Средняя арифметическая темпов приросту равна + 35/5 = 7. Однако 100 единиц, инвестированных в пер­вый год, возрастут до следующих значений в каждом году соот­ветственно: 110; 132; 151,8; 106,26; 127,51. Следовательно, фак­тический прирост за весь пятилетний период составляет лишь 27,5%. Разделив это число на пять, мы получим 5,5% в год; но правильный ли это ответ?

Правду говоря, нет! Что нам действительно нужно, так это единичная мера темпа прироста, которая при повторении ее n раз трансформирует начальное значение в конечное. Корректный по­казатель периодических темпов прироста находится с использова­нием средней геометрической. Для измерения среднего годового темпа прироста за n лет используется следующая формула:

(1.7)

где имеют вид (1 + r), авеличина r, темп прироста, выражена в десятичных дробях, т.е., например, 10% = 0,1.

При использовании приведенных выше данных средняя геомет­рическая из темпов прироста в течение пяти лет составит 4,98%:

Таким образом, средняя арифметическая дает преуве­личенное значение среднего годового темпа прироста в данном примере. Применение же средней геометрической дает коррект­ную "среднюю" темпа прироста.

Какую среднюю использовать? Выбор подходящего вида средней зависит, с одной стороны, от природы данных, а с другой - от того, как этот показатель будут использовать. Средняя арифметическая особо чувствительна к экстремаль­ным (выделяющимся) значениям в одном из направлений, кото­рые называются смещенными данными. Выделяющиеся большие значения увеличивают среднюю выше уровня действительного представляющего точку центра распределения данных. Особо малые значения признаков имеют противоположный эффект. Иногда для того чтобы исключить влияние экстремальных еди­ниц данных, рассчитывается усеченная средняя.Для этого просто необходимо удалить 5% наибольших и 5% наименьших наблю­дений до расчета средней арифметической.

Экстремальные наблюдения не влияют на медиану и моду, но эти показатели не столь полезны в дальнейшем матема­тическом и статистическом анализе.

Средняя геометрическая лучше других подходит, когда под­считываются "средние" темпы прироста в течение нескольких временных периодов.

 

1.4. Дисперсия и среднее квадратическое отклонение.

 

Если средняя арифметическая выбрана как показатель центра распределения, то соответствующими показателями вариации являются дисперсия и среднее квадратическое отклонение. Дис­персия широко применяется в финансовых расчетах как мера риска и неопределенности. Сред­нее квадратическое отклонение ис­пользуется как мера изменчивости в ценообразовании, например, опционов.

Дисперсия для несгруппированных данных. Если отдельные на­блюдения сгруппированы вблизи среднего значения, то разности между каждым индивидуальным наблюдением , и средней будут небольшими. Если отдельные наблюдения широко рассея­ны, то разности между каждым индивидуальным значением , и средней будут велики.

Можно предположить, что с помощью суммирования всех ( - ) мы получим меру рассеяния. К сожалению, это не так, потому что всегда равна нулю. Для преодоления этого свой­ства средней необходимо возвести в квадрат каждое отклонение ( - ) и просуммировать получившиеся значения. Деление ре­зультата на n-1, т.е. на количество наблюдений минус один, дает дисперсию. Это можно записать в формализованном виде:

(1.8).

Если вычисляется дисперсия на основе всей совокупности данных, то делитель в выражении (1.8) равен n. Однако когда данные, которыми мы располагаем, представляют выборку из всей совокупности данных, что обычно случается в эмпирических ис­следованиях в области финансов, следует делить на n-1. Происходит это потому, что мы должны делить на то, что статистики называют степенями свободы, для предотвращения искажения ре­зультата. Степени свободы - это число наблюдений минус число параметров, оцененных по рассматриваемым данным. В случае дисперсии средняя оценивается по тем же данным. Таким образом, когда эта оценка используется при вычислении среднего квадратического отклонения, число степеней свободы равно n-1. Наибольший эффект при коррекции n на число степеней свободы наблюдается для малых выборок. Понятно, что для большого объ­ема данных эффект коррекции минимален.

Пример. Найдите самостоятельно дисперсию переменной Х, значения которой приведены в таблице 1.3.

Таблица 1.3.

Значения переменной Х 2407,5 2289,2 2160,1 2311,1 2425,8 2378,4 2245,5 2229,2 2118,8 2372,4 2376,3

Ответ: 10520.15.

Дисперсия для сгруппированных данных. При использовании сгруппированных данных формула дисперсии выглядит так:

(1.9),

где - количество наблюдений в каждом интервале, - центральное значение каждого интервала, а - среднее значение всех Х.

Пример. Вычислить дисперсию сгруппированных данных, представленных в таблице 1.2.

Среднее квадратическое отклонение. Дисперсия выражается в квадратах единиц, находящихся в осно­вании расчета, что делает ее интерпретацию довольно затруднительной. Эту проблему можно преодолеть, извлекая квадратный корень из дисперсии и получая, таким образом, среднее квадра­тическое отклонение, обозначаемое как .

Среднее квадратическое отклонение для несгруппированных данных. Среднее квадратическое отклонение вычисляется так:

(1.10).

Среднее квадратическое отклонение для сгруппированных дан­ных. Формула для нахождения среднего квадратического откло­нения для сгруппированных данных выглядит так;

(1.11).

Это опять только квадратный корень из диспер­сии, но на этот раз для сгруппированных данных.

Коэффициент вариации. Среднее квадратическое отклонение выражается в единицах из­мерения, лежащих в основе расчета. Таким образом, при срав­нении степени вариации переменных должны быть учтены раз­личия в величине этих переменных. Для этого нужно рассчитать коэффициент вариации. Он находится как отношение:

(1.12).

Коэффициент асимметрии. Иногда бывает важно знать, есть ли смещения в рассеянии данных. Ин­дикатор этих смещений - скошенность (асимметрия) данных. В случае положительной асимметрии распределение имеет длинную правую ветвь. Средняя величина дохода больше медиа­ны, которая в свою очередь больше моды. Значение средней больше медианы и моды, потому что на нее повлияли несколько очень больших значений доходов.

Отрицательная асимметрия проявляется в виде более длинной левой ветви, а величина средней меньше медианы и моды. Боль­шинство наблюдений распределения имеют значения больше средней, но величина средней снижается из-за нескольких очень малых наблюдений.

При симметричном распределении средняя, медиана и мода имеют одно и то же значение.

Показателем асимметрии, который наиболее пригоден для применения в случае сгруппированных данных, является ко­эффициент асимметрии, основанный на расчете моментов рас­пределения. Он определяется с помощью центрального момента третьего порядка и деления его на куб среднего квадратического отклонения, что можно представить следующей формулой:

(1.13).

Эксцесс. В то время как показатели асимметрии характеризуют симметричность распределения частот, показатели эксцесса описывают пиковость этого распределения. Распределения, имеющие более выраженный пик, чем у нормального распределения (о нем деталь­но рассказано далее), называются островершинными. Те же распре­деления, у которых степень вытянутости вдоль оси ординат меньше, чем у нормальной кривой, называются плосковершинными, а рас­пределения, которые похожи на нормальное, - средневершинными. Островершинные распределения можно увидеть в доходах активов, когда наблюдаются периодические скачки в ценах на эти активы. Рынки с прерывающимся процессом торговли, как, например, рынки ценных бумаг, которые закрываются на ночь и в выходные, имеют большую вероятность для демонстрации скачков цен активов. Причиной служит то, что информация, которая влияет на цены, но публикуется во время закрытия рынков, окажет воздействие на цены, когда рынок откроется вновь, таким образом создавая условия для скачка между преды­дущей ценой закрытия и ценой открытия. Этот скачок цен, наи­более заметный для ежедневных или еженедельных данных, приведет к более высокой частоте повторения больших положи­тельных или отрицательных доходов, чем предполагалось бы, если бы торговля на рынках велась непрерывно. Коэффициенты эксцесса могут быть определены с помощью центральных моментов распределения. Коэффициент эксцесса находится делением центрального момента четвертого порядка на среднее квадратическое отклонение, возведенное в четвертую степень:

(1.14).

Если данные будут нормально распределены, то коэффициент эксцесса, рассчитанный с помощью формулы (1.11), равнялся бы 3.

 

1.5. Показатели статистической связи.

Выше объяснялось, что дисперсия случайной переменной показы­вает, как наблюдаемые значения этой переменной распределены вокруг среднего значения. Здесь введем понятие ковариации, которая показывает, как две случайные переменные ведут себя по отношению одна к другой. Затем мы перейдем к расчету коэффициента корреляции, который является наиболее удобным показателем степени линейной связи между двумя переменными.

Ковариация. В финансовой и других областях встречается много ситуаций, когда важно знать, как две переменные ведут себя по отноше­нию друг к другу. Например, в управлении портфелем ценных бумаг для опре­деления риска портфеля активов необходимо знать, как цена ценной бумаги Х ведет себя по отношению к ценной бумаге Y для всех пар активов. Другими словами, нам нужно определить ковариацию или корреляцию каждой пары активов.

Если цена ценной бумаги X обычно растет (падает) в то же время, когда растет (падает) цена ценной бумаги Y, ковариация будет положительной. Однако если обычно во время роста цены ценной бумаги X цена ценной бумаги Y падает, то ковариация будет отрицательной. Если же не существует определенной мо­дели связи между движениями цен, т.е. цены двух ценных бумаг ведут себя независимо, ковариация равна нулю. Формула для вычисления ковариации выглядит следующим образом:

(1.15).

Как видно из формулы, величина ковариации зависит от величины наблюдений Х и Y. Таким образом, значительная ковариация может быть вызвана в большей степени высокими значениями наблюдений, чем близкой связью между переменными.

Дисперсионно-ковариационная матрица. Часто ковариации нескольких переменных (например X, Y, Z) изображаются в виде дисперсионно-ковариационной матрицы С:

(1.16).

Возможными парами активов в этом примере являются XX, ХY, ХZ, YХ, YY, YZ, ZХ, ZУ и ZZ. Таким образом, кова­риация X и Y - это то же самое, что и кова­риация Y и X. Поэтому все ковариации левее и ниже диагонали повторяются выше и правее диагонали. Значит, эти ковариации введены в матрицу дважды. Важность этой детали проиллюстрируем позд­нее, когда будем измерять риск портфеля. Ковариации на диагонали - это ковариации доходов с ними са­мими. Ковариация переменной с ней самой равняется диспер­сии этой переменной. Для понимания этого используем выра­жение (1.10) для измерения ковариации актива X с ним самим. Равенство будет выглядеть так:

(1.17),

что совпадает с формулой дисперсии.

Коэффициент корреляции. Наиболее широко используемым показателем степени связи ме­жду двумя переменными является коэффициент корреляции. Это показатель, независимый от единиц измерения, характеризует силу и направление линейной связи между двумя переменными. Следовательно, при его использовании преодолевается недоста­ток ковариации, так как величина коэффициента корреляции не находится под влиянием значений наблюдений.

Значения коэффициента корреляции находятся в промежутке от (- 1) для случая отрицательной связи, проходя через 0, где две переменные независимы друг от друга и заканчиваются в точке (+ 1) для случая положительной связи между переменными.

Коэффициент корреляции рассчитывается делением коэффициента кова­риации между X и Y на произведение среднего квадратического откло­нения X и среднего квадратического отклонения Y. В формали­зованном виде это записывается так:

(1.18).

Независимо от того, положительна или отрицательна корре­ляция, коэффициент корреляции - это только мера стати­стической связи. В статистике выводы о причинности, т.е. возможности предположить, что изменение пе­ременной X приведет к изменению переменной Y или наоборот, нельзя сделать, использовав коэффициент корреляции: для этого существует, например, тест Гранжера. Следовательно, коэффициент корреляции может лишь показать, насколько сильна линейная связь между двумя переменными, но не может объяснить их изменений.

 

1.6. Показатели, характеризующие тенденцию динамики.

Для того чтобы построить систему показателей, характеризующих тенденцию динамики, нужно подобрать величины, которые характеризуют изменения уровней анализируемого ряда как в абсолютном, так и в относительном вы­ражении. Далее финансового аналитика, как правило, интересует, является ли из­менение временного ряда равномерным или неравномерным, ускоренным или замед­ленным. Наконец, его интересует уравнение тенденции ряда в форме некоторого достаточно простого выражения, наилучшим образом аппроксимирующего фактическую тенденцию динами­ки. Понятие об уравнении тенденции динамики было введено в статистику английским ученым Гукером в 1902 г. Он предло­жил называть такое уравнение трендом (trend).

Для того чтобы нагляднее представить показатели, харак­теризующие тенденцию, следует абстрагироваться от колебле­мости и выявить динамический ряд в форме «чистого» тренда при отсутствии колебаний. Пример такого ряда представлен в табл. 1.4.

Абсолютное изменение уровней - в данном случае его можно назвать абсолютным приростом - это разность между сравни­ваемым уровнем и уровнем более раннего периода, принятым за базу сравнения. Если эта база - непосредственно предыду­щий уровень, показатель называют цепным, если за базу взят, например, начальный уровень, показатель называют базисным. Формулы абсолютного изменения уровня:

цепное :

базисное : (1.19).

Если абсолютное изменение отрицательно, его следует на­зывать абсолютным сокращением. Абсолютное изменение име­ет ту же единицу измерения, что и уровни ряда с добавлением единицы времени, за которую определено изменение: 22 тыс. руб. в год (или в месяц, или в пятилетие). Без указания единицы времени, за которую произошло измерение, абсолютный прирост нельзя правильно интерпретировать.

 

Таблица 1.4.

Абсолютные и относительные показатели тенденции.

Номер периода Уровень ряда (тыс. руб.) Абсолютное изменение уровней (тыс. руб. в год) Ускорение абсолютного изменения (тыс. руб. в год) Темп роста уровня к периоду, %
предыдущему Начальному
0 (начальный) - - - -
-
114,3
115,6
116,2
116,3
116.0

 

В табл. 1.4 абсолютное изменение уровня не является кон­стантой тенденции. Оно со временем возрастает, т.е. уровни ряда изменяются с ускорением. Ускорение - это разность меж­ду абсолютным изменением за данный период и абсолютным из­менением за предыдущий период равной длительности:

(1.20).

Показатель абсолютного ускорения применяется только в цепном варианте, но не в базисном. Отрицательная величина ускорения говорит о замедлении роста или об ускорении сниже­ния уровней ряда.

Как видно из табл. 1.4, ускорение является константой тен­денции данного ряда, что свидетельствует о параболической форме этой тенденции. Ее уравнение имеет вид:

(1.21),

где где у0 - уровень ряда в начальный (нулевой) период; а - средний абсолютный прирост (по всему ряду); b - половина ускорения; - номера периодов.

По данным табл. 1.4 имеем:

Показатель ускорения абсолютного изменения уровней вы­ражается в единицах измерения уровня, деленных на квадрат длины периода. В нашем случае ускорение составило 4 тыс. руб. в год за год. Смысл показателя следующий: стоимость объема продаваемых акций имел абсолютный при­рост, возрастающий на 4 тыс. руб. в год ежегодно.

Усвоить рассмотренные показатели поможет следующая аналогия с механическим движением: уровень - это аналог прой­денного пути, причем начало его отсчета не в нулевой точке; абсолютный прирост - аналог скорости движения тела, а уско­рение абсолютного прироста - аналог ускорения движения. Пройденный телом путь, считая и тот, который уже был прой­ден до начала отсчета времени в данной задаче, равен:

(1.22),

где - путь, пройденный до начала отсчета времени; v – скорость движения; а - ускорение; t - время, прошедшее от начала его отсчета в задаче.

Система показателей должна содержать не только абсолют­ные, но и относительные статистические показатели. Относи­тельные показатели динамики необходимы для сравнения развития разных объектов, особенно если их абсолютные характеристики различны. Предположим, что тенденция объема продаж другого вида ценных бумаг характеризуется следующим уравнением: . И абсолют­ный прирост, и ускорение роста объема продаж во втором случае гораздо меньше, чем в первом. Но можно ли ограничиться этими показателями и сделать вывод, что развитие продаж вто­рого вида ценных бумаг происходит более медленными темпами, чем первого? Меньший уровень еще не есть меньший темп разви­тия, и это покажет относительная характеристика тенденции динамики - темп роста.

Темп роста - это отношение сравниваемого уровня (более позднего) к уровню, принятому за базу сравнения (более ранне­му).Темп роста исчисляется в цепном варианте - к уровню предыдущего года, а в базисном - к одному и тому же, обыч­но начальному уровню. Он свидетельствует о том, сколько процентов составляет срав­ниваемый уровень по отношению к уровню, принятому за базу, или во сколько раз сравниваемый уровень больше у ровня, при­нятого за базу. При этом если уровни снижаются со временем, то сказать, что последующий уровень «больше в 0,75 раза», или составляет 75% базового уровня, это, разумеется, означает, что уровень уменьшился на четверть. Темп изменения в разах всегда говорит о том, во сколько раз сравниваемый уровень больше предыдущего.

Рассмотрим связь абсолютныхи относительных показателен динамики. Обозначим темп изменения через k, тогда имеем:

цепной темп роста в период с номером n:

базисный темп роста за весь период:

Если сравниваемый уровень выразить через уровень базис­ного (или предыдущего) периода и абсолютное изменение, по­лучим:

(1.23).

Величина k в уравнении (1.23), т.е. отношение абсолютного изменения к уровню предыдущего (или базисного) года, называется относительным приростом(относительным сокращением, относительным изменением, процентным изменением) или темпом прироста.

Темп изменения - величина всегда положительная. Если уро­вень ряда динамики принимает положительные и отрицатель­ные значения, например, финансовый результат от реализации продукции предприятием может быть прибылью (+), а может быть убытком (-), тогда темп изменения и темп прироста при­менять нельзя. В этом случае такие показатели теряют смысл и не имеют экономической интерпретации. Сохраняют смысл только абсолютные показатели динамики.

Рассмотрим соотношения между цепными и базисными по­казателями на примере данных табл. 1.4:

1) сумма цепных абсолютных изменений равна базисному абсолютному изменению:

12+16+20+24+28+32=232-100=132

2) произведение цепных темпов изменения равно базисно­му темпу изменения:

1,12 * 1,143 * 1,156 * 1,162 * 1,163 * 1,16 = 2,32.

Значения цепных темпов прироста, рассчитанных каждый к своей базе, различаются не только числом процентов, но и величиной абсолютного изменения, составляющей каждый про­цент. Следовательно, складывать или вычитать цепные темпы прироста нельзя. Абсолютное значение 1%-ного прироста равносотой части предыдущего уровня или базисного уровня.

Средний темп изменения определяется наиболее точно при аналитическом выравнивании динамического ряда по экспоненте. Если можно пренебречь колеблемостью, то средний темп определяют как геометрическую среднюю из цепных темпов роста за п лет или из общего (базисного) темпа роста за nлет:

(1.24).

Например, стоимость потребительской корзины за год в ре­зультате инфляции возросла в три раза. Каков средний месяч­ный темп инфляции?

, или 1.096%,

т.е. в среднем за месяц цена увеличивалась на 9.6% к уровню пре­дыдущего месяца.

Средний темп роста так же, как средний прирост, следует сопровождать указанием двух единиц времени: периода, который им характеризуется, и периода, на который рассчитан, например, среднегодовой темп за последнее десятилетие; сред­немесячный темп за полугодие и т.д.

Если исходной информацией служат темпы прироста и нуж­но вычислить их среднегодовую величину, то предварительно следует все темпы прироста превратить в темпы роста, приба­вив 1, или 100%, вычислить их среднюю геометрическую и сно­ва вычесть 1, или 100%. Интересно, что ввиду асимметрии темпа прироста и темпа сокращения при равных их величинах общий темп прироста всегда отрицателей. Так, если за первый год объем производства вырос па 20%, а за второй снизился на 20% (темпы цепные), то за два года имеем:

- средний темп роста или 97,98%;

- средний темп прироста - 1 = -0,0202, или -2,02%.

Интересную задачу представляет определение срока, за кото­рый ряд с большим средним показателем динамики, но меньшим начальным уровнем догонит другой ряд с большим начальным уровнем, по меньшим показателем динамики. Для абсолютных приростов задача элементарна: имеем одни ряд с базисным уров­нем и средним абсолютным приростом ; второй ряд с показателями соответственно , , причем > , < . Уровень первого ряда сравняется с уровнем второго ряда через n лет:

 

(1.25).


<== предыдущая лекция | следующая лекция ==>
АТФ и ГТФ как источники энергии | Методы корреляционно-регрессионного анализа фондового рынка. 1 страница




Дата добавления: 2017-10-09; просмотров: 1456;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.115 сек.