Данные наблюдений для эконометрического моделирования
Для построения эконометрической модели используется выборка значений зависимой переменной Y и выборки по каждой из объясняющих переменных X1, X2, ... , Xp . Число наблюдений n должно примерно на порядок и больше превышать число объясняющих переменных р и быть достаточно велико. Например, р=2 - две объясняющие переменные и n=22 – число наблюдений.
Увеличению n препятствует либо ограниченный объем данных наблюдения, либо неоднородный состав этих данных и необходимость разбивать их на однородные массивы (кризисы в экономике, резкие изменение конъюнктуры рынка и т.п.).
Другая проблема - необходимость делать предположение о том, что условное распределение СВ Y одинаково при различных наборах значений объясняющих переменных Х.
Исходные данные делят на два типа: пространственные и временные. Под пространственными данными понимаются результаты наблюдений по множеству объектов за одинаковый интервал или на один момент времени, например, выборка рентабельности по n средним и большим предприятиям города за 2004 г. Важно то, что порядок изучения предприятий и расположения их в выборке здесь не имеет значения.
Формально пространственной выборкой называют серию из n независимых наблюдений (р+1)-мерной СВ (X1, X2, ... , Xp, Y). При этом различные СВ Yi обычно принимаются независимыми и отсюда следует некоррелированность возмущений:
r(ei, ej) = 0 при i¹j. | (1.6) |
Это условие упрощает модель и ее анализ. Однако практически доказать независимость случайных величин часто оказывается невозможным, поскольку есть доводы как за, так и против этой гипотезы. Например, довод против независимости: все наблюдаемые предприятия находятся в однородной рыночной среде (курсы валют, законодательная база, цены на мировом рынке и пр.).
Таким образом, эконометрическая модель на основе пространственных наблюденных данных (xi, yj) имеет вид:
yi=f(xi) + ei, i=1, 2, ... , n. | (1.7) |
Ошибки регрессии удовлетворяют условиям:
- математическое ожидание ошибок наблюдений М(ei,)=0; | (1.8) |
- коэффициент корреляции между ошибками наблюдений r(ei, ej)=0; | (1.9) |
- дисперсия ошибок наблюдений D(ei)=si2. | (1.10) |
Дисперсия ошибок (1.10) может быть двух типов:
а) одинаковой для всех наблюдений: si2 = sj2 при всех i и j. Постоянство дисперсий ошибок называется гомоскедастичностью, это свойство облегчает проведение анализа модели;
б) неодинаковой для различных наблюдений: si2 ¹ sj2 . Это свойство дисперсий называется гетероскедастичностью. Оно затрудняет статистический анализ и может потребовать ее устранения.
Временной выборкой (временным рядом) называется такая выборка, в которой нельзя без потери смысла произвольно менять порядок следования наблюденных значений: каждое значение связано с определенным моментом времени. Обычно предполагается, что в разные моменты времени тип распределения наблюдаемой СВ остается одним и тем же, хотя параметры распределения меняются во времени. Очень часто при этом близко расположенные по времени значения СВ не являются независимыми. Отсюда следует коррелированность ошибок между собой. Это значительно усложняет анализ модели.
Дата добавления: 2019-10-16; просмотров: 337;