Фиктивные переменные
До сих пор в качестве факторов рассматривались экономические переменные, принимающие количественные значения в некотором интервале. Вместе с тем может оказаться необходимым включить в модель фактор, имеющий два или более качественных уровней. Это могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол, образование, климатические условия, принадлежность к определенному региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые значения, т.е. качественные переменные должны быть преобразованы в количественные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными. Преобразование качественных переменных в количественные соответствует первому требованию по отбору факторов для множественной регрессии.
Предположим, что определено уравнение для потребления кофе:
где - количество потребляемого кофе;
– цена;
фиктивная переменная
Теоретические значения размера потребления кофе для мужчин будут получены из уравнения
Для женщин соответствующие значения получим из уравнения
Сопоставив эти результаты, видим, что различия в уровне потребления мужчин и женщин состоят в различии свободных членов данных уравнений: a – для женщин и a+b – для мужчин.
В рассмотренном примере качественный фактор имел только два альтернативных значения (мужчина и женщина), которым и соответствовали обозначения 1 и 0. Если же число градаций качественного признака-фактора превышает два, то в модель вводится несколько фиктивных переменных, число которых должно быть меньше числа качественных градаций.
Общее правило звучит так: если качественная переменная имеет k альтернативных значений, то при моделировании используются (k-1) фиктивных переменных.
Коэффициенты при фиктивных переменных называются дифференциальными коэффициентами свободного члена.
Мы рассмотрели модели с фиктивными переменными, в которых последние выступают факторами. Может возникнуть необходимость построить модель, в которой бинарный признак играет роль результата. Подобного вида модели применяются, например, при обработке данных социологических опросов. В качестве зависимой переменной y рассматриваются ответы на вопросы, данные в альтернативной форме: «да» или «нет». Поэтому зависимая переменная имеет два значения: 1, когда имеет место ответ «да», и 0 – во всех остальных случаях. Модель такой зависимой переменной имеет вид:
Такая модель называется вероятностной линейной моделью.
Дата добавления: 2015-10-05; просмотров: 1541;