Уравнение множественной регрессии
Применение корреляционного метода при изучении зависимости признака-результата от нескольких факторных признаков формируется по схеме, аналогичной простой (парной) корреляции.
Одной из важнейших задач многофакторного корреляционного комплекса является составление и решение уравнений множественной регрессии. Этот процесс включает следующие этапы: выбор уравнения взаимосвязи между признаками, отбор наиболее существенных факторных признаков, определение оптимального числа статистических единиц для получения несмещенных оценок.
При выборе формы корреляционной связи целесообразно учитывать следующие требования: во-первых, выбранное уравнение должно отражать основные черты закономерности, например, близкой к прямолинейной либо гиперболической или к параболической и т.п.; во-вторых, принятое аналитическое уравнение должно иметь по возможности несложный вид; в-третьих, число основных факторов должно быть рациональным.
Разработка множественной корреляционной модели всегда связана с отбором существенных факторов, оказывающих наибольшее влияние на признак-результат. При этом введение в задачу неоправданно большого числа факторов ведет к значительному усложнению ее решения. В то же время непродуманное исключение факторных признаков может привести к существенному искажению корреляционной взаимосвязи. В уравнение множественной регрессии не рекомендуется вводить те факторы, которые находятся между собой в тесной связи. В такой ситуации неизбежно явление коллинеарности, т.е. корреляция между факторными признаками. Если несколько факторов коррелирует между собой, то может иметь место мультиколлинеарность, т.е. зависимость между факторами множественной регрессии. Выявление мультиколлинеарности проводится с помощью расчета парных корреляционных отношений или коэффициентов корреляции, отражающих меру тесноты связи между признаками-факторами. Условно принято, что если коэффициент корреляции превышает 0,8, то один из двух факторов выводится из системы.
Объективность результатов, получаемых при составлении и решении уравнений множественной регрессии, во многом определяется численностью выборочной совокупности. Совершенно очевидно, что объективность корреляционных показателей зависит непосредственно от представительности выборки, так как сущность корреляционных расчетов базируется на использовании средних величин, надежность которых напрямую связана с числом единиц в совокупности. Поэтому разработка многофакторного корреляционного комплекса по малой выборке в социально-экономических явлениях имеет ограниченное применение в силу невысокой достоверности получаемых результатов. Для практической работы по составлению и решению многофакторной корреляционной модели принято считать, что численность выборки должна превышать число изучаемых признаков не менее, чем в 8 раз. Так, если для корреляционной модели отобрано, допустим, пять факторов, то в программе выборочного наблюдения необходимо предусмотреть не менее 40 (5·8) статистических единиц.
Стандартное уравнение множественной регрессии при условии включения n факторов можно представить в виде
(11.24)
где – среднее значение признака-результата, соответствующее заданным значениям факторных признаков х1, х2, ….., хn; а – среднее значение результата при условии полной изоляции влияния изучаемых факторов (х1, х2, ….., хn=0); в, с, …, z – неизвестные параметры, т.е. частные коэффициенты регрессии результативного признака при условии увеличения или уменьшения каждого фактора на единицу.
В качестве примера составим и решим уравнение регрессии, характеризующее зависимость годового объема механизированных работ на 1 условный эталонный трактор (признак-результат) от числа трактористов – машинистов, приходящихся на 100 га сельскохозяйственных земель и на 1 физический трактор (признаки-факторы) по данным 100 сельскохозяйственных организаций. Это означает, что необходимо составить и решить двухфакторный корреляционный комплекс, уравнение для которого в общем виде выглядит следующим образом:
(11.25)
где - средний годовой объем механизированных работ на 1 условный эталонный трактор; х1 – число трактористов–машинистов, приходящихся на 1 физический трактор; а, в, с – неизвестные параметры уравнения.
Для нахождения параметров а, в, с необходимо составить и решить систему нормальных уравнений, число которых равно количеству искомых параметров:
Из системы этих уравнений видно, что для определения параметров а, в, с необходимо рассчитать следующие значения: Σх1, Σх2, Σу, Σх1х2, Σх1 у, Σх2 у, Σ х21, Σх22 .С этой целью приведем сокращенный вариант рабочей табл. 11.11.
Подставим полученные в табл. 11.11 конкретные значения ; ; в уравнения (9.26 – 9.28):
Разделим каждое полученное уравнение на коэффициент при а:
Вычитаем из второго уравнения первое, а из третьего – второе:
Из пятого уравнения находим параметр
Теперь подставим рассчитанное значение параметра в четвертое уравнение: 0,3 · 1,4+0,32 с=0,35; с= – 0,22.
Для расчета параметра теперь уже известные параметры и с подставим, например, в уравнение 1. Получим: а+1,5 · 1,4+1,35 · ( – 0,22)=1,65; а= – 0,15.
Раздел 2. «Социально-экономическая статистика»
Дата добавления: 2017-04-20; просмотров: 363;