Проблема мультиколлинеарности в моделях множественной регрессии. виды мультиколлинеарности, признаки, последствия. методы устранения мультиколлинеарности.

Множественная регрессия разрешает выстроить и проверить модель линейной связи между зависимой (эндогенной) и несколькими свободными (экзогенными) переменными: y = f(x1,…,xр ), где у — зависимая переменная (результативный показатель); х1,…,хр — свободные переменные (факторы). Множественная линейная регрессионная модель имеет форму: y=a+b1x1+b2x2+…+bpxp+? Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

1. быть количественно измеримы. При включении качественного фактора необходимо придать ему количественную определенность

2. не должны быть коррелированы между собой и тем более и годиться в правильной функциональной связи.

Включение в модель факторов с высокой интеркорреляцией, в то время, когда ryx1 rx1x2 может повлечь за собой ненадёжность и неустойчивость оценок коэффициентов регрессии. Потому, что одним из условий построения уравнения множественной регрессии есть независимость действия факторов, коллинеарность факторов нарушает это условие. В случае если факторы очевидно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение наряду с этим отдается фактору, что при достаточно тесной связи с результатом имеет мельчайшую тесноту связи с другими факторами

Показатели мультиколлинеарности.

1.В модели с двумя переменными одним из показателей мультиколлинеарности есть близкое к единице значение коэффициента парной корреляции. В случае если значение хотя бы одного из коэффициентов парной корреляции больше, чем 0,8, то мультиколлинеарность представляет собой значительную проблему. Но в модели с числом свободных переменных больше двух, парный коэффициент корреляции может принимать маленькое значение кроме того при наличия мультиколлинеарности. В этом случае лучше разглядывать частные коэффициенты корреляции. 2. Для проверки мультиколлинеарности возможно разглядеть детерминант матрицы коэффициентов парной корреляции |r|. Данный детерминант именуется детерминантом корреляции |r| ?(0; 1). В случае если |r| = 0, то существует полная мультиколлинеарность. В случае если |r|=1, то мультиколлинеарность отсутствует. Чем ближе |r| к нулю, тем более возможно наличие мультиколлинеарности.

3. В случае если оценки имеют громадные стандартные неточности, низкую значимость, но модель в целом значима (имеет большой коэффициент детерминации), то это говорит о наличие мультиколлинеарности.

4. В случае если введение в модель новой свободной переменной ведет к значительному трансформации.

19. Фиктивные переменные: определение, назначение, типы (спецификация, суть параметра при фиктивной переменной).Фиктивная переменная (англ. dummy variable) — качественная переменная, принимающая значения 0 и 1, включаемая в эконометрическую модель для учёта влияния качественных событий и признаков на растолковываемую переменную. Наряду с этим фиктивные переменные разрешают учесть влияние не только качественных показателей принимающих два, но и пара вероятных значения. В этом случае добавляются пара фиктивных переменных.

В некоторых случаях, при увеличении качества моделей, появляется необходимость оценки влияния качественных показателей на эндогенную переменную (пр.: для ф-ии спроса – это вкус потребителя, возраст, сезонность…).

Эти показатели нельзя представить в численном виде. Исходя из этого применяют фиктивные переменные – переем-е с дискретным множеством значений, каковые образом обрисовывают качественные показатели. В большинстве случаев употребляются фиктивные переменные двоичного типа «О—1»: В принципе возможно оценивать соответствующие зависимости по отдельности в каждой категории, а после этого изучать различия между ними, но введение фиктивных переменных разрешает оценивать одно уравнение сходу по всем категориям.

Однако, переменная такая же «равноправная» переменная, как и каждая вторая «простая» переменная. Ее «фиктивность» состоит лишь в том, что она количественным образом обрисовывает качественный показатель. Все статистические процедуры регрессионного анализа для модели с фиктивными переменными (оценка параметров регрессии, проверка значимости и т. д.) проводятся совершенно верно равно как и при «простых» количественных растолковывающих переменных. В общем случае, в то время, когда качественный показатель имеет более двух значений, вводится пара двоичных переменных. При применении нескольких двоичных переменных нужно исключить линейную зависимость между переменными, поскольку в другом случае, при оценке параметров, это приведет к полной мультиколлинеарности.

Исходя из этого используется следующее правило: в случае если качественная

переменная имеет к других значений, то при моделировании употребляются лишь к-1 фиктивная переменная.

В регрессионных моделях используются фиктивные переменные двух типов: переменные переменные наклона и сдвига.

Фиктивные переменные бывают двух наклона — и типов сдвига. Фиктивная переменная сдвига — это переменная, которая меняет точку пересечения линии регрессии с осью ординат при применения качественной переменной. Фиктивная переменная наклона — это та переменная, которая изменяет наклон линии регрессии при применения качественной переменной
— модель с фиктивной переменной сдвига;

— модель с фиктивной переменной наклона;

— модель с фиктивной переменной сдвига и наклона.

Построение модели множественной регрессии в программе Gretl


Также читать:

Понравилась статья? Поделиться с друзьями: