Отбор факторов при построении модели регрессии

Для отбора важнейших факторов xi учитываются следующие условия: 1)связь между результативным показателем и факторным должна быть выше межфакторной связи; 2)связь между факторами должна быть не более 0.7. В случае если в матрице имеется межфакторный коэффициент корреляции rxjxi 0.7, то в данной модели множественной регрессии существует мультиколлинеарность.;3)при высокой межфакторной связи показателя отбираются факторы с меньшим коэффициентом корреляции между ними. 4)В случае если факторные переменные связаны строгой функциональной зависимостью, то говорят о полной мультиколлинеарности. отбор факторов – 2 этапа –а) логический, выбор зависит от природы связи, факторы должны бвть колич измеримы(в случае если необх вкл кач фактор, то придать колич значение), факторы не должны быть интеркоррелированы. В случае если факторы связаны между собой нереально выяснить их влияние на рез-т. при неизменности ост факт в случае если при вкл новых факторов коэфф детерм R2не улучшается, а ост дисп не уменьш то ненужно вкл фактор в модель. Теорет анализ не дает однознач ответа о колич связи исходя из этого:Б)на осн матрицы показ коррел возможно искл дублирующие факторы

rx1y rx2y
rx1y rx1x2
rx2y rx1x2

.

параметров регрессии r(xjy) r(xkxj) ; r(xky) r(xkxj).

В случае если межфакт rxjxi 0.7,то факт дублируют друг друга и искл тот факт корр кот при достаточно тесн связи с у имеет более не сильный сообщение с др факторами. Матрица пок лишь явную коллинеарн,дабы взглянуть мультиколлин необх выстроить матрицу парных коэфф корреляции, если бы факт не корр между союой то матрица была бы единичной с опред =1, в случае если факт нах в полной лин зависим то опред=0 чем ближе к нулю опред тем больше мультиколл. через коэфф мн детерминации определяется какой фактор ответственнен за мультиколл чем ближе к 1 тем больше .и исключается из модели

15. учёт и Мультиколлинеарность факторов ее при построении моделей регрессии.

По величине парных коэфф-тов корреляции обнаруживается явная коллинеарность факторов. Громаднейшие трудности в применении множественной регрессии – при наличии мультиколл факторов, в то время, когда более чем 2 фактора связаны между собой линейной зависимостью, т. е. имеет место совок возд факт друг на друга. В рез-те вариация в данных перестает быть полностью свободной, и нельзя оценить действие каждого фактора в отдельности. Включение в модель мультиколлинеарных факторов нежелательно в

силу последствий:• затрудняется интерпретация параметров множественной регрессии как

черт действия факторов в «чистом» виде, потому что факторы коррелированы;

параметры линейной регрессии теряют экономический суть;• оценки параметров ненадежны, выявляют громадные стандартные неточности и

изменяются с трансформацией количества наблюдений (не только по величине, но и по

символу), что делает модель негодной для прогнозирования и анализа.Для оценки мультиколлинеарности факторов может использоваться определитель

матрицы парных коэффициентов корреляции между факторами Если бы факторы не коррелировали между собой, то матрица парных коэффициентов

корреляции между факторами была бы единичной матрицей, потому, что все недиагональные элементы были бы равны нулю. В случае если же, напротив, между факторами существует полная линейная зависимость и все коэффициенты корреляции равны единице, то определитель таковой матрицы равен нулю. Чем ближе к нулю определитель матрицы межфакторной корреляции, тем посильнее ненадёжнее результаты и мультиколлинеарность факторов множественной регрессии, и напротив. Через коэфф мн детерминации ^2

возможно отыскать факторы важные за мультиколлинеарность . чем ближе к 1 тем посильнее мультиколлинеарность сравнивая коэфф возможно заметить переменн отв за мультиколл и исключить их из модели

16. Преодоление мультиколлинеарности при построении модели регрессии.

1)исключение одного либо нескольких факторов

2.)преобразование факторов при кот уменьш корр между ними (последовательности динамики на ур назад для мскл тенденции) 3)переход к совмещенным уравнениям регрессии те к уравн кот отраж не только сообщение факт с рез-том но и фзаимод факторов f(x1,x2,x3) y=a+b1x1+b2x2+b3x3+b12x1x2+b13x1x3+b23x2x3+e

Проверить значимость по F взаимод факторов и покинуть лишь значимые 4)переход к уравнениям приведен формы – подстановка рассматр фактора через выраж из др уравнения регресс другими словами включит еще одно уравнение где фактор будет рассматр как зависимая переменная.

РЕГРЕССИОННЫЙ АНАЛИЗ техника DUMMY | АНАЛИЗ ДАННЫХ #18


Также читать:

Понравилась статья? Поделиться с друзьями: