Линейные регрессионные модели с гомоскедастичными и гетероскедастичными остатками
Указанные критерии оценок (несмещенность, состоятельность и эффективность) обязательно учитываются при разных способах оценивания. Метод наименьших квадратов строит оценки регрессии на основе минимизации суммы квадратов остатков. Поэтому очень важно исследовать поведение остаточных величин регрессии
. Условия, необходимые для получения несмещенных, состоятельных и эффективных оценок, представляют собой предпосылки МНК, соблюдение которых желательно для получения достоверных результатов регрессии.
Исследования остатков
предполагают проверку наличия следующих пяти предпосылок МНК:
1) случайный характер остатков;
2) нулевая средняя величина остатков, не зависящая от
;
) гомоскедастичность - дисперсия каждого отклонения
, одинакова для всех значений
;
) отсутствие автокорреляции остатков - значения остатков
распределены независимо друг от друга;
5) остатки подчиняются нормальному распределению.
Если распределение случайных остатков
не соответствует некоторым предпосылкам МНК, то следует корректировать модель.
Прежде всего, проверяется случайный характер остатков
- первая предпосылка МНК. С этой целью стоится график зависимости остатков
от теоретических значений результативного признака (рис.2.1). Если на графике получена горизонтальная полоса, то остатки
представляют собой случайные величины и МНК оправдан, теоретические значения
хорошо аппроксимируют фактические значения
.
Возможны следующие случаи, если
зависит от
то:
) остатки
не случайны (рис.2.2а);
) остатки
не имеют постоянной дисперсии (рис.2.2б);
) остатки
носят систематический характер (рис.2.2в).


а б в
Рис.1
.
Зависимость случайных остатков
от теоретических значений
.
В этих случаях необходимо либо применять другую функцию, либо вводить дополнительную информацию и заново строить уравнение регрессии до тех пор, пока остатки
не будут случайными величинами.
Вторая предпосылка МНК относительно нулевой средней величины остатков означает, что
. Это выполнимо для линейных моделей и моделей, нелинейных относительно включаемых переменных.
Вместе с тем, несмещенность оценок коэффициентов регрессии, полученных МНК, зависит от независимости случайных остатков и величин
, что также исследуется в рамках соблюдения второй предпосылки МНК. С этой целью наряду с изложенным графиком зависимости остатков
от теоретических значений результативного признака
строится график зависимости случайных остатков
от факторов, включенных в регрессию
(рис.2.3).
Рис.2
.
Зависимость величины остатков от величины фактора
.
Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений
. Если же график показывает наличие зависимости
и
, то модель неадекватна. Причины неадекватности могут быть разные. Возможно, что нарушена третья предпосылка МНК и дисперсия остатков не постоянна для каждого значения фактора
. Может быть неправильна спецификация модели и в нее необходимо ввести дополнительные члены от
, например
. Скопление точек в определенных участках значений фактора
говорит о наличии систематической погрешности модели.
Перейти на страницу:
1 2 3 4 5 6