Кадровый потенциал

Кадровый потенциал - совокупность способностей всех людей, которые заняты в данной организации и решают определенные задачи ...

Проверка гипотез относительно коэффициентов линейного уравнения регрессии

Для определения качества модели уравнения регрессии осуществляется процедура проверки гипотез. Статистическая гипотеза - это гипотеза о виде неизвестного распределения, или о параметрах известных распределений.

Основной принцип проверки статистических гипотез: если наблюдаемое значение принадлежит критической области - гипотезу отвергают; если наблюдаемое значение принадлежит области допустимых значений - гипотезу принимают. Правило принятия решения для проверки статистических гипотез - это модель расчета значений выборочных статистических показателей, на основании которых принимается или отвергается нулевая гипотеза.

Процедура проверки гипотезы следующая: необходимо сформулировать нулевую и альтернативную гипотезы; определить уровень значимости; найти наблюдаемое значение, используя формулу стандартизированного критерия; по таблице выяснить критическое значение в соответствии с уровнем значимости и размером выборки, если это необходимо; сравнить критическое значение с наблюдаемым, тем самым использовать правило принятия решения.

Цель работы - овладеть навыками определения параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel, ознакомиться с методикой расчета показателей парной нелинейной регрессии и корреляции, овладеть приемами построения нелинейных регрессионных моделей с помощью MS Exсel, овладеть методикой построения линейных моделей множественной регрессии, оценки их существенности и значимости, расчетом показателей множественной регрессии и корреляции.

Проверка гипотез относительно коэффициентов линейного уравнения регрессии.

Статистическая гипотеза - это гипотеза о виде неизвестного распределения, или о параметрах известных распределений.

Нулевой гипотезой (H0) называют выдвинутую гипотезу.

Конкурирующей (альтернативной)(H1) называют гипотезу, которая противоречит нулевой.

Гипотезу, содержащую только одно предположение, называют простой. Например, математическое ожидание нормально распределенной величины равно 5. Гипотеза, которая состоит из двух или нескольких простых гипотез, называют сложной. Например, математическое ожидание нормально распределенной величины больше 5.

Так как проверку производят методами статистики, ее называют статистической. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность совершить ошибку первого рода принято обозначать α , ее называют уровень значимости. Наиболее уровень значимости принимают равным 0,05 или 0,01.

Статистическим критерием называют случайную величину, которая служит для проверки нулевой гипотезы. Наблюдаемым значением называют значения критерия, вычисленного по выборкам. Критической областью называют совокупность значений критерия, при которых нулевая гипотеза отвергается.

Областью принятия гипотезы (область допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.

Основной принцип проверки статистических гипотез: если наблюдаемое значение принадлежит критической области - гипотезу отвергают; если наблюдаемое значение принадлежит области допустимых значений - гипотезу принимают.

Критические точки - это точки, отделяющие критическую область от области принятия гипотезы. Различают одностороннюю (лево- и правостороннюю) и двустороннюю критические области.

Правило принятия решения для проверки статистических гипотез - это модель расчета значений выборочных статистических показателей, на основании которых принимается или отвергается нулевая гипотеза.

Процедура проверки гипотезы следующая: необходимо сформулировать нулевую и альтернативную гипотезы; определить уровень значимости; найти наблюдаемое значение, используя формулу стандартизированного критерия; по таблице выяснить критическое значение в соответствии с уровнем значимости и размером выборки, если это необходимо; сравнить критическое значение с наблюдаемым, тем самым использовать правило принятия решения.

При проверке качества модели в первую очередь стоит обращать внимание на то, соответствует ли она логике экономического процесса, т.е. мы должны смотреть, реалистичны ли знаки коэффициентов перед независимыми переменными и реалистична ли их величина.статистика:статистика соизмеряет значение коэффициента с его стандартной ошибкой. Фактически же мы проверяем гипотезу о том, равен нулю коэффициент при рассматриваемой переменной или нет. Т.е:: коэффициент=0. Если эта гипотеза верна, то коэффициент не значим.: коэффициент не равен 0. Если эта гипотеза верна, то коэффициент значим.

Выяснить, отвергается нулевая гипотеза или нет, можно 2 способами:

1. Метод критических значений (по таблицам):

a) Находим фактическое значение t:) Определяем число степеней свободы

m=n-k

n - число наблюдений- число оцененных параметров) Выбираем уровень значимости (т.е. вероятность ошибки): 1% или 5%.) Находим критическое значение по таблице:

в таблице выбираем клетку в строке, соответствующей числу степеней свободы и в столбце, соответствующем выбранному уровню значимости.) Сравниваем фактическое значение с табличным:

Если t > t , то коэффициент значим на выбранном уровне значимости (лучше сначала на 1% проверить). Т.е. нулевая гипотеза отвергается.

Если t < t , то коэффициент не значим. Нулевая гипотеза не отвергается.статистика:статистика представляет собой отношение объясненной суммы квадратов (в расчете на одну независимую переменную) к остаточной сумме квадратов (в расчете на одну степень свободы).

Фактически проверяем гипотезу:

Но: все коэффициенты при независимых переменных равны нулю

На: хотя бы один из них нулю не равен.

Выяснить, отвергается нулевая гипотеза или нет, можно 2 способами:

1. По таблицам:

a) Рассчитываем фактическое по формуле:

F(k-1,n-k)= , где

k - число объясняющих переменных.) Находим табличное:

· Выбираем уровень значимости α (1% или 5%)

· Вычисляем число степеней свободы: 1 и (n-2).

· По таблицам F-распределения Фишера определяем критическое значение Fα, 1, n-2 (всегда одностороннее)) Если Fстатистика(фактическое) > Fα , 1, n-2, то уравнение в целом является значимым при выбранном уровне значимости α .

d) В противном случае уравнение в целом незначимо (на данном уровне α).

Задание 1.

. Для характеристики зависимости у от х рассчитать параметры следующих уравнений регрессии:

а) линейной;

б) параболической

в) степенной;

. Рассчитать коэффициент корреляции или индекс корреляции и коэффициент детерминации по каждой модели.

. Оценить каждую модель через среднюю ошибку аппроксиминации Ā и F-критерий Фишера.

Душевой доход, долл., у

Индекс человеческого развития (ИЧР), х

3680

0,566

3650

0,717

3280

0,711

2680

0,672

2600

0,589

2600

0,626

2200

0,513

2150

0,445

1370

0,328

1350

0,393

1350

0,446

линейный регрессия корреляция детерминация

Решение:

1 Расчет параметров линейной регрессии.

Парная линейная регрессия - уравнение вида , где a и b - параметры регрессии, а - погрешность уравнения (случайная величина).

Параметры уравнения a и b, находят посредством Метода Наименьших Квадратов. Рассчитаем вспомогательные параметры в таблице:

Х

У

х*у

Х2

y2

1

0,566

3680

2082,9

0,32

13542400

2

0,717

3650

2617,1

0,51

13322500

3

0,711

3280

2332,1

0,51

10758400

4

0,672

2680

1801,0

0,45

7182400

5

0,589

2600

1531,4

0,35

6760000

6

0,626

2600

1627,6

0,39

6760000

7

0,513

2200

1128,6

0,26

4840000

8

0,445

2150

956,8

0,20

4622500

9

0,328

1370

449,4

0,11

1876900

10

0,393

1350

692,6

0,15

1822500

11

0,446

1350

600,8

0,20

1822500

S

6,006

26910,0

15820,0

3,45

73310100

Ср.зн

0,546

2446,4

1438,2

0,31

6664555

По найденным значениям вычислим параметр b (коэффициент регрессии):

Рассчитаем значение а:

Тогда уравнение регрессии запишется следующим образом:

. Для оценки тесноты связи в эконометрике используется коэффициент корреляции (r).

.

В нашем случае значение коэффициента корреляции 0,85 говорит о сильной связи между х и у, т.е. связь между индексом человеческого развития и душевым доходом очень сильная. Рассчитаем коэффициент детерминации R2. R2=(0.85)2= 0.72. Таким образом, вариация величины доли душевого дохода на 72% зависит от вариации индекса человеческого развития, а на остальные (100%-72%) 28% − от вариации факторов, не включенных в модель.

. Расчет средней ошибки аппроксимации.

Определим среднюю ошибку аппроксимации по формуле:

Используем данные вспомогательной таблицы:

2558,3

12525,3

1521858,7

1121,7

1258255,8

0,3

3400,9

911063,3

1448740,5

249,1

62070,7

0,1

3367,4

848271,1

694949,6

-87,4

7635,3

0,0

3149,8

494766,4

54586,0

-469,8

220674,5

0,2

2686,6

57723,1

23604,1

-86,6

7503,0

0,0

2893,1

199555,5

23604,1

-293,1

85895,9

0,1

2262,5

33791,1

60695,0

-62,5

3911,3

0,0

1883,1

317265,9

87831,4

266,9

71235,6

0,1

1230,2

1478956,7

1158558,7

139,8

19532,9

0,1

1592,9

728331,9

1202013,2

-242,9

59019,8

0,2

1888,7

311011,0

1202013,2

-538,7

290176,1

0,4

Сумма=26913,5

5393261,5

7478454,5

-3,5

2085910,8

1,6

Ср.зн.= 2446,7

490296,5

679859,5

-0,3

189628,3

0,1

Тогда средняя ошибка аппроксимации равна

Практически полагают, что значение средней ошибки аппроксимации не должно превышать 8-15%, для грубого приближения регрессии к реальной зависимости. В нашем случае средняя ошибка аппроксимации приблизительно равна указанному значению, поэтому можно говорить о том, что реальная зависимость существует.

. Оценка значимости уравнения регрессии в целом даётся при помощи F-критерия Фишера. При этом выдвигается нулевая гипотеза (Н0), что b=0, и, следовательно, фактор х не оказывает влияния на фактор у. Но перед этим следует произвести анализ дисперсии. Рассчитаем Dфакт и Dостат:

.

.

Сопоставляя факторную и остаточную дисперсии получаем F-критерий (величину F-отношения): . Если гипотеза Н0 справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для того, чтобы опровергнуть гипотезу Н0, необходимо полученное F-отношение сравнить с табличным Fкр, которое берётся из таблиц Фишера - Снедекора (при разных уровнях значимости) или определяется по функции Excel FPACПОБР.

Вычислим критическое значение критерия Фишера на уровне значимости a=0,05 и числе степеней свободы факторной суммы k1 и числе степеней свободы остаточной суммы k2 с помощью статистической функции FPACПОБР: Fкр(a=0,05, k1 =k-1; k2 =n-k)=5,32, где n=11 - объем выборки; k=2 - количество коэффициентов в уравнении.

Так как F=23> Fкр (a=0,05, k1 = 1; k2 =9)=5, то нулевая гипотеза Н0 отвергается и утверждается, что фактор х оказывает влияние на фактор у, уравнение регрессии признаётся значимым (модель достоверна).

2 Расчет параметров параболической регрессии

Спецификация модели зависимости у от х с помощью параболической функции

Приведем эту функцию к линейному виду. Для этого заменив переменные х=х1, х2=х2, получим двухфакторное уравнение линейной регрессии:

Исходные и расчетные данные для оценки коэффициентов функции представлены в таблице:

Х1

Х2

У

Х1*У

X2*У

х12

Х22

Х1*Х2

y2

1

0,57

0,32

3680

2083

1179

0,32

0,10

0,18

13542400

2

0,72

0,51

3650

2617

1876

0,51

0,26

0,37

13322500

3

0,71

0,51

3280

2332

1658

0,51

0,26

0,36

10758400

4

0,67

0,45

2680

1801

1210

0,45

0,20

0,30

7182400

5

0,59

0,35

2600

1531

902

0,35

0,12

0,20

6760000

6

0,63

0,39

2600

1628

1019

0,39

0,15

0,25

6760000

<\/a>") //-->