Поле корреляции. Неколлинеарные факторы, их коэффициенты частной корреляции
Задача 1 По территориям Южного федерального округа приводятся статистические данные за 2000 год:
Предварительный анализ исходных данных выявил наличие двух территорий с аномальными значениями признаков. Эти территории исключены из дальнейшего анализа. Значения показателей в итоговых строках приведены без учёта указанных аномальных единиц. Задание: . Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X. . Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи. 3. Рассчитайте параметры а1 и а0 парной линейной функции и линейно-логарифмической функции . Оцените тесноту связи с помощью показателей корреляции (ryx и ηylnx) и детерминации (r2yx и η2ylnx), проанализируйте их значения. Надёжность уравнений в целом оцените через F -критерий Фишера для уровня значимости 0,05. На основе оценочных характеристик выберите лучшее уравнение регрессии и поясните свой выбор. . По лучшему уравнению регрессии рассчитайте теоретические значения результата (), по ним постройте теоретическую линию регрессии и определите среднюю ошибку аппроксимации - ε'ср., оцените её величину. . Рассчитайте прогнозное значение результата, если прогнозное значение фактора () составит 1,037 от среднего уровня (). . Рассчитайте интегральную и предельную ошибки прогноза (для 0,05), определите доверительный интервал прогноза (; ), а также диапазон верхней и нижней границ доверительного интервала (), оцените точность выполненного прогноза. Решение: Для построения графика расположим территории по возрастанию значений фактора . См. табл.2. Так как график строится в табличном процессоре EXCEL, то в исходной таблице фактор должен находиться на первом месте, а результат - на втором. Из графика может быть сделан вывод о возможной форме связи валового регионального продукта (Y) с кредитами, предоставленными предприятиям, организациям, банкам и физическим лицам (X). В этом случае для описания зависимости следует построить несколько моделей разного вида и на основе оценочных характеристик выбрать оптимальную форму модели. Таблица 2
Рис. 1 По данным таблицы №2 видно, что с увеличением факторного признака (Х) увеличивается результативный признак (Y). По характеру расположения точек на поле корреляции (по графику) можно сделать вывод о слабой связи. Так как точки корреляционного поля почти не обнаруживают определенную направленность в своем расположении, можно говорить о наличии очень слабой связи (линейной или нелинейной). Обычно моделирование начинается в построения уравнения прямой:, отражающей линейную форму зависимости результата Y от фактора X. Расчёт неизвестных параметров уравнения выполним методом наименьших квадратов (МНК), построив систему нормальных уравнений и решая её, относительно неизвестных а0 и а1. Для расчёта используем значения определителей второго порядка Δ, Δа0 и Δа1 Расчётные процедуры представим в разработочной таблице, в которую, кроме значений Y и X, войдут X2, X*Y, а также их итоговые значения, средние, сигмы и дисперсии для Y и X. См. табл.3. Таблица 3
Расчёт определителя системы выполним по формуле: 10*1163559,63 - 2504,7*2504,7 = 5362074,21 Расчёт определителя свободного члена уравнения выполним по формуле: 156,9*1163559,63 -67831,39*2504,7 = =12665223,41 Расчёт определителя коэффициента регрессии выполним по формуле: 10*1163559,63 -156,9*2504,7 = 285326,47. Расчёт параметров уравнения регрессии даёт следующие результаты: ; . В конечном счёте, получаем теоретическое уравнение регрессии следующего вида: В уравнении коэффициент регрессии а1 = 0,053 означает, что при увеличении объема кредитов на 1 млн. руб. (от своей средней) объём валового регионального продукта возрастёт на 0,053 млрд. руб. (от своей средней). Свободный член уравнения а0 =2,362 оценивает влияние прочих факторов, оказывающих воздействие на объём валового регионального продукта. Построение логарифмической функции предполагает предварительное выполнение процедуры линеаризации исходных переменных. В данном случае, для преобразования нелинейной функции в линейную введём новую переменную , которая линейно связана с результатом. Следовательно, для определения параметров модели будут использованы традиционные расчётные приёмы, основанные на значениях определителей второго порядка. См. расчётную таблицу №4. Таблица 4
|