Автор работы: Пользователь скрыл имя, 04 Сентября 2013 в 18:46, контрольная работа
1) Предварительный анализ исходных данных выявил наличие одной территории (Краснодарский край) с аномальными значениями признаков. Эта территория исключена из дальнейшего анализа. Значения показателей в итоговых строках приведены без учёта указанной аномальной единицы.
Задание:
1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.
2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.
3. Рассчитайте параметры а1 и а0 парной линейной функции .
4. Оцените тесноту связи с помощью показателей корреляции (ryx) и детерминации (r2yx), проанализируйте их значения.
5. Надёжность уравнений в целом оцените через F-критерий Фишера для уровня значимости a=0,05.
6. На основе оценочных характеристик выберите лучшее уравнение регрессии и поясните свой выбор.
Это означает, что фактическая реализация прогноза не будет находиться в доверительном интервале . Верхняя граница доверительного интервала составит
Нижняя граница доверительного интервала составит:
Относительная величина различий значений верхней и нижней границ составит: = раза. Это означает, что верхняя граница в 12,3 раза больше нижней границы, то есть точность выполненного прогноза очень невелика, но его надёжность на уровне 95% оценивается как высокая. Причиной небольшой точности прогноза является повышенная ошибка аппроксимации. Здесь её значение выходит за границу 5-7% из-за недостаточно высокой типичности линейной регрессии, которая проявляется в присутствии единиц с высокой индивидуальной ошибкой. Если удалить территории с предельно высокой ошибкой (например, Астраханскую область с ), тогда качество линейной модели и точность прогноза по ней заметно повысятся.
Задача №2.
Проводится анализ значений социально-экономических показателей по территориям Северо-Западного федерального округа РФ за 2000 год.
Y – Валовой региональный продукт, млрд. руб.;
X1 – Инвестиции 2000 года в основной капитал, млрд. руб.;
X2 – Среднегодовая стоимость основных фондов в экономике, млрд. руб.;
X3 – Кредиты, предоставленные в 2000 году предприятиям, организациям, банкам и физическим лицам, млрд. руб.
Требуется изучить влияние указанных факторов на стоимость валового регионального продукта.
Предварительный анализ исходных данных по 10 территориям выявил наличие одной территории (г. Санкт-Петербург) с аномальными значениями признаков. Эта единица должна быть исключена из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанной аномальной единицы.
При обработке исходных данных получены следующие значения:
А) - линейных коэффициентов парной корреляции, средних и средних квадратических отклонений -σ:
N=9.
Y |
X1 |
X2 |
X3 | |
Y |
1 |
0,7677 |
0,8653 |
0,4237 |
X1 |
0,7677 |
1 |
0,8897 |
0,0157 |
X2 |
0,8653 |
0,8897 |
1 |
-0,0179 |
X3 |
0,4237 |
0,0157 |
-0,0179 |
1 |
Средняя |
31,92 |
8,87 |
121,18 |
0,5683 |
σ |
14,61 |
5,198 |
48,19 |
0,6942 |
Б) - коэффициентов частной корреляции
Y |
X1 |
X2 |
X3 | |
Y |
1 |
-0,1462 |
0,8737 |
0,8791 |
X1 |
-0,1462 |
1 |
0,5562 |
0,1612 |
X2 |
0,8737 |
0,5562 |
1 |
-0,7842 |
X3 |
0,8791 |
0,1612 |
-0,7842 |
1 |
Задание:
1. По значениям линейных коэффициентов парной и частной корреляции выберите неколлинеарные факторы и рассчитайте для них коэффициенты частной корреляции. Проведите окончательный отбор информативных факторов во множественную регрессионную модель.
2. Выполните расчёт бета коэффициентов (b) и постройте с их помощью уравнение множественной регрессии в стандартизованном масштабе. Проанализируйте с помощью бета коэффициентов (b) силу связи каждого фактора с результатом и выявите сильно и слабо влияющие факторы.
3. По значениям b-коэффициентов рассчитайте параметры уравнения в естественной форме (a1, a2 и a0). Проанализируйте их значения. Сравнительную оценку силы связи факторов дайте с помощью общих (средних) коэффициентов эластичности - .
4. Оцените тесноту множественной связи с помощью R и R2, а статистическую значимость уравнения и тесноту выявленной связи - через F-критерий Фишера (для уровня значимости a=0,05).
5. Рассчитайте прогнозное значение результата, предполагая, что прогнозные значения факторов составят 102,1 процента от их среднего уровня.
6. Основные выводы
оформите аналитической
Решение.
Расчёты частных коэффициентов корреляции выполним по следующим формулам:
Как видим, фактор X1 и X2, тесно связаны между собой, а с результатом заметно взаимосвязан фактор X2, связь с результатом фактора X1 – слабая.
Расчёт аналогичных показателей по следующей паре факторов приводит к иным результатам:
В данном случае, межфакторное взаимодействие оценивается как слабое ( ) а связь факторов X2 и X3 – весьма тесная и тесная соответственно. Таким образом, вторая из рассмотренных пар факторных признаков (X2 и X3 ) в большей мере отвечает требованиям, предъявляемым МНК к исходным данным и, в частности, к отсутствию межфакторного взаимодействия. Указанные обстоятельства позволяют использовать X2 и X3 в качестве информативных факторов уравнения множественной регрессии.
В результате получено уравнение в стандартизованном масштабе:
Параметры данного уравнения представляют собой относительные оценки силы влияния каждого из факторов на результат. При увеличении среднегодовой стоимости основных фондов на одну сигму (от своей средней) валовой региональный продукт увеличится на 0,872 своей сигмы ( ); с увеличением предоставленных кредитов на результат увеличится на 0,439 .Сравнивая b-коэффициенты, определяем, какой из признаков влияет на результат сильнее, а какой – слабее. В данном случае увеличение валового регионального продукта происходит, прежде всего, под влиянием увеличения среднегодовой стоимости основных фондов и в меньшей степени – в результате увеличения предоставления кредитов.
В конечном счёте, имеем
уравнение:
По значениям коэффициентов регрессии можно судить о том, на какую абсолютную величину изменяется результат при изменении каждого фактора на единицу (от своей средней).
С увеличением среднегодовой стоимости основных фондов на 1 млрд. руб. валовой региональный продукт увеличивается на 0,264 млрд. руб., с увеличением предоставленных кредитов на 1 млрд. руб. валовой региональный продукт возрастает на 6,318 млрд. руб.
Точную оценку силы связи факторов с результатом дают коэффициенты эластичности и β - коэффициенты.
4. Для сравнительной оценки силы связи выполним расчёт средних коэффициентов эластичности. С их помощью можно определить, на сколько процентов изменяется результат при изменении фактора на 1% (от своего среднего значения). В нашем случае расчёт показал, что влияние численности населения на розничный товарооборот оказалось более сильным по сравнению с влиянием инвестиций в экономику: С увеличением среднегодовой стоимости основных фондов на 1 % валовой региональный продукт увеличивается на 100,2 %, с увеличением предоставленных кредитов на 1 % валовой региональный продукт возрастает на 16,5%.
Различия в силе влияния весьма значительны: первый фактор влияет на результат почти в десять раз сильнее, чем второй. Поэтому регулирование величины валового регионального продукта через среднегодовую стоимость основных фондов будет более результативным, чем через размер предоставленных кредитов.
5. Тесноту выявленной зависимости розничного товарооборота от инвестиций в экономику региона и от численности населения оценивают множественный коэффициент корреляции и детерминации. Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и β - коэффициентов. В нашем случае 2-х факторной зависимости расчёт строится следующим образом:
Как показали расчёты, установлена весьма тесная зависимость уровня валового регионального продукта от среднегодовой стоимости ОФ и выданных кредитов. Это означает, что 94,05% вариации валового регионального продукта определены вариацией данных факторов. Оставшиеся 5,95% вариации результата сформировались под влиянием прочих причин, роль которых незначительна.
6. Оценка статистической значимости или надёжности установленной формы зависимости, её параметров, оценок её силы и тесноты является важным этапом анализа результатов. Для выполнения оценки формулируется нулевая гипотеза, которая рассматривает предположение о случайной природе полученных результатов. То есть, .
Для проверки выдвинутой нулевой гипотезы используется F-критерия Фишера. Его фактическое значение определяется, исходя из соотношения факторной и остаточной дисперсий и их степеней свободы: d.f.1=k и d.f.2=n-k-1; где: n –число изучаемых единиц; k – число ограничений, которые накладываются на исходные данные при расчёте данного показателя. Здесь k равно числу факторов уравнения, то есть k=2.
В нашем случае, когда
рассматривается зависимость
Фактическое значение критерия показывает, что детерминация, сформированная под воздействием двух изучаемых факторов, почти в 43 раза больше, чем детерминация, связанная с действием прочих причин. Очевидно, что подобное соотношение случайно сформироваться не может и является результатом влияния существенных, систематических факторов.
Для принятия обоснованного решения Fфактич. сравнивается с Fтабличн., которое формируется случайно и зависит степеней свободы факторной (d.f.1 = k) и остаточной (d.f.2 = n-k-1) дисперсий, а также от уровня значимости α=0,05. В нашем примере, где d.f.1=k= 2 и d.f.2=n-k-1 = 9-2-1=6 при α=0,05 Fтабл = 5,14. (См. табл. приложения 1). В силу того, что Fфактич =42,76> Fтабл. = 5,14, можно с высокой степенью надёжности отклонить нулевую гипотезу, а в качестве альтернативы – согласиться с утверждением, что проверяемые параметры множественной регрессионной модели неслучайны, что коэффициенты уравнения и показатели тесноты связи не являются случайными величинами.
7. Техническая часть прогнозных расчётов по уравнению множественной регрессии сравнительно проста. Достаточно определить прогнозные значения каждого факторного признака , подставить их в уравнение и выполнить с ними расчёт прогнозного значения результата - . При этом следует помнить, что требования к точности и надёжности прогноза предъявляют к используемой модели повышенные требования. В нашем случае, прогнозное значение каждого из факторов, то есть и , получено на основе средней величины:
После подстановки в уравнение получаем следующий результат:
Если среднегодовая стоимость ОФ возрастет до 123,6 млрд. руб., а размер выданных кредитов составит 0,58 млрд. руб., тогда следует ожидать, что валовой региональный продукт возрастет до 32,67 млрд. руб., то есть увеличится на 2,4% от своего среднего уровня.