Автор работы: Пользователь скрыл имя, 17 Февраля 2013 в 12:01, методичка
Эконометрика – наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов, т.е. осуществляет количественный анализ реальных экономических явлений – определение Самуэльсона. Более широкий подход – эконометрика – это любое приложение математических и статистических методов к изучению экономических процессов.
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
1,9 |
2,618 |
2, 817 |
3,734 |
5,116 |
4,980 |
3,280 |
3,863 |
4,015 |
4,240 |
Будем считать существенным отличие в 1 тыс., т.е. все значения между 1,5 и 2,5 будем считать равными 2,между 2,5 и 3,5 – равными 3 и т.д. Получим точно такую же таблицу частот, как для «оценки». Эта процедура осуществляется в Excel следующим образом:
Сервис – Анализ данных –Гистограмма. В качестве Входного интервала следует задать массив данных, а в качестве интервала карманов – массив «границ», т.е. в нашем случае – массив 1,5 2,5 3,5 4,5 5,5.
Самое существенное отличие НСВ от ДСВ состоит в том, что для ДСВ можно указать ненулевую вероятность того, что она, а для НСВ – вероятность того, что она принимает конкретное значение равна 0! (вероятность того, что прибыль в точности 3,175!)
X1 |
X2 |
.. |
Xm |
p1 |
p2 |
.. |
pm |
Математическое ожидание.
Пусть ДСВ X (N испытаний) задана таблицей вероятностей.
E(X) -мат. ожиданием X называется число
E(X)= x1*p1+x2*p2+….+xm*pm
Смысл E(X) - среднее значение X.
Действительно – преобразуем X в ряд значений. Получим
x1, ..x1 |
x2,..x2 |
…… |
xm,..xm |
p1*N раз |
p2*N раз |
pm*N раз |
Расчет среднего арифметического такого набора чисел даст в точности E(X)!
Таким образом математическое ожидание X - это ожидаемое значение X!
Для «оценки» E(X)=2*0,1+3*0,3+4*0,4+5*0,2=
Свойства математического ожидания.
Для расчета мат.ожидания ДСВ по ряду значений можно использовать функцию Excel – СРЗНАЧ(диапазон – ряд значений дискретной СВ), для расчета мат. ожидания по таблице вероятностей или частот – только счет по формулам.
X – задана таблицей вероятностей. Дисперсией X называется величина D(X)
D(X)=(x1-E(X))2+(x2-E(X))2+…+(
Легко видеть, что D(X)=E(X2)-E(X)2
Дисперсия – мера рассеяния СВ.
Пример.
Рассматриваем две случайных величины X и Y -прибыль для двух типов предприятий. Есть таблицы вероятностей.
99 |
101 |
0,5 |
0,5 |
0 |
200 |
0,5 |
0,5 |
И в первом, и во во втором случаях математические ожидания одинаковы:
E(X)=E(Y)=100. Вопрос – куда лучше вкладывать деньги? Ожидаемая прибыль – одинакова. Однако при вложении в Y можно все потерять с вероятностью 50%, т.е. второй тип предприятий значительно более рискованный. Рассмотрим дисперсии. D(X)= (-1)2*0,5+1*2*0,5=1
D(Y)=(-100)2*0,5+(100)2*0,5=
Свойства дисперсии.
Пусть Y=X+a ; тогда D(Y)=D(X)
Пусть Y=X*k; тогда D(Y)=D(X)*k2
Если СВ задана рядом значений или вариационным рядом для расчета дисперсии служит функция Excel ДИСПР(диапазон– ряд значений дискретной СВ), при заданной таблице вероятностей – расчет по формуле.
σ(X)= - мера рассеяния вокруг среднего значения в единицах, сопоставимых с E(X).
Если СВ задана рядом значений или вариационным рядом для расчета СКО служит функция Excel СТАНДОТКЛОНП (диапазон– ряд значений дискретной СВ), при заданной таблице вероятностей – расчет по формуле.
Вариацией называется величина V(X)
V(X)= (обычно в процентах).
Обзор первой лаб. работы.
Для дискретной СВ рассмотрены 4 способа представления: ряд значений, вариационный ряд, таблица частот, таблица вероятностей. Для непрерывной СВ ни один из этих способов не возможен. Однако любая СВ определяется своей функцией распределения. Пусть задана СВ X. Вероятность того, что X принимает значения, меньшие, чем t, будем обозначать как P{X<t}. Функция распределения СВ X F(t) - это вероятность того, что СВ X принимает значения, меньшие t.
F(t) =P{X<t}.
Свойства функции распределения
F(-∞)=0
0≤F(t)≤1
F(t) – возрастающая функция.
Функция распределения для дискретной СВ – ступенчатая.
ПРИМЕР – СВ оценка. Функция распределения для нее
F(t) =0 t ≤2; F(T)=0,1 2< t ≤3; F(t)=0,4 3<t≤4; F(t)=0,8 4<t≤5;F(t)=1 t>5
График функции распределения дискретной СВ в Excel можно построить следующим образом: СЕРВИС – АНАЛИЗ ДАННЫХ – Гистограмма (входной интервал – ряд значений) – Интегральный процент.
Непрерывную СВ нельзя задать с помощью ряда значений – в этом случае она станет дискретной. Непрерывная СВ полностью определяется своей функцией распределения. Принципиальное отличие дискретной СВ от непрерывной СВ состоит в том, что для дискретной СВ можно указать ненулевую вероятность того, что она принимает конкретное значение, а для непрерывной СВ такая вероятность всегда равна 0. (Если прибыль может принимать любое значение от 3 до 8, то вероятность того, что она равна в точности 5, 515 равна 0).
Для непрерывной СВ, принимающей значения в интервале от a до b - функция распределения непрерывная и имеет вид примерно такой:
Графики функций распределения для разных непрерывных СВ «похожи» друг на друга, поэтому ввели еще одну характеристику непрерывной СВ – плотность вероятности f(t)=F′(t).
Свойства плотности вероятности.
Пусть X [a,b].
F(t)=0 при t<a, поэтому f(t)=0 при t<a ;
F(t)=1 при t>b, поэтому f(t)=0 при t>b ;
F(t) –возрастающая функция, поэтому f(t) ≥ 0 для всех t.
Типичный график для плотности вероятности выглядит так:
Смысл плотности вероятности:
=P{α<X<β}.
Известно, что такой интеграл представляет собой площадь криволинейной трапеции S1. Таким образом площадь области S1- это вероятность того, что СВ X принимает значения из интервала (α, β). Площадь области S2- это вероятность того, что СВ X принимает значения, меньшие γ .
Основной вывод – если известна плотность вероятности СВ, можно оценить вероятность попадания СВ в заданный промежуток.
Пусть СВ X непрерывная. Математическое ожидание E(X) и дисперсия D(X) определяются соответственно:
СВ X называется центрированной, если ее математическое ожидание E(X)=0.
СВ X называется нормированной, если ее дисперсия D(X)=1.
Центрированная и
Любую СВ X можно стандартизировать. Пусть E(X)=m, D(X)=d, т.е. X(m,d).
Рассмотрим новую СВ Z
Очевидно, что E(Z)=0, D(Z)=1.
В эконометрическом анализе активно используются следующие виды законов распределения:
Нормальное распределение;
Распределение χ2 (Хи-квадрат);
Распределение Фишера;
Распределение Стьюдента.
Нормальное распределение является предельным случаем почти всех реальных распределений, поэтому именно оно чаще всего используется в практических приложениях. Основанием этого утверждения служит центральная предельная теорема Ляпунова.
Теорема Ляпунова. Распределение суммы n произвольно распределенных и взаимно-независимых СВ при стремится к нормальному, если вклад отдельных слагаемых равномерно мал. Как правило, реальные экономические показатели, которые изучаются в эконометрике, складываются под влиянием множества различных факторов (расходы на питание зависят от дохода семьи, количества членов семьи, региона проживания и пр.). Именно поэтому как правило для экономических показателей можно считать, что это нормально распределенные СВ.
Плотность вероятности f(t) для нормального распределения задается формулой Здесь m и σ соответственно математическое ожидание и среднее квадратичное отклонение СВ X. Обозначение - X~N(m, σ).
График нормального
Для X~N(m, σ) справедливо правило «3-х сигма».
P{m- σ<X< m+σ}=0,68
P{m- 2σ<X< m+2σ}=0,95
P{m- 3σ<X< m+3σ}=0,997
Т.о. с вероятностью более 99% можно утверждать, что нормально распределенная СВ X с математическим ожиданием m и средним квадратичным отклонением σ попадает в промежуток [m- 3σ,m+3σ].
Пусть прибыль по некоторому типу
предприятий можно считать
Если известно, что X~N(m, σ), то для любых x1,x2 можно рассчитать P{x1X<x2}. Раньше это делалось по таблицам функции Гаусса. В Excel для функция НОРМРАСП(x,m, σ,I) возвращает значения f(x) при I=0, F(x) при I=1.
Пусть для прибыли предприятия X можно считать X~N(5, 1). Требуется определить вероятность того, то прибыль меньше 3,5.
НОРМРАСП(3,5, 5,1,1)= 0,352065, т.е. 35%
Требуется определить вероятность того, то прибыль попадает в промежуток от 3,5 до меньше 6,5, т.е. P{3,5<X<6,5}.
НОРМРАСП(3,5, 5,1,1)= 0,066807
НОРМРАСП(6,5, 5,1,1)= 0,933193
P{3,5<X<6,5}= НОРМРАСП(6,5, 5,1,1)- НОРМРАСП(3,5, 5,1,1)= 0,866386, т.е. 86%.
Пусть X1 , X2 ,….Xn - стандартные СВ Xi ~N(0, 1).
Тогда их сумма квадратов имеет распределение χ2 с n степенями свободы.
Y= X12+ X22+…+ Xn2 Y ~ χ2(n ).
Для распределения χ2 график плотности вероятности ассиметричен, при больших n распределение χ2 стремится к нормальному.
Пусть V и – независимые СВ, распределенные по закону χ2 с n и m степенями свободы, т.е. V ~ χ2(n ); W ~ χ2(m ).
Тогда имеет распределение Фишера с n степенями свободы в числителе и m степенями свободы в знаменателе, т.е. распределение Фишера определяется двумя параметрами n и m. Обозначение F ~ F(n,m ). При больших n распределение Фишера стремится к нормальному.
Пусть U ~N(0, 1), V ~ χ2(n ).
Тогда T= имеет распределение Стьюдента с n степенями свободы (t- распределение). При n>30 распределение Стьюдента практически неотличимо от нормального распределения N(0, 1).
Это были рассмотрены базовые понятия теории вероятностей. Теперь рассмотрим базовые понятия статистики.
При исследовании реальных
экономических процессов
Генеральной совокупностью называется множество всех возможных значений или реализаций исследуемой СВ при данном реальном комплексе условий. Независимо от того, является ли исследуемая СВ дискретной (количество детей в семье) или непрерывной (прибыль предприятия) –изучить всю генеральную совокупность невозможно. Выборкой из генеральной совокупности значений СВ называется часть генеральной совокупности, отобранная для изучения, т.е. выборка-это конечное множество значений СВ, описанное рядом значений, таблицей частот или таблицей вероятностей.