Проблема обоснованности и точности статистических оценок

Автор работы: Пользователь скрыл имя, 10 Ноября 2015 в 12:35, реферат

Краткое описание

Степень обоснованности и точности результатов зависит от количества, характера данных, метода их обработки, степени соответствия данных и методов друг другу. Количество данных , минимально необходимое для статистической обработки, в любом самом благоприятном случае не может быть менее 5-8 измерений каждого параметра, признака. Для получения надежных оценок часто необходимо не менее 30-40 измерений.

Содержание

Глава 1. Проблема обоснованности и точности статистических оценок……3
Глава 2. Корреляционный анализ связей в экономических и производственных системах………………………………………………………………………..6

Прикрепленные файлы: 1 файл

Проблема обоснованности и точности статистических оценок.docx

— 30.51 Кб (Скачать документ)

СОДЕРЖАНИЕ

Глава 1. Проблема обоснованности и точности статистических оценок……3

Глава 2. Корреляционный анализ связей в экономических и производственных системах………………………………………………………………………..6                                                                                     

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Глава 1. Проблема обоснованности и точности статистических оценок

 

Методы математической и прикладной статистики, в том числе корреляционный и регрессионный анализ, используются в прогнозировании развития экономических, производственных систем, рынков сбыта.

Вполне обосновано предполагается, что все или некоторые данные содержат случайную составляющую. Результаты, получаемые при статистической обработке данных, могут различаться по степени точности и вероятностной обоснованности. Прогнозы могут основываться на статистических оценках, если эти оценки обоснованы, определена их вероятность и точность. Без такого обоснования прогнозы не заслуживают доверия.

Степень обоснованности и точности результатов зависит от количества, характера данных, метода их обработки, степени соответствия данных и методов друг другу. Количество данных , минимально необходимое для статистической обработки, в любом самом благоприятном случае не может быть менее 5-8 измерений каждого параметра, признака. Для получения надежных оценок часто необходимо не менее 30-40 измерений.

Если измерения, оценки охватывают не все изучаемые объекты, а только некоторую их часть, то есть используется выборочный метод, то минимальное число измерений должно быть установлено в соответствии с требуемым уровнем точности и доверительной вероятности, с которой полученные оценки могут быть распространены на всю генеральную совокупность объектов.

Большинство статистических методов и программ в статистических пакетах для обработки данных на компьютерах основываются на гипотезе о нормальном (гауссовском) законе распределения данных, используемых для обработки. Поэтому, как правило, первым этапом анализа данных должна быть их проверка на соответствие закону нормального распределения.

Пример. Проверим гипотезу о нормальном распределении рентабельности и роста промышленного производства в регионах Российской Федерации, ограничившись краями, областями и республиками. Выберем данные об объемах промышленного производства и стоимостном выражении, размерах прибыли и рассчитаем величины рентабельности и годового прироста объемов производства в 1995 г.

Используем систему STADIA 5.0. Введем в таблицу данных 74 пары переменных: соответственно рентабельность и прирост производства в процентах.  Используя блок статистики системы  и процедуру «Гистограмма и нормальность», получим оценки соответствия распределения нормальному закону и построим гистограммы для каждой переменной.

Напомним, что гистограмма – это диаграмма, показывающая, сколько значений попадает в каждый из интервалов, на которые можно разделить весь диапазон  изменения рассматриваемой величины.

С помощью процедуры «Гистограмма и нормальность» в системе STADIA получены оценки соответствия данных нормальному закону распределения. Для данных о рентабельности эти оценки приведены в таблице 1, для данных о темпах прироста – в таблице 2. Использованы следующие критерии:

Колмогорова D, который реагирует на наибольшую разницу между теоретическими и эмпирическим распределением вблизи максимума плотности распределения;

омега-квадрат ω2, который реагирует на более равномерные отклонения от теоретического распределения;

хи-квадрат χ2, который равномерно реагирует на отличия распределений во всем диапазоне, но чувствителен к объему выборки и числу интервалов, на которые разбит диапазон переменной.

Таблица 1

Оценки отличий распределения рентабельности промышленного производства в 1995 г. от нормального распределения

Критерий

Оценка критерия

Уровень значимости

Колмогорова D

Омега-квадрат ω2

Хи-квадрат χ2

0,09617

0,1047

2,57

0,1088

0,0955

0,7658


 

Каждый критерий оценивает гипотезу об отсутствии различий между данными изучаемой выборки и нормальным распределением. Если уровень значимости гипотезы P>0,05, то распределение не отличается от нормального распределения с вероятностью не менее 95%.

Таблица 2

Оценки отличий распределения темпов прироста промышленного производства в 1995 г. от нормального распределения

Критерий

Оценка критерия

Уровень значимости

Колмогорова D

Омега-квадрат ω2

Хи-квадрат χ2

0,1181

0,1848

12,76

0,01594

0,00715

0,0256


 

Оценки, приведенные в  таблицах, показывают, что распределение данных о рентабельности соответствует нормальному распределению. Распределение данных о росте производства нельзя считать соответствующим нормальному распределению, так как уровень значимости гипотезы об отсутствии различий не превышает порогового значения 0,05 и составляет по разным критериям соответственно: 0,01594; 0,00715; 0,0256.

 

 

 

 

 

 

 

 

 

 

 

 

 

Глава 2. Корреляционный анализ связей в экономических и производственных системах

 

Корреляция; Корреляционная связь (correlation)- это согласованное изменение двух признаков, при котором изменчивость одного признака находится в соответствии с изменчивостью другого.

Корреляционный анализ (correlation analysis) [лат. correlatio — соотношение ] - раздел математической статистики, объединяющий практические методы исследования корреляционной связи между двумя и более случайными признаками или факторами.

Цель корреляционного анализа — обеспечить получение некоторой информации об одной переменной с помощью другой переменной. В случаях, когда возможно достижение цели, говорят, что переменные коррелируют. В самом общем виде принятие гипотезы о наличии корреляции означает что изменение значения переменной X, произойдет одновременно с пропорциональным изменением значения Y.

Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции.

Корреляционный анализ используют для выявления  и оценки связи между различными показателями, характеризующими экономические и производственные системы. Степень тесноты связи оценивают коэффициентами, изменяющимися в пределах от 0 до +1,0. Малое значение коэффициента свидетельствует о слабой связи, значение, близкое по величине к 1,0, характеризует очень сильную связь и часто позволяет предположить наличие функциональной причинно-следственной связи.

В таблице 3 приведены качественные оценки степени тесноты связи в экономических системах с помощью коэффициента корреляции.

Метод оценки корреляционной связи и тип определяемого при этом коэффициента зависят от закона распределения данных.

Таблица 3.

Теснота связи и величина коэффициента корреляции

Коэффициент корреляции

Теснота связи

± 0,91+1,00

± 0,81+0,90

±0,65+0,80

±0,45+0,64

±0,25+0,44

До ± 0,25

Очень сильная

Весьма сильная

Сильная

Умеренная

Слабая

Очень слабая


 

 

Параметрический корреляционный анализ. Это наиболее распространенный и точный вид анализа, для которого разработано всестороннее вероятностное обоснование. Условием обоснованного применения параметрических методов анализа, как правило, является нормальный закон распределения данных, используемых для обработки.

Первый этап анализа – это проверка данных на соответствие закону нормального распределения. Если распределение данных в выборке близко к нормальному закону, то можно оценить наличие линейной связи между переменными с помощью индикатора связи – коэффициента корреляции Пирсона.

Пример. Выявим и оценим наличие и тесноту связи между рентабельностью и ростом промышленного производства в регионах Российской Федерации, ограничившись краями, областями и республиками.

Результаты проверки, полученные в примере, свидетельствуют о том, что распределение одного из показателей отличается от нормального распределения. Поэтому параметрический корреляционный анализ связи рентабельности и темпов роста не будут точными, он позволит получить лишь приближенные оценки связи. Получим их с помощью процедуры «Корреляция» в системе STADIA. Величина оценок составит:

Коэффициент корреляции Пирсона r = 0,2592;

Т-статистика, оценивающая отношение величины коэффициента и его стандартной ошибки (среднеквадратического отклонения) – 2,809;

Уровень значимости гипотезы об отсутствии связи – 0,026 (2,6%).

Таким образом, можно полагать, что между рентабельностью и ростом промышленного производства в 1995 г. имела место связь, эта связь была слабой, так как величина коэффициента корреляции не слишком велика по сравнению с единицей. Отвергать гипотезу о связи нельзя, так как величина коэффициента корреляции значительно превышает его случайную ошибку, а вероятность отсутствия связи мала, всего лишь 2,6%.

Непараметрические методы. Эти методы статистики, в отличии от параметрических не базируются на каких-либо предположениях о законах распределения данных. В качестве непараметрических критериев связи переменных часто используют коэффициент ранговой корреляции Спирмена и коэффициент ранговой корреляции (конкордации) Кендела.

Коэффициент ранговой корреляции Спирмена является непараметрическим аналогом коэффициента корреляции Пирсона и определяется не по величинам переменных признаков, а рангам – номерам в порядке возрастания величин признаков. Он более детально оценивает связь по сравнению с коэффициентом конкордации Кендела, но менее детально, чем коэффициент Пирсона.

Коэффициент конкордации Кендела определяется количеством пар признаков, для которых характерны положительные и отрицательные связи.

Точность коэффициентов, дающих непараметрические оценки связи, определяют с помощью Z – статистики, которая является аналогом T – статистики, и характеризует отношение величины коэффициента и его стандартной ошибки. Аналогично параметрическим методам необходимо оценивать и уровень значимости гипотезы об отсутствии связи.

Пример. Продолжение оценки связи между рентабельностью и ростом промышленного производства в регионах Российской Федерации. Используем систему STADIA 5.0. С помощью процедуры «Корреляция (независимость)» в блоке статистики определим  непараметрические оценки  связи рентабельности и роста производства.

Коэффициент ранговой корреляции Спирмена составляет 0,303 при Z-статистике величиной 2,686 и уровне значимости гипотезы об отсутствии связи величиной 0,0034. Коэффициент конкордации Кендела составляет 0,2116 при Z-статистике величиной 2,809 и уровне значимости гипотезы об отсутствии связи величиной 0,0024.

Полученные результаты свидетельствуют о несомненной связи между рентабельностью и ростом промышленного производства в регионах Российской Федерации в 1995 г. Теснота этой связи невелика. Интересно отметить, что до 1995 г. такой связи не было вообще, в чем моно убедиться, проведя анализ для 1993 и 1994 гг. Некоторые результаты такого анализа в сопоставлении с оценками для 1995 г. приведены в таблице 4.

Они свидетельствуют о постепенном, медленном формировании тенденции эффективного хозяйствования в промышленности.

Таблица 4.

Связь рентабельности и роста промышленного производства в России

Годы реформ

1993

1994

1995

Коэффициент ранговой корреляции Спирмена

-0,07

+0,03

+0,30

Уровень значимости гипотезы об отсутствии связи

0,396

0,456

0,000

Коэффициент корреляции Пирсона

-0,10

0,00

+0,25

Уровень значимости гипотезы об отсутствии связи

0,42

0,49

0,026


 

 

 

 

 

 


Информация о работе Проблема обоснованности и точности статистических оценок