Автор работы: Пользователь скрыл имя, 10 Ноября 2015 в 12:35, реферат
Степень обоснованности и точности результатов зависит от количества, характера данных, метода их обработки, степени соответствия данных и методов друг другу. Количество данных , минимально необходимое для статистической обработки, в любом самом благоприятном случае не может быть менее 5-8 измерений каждого параметра, признака. Для получения надежных оценок часто необходимо не менее 30-40 измерений.
Глава 1. Проблема обоснованности и точности статистических оценок……3
Глава 2. Корреляционный анализ связей в экономических и производственных системах………………………………………………………………………..6
СОДЕРЖАНИЕ
Глава 1. Проблема обоснованности и точности статистических оценок……3
Глава 2. Корреляционный анализ связей
в экономических и производственных системах…………………………………………………………
Глава 1. Проблема обоснованности и точности статистических оценок
Методы математической и прикладной статистики, в том числе корреляционный и регрессионный анализ, используются в прогнозировании развития экономических, производственных систем, рынков сбыта.
Вполне обосновано предполагается, что все или некоторые данные содержат случайную составляющую. Результаты, получаемые при статистической обработке данных, могут различаться по степени точности и вероятностной обоснованности. Прогнозы могут основываться на статистических оценках, если эти оценки обоснованы, определена их вероятность и точность. Без такого обоснования прогнозы не заслуживают доверия.
Степень обоснованности и точности результатов зависит от количества, характера данных, метода их обработки, степени соответствия данных и методов друг другу. Количество данных , минимально необходимое для статистической обработки, в любом самом благоприятном случае не может быть менее 5-8 измерений каждого параметра, признака. Для получения надежных оценок часто необходимо не менее 30-40 измерений.
Если измерения, оценки охватывают не все изучаемые объекты, а только некоторую их часть, то есть используется выборочный метод, то минимальное число измерений должно быть установлено в соответствии с требуемым уровнем точности и доверительной вероятности, с которой полученные оценки могут быть распространены на всю генеральную совокупность объектов.
Большинство статистических методов и программ в статистических пакетах для обработки данных на компьютерах основываются на гипотезе о нормальном (гауссовском) законе распределения данных, используемых для обработки. Поэтому, как правило, первым этапом анализа данных должна быть их проверка на соответствие закону нормального распределения.
Пример. Проверим гипотезу о нормальном распределении рентабельности и роста промышленного производства в регионах Российской Федерации, ограничившись краями, областями и республиками. Выберем данные об объемах промышленного производства и стоимостном выражении, размерах прибыли и рассчитаем величины рентабельности и годового прироста объемов производства в 1995 г.
Используем систему STADIA 5.0. Введем в таблицу данных 74 пары переменных: соответственно рентабельность и прирост производства в процентах. Используя блок статистики системы и процедуру «Гистограмма и нормальность», получим оценки соответствия распределения нормальному закону и построим гистограммы для каждой переменной.
Напомним, что гистограмма – это диаграмма, показывающая, сколько значений попадает в каждый из интервалов, на которые можно разделить весь диапазон изменения рассматриваемой величины.
С помощью процедуры «Гистограмма и нормальность» в системе STADIA получены оценки соответствия данных нормальному закону распределения. Для данных о рентабельности эти оценки приведены в таблице 1, для данных о темпах прироста – в таблице 2. Использованы следующие критерии:
Колмогорова D, который реагирует на наибольшую разницу между теоретическими и эмпирическим распределением вблизи максимума плотности распределения;
омега-квадрат ω2, который реагирует на более равномерные отклонения от теоретического распределения;
хи-квадрат χ2, который равномерно реагирует на отличия распределений во всем диапазоне, но чувствителен к объему выборки и числу интервалов, на которые разбит диапазон переменной.
Таблица 1
Оценки отличий распределения рентабельности промышленного производства в 1995 г. от нормального распределения
Критерий |
Оценка критерия |
Уровень значимости |
Колмогорова D Омега-квадрат ω2 Хи-квадрат χ2 |
0,09617 0,1047 2,57 |
0,1088 0,0955 0,7658 |
Каждый критерий оценивает гипотезу об отсутствии различий между данными изучаемой выборки и нормальным распределением. Если уровень значимости гипотезы P>0,05, то распределение не отличается от нормального распределения с вероятностью не менее 95%.
Таблица 2
Оценки отличий распределения темпов прироста промышленного производства в 1995 г. от нормального распределения
Критерий |
Оценка критерия |
Уровень значимости |
Колмогорова D Омега-квадрат ω2 Хи-квадрат χ2 |
0,1181 0,1848 12,76 |
0,01594 0,00715 0,0256 |
Оценки, приведенные в таблицах, показывают, что распределение данных о рентабельности соответствует нормальному распределению. Распределение данных о росте производства нельзя считать соответствующим нормальному распределению, так как уровень значимости гипотезы об отсутствии различий не превышает порогового значения 0,05 и составляет по разным критериям соответственно: 0,01594; 0,00715; 0,0256.
Глава 2. Корреляционный анализ связей в экономических и производственных системах
Корреляция; Корреляционная связь (correlation)- это согласованное изменение двух признаков, при котором изменчивость одного признака находится в соответствии с изменчивостью другого.
Корреляционный анализ (
Цель корреляционного анализа — обеспечить получение некоторой информации об одной переменной с помощью другой переменной. В случаях, когда возможно достижение цели, говорят, что переменные коррелируют. В самом общем виде принятие гипотезы о наличии корреляции означает что изменение значения переменной X, произойдет одновременно с пропорциональным изменением значения Y.
Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции.
Корреляционный анализ используют для выявления и оценки связи между различными показателями, характеризующими экономические и производственные системы. Степень тесноты связи оценивают коэффициентами, изменяющимися в пределах от 0 до +1,0. Малое значение коэффициента свидетельствует о слабой связи, значение, близкое по величине к 1,0, характеризует очень сильную связь и часто позволяет предположить наличие функциональной причинно-следственной связи.
В таблице 3 приведены качественные оценки степени тесноты связи в экономических системах с помощью коэффициента корреляции.
Метод оценки корреляционной связи и тип определяемого при этом коэффициента зависят от закона распределения данных.
Таблица 3.
Теснота связи и величина коэффициента корреляции
Коэффициент корреляции |
Теснота связи |
± 0,91+1,00 ± 0,81+0,90 ±0,65+0,80 ±0,45+0,64 ±0,25+0,44 До ± 0,25 |
Очень сильная Весьма сильная Сильная Умеренная Слабая Очень слабая |
Параметрический корреляционный анализ. Это наиболее распространенный и точный вид анализа, для которого разработано всестороннее вероятностное обоснование. Условием обоснованного применения параметрических методов анализа, как правило, является нормальный закон распределения данных, используемых для обработки.
Первый этап анализа – это проверка данных на соответствие закону нормального распределения. Если распределение данных в выборке близко к нормальному закону, то можно оценить наличие линейной связи между переменными с помощью индикатора связи – коэффициента корреляции Пирсона.
Пример. Выявим и оценим наличие и тесноту связи между рентабельностью и ростом промышленного производства в регионах Российской Федерации, ограничившись краями, областями и республиками.
Результаты проверки, полученные в примере, свидетельствуют о том, что распределение одного из показателей отличается от нормального распределения. Поэтому параметрический корреляционный анализ связи рентабельности и темпов роста не будут точными, он позволит получить лишь приближенные оценки связи. Получим их с помощью процедуры «Корреляция» в системе STADIA. Величина оценок составит:
Коэффициент корреляции Пирсона r = 0,2592;
Т-статистика, оценивающая отношение величины коэффициента и его стандартной ошибки (среднеквадратического отклонения) – 2,809;
Уровень значимости гипотезы об отсутствии связи – 0,026 (2,6%).
Таким образом, можно полагать, что между рентабельностью и ростом промышленного производства в 1995 г. имела место связь, эта связь была слабой, так как величина коэффициента корреляции не слишком велика по сравнению с единицей. Отвергать гипотезу о связи нельзя, так как величина коэффициента корреляции значительно превышает его случайную ошибку, а вероятность отсутствия связи мала, всего лишь 2,6%.
Непараметрические методы. Эти методы статистики, в отличии от параметрических не базируются на каких-либо предположениях о законах распределения данных. В качестве непараметрических критериев связи переменных часто используют коэффициент ранговой корреляции Спирмена и коэффициент ранговой корреляции (конкордации) Кендела.
Коэффициент ранговой корреляции Спирмена является непараметрическим аналогом коэффициента корреляции Пирсона и определяется не по величинам переменных признаков, а рангам – номерам в порядке возрастания величин признаков. Он более детально оценивает связь по сравнению с коэффициентом конкордации Кендела, но менее детально, чем коэффициент Пирсона.
Коэффициент конкордации Кендела определяется количеством пар признаков, для которых характерны положительные и отрицательные связи.
Точность коэффициентов, дающих непараметрические оценки связи, определяют с помощью Z – статистики, которая является аналогом T – статистики, и характеризует отношение величины коэффициента и его стандартной ошибки. Аналогично параметрическим методам необходимо оценивать и уровень значимости гипотезы об отсутствии связи.
Пример. Продолжение оценки связи между рентабельностью и ростом промышленного производства в регионах Российской Федерации. Используем систему STADIA 5.0. С помощью процедуры «Корреляция (независимость)» в блоке статистики определим непараметрические оценки связи рентабельности и роста производства.
Коэффициент ранговой корреляции Спирмена составляет 0,303 при Z-статистике величиной 2,686 и уровне значимости гипотезы об отсутствии связи величиной 0,0034. Коэффициент конкордации Кендела составляет 0,2116 при Z-статистике величиной 2,809 и уровне значимости гипотезы об отсутствии связи величиной 0,0024.
Полученные результаты свидетельствуют о несомненной связи между рентабельностью и ростом промышленного производства в регионах Российской Федерации в 1995 г. Теснота этой связи невелика. Интересно отметить, что до 1995 г. такой связи не было вообще, в чем моно убедиться, проведя анализ для 1993 и 1994 гг. Некоторые результаты такого анализа в сопоставлении с оценками для 1995 г. приведены в таблице 4.
Они свидетельствуют о постепенном, медленном формировании тенденции эффективного хозяйствования в промышленности.
Таблица 4.
Связь рентабельности и роста промышленного производства в России
Годы реформ |
1993 |
1994 |
1995 |
Коэффициент ранговой корреляции Спирмена |
-0,07 |
+0,03 |
+0,30 |
Уровень значимости гипотезы об отсутствии связи |
0,396 |
0,456 |
0,000 |
Коэффициент корреляции Пирсона |
-0,10 |
0,00 |
+0,25 |
Уровень значимости гипотезы об отсутствии связи |
0,42 |
0,49 |
0,026 |
Информация о работе Проблема обоснованности и точности статистических оценок