Автор работы: Пользователь скрыл имя, 15 Января 2014 в 05:27, лабораторная работа
На основе данных описательной статистики был проведен сравнительный анализ.
В начале были получены по таблице частот гистограммы, на которые были наложены плотности нормального распределения. Таблицы частот используют как одну из процедур разведочного анализа, чтобы посмотреть каким образом различные данные распределены в выборке. Гистограммы позволяют оценить нормальность эмпирического распределения.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
СУРГУТСКИЙ ГОСУДАРСТВЕННЫЙ
ФАКУЛЬТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ
Лабораторная работа по предмету
«Информационные технологии»
Выполнил:
студент группы 141
Маслаков Максим Эдуардович
Проверил:
преподаватель кафедры АСОиУ
Овчаров Михаил Александрович
Сургут
2007 г.
Постановка задачи
По основной описательной статистике провести сравнительный анализ двух метеопараметров, температуры и давления, за 2005 – 2006гг. в теплый и холодной (ночной и дневной) периоды.
Исходные данные.
Исходные данные взяты из Интернета:
http://meteo.infospace.ru/win/
В качестве ночного и дневного периода были взяты замеры соответственно в 0:00 часов и в 15:00 часов.
Описательная статистика:
0:00 часов
Средство |
геометрическое среднее |
Средний |
Минимальный |
Максимальный |
Нижний квартиль |
Верхний квартиль |
Стандартное отклонение |
Стандартная ошибка | |
давление |
1008,594 |
1008,518 |
1008,152 |
975,76 |
1052,46 |
999,92 |
1016,57 |
12,39 |
0,46522 |
температура |
-3,6 |
-1,8 |
-51,4 |
22,5 |
-14,4 |
9,3 |
14,87 |
0,55831 |
15:00 часов
Средство |
геометрическое среднее |
Средний |
Минимальный |
Максимальный |
Нижний квартиль |
Верхний квартиль |
Стандартное отклонение |
Стандартная ошибка | |
давление |
1008,886 |
1008,812 |
1008,474 |
978,046 |
1052,518 |
999,93 |
1016,21 |
12,20 |
0,45794 |
температура |
0,4 |
0,1 |
-50,6 |
31,6 |
-11,2 |
14,2 |
16,34 |
0,61356 |
На основе описательной статистики при сравнении показателей сделаем выводы:
На основе данных описательной статистики был проведен сравнительный анализ.
В начале были получены по таблице частот гистограммы, на которые были наложены плотности нормального распределения. Таблицы частот используют как одну из процедур разведочного анализа, чтобы посмотреть каким образом различные данные распределены в выборке. Гистограммы позволяют оценить нормальность эмпирического распределения.
0:00 часов:
15:00 часов:
На основе данных гистограмм делаем вывод, что в 15:00 часов на протяжении исследуемого периода времени (2 года) число замеров давления содержащегося в интервале от 999 до 1007 больше, чем в 0:00 часов. В теплый период давление повышается, в холодный – незначительно, но понижается. С температурой та же ситуация: количество замеров температуры, лежащей в интервале – 10 до 0, в 0:00 часов ночи больше, чем в 15:00 часов дня, также число замеров температуры от 10 до 20 в 15:00 часов дня, больше чем в 0:00 часов ночи.
Далее проанализируем вероятностные графики метеопараметров.
0:00 часов:
Нормальный вероятностный:
На данных графиках вместо сплайнов можно было использовать прямую линию, так как наблюдаемые значения (по оси X) распределены нормально, то есть практически все значения на графиках попадают на прямую линию.
Полунормальный вероятностный
На данном графике вместо сплайнов можно было использовать прямую линию, так как наблюдаемые значения (по оси X) распределены нормально, то есть практически все значения на графике попадают на прямую линию.
15:00 часов:
Нормальный вероятностный:
На данных графиках вместо сплайнов можно было использовать прямую линию, так как наблюдаемые значения (по оси X) распределены нормально, то есть практически все значения на графиках попадают на прямую линию.
Полунормальный вероятностный:
Нормальные вероятностные графики используются для оценки нормальности распределения переменной, т.е. близости этого распределения к нормальному. Полунормальный вероятностный график отличается от нормального тем, что в первом случае рассматривается лишь положительная часть. Сравнивая все соответствующие вероятностные графики между дневным и ночным периодом метеопараметров температуры и давления, то на всех графиках наблюдается сгущение переменных, а близость нормального распределения имеет резкий характер.
Далее в основной статистике был проведен корреляционный анализ.
Корреляционная матрица для 0:00 часов:
Давление |
Температура | |
Давление |
1,00 |
-0,56 |
Температура |
-0,56 |
1,00 |
Корреляционная матрица для 15:00 часов:
Давление |
Температура | |
Давление |
1,00 |
-0,52 |
Температура |
-0,52 |
1,00 |
Из матриц видно, что температура в том и другом случае имеет отрицательную корреляцию относительно давления, это означает, что с увеличением давления температура понижается (потому что отрицательный коэффициент корреляции показывает, что при возрастании значений одной переменной значения другой убывают.).
Графики корреляции:
0:00 часов:
15:00 часов:
Из данных графиков можно сделать следующие выводы:
Вывод:
В ходе выполнения работы были обработаны данные по температуре и давлению в городе Сургуте за 2005-2006 годы, была получена описательная статистика данных. Был проведен сравнительный анализ метеопараметров дневного и ночного (теплый и холодный) периода. Разница в графиках и показателях не очень существенна. Средняя температура отрицательная, среднее давление чуть завышено, что говорит об обратной зависимости температуры от давления, т.е. если давление повышается, то температура понижается.