Автор работы: Пользователь скрыл имя, 22 Сентября 2014 в 11:04, контрольная работа
Широкое применение компьютеров в лесоустройстве и в лесхозах сделало биометрические методы доступными широкому кругу лесоводов. В то же время лесовод не может быть бездумным пользователем компьютерных результатов биометрических измерений и вычислений. Он дол жен понимать суть изучаемого явления или процесса, разбираться в алгоритме и механизме вычислений, которые выполнил компьютер по заданной про грамме.
Но в силу присущих им недостатков они малопригодны для измерения вариабельности признаков. Дело в том, что эти показатели неустойчивы: они зависят от многих случайных причин и при повторных выборках могут резко менять свое значение. Главный же недостаток указанных показателей заключается в том, что они не отражают существенные черты варьирования.
Среднее линейное отклонение Для измерения вариации можно использовать центральный момент первого порядка как одну из характеристик вариационного ряда, представляющую сумму отклонений вариант от средней арифметической, отнесенную к общему числу вариант данной совокупности.
Этот показатель, называемый средним линейным отклонением, может иметь значение только при условии, что отклонения вариант от средней арифметической берутся без учета знаков, так как в противном случае Используем этот показатель для характеристики взятого нами примера.
Среднее квадратическое отклонение Чтобы преодолеть недостатки линейного отклонения, принято отклонения вариант от средней арифметической возводить в квадрат и сумму квадратов отклонений относить к общему числу наблюдений, т.е. к объему выборки. Полученный таким образом показатель служит центральным моментом второго порядка, он характеризует дисперсию или рас сеяние вариант около средней арифметической. Этот показатель, называемый дисперсией, или вариансой. Для непрерывной случайной величины, заданной аналитически, дисперсию находят по формуле:
При возведении отклонений вариант от средней арифметической в квадрат их сумма не превращается в нуль, так как и положительные и отрицательные отклонения получают один и то же положительный знак.
Кроме того, большие отклонения от средней, будучи возведены в квадрат, получают и больший «удельный вес», оказывая большее влияние на величину показателя вариации.
Однако, возводя отклонения вариант от средней арифметической в квадрат, мы, таким образом, искусственно увеличиваем и самый показатель вариации. Чтобы преодолеть это, вместо дисперсии берут корень квадратный из указанного отношения:
Способы вычисления среднеквадратического отклонения Способов вычисления среднеквадратического отклонения вариационного ряда как и других его показателей (статистик) есть несколько. В настоящее время для вычисления статистик разработаны компьютерные программы.
Асимметрия, эксцесс, коэффициент вариации Центральные моменты используют для вычисления главных статистических показателей ряда распределения
Среднеквадратическое отклонение, как и средние величины ряда, является именованной величиной, выражающейся в величинах измерения ряда.
Для решения многих теоретических и практических вопросов лесной биометрии нужны относительные величины, характеризующие общие особенности размаха ряда распределения. Таким показателем является коэффициент вариации, который в литературе по лесному хозяйству называют еще показателем изменчивости таксационных признаков лесных насаждений.
Коэффициент вариации представляет собой показатель изменчивости изучаемого признака, выраженный в относительных единицах, обычно в процентах. Он определяется по формуле где – коэффициент вариации;
– среднеквадратическое отклонение;
- среднее значение.
Так как коэффициент вариации не зависит от принятых единиц измерения (при делении на единицы измерения взаимно уничтожаются), то он применяется при сравнительной оценке варьирования различных признаков.
В лесном хозяйстве это могут быть диаметр дерева, его высота, объем, при рост и т.д.
Значение коэффициента вариации используют для вычисления точности исследования.
Распределения могут быть дискретными и непрерывными.
Все, что может быть измерено или исчислено в живой природе, называют величиной постоянной или переменной. В зависимости от обстоятельств эти величины могут принимать разные значения. Переменную величину считают определенной, если заранее, до опыта можно указать ее значение. Если же в одних и тех же условиях переменная величина может принимать разные значения, которые заранее указать нельзя, она называется случайной величиной. Понятие случайной величины, как и понятие случайного события, относится к фундаментальным в теории вероятностей.
Случайные величины бывают зависимыми и независимыми. Случайные величины называют независимыми, если вероятность любого значения од ной величины (Х) не зависит от того, какие значения принимает другая вели чина (У). В противном случае эти величины находятся в зависимости одна от другой и называются взаимозависимыми случайными величинами. Например, мы изучаем некоторый участок леса. Там имеется определенная почва, на которой растут деревья. На одной и той же почве могут расти разные деревья: сосна, береза, ель и другие. Механический состав почвы не зависит от того, какой древесный вид сегодня здесь растет. Таким образом при рассмотрении системы почва-дерево характеристики почвы, скажем, процент физической глины, будет величиной независимой. В то же время высота дерева, да и сам породный состав лесного участка определяется почвенными условиями, т.е. показатели роста деревьев зависят от почвенных характеристик и являются величиной зависимой. Если мы будем рассматривать диаметр и высоту дерева, то обнаружим, что с изменением одного показателя меняется и второй. Это величины взаимозависимые.
Эмпирические функции распределения.
В лесной биометрии мы, как правило, имеем дело с эмпирическими функциями распределения. Это значит, что, выполняя некоторые измерения случайной величины, например, диаметры деревьев в лесу, получаем распре деление и определяем вид этого распределения, руководствуясь графиком некоторой функции распределения.
В эмпирических распределениях, т. е. тех, которые наблюдаем, проводя измерения в лесу, бросается в глаза одна важная особенность - преимущественное накапливание вариант в центральных классах и постепенное убывание их числа по мере удаления от средней арифметической вариационного ряда. Эта особенность, составляющая одну из характерных черт варьирования биологических признаков вообще и лесохозяйственных в частности, факт фундаментального значения,
Одним из достаточно распространенных видов подобных распределений является биномиальное
Биномиальное разложение как проявление событий с двумя входами Биномиальное распределение обычно применяют, когда необходимо провести исследование событий, которые могут наступить или не наступить.
Распределение Пуассона как частный случай биномиального распределения В лесохозяйственной науке и практике часто встречаются случаи, когда из двух (или более) наблюдаемых явлений одно встречается редко.
Подобные примеры редких явлений часто встречаются в физике, биологии и других науках. Для описания названных и других подобных распределений обычно применяют распределение Пуассона.
Распределение Пуассона. Распределение Пуассона, или пуассоново распределение, подобно биномиальному, относится к дискретной или прерывистой изменчивости. Оно имеет самостоятельное значение, хотя его можно рассматривать и как предельный случай биномиального. При биномиальном распределении значения a и b могут быть близки друг к другу, при пуассоновом же a очень мало, т.е. события осуществляются очень редко, а b приближается к единице.
Распределение отдельных редких наблюдений является при этом чаще всего асимметричным, но симметрия возрастает с увеличением.
При увеличении a распределение приближается к биномиальному.
Пуассоново распределение характеризуется в сущности только одним параметром - средней арифметической обычно равна или близка ей по значению. Именно по этому равенству и легче всего определить, что данное распределение является пуассоновым.
В лесном хозяйстве к распределению Пуассона прибегают, когда исследуют мутации при проведении генетико-селекционных исследований, при анализе появления альбиносов среди лесных зверей и птиц, для оценки выживаемости самосева сосны под пологом леса и т.д., при анализе других редких событий.
Еще в XIX веке немецкими лесоводами и таксаторами (Вейзе и др.), а за тем и в России (А.В. Тюрин (1882-1979) и др.) было доказано, что распределение числа деревьев в древостое по таксационным показателям соответствует закону нормального распределения. Но более глубокие исследования, проведенные во второй половине XX века, показали, что это не совсем так. Реальная кривая похожа на кривую нормального распределения, но чаще всего бывает скошенной вправо или влево, более плоской или более остроконечной. Оказалось, что кривой Гаусса-Лапласа соответствуют, да и то не всегда, древостои естественного происхождения, растущие без вмешательства человека и имеющие возраст, близкий к спелому (для сосны это 80 лет и старше). В большинстве случаев кривая, которой хорошо моделируются распределения деревьев в лесах Беларуси, лишь близка к нормальному распределению. Называется она кривой обобщенного нормального распределения или кривая типа А. Ее еще называют кривой Грама-Шарлье, иногда просто кривой Шарлье.
В том случае, когда статистики распределения и Е или один из них оказались значимыми, или когда при интервальной оценке параметров и Е интервал перекрывает нуль, выравнивающие частоты бывает целесообразно рассчитать именно по уравнению обобщенного нормального распределения.
Это распределение является разложением в ряд уравнения кривой нормального распределения. Оно учитывает имеющиеся асимметрию и эксцесс. Выравнивание по этому уравнению, как показали многочисленные исследования, дает лучшую аппроксимацию экспериментального ряда числа стволов по диаметру и высоте в антропогенных лесах, чем нормальное распределение. Последнему отдают предпочтение лишь в тех случаях, когда t0,05 и Еt0,05. Исходят при этом из положения, что при недоказанном отклонении распределения от нормального, надежнее считать это распределение следующим модели нормального распределения, а найденные показатели и Е относить за счет случайного состава выборочной совокупности.
Другие распределения
В лесных исследованиях используется ряд других распределений.
Гамма- и бета- распределения. Гамма- и бета- распределения принадлежат к числу основных моделей, используемых при изучении распределений. Оба они связаны с одним из наиболее общих распределений – распределением Маркова, из которого можно получить практически все встречаемые в приложениях распределения как предельные стохастические кривые. Условия, при которых формируются гамма- и бета – распределения, весьма широки в зависимости от величины входящих в них параметров. Как правило, они могут описывать любую практическую ситуацию из приведенных в настоящем параграфе, а ряд рассмотренных распределений может быть получен как частные случаи гамма- и бета- распределений.
Гамма- распределение – одна из основных статистических моделей для представления распределений случайной вели чины, ограниченных с одной стороны
В основе оценок статистик лежит знание об их распределении. Так, если из одной генеральной совокупности взять некоторое число выборок и для каждой из них определить статистики, например, и, то можно выявить распределение этой статистики, которая тоже является случайной величиной.
Знание закона распределения искомой статистики позволяет делать ее вероятные оценки. Следовательно, оценку искомого статистического параметра можно сделать только с определенной вероятностью.
Теоретическую основу таких оценок дает теория вероятности и описываемый ею закон больших чисел. Здесь важными для решения наших задач являются теоремы Маркова, Чебышева, Пуассона и Бернулли. Их подробное изложение с приведением доказательств есть в учебниках по теории вероятностей, а также в книге А.К. Митропольского. Учитывая ограниченность курса лесной биометрии, приведем здесь лишь сами теоремы без их доказательства в том порядке, в каком они взаимосвязаны.
Доказательства названных теорем базируются на использовании леммы Маркова.
Лемма Маркова формулируется следующим образом. Если случайная величина х может принимать только положительные значения, то вероятность P того, что эта величина не превзойдет своего математического ожидания М(х), умноженного на некоторое положительное число t2, больше разности между единицей и числом, обратным данному положительному числу.
Лемма Маркова является основным предложением статистического исчисления. Замечательным свойством этой леммы является ее независимость от природы распределения положительной случайной величины. На лемме Маркова основано доказательство многих теорем статистического исчисления и, в частности, важнейшей из этих теорем – закона больших чисел.
Неравенство Чебышева. Лемма Маркова дает возможность найти вероятность того, что положительная случайная величина примет значение, не превышающее некоторого данного числа; при этом требуется только знание математического ожидания этой величины.
Определенное заключение о случайной величине дает также не равенство Чебышева, которое приложимо к каким угодно (не обязательно положительным) случайным величинам, причем требуется только знание математического ожидания и дисперсии случайной величины.
Теорема Маркова представляет собой наиболее общее выражение закона больших чисел. Ее частным случаем является теорема Чебышева. Она формулируется следующим образом.