Освоении метода линейных компонент

Автор работы: Пользователь скрыл имя, 18 Июня 2012 в 22:37, лабораторная работа

Краткое описание

В качестве примера рассмотрим объёмы производства (тыс. ед.) 5 видовдеталей некоторой фабрикой за последние 20 лет.

Прикрепленные файлы: 1 файл

Цель работы.docx

— 68.03 Кб (Скачать документ)

 

    Из  матрицы собственных чисел видно, что наибольший вклад в дисперсию  исходных признаков вносят 2-я, 5-я,  и 3-я компоненты (их суммарный вклад  составляет 75.6%). Поэтому дальнейший анализ можно проводить, используя  только эти 3 параметра. Остальные компоненты, вносящие наименьший вклад в дисперсию  будем считать равными нулю. Т. е. мы предполагаем, что 

    
    T      
T
z1   8,864462 -14,8933 -2,8867
f2   z2   -9,34984 11,13806 6,64196
f3 = z3 = 11,72561 9,19656 7,53607
f5   z4   9,247652 15,27651 -8,09808
    z5   3,857446 -3,26989 19,28723

 
 

    Полученные  значения главных компонент не имеют  экономического смысла, но геометрически  их можно трактовать как координаты 20 точек в пространстве R5 в системе координат, полученной поворотом на некоторый угол относительно другой  системы,  в которой по нормированным значениям и были построены эти точки.

    Так как главные компоненты не коррелированы  друг с другом, то их значения можно  использовать в регрессионном анализе. Допустим, мы хотим исследовать зависимость  некоторого признака Y (например, прибыли предприятия) от объёмов производства тортов. Поскольку объёмы производства каждого вида взаимосвязаны, то регрессионный анализ, проведённый по исходным данным, может привести к неадекватным результатам. Поэтому, лучше построить модель признака Y по главным компонентам (не обязательно по всем, в нашем случае можно взять только компоненты 1, 3, 4 и 5). Полученное соотношение Y=F(f) можно преобразовать в соотношение Y=F1(z), а затем в Y=F2(x). Полученная таким способом модель будет более точно описывать зависимость признаков, поскольку при её построении будут использованы некоррелированные друг с другом данные.

    В нашем случае в качестве параметра Y возьмём объём спроса на торты в данном регионе за последние 20 лет. 
 

                Таблица №2. Выпуск деталей за  последние 20 лет в данном регионе

    
    Объём выпуска (тыс. шт)
        3045,083
        3068,075
        3103,839
        3070,629
        3055,302
        3065,52
        3062,965
        3080,848
        3062,965
        3065,52
        3060,411
        3052,747
        3075,738
        3116,612
        3034,865
        3024,646
        3047,638
        3052,747
        3137,049
        3039,974

 

    Полученная  модель примет вид

    
    Y=3066,159- 0,332098f2+ 11,24024 f3+ 19,951f5

    Через переменные z модель запишется как

    
Y=3066,159- 8,915554z1+ 10,2184z2+ 9,7841z3+ 27,6918z4+ 13,56497z5
           

    А через исходные признаки x

    
Y=30,66159- 38,0654x1+ 63,865x2+ 226,593x3+ 142,2912x4+ 47,00464x5

 

    Вывод: таким образом, был освоен метод линейных компонент. Как видно из полученной модели наибольший вклад в спрос вносит вид №3, т. е. детали вида №3 за исследуемый период пользовались наибольшим спросом. 


Информация о работе Освоении метода линейных компонент