Автор работы: Пользователь скрыл имя, 11 Января 2013 в 18:24, лабораторная работа
Деревья классификации - это метод, позволяющий предсказывать принадлежность наблюдений или объектов к тому или иному классу категориальной зависимой переменной в зависимости от соответствующих значений одной или нескольких предикторных переменных. Построение деревьев классификации - один из наиболее важных методов, используемых при проведении "добычи данных”.
Федеральное агентство образования и науки РФ
Югорский Государственный Университет
Отчет по лабораторной работе №11 на тему
«Построение и анализ древовидных объектов в Matlab»
(Вариант №18)
Дисциплина Теория принятия решений
Специальность 230102 – Автоматизированные системы обработки информации и управления
Курс 4
Семестр осенний учебного года 2010
Ханты-Мансийск 2010г.
Задание:
Примечание.
Деревья классификации - это метод, позволяющий предсказывать принадлежность наблюдений или объектов к тому или иному классу категориальной зависимой переменной в зависимости от соответствующих значений одной или нескольких предикторных переменных. Построение деревьев классификации - один из наиболее важных методов, используемых при проведении "добычи данных”.
Загрузил в MATLAB данные своего варианта: файл A18.mat.
Матрица hh4 (7x7):
hh4 =
0 49 44 48 25 47 44
49 0 47 45 32 39 41
44 47 0 46 27 45 42
48 45 46 0 31 43 30
25 32 27 31 0 30 27
47 39 45 43 30 0 39
44 41 42 30 27 39 0
Где три элемента {i, j, k} принадлежат X.
Т.е a(i,k)+ a(j,k)- a(i,j) → MAX
Создал одну Function M-File с именем mass (mass.m):
function [z,qq]=mass(a)
[n,m]=size(a);
n=length(a)
Результат выполнения m-функции:
mass(hh4)
n = 7
Далее в MATLAB написал следующее (прописал b1, b2, b3 чтобы в дальнейшем найти i,j,k):
b1=repman(a,[1 1 n]); % b1(i, j, k)=a(i,j)
b2=permute(b1,[1 3 2]); % b2(i, j, k)=b1(i,j,k)=a(i,k)
b3=permute(b2,[3 2 1]); % b2(i, j, k)=b1(k,j,i)=a(j,k)
Написал следущее:
q=b2+ b3- b1=a(i,k)+ a(j,k)- a(i,j)
Далее:
[r,r3]=max (max (max (q)))
[r,r2]=max (max (q(:, :, r3)))
[r,r1]=max (q(:, r2, r3))
[r1, r2, r3]=[i,j,k]
Построения дерева классификации используя данные лабораторной работы а именно:
Расстояния до вершин дерева:
A=
7 4
5 2
5 4
1 3
B=
13 17 18.500 20.500 2.500 2.500 5 21 4
Далее построим дерево классификации используя эти данные:
TREE = phytree(a,b);
view(THREE)
Результат:
Затем, чтобы получить информацию о филогенетическом древовидном объекте нужно прописать:
GET(THREE)
NumLeaves: 6
NumBranches: 5
NumNodes: 11
Pointers: [4x2 double]
Distances: [9x1 double]
LeafNames: {6x1 cell}
BranchNames: {5x1 cell}
NodeNames: {9x1 cell}
Где: NumLeaves - число листьев; NumBranches - число переходов; NumNodes - число узлов; Pointers - список связи переходов листа/перехода; Distances - длина края для каждого листа/перехода; LeafNames - названия листьев; BranchNames - названия переходов; NodeNames - названия всех узлов;
Примечание.
Что же такое деревья классификации? К примеру, нам нужно придумать устройство, которое отсортирует коллекцию монет по их достоинству (например, 1, 2, 3 и 5 копеек). Предположим, что какое-то из измерений монет, например - диаметр, известен и, поэтому, может быть использован для построения иерархического устройства сортировки монет. Заставим монеты катиться по узкому желобу, в котором прорезана щель размером с однокопеечную монету. Если монета провалилась в щель, то это 1 копейка; в противном случае она продолжает катиться дальше по желобу и натыкается на щель для двухкопеечной монеты; если она туда провалится, то это 2 копейки, если нет (значит это 3 или 5 копеек) - покатится дальше, и так далее. Таким образом, мы построили дерево классификации. Решающее правило, реализованное в этом дереве классификации , позволяет эффективно рассортировать горсть монет, а в общем случае применимо к широкому спектру задач классификации.
Вывод:
В ходе выполнения лабораторной работы №11 «Построение и анализ древовидных объектов в Matlab» получил теоретические и практические знания по данной теме лабораторной работы, приобрел навыки работы с построением дерева классификации, с получением информации о филогенетическом древовидном объекте.
Информация о работе Построение и анализ древовидных объектов в Matlab