Методы построения дерева решений

Автор работы: Пользователь скрыл имя, 02 Октября 2012 в 18:57, курсовая работа

Краткое описание

Цель данной контрольной работы: ознакомится с понятием дерева решений и областью его применения, рассмотреть методы решений деревьев решений, выяснить, в чём преимущество данного метода, а также решить с помощью этого метода задачу.
Объектом исследования служит метод дерева решений как процесс выбора альтернативного решения. Предметом исследования являются теоретические и методологические аспекты применения метода дерева решений. 

Содержание

Введение……………………………………………………………….3
1.Дерево решений
1.1 Дерево решений и область его применения……………………4
1.2 Преимущества использования деревьев решений…………….8
2. Методы построения дерева решений
2.1 Методика "Разделяй и властвуй"……………………………….12
2.2 Алгоритм C4.5……………………………………………………15
2.3 Алгоритм покрытия……………………………………………..17
3. Практическая часть. Построение дерева решений на примере………………………………………………………………………19
Заключение…………………………………………………………….21
Список используемой литературы…………………………………..22

Прикрепленные файлы: 1 файл

курсовая по упр.реш. дерево решений.docx

— 57.94 Кб (Скачать документ)

 

 


Содержание

Введение……………………………………………………………….3

1.Дерево решений 

1.1 Дерево решений и  область его применения……………………4

1.2  Преимущества использования  деревьев решений…………….8

2. Методы построения  дерева решений

2.1 Методика "Разделяй  и властвуй"……………………………….12

2.2 Алгоритм C4.5……………………………………………………15

2.3 Алгоритм покрытия……………………………………………..17

3. Практическая часть. Построение дерева решений на          примере………………………………………………………………………19

Заключение…………………………………………………………….21

Список используемой литературы…………………………………..22

 

 

 

 

Введение

Своевременная разработка и  принятие правильного решения —  главные задачи работы управленческого  персонала любой организации. Когда  нужно принять несколько решений  в условиях неопределенности, когда  каждое решение зависит от исхода предыдущего решения или исходов  испытаний, то применяют схему, называемую деревом решений. Это графическое  изображение процесса принятия решений, в котором отражены альтернативные решения, альтернативные состояния  среды, соответствующие вероятности  и выигрыши для любых комбинаций.

Актуальность темы исследования определяется тем, что метод дерева решений имеет большое значение для разработки эффективных управленческих решений. Метод деревьев решений  является одним из наиболее популярных методов, используемых на этапе выбора альтернатив.

Цель данной контрольной работы: ознакомится с понятием дерева решений и областью его применения, рассмотреть методы решений деревьев решений, выяснить, в чём преимущество данного метода, а также решить с помощью этого метода задачу.

Объектом исследования служит метод дерева решений как процесс  выбора альтернативного решения. Предметом исследования являются теоретические и методологические аспекты применения метода дерева решений. 

1.Дерево решений.

1.1 Дерево решений и область его приминения.

Одним из популярных методов  принятия решений являются деревья  решений. С помощью этого метода можно принимать решения:

по социальным и макроэкономическим вопросам;

по развитию фирмы или  в банковской сфере.

Деревья решений используются также для диагностики в медицине, экономике и бизнесе.

Основное отличие деревьев решений от методов распознавания  образов и моделирования состоит  в том, что проводимое исследование основывается на логических рассуждениях, а не на вычислениях. Деревья решений - это один из методов построения экспертных систем на основе правил вывода. Такие системы называются системами прямого логического вывода, так как мы начинаем с фактов, в результате приходим к тому или иному выводу

Дерево решений - популярный метод науки управления, используемый для выбора наилучшего направления  действий из имеющихся вариантов, это  способ представления правил в иерархической, последовательной структуре, где каждому  объекту соответствует единственный узел, дающий решение.

Под правилом понимается логическая конструкция, представленная в виде "если ... то ...".[10,с.554]

Область применения деревья  решений в настоящее время  широка, но все задачи, решаемые этим аппаратом могут быть объединены в следующие три класса :

Описание данных: Деревья решений позволяют хранить информацию о данных в компактной форме, вместо них мы можем хранить дерево решений, которое содержит точное описание объектов.

Классификация: Деревья решений отлично справляются с задачами классификации, т.е. отнесения объектов к одному из заранее известных классов. Целевая переменная должна иметь дискретные значения.

Регрессия: Если целевая переменная имеет непрерывные значения, деревья решений позволяют установить зависимость целевой переменной от независимых (входных) переменных. Например, к этому классу относятся задачи численного прогнозирования (предсказания значений целевой переменной). [4,с.296]

Построение «дерева решений» чаще всего используется для анализа  проектных рисков. Метод применяется  для тех проектов, которые имеют  обозримое количество вариантов  развития. При этом аналитик, осуществляющий построение «дерева решений», для  формулирования различных сценариев  развития проекта должен обладать необходимой  и достоверной информацией с  учетом вероятности и времени  их наступления. Можно предложить следующую  схему управления проектом, последовательности сбора данных для построения «дерева  решений»:

- определение состава  и продолжительности фаз жизненного  цикла проекта;

- определение ключевых  событий, которые могут повлиять  на дальнейшее развитие проекта;

- определение времени  наступления ключевых событий;

- формулировка всех возможных  решений, которые могут быть  приняты в результате наступления  каждого ключевого события;

- определение вероятности  принятия каждого решения;

- определение стоимости  каждого этапа осуществления  проекта (стоимости работ между  ключевыми событиями) в текущих  ценах.

На основании полученных данных строится «дерево решений», структура которого содержит узлы, представляющие собой ключевые события (точки принятия решений), и ветви, соединяющие узлы, - работы по реализации проекта.

Следует отметить, что очень  часто по различным причинам, в  значительной мере в связи с отсутствием  достоверной информации, использование  статистического метода или метода «дерева решений» не представляется возможным.

В таких случаях применяются  методы, использующие результаты опыта  и интуицию, то есть эвристические  методы или методы экспертных оценок. Как выглядит дерево решений на практике, мы можем рассмотреть   на рис.1

 

Рис.1 «Дерево  решений»

 

На данном рисунке представаленно решение задачи: в случае, если книга имеет успех, прибыль равняется 8 млн. долл., а при провале — соответственно —8 млн. долл. Поскольку менеджеры в случае провала книги фильм снимать не будут, то худший возможный результат по-прежнему составляет потерю не 8 млн. долл., а 0 долл. По причине того, что менеджеры в случае провала книги примут решение не продолжать работу над проектом, ожидаемая величина прибыли через год, считая с сегодняшней даты, возрастает с 2 млн. долл. до 4 млн. долл. Таким образом, ожидаемая величина прибыли от проекта, вследствие увеличения в два раза разброса возможных в будущем результатов, удваивается. С такой точки зрения увеличение неопределенности в возможных в будущем доходах по проекту приводит к росту его стоимости.[1,с.240]

Области применения деревьев решений: Деревья решений являются прекрасным инструментом в системах поддержки принятия решений, интеллектуального анализа данных. В состав многих пакетов, предназначенных для интеллектуального анализа данных, уже включены методы построения деревьев решений.

Деревья решений успешно  применяются для решения практических задач в следующих областях:

 -Банковское дело. Оценка кредитоспособности клиентов банка при выдаче кредитов.

 -Промышленность. Контроль за качеством продукции (выявление дефектов), испытания без разрушений (например проверка качества сварки) и т.д.

 -Медицина. Диагностика различных заболеваний.

- Молекулярная биология. Анализ строения аминокислот.[2,192]

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.2  Преимущества  использования деревьев решений.

 

Классификационная модель, представленная в виде дерева решений, является интуитивной и упрощает понимание решаемой задачи. Результат  работы алгоритмов конструирования  деревьев решений, в отличие, например, от нейронных сетей, представляющих собой "черные ящики", легко интерпретируется пользователем. Это свойство деревьев решений не только важно при отнесении  к определенному классу нового объекта, но и полезно при интерпретации  модели классификации в целом. Дерево решений позволяет понять и объяснить, почему конкретный объект относится  к тому или иному классу.

Деревья решений дают возможность  извлекать правила из базы данных на естественном языке. Пример правила: Если Возраст > 35 и Доход > 200, то выдать кредит.

Деревья решений позволяют  создавать классификационные модели в тех областях, где аналитику  достаточно сложно формализовать знания.

Алгоритм конструирования  дерева решений не требует от пользователя выбора входных атрибутов (независимых  переменных). На вход алгоритма можно  подавать все существующие атрибуты, алгоритм сам выберет наиболее значимые среди них, и только они будут  использованы для построения дерева. В сравнении, например, с нейронными сетями, это значительно облегчает  пользователю работу, поскольку в  нейронных сетях выбор количества входных атрибутов существенно  влияет на время обучения.

Точность моделей, созданных  при помощи деревьев решений, сопоставима  с другими методами построения классификационных  моделей (статистические методы, нейронные  сети).[7,с.17]

Разработан ряд масштабируемых алгоритмов, которые могут быть использованы для построения деревьев решения  на сверхбольших базах данных; масштабируемость здесь означает, что с ростом числа примеров или записей базы данных время, затрачиваемое на обучение, т.е. построение деревьев решений, растет линейно.

Быстрый процесс обучения. На построение классификационных моделей  при помощи алгоритмов конструирования  деревьев решений требуется значительно  меньше времени, чем, например, на обучение нейронных сетей.

Большинство алгоритмов конструирования  деревьев решений имеют возможность  специальной обработки пропущенных  значений.

Многие классические статистические методы, при помощи которых решаются задачи классификации, могут работать только с числовыми данными, в  то время как деревья решений  работают и с числовыми, и с  категориальными типами данных.

В процессе построения дерева, чтобы его размеры не стали  чрезмерно большими, используют специальные  процедуры, которые позволяют создавать  оптимальные деревья, так называемые деревья "подходящих размеров".

Какой размер дерева может  считаться оптимальным? Дерево должно быть достаточно сложным, чтобы учитывать  информацию из исследуемого набора данных, но одновременно оно должно быть достаточно простым. Другими словами, дерево должно использовать информацию, улучшающую качество модели, и игнорировать ту информацию, которая ее не улучшает.

Тут существует две возможные  стратегии. Первая состоит в наращивании  дерева до определенного размера  в соответствии с параметрами, заданными  пользователем. Определение этих параметров может основываться на опыте и  интуиции аналитика, а также на некоторых "диагностических сообщениях" системы, конструирующей дерево решений.

Вторая стратегия состоит  в использовании набора процедур, определяющих "подходящий размер" дерева, они разработаны Бриманом, Куилендом и др. в 1984 году. Однако, как отмечают авторы, нельзя сказать, что эти процедуры доступны начинающему пользователю.[5,с.304]

Процедуры, которые используют для предотвращения создания чрезмерно  больших деревьев, включают: сокращение дерева путем отсечения ветвей; использование  правил остановки обучения.

Не все алгоритмы при  конструировании дерева работают по одной схеме. Некоторые алгоритмы  включают два отдельных последовательных этапа: построение дерева и его сокращение; другие чередуют эти этапы в процессе своей работы для предотвращения наращивания внутренних узлов.

Остановка построения дерева. Рассмотрим правило остановки. Оно  должно определить, является ли рассматриваемый  узел внутренним узлом, при этом он будет разбиваться дальше, или  же он является конечным узлом, т.е. узлом  решением.

Остановка - такой момент в процессе построения дерева, когда  следует прекратить дальнейшие ветвления.

Один из вариантов правил остановки - "ранняя остановка", она  определяет целесообразность разбиения  узла. Преимущество использования такого варианта - уменьшение времени на обучение модели. Однако здесь возникает риск снижения точности классификации. Поэтому  рекомендуется "вместо остановки  использовать отсечение".

Второй вариант остановки  обучения - ограничение глубины дерева. В этом случае построение заканчивается, если достигнута заданная глубина.

Еще один вариант остановки - задание минимального количества примеров, которые будут содержаться  в конечных узлах дерева. При этом варианте ветвления продолжаются до того момента, пока все конечные узлы дерева не будут чистыми или будут  содержать не более чем заданное число объектов.

Информация о работе Методы построения дерева решений