Автор работы: Пользователь скрыл имя, 12 Декабря 2013 в 20:56, курсовая работа
С древних времен люди пытались найти сходство между объектами, явлениями или событиями. Однако очень трудно установить механизм выявления человеком сходства или несходства, измерения степени сходства, т.к. понятие сходства носит качественный, неопределенный характер.
В значительной мере наши представления о теории сходства опираются на представления о теории вероятности и ее приложении. Если считать, что теория вероятности является отображением наших субъективных представлений о вероятности событий, то теорию сходства можно считать отображением наших субъективных представлений о сходстве объектов.
Введение…………………………………………………………………………………….……3
Постановка задачи………………………………………………………………………….……4
Алгоритм «Голотип N»………………………………………………………………………….6
Применение алгоритма «Голотип N» для распределения абитуриентов………………….…8
Заключение…………………………
Международный университет природы, общества и человека «Дубна»
Кафедра системного анализа и управления
Курсовая работа
по курсу
«Теория принятия решений»
на тему:
«Принятие решений на примере задачи распознавания образов с использованием алгоритма «Голотип N»»
Выполнила
студентка группы 2071
Волостникова К. С.
Проверили:
проф. Черемисина Е.Н.
доцент Крейдер О.А.
Дубна, 2011
Введение…………………………………………………………
Постановка задачи…………………………………
Алгоритм «Голотип N»…………………………………………………………………………
Применение алгоритма «Голотип N» для распределения абитуриентов………………….…8
Заключение……………………………………………………
Приложение 1……………………………………………………………………………
Приложение 2……………………………………………………………………………
Приложение 3………………………………………………………………………..
Список используемой
литературы……………………………………………………
Введение
С древних времен люди пытались найти сходство между объектами, явлениями или событиями. Однако очень трудно установить механизм выявления человеком сходства или несходства, измерения степени сходства, т.к. понятие сходства носит качественный, неопределенный характер.
В значительной мере наши представления о теории сходства опираются на представления о теории вероятности и ее приложении. Если считать, что теория вероятности является отображением наших субъективных представлений о вероятности событий, то теорию сходства можно считать отображением наших субъективных представлений о сходстве объектов.
О сходстве объектов рассуждают в двух смыслах: широком, когда имеют в виду сопоставление объектов по всем их существенным свойствам, и в узком, когда имеют в виду сопоставление объектов только по их некоторым заранее фиксированным свойствам.
Существует множество различных алгоритмов, позволяющих определить принадлежность объекта к образу. Например, «Дискриминантная функция», «Голотип 1», «Голотип N», «Энтропия», «Тесты», «Кора», «Метод эталонов» и т. д. Прежде чем приступить к распознаванию и выбору алгоритма необходимо анализировать данные, чтобы ошибка при отнесении объекта к образу была минимальной либо отсутствовала вовсе. Подходящий алгоритм распознавания выбирается в зависимости от того, сколько образов присутствует в материале обучения, а также от взаиморасположения объектов в пространстве свойств.
В данной курсовой работе рассматривается применение алгоритма «Голотип N» в практической задаче. Задача состоит в распознавании образов—результатов экзаменов ЕГЭ абитуриентов, поступавших в университет «Дубна» в 2009 году со второй волной на три различные специальности. Необходимо с помощью алгоритма «распознать» эти объекты и соотнести их к соответствующим образам—наиболее подходящим по их результатам специальностям.
Постановка задачи
Использование алгоритма
для распределения абитуриентов
в университет «Дубна» по специальностям
Прикладная информатика (по областям),
Государственное и
Цель
Показать применение алгоритма «Голотип N» при решении практической задачи—распределения абитуриентов, поступающих в МУПОЧ «Дубна» со второй волной.
Исходные данные
Для анализа представлены следующие данные:
Прикладная информатика |
ГМУ |
Менеджмент | ||||||
Матем. |
Р. Я. |
Общ-е |
Матем. |
Р. Я. |
Общ-е |
Матем. |
Р. Я. |
Общ-е |
80 |
72 |
70 |
80 |
72 |
70 |
80 |
72 |
70 |
68 |
72 |
70 |
68 |
72 |
70 |
68 |
72 |
70 |
73 |
71 |
69 |
73 |
71 |
69 |
73 |
71 |
69 |
69 |
75 |
70 |
69 |
75 |
70 |
69 |
75 |
70 |
80 |
76 |
75 |
80 |
76 |
75 |
80 |
76 |
75 |
67 |
71 |
74 |
67 |
71 |
74 |
67 |
71 |
74 |
80 |
75 |
70 |
80 |
75 |
70 |
80 |
75 |
70 |
80 |
75 |
65 |
80 |
75 |
65 |
80 |
75 |
65 |
66 |
69 |
73 |
66 |
69 |
73 |
66 |
69 |
73 |
71 |
73 |
69 |
71 |
73 |
69 |
71 |
73 |
69 |
74 |
75 |
73 |
74 |
75 |
73 |
74 |
75 |
73 |
76 |
69 |
70 |
76 |
69 |
70 |
76 |
69 |
70 |
Представления о модели
Алгоритм «Голотип N» используется в ситуациях, когда в МО представлены объекты k образов, где k>=2. Отсутствуют требования жесткой компакции исследуемых объектов, в качестве исходных данных могут присутствовать объекты, свойства которых измерены в разных шкалах, в алгоритмах используется «бюрократический» подход к распознаванию, т.е. ситуация, когда один раз проводится процесс обучения и строится решающее правило, и затем это решающее правило многократно применяется к объектам экзамена.
Ожидаемый результат
С помощью программы MS Office Excel и алгоритма для распознавания образов «Голотип N» абитуриенты будут распределены по наиболее подходящим для них специальностям.
Критерии оценки результата
Все образы МЭ распознаны и принадлежат к одному из образов МО.
Алгоритм «Голотип N»
Назначение – решение задач распознавания в ситуациях, когда в МО представлены объекты k образов, где k>=2.
Условия применимости:
Шаг 1. Постановка задачи.
На данном шаге замеряются необходимые свойства, все исходные данные заносятся в ТОС.
Шаг 2. Вычисление экстремальных разностей.
По каждому свойству определим минимальное и максимальное значения и вычислим экстремальные разности: , где k= 1,2..m и m – общее число свойств.
Шаг 3. Введение меры сходства.
Мера сходства между парой объектов по свойству вычисляется следующим образом:
Шаг 4. Построение матрицы мер сходства для каждого свойства.
, где k = 1,2..m и m – общее число свойств; i, j = 1,2..n и n – количество всех объектов в МО.
Шаг 5. Вычисление общей матрицы мер сходства.
, где – вес k-го свойства.
Вес свойства может быть равномерным в случае, если свойства равнозначны. Но обычно в реальных задачах именно от подбора этого коэффициента зависит точность решения. Единственным условием является то, что .
Шаг 6. Вычисление порога для разбиения МО на компактные группы.
выбирается так, чтобы
Шаг 7. Построение голотипов и радиусов.
Голотип – это тот объект, у которого средняя мера сходства с остальными объектами данной группы является максимальной, т.е. тот на который все остальные объекты в группе наиболее похожи. Голотип находится по формуле: , где m – количество объектов в группе.
Радиус – это максимальная мера сходства между самым удаленным объектом группы и самым близким «чужим» объектом. Радиус рассчитывается по формуле: , где – самый дальний объект из группы, – самый близкий объект из «чужих».
Шаг 8. Распознавание.
Пусть объект экзамена – X.
Вычисляем меру сходства объекта экзамена с каждым из голотипов.
Если выполняется условие: , то мы определяем его в q-ю группу, и соответственно определяем его в образ, которому принадлежит группа.
Применение алгоритма «Голотип N» для распределения абитуриентов
Имеется следующий набор данных, представленный в виде таблицы, где ее содержимое является результатами ЕГЭ, по которым студенты в 2009 году поступили на данные специальности первой волной.
Прикладная информатика |
ГМУ |
Менеджмент | ||||||
Матем. |
Р. Я. |
Общ-е |
Матем. |
Р. Я. |
Общ-е |
Матем. |
Р. Я. |
Общ-е |
80 |
72 |
70 |
56 |
83 |
75 |
53 |
69 |
82 |
68 |
72 |
70 |
59 |
81 |
76 |
51 |
70 |
83 |
73 |
71 |
69 |
62 |
78 |
79 |
58 |
72 |
86 |
69 |
75 |
70 |
61 |
82 |
73 |
50 |
69 |
87 |
80 |
76 |
75 |
57 |
79 |
75 |
54 |
75 |
92 |
67 |
71 |
74 |
59 |
85 |
69 |
59 |
74 |
94 |
80 |
75 |
70 |
55 |
80 |
72 |
61 |
71 |
92 |
80 |
75 |
65 |
56 |
79 |
70 |
60 |
70 |
89 |
66 |
69 |
73 |
52 |
79 |
77 |
55 |
69 |
88 |
71 |
73 |
69 |
60 |
81 |
80 |
54 |
72 |
86 |
74 |
75 |
73 |
58 |
79 |
81 |
53 |
70 |
85 |
76 |
69 |
70 |
56 |
80 |
72 |
51 |
71 |
87 |
Из этих данных мы создадим ТОС, в которой имеется часть представителей каждого образа и на каждом объекте материала обучения и материала экзамена измерены косвенные свойства: — результаты ЕГЭ по математике (баллы), — результаты ЕГЭ по русскому языку (баллы) и f3 — результаты ЕГЭ по обществознанию (баллы). Объекты материала обучения расклассифицированы по образам.
f1 |
f2 |
f3 |
образ | |
a1 |
80 |
72 |
70 |
1 |
a2 |
68 |
72 |
70 |
1 |
a3 |
73 |
71 |
69 |
1 |
a4 |
69 |
75 |
70 |
1 |
a5 |
80 |
76 |
75 |
1 |
a6 |
67 |
71 |
74 |
1 |
a7 |
80 |
75 |
70 |
1 |
a8 |
80 |
75 |
65 |
1 |
a9 |
66 |
69 |
73 |
1 |
a10 |
71 |
73 |
69 |
1 |
a11 |
74 |
75 |
73 |
1 |
a12 |
76 |
69 |
70 |
1 |
a13 |
56 |
83 |
75 |
2 |
a14 |
59 |
81 |
76 |
2 |
a15 |
62 |
78 |
79 |
2 |
a16 |
61 |
82 |
73 |
2 |
a17 |
57 |
79 |
75 |
2 |
a18 |
59 |
85 |
69 |
2 |
a19 |
55 |
80 |
72 |
2 |
a20 |
56 |
79 |
70 |
2 |
a21 |
52 |
79 |
77 |
2 |
a22 |
60 |
81 |
80 |
2 |
a23 |
58 |
79 |
81 |
2 |
a24 |
56 |
80 |
72 |
2 |
a25 |
53 |
69 |
82 |
3 |
a26 |
51 |
70 |
83 |
3 |
a27 |
58 |
72 |
86 |
3 |
a28 |
50 |
69 |
87 |
3 |
a29 |
54 |
75 |
92 |
3 |
a30 |
59 |
74 |
94 |
3 |
a31 |
61 |
71 |
92 |
3 |
a32 |
60 |
70 |
89 |
3 |
a33 |
55 |
69 |
88 |
3 |
a34 |
54 |
72 |
86 |
3 |
a55 |
53 |
70 |
85 |
3 |
a66 |
51 |
71 |
87 |
3 |