В системах, основанных на прецедентах,
БЗ содержит описания конкретных ситуаций
(прецеденты). Поиск решения осуществляется
на основе аналогий и включает следующие
этапы:
- получение информации о текущей проблеме;
- сопоставление полученной информации со значениями признаков прецедентов из базы знаний;
- выбор прецедента из базы знаний, наиболее близкого к рассматриваемой проблеме;
- адаптация выбранного прецедента к текущей проблеме;
- проверка корректности каждого полученного решения;
- занесение детальной информации о полученном решении в БЗ.
Прецеденты описываются множеством
признаков, по которым строятся индексы
быстрого поиска. Однако в системах,
основанных на прецедентах, в отличие
от индуктивных систем до-пускается
нечеткий поиск с получением множества
допустимых альтернатив, каждая из которых
оценивается некоторым коэффициентом
уверенности. Наиболее эффективные решения
адап-тируются к реальным ситуациям с
помощью специальных алгоритмов.
Системы, основанные на прецедентах,
применяются для распространения
знаний и в системах контекстной
помощи.
Информационные хранилища отличаются
от интеллектуальных баз данных, тем,
что представляют собой хранилища
значимой информации, регулярно извлекаемой
из оперативных баз данных. Хранилище
данных - это предметно-ориентированное,
интегрированное, привязанное ко времени,
неизменяемое собрание данных, применяемых
для поддержки процессов принятия
управленческих решений. Предметная ориентация
означает, что данные объединены в
категории и хранятся в соответствии
с теми областями, которые они
описывают, а не с приложениями, которые
их используют. В хранилище данные
интегрируются в целях удовлетворения
требований предприятия в целом,
а не отдельной функции бизнеса.
Привязанность данных ко времени
выражает их "историчность", т.е. атрибут
времени всегда явно присутствует в
структурах хранилища данных. Неизменяемость
означает, что, попав однажды в
хранилище, данные уже не изменяются
в отличие от оперативных систем,
где данные присутствуют только в
последней версии, поэтому постоянно
меняются.
Технологии извлечения знаний из хранилищ
данных основаны на методах статистического
анализа и моделирования, ориентированных
на поиск моделей и отношений,
скрытых в совокупности данных. Эти
модели могут в дальнейшем использоваться
для оптимизации деятельности предприятия
или фирмы.
Для извлечения значимой информации
из хранилищ данных имеются специальные
методы (OLAP-анализа, Data Mining или Knowledge Discovery),
основанные на применении методов мате-матической
статистики, нейронных сетей, индуктивных
методов построения деревьев решений
и др.
Технология OLAP (On-line Analytical Processing - оперативный
анализ данных) предоставляет пользователю
средства для формирования и проверки
гипотез о свойствах данных или отношениях
между ними на основе разнообразных запросов
к базе данных. Они применяются на ранних
стадиях процесса извлечеия знаний, помогая
аналитику сфокусировать внимание на
важных переменных. Средства Data Mining отличаются
от OLAP тем, что кроме проверки предполагаемых
зависимостей они способны самостоятельно
(без участия пользователя) генерировать
гипотезы о закономерностях, существующих
в данных, и строить модели, позволяющие
количественно оценить степень взаимного
влияния исследуемых факторов на основе
имеющейся информации.
Обработка естественного языка
[править]
Материал из Википедии — свободной
энциклопедии
Обработка естественного языка (Natural Language Processing, NLP) — общее направление искусственного интеллекта и математической лингвистики.
Оно изучает проблемы компьютерного анализа и синтеза естественных языков. Применительно к искусственному интеллекту
анализ означает понимание языка, а синтез
— генерацию грамотного текста. Решение
этих проблем будет означать создание
более удобной формы взаимодействия компьютера
и человека.
Задачи и ограничения
Теоретически,
построение естественно-языкового интерфейса для
компьютеров — очень привлекательная
цель. Ранние системы, такие как SHRDLU, работая с ограниченным «миром кубиков»
и используя ограниченный словарный запас,
выглядели чрезвычайно хорошо, вдохновляя
этим своих создателей. Однако оптимизм
быстро иссяк, когда эти системы столкнулись
со сложностью и неоднозначностью реального
мира.
Понимание
естественного языка иногда считают AI-полной задачей, потому как распознавание живого
языка требует огромных знаний системы
об окружающем мире и возможности с ним
взаимодействовать. Само определение
смысла слова «понимать» — одна из главных задач искусственного
интеллекта.
Сложности понимания
В русском языке
Качество
понимания зависит от множества
факторов: от языка, от национальной культуры,
от самого собеседника и т. д. Вот некоторые
примеры сложностей, с которыми сталкиваются
системы понимания текстов.
- Предложения «Мы отдали бананы обезьянам, потому что они были голодные» и «Мы отдали бананы обезьянам, потому что они были перезрелыми» похожи по синтаксической структуре. В одном из них местоимение они относится к обезьянам, а в другом — к бананам. Правильное понимание зависит от знаний компьютера, какими могут быть бананы и обезьяны. По нормам русского языка второе предложение некорректно, потому что в нем местоимение ссылается не на последнее подходящее слово, однако в живой речи такое предложение очень даже может встретиться.
- Свободный порядок слов может привести к совершенно иному толкованию фразы: «Бытие определяет сознание» — кто кого определяет?
- В русском языке свободный порядок компенсируется развитой морфологией, служебными словами и знаками препинания, но в большинстве случаев для компьютера это представляет дополнительную проблему.
- В речи могут встретиться неологизмы, например, глагол «Пятидесятирублируй» — то есть высылай 50 рублей. Система должна уметь отличать такие случаи от опечаток и правильно их понимать.
- Правильное понимание омонимов — ещё одна проблема. При распознавании речи, помимо прочих, возникает проблема фонетических омонимов. Во фразе «Серый волк в глухом лесу встретил рыжую лису» выделенные слова слышатся одинаково, и без знания, кто глухой, а кто рыжий, не обойтись (Кроме того, что лиса может быть рыжей, а лес — глухим, лес также может быть рыжим (характеристика, в данном случае обозначающая преобладающий цвет листвы в лесу), в то время как лиса может быть глухой, что порождает дополнительную проблему, вытекающую из предыдущей.)
Главные задачи
- Синтез речи
- Распознавание речи
- Анализ текста
- Синтез текста
- Машинный перевод
- Вопросно-ответные системы
- Информационный поиск
- Извлечение информации
- Анализ тональности текста
- Анализ высказываний
- Упрощение текста
- Технология перевода
- Робот (программа)
- Автореферат
Программное
обеспечение для обработки естественного
языка
- AlchemyAPI
- Expert System S.p.A.
- General Architecture for
Text Engineering (GATE)
- Modular Audio Recognition Framework
- MontyLingua
- Natural Language Toolkit (NLTK)
Анализ текста — процесс получения высококачественной информации из текста на естественном языке. Как правило, для этого применяется
статистическое обучение на основе шаблонов:
входной текст разделяется с помощью шаблонов,
затем производится обработка полученных
данных.
Адаптивные информационные
системы
Потребность в адаптивных информационных
системах возникает в тех случаях,
когда поддерживаемые ими проблемные
области постоянно развиваются.
В связи с этим адаптивные системы
должны удовлетворять ряду специфических
требований, а именно:
- адекватно отражать знания проблемной области в каждый момент времени;
- быть пригодными для легкой и быстрой реконструкции при изменении проблемной среды.
Адаптивные свойства информационных
систем обеспечиваются за счет интеллектуализации
их архитектуры. Ядром таких систем
является постоянно развиваемая
модель проблемной области, поддерживаемая
в специальной базе знаний - репозито-рии.
Ядро системы управляет процессами генерации
или переконфигурирования программного
обеспечения.
В процессе разработки адаптивных информационных
систем применяется оригинальное или
типовое проектирование. Оригинальное
проектирование предполагает разработку
информационной системы с "чистого
листа" на основе сформулированных
требований. Реализация этого подхода
основана на использовании систем автоматизированного
проектирования, или CASE-технологий (Designer2000,
SilverRun, Natural Light Storm и др.).
При типовом проектировании осуществляется
адаптация типовых разработок к
особенностям проблемной области. Для
реализации этого подхода применяются
инструментальные средства компонентного
(сборочного) проектирования информационных
систем (R/3, BAAN IV, Prodis и др.). Главное отличие
подходов состоит в том, что при использовании
CASE-технологии на основе репозитория при
изменении проблемной области каждый
раз выполняется генерация про-граммного
обеспечения, а при использовании сборочной
технологии - конфигурирование программ
и только в редких случаях - их переработка.
Интеллектуальная информационная
система
[править]
Материал из Википедии — свободной
энциклопедии
Перейти к: навигация, поиск
Интеллектуальная информационная
система (ИИС, англ. intelligent system) — разновидность интеллектуальной системы,
один из видов информационных систем, иногда ИИС называют системой, основанной
на знаниях. ИИС представляет собой комплекс
программных, лингвистических и логико-математических
средств для реализации основной задачи:
осуществление поддержки деятельности
человека, например возможность поиска информации в режиме продвинутого диалога на естественном языке.[источник не указан 502 дня]
Содержание
[убрать]
- 1 Классификация ИИС
- 2 Обеспечение работы ИИС
- 3 Классификация задач, решаемых ИИС
- 4 См. также
- 5 Ссылки
|
[править] Классификация ИИС
- Экспертные системы
- Собственно экспертные системы (ЭС)
- Интерактивные баннеры (web + ЭС)
- Вопросно-ответные системы (в некоторых источниках «системы общения»)
- Интеллектуальные поисковики (например, система Старт)
- Виртуальные собеседники
- Виртуальные цифровые помощники
ИИС
могут размещаться на каком-либо
сайте, где пользователь задает системе
вопросы на естественном языке (если
это вопросно-ответная система) или,
отвечая на вопросы системы, находит
необходимую информацию (если это
экспертная система). Но, как правило,
ЭС в интернете выполняют рекламно-информационные
функции (интерактивные баннеры), а
серьезные системы (такие, как, например,
ЭС диагностики оборудования) используются
локально, так как выполняют конкретные
специфические задачи.
Интеллектуальные поисковики отличаются
от виртуальных собеседников тем, что
они достаточно безлики и в ответ на вопрос
выдают некоторую выжимку из источников
знаний (иногда достаточно большого объема),
а собеседники обладают «характером»,
особой манерой общения (могут использовать сленг, ненормативную лексику), и их ответы должны быть предельно лаконичными
(иногда даже просто в форме смайликов,
если это соответствует контексту).
Для
разработки ИИС раньше использовались
логические языки (Пролог, Лисп и т. д.), а сейчас используются различные процедурные языки. Логико-математическое обеспечение
разрабатывается как для самих модулей
систем, так и для состыковки этих модулей.
Однако на сегодняшний день не существует
универсальной логико-математической
системы, которая могла бы удовлетворить
потребности любого разработчика ИИС,
поэтому приходится либо комбинировать
накопленный опыт, либо разрабатывать
логику системы самостоятельно. В области
лингвистики тоже существует множество
проблем, например, для обеспечения работы
системы в режиме диалога с пользователем
на естественном языке необходимо заложить
в систему алгоритмы формализации естественного
языка, а эта задача оказалась куда более
сложной, чем предполагалось на заре развития
интеллектуальных систем. Еще одна проблема —
постоянная изменчивость языка, которая
обязательно должна быть отражена в системах
искусственного интеллекта.
[править] Обеспечение работы ИИС
- Математическое
- Лингвистическое
- Информационное
- Семантическое
- Программное
- Техническое
- Технологическое
- Кадровое
[править] Классификация задач, решаемых
ИИС
- Интерпретация данных. Это одна из традиционных задач для экспертных систем. Под интерпретацией понимается процесс определения смысла данных, результаты которого должны быть согласованными и корректными. Обычно предусматривается многовариантный анализ данных.
- Диагностика. Под диагностикой понимается процесс соотношения объекта с некоторым классом объектов и/или обнаружение неисправности в некоторой системе. Неисправность — это отклонение от нормы. Такая трактовка позволяет с единых теоретических позиций рассматривать и неисправность оборудования в технических системах, и заболевания живых организмов, и всевозможные природные аномалии. Важной спецификой является здесь необходимость понимания функциональной структуры («анатомии») диагностирующей системы.
- Мониторинг. Основная задача мониторинга — непрерывная интерпретация данных в реальном масштабе времени и сигнализация о выходе тех или иных параметров за допустимые пределы. Главные проблемы — «пропуск» тревожной ситуации и инверсная задача «ложного» срабатывания. Сложность этих проблем в размытости симптомов тревожных ситуаций и необходимость учёта временного контекста.
- Проектирование. Проектирование состоит в подготовке спецификаций на создание «объектов» с заранее определёнными свойствами. Под спецификацией понимается весь набор необходимых документов—чертёж, пояснительная записка и т.д. Основные проблемы здесь — получение чёткого структурного описания знаний об объекте и проблема «следа». Для организации эффективного проектирования и в ещё большей степени перепроектирования необходимо формировать не только сами проектные решения, но и мотивы их принятия. Таким образом, в задачах проектирования тесно связываются два основных процесса, выполняемых в рамках соответствующей ЭС: процесс вывода решения и процесс объяснения.
- Прогнозирование. Прогнозирование позволяет предсказывать последствия некоторых событий или явлений на основании анализа имеющихся данных. Прогнозирующие системы логически выводят вероятные следствия из заданных ситуаций. В прогнозирующей системе обычно используется параметрическая динамическая модель, в которой значения параметров «подгоняются» под заданную ситуацию. Выводимые из этой модели следствия составляют основу для прогнозов с вероятностными оценками.
- Планирование. Под планированием понимается нахождение планов действий, относящихся к объектам, способным выполнять некоторые функции. В таких ЭС используются модели поведения реальных объектов с тем, чтобы логически вывести последствия планируемой деятельности.
- Обучение. Под обучением понимается использование компьютера для обучения какой-то дисциплине или предмету. Системы обучения диагностируют ошибки при изучении какой-либо дисциплины с помощью ЭВМ и подсказывают правильные решения. Они аккумулируют знания о гипотетическом «ученике» и его характерных ошибках, затем в работе они способны диагностировать слабости в познаниях обучаемых и находить соответствующие средства для их ликвидации. Кроме того, они планируют акт общения с учеником в зависимости от успехов ученика с целью передачи знаний.