Почему машина не переводит как человек

Автор работы: Пользователь скрыл имя, 28 Января 2014 в 13:31, реферат

Краткое описание

Целью данной работы является исследование вопроса почему машина не переводит как человек.
Поставленная цель решается посредством следующих задач:
- изучить алгоритм перевода компьютера
-изучить достоинства программ машинного перевода
-проанализировать пример текста
Объектом исследования является перевод.

Содержание

Введение………………………………………………………………….….….3
Глава I.
1.1. Как переводит компьютер ………………………………………………. 4
1.1.1Словарь ………………………………………………………… 4
1.1.2.Грамматика ……………………………………………………. 5
1.2. Машинный перевод– это… инструмент………………………………....7
Глава II
2.1.Практический перевод ……………………………………………….…. 9
2.2. Анализ переведенного текста…………………………………………….11
Заключение………...……………………………………………………………13
Список литературы……….………………… …………………………………14

Прикрепленные файлы: 1 файл

Федеральное агентство по образованию.docx

— 35.94 Кб (Скачать документ)

Федеральное агентство по образованию

Государственное образовательное  учреждение

высшего профессионального  образования

«Бурятский государственный  университет»

Факультет иностранных языков

 

 

Почему машина не переводит как человек?

реферат по дисциплине

«Машинный перевод»

 

 

 

                                                                Исполнитель:

 

                  Иванов И. И,

                  студентка 2 курса

                  очного отделения

                  68698 группы

 


                                                                                          Проверил:

                                                                                          Ст. преподаватель

                                                                                                                         

                                                                     

Город

2013

                                              Содержание

 

Введение………………………………………………………………….….….3

Глава I.

1.1. Как переводит компьютер ………………………………………………. 4

1.1.1Словарь ………………………………………………………… 4

1.1.2.Грамматика ……………………………………………………. 5

1.2. Машинный перевод– это… инструмент………………………………....7

Глава II

2.1.Практический перевод   ……………………………………………….…. 9

2.2. Анализ переведенного  текста…………………………………………….11

Заключение………...……………………………………………………………13

Список литературы……….………………… …………………………………14

 

 

 

 

 

 

 

 

 

 

 

 

                                         Введение

Несмотря на бурное развитие техники и, казалось бы, облегчение труда человека, человеческая деятельность остается востребованной. Особенно это  касается интеллектуальной сферы, в  частности, переводов.  
Казалось бы: прогресс шагнул далеко, на рынке существует большое количество компьютерных программ для перевода (систем машинного перевода), электронных словарей, систем Translation Memory (ТМ), а потребность в переводчиках не уменьшается. Лингвистические вузы не закрываются, а наоборот. Бюро и компании переводов не меняют профиль бизнеса, а расширяются, причем на рынке возникают новые аналогичные компании. Так, почему электронные помощники не становятся полной заменой человеку? Говоря о МП, следует прежде всего помнить, что компьютер — создание бездушное. Он не понимает языковых нюансов, намеков в тексте, того, что называется тонкой игрой слов. Да и, собственно, понять содержание текста в полной мере ему не под силу. Мышления как такового при МП не происходит: предложение расчленяется на части речи, в нем выделяются стандартные конструкции, слова и словосочетания переводятся по находящимся в памяти машины словарям. Затем переведенные части речи собираются по правилам другого языка. И из результата следует, что идеального перевода грамматики и слов недостаточно для идеального перевода смысла, однако неплохих результатов можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле.

Целью данной работы является исследование вопроса почему машина не переводит как человек.

Поставленная цель решается посредством  следующих задач:

- изучить алгоритм перевода компьютера

-изучить достоинства программ машинного перевода

-проанализировать пример текста

Объектом исследования является перевод.

Предметом исследования машинный перевод.

Методом исследования является анализ научной литературы.

 

Глава I

1.1. КАК ПЕРЕВОДИТ КОМПЬЮТЕР

Во-первых, всем ясно, что  чем больше словарь, тем лучше  перевод, значит, первая проблема –  проблема создания больших словарей для систем.

Во-вторых, ясно, что система  должна переводить такие предложения: «Привет, как дела?». Значит, еще одна проблема - научить систему распознавать устойчивые обороты.

В-третьих, понятно, что предложение  для перевода пишется по определенным правилам, по определенным правилам переводится, а значит, есть еще одна проблема: записать все эти правила в  виде программы. Вот, собственно, и все.

Самое интересное, что эти  проблемы действительно являются основными  при разработке систем МП, другое дело, что методы их решения известны далеко не всем и отнюдь не так просты, как  может показаться.

Системы МП семейства PROMT (PROgrammer's Machine Translation) - очень хороший объект, чтобы продемонстрировать, каким образом эти проблемы могут решаться эффективно.

1. 1.1. СЛОВАРЬ

Для качественного перевода очень важно, чтобы практически  все слова исходного текста легко  было найти и в словаре системы. А те из них, которых в нем нет, переносятся в текст непереведенными уже на выходе из системы, и их впоследствии переводят вручную при редактировании результатов перевода. Такие слова могут повлиять на качество перевода предложения. Дело в том, что для определения, к какой части речи относится рассматриваемое слово, система производит анализ всего предложения в целом. При этом имитируется мыслительная деятельность человека (такую систему принято называть системой с элементами искусственного интеллекта). Если значение хотя бы одного слова в предложении не определено, то это может исказить анализ всего предложения, а иногда и результаты всего перевода.

Методы организации больших  баз данных достаточно хорошо разработаны, но для перевода не менее, а может  быть, и более важно правильно  структурировать информацию, которая  приписывается элементу базы, правильно  выбрать этот самый элемент. Сколько, например, записей в словаре должно соответствовать обыкновенному  русскому слову "программа"? И, вообще, большой словарь – это словарь, который содержит много словарных статей, или словарь, который позволяет распознать много слов из текста?

При ближайшем рассмотрении оказывается, что, например, существительные  в русском языке изменяются по падежам и по числам, то есть для  одного существительного может существовать до 12 разных форм, а для глаголов и прилагательных, как правило, существует еще большее количество различных форм (более тридцати). Следовательно, чтобы переводить предложения, содержащие слова "программу", "программе", "программы" и т.д., хорошо было бы иметь способ соотнесения словарной статьи из автоматического словаря для слова "программа" с соответствующей словоформой из текста. Поэтому для описания и входного, и выходного языка в системе должен существовать некоторый формальный метод описания морфологии, на котором основывается выбор единицы словаря.

В системах семейства PROMT разработано  практически уникальное по полноте  морфологическое описание для всех языков, с которыми системы умеют  обращаться. Оно содержит 800 типов  словоизменений для русского языка, более 300 типов как для немецкого, так и для французского языка, и даже для английского, который не принадлежит к флективным языкам, выделено более 250 типов словоизменений. Множество окончаний для каждого языка хранится в виде древесных структур, что обеспечивает не только эффективный способ хранения, но и эффективный алгоритм морфологического анализа.

Кроме того, используемая модель морфологии позволила разработать  экспертную систему для пользователя – создателя словаря. Эта система  фактически автоматизирует процедуру  выделения основы и определения  типа словоизменения при вводе новых  словарных статей.

Однако разработка описания морфологии позволяет решить только проблему того, что является заголовком словарной статьи, по которому происходит идентификация единицы текста и  единицы словаря. Но ведь идентификация  слова из текста со словарной статьей  происходит не ради идентификации, как  это требуется в электронных  словарях, она необходима для выполнения программой собственно процедур перевода. Какая же нужна информация в словарной  статье и как должны быть описаны  правила перевода для того, чтобы  программа переводила?

1.1. 2. ГРАММАТИКА

С развитием МП как области  прикладной лингвистики появилось  множество лингвистических работ, предлагавших структуру описания свойств  живого слова в словарной статье машинного словаря. При этом совершенно отдельно появлялись исследования, описывающие, например, "структуру именной  группы" или "способы выражения прямого дополнения для глаголов говорения".

Например, на основе признака "принадлежность к части речи" описывалась грамматика такого типа:

• именная группа - это  существительное 

• именная группа - это  прилагательное + именная группа

• глагольная группа - это  глагол + именная группа

• предложение - это именная  группа + глагольная группа

Понятно, что некоторая  часть предложений естественного  языка описывается такой грамматикой, но эта часть очень незначительна, и на ее основе нельзя правильно  анализировать и переводить хоть сколько-нибудь реальный текст. Но зато можно использовать эффективные  методы построения преобразователя  по заданной грамматике или, на худой  конец, написать программу, которая  путем перебора построит деревья  зависимостей для ограниченного  множества предложений.

Стало принятым делить системы  перевода, которые основаны на особенностях архитектурных решений для лингвистических алгоритмов на системы типа TRANSFER и системы типа INTERLINGUA: Алгоритмы перевода для систем типа TRANSFER строятся как композиция трех процессов: анализ входного предложения в терминах структур входного языка, преобразование этой структуры в аналогичную структуру выходного языка (TRANSFER) и затем синтез выходного предложения по полученной структуре. Системы типа INTERLINGUA предполагают априори наличие некоторого метаязыка структур (INTERLINGUA), на котором можно описать все структуры как входного, так и выходного языков в общем случае; поэтому алгоритм перевода в системе типа INTERLINGUA предполагается как более простой: анализ входного предложения в терминах метаязыка и затем синтез из метаструктуры соответствующего предложения выходного языка. "Единственная" сложность в этом случае – разработать сам метаязык и описать естественный язык в соответствующих терминах.

Несмотря на то, что эта  классификация существует, и в  среде разработчиков МП считается  хорошим тоном спросить, к какому типу относится ваша система, не было разработано еще не одной реальной системы, основанной на принципе INTERLINGUA.

Поэтому анализ простых предложений  как структур, состоящих из синтаксических единиц, выполняется на основе фреймовых  предикатных структур, которые позволяют  эффективно выполнять преобразования. Глагол считается для простых предложений главным элементом и его валентности определяют заполнение соответствующего фрейма. Для каждого типа фреймов существует некоторый закон преобразования в выходной фрейм и оформление актантов. Таким образом, осуществляется TRANSFER на уровне предложений. Анализ сложных предложений требуется в случае формирования согласования времен и правильного перевода союзов.

Хотелось бы надеяться, что  эти сведения позволят потенциальным  пользователям систем перевода понять, что создание системы МП – задача не такая уж простая, и, что называется, наукоемкая. А, следовательно, количество действительно пригодных к использованию  систем перевода, которое может появляться в единицу времени, принципиально  ограничено.

В любом случае, стилистические и грамматические огрехи машинного  перевода компенсируются потрясающей скоростью получения его чернового варианта.

1.2. МАШИННЫЙ ПЕРЕВОД – ЭТО… ИНСТРУМЕНТ

Всем хорошо известно, что  хороший перевод текста – это  не только творческая, но и достаточно трудоемкая работа. Причем даже самый  хороший перевод, как правило, нуждается  в редакторской правке. Что касается творческой части, то в обозримом  будущем в соревновании компьютер-человек  всегда победит "живой" переводчик. Однако для решения проблем, обусловленных  трудоемкостью процесса перевода, системы  МП могут оказаться хорошим подспорьем. Для того чтобы это лучше понять, перечислим достоинства программ машинного  перевода (общие для всех систем МП вообще и систем PROMT в частности):

1. Высокая скорость. Всего несколько секунд и Вы получаете перевод многостраничного текста. Это позволяет быстро понять смысл текста, а если система настроена на перевод текстов этой тематики, требуется минимальная редакторская правка.

2. Низкая стоимость. Это очень легко оценить: если вы обращатесь к профессиональным переводчикам, приходиться платить за каждую страницу переведенного текста (в зависимости от региона и уровня квалификации переводчика страница перевода будет стоить от 5 до 20 долларов), либо вы нанимаете штатного переводчика, которому приходится платить зарплату. В случае с системой машинного перевода, вы платите деньги только один раз – при покупке программы. Что вы предпочтете – разовое капиталовложение или регулярные издержки? По данным пользователей компании ПРОМТ при переводе от 50 страниц текста в месяц программа-переводчик PROMT 98 окупается примерно за месяц.

3. Доступ к услуге. Немаловажный фактор, который многие критики систем МП не принимают в расчет. Программа-переводчик всегда под рукой, а обращаться в переводческое бюро во многих случаях связано с дополнительными затратами времени и сил.

4. Конфиденциальность. Системе МП вы можете доверить любую информацию. Приятно ли вам отдавать на перевод личную переписку? Готовы ли Вы к тому, чтобы посвятить в свои финансовые дела постороннего переводчика? Пойдете ли вы в переводческое бюро для того, что бы перевести какую-нибудь эротическую литературу? Если да, то действительно вопросов нет. Но даже в этом случае, согласитесь, немногие пользователи Вас в этом поддержат. Мы знаем, что многие пользователи регулярно используют наши системы для перевода личных писем, поскольку часто получаем письма от людей, которым наша система помогла устроить личную жизнь. Программа-переводчик сохранит в тайне любые тексты, которой Вы ей доверите.

Информация о работе Почему машина не переводит как человек