Системы машинного перевода. Достоинства и недостатки

Автор работы: Пользователь скрыл имя, 06 Января 2014 в 16:54, реферат

Краткое описание

В последнее время знание иностранных языков может понадобиться не только в путешествии или на приеме гостей из-за рубежа, но и в собственном доме, например, при просмотре популярных голливудских кинолент, при чтении инструкции по использованию заморских товаров или Web-страниц, которые разыскивает по всему свету неутомимый броузер. Таким образом, оказывается, что даже не покидая родных стен, мы нуждаемся в услугах переводчика. Однако необходимую помощь нам вполне может оказать домашний компьютер. Системы машинного перевода (МП) давно перестали быть диковинкой.

Содержание

1. Машинный перевод…………………………………………………………………….. 3
2. Формы организации взаимодействия ЭВМ и человека при машинном переводе…. 4
3. История машинного перевода…………………………………………………………. 5
4. Качество перевода……………………………………………………………………… 8
5. Статистический машинный перевод………………………………………………….. 9
6. Компьютер на месте переводчика……………………………………………………. 10
7. Машинный перевод – это… инструмент……………………………………………... 12
8. Переводчик для офиса…………………………………………………………………. 13
9. Обзор доступных систем машинного перевода……………………………………… 19
10. Недостатки программ машинного перевода…………………………………………. 20
11. Достоинства программ – переводчиков………………………………………………. 22
12. Заключение……………………………………………………………………………… 24
13. Список используемой литературы…………………………………………………….. 26

Прикрепленные файлы: 1 файл

реферат машинный перевод.doc

— 196.00 Кб (Скачать документ)

Министерство образования и  науки

Российской Федерации

«Красноярский государственный педагогический

Университет им. В.П. Астафьева»

Реферат

ТЕМА: Системы машинного перевода. Достоинства и недостатки.

Выполнил: студент заочного отделения  
факультета Информатики  
специальность - Информатика (5,5 лет)  
Заболотникова Евгения Геннадьевна

2009 – 2010 учебный год

 

ПЛАН:

Машинный перевод……………………………………………………………………..

3

Формы организации взаимодействия ЭВМ и человека при машинном переводе….

4

История машинного перевода………………………………………………………….

5

Качество перевода………………………………………………………………………

8

Статистический машинный перевод…………………………………………………..

9

Компьютер на месте переводчика…………………………………………………….

10

Машинный перевод – это… инструмент……………………………………………...

12

Переводчик для офиса………………………………………………………………….

13

Обзор доступных систем машинного  перевода………………………………………

19

Недостатки программ машинного  перевода………………………………………….

20

Достоинства программ – переводчиков……………………………………………….

22

Заключение………………………………………………………………………………

24

Список используемой литературы……………………………………………………..

26




 

Машинный перевод

В последнее время знание иностранных  языков может понадобиться не только в путешествии или на приеме гостей из-за рубежа, но и в собственном доме, например, при просмотре популярных голливудских кинолент, при чтении инструкции по использованию заморских товаров или Web-страниц, которые разыскивает по всему свету неутомимый броузер. Таким образом, оказывается, что даже не покидая родных стен, мы нуждаемся в услугах переводчика. Однако необходимую помощь нам вполне может оказать домашний компьютер.

Системы машинного перевода (МП) давно  перестали быть диковинкой. Они постепенно выходят из младенческого возраста и вместо бессвязного детского лепета начинают изъясняться на вполне понятном, "человеческом" языке. До последнего времени такие программы были не только очень дороги, уступая в цене разве что мощным графическим и издательским системам, но и весьма сложны и капризны в работе. И вот появились первые переводчики, пригодные для использования на домашнем ПК. Давайте познакомимся с ними поближе и узнаем, на что они способны. Но начнем, конечно же, с истории развития МП.

Маши́нный перево́д — процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем.

 

Формы организации взаимодействия ЭВМ и человека при машинном переводе

  • С постредактированием: исходный текст перерабатывается машиной, а человек-редактор исправляет результат.
  • С предредактированием: человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка.
  • С интерредактированием: человек вмешивается в работу системы перевода, разрешая трудные случаи.
  • Смешанные системы (например, одновременно с пред- и постредактированием).

Автоматизированный перевод

Вместо «машинный» иногда употребляется слово автоматический, что не влияет на смысл. Однако термин автоматизированный перевод имеет совсем другое значение — при нём программа просто помогает человеку переводить тексты.

Автоматизированный перевод предполагает такие формы взаимодействия:

  • Частично автоматизированный перевод: например, использование переводчиком-человеком компьютерных словарей.
  • Системы с разделением труда: компьютер обучен переводить только фразы жёстко заданной структуры (но делает это так, чтобы исправлять за ним не требовалось), а всё, не уложившееся в схему, отдаёт человеку.

В англоязычной терминологии также различаются термины англ. machine translation, MT (полностью автоматический перевод) и англ. machine-aided или англ. machine-assisted translation (MAT) (автоматизированный); если же надо обозначить и то, и другое, пишут M(A)T.

 

История машинного перевода

По свидетельству биографов, еще  выдающийся математик XIX века Чарльз Бэббидж пытался убедить британское правительство в необходимости финансировать его исследования по разработке “вычислительной машины”. В числе прочих благ он обещал, что когда-нибудь эта машина сможет автоматически переводить разговорную речь. Но, хотя сегодня Бэббидж и считается признанным автором множества идей, лежащих в основе работы компьютера, он так и не сумел ни построить свою машину, ни выполнить обещания по поводу МП. И сегодня эта идея по-прежнему остается в значительной степени нереализованной. Однако в последнее время благодаря появлению Интернет как платформы глобальной связи она вновь начала привлекать широкое внимание и инвестиции.

Вообще, первые программы МП появились  в 50-х годах, всего несколько лет  спустя после рождения компьютера, но до широкого распространения ПК МП был скорее интересным объектом научных исследований, чем важной сферой использования вычислительной техники, по двум причинам: дороговизна времени работы компьютера и коллективное пользование его ресурсами. Последнее обстоятельство часто не позволяло немедленно обратиться к электронному помощнику, сводя на нет важнейшее преимущество МП перед обычным – его оперативность.

Датой рождения МП (как области  исследований) принято считать 1947 г., и все началось с письма Уоррена Уивера, директора отделения естественных наук Рокфеллеровского фонда, к Норберту Винеру в марте того же года, в котором задача перевода сравнивалась с задачей дешифровки текстов. Последняя в то время уже стала выполняться на электромеханических устройствах. За этим письмом последовало множество дискуссий, появился меморандум о целях, и наконец, были выделены средства на исследования. И в 1952 г. состоялась первая конференция, организованная знаменитым математиком Бар-Хиллелем, на которой исследователи обменялись мыслями относительно организации множества синтаксических правил языка, способов описания семантики, морфологических структур, структуры словарей для систем перевода. Достижения в академических исследованиях стимулировали коммерческий интерес к проблеме МП, и фирма IBM совместно с Джорджтаунским университетом в США в 1954 г. сумела показать первую систему, базирующуюся на словаре из 250 слов и 6 синтаксических правил и обеспечивающую перевод 49 заранее отобранных предложений. Этот эксперимент положил начало исследовательскому буму: в следующие 10 лет правительство и военные ведомства США затратили на исследования в области МП около 40 млн. долларов.

От эйфории, связанной с первыми  результатами, до практически полного  отрицания осуществимости МП прошло всего восемь лет. К подобному выводу пришли на основании обзора, выполненного специальным комитетом по прикладной лингвистике (ALPAC) Национальной Академии наук США. В нем констатировалось, что системы автоматического перевода не смогут обеспечить приемлемое качество в обозримом будущем. Этот отчет драматически повлиял на развитие МП, так как были практически прекращены какие бы то ни было исследования из-за отсутствия финансирования, по крайней мере, в США и Европе. И лишь в конце 70-х годов занятия МП возобновились вместе с возрастанием интереса со стороны проектировщиков и исследователей к лингвистическим проблемам искусственного интеллекта и компьютерного поиска информации.

И только с начала 80-х годов, когда  ПК уверенно и мощно начали завоевывать мир, время их работы, естественно, подешевело и доступ к ним можно было получить в любую минуту. А значит, МП наконец-то стал экономически выгодным. К тому же в эти и последующие годы совершенствование программ позволило достаточно точно переводить многие виды текстов, однако некоторые проблемы МП остались нерешенными и по сей день.

90-е годы можно считать подлинной  эпохой возрождения в развитии  МП, что связано не только с  высоким уровнем возможностей  персональных компьютеров, появлением  сканеров и программ OCR, но и с распространением Интернет/интранет (Internet/intranet), обусловивших реальный спрос на МП. Он вновь стал привлекательной областью вложения капиталов, как для частных инвесторов, так и для государственных структур.

И хотя технологии МП по-прежнему страдают множеством недостатков, многие организации вновь стали серьезно относиться к обещанию Бэббиджа. “Машинный перевод все еще далек от совершенства, но любой желающий с его помощью сможет, по крайней мере, понять основной смысл документа”, — считает Луи Монье, технологический директор Alta Vista, крупного поискового Web-узла, который начал эксперимент с МП в онлайновом режиме.

Страны Европейского Союза потратили  за последние 15 лет более 70 млн. долл. на исследования по этой проблеме, а японские государственные организации — более 200 млн. долл. По словам T.Р.Педтке (представителя правительства США), сделавшего очень интересный доклад на MT SUMMIT VI о стратегической важности МП для его страны, одну из главных ролей в развитии этого направления продолжает играть правительство. Проблема МП рассматривается как ключевая в вопросах продвижении высоких технологий и обеспечении конкурентоспособности США в глобальном информационном пространстве.

Мысль использовать ЭВМ для перевода была высказана  в 1946 году в США, сразу после появления первых ЭВМ. Первая публичная демонстрация машинного перевода (так называемый Джорджтаунский эксперимент) состоялась в 1954 году. Несмотря на примитивность той системы (словарь в 150 слов, грамматика из 6 правил, перевод нескольких простых фраз), этот эксперимент получил широкий резонанс: начались исследования в Англии, Болгарии, ГДР, Италии, Китае, Франции, ФРГ, Японии и других странах; в том же 1954 году и в СССР.

К середине 1960-х в США для практического использования были предоставлены две системы русско-английского перевода:

  • MARK (в Департаменте иностранной техники ВВС США);
  • GAT (разработка Джорджтаунского университета, использовалась в Национальной лаборатории атомной энергии в Окридже и в центре Евратома в г. Испра, Италия).

Однако созданная для оценки подобных систем комиссия ALPAC пришла к выводу, что в силу низкого качества машинно переведённых текстов эта деятельность в условиях США нерентабельна. Хотя комиссия рекомендовала продолжать и углублять теоретические разработки, в целом её выводы привели к росту пессимизма, снижению финансирования, часто к полному прекращению работ по этой тематике.

Тем не менее, в  ряде стран исследования продолжались, чему способствовал постоянный прогресс вычислительной техники. Особенно существенным фактором стало появление мини и персональных компьютеров, а с ними всё более сложных словарных, поисковых и т. п. систем, ориентированных на работу с естественноязыковыми данными. Росла и необходимость в переводе как таковом ввиду роста международных связей. Все это привело к новому подъёму этой области, наступившему примерно с середины 1970-х. В 1980-е наступило время широкого практического использования переводческих систем, сложился рынок коммерческих разработок по этой теме.

Впрочем, мечты, с которыми человечество полвека  назад взялось за задачу машинного  перевода, в значительной мере остаются мечтами: высококачественный перевод текстов широкой тематики по-прежнему недостижим. Однако несомненным является ускорение работы переводчика при использовании систем машинного перевода: по оценкам конца 1980-х, до пяти раз.

В настоящее время  существует множество коммерческих проектов машинного перевода. Одним из пионеров в области машинного перевода была компания Systran. В России большой вклад в развитие машинного перевода внесла группа под руководством проф. Р. Г. Пиотровского (Российский государственный педагогический университет имени А. И. Герцена, Санкт-Петербург).

Информация о работе Системы машинного перевода. Достоинства и недостатки