Машинный перевод

Автор работы: Пользователь скрыл имя, 16 Апреля 2014 в 20:19, курсовая работа

Краткое описание

Перевод имеет долгую историю. Своими корнями он восходит к тем далеким временам, когда праязык начал распадаться на отдельные языки и возникла необходимость в людях, знавших несколько языков и способных выступать в роли посредников при общении представителей разных языковых общин.

Переводом называется процесс и результат создания на основе исходного текста на одном языке равноценного ему в коммуникативном отношении текста на другом языке.

Содержание

ВВЕДЕНИЕ ………………………………………………………………………. 3

МАШИННЫЙ ПЕРЕВОД ……………………………………………………. 6

История развития машинного перевода …………………………... 6

Электронные словари ………………………………………………….. 8

Компьютер на месте переводчика …………………………………... 10

Как переводит компьютер …………………………………………….. 12

Словарь ……………………………………………………………… 12

Грамматика …………………………………………………………. 13

Ответ критикам машинного перевода

(или Почему популярны программмы-перводчики) ……….. 15

Машинный перевод – это… инструмент …………………………… 16

Переводчик для офиса ………………………………………………….. 19

Кто в доме переводчик? ………………………………………………… 22

Машинный перевод в Интернете …………………………………….. 25

Как улучшить качество перевода (Практические советы) …... 27


ЗАКЛЮЧЕНИЕ …………………………………………………………………… 30

Литература …………………………………………………………………………. 32

Прикрепленные файлы: 1 файл

машинный перевод курсовая.docx

— 73.19 Кб (Скачать документ)

 

 Система ПАРС по  некоторым параметрам уступает  Stylus, хотя для бытового использования она достаточно удобна и, что очень важно, цена ее лицензионной копии доступна (компакт-диск с этой программой и несколькими специализированными словарями стоит около $20). В продаже есть большой набор словарей к этой системе по различным темам: вычислительная техника, медицина, химия и т.д. вплоть до таких областей, как, например, лесная и бумажная промышленность. Цены на компакт-диски со специализированными словарями к системе ПАРС обычно не превышают $30, она размещается на одном CD со словарями. Эта система спокойно работает в среде Windows 3.1 и более поздних версий. Есть даже ее версия для операционной системы MS DOS, что позволяет использовать для МП устаревшие компьютеры с процессорами 80286, которые вполне пригодны для обработки текстов. В дальнейшем речь пойдет о версии ПАРС для Windows, работающей в среде операционной системы Windows 95.

 

 ПАРС для Windows может работать в двух режимах. В первом случае он переводит файл в формате «текст MS DOS» и результат записывает в другой файл с тем же форматом. Сам же переводимый текст готовится в другом редакторе, причем в среде Windows сделать это затруднительно, так как в ней принята другая кодировка русских букв. Кроме всего прочего, простейший формат «текст MS DOS» все реже применяется для подготовки серьезных документов.

 

 Гораздо удобнее другой  режим, когда программа МП работает  совместно с мощным внешним  текстовым редактором. Таким редактором  для ПАРС является Microsoft Word 6.0 for Windows. Кроме удобства появляется возможность работы с текстами в формате RTF (Rich Text Format), где записываются размеры и форма шрифтов, и эти параметры переносятся в результат перевода.

 

В процессе инсталляции ПАРС определяется наличие на жестком диске инсталлированного текстового редактора Word. Когда редактор успешно обнаружен при инсталляции программы МП, то в его окне наверху появляется еще одно меню – ‘Перевод’. Результат перевода представляется в редакторе как новое окно с текстом. Если сначала была инсталлирована система ПАРС, а потом уже Word, то для их совместной работы потребуется повторно осуществить выборочную инсталляцию программы перевода и элементов ее связи с внешним текстовым редактором.

 

Но если перевод осуществляется впервые после запуска программы, перед его началом потребуется указать используемые словари. Зачастую пользователи могут недооценивать применение специализированных словарей. Однако следует вспомнить, что переводчики при работе со специализированными текстами используют, как правило, словари по соответствующей тематике, а не произвольные.

 

 Рассмотрим это на  примере:

 

 Оригинал:

 

Nokia 9000i Communicator now supports short messages with up to 2 280 characters, the current standard being 160 characters. With the Text Web service based on Smart Messaging, the end-user is able to obtain information in a simple text format without graphics or logos from the Internet by using the short message service. Text Web information can include flight schedules, weather or traffic reports, or the stock news.

 

 Перевод без подключения специализированного словаря:

 

Nokia 9000i Коммуникатор теперь поддерживает короткие сообщения с до 2280 характеров (знаков), текущий стандарт, являющийся 160 характерами (знаками). С обслуживанием (службой) Ткани (сети) Текста, основанным на Шикарном (сильном) Messaging, конечный пользователь способен получить информацию в простом формате текста без графики или эмблем от Internet, используя короткое обслуживание (службу) сообщения. Информация Ткани (сети) Текста может включать списки (графики) рейса (полета), погоду или сообщения движения, или новости запаса (акции).

 

 Перевод с подключенным  словарем “Телекоммуникации и  связь”:

 

Nokia 9000i Коммуникатор теперь поддерживает короткие сообщения с до 2280 символов, текущий стандарт, являющийся 160 символами. С Текстовым обслуживанием Сети, основанным на Smart Messaging, конечный пользователь способен получить информацию в простом текстовом формате без графики или эмблем от Internet, используя систему передачи коротких сообщений. Текстовая информация Сети может включать список рейса (полета), погоду или сообщения трафика, или новости фондового рынка.

 

Как уже было сказано, словари выбираются в зависимости от стиля и тематики текста. Обратим внимание на кнопку ‘Приоритет’. С ее помощью можно перемещать словари в списке. Если в переводимом тексте имеется слово, встречающееся в нескольких из выбранных словарей и в каждом из них его значения различны, то будет выбран вариант перевода из словаря, стоящего в списке первым. Возможность расположения словарей по различному приоритету позволяет гибко подстраивать систему перевода под тексты, содержание которых лежит на границе двух специальностей. Рассмотрим в качестве примера использование словарей компьютерных и химических терминов. Допустим, имеется текст про компьютеризацию химического производства. В нем, конечно, чаще будут встречаться компьютерные, нежели химические термины, и поэтому термин, имеющий двоякое толкование, должен скорее переводиться по словарю компьютерных терминов. В этом случае словарь терминов компьютерных должен иметь больший приоритет, чем словарь химических. Другой вариант – текст про химические процессы в производстве компьютеров. Здесь чаще будем замечать химические термины, и, соответственно, словарь химических терминов будет иметь больший приоритет. Ну и, конечно, используя специальные словари, не следует забывать подключать и словарь общеупотребительной лексики. При переводе технических текстов целесообразно присвоить этому словарю наименьший приоритет.

 

 Но даже тонкая настройка  системы под лексику переводимого  текста не учитывает всех его  особенностей, поэтому переведенные  слова, имеющие несколько синонимов, помечаются звездочкой. Указав мышкой  на такое слово, можно выбрать  подходящий вариант перевода  либо оставить то, что предложил  компьютер.

 

 Когда варианты перевода  выбраны, можно приступать к редактированию  переведенного текста, благо Word обладает для этого мощными средствами.

 

 Текст иногда полезно  подвергнуть некоторой обработке  перед МП. Так, системы МП могут  ошибаться из-за наличия в тексте  сокращений, заканчивающихся точкой. Если после такого сокращения  следует слово, начинающееся с  большой буквы, то компьютер воспринимает  точку как конец предложения, из-за чего предложение может  быть неправильно разобрано, и, следовательно, ошибочно переведено. Значит, точки  в сокращениях надо убирать. Сокращения  будут перенесены в текст без  перевода, и их нужно перевести  вручную. В переводимом тексте  должны отсутствовать переносы, что, впрочем, легко обеспечивается при подготовке текста в редакторе Word. Особенно внимательно надо просматривать тексты, получаемые в результате распознавания отсканированного изображения, так как содержащиеся в них ошибки нередко приводят к тому, что отдельные слова остаются непереведенными всего-то из-за одной неправильной буквы. Кстати, уже упоминавшаяся система Stylus вместе с программой FineReader входит в состав пакета Stylus Lingvo Office, предназначенного для обработки документов, введенных в компьютер путем сканирования.

 

 

Однако не следует забывать, что работа для переводчика найдется не только в офисе, но и дома. Поэтому мне хотелось бы рассказать о некоторых системах машинного перевода, изначально предназначенных домашнего применения.

 

 

8. КТО В ДОМЕ ПЕРЕВОДЧИК?

 

Работа для электронного полиглота найдется практически в каждом доме. Его услугами охотно воспользуются школьники, студенты и аспиранты с их вечными "тысячами", которые нужно сдавать, невзирая на полное или частичное отсутствие времени, желания, а иногда и знаний. Время от времени он будет полезен и другим членам семьи при переводе письма, полученного по электронной почте от знакомого из-за рубежа, инструкции к импортной стиральной машине или кулинарного рецепта из иностранного журнала. Все мы, вне зависимости от возраста и рода занятий, являемся потенциальными "клиентами" домашнего переводчика.

 

Но какие же системы вправе называться домашними? В первую очередь, естественно, это программы, изначально создаваемые для всей семьи. Они отличаются простотой пользовательского интерфейса, многочисленными вспомогательными функциями и мультимедийными возможностями. Их словари оптимизированы для перевода текстов на обычные домашние темы: хозяйство, отдых, развлечения и т.д. Работать с ними интересно не только взрослым, но и детям.

 

Вторым критерием пригодности системы МП для использования дома является легкость управления и высокий уровень автоматизации. Мало кто, не являясь профессионалом-лингвистом, возьмется, например, определять языковые характеристики слов. Чаще всего нам нужно просто узнать содержание непонятного текста на иностранном языке, а не получить его литературный перевод.

 

И наконец, немаловажным фактором при покупке персональных переводчиков является цена. Системы стоимостью выше $60–70 вряд ли смогут получить прописку у многих пользователей на винчестере их домашнего ПК. Поэтому я решила ограничить свой выбор продуктами, которые можно приобрести дешевле $50.

 

Исходя из приведенных критериев, для домашнего применения можно порекомендовать следующие системы МП: Magic Gooddy (от компании ПРОМТ), "Сократ Персональный 3.0.3" и "Коперник". Первая из них была специально разработана для этих целей, вторая попадает в наше поле зрения благодаря своей компактности и предельной простоте использования, последняя же обладает довольно широким набором возможностей при весьма низкой цене.

 

Выбранные мною системы настолько разнообразны по своим возможностям, что какое-либо их сравнение или тестирование вряд ли имеет смысл. А поскольку цель данной работы состоит не в том, чтобы дать полное руководство пользователя данных программ, то позволю себе отметить лишь особенности, преимущества и полезные функции каждой из них.

 

 Что же выбрать? Оказывается, что выбор домашнего переводчика  сегодня однозначно зависит от  его функциональных возможностей  и предельно прост, поскольку  рассмотренные нами программы  коренным образом различаются. Сформулировав  основные цели перевода, диапазон  тематик, а также требования к  качеству результата, можно четко  определить, какая из систем окажется  в данном случае наиболее подходящей.

 

 

Magic Gooddy – самый универсальный семейный переводчик. И не удивительно – ведь он "домашний" от рождения. Он вполне годится для перевода учебных текстов, писем, руководств к программам, интерактивной справки, и многого другого, вплоть до кулинарных рецептов. Те, кому уже приходилоси сталкиваться с «Волшебником Гудди», настоятельно рекомендуют эту программу детям. Для них она окажется не только помощником и подсказчиком при выполнении домашних заданий по английскому языку. Magic Gooddy является ценным дополнением к обучающим программам, главным образом благодаря возможности читать вслух произвольные тексты. Не стоит бояться, что Гудди отучит ваших детей работать самостоятельно. Более вероятно, что он пробудит в них интерес к иностранным языкам, а возможно, и к нелегкому труду переводчика.

 

Что касается качества перевода, скорее всего у вас не будет проблем с переводом руководства к кухонному комбайну, кулинарного рецепта или письма. Фрагмент руководства по Quake II также будет вполне понятным, однако, самые "заковыристые" жаргонные выражения программа переведет не совсем точно. Но есть у этого переводчика и недостаток – зависимость качества перевода от того, насколько точно оригинал соответствует одной из имеющихся тематик. Тексты "на стыке" областей, а также разговорные переводятся хуже.

 

 

"Коперник" лучше всего  подойдет для домашнего офиса  профессионального переводчика. Он  обладает достаточными возможностями  для подготовки переводных текстов  высокого качества. Программа хорошо  переводит тексты самых разнообразных  тематик, иногда даже без дополнительных  словарей. В некоторых случаях  после подключения словарей и  несложного постредактирования  удается получить переводы, удовлетворяющие  всем правилам грамматики и  стилистики русского языка. Кроме  того, эта программа поддерживает  четыре языка, в том числе украинский, что в последнее время весьма актуально. К тому же единственная система, которая может работать с таким же набором языков, – Language Master 98 – стоит на порядок дороже. А интеграция с Word и функция выбора вариантов перевода слов позволяют значительно сократить затраты времени на постредактирование.

 

 

"Сократ Персональный 3.0.3" – это предельно простая  система для ознакомительного  перевода небольших фрагментов  текста. Ее козыри – компактность  и наличие встроенного электронного  словаря, она нетребовательна к  квалификации пользователя и  максимально автоматизирована. Качество  перевода этой системы не всегда  высокое, но зато мало зависит  от тематики текста. Соответственно, эта программа найдет применение  при интенсивной работе с разнообразными  иностранными текстами на ознакомительном  уровне. Лучше всего поддаются  переводу с ее помощью тексты  интерактивной справки. Их смысл  удается понять во всех случаях, а большинство предложений построены  грамотно. Также хорошие результаты  можно получить при работе  с деловыми письмами – здесь  сказываются хорошая сбалансированность  словаря, большой запас экономической  лексики, а также строгость и  шаблонность делового стиля речи, под который, в частности, и настраивался  программный алгоритм "Сократа". Удовлетворительными можно считать  результаты работы с документацией  к программам и руководствами  к бытовым приборам, однако, понять  их содержание, как правило, можно. Слабым местом программы являются  научные тексты, личная переписка, разговорные темы и особенно  руководства к компьютерным играм. В первом случае сказывается  отсутствие в составе "Сократа" словарей специальных терминов. Остальные же представляют собой  естественное затруднение для  всех систем машинного перевода, вызванное неформализованной лексикой, сложностью оборотов и стилистическим  разнообразием указанных текстов.

Информация о работе Машинный перевод