Машинный перевод

Автор работы: Пользователь скрыл имя, 16 Апреля 2014 в 20:19, курсовая работа

Краткое описание

Перевод имеет долгую историю. Своими корнями он восходит к тем далеким временам, когда праязык начал распадаться на отдельные языки и возникла необходимость в людях, знавших несколько языков и способных выступать в роли посредников при общении представителей разных языковых общин.

Переводом называется процесс и результат создания на основе исходного текста на одном языке равноценного ему в коммуникативном отношении текста на другом языке.

Содержание

ВВЕДЕНИЕ ………………………………………………………………………. 3

МАШИННЫЙ ПЕРЕВОД ……………………………………………………. 6

История развития машинного перевода …………………………... 6

Электронные словари ………………………………………………….. 8

Компьютер на месте переводчика …………………………………... 10

Как переводит компьютер …………………………………………….. 12

Словарь ……………………………………………………………… 12

Грамматика …………………………………………………………. 13

Ответ критикам машинного перевода

(или Почему популярны программмы-перводчики) ……….. 15

Машинный перевод – это… инструмент …………………………… 16

Переводчик для офиса ………………………………………………….. 19

Кто в доме переводчик? ………………………………………………… 22

Машинный перевод в Интернете …………………………………….. 25

Как улучшить качество перевода (Практические советы) …... 27


ЗАКЛЮЧЕНИЕ …………………………………………………………………… 30

Литература …………………………………………………………………………. 32

Прикрепленные файлы: 1 файл

машинный перевод курсовая.docx

— 73.19 Кб (Скачать документ)

 

 

 И в заключение немного  о "темных лошадках". Существует  еще одна программа, которую, признаться, мне очень хотелось бы видеть  среди недорогих домашних переводчиков. Это утилита QTrans, на сегодняшний день поставляемая только в комплекте с PROMT 98. В ней реализованы довольно мощные функции перевода и предельно простой пользовательский интерфейс. К тому же, объединив QTrans с новой коллекцией тематических словарей под названием "Домашняя", компания ПРОМТ могла бы предложить отличный продукт, удовлетворяющий и начинающих, и более опытных пользователей.

 

 

 Также сейчас наблюдается  новый всплеск интереса к системам  МП в связи с развитием сети  Интернет. Миллионы людей, говорящих  на разных языках, оказались в  едином информационном пространстве. Доминирует в Сети английский  язык, но есть пользователи, которые  им не владеют, как, впрочем, есть  множество Webстраниц, написанных не по-английски. Для облегчения просмотра страниц Интернет на незнакомом пользователю языке появились дополнения к броузерам, которые осуществляют немедленный перевод выбранных пользователем фрагментов просматриваемой Web­страницы. Достаточно лишь выделить часть текста мышкой и перенести ее на специальную панель либо нажать указателем на специальную кнопку меню. Примером такого переводчика является система Web Trans Site фирмы ПРОМТ, созданная на базе программы Stylus, которая подключается как к броузеру Netscape Navigator, так и к броузеру Microsoft Internet Explorer.

 

 

9. МАШИННЫЙ ПЕРЕВОД В  ИНТЕРНЕТЕ

 

 Онлайновый перевод  информации в Интернете становится  все более популярным. Интернет  стремительно превращается из  преимущественно англоязычной в многоязычную среду, что вынуждает владельцев Web-сайтов предоставлять информацию на нескольких языках. Наиболее часто к услугам МП прибегают информационные и поисковые сайты, которые стремятся привлечь на свои страницы разноязычных пользователей. Так, на канадском информационно-поисковом портале InfiniT (infiniT) открылся новый сервис переводов. На сайте теперь доступен онлайновый перевод текста с английского и немецкого языков на французский язык и обратно.

 

 Увеличение числа посетителей  портала обусловлено возможностью  онлайнового перевода Web-страниц. Для  этого пользователю достаточно  указать только адрес Web-страницы, выбрать направление перевода  и нажать кнопку перевода. В  результате через несколько секунд  пользователь получает полностью  переведенную Web-страницу с сохранением  форматирования.

 

 Новый сервис позволяет  ликвидировать языковую проблему  в канадском Интернете, где в  силу исторических особенностей  широко используются два языка: английский и французский. Кроме  того, онлайновый переводчик открывает  доступ к сайтам на немецком  языке тем жителям Канады, которые  не владеют иностранными языками.

 

 Сервис работает на  базе серверного Интернет-решения компании ПРОМТ под названием PROMT Internet Translation Server version 2.0. Проект был реализован совместно с компанией Softissimo, которая занимается продвижением продуктов компании ПРОМТ под торговой маркой REVERSO.

 

 Интересной особенностью Web-сайтов, знакомящих с программами  МП, электронными словарями и  другими программами лингвистической  поддержки, является то, что с  работой многих программных продуктов  можно познакомиться в интерактивном  режиме, используя версию, установленную  на сервере и имеющую шлюз  для удаленного общения через Web-интерфейс. На сервере Web-издательства "ИнфоАрт" (infoart/misc/dict) организована интерактивная демонстрация словарей Lingvo и "МультиЛекс". Вы можете ввести слово или словосочетание и мгновенно получить перевод, толкование, примеры употребления и устойчивые словосочетания.

 

 

 Что же посоветовать  пытливому читателю, решившемуся  на штурм языкового барьера  в Интернет? Его оружием могут  стать WebTranSite 98 (разработчик – ПРОМТ, цена ~ $32), WebView (продукт поставляется в комплекте с PROMT и PROMT Internet), PROMT Internet (разработчик – ПРОМТ, цена ~ $42) или Socrat Internet (разработчик – "Арсеналъ", цена ~ $30). Наиболее универсальным из них является PROMT Internet. Купив этот пакет, вы получите сразу несколько программ для перевода Web-страниц, и не только их. Можно с уверенностью сказать, что возможностей данного набора приложений вполне достаточно для полноценной работы с документами на английском, французском и немецком языке.

 

Если вы предполагаете использовать универсальную переводящую программу WebTranSite 98 или броузер WebView больше, чем другие части пакета PROMT Internet, и при этом желаете сэкономить немного денег, то можете приобрести эти продукты по отдельности. В таком случае WebTranSite 98 придется по вкусу тем, кто часто переводит небольшие фрагменты текста не только из Интернет, но и из офисных, почтовых и других программ, а также из системы интерактивной справки. Замечу, что WebTranSite 98 подходит не только для перевода Web-страниц. Она достаточно универсальна и позволяет обрабатывать фрагменты текста из любых приложений, в том числе из текстовых редакторов, электронных таблиц, органайзеров, броузеров. Программа переводит тексты с английского, немецкого или французского языка на русский и обратно.

 

 Что касается WebView, то это – инструмент искушенного "интернетчика", много времени проводящего на иноязычных серверах и не желающего пропустить ни одной крупицы информации. Программа WebView – полноценный броузер для загрузки и просмотра Web-страниц. Так что, используя его при работе с Интернет-документами на иностранном языке, вы можете даже отказаться от привычных Internet Explorer и Netscape Navigator. WebView – это своеобразный "гибрид" броузера Internet Explorer 4.0 и системы машинного перевода PROMT 98. Полученная в результате такого "скрещивания" программа позволяет переводить Web-страницы, полностью сохраняя их внешний вид. WebView может работать с тремя иностранными языками: английским, французским и немецким, причем переводит как с любого из них на русский, так и в обратном направлении. Функции перевода в этой программе шире, чем в WebTranSite 98, и их набор практически такой же, как в PROMT 98. Так, в дополнение к рассмотренным выше операциям со словарями WebView позволяет вводить в них новые слова и фразы. Чтобы облегчить вашу задачу, программа составляет список незнакомых ей выражений, встретившихся в тексте, подсчитывает количество появлений каждого из них и выводит результаты в специальном диалоговом окне. Выбрав любое из этих слов, вы можете либо запретить его перевод, либо добавить в пользовательский словарь. Единственный недостаток, который портит хорошее впечатление о WeView – это то, что программа иногда зависает при несовпадении направления перевода и языка оригинальной страницы.

 

 Однако программы WebTranSite 98 и Web View по отдельности уже сняты с производства. Да и экономия по сравнению с покупкой PROMT Internet не так уж велика.

 

Socrat Internet – это аналог "переводящего броузера" WebView. С ее помощью можно выполнять "синхронный" перевод Web-страниц с сохранением их форматирования. Однако если WebView по возможностям настройки опций перевода ничем не уступает профессиональной системе PROMT 98, то в Socrat Internetникаких средств управления этими функциями нет вообще. Броузер от компании "Арсеналъ" не позволяет подключать тематические словари, что сильно ухудшает качество перевода специальных текстов (их, кстати, в Интернет очень много). Простота использования, которой так добивались разработчики, отнюдь не пошла на пользу программе, потерявшей гибкость и управляемость, такие важные для систем машинного перевода. В итоге Socrat Internet существенно уступает продуктам "ПРОМТ" по многим параметрам, в том числе и по самому важному – качеству выходного текста.

 

 

10. КАК УЛУЧШИТЬ КАЧЕСТВО  ПЕРЕВОДА?

Практические советы.

 

Наверняка многие уже имеют опыт "общения" с системами машинного перевода. Кое-кто сумел уловить правильный подход к работе с этими программами и эффективно использует их. Другие, наоборот, после первого же сеанса работы испытали разочарование, оценив качество полученного текста. Но не стоит отчаиваться. Существуют способы улучшения результатов машинного перевода, доступные каждому пользователю. О некоторых из них мы сейчас и поговорим.

 

 

1. Исход работы в значительной  мере решается еще до ее  начала.

 

Прежде чем приступить к переводу, обязательно определите две вещи: во-первых, для каких целей предполагается использовать его результаты, а во-вторых, что представляет собой исходный текст.

 

 Назначение перевода  играет первостепенную роль при  оценке его качества. В самом  деле, один и тот же результат  можно считать отличным, если  нужно просто узнать, о чем  идет речь в оригинальной статье, и совершенно непригодным, если  нужно получить текст для публикации в книге или журнале. Но иногда даже самый "грубый" перевод оказывается приемлемым, если в нем имеется достаточно информации, по которой специалист в соответствующей предметной области может легко восстановить содержание текста.

 

 С другой стороны, определив, к какому стилю речи принадлежит  исходный текст, нетрудно оценить  его пригодность для машинного  перевода, а значит, и предугадать  результат. Чем больше в тексте  иносказательных оборотов, метафор, чем свободнее стиль, тем хуже  справится компьютер с его  переводом.

 

 Лучше других обрабатываются  научные, технические и образовательные  тексты, которым присуще строгое  изложение материала. Если своевременно  пополнять специальные словари  новыми терминами, то можно получать  полностью связный перевод текстов, требующий минимальной стилистической  доработки.

 

Разговорный и публицистический стиль, где много специфических оборотов, но большинство слов используется в прямом смысле, пригодны для ознакомительного перевода, однако для получения грамотного выходного текста потребуется ручная правка. А вот поэзия и художественная литература, к сожалению, совершенно непригодны для машинного перевода. Смысл текста, построенного на иносказательных выражениях, при машинном переводе искажается и недоступен даже для ознакомления.

2. Бойтесь опечаток!

 

Очень часто причиной неправильного перевода являются опечатки в оригинале. В особенности это касается отсканированных и распознанных текстов. Слова с орфографическими ошибками в большинстве случаев помечаются системой как незнакомые, поскольку в исковерканном виде они в словарях отсутствуют. Сложнее, если опечатка превращает одно слово в другое, которое также существует в иностранном языке, – программа переведет его, но смысл текста будет искажен. Но самыми серьезными "подводными камнями" являются ошибки в пунктуации. Одна неправильно поставленная запятая способна серьезно исказить перевод предложения. Поэтому перед переводом как можно тщательнее проверьте исходный текст.

 

 

3. Хороший словарь –  половина успеха.

 

 Обязательно найдите  и подключите специальные словари  по тематике переводимого текста. Если в точности такой тематики  нет, определите наиболее подходящую  комбинацию имеющихся у вас  словарей и, кроме того, обязательно  создавайте свои. Идеально, конечно, иметь для каждого текста свой  словарик, но оптимальным, с точки  зрения продуктивности работы, является  разбиение наиболее распространенных  тем на подпункты. Например, в  рамках компьютерной тематики  можно создать словари "Офисные  программы", "Графика", "Сети", "Internet и WWW" и т.д.

 

 

4. Строим "пирамиду".

 

 Если к системе подключено  несколько словарей, то успех  перевода во многом зависит  от того, в каком порядке программа  ищет в них текущее слово. Поэтому  организуйте иерархию словарей  в порядке от частного к  общему. Самый высокий приоритет  должен иметь словарь, созданный  для текущего текста, затем –  тематические (в порядке расширения  предметной области), а самый низкий  уровень остается за словарем  общеупотребительных понятий. Так, при переводе текста о программе  Adobe Photoshop лучше всего на самом высоком уровне поставить словарь "Photoshop" (созданный вами специально для этого текста), затем – "Компьютерная графика", "Информатика" и в самом конце списка – общий словарь. Поскольку объем узкоспециализированных пользовательских словарей, как правило, невелик, а общего, наоборот, огромен, то полученная в результате "конструкция" в чем-то походит на пирамиду.

 

 

5. Не надо спешить!

 

 Никогда не переводите  сразу весь текст. В нем всегда  найдется как минимум одно-два  слова, отсутствующих в словарях, и превеликое множество таких, которые система переводит неправильно. Покончив с подключением словарей  и определением других опций  перевода, для начала переведите  небольшой фрагмент в начале  текста, например первый абзац. Найдите  в этом фрагменте слова, переведенные  неправильно, и внесите их в  словарь самого высокого уровня. Переведите фрагмент заново. Если  результат вас удовлетворит, переходите  к следующему абзацу. Практика  показывает, что для точной настройки  системы необходимо перевести таким образом четверть, а иногда даже треть материала и только после этого запускать автоматическую обработку всего текста.

 

 

6. Различайте общее и  частное!

 

 Прежде чем внести  новое слово в пользовательский  словарь, определите, будет ли оно  переводиться в тексте данным  образом только один-два раза  или постоянно. Искусство правильной  работы с системой машинного  перевода состоит в том, чтобы  различать общее и частное. В  идеальном случае от вас потребуется  знание иностранного языка и  предметной области текста. В  словарь вносите только систематически  встречающиеся варианты перевода, единичные же исправляйте вручную. В противном случае слово по  всему тексту будет переведено  неправильно.

 

 

 Соблюдение приведенных  выше простых правил обычно  позволяет существенно повысить  качество переведенных компьютером  текстов. Нельзя гарантировать, что  они всегда окажутся абсолютно  правильными и стилистически  грамотными. Однако, вероятнее всего, свою первую задачу – понять  смысл текста – вы решите.

 

З А К Л Ю Ч Е Н И Е

 

 Стремительные потоки  информационного обмена между  высокоразвитыми промышленными  странами, лавина научно-технической  документации, поступающая от производителей  товаров и современных технологий, требуют совершенно нового подхода  к проблеме перевода технической  литературы. Выход один: максимально  автоматизировать процесс, оставив  человеку его творческую редакционную  часть. В этом помогает система  машинного перевода. Ее параметры  должны удовлетворять четырем  основным требованиям:

 

• оперативность;

 

• гибкость;

 

• скорость;

 

• точность.

 

Информация о работе Машинный перевод