Автор работы: Пользователь скрыл имя, 16 Апреля 2014 в 20:19, курсовая работа
Перевод имеет долгую историю. Своими корнями он восходит к тем далеким временам, когда праязык начал распадаться на отдельные языки и возникла необходимость в людях, знавших несколько языков и способных выступать в роли посредников при общении представителей разных языковых общин.
Переводом называется процесс и результат создания на основе исходного текста на одном языке равноценного ему в коммуникативном отношении текста на другом языке.
ВВЕДЕНИЕ ………………………………………………………………………. 3
МАШИННЫЙ ПЕРЕВОД ……………………………………………………. 6
История развития машинного перевода …………………………... 6
Электронные словари ………………………………………………….. 8
Компьютер на месте переводчика …………………………………... 10
Как переводит компьютер …………………………………………….. 12
Словарь ……………………………………………………………… 12
Грамматика …………………………………………………………. 13
Ответ критикам машинного перевода
(или Почему популярны программмы-перводчики) ……….. 15
Машинный перевод – это… инструмент …………………………… 16
Переводчик для офиса ………………………………………………….. 19
Кто в доме переводчик? ………………………………………………… 22
Машинный перевод в Интернете …………………………………….. 25
Как улучшить качество перевода (Практические советы) …... 27
ЗАКЛЮЧЕНИЕ …………………………………………………………………… 30
Литература …………………………………………………………………………. 32
Потенциальную аудиторию
этих программ можно
Ниже представлена классификация электронных словарей по их основным техническим и эксплуатационным характеристикам. Всю совокупность ЭС можно подразделить по следующим критериям.
1. По используемой операционной
системе. Наиболее простые электронные
словари (DIC) работают под управлением
ОС MS-DOS, начиная с версий 2.21 и 3.30,
что позволяет их использовать
практически на любых IBM-совместимых
персональных компьютерах, включая
XT, АТ-286. Наиболее сложные многооконные
и многофункциональные ЭС, позволяющие
в одной оболочке подключать
различные тематические базы
данных, работают под управлением
ОС WINDOWS 3.11, WINDOWS NT, WINDOWS 95 и т.д. Естественно,
что для их успешного
2. По способу загрузки.
Можно подразделить на
3. По количеству подключаемых
словарных баз (словарей). Ранние
версии ЭС позволяли
4. По возможностям расширения
словарной базы. Устаревшие ЭС
не имели возможности
5. По режиму перевода. Можно выделить два основных режима перевода: автоматический пакетный (подстрочечный) и интерактивный (режим "запрос — ответ").
В первом случае
программа вызывается с
Во втором случае
программа работает следующим
образом. После загрузки резидентной
части программы в оперативную
память компьютера, пользователь, работая,
например, в текстовом редакторе
либо непосредственно в
В любом случае, бум,
связанный с появлением
3. КОМПЬЮТЕР НА МЕСТЕ ПЕРЕВОДЧИКА.
Вычислительная техника, как известно, хорошее подспорье человеку в рутинной работе. Относится ли к таким занятиям перевод текстов? И да, и нет. С одной стороны, труд переводчика во многом формален, а с другой – перевод не может быть выполнен чисто формально. Есть, например, технический перевод, где важно знать принятые за рубежом стандарты обозначений тех или иных понятий. И есть литературный перевод, когда требуется получить текст, по художественной ценности максимально близкий к оригиналу. Возможно ли поручить подобную работу компьютеру?
Говоря о МП, следует прежде всего помнить, что компьютер — создание бездушное. Он не понимает языковых нюансов, намеков в тексте, того, что называется тонкой игрой слов. Да и, собственно, понять содержание текста в полной мере ему не под силу. Мышления как такового при МП не происходит: предложение расчленяется на части речи, в нем выделяются стандартные конструкции, слова и словосочетания переводятся по находящимся в памяти машины словарям. Затем переведенные части речи собираются по правилам другого языка.
Но этого, согласитесь,
недостаточно для полноценного
перевода. В зависимости от того
или иного стиля и назначения
текста одно и то же слово
нередко имеет разные значения.
В какой-то мере эта
Наряду с установленными
правилами построения
Текст также может содержать слова, которые нужно понимать в контексте образа жизни людей в конкретной стране. Например, под словом «демократ» в США подразумеваются политики, выступающие за большее вмешательство государства в экономику, а в России те, кто выступает за большую свободу рынка. Это разные понятия.
Заглавные буквы и сокращения таят в себе и другие подвохи. Когда слово начинается с большой буквы, его перевод будет начинаться тоже с большой буквы. Слово, целиком состоящее из таких букв, также будет в переводе записано заглавными. В англоязычной литературе достаточно часто встречаются внешне эффектные аббревиатуры, которые могут быть прочитаны как одно слово. Такая аббревиатура и будет переведена единым словом.
Таким образом, результаты МП часто требуют редактирования. Насколько адекватными можно считать результаты перевода на компьютере? Это определяется не только качеством системы МП, но и качеством последующего редактирования. Нередко систему МП использует в качестве подспорья специалист, которому нужно быстро перевести, например, техническую документацию. Тогда проблема корректного употребления терминов решается сама собой.
Однако МП – это
такая специфическая область
применения компьютеров, в проблемах
которой почти каждый ощущает
себя более или менее
4. КАК ПЕРЕВОДИТ КОМПЬЮТЕР
Во-первых, всем ясно, что чем больше словарь, тем лучше перевод, значит, первая проблема – проблема создания больших словарей для систем.
Во-вторых, ясно, что система должна переводить такие предложения: «Привет, как дела?». Значит, еще одна проблема - научить систему распознавать устойчивые обороты.
В-третьих, понятно, что
предложение для перевода
Самое интересное, что
эти проблемы действительно
Системы МП семейства PROMT (PROgrammer's Machine Translation)7 - очень хороший объект, чтобы продемонстрировать, каким образом эти проблемы могут решаться эффективно.
4. 1. СЛОВАРЬ
Для качественного перевода очень важно, чтобы практически все слова исходного текста легко было найти и в словаре системы. А те из них, которых в нем нет, переносятся в текст непереведенными уже на выходе из системы, и их впоследствии переводят вручную при редактировании результатов перевода. Такие слова могут повлиять на качество перевода предложения. Дело в том, что для определения, к какой части речи относится рассматриваемое слово, система производит анализ всего предложения в целом. При этом имитируется мыслительная деятельность человека (такую систему принято называть системой с элементами искусственного интеллекта). Если значение хотя бы одного слова в предложении не определено, то это может исказить анализ всего предложения, а иногда и результаты всего перевода.
Методы организации больших баз данных достаточно хорошо разработаны, но для перевода не менее, а может быть, и более важно правильно структурировать информацию, которая приписывается элементу базы, правильно выбрать этот самый элемент. Сколько, например, записей в словаре должно соответствовать обыкновенному русскому слову "программа"? И, вообще, большой словарь – это словарь, который содержит много словарных статей, или словарь, который позволяет распознать много слов из текста?
При ближайшем рассмотрении оказывается, что, например, существительные в русском языке изменяются по падежам и по числам, то есть для одного существительного может существовать до 12 разных форм, а для глаголов и прилагательных, как правило, существует еще большее количество различных форм (более тридцати). Следовательно, чтобы переводить предложения, содержащие слова "программу", "программе", "программы" и т.д., хорошо было бы иметь способ соотнесения словарной статьи из автоматического словаря для слова "программа" с соответствующей словоформой из текста. Поэтому для описания и входного, и выходного языка в системе должен существовать некоторый формальный метод описания морфологии, на котором основывается выбор единицы словаря.
В системах семейства
PROMT разработано практически
Кроме того, используемая
модель морфологии позволила
разработать экспертную
Однако разработка
описания морфологии позволяет
решить только проблему того,
что является заголовком
4. 2. ГРАММАТИКА
С развитием МП как
области прикладной