Автор работы: Пользователь скрыл имя, 12 Ноября 2012 в 15:49, курсовая работа
Сравнительно-историческое языкознание (лингвистическая компаративистика) — наука, занимающаяся сравнением языков с целью установления их родства, их генетической классификацией и реконструкцией праязыковых состояний. Основным орудием сравнительно-исторического языкознания является сравнительно-исторический метод, позволяющий эффективно решать все перечисленные выше задачи.
Введение 3
1. Компьютерная компаративистика 4
1.1. Использование компьютера в сравнительно-историческом языкознании 4
1.2. Система STARLING 4
1.3. Установление регулярных фонетических соответствий 5
1.4. Поиск слов по приблизительному звучанию и значению 5
2. Реконструкция фонетики и фонологии 8
2.1. Возможность фонетико-фонологической реконструкции 10
2.2. Внутренняя реконструкция 11
2.3. Внешняя реконструкция 15
2.4. Установление относительной хронологии фонетических изменений 18
Заключение 20
Список использованной литературы: 21
Оглавление
Введение 3
1. Компьютерная компаративистика 4
1.1. Использование компьютера в сравнительно-историческом языкознании 4
1.2. Система STARLING 4
1.3. Установление регулярных фонетических соответствий 5
1.4. Поиск слов по приблизительному звучанию и значению 5
2. Реконструкция фонетики и фонологии 8
2.1. Возможность фонетико-фонологической реконструкции 10
2.2. Внутренняя реконструкция 11
2.3. Внешняя реконструкция 15
2.4. Установление относительной хронологии фонетических изменений 18
Заключение 20
Список использованной литературы: 21
Сравнительно-историческое
языкознание (лингвистическая
Сравнивать языки можно
Реконструкция праязыковых состояний
— чрезвычайно специфическая
область, близкая к палеонтологической
реконструкции. Результаты лингвистической
реконструкции — бесценный
В наше время никакая
научная работа уже не может
осуществляться без помощи
Однако компьютерная верстка — отнюдь не единственная помощь, которую вычислительная техника может предоставить компаративисту. Существует три класса задач, при которых компьютер может быть чрезвычайно полезен в сравнительном языкознании:
1) составление и обработка
компьютерных
2) разного рода статистические
задачи, связанные с
3) размещение этимологической
и сравнительно-исторической
Эти задачи призвана решать автоматическая система STARLING, созданная С. А. Старостиным [1].
STARLING — это прежде всего так называемая СУБД, то есть система управления базами данных (хотя STARLING включает в себя и довольно многофункциональный текстовый редактор). Элементарная база данных — это "электронная таблица", состоящая из полей (столбцов) и записей (строк). Содержимое полей может индексироваться, сортироваться, по нему могут вестись различные типы поиска.
Система STARLING позволяет осуществлять
разнообразные запросы к базам
данных. Отдельные базы данных можно
связывать друг с другом, формируя
так называемую реляционную СУБД.
Этимологическая справочная система
по любой семье языков может быть
организована в виде реляционной
иерархической системы, состоящей
из отдельных баз данных, связанных
между собой. Система STARLING позволяет
связывать между собой
Помимо хранения и облегчения
пользования информацией, система STARLING
реализует некоторые
Процесс установления фонетических соответствий между языками моделируется при помощи следующего алгоритма
a) вычисляется частота каждой фонемы в списке каждого из сравниваемых языков;
b) в языке A берется подмножество слов N, содержащих фонему x;
c) в языке B берется подмножество слов N', являющихся переводом слов подмножества N языка A.
d) вычисляется частота каждой фонемы языка B в подмножестве N', и сравнивается со стандартной частотой данной фонемы во всем списке слов языка B.
e) фонема x', частота которой в подмножестве N' существенным образом (вычисляемым, например, по правилу "трех сигм") превышает стандартную частоту данной фонемы, считается соответствующей фонеме x языка A.
Заметим, что при такой процедуре одной фонеме x может в принципе соответствовать несколько фонем в языке B, что не противоречит реальной компаративистической практике.
Эта процедура позволяет устанавливать около 80% правильных фонетических соответствий, и почти не дает ложных соответствий. Точность соответствий естественно возрастает при увеличении исходного массива данных.
Ценность этого компьютерного алгоритма состоит не столько в компьютеризации работы компаративиста (этот алгоритм не может определить дополнительных распределений, не срабатывает в случае выпадения фонем, то есть соответствия некоторой фонемы в одном языке нулю в другом, не позволяет установить многих редких, но существенных, соответствий), сколько в доказательстве объективности факта фонетических соответствий вообще и подтверждения выводов, эмпирически полученных исследователем.
STARLING позволяет осуществлять любые лексико-статистические и этимостатистические подсчеты, в том числе между семьями, материал которых содержится в разных файлах. Если исходные данные сравниваемых языков относятся к разному времени, программа делает соответствующую поправку. Кроме того, на основании произведенных подсчетов автоматически строится генеалогическое древо.
Моделируются фонетические изменения (с заданием контекстов и правил), а также собственно работа этимолога: реализован поиск слов по их приблизительному звучанию и значению. Под приблизительным звучанием понимается сходство первых двух согласных в сравниваемых словах. Согласные считаются похожими, если они входят в один класс — например, в класс "зубных смычных" (t, d, {t.}, {th}, {d^}, {t'}, {d'} и т. п.) или в класс "аффрикат" (c, {z3}, {c^}, {z3^}, {c.}, {c^.} и т. п.). Программа позволяет пользователю создавать свои классы похожих звуков — в соответствии с тем, какие звуковые изменения характерны для исследуемых им языков.
Значения считаются похожими, если существует такой праязыковой корень, рефлексы которого в языках-потомках имеют эти значения. Список похожих значений, так же, как и список похожих звуков, хранится в отдельном файле и доступен изменениям.
Такое широкое понимание
сходства необходимо для того, чтобы
при автоматическом поиске этимологий
пропустить как можно меньше правдоподобных
сближений. Окончательное решение
о том, являются ли найденные компьютером
слова родственными, в любом случае
принадлежит исследователю-
В подавляющем большинстве
случаев компаративистский
Система STARLING реализована на одном из диалектов языка xBase, и на этом языке можно осуществлять разнообразные запросы к базам данных. Отдельные базы данных можно связывать друг с другом, формируя так называемую реляционную СУБД. Сами базы данных имеют широко распространенный формат DBF (database files), но дополнены специальным типом полей переменной длины для хранения и обработки больших текстовых и лексикографических массивов.
Приведем описание типичной
этимологической базы данных, содержащей
сравнительный словарь северно-
На нижнем иерархическом уровне здесь находятся файлы, содержащие списки базисной лексики отдельных подгрупп северно-кавказских языков:
1) AAND.DBF — аваро-андийские языки (аварский, андийский, ахвахский, ботлихский, багвалинский, годоберинский, каратинский, чамалинский, тиндинский).
2) ABAD.DBF — абхазо-адыгские языки (абхазский, абазинский, адыгейский, кабардинский, убыхский).
2) CEZ.DBF — цезские языки (цезский, гинухский, хваршинский, инхокваринский, гунзибский, бежтинский).
3) DARG.DBF — даргинский язык (с диалектами).
4) KHIN.DBF — хиналугский язык.
5) LAK.DBF — лакский язык (с диалектами).
6) LEZG.DBF — лезгинские языки (лезгинский, агульский, табасаранский, рутульский, цахурский, крызский, будухский, арчинский, удинский).
7) NAKH.DBF — нахские языки (чеченский, ингушский, бацбийский).
Эти файлы в принципе содержат небольшой объем лексики (стандартный стословный список наиболее устойчивой лексики), и являются факультативным звеном общей словарной системы. Они служат прежде всего лексикостатистическим задачам, и полный этимологический словарь можно начинать строить и со следующего уровня. Следует, однако, заметить, что обычно оказывается удобным начинать построение базы данных именно с заполнения такого рода списков. При правильном построении базы каждое слово из списка связано с соответствующей этимологической информацией из файла более высокого иерархического уровня.
На следующем иерархическом уровне находятся этимологические файлы для подгрупп (соответственно: AANDET.DBF, ABADET.DBF, CEZET.DBF, DARGET.DBF, KHINET.DBF, LAKET.DBF, LEZGET.DBF и NAKHET.DBF). Каждый из этих файлов, по сути дела, представляет собой самостоятельный этимологический словарь соответствующей подгруппы, и может пополняться независимо от всех остальных. При этом для любого корня, если он имеет северно-кавказское происхождение, можно получить информацию из более высокого в иерархии файла.
На самом высоком
При таком устройстве легко оперировать как со всей базой данных, так и с отдельными ее фрагментами. В системе STARLING предусмотрена возможность связывания между собой при помощи реляционных отношений произвольного числа файлов баз данных.
Программа STARLING существует в настоящее время в трех версиях:
1) Версия для DOS — пока
наиболее полная и содержащая
весь комплекс
2) Версия для Windows, изготовленная недавно и еще не включающая в себя сравнительно-исторического компонента;
3) Сервер баз данных, обеспечивающий
функционирование
Одной из задач сравнительно-
Реконструкция — это "комплекс
приемов и процедур воссоздания
незасвидетельствованных
Информация о работе Компьютерная компаративистика. Реконструкция фонетики и фонологии