Типология как общенаучный метод

Автор работы: Пользователь скрыл имя, 09 Апреля 2014 в 10:01, лекция

Краткое описание

Лингвистическая типология - наука, занимающаяся сравнительным изучением структурных и функциональных свойств языков независимо от характера генетических соотношений между ними. Типология - это один из двух основных аспектов изучения языка наряду со сравнительно - историческим аспектом, от которого она отличается онтологически (т. е. по сущностным характеристикам предмета исследования) и эпистемологически (т.е. по совокупности принципов и приемов исследования)
Лингвистическая типология занимается выяснением наиболее общих закономерностей различных языков, не связанных между собой общим происхождением или взаимным влиянием, стремится выявить наиболее вероятные явления в различных языках. В случае если некоторое явление выявляется в представительной группе языков, оно может считаться типологической закономерностью, применимой к языку как таковому.

Прикрепленные файлы: 1 файл

реферат.docx

— 105.40 Кб (Скачать документ)

    

     Сформулированная Хомским исследовательская программа, имеющая целью объяснить способность человека к овладению языком, в качестве отправной точки имела следующие наблюдения.

1. Множество грамматически  правильных предложений на любом  естественном языке бесконечно, поэтому овладение языком не  может быть сведено к простому  запоминанию всех правильных  предложений на этом языке (как  и грамматика языка не может  быть описанием всех засвидетельствованных  предложений на этом языке  – сколь бы велика ни была  их подборка, она заведомо будет  включать не все допустимые  на этом языке предложения).

2. Ребенок достаточно  быстро овладевает грамматикой  родного языка, т.е. становится способен  отличить грамматически правильное  предложение на этом языке  от неправильного.

Между двумя этими наблюдениями есть очевидное противоречие, объяснить которое и стремился Хомский. Ребенок, овладевший грамматикой родного языка (в большинстве случаев этот процесс завершается к пяти годам), верно определяет, какие предложения на этом языке являются грамматически правильными, несмотря на то, что большинство из этих предложений он ранее не слышал: даже при богатом опыте речевого общения множество всех предложений, когда-либо услышанных ребенком в речи взрослых, является конечным – в отличие от числа грамматически правильных предложений на языке. Невозможно также предположить, что все предложения, неправильность которых верно фиксирует ребенок, были ранее произнесены им или другими детьми в его присутствии и исправлены взрослыми: неправильных предложений, которые можно составить из слов какого-либо языка, также, очевидно, бесконечно много, между тем неправильные предложения, исправленные когда-либо взрослыми в речи ребенка, образуют конечное, замкнутое множество.

    Рассматривая язык в отрыве от человеческого сознания, лингвистическая теория может предложить самые разнообразные объяснения этому запрету. Хомского, однако, в грамматических запретах интересовало то, каким образом «наивный» носитель языка, не владеющий лингвистической теорией, способен верно идентифицировать эти запреты.

 

 

 

 

 

 

 

 

 

 

 

 

КЛАССИФИКАЦИЯ ЯЗЫКОВ ПО ХОМСКОМУ

 

     Иерархия Хомского — классификация формальных языков и формальных грамматик, согласно которой они делятся на 4 типа по их условной сложности. Предложена профессором Массачусетского технологического института, лингвистом Ноамом Хомским.

     Если все без исключения правила грамматики удовлетворяют некоторой структуре, то ее относят к заданному типу. Если хотя бы одно правило грамматики не удовлетворяет требованиям структуры, то она не попадает в заданный тип.

     Формальные языки классифицируются в соответствии с типами грамматик, которыми они задаются. Однако, один и тот же язык может быть задан разными грамматиками, относящимися к разным типам. В таком случае, считается, что язык относится к наиболее простому из них. Так, язык, описанный грамматикой с фразовой структурой, контекстно-зависимой и контекстно-свободной грамматиками, будет контекстно-свободным.

Так же, как и для грамматик, сложность языка определяется его типом. Наиболее сложные — языки с фразовой структурой (сюда можно отнести естественные языки), далее — КЗ-языки, КС-языки и самые простые — регулярные языки.

    Пусть грамматика обозначена как G(VT,VN,P,S), V=VTVN. В соответствии с иерархией Хомского выделяют 4 типа грамматик.

 
Пусть А = {а1,а2,…аn} – конечное множество абстрактных символов, называемое алфавит. 
Строка (слово) в алфавите А – это произвольная последовательность расположенных друг за другом символов этого алфавита, возможно бесконечная последовательность. Строки будем обозначать греческими буквами. Множество всех возможных слов в алфавите А – А*.  
 
A+ = {α | (α = ai1ai2…aik…) /\ (aij A)}; A* = A+ {ε}, где ε – пустое слово. 
 
     Языком в алфавите А называется любое подмножество множества А*. Языки будем обозначать буквой L A*. Слова, принадлежащие языку L иногда называют правильными словами, т.к. любое слово j L – это не любая цепочка символов, а такая цепочка, которая конструируется по некоторым правилам (грамматике). Длина слова α будет обозначаться символом |α|. Таким образом, если α = ai1ai2…aik, то |α|=k. 
     Формальная грамматика языка L – это математическая система, которая задает язык с помощью порождающих правил: G = N, P, S>, где Vт = {a1,…an} – множество терминальных символов, VN = {S, A, B, C, …} – конечное множество нетерминальных символов, V = Vт VN - множество терминальных и нетерминальных символов данной грамматики, P = {pi} – множество правил вывода данной грамматики, pi: α β («β выводится из α»), α V+, β V*. 
Среди правил вывода обязательно должно присутствовать правило вида: S B, где S VN и называется начальным символом грамматики G. 
Слово w V*, которое может быть выведено из начального символа S путем последовательного применения правил pi P называется сентенциальной формой. 
     
Сентенция – частный случай сентенциальной формы: цепочка (слово), состоящее только из терминальных символов w Vт* и выводимая из начального символа S. 
Множество всех сентенций, выводимых из начального символа S с помощью правил грамматики G называется языком, порожденным грамматикой G и обозначается L(G), а сама грамматика G называется порождающей грамматикой. 
Порождающая грамматика G - это четверка (VT, VN, P, S), где 
VT - алфавит терминальных символов ( терминалов ), 
VN - алфавит нетерминальных символов (нетерминалов), не пересекаю- 
щийся с VT, 
P - конечное подмножество множества (VT È VN)+ ´ (VT È VN)*; элемент (a, b) множества P называется правилом вывода и записывается в виде a ® b, 
S - начальный символ (цель) грамматики, S Î VN. 
ТИП 0: 


Грамматики с фразовой структурой, или без ограничений. На структуру их правил не накладывается никаких ограничений, т.е. правила имеют вид: , где V+, V*. Это самый общий тип грамматик. Грамматики, которые относятся только к этому и не могут быть отнесены ни к какому другому типу, являются самыми сложными по структуре. 
Грамматика G = (VT, VN, P, S) называется грамматикой типа 0, если на правила вывода не накладывается никаких ограничений (кроме тех, которые указаны в определении грамматики). 
Язык типа 0: L(G) = {a2  | n >= 1} 
G: S ® aaCFD 
F ® AFB | AB 
AB ® bBA 
Ab ® bA  
AD ® D 
Cb ® bC 
CB ® C 
bCD ® e 
ТИП 1.

Контекстно-зависимые (КЗ) и неукорачивающие грамматики. К этому типу относятся два основных класса грамматик.

Контекстно-зависимые грамматики имеют правила вида 1A2 12, где 1,2V*, AVN, V+.

Неукорачивающие грамматики имеют правила вида , где ,V+, .

В КЗ-грамматиках при построении предложений заданного языка один и тот же нетерминальный символ может быть заменен различными терминальными цепочками в зависимости от контекста, в котором он встречается. Цепочки 1 и 2 в правилах обозначают контекст: 1 - левый контекст, 2 - правый контекст. В общем случае они могут быть пустыми.

В неукорачивающих грамматиках при построении предложений языка цепочка символов заменяется на цепочку не меньшей длины. Эти два класса грамматик эквивалентны.

При построении компиляторов такие грамматики не применяются, поскольку языки программирования имеют более простую структуру и могут быть построены с помощью грамматик других типов. 
Грамматика G = (VT, VN, P, S) называется неукорачивающей грамматикой, если каждое правило из P имеет вид a ® b, где a Î (VT È VN)+, b Î (VT È VN)+ и  
| a | <= | b |.  
Грамматика G = (VT, VN, P, S) называется контекстно-зависимой ( КЗ ), если каждое правило из P имеет вид a ® b, где a = x1Ax2; b = x1gx2; A Î VN; 
g Î (VT È VN)+; x1,x2 Î (VT È VN)*. 
Язык типа 1: L(G) = { an bn cn, n >= 1} 
G: S ® aSBC | abC 
CB ® BC 
bB ® bb 
bC ® bc 
cC ® cc 
Грамматику типа 1 можно определить как неукорачивающую либо как контекстно-зависимую. 
ТИП 2. Контекстно-свободные (КС) грамматики

     Контекстно-свободные (КС) грамматики имеют правила вида A , где AVN, V+. В правой части у них стоит всегда хотя бы один символ.

     Такие грамматики еще называют неукорачивающими контекстно-свободными (НКС) грамматиками. Существует почти эквивалентный им класс укорачивающих контекстно-свободных (УКС) грамматик, отличие которого в том, что он допускает пустую цепочку, т.е. правила имеют вид A , где AVN, V*. В дальнейшем, если возможность наличия в языке пустой цепочки не имеет принципиального значения, будем говорить просто о КС-грамматиках.

    КС-грамматики широко используются при описании синтаксических конструкций языков программирования. 
Грамматика G = (VT, VN, P, S) называется контекстно-свободной ( КС ), если каждое правило из Р имеет вид A ® b, где A Î VN, b Î (VT È VN)+. 
Грамматика G = (VT, VN, P, S) называется укорачивающей контекстно-свободной ( УКС ), если каждое правило из Р имеет вид A ® b, где A Î VN,  
b Î (VT È VN)*. 
Грамматику типа 2 можно определить как контекстно-свободную либо как укорачивающую контекстно-свободную. 
Язык типа 2: L(G) = {(ac)n (cb)n | n > 0} 
G: S ® aQb | accb 
Q ® cSc 
ТИП 3:

Регулярные грамматики

К этому типу относятся два эквивалентных класса грамматик: леволинейные и праволинейные.

Леволинейные грамматики могут иметь правила двух видов: A B, или A , где A,BVN, VT+.

Праволинейные грамматики имеют правила тоже двух видов: A B, или A , где A,BVN, VT+.

Регулярные грамматики используются при описании простейших конструкций языков программирования: идентификаторов, констант, строк, комментариев и т.д. Они очень просты и удобны в использовании, поэтому в компиляторах на их основе строятся функции лексического анализа входного языка.

Из определения типов видно, что любая регулярная грамматика является также КС-грамматикой, или любая грамматика может быть отнесена к типу 0. В то же время существуют УКС-грамматики, которые не относятся к типу 1, поскольку могут содержать правила вида A , недопустимые в этом типе. В общем, сложность грамматики обратно пропорциональна тому максимально возможному номеру типа, к которому может быть отнесена эта грамматика. Самыми простыми являются грамматики типа 3, самыми сложными - типа 0. 
Грамматика G = (VT, VN, P, S) называется праволинейной, если каждое правило из Р имеет вид A ® tB либо A ® t, где A Î VN, B Î VN, t Î VT. 
Грамматика G = (VT, VN, P, S) называется леволинейной, если каждое правило из Р имеет вид A ® Bt либо A ® t, где A Î VN, B Î VN, t Î VT. 
Грамматику типа 3 (регулярную, Р-грамматику) можно определить как праволинейную либо как леволинейную. 
Язык типа 3: L(G) = {w ^ | w Î {a,b}+, где нет двух рядом стоящих а} 
G: S ® A^ | B^ 
A ® a | Ba 
B ® b | Bb | Ab 
Соотношения между типами грамматик: 
(1) любая регулярная грамматика является КС-грамматикой; 
(2) любая регулярная грамматика является УКС-грамматикой; 
(3) любая КС-грамматика является КЗ-грамматикой; 
(4) любая КС-грамматика является неукорачивающей грамматикой

(5) любая  КЗ-грамматика является грамматикой  типа 0. 
(6)любая неукорачивающая грамматика является грамматикой типа 0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

СОДЕРЖАНИЕ:

 

  1. Введение
  2. Типология как общенаучный метод
  3. Виды типологических исследований
  4. Порождающая грамматика Хомского
  5. Классификация языков по Хомскому
  1. Квантативный подход к типологии и описанию языковых универсалий Дж.Х. Гринберга
  1. Лексические универсалии по Гринбергу

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ВВЕДЕНИЕ

 

Типология в общенаучном масштабе – это метод исследования сложных объектов путем их сопоставления, выявления их общих, или сходных черт и объединения схожих объектов в некие классы (группы, типы). Типология языков, или лингвистическая типология занимается изучением основных, существенных признаков языков, их группировкой, выведением общих закономерностей, наблюдаемых в ряде языков, и установлением типов языков.

Общие признаки могут быть обусловлены общим происхождением языков, т.е. их родством или генеалогией, а также продолжительным географическим и/или культурным контактом. В первом случае в результате общности языки систематизируются в «языковые семьи» (группы, макросемьи и т.д.), во втором случае – образуют «языковые союзы». В тех случаях, когда общность структурных черт языков не обусловлена ни их первичным генеалогическим родством, ни вторичным ареальным сродством, возможно выявление общих черт, обусловленных собственно строевыми возможностями языка, которые базируются на физиологических, когнитивных, психических и эмоциональных возможностях человека как его носителя. Только при исследовании таких общностей и расхождений в лингвистике используется идея типа как некоторого объединения объектов (в данном случае, языков) с учетом их общих черт.

      Предпосылки типологического сопоставления языков существовали задолго до возникновения собственно научной типологии; например, в Средние века «народные» языки сопоставлялись с латынью, уже высказывались идеи об универсальности языков, о развитии языков и др. Однако последовательно научное сопоставление языков началось в начале XIX в.

    Работа посвящена  трудам таких известных ученых  как Наум Хомский и Дж. Гринберг, которые являются представителями  двух самых известных направлений языковых типологических исследований.

 

 

 

 

 

 

 

 

 

 

 

 

 


Информация о работе Типология как общенаучный метод