Методы исследования семантики

Автор работы: Пользователь скрыл имя, 11 Июня 2013 в 01:14, курсовая работа

Краткое описание

Каждая научная дисциплина вырабатывает в процессе познания и описания объекта своего изучения целый комплекс разнообразных приемов. Приемы, или способы, с помощью которых исследуется тот или иной объект в определенной научной дисциплине, называются методами. Многообразие предметов и их свойств, множество стабильных и нестабильных отношений между ними требует для адекватного изучения предмета применения совокупности различных методов. Для правильного выбора и использования в исследовательской работе конкретного метода нужны некоторые предварительные знания о предмете изучения, умения вычленять его из среды и сопоставлять с другими предметами таким образом, чтобы отчетливо проявлялись наиболее важные и существенные стороны рассматриваемого предмета.

Прикрепленные файлы: 1 файл

Глава 5.docx

— 620.01 Кб (Скачать документ)

185

 

щественном семантическом изменении статуса этой единицы в языке и об изменении той роли, которую играет обозначаемый данной единицей предмет или явление в жизни людей. Неодинаковое распределение слов разных частей речи в научном и художественном текстах (в языке науки гораздо чаще используются существительные) служит показателем большей предметности языка научных текстов по сравнению с художественными.     

Различной интенсивности  проявления конкретного семантического свойства соответствует связанная  с ним квантитативная характеристика форм тех языковых единиц, которые  выражают это свойство при своем  употреблении в речи. Задача языковеда в данном случае заключается только в том, чтобы вскрыть, какая языковая форма выражает рассматриваемое языковое значение, а это зачастую требует от исследователя изобретательности и наблюдательности, разработки специальных лингвистических процедур для обнаружения этих форм, поскольку количественные формы проявления различных аспектов значения не всегда лежат на поверхности языка, во многих случаях они завуалированы, скрыты и реализуются только в определенных ситуациях использования языка.    

Одна из задач исследования плана содержания языка сводится к осуществлению соответствующих  измерений, вытекающих из имплицитно присущей ему неодинаковой степени проявления семантических свойств, различной  силы семантической связи между  значениями языковых единиц, неодинаковой семантической роли, выполняемой  ими в языке, и т. д. Измерения  могут быть неколичественными и  количественными. В первом случае языковеды  используют неконкретные количественные оценки, формулируют лишь общие закономерности, проявляющиеся скорее как тенденция, а не как строгое правило, связи  количественных и качественных характеристик  языковых единиц. Отметим, что неконкретные количественные оценки, данные, измерения, основанные на интуитивном знании языка  исследователями, содержатся практически  в большинстве лингвистических  работ, независимо от того, как относится  языковед к использованию квантитативных методов в целом.    

Неопределенные количественные оценки используются лингвистами при  описании семантических явлений  в виде выражений чаще, употребительнее, синонимичное, как правило, по всей вероятности, реже и т. п. (Головин 1971: 11; Altmann 1972: 5) или в виде формулировок некоторых пра-

186

 

вил, основанных на количественных пропорциях, соотношениях, взаимозависимостях и т. п. Например: "чем лучше  известен смысл слова, тем ассоциации, основывающиеся на фактах мысли, интенсивнее  стремятся вытеснить ассоциации, вызываемые формой слова; и наоборот: чем менее прочны ассоциации, основывающиеся на фактах мысли, тем ассоциации, вызываемые формой слова или даже его материальным звуковым обликом, интенсивнее стремятся выйти на первый план в сознании говорящего" (Балли 1961: 52- 53); "чем сильнее мы абстрагируемся от конкретных предметов, тем неопределеннее становятся границы значения" (Baldinger 1957: 23); "чем сложнее содержание (слова.- Б. П.), т. е. чем больше элементов содержится в нем, тем древнее оно" (Kronasser 1952: 50) и т. д.     

Конкретные оценки и измерения  соответствующих семантических  явлений отмечаются в тех случаях, когда взаимосвязь между содержанием  языковой единицы и формой выражения  этого содержания характеризуется  определенными числами. Например, семантическое  расстояние между словами в осмысленном  предложении можно измерять путем  учета количества прямых и опосредованных грамматических связей, имеющихся у  каждого члена предложения с  другими его членами. Напомним, что  грамматическая связь есть, в сущности, формальное выражение семантических  отношений между сочетающимися  словами. Если слову, а затем словосочетанию, которые в пределах рассматриваемого предложения грамматически подчиняются  другим словам и словосочетаниям, последовательно  приписывать по одному баллу (по единице), а словам и словосочетаниям, подчиняющим  себе другие слова и словосочетания, по нулю, то расстояние между словами  в конкретном предложении, например Этот студент регулярно читает научные журналы, можно выразить и подсчитать по схеме (рис. 15).    

На схеме стрелками  указаны подчинительные связи, знаком Х соединены группы подлежащего  и сказуемого, которым приписывается  по одному баллу, цифрами выражены расстояния между словами: чем больше количество баллов у слов данной пары, тем больше расстояние между ними в пределах данного предложения. Так, наибольшее расстояние на материале приведенного примера выражается числом 5 и отмечается между словами этот и научные (по кратчайшему пути, соединяющему эти два слова, насчитывается 5 единиц), а наименьшее расстояние выражается единицей и наблюдается между словами, соединенными прямой грамматической связью (Gammon 1963).

187

 

 

    Более сложные измерения расстояния между заданными словами используются в тех случаях, когда языковед опирается на количественные показатели, характеризующие определенный признак  слов. Такими показателями могут служить  количественные данные о тех грамматических формах существительных, которыми управляют  исследуемые глаголы. Так, но данным обследованных текстов (Апресян 1966: 141-144), сочетаемость некоторых глаголов русского

 

 

языка с существительными в определенных падежах может  быть представлена в виде таблицы.

 

 
    

Цифры обозначают вычисленную  вероятность встречи существительных  в указанном падеже с приведенными глаголами.    

Расстояние, между глаголами  каждой пары вычисляется по формуле

 

 

где а, Ь - заданные глаголы, р -. расстояние, 2 - сумма чисел, S - числовые значения (цифры в таблице).

188

 

 

    Вычисленные расстояния между рассматриваемыми глаголами можно представить  в виде следующей матрицы:

 
    

Как видно из приведенных  данных, наиболее близкое расстояние отмечено между глаголами построить и производить (0,03), производить и создавать (0,09), а самое большое расстояние зафиксировано между глаголами беседовать и изменить (2,00), беседовать и построить (1,95). Подчеркнем, что эти количественные расстояния в какой-то мере отражают и семантическую близость рассматриваемых глаголов.    

Для разнообразных измерений  семантических явлений языка  в современной лингвистике используются и другие статистические формулы (коэффициент  ранговой корреляции, коэффициент корреляции, коэффициент ассоциации и др.), "сырьем" для которых служат эмпирические данные о тех семантических свойствах  языковых единиц, что фиксируются  при их употреблении в речи. Применяются  также разности между теоретически ожидаемыми показателями и эмпирическими  данными, отклонения от средних .и т. д.     

Отметим, что даже элементарные количественные сведения о значимых единицах языка содержат существенную информацию о качественной стороне  этих единиц. Так, данные частотных  словарей необходимо использовать для оптимизации учебного процесса, в частности при изучении иностранных языков, поскольку известно, что 1000 самых частых слов покрывают около 80%¦ письменного текстами, естественно, именно на эти слова надо обращать первоочередное внимание при изучении лексики (Tesitelova 1974).    

Мера информационной значимости языковых единиц связана с частотой этих единиц. К измерению количества информации, которую несет с собой  определенная языковая единица, можно  подходить с двух точек зрения: инженерно-кибернетической и лингвистической. С первой точки зрения мера информационной значимости считается тем выше, чем  реже встречается языковой знак, а  сама информация изме-

189

 

ряется посредством логарифма числа тех знаков, которые могут быть выбраны из имеющегося набора, т. е.    

Н = nlogS,

где Н - количество информации, п - количество выбранных знаков, S - количество всех знаков, имеющихся в наборе. Такой подход к измерению информации разработан К. Шенноном (Шеннон 1963) и практически применяется в технике связи и кибернетике. Знаком здесь считается всякий сигнал, будь то буква, слово или предложение, а понятие информационной значимости не связано с конкретным смыслом, который выражают передаваемые по каналу связи сигналы. С лингвистической точки зрения, учитывая непосредственные значения слов, специалисты, напротив, связывают с наиболее частыми словами и большую значимость (Blanke 1973: 159). Так, чем частотнее слово в языке, тем, как правило, больше значений оно имеет (Гиро 1976: 62), т. е. по сути тем информативнее оно по содержанию. Значит, если с кибернетической стороны информация языкового знака рассматривается как мера его ожидаемости, то с лингвистической стороны - как мера осмысленности текста, в котором употребляются эти знаки.     

Использование статистических методов и количественных данных при изучении семантических явлений  языка расширяет возможности  описания и представления результатов  лингвистических исследований, поскольку  результаты квантитативного анализа  способны оформляться разнообразными невербальными способами: графиками, таблицами, диаграммами, схемами, гистограммами  и т. д. Иначе говоря, квантитативные методы обогащают метаязыковые средства описания семантики, что делает сами эти описания, с одной стороны, более строгими и адекватными, а  с другой, более наглядными и разносторонними. В свою очередь, чем многообразнее способы представления объекта, тем глубже он познается и тем легче усваивается его сущность. Научная ценность квантитативных данных при исследовании-семантики определяется тем, что они могут быть воспроизведены и проверены. Трудоемкость использования их на большом эмпирическом материале компенсируется, во-первых, нетривиальностью и надежностью получаемых при этом результа-. тов и, во-вторых, благоприятной перспективой практически полностью передать количественные исследования современным ЭВМ, которые уже в настоящее время применяются для статистического анализа текстов, составления частотных словарей, автоматического перевода и т. д.

190

 

5.7. ДИСТРИБУТИВНЫЙ  МЕТОД В СЕМАНТИКЕ    

Дистрибутивный метод  получил распространение в науке  о языке при "исследовании семантических  явлений только во второй половине нашего века, т. е. относится к одному из наиболее современных приемов  лингвистического анализа.    

Термины "дистрибуция" и "дистрибутивный метод" неоднозначны, хотя в их основе лежит латинское  слово distributio с определенным значением "распределение". Отсюда и первичное значение термина "дистрибуция" - распределение, а исходное содержание дистрибутивного метода заключается в исследовании того, как распределяются (встречаются, и сочетаются) в речевом потоке (письменном тексте) относительно одна другой языковые единицы.    

Чаще всего термин "дистрибуция" употребляется в следующих двух значениях: 1) совокупность всех линейных окружений данной языковой единицы; 2) совокупность всех сочетаний исследуемой  языковой единицы. Иногда эти значения не дифференцируются, и тогда дистрибуция  рассматривается, как совокупность всех контекстов языковой единицы, а  дистрибутивный метод - как контекстуальное  исследование семантики. Во всех случаях дистрибутивный метод предполагает учет отношений между языковыми единицами, их распределение в тексте.    

Как правило, значимые единицы  языка распределяются в речи не произвольно, а по определенным закономерностям, которые могут иметь детерминистический (логический, точно предсказуемый) или, что гораздо чаще, вероятностный  характер. В основе обоих видов  закономерностей распределения  лежат семантические свойства языковых единиц. В свою очередь, эти семантические  свойства подразделяются на общие грамматические и индивидуальные смысловые. В то время как грамматическая сочетаемость подчиняется преимущественно детерминистическим правилам, лексическая сочетаемость определяется главным образом вероятностными правилами. Такой вид распределения слов в связном тексте, как совместная встречаемость, фактически полностью подчиняется вероятностным закономерностям.    

Сущность всех указанных  видов распределения языковых единиц заключается в возможности прогнозирования  в речи (тексте) одних элементов  на основании знания других элементов. Например, фразеологически связанная единица или грамматическая форма многих слов часто дает возможность стопроцентного (детерминистического) предсказания друго-

191

 

го слова или грамматической формы. Так, слово храповицкого требует глагола задать, направленная на объект грамматическая форма глагола видеть требует существительного (местоимения) в форме винительного падежа и т. д. В остальных случаях распределения слов прогнозирование подчиняется вероятностным закономерностям, т. е. можно предсказать слово или грамматическую форму лишь с известной долей вероятности. Обычно, чем больше членов высказывания известно, тем легче предсказать недостающий его член.     

С учетом таких видов распределения  языковых единиц, как грамматическая и лексическая сочетаемость, а  также совместная их встречаемость, выделяются соответствующие разновидности  дистрибутивного метода, используемые для исследования плана содержания языковых единиц. Одна из таких разновидностей называется дистрибутивно-трансформационной.] Цель применения этого метода заключается в том, чтобы выявить семантическую общность слов на основании сходства их синтаксических потенций, которые обнаруживаются в их отношении с другими словами. Как правило, оказывается, что те слова, которые в сочетании с другими словами способны к одинаковым синтаксическим преобразованиям, обладают и одинаковыми семантическими свойствами. Иначе говоря, Цюм более .сходными являются синтаксические свойства данных слов, тем ближе их значения. Способность к синтаксическим преобразованиям находится под влиянием семантического потенциала слова, и, чем разнообразнее эти преобразования, тем активнее семантические свойства слова, т. е. внутренние содержательные свойства находят одно из своих формальных выражений во внешних синтаксических проявлениях. Отсюда "синтаксическим различиям и сходствам соответствуют, как.правило, существенные семантические различия и сходства" (Апресян 1967: 25; см. также: Lyons 1977: 386).    

Значит, одна из важнейших  проблем семантики - системность  лексических значений - имеет доступ к своему исследованию со стороны  синтаксиса, что позволяет объективным  путем, посредством использования  внутриязыковых критериев, обнаруживать те семантические связи между  словами, с помощью которых данные слова образуют лексические подсистемы, поля, группы, т. е. совокупности слов, имеющие семантическую общность. Так, например, лишь существительные типа вид, семейство, класс, разряд, категория, группа, разновидность, род и т. п. допускают следующую трансформацию: этот вид (семейство, класс, разряд

Информация о работе Методы исследования семантики