Квантитативная лингвистика
Реферат, 27 Мая 2013, автор: пользователь скрыл имя
Описание работы
В КЛ под законом понимается класс гипотез, выведенных из теоретических допущений, математически сформулированных, взаимосвязанных с другими законами в этой области и в достаточном объёме и успешно проверенных на эмпирических данных, то есть таких, которые нельзя было опровергнуть несмотря на многочисленные попытки. Köhler пишет о законах КЛ: «Более того, можно показать, что эти свойства лингвистических элементов и отношений между ними подчиняются универсальным законам, которые могут быть сформулированы строго математически также как и законы естественных наук.
Содержание работы
Введение
1. Проблематика квантитативной лингвистики с теоретической и прикладной точек зрения - 5 -
1.1. Некоторые языковые лингвистические
законы - 7 -
1.2. Стилистика - 9 -
2. Основные области приложения структурно-вероятностной модели языка - 10 -
2.1. Авторизация атрибуция текста - 12 -
2.2. Авторизация текста: пример экспертизы - 14 -
Заключение
Список использованной литературы
Файлы: 1 файл
Квантитативная лингвистика.docx
— 56.95 Кб (Скачать файл)
План:
Введение
- Проблематика квантитативной лингвистики с теоретической и
прикладной точек зрения - 5 - - Некоторые языковые лингвистические
законы - 7 -
1.2. Стилистика - 9 -
2. Основные области приложения
структурно-вероятностной
2.1. Авторизация атрибуция текста - 12 -
2.2. Авторизация текста: пример экспертизы - 14 -
Заключение
Список использованной литературы
Введение
Квантитати́вная
лингви́стика (англ. quantitati
Самые ранние
концепции КЛ относятся к древнегреческой
и древнеиндийской культурам. Один
из исторических источников включает
приложения комбинаторики к лингвистическим
реалиям, другой основывается на элементарных
статистических исследованиях, которые
можно найти под заголовками колометрия и стихо
В КЛ под
законом понимается класс гипотез,
выведенных из теоретических допущений,
математически
- Проблематика квантитативной лингвистики с теоретической и прикладной точек зрения
Название «квантитативная
Применение количественных методов
при описании функционирования языка
мало чем отличается от использования
аналогичного инструментария в естественных
и гуманитарных науках. Привлечение
методов измерения и подсчета
языковых реализаций позволяет, однако,
существенно модифицировать представление
о языковой системе и возможностях
ее функционирования. В этом отношении
квантитативная лингвистика оказывается
важнейшим фактором, влияющим на лингвистическую
теорию. Например, в сфере грамматики
теоретическая лингвистика, как
правило, ограничивается констатацией
существования в русском языке
системы падежей. Со структурной
точки зрения этого, быть может, и
достаточно. Между тем за рамками
обсуждения остается весьма существенная
информация о том, как часто используются
различные падежи, какова динамка
использования различных
Другой пример. С системной точки зрения в русском, английском и латинском языках имеется форма именительного падежа единственного числа личных местоимений. Однако в английском языке при глаголе эта форма местоимения практически всегда необходима, в русском — местоимение в этих случаях обычно представлено, а в латыни — как правило, отсутствует. Отсутствие достоверных количественных данных об этих языковых явлениях делает структурное описание явно недостаточным. Разумеется, имеются и смешанные случаи.
Близкие проблемы возникают и в
сфере лексики. Обычные толковые
словари не помещают в составе
словарной статьи информации о частоте
использования той или иной лексемы.
Это связано с очень большим
объемом работы, который надо проделать,
чтобы для каждого слова
С теоретической точки зрения использование
статистических методов в языкознании
позволяет дополнить
Из приведенного примера видно,
что задача построения структурно вероятностной
модели функционирования языка относится
к теоретическим проблемам
- Некоторые лингвистические законы
Существует целый ряд языковых законов, среди которых:
- Закон диверсификации: Если лингвистические категории (такие, например, как части речи или грамматические окончания) появляются в различных формах, то можно сказать, что частоты их появления в текстах контролируются определенными законами.
- Распределение длин (или, в более общем виде, многокомпонентности). Исследование частот различных языковых единиц с точки зрения их длин в текстах и словарях регулярно приводит к выявлению целого ряда распределений, в зависимости от изучаемой единицы. На данный момент были изучены следующие единицы:
- Закон распределения длин морфов;
- Закон распределения длин ритмических единиц;
- Закон распределения длин предложений;
- Закон распределения длин слогов;
- Закон распределения длин слов;
Другие языковые единицы, которые также подчиняются этому закону, — это, например, буквы (символы) различной сложности, длины так называемых hrebs и речевых актов. Это же справедливо и для распределений звуков (фонов) различной длительности (долготы).
- Закон Мартина: Этот закон касается лексических цепочек, которые образуются при поиске дефиниций (определений) слов в словаре, затем дефиниций только что найденных дефиниций и т. д. В конце концов все эти дефиниции образуют иерархию всё более и более общих значений, при этом дефиниций становится тем меньше, чем более общее значение получается. Среди уровней данной иерархии существует целый ряд подчиняющихся закону отношений.
- Закон Менцерата (также, в особенности в лингвистике, известный как закон Менцерата-Альтмана): Данный закон гласит, что размеры составляющих конструкции уменьшаются с увеличением самой изучаемой конструкции. Чем длиннее, например, предложение (измеренное количеством входящих в его состав придаточных предложений), тем короче входящие в его состав придаточные предложения (измеренные количеством слов), или: чем длиннее слово (в слогах или морфах), тем короче слоги или слова в звуках.
- Законы частотно-рангового распределения: Практически любая языковая единица подчиняется этим закономерностям. Приведем лишь несколько примеров:
- Слова в тексте организованы в соответствии с частотой их появления в тексте, и каждому из них присвоен номер ранга и соответствующая частота. Со времен Джорджа Кингсли Ципфа (широкоизвестный закон Ципфа), предлагалось большое количество математических моделей, описывающих отношения между рангом и частотой.
- Можно наблюдать похожее распределение между рангом и частотой звуков, фонем и букв.
- Словесные ассоциации: Ранг и частота ассоциаций реагируют на (словесный) стимул.
- Закон изменения языка: Процессы роста в языке (как, например, рост словаря), распространение иностранных и заимствованных слов, изменения в флективной системе и т. д. подчиняются закону, известному в КЛ как закон Пиотровского, и соответствуют моделям роста в других научных дисциплинах. Закон Пиотровского — это частный случай так называемой логистической модели (ср. с логистическим уравнением). Было показано, что он затрагивает и процессы усвоение языка (ср. закон усвоения языка).
- Закон текстового блока: Лингвистические единицы (напр., слова, буквы, синтаксические функции и конструкции) демонстрируют определенное распределение частоты в одинаково больших блоках текстов.
Закон Ципфа: Частота слова обратно пропорциональна их рангу в списках частотности.
- Стилистика
Изучение поэтического и непоэтического стилей может основываться на статистических методах; более того, возможно проводить соответствующие исследования на основе особых форм (параметров), которые языковые законы принимают в текстах различных стилей. В таких случаях КЛ проводит исследование в стилистике: одна из итоговых целей — доказать настолько объективно, насколько это возможно, по крайней мере в одной области действий существование стилистического феномена, ссылаясь на действие языкового закона. Одно из главных предположений КЛ состоит в том, что некоторые законы (например, закон распределения длин слов) требуют различных моделей, по крайне мере различных значений параметров закона (распределений или функций), в зависимости от типа текста, к которому принадлежит этот текст. Если изучаются поэтические тексты, то методы КЛ образуют поддисциплину, которая называется «Квантитативное изучение литературы»
Основные области приложения структурно-вероятностной модел
и языка
Лингвистический мониторинг функционирования языка. Задача лингвистического мониторинга заключается в выявлении общих особенностей функционирования языковой системы в конкретном типе дискурса (научном, политическом дискурсе, текстах средств массовой информации и т.д.). В качестве предмета лингвистического мониторинга могут выступать такие феномены естественного языка, как типы языковых ошибок, сфера иностранных заимствований, новые слова и значения, новые (креативные, творческие — не конвенциональные) метафоры, тематическое распределение лексики (например, лексика временных и пространственных отношений, лексика выражения чувств и эмоций, спортивная лексика и т.д.), особенности использования в текстах тех или иных грамматических форм, синтаксических конструкций. Технология лингвистического мониторинга основывается на двух важнейших предпосылках: во-первых, на регулярности и периодичности анализируемых данных, и, во-вторых — на достаточно большом объеме привлекаемого материала, на репрезентативности выборки данных. В силу этого лингвистический мониторинг невозможен без соответствующего компьютерного обеспечения. Использование компьютерной технологии позволяет давать оценку исследуемому феномену, выявляя его распределение по времени, по источникам, авторам и т.д.
Информация о статистических закономерностях функционирования языковой системы лежит в основе некоторых методик анализа данных, разрабатываемых в политической лингвистике. К ним относится, в частности, методика контентанализа, используемая для выявления структуры и состояния общественного сознания. При помощи контентанализа появляется возможность по частоте употребления лексем реконструировать, например, ценностные ориентации общества, выявлять актуальные темы публичной политики, оценивать динамику изменения тематики политических дискуссий и т.д..