Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Исследование стилевых особенностей текстов количественными методами: графическое представление синтаксических структур, количественные показатели, предложенные Г.Я. Мартыненко.
1 2 3 4 5 6 Я пишу синим маркером на доске. 1-> х 2-> 1, 4, 5. 3-> х 4-> 3 5-> 6 6-> х Чтобы сравнить синтаксич. характеристики разных стилей Мартыненко ввел некоторые параметры (синтаксич. дерево зависимостей): 1. ширина дерева в узле Х – число стрелок, выходящих из этого узла, показывает полноту представления ситуации. 2. ширина дерева в целом – максимальная ширина дерева – обладает предикат, предикат – смысловой центр ситуации. 3. длина дерева в узле Х – кратчайшее расстояние от вершины дерева до узла Х 4. длина дерева в целом – максимальное расстояние от узла до вершины 5. густота дерева = число висячих узлов, из них не выходит ни одна стрелка; показывает распространённость предложения 6. степень гнездования – максимальное число стрелок, накрывающих узел и не имеющих общих краёв, показывает насколько далеко находятся синтаксические связи друг от друга, чем выше степень гнездования, тем сложнее воспринимать текст. В русском max степень гнездования - 4, в английском - 2-3. 7. степень дистантизации дерева – максимальное число узлов между двумя синтаксически связанными узлами – самая длинная стрелка и между ней числа. 8. проективность – если стрелки не пересекают друг друга, непроективность сложнее для понимания, она часто встречается в поэзии.
8. Количественный анализ художественных текстов Дистрибутивно-статистический анализ в том виде, как его разработал и применяет А.Я. Шайкевич, «есть сумма формальных алгоритмических процедур, направленных на описание языка и опирающихся только на распределение (дистрибуцию) заданных элементов в тексте. Под заданными элементами могут пониматься буквы (и другие графические символы), цепочки букв между пробелами (слова), цепочки слов между более крупными пробелами (высказывания), короче —любые объекты в тексте, непосредственно доступные нашему восприятию. Сам анализ при этом носит не жестко-детерминистский, а статистический характер, постоянно использует количественную информацию о встречаемости элементов в тексте» (Шайкевич, 1976: 355). Важно подчеркнуть, что в своем анализе А.Я. Шайкевич убедительно показывает следующее: скрытое или явное предположение о том, что текст или какие-то явления в тексте можно представить как случайный процесс, для лингвостатистики неплодотворно. Шайкевич доказывает, что основные перспективы лингвостатистики, если она хочет исследовать особенности структуры текста или структуры языка, связаны с поисками расхождений между теоретическими данными (чаще всего они сравниваются с нормальным распределением, или распределением Пуассона) и эмпирическими данными. Здесь мы ограничимся конкретным примером, иллюстрирующим предложенную методику. Шайкевич исследовал распределение относительной частоты неопределенного артикля в речи персонажей У. Шекспира и показал неоднородность этого распределения для двух, выделившихся именно благодаря этому анализу, групп персонажей. У слуг, горожан и носителей комического начала (шутов, остряков, глупцов) отмечено повышение частоты неопределенного артикля. И напротив, у героев «серьезных» и высоко стоящих на социальной лестнице частота неопределенного артикля понижается. Таким образом, метод может быть использован в стилистике, но, разумеется, пригоден и для других целей. В информатике, например, его применяют для выделения ключевых слов.
|