![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Корпусна лінгвістика. Об’єкт, предмет, завдання й методи корпусної лінгвістики. Корпуси текстів та їх типи.
Корпусна лінгвістика - дисципліна в межах комп’ютерної лінгвістики, предметом дослідження якої є розроблення поняттєвого та процедурного апарату для формування корпусів текстів та їх аналізу. Обєкт – проблемна область – область реалізації мовної системи; предмет – корпус даних – вибірка із проблемної області. Корпус текстів - це різновид корпусів даних, од. яких є тексти або його фрагменти. Головним поняттям корпусної лінгвістики є корпус мовленнєвої реалізації мови, що кваліфікується як сформована за певними вимогами вибірка мовленнєвого матеріалу, який може використовуватися для опису й дослідження мови як системи. Базовий, вихідний масив текстів разом із програмним забезпеченням формує динамічний корпус текстів. Складниками корпусу є одиниця зберігання, або базова одиниця, яка може відповідати слову, сполуці, синтагмі, висловленню, фрагменту тексту й цілому тексту залежно від мети створення корпусу. Типи корпусів: 1) дослідницькі – вивчення аспектів функціонування мовної системи; 2) ілюстративні – підтвердження отриманих результатів; 3) статичні – корпуси письменників Корпуси можуть охоплювати всі мовні стилі й жанри або бути обмеженими певною дискурсивною сферою чи жанром (наприклад, Боннський корпус газетних текстів, німецький корпус текстів публічної політики за період з 1989-1990 p. p. «Wendekorpus»; російський корпус текстів словника Ф. Достоєвського тощо).
На підставі обробки комп'ютерного корпусу текстів здійснюється корпусний аналіз - один з об'єктивних методів мовного аналізу, спрямований на вивчення певних закономірностей й особливостей мови та мовлення. Застосовується в лінгвістичній семантиці з метою встановлення спектра контекстуальних значень й особливостей уживання лексем. Найбільш істотними недоліками цього методу є спрощення обробки мовного матеріалу й експланаторна негнучкість. Вимоги до корпусів текстів: репрезентативність; повнота; економічність; структуралізація матеріалу; комп’ютерна підтримка.
|