Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Глава 5 слова, слова, слова 1 страница
Всё о лексике Слово glamour 'волшебство' происходит от слова grammar 'грамматика', и со времен хомскианской революции, такая этимология вполне уместна. Разве созидательная мощь ментальной грамматики может не ослеплять ее способностью передавать неограниченное количество мыслей с помощью ограниченного набора правил? Существует книга о сознании и материи под названием «Грамматический человек» и нобелевская лекция, проводящая сравнение между механизмами, лежащими в основе жизни, и генеративной грамматикой. У Хомского брали интервью в «Роллинг стоун»2' и на него ссылались в «Сэтердей найт лайв»3'. У Вуди Аллена в «Проститутке из Менсы» клиент спрашивает: «А если я захочу, чтобы две девушки объяснили мне теорию Ноама Хомского?» «Это бы вам дорого обошлось», — отвечает главная героиня. В отличие от ментальной грамматики, ментальный словарь никак не прославился. Он кажется не более, чем занудным списком слов, каждое из которых механически заносится в память. В предисловии к своему «Словарю» Сэмьюел Джонсон4' писал: Печальная судьба тех, кто занимается неблагодарной работой — это быть движимым скорее боязнью дурного, чем быть влекомым благими перспективами; быть выставленным на растерзание цензуры безо всякой надежды на похвалу; быть униженным неправым судом или наказанным за небрежение; знать, что успех не повлечет рукоплесканий, а усердие останется без награды. Среди этих несчастных смертных находятся и составители словарей. Собственный словарь Джонсона определяет лексикографа как «безобидного трудягу, который ставит себе задачу проследить происхождение и детализировать значение слов». В этой главе мы увидим, что такой стереотип несправедлив. Мир слов так же чудесен, как и мир синтаксиса, и даже больше. Во-первых, ' Слова, слова, слова — В. Шекспир. «Гамлет». — Прим. перев. ' «Роллинг стоун» — популярный музыкальный еженедельник в США. — Прим. ред. ' «Сэтердей найт лайв» — вечернее субботнее телешоу компании Эн-Би-Си (США), известно импровизированными комедийными сценками. — Прим. ред. 'Сэмьюел Джонсон (1709-1784) — английский лексикограф, критик и поэт. — Прим. перев. Глава 5- Слова, слова, слова словотворчество людей не знает границ (как и их творчество в области синтаксических групп и предложений). А во-вторых, запоминание каждого по-отдельности слова требует своей собственной виртуозности. Вспомните вяг-тест (vwg-test), который не вызовет затруднений у любого дошкольника: «Вот ваг. А вот их двое. На картинке два___». Прежде, чем ему предложили решить такую задачу, ребенок никогда не слышал, как кто-то это говорит, а самого его никогда не хвалили за произнесение слова «вага» (wugs). Таким образом, слова не просто извлекаются Из ментального архива. У человека должно иметься ментальное правило для образования новых слов из старых, что-то вроде: «чтобы образовать множественное число от существительного, надо добавить суффикс -s». Хитроумный механизм, стоящий за человеческим языком (при том, что язык является дискретной комбинаторной системой), используется как минимум в двух областях: предложения и синтаксические группы строятся из слов по правилам синтаксиса, а сами слова строятся из меньших частей с помощью другой группы правил — правил «морфологии». Созидательная мощь английского языка — это просто жалкое подобие того, что мы встречаем в других языках. Английское существительное выступает всего в двух формах (duck 'утка' и ducks 'утки'), а глагол — в четырех (quack 'крякать' — неопределенная форма или любая личная форма, кроме 3-го лица ед. числа, quacks 'крякает' — форма 3-го лица ед. числа, quacked 'крякал' — форма прошедшего времени, quacking 'крякающий' — причастие. В современном итальянском и испанском каждый глагол имеет около пятидесяти форм, в классическом греческом — триста пятьдесят, в турецком — два миллиона! Многие языки, которые я упоминал, как например: эскимосский, язык апачей, хопи, кивунджо и американский язык жестов известны своими чудесными созидательными возможностями. Как у них это получается? Вот пример из кивунджо — языка группы банту — о котором сказано, что на его фоне английский выглядит как шашки по сравнению с шахматами. Глагол Naikimlyiia, означающий 'Он ест это для нее', состоит из восьми частей: N-: Показатель того, что слово является смысловым «центром» в данный момент разговора. -а-: Показатель согласования подлежащего. Он определяет принадлежность того, кто ест, к t-ому классу одного из шестнадцати классов родовой принадлежности — «человек, единственное число». (Напомним, что лингвистический «род» имеет иное значение, нежели «пол».) Другие роды включают существительные, которые обозначают названия нескольких человек, тонких или вытянутых предметов, парных или объединенных в группу предметов, самих пар или групп предметов, инструментов, животных, частей тела, уменьшительных форм, абстрактных качеств, точных месторасположений и мест вообще. -i'-: Настоящее время. Другие времена в банту могут относиться к сегодняшнему дню, сегодняшнему дню в более раннее время, вчерашнему дню, времени не ранее вчера, вчера или ранее, отдаленному прошлому, привычным действиям, продолжающимся действиям, последовательным Всё о лексике действиям, предполагаемым действиям, будущему, неопределенному времени, моменту «еще не» и действиям, происходящим иногда. -ki-: Показатель согласования дополнения, в данном случае указывающий, что поедаемая вещь относится к 7-ому родовому классу. -rh-: Бенефактивный показатель, указывающий в чью пользу происходит действие, в данном случае — в пользу члена 1-го родового класса. -lyi-: Глагол «есть, кушать». -I-: Аппликативный показатель, указывающий, что состав ролевых исполнителей увеличился на одну дополнительную роль, в данном случае — на бенефактив. (Для сравнения представьте себе, что в английском нам пришлось бы добавлять суффикс к глаголу bake 'печь', когда он употребляется в предложении: I baked her a cake 'Я испек ей пирог' в противоположность обычному: / baked a cake 'Я испек пирог'.) -а: Конечная гласная, которая может указывать на изъявительное в отличие от сослагательного наклонение. Если перемножить количество возможных комбинаций семи префиксов и суффиксов итоговая сумма будет равняться приблизительно половине миллиона, и это будет количество возможных для глагола форм в данном языке. В действительности, язык кивунджо и ему подобные выстраивают внутри одного сложного слова (глагола) целое предложение. Но я был немного несправедлив к английскому языку. Английский действительно несовершенен с точки зрения «флективной» морфологии (словоизменения), в рамках которой слово изменяют так, чтобы оно удовлетворяло требованиям предложения (например, когда существительное маркируется показателем множественности -s или глагол — показателем прошедшего времени -ed). Но английский наверстывает упущенное в «деривационной» морфологии, в рамках которой из старого слова создается новое. Например, суффикс -able, как в словах learnable 'поддающийся изучению', teachable 'поддающийся обучению', huggable 'поддающийся к стискиванию в объятиях', переводит глагольное значение «сделать X» в значение прилагательного: «способный иметь X сделанным». Большинство людей с удивлением узнают, как много деривационных суффиксов имеется в английском. Вот наиболее часто встречающиеся:
В дополнение к этому английский легко и свободно занимается «словосложением», при котором два слова склеиваются вместе, чтобы образовалось новое, например toothbrush 'зубная щетка' и mouse-eater 'поедатель мышей'. Благодаря этим процессам количество возможных слов, даже в морфологически обедненном английском, невероятно. Специалист по компьютерной лингвистике Ричард Спроут Глава 5. Слова, слова, слова сделал подборку из всех отдельных слов в текстах, содержащих сорок четыре миллиона слов из новостных публикаций в «Ассошиэйтед Пресс»5' начиная с середины февраля 1988 г. К 30-му декабря список состоял из трехсот тысяч отдельных словоформ; почти столько же может содержать хороший полный словарь. Вы можете подумать, что в результате этого английская лексика, употребляемая в такого рода публикациях, будет исчерпана. Но когда Спроут посмотрел на то, что было опубликовано 31-го декабря, он нашел не меньше тридцати пяти новых форм, включая: instrumenting 'инструментирова-ние', counterprograms 'встречные программы', armhole 'отверстие для руки', part-Vulcan 'Вулкан отчасти', fuzzier 'пушистик', groveled 'склонный пресмыкаться', boulderlike 'валуноподобный', mega-lizard 'мега-ящери-ца', traumatological 'травматологический' и ex-critters 'в прошлом бывшие тварями'. Еще более впечатляющим образом конечный продукт одного морфологического правила может быть исходным продуктом для другого или для самого себя. Можно говорить об unmicrowaveability 'неподдаваемости готовке в микроволновой печи' некоторых картофельных полуфабрикатов или о toothbrush-holder fastener box 'коробочка для креплений к стаканчикам для зубных щеток', где можно хранить toothbrush-holder fasteners 'крепления к стаканчикам для зубных щеток'. Это делает количество слов, возможных в языке, даже более, чем невероятным; так же, как и количество предложений, оно бесконечно. Если оставить в стороне те притязающие на бессмертие причуды, которыми наполнена «Книга рекордов Гиннесса», то самое длинное зафиксированное слово английского языка — это, возможно, floccinaucinihilipilification 'флокциносинигилипи-лификация', которому «Оксфордский словарь английского языка» дает следующее определение: «категоризирующий что-либо как вещь тривиальную или не имеющую ценности». Однако этот рекорд предназначен для того, чтобы быть превзойденным: /loccinaucinihilipiliflcational 'флокциносинигилипилификационный': относящийся к категоризации чего-либо как вещи тривиальной или не имеющей ценности /loccinaucinihiHpiliflcationalize 'флокциносинигилипилификационизировать': делать так, чтобы что-то относилось к категоризации чего-либо как вещи тривиальной или не имеющей ценности floccinaucinihilipiUficationaUzation 'флокциносинигилипилификационизация': действие, приводящее к тому, что что-то начинает относиться к категоризации чего-либо как вещи тривиальной или не имеющей ценности floccinaucinihilipilificationaHzationai 'флокциносинигилипилификационизаци-онный': относящийся к действию, приводящему к тому, что что-то начинает относиться к категоризации чего-либо как вещи тривиальной или не имеющей ценности 5* «Associated Press» — одно из крупнейших телеграфно-информационных агентств в США. — Прим. ред. Всё о лексике floccinaucinihUipilificationalizationaHze 'флокцнносинигилипилификациониза-инонизировать': делать так, чтобы что-то относилось к действию, приводящему к тому, что что-то начинает относиться... Или, если вы страдаете от сескипедалиафобии, то есть боязни длинных слов, вы можете подумать о своей прабабушке, пра-прабабушке, пра-пра-прабабушке и так далее; на практике список будет ограничен только количеством поколений, начиная с Евы. Более того, у слов, как и у предложений, слишком тонкое строение, чтобы их можно было производить с помощью генератора цепочек (механизма, который выбирает компонент из одного списка, затем перемещается к какому-либо другому списку, затем — к следующему). Когда Рональд Рейган выступил с предложением Стратегической оборонной инициативы, известной в народе как Звездные Войны, он представил такую картину будущего: приближающаяся советская ракета должна быть сбита ракетой противоракетного действия (anti-missile missile). Но критики тострили внимание на том, что Советский Союз может контратаковать ракетой противо-противоракетного действия (anti-anti-missile-missile missile). Нет проблем, сказали инженеры, обучавшиеся в Массачусетском Технологическом Институте, мы просто создадим ракету противо-противо-противоракетного действия (anti-anti-anti-missile-missile-missile missile). •Зти вооружения высоких технологий требуют грамматики высоких технологий — чего-то позволяющего уследить за всеми ant! в начале слова, чтобы закончить его соответствующим количеством missile плюс еще одно па конце. Грамматика структуры слова (грамматика структуры непосредственно составляющих для слов), которая может вставлять слова между unti- и его missile, выполнит эту задачу, а генератор цепочек с ней не спра-нится, поскольку он забудет компоненты, стоящие в начале длинного слова, к тому времени, как дойдет до конца. * * * Как и синтаксис, морфология — это умно организованная система, и многие кажущиеся странности слов — это предсказуемые следствия ее нпутренней логики. У слов тонкое строение; их составные части, подо-шанные друг к другу определенным образом, называются морфемами. Система структуры слова — это продолжение системы структуры непосредственно составляющих Х-штрих, где большие именные комплексы составлены из меньших именных элементов, а меньшие именные комплексы составлены из еще меньших именных элементов и т.д. Самая большая синтаксическая группа для имени существительного — это именная группа; в именную группу входит N-штрих; в N-штрих входит имя существительное — слово. Совершая прыжок от синтаксиса к морфологии, мы просто продолжим это разделение, разбивая существительное на меньшие и меньшие части. Глава 5. Слова, слова, слова Вот схема, представляющая структуру слова dogs (собаки): Вершиной этого мини-дерева является «N» — «имя существительное», что делает возможной операцию присоединения, при которой слово целиком может быть размещено в именном слоте внутри любой именной группы. Ниже — внутри слова — мы видим две его части — чистую словоформу dog, обычно называемую основой слова, и флексию множественного числа -s. Правило, ответственное за словоизменение (правило, прославленное ваг-тестом) — простое: N -¥ NoCHcma Ыфлексия «Имя существительное может состоять из именной основы, за которой следует именная флексия». Это правило прекрасно взаимодействует с ментальным словарем: dog будет значиться в нем как именная основа со значением «собака», a s будет значиться как именная флексия со значением «множественное число от...». Данное правило — это простейший, самый чистый пример того, что можно назвать грамматическим правилом. В моей лаборатории мы используем его как легко поддающийся изучению образчик ментальной грамматики, позволяющий нам с мельчайшими подробностями отразить психологию действия лингвистических правил как в детском, так и в преклонном возрасте, как в сознании нормальных людей, так и людей с расстройствами нервной системы. Во многом подобным образом биологи выбирают в качестве объекта фруктовую мушку дрозофилу, чтобы изучить генетические механизмы. Будучи простым, правило, присоединяющее флексию к основе, оказывается на удивление мощной вычислительной операцией. Это происходит потому, что оно опознает абстрактный ментальный символ, такой как «именная основа», не ассоциируя его с определенным списком слов или звуков, или значений. Мы можем использовать это правило, чтобы изменить форму любого компонента с пометой «именная основа» в ментальном словаре, не заботясь о том, что означает это слово; мы можем не только превратить dog 'собака' в dogs 'собаки', но и hour 'час' — в hours 'часы', a justification 'оправдание' — в justifications 'оправдания'. Подобным образом это правило позволяет нам образовывать формы множественного числа, не принимая во внимание звучание слова; мы образуем множественное число от слов с непривычным звучанием, например, the Gorbachevs 'Горбачевы', the Bachs 'Бахи' и the Мао Zedongs 'Мао Цзедуны'. По той же причине это правило замечательно работает применительно к совершенно новым словам, таким Всё о лексике как: faxes 'факсы', dweebs (двибы — несуществующее слово), wugs (ваги — придуманное слово, использующееся в исследованиях детской речи) и zots (зоты — несуществующее слово). Мы применяем это правило с такой легкостью, что, вероятно, единственный способ вызвать восхищение результатом его работы — это сравнить человека с одной компьютерной программой, превозносимой многими учеными-кибернетиками как шаг в будущее. Такие программы, называемые «искусственными нейронными сетями», не используют правило, которое я вам только что продемонстрировал. Искусственная нейронная сеть работает по аналогии, конвертируя wug 'ваг' в wugged 'вагал', потому что это смутно напоминает hug 'обнимать' — hugged 'обнимал', walk 'шагать' — walked 'шагал' и тысячи других глаголов, которые эта сеть была «обучена» распознавать. Но когда эта сеть сталкивается с новым глаголом, непохожим на что-либо ей ранее встречавшееся при «обучении», она часто коверкает его, потому что не знает абстрактной всеобъемлющей категории «глагольная основа», опираясь на которую можно добавить аффикс. Ниже приводится для сравнения несколько вариантов типичной реакции людей и искусственных нейронных сетей на ваг-тест.
Основы также могут состоять из частей на втором более глубоком уровне их структуры. В таких сложных словах-композитах, как: Yugoslavia report 'доклад о Югославии', sushi-lover 'любитель суши', broccoli-green 'зеленый, как капуста брокколи' и toothbrush 'зубная щетка', Глава 5. Слова, слова, слова две основы соединены вместе, чтобы образовать новую основу согласно правилу: N основа -> N основа N основа «Именная основа может состоять из именной основы, за которой следует другая именная основа» В английском сложное слово обычно пишется через дефис, или два слова, его составляющие, сливаются воедино; но оно может также писаться с пробелом между двумя компонентами, как если бы они все еще были отдельными словами. Это сбило с толку вашу учительницу грамматики и заставило ее сказать вам, что в Yugoslavia report слово Yugoslavia — это прилагательное. Чтобы увидеть, что это не может быть так, давайте попробуем сравнить его с настоящим прилагательным, например, interesting 'интересный'. Можно сказать: This report seems interesting! 'Этот доклад кажется интересным! ', но не: This report seems Yugoslavia! 'Этот доклад кажется Югославия! '. Есть простой способ отличить, является ли что-либо сложным словом или синтаксической группой: у сложного слова ударение обычно падает на первый компонент, у синтаксических групп — на второй. Darkrdom 'темная комната' — синтаксическая группа, — это любая комната, в которой темно, но ddrk room (сложное слово) — это помещение, где работают фотографы, и она может быть освещена, когда работа закончена. Black board 'черная доска' (синтаксическая группа) — это обязательно доска черного цвета, но некоторые bldckboards 'классные доски' (сложное слово) — зеленого или даже белого цвета. Без ориентира, заданного произношением или пунктуацией, некоторые цепочки слов могут выступать и как синтаксическая группа, и как сложное слово, как, например, следующие заголовки: Squad Helps Dog Bite Victim 'Отряд полиции помогает человеку, искусанному собакой' или 'Отряд полиции помогает собаке искусать человека' Man Eating Piranha Mistakenly Sold as Pet Fish 'Пиранья-людоед по ошибке продавалась как аквариумная рыбка' или 'Человек съедает пиранью, по ошибке проданную как аквариумная рыбка' Juvenile Court to Try Shooting Defendant 'Суд по делам несовершеннолетних собирается допрашивать стрелявшего подзащитного' или 'Суд по делам несовершеннолетних собирается застрелить подзащитного' Новые основы могут быть также образованы из старых путем добавления аффиксов (префиксов и суффиксов), таких как -al, -ize и -ation, которые я использовал рекурсивно для получения все более и более длинных слов, что можно делать до бесконечности (как, например, sen-sationalizationaUzation). Например, -able сочетается с любыми глаголами, Всё о лексике чтобы в итоге образовалось прилагательное, как в слове crunch 'хрустеть' — crunchable 'такой, которым можно похрустеть'. Суффикс -ег превращает любой глагол в существительное: crunch 'хрустеть' — cruncher 'тот, кто хрустит'. Суффикс -ness превращает любое прилагательное в существительное: crunchy 'хрустящий' — crunchiness 'хрустящее состояние чего-либо'. 'А основа' crunch -able Правило, по которому они образованы, будет следующим: А основа — > S основа аффикс А основы «Основа прилагательного может состоять из основы, присоединенной к суффиксу» и в ментальном словаре словарная статья такого суффикса, как -able, будет следующей: -able: аффикс основы прилагательного означает «способный подвергнуться действию X» присоедини меня к глагольной основе Как и флексии, аффиксы основы могут присоединяться к любой основе, у которой есть ярлычок соответствующей категории, и в результате мы получаем: crunchable, scrunchable (вымышленное слово), shmooshable (вымышленное слово), wuggable (вымышленное слово) и т.д. Их значения предсказуемы: такой, которым можно похрустеть; такой, с которым можно совершить действие scrunch; такой, с которым можно совершить действие shmoosh; такой, с которым можно совершить действие wug, что бы это wug ни означало. (Хотя я могу привести и исключение: в предложении / asked him what he thought of my review of his book, and his response was unprintable 'Я спросил его, что он думает о моей рецензии на его книгу, и его ответ был непечатным' слово unprintable 'непечатный' означает нечто более специфическое, чем «такой, который нельзя напечатать».) Схема для выведения значения основы из значения ее частей сходна с той, что использовалась для синтаксических групп: один особый элемент — это ее «ядро», и она определяет значение всей конгломерации элементов. Точно так же, как синтаксическая группа the cat in the hat 'кот в шляпе' говорит о неком коте, указывая на то, что этот кот является Глава 5. Слова, слова, слова ее ядром, a Yugoslavia report — это вид доклада, a shmooshobility (такой, с которым можно совершить действие shmoosh) — это вид способности, поэтому report и -ability должны являться ядрами, ведущими компонентами этих слов. Ядро английского слова — это просто его крайняя справа морфема. * * * Продолжая процесс разъединения, мы можем расчленить основы на еще меньшие части. Наименьшая часть слова, та, которую уже нельзя разделить на меньшие части, называется его корнем. Корни могут соединяться с особыми суффиксами, образуя основы. Например, корень Darwin 'Дарвин' может быть обнаружен внутри основы Darwinian 'дарвинистский'. Основу Darwinian в свою очередь можно ввести в правило суффиксации, чтобы получить новую основу Darwinianism букв, 'дарвинистскизм'. Применяя к ней правило словоизменения мы можем получить даже слово Darwinianisms 'дарвинистскизмы', в котором присутствуют все три уровня структуры слова: Интересно, что эти части могут быть пригнаны друг к другу только определенным способом. Так, Darwinism 'дарвинизм', основа, образованная с помощью суффикса основы -ism, не может принять суффикс -idn, поскольку -ian присоединяется только к корням; отсюда Darwinismian (что могло бы означать 'относящийся к дарвинизму') звучит нелепо. Аналогично, Darwinsian 'относящийся к двум знаменитым Дарвинам — Чарльзу и Эразму', Darwinsianism букв, 'дарвиныистский' и Darwinsism букв, 'дарвиныизм' совершенно невозможны, поскольку к цельной словоформе невозможно присоединить ни один суффикс корня или суффикс основы. Внизу, на самом нижнем уровне, где находятся корни и корневые аффиксы, мы вступаем в странный мир. Возьмем слово electricity 'элек- Всё о лексике тричество', произносится «электрисити». Кажется, что оно содержит две части: electric и -ity: Но действительно ли это слово составлено по правилу, согласно которому словарная единица -ity может присоединяться к корню electric подобным образом? N основа -> N корень суффикс N корня «Именная основа может быть составлена из именного корня и суффикса». -ity: суффикс именного корня означает состояние X присоедини меня к именному корню Только не на этот раз. Прежде всего, просто «склеивая» вместе слово electric и суффикс -ity нельзя получить electricity — будет звучать нечто вроде electric itty (произносится «электрик итти»). Корень, к которому присоединяется -ity, изменил свое произношение на «электрйс». То, что остается слева после удаления суффикса, является корнем, который не может быть произнесенным изолированно. Во-вторых, у комбинации корень-аффикс может быть непредсказуемое значение, здесь ломается регулярная схема выведения значения целого из значения частей. Complexity 'сложность' — это состояние, при котором нечто является complex 'сложным', однако, electricity — это не состояние, при котором нечто является electric 'электрическим' (невозможно сказать, что электричество этого нового консервного ножа делает его таким удобным), это сила, движущая что-либо электрическое. Точно так же слово instrumental 'инструменталис' (падеж) не имеет ничего общего с instruments 'инструментами', intoxicate 'опьянять' не о toxic substances 'токсических веществах', никто не recite 'декламирует' во время recital 'сольного концерта', a five-speed transmission 'коробка передач с пятью скоростями' это не transmitting 'акт передачи чего-либо'. В-третьих, предполагаемое правило и аффикс, который мы рассматриваем, невозможно свободно применять к словам, в отличие от других правил и аффиксов, которые мы рассматривали ранее. Например, что-либо может быть academic 'академическим', acrobatic 'акробатическим', aerodynamic 'аэродинамическим' или alcoholic 'алкогольным', но academic- Глава 5. Слова, слова, слова ity 'академичество', acrobaticity 'акробатичество', aerodynamkity 'аэроди-намичество' и alcoholicity 'алкогольность' звучат ужасно (я выбрал просто первые четыре слова на -к из своего электронного словаря).
|