![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
ПЕРСПЕКТИВЫ 3 страница
Значение систем продукций состоит в возможности выполнения вычислений, что, по предположению, составляет суть процессов познания
у человека. Далее, они позволяют записывать информацию однородно, являясь наиболее гомогенной формой организации программ из всех, известных на сегодняшний день. Так как каждая продукция не зависит от других, это облегчает дополнение системы новыми продукциями, выявляемыми при опросе и наблюдении за поведением испытуемых. Система продукции предполагает существование рабочей памяти, содержащей описание условий актуально реализуемых продукций и их результатов, а также операций сравнения и идентификации, нахождения подпрограмм и контроля за их развертыванием. Эти операции в системах продукции крайне просты, поэтому общее количество единиц оказывается в пределах «магического числа». Долговременная память интерпретируется как хранилище массива продукций, то есть связок «условие—действие». Наконец, работа моделей определяется балансом информации, поступающей из внешнего мира («внешней памяти») и создаваемой продукциями. Возникает известная непредсказуемость «поведения», столь характерная и для человека. В области мышления этот этап исследований открыла монография Ньюэлла и Саймона (Newell & Simon, 1972), в которой они обобщили опыт моделирования доказательства геометрических теорем, решения криптоарифметических задач и игры в шахматы. Основным допущением этой работы является то, что мыслительные процессы — это процессы вычислений, а основным выводом — что по своей организации они являются системой продукции. С помощью систем продукции было проведено моделирование процессов решения множества простых познавательных задач. Так, Д. Массаро (Massaro, 1975) создал программы последовательного исчерпывающего, последовательного самооканчивающегося и контентно-адресуемого поиска в памяти. В последнем случае центр тяжести обработки переносится на этап фиксации элементов положительного множества, каждый из которых заносится в одну из специально пронумерованных ячеек памяти и снабжается маркером ответа. При предъявлении стимула информация о нем направляется прямо к соответствующей ячейке, вызывая записанный там ответ. В памяти модели, следовательно, могут храниться не только элементы, но и пары «стимул-ответ». Этот же принцип был реализован в другой программе (Newell, 1974a), моделирующей решение задач поиска в памяти, непосредственного запоминания, задач абстрагирования и выполнения арифметических вычислений. Помимо этой и последующих работ Ньюэлла, Саймона и их коллег (например, Newell, 1990), процедурная репрезентация знания является основой большинства глобальных моделей понимания. Дж.Р. Андерсон (2002) использует ее в модели ACT-R, память которой разбита на две примерно равные части: систему пропозиций (декларативная часть) и систему продукций (см. 6.4.1 и 8.1.1). Такой диапазон моделей иллюстрирует возможности систем продукции, допускающих простое расширение набора операций и выделение их общих звеньев. В других моделях соотношение оказывается иным, вплоть до отказа от процедурного знания. Это отражает ведущиеся в информатике споры о сравнительных достоинствах этих двух форм репрезентации13. Декларативные системы более обозримы и доступны для внешнего контроля, поэтому здесь легче извлекать нужную порцию сведений. Независимость от контекста позволяет также вводить общие алгоритмы расширения базы данных. Что касается процедурных систем, то они более эффективны, когда использование операций удается связать с тем специфическим контекстом (условиями), в котором они заведомо ведут к цели. Психологически правдоподобное решение этой проблемы состоит в отказе от жесткого различения данных и операций. Например, в ранней системе представления знаний LNR, разработанной Д. Норманом, Д. Румелхартом и их сотрудниками, одна и та же информация может попеременно выступать то в одном, то в другом качестве. Как отмечают эти авторы, «то, что мы знаем, включено в то, что мы умеем делать» (Rumelhart & Norman, 1981). Обобщенные описания знания — схемы — это процедуры, сканирующие сенсорную информацию в поисках примеров репрезентированных ими понятий. Внутренняя структура схем при этом иррелевантна, существен лишь операциональный аспект. Декларативный аспект важен в тех случаях, когда появляется необходимость ассимиляции нового знания либо имеющиеся знания должны быть применены в новых условиях. Подобный перенос навыка решения, сравнение и обучение осуществляются в современных моделях (таких как LISA и EMMA — см. 8.2.1) прежде всего по типу решения задач на аналогии. В качестве простейшей иллюстрации рассмотрим процедурное определение функции, извлекающей из памяти имена всех родителей индивида «х»: родитель (дс): возврат узлов от «х» через «родитель». Функцию ребенок (дг) можно определить как аналогичную функции родитель (jc) с «ребенок» вместо «родитель». Это приведет к появлению функции, извлекающей набор узлов семантической памяти, доступных от узла «х» с помощью указателя «ребенок». Если данные хранятся упорядоченным образом, то в результате можно получить список всех детей индивида «л». Если существует функция мужчина (дс), которая, действуя как фильтр, отбирает из множества «jc» тех индивидов, про которых можно сказать, что они являются мужчинами, то новую функцию отец (х) можно определить так: отец (х) возврат мужчина (родитель (х)) Тогда при наличии функции женщина (х) (ее, разумеется, можно ввести по аналогии с функцией мужчина (х)) легко создать новые функции мать (jc), дочь (х), сын (дс), бабушка (дс), внучка (дс) и т.д., используя такие структурные отношения, как «мать» подобно «отец» с «женщина» вместо «мужчина», «дочь» подобно «мать» с «ребенок» вместо «родитель», «бабушка» подобно «мать» с родитель (дс) вместо «х» и т.п. Иными словами, декларативное описание отношений родства удается построить на основе двух или трех исходных процедур.
Полезность подобного гибкого совмещения декларативных и процедурных способов описания материала также удается показать в рамках исследований по процедурной семантике, для которых характерно понимание значения как системы операций, позволяющих установить перцептивные референты понятия и возможности его использования. Хорошим примером здесь может служить использование понятийного знания для порождения новых лексических единиц, которое обсуждалось нами в предыдущих главах (см. 6.1.1 и 7.3.2). К сожалению, примеров учета функциональных возможностей различных форм репрезентации знания в вычислительном подходе не так уж много. Так, в период расцвета глобальных моделей понимания рецензенты единодушно отмечали их слабую связь с эмпирическими данными (см. 6.4.1 и 8.1.1). Поскольку языки программирования и аналогичные формально-логические системы достаточно мощны, чтобы описать любой массив данных, а, с другой стороны, своеобразие их внутренней грамматической организации сводит возможность правильного предсказания новых психологических результатов к случайности, то и схема ги-потетико-дедуктивного исследования оказывается не достижением, а помехой. Возможно, именно поэтому наиболее резкая критика чрезмерного обилия фактов в когнитивной психологии и иррелевантности экспериментов исходит от представителей вычислительного подхода. С практической точки зрения, наиболее важным развитием последних десятилетий стало создание экспертных систем — программных систем, моделирующих в рамках определенной проблемной области решение задач экспертами (см. 8.3.3). Экспертные системы состоят из двух основных компонентов: базы знаний и так называемой машины вывода, то есть собственно решателя задач. Базы знаний строятся при этом как процедурно-декларативные репрезентации, включающие факты и правила. В качестве технического, человеко-машинного «изделия» полноценная экспертная система дополнительно включает интерфейс пользователя и интерфейс разработчика (инженера по знаниям). Наконец, чрезвычайно важным оказалось присутствие специальной подсистемы, которая давала бы пользователю правдоподобное обоснование предлагаемых решений. Общей тенденцией стала постепенная трансформация экспертных систем в системы поддержки решений. К числу основных сфер применения этой основанной на формальном представлении знаний (knowledge-based) технологии относятся медицина, геология, юриспруденция, психологическая диагностика, а также учет и логистика, прежде всего в области электронной коммерции и банковского дела. По утверждению разработчиков, экспертные системы в ряде случаев демонстрируют уровень знаний, равный среднему уровню знаний специалистов в соответствующих областях (Джексон, 2001). Более того, имеются примеры использования этой технологии для моделирования творческих достижений (как в случае системы поддержки индуктивных умозаключений BACON, которая смогла на основании заранее выявленных, кодированных и введенных в компьютер данных «повторить» открытие законов Галилея, Кеплера и Ома). Самостоятельное значение имеет использование программ компьютерной графики в качестве инструмента визуализации, позволяющих человеку-эксперту делать новые открытия в медицине, геологии и математике, в частности, в теории чисел (Зенкин, 1996). Но все же, как правило, в большинстве случаев традиционные экспертные системы остаются на уровне прототипов, не превращаясь в коммерческий продукт. Их применимость ограничивается проблемой юридической ответственности, как в случае неправильно поставленного медицинского диагноза, а также недостаточной гибкостью. Одной из неприятных особенностей практически всех систем является возникающее вблизи границ области экспертизы «обвальное» ухудшение результатов. Надежды возлагаются поэтому на гибридные архитектуры, прежде всего на искусственные нейронные сети. Последние демонстрируют при ухудшении условий работы плавное снижение эффективности (англ. graceful degradation — см. 2.3.2). Вопрос состоит в том, можно ли, в свете этих данных, считать правильным вычислительное понимание мышления и, шире, познания? В отношении самих процессов, ведущих к решению, в этом нет никакой уверенности. В литературе сосуществует множество различных систем описания вычислений, и они постоянно развиваются, как, например, в случае возникших сравнительно недавно языков объектно-ориентированного программирования {ООП). Основное в этих языках — сохранение внешней формы при изменении свойств: программные структуры меняют свое содержание в зависимости от того, какие «объекты» (либо, в более современной, но менее адекватной терминологии, «классы») подставляются в них14. Однако в целом развитие логических оснований вычислительного подхода имеет собственную динамику. Оно направлено не на симуляцию человеческих достижений, а на их дополнение, причем акцент делается на способности вычислительных устройств к чрезвычайно быстрому перебору вариантов15.
15 Исследователям всегда было свойственно считать достигнутый в их время техни 306 все новыми разновидностями компьютерных программ. Трудно сказать, какие возмож- С точки зрения сравнения результатов искусственных и естественных интеллектуальных достижений, ответ, несомненно, выглядит иначе. В ряде случаев, как, например, в случае компьютерных программ игры в шахматы, программные системы явно превзошли человека16. Это развитие было предсказано свыше полувека назад. В 1950 году Алан Тьюринг опубликовал статью «Вычислительные машины и интеллект», где он высказал предположение, что к концу 20-го века достижения программируемых компьютеров сравняются с результатами решения задач человеком (см. 2.1.1). В той же классической статье Тьюрингом была описана процедура возможной проверки такого соответствия. Эта процедура известна сегодня как тест Тьюринга. Если в диалоге с невидимым партнером человек не может достоверно определить, имеет ли он дело с собратом по разуму или же с вычислительным устройством, то последнее успешно выдержало этот тест. В ряду серьезных и полусерьезных попыток проведения теста Тьюринга выделяются эксперименты известного критика работ в области искусственного интеллекта Дж. Вейценбаума (1982) с относительно простой, включавшей всего лишь несколько сот строчек текста программой ELISA, которая позволяла длительное время поддерживать заочный диалог с человеком. При этом она производила на собеседников впечатление живого человека. Позднее (и опять же скорее в критических целях) Вейценбаум адаптировал свою программу для целей роджериан-ской психотерапии, назвав ее DOCTOR. Многие участники опытов Вейценбаума не только не чувствовали дискомфорта, но и предпочитали иметь дело с компьютером, а не с реальным психотерапевтом. 9.2.2 Философия искусственного интеллекта Слабость теста Тьюринга состоит в том, что это бихевиористский тест. Для когнитивной науки важен анализ интенций и ментальных репрезентаций, обеспечивающих решение задачи. Неоменталистским ответом на тест Тьюринга и успехи вопросно-ответных программ стал мысленный эксперимент, описанный американским философом Джоном Сёрлом (Searle, 1991). Он предложил представить человека, находящегося в закрытом помещении. Через щель в комнату поступают письменные вопросы на китайском языке, о котором этот человек не имеет ни
·" В 1997 году компьютерная программа впервые выиграла партию у чемпиона мира по малейшего представления. Ему также не известна тематика вопросов. К счастью, при нем находится достаточно полный китайско-китайский толковый словарь. Найдя в словаре иероглифы, соответствующие толкованию иероглифов в записках, герой этой истории записывает их в качестве ответа и передает обратно через дверную щель. Для внешнего наблюдателя весь процесс может выглядеть как участие закрытого в «китайской комнате» человека в дискуссии экспертов... по истории средневекового Китая. Проблема, однако, состоит в том, что, симулируя работу компьютера и практически решая коммуникативную задачу, человек в комнате совершенно не осознает интенциональное содержание своей деятельности. Это феноменологическое рассуждение (если нет интенционально-сти, то нет сознания, а следовательно, нет и человеческого мышления) служит одним из нескольких обсуждаемых в литературе радикальных аргументов против применения вычислительного подхода в психологии и против самой возможности построения искусственного интеллекта. Но аргументация Сёрла не безупречна. Слабым ее пунктом является рассмотрение заведомо ограниченной системы индивидуального сознания и мышления. Хотя человек в комнате, по определению, ничего не знает о содержании принимаемых и передаваемых сообщений, нельзя отрицать, что фактической основой его работы служит глубокое понимание языка и тематики обсуждения создателями толкового словаря и участниками ведущейся дискуссии. Используя нейрокогнитивную аналогию, можно уподобить сёрловского оператора частной подсистеме большого мозга. Так, зона Брока, играя важную роль в экспрессивном речевом общении (см. 7.3.3), тоже, по-видимому, «не понимает» намерений и содержания речи своего обладателя. В последние десятилетия стали появляться примеры, как бы зеркально симметричные аргументу Сёрла. Речь идет об успешном решении задачи компьютером при отсутствии понимания природы этого решения человеком. Самым известным примером такого рода является доказательство теоремы о четырех красках. Еще в середине 19-го века было высказано предположение, что для раскраски карты таким образом, чтобы две имеющие общую границу области (страны) имели разную окраску, должно быть достаточно четырех красок. Несмотря на усилия выдающихся математиков, эта теорема не могла быть доказана вплоть до 1977 года, когда ее «доказала» относительно простая компьютерная программа, написанная К. Аппелем и В. Хакеном. Путем исчерпывающего перебора множества возможных сочетаний границ, программа продемонстрировала, что во всех случаях четырех красок действительно оказывается достаточно. Профессиональное сообщество математиков отнеслось к этому событию с большой долей скепсиса, так как, во-первых, остались непонятными концептуальные основания данного вывода, а во-вторых, любая программа, как было ясно уже в то время (до появления продукции фирмы Microsoft), может содержать ошибку. Собственно «человеческое» доказательство теоремы появилось лишь спустя 20 лет, в 1997 году (MacKenzie, 2001). Ситуации непонятности машинного решения для человека возникают, например, при распознавании объектов с помощью искусственных нейронных сетей, поскольку характер изменений в сетях в процессе обучения слишком сложен, чтобы его можно было затем проследить аналитически. Более того, эпизоды непонимания содержания производимых компьютерными системами операций и вытекающих из них выводов весьма частотны в реальной жизни — как в профессионально-технологическом контексте (проблема ситуативного сознания у пользователей полуавтоматизированных систем — см. 2.1.2), так и во все большей мере в повседневных бытовых условиях. Непонимание возникает здесь, в конечном счете, между пользователем и разработчиком технических систем. Но стремительное усложнение этих систем и их намечающееся автономное взаимодействие — автомобилей между собой и со знаками дорожного движения, домашних приборов с системой энергообеспечения дома и т.д. — заставляет и самих разработчиков опираться на компьютерные средства поддержки программирования и принимаемых при этом решений (как в случае систем CAD — Computer Aided Design). Что касается теоретических обобщений этих результатов, то складывается впечатление, что часто они имеют характер «бракосочетания сомнительной эпистемологии и IBM». Унаследованный от формальной логики и вычислительной лингвистики интерес к играм с условными правилами, применяемым к дискретным символам, а также влияние философских взглядов Декарта и особенно Юма привели к тому, что основной стратегией исследования в когнитивной науке был объявлен методологический солипсизм (см. 1.1.2). Считая Юма первым подлинным представителем когнитивной науки, Фодор (Fodor, 1980) утверждает, что если нет различия между мыслью о предмете и просто мыслью, то предмет можно игнорировать. Этот вывод имеет определенные основания, так как при построении систем искусственного интеллекта наиболее существенными вопросами являются их непротиворечивость и программная реализуемость, а не соответствие реальным прототипам. Основной задачей вычислительного подхода было объявлено изучение «языка мысли» (language of thought), предикаты которого, как считает Фодор (Fodor, 1978; Ray, 2003), являются врожденными и лежат в основе не только усвоения родного языка, но и вообще всех форм познавательной активности17. Язык мысли («менталезский язык»)
включает, наряду с логическими суждениями, пропозициями, также и пропозициональные установки, то есть метаоператоры субъективного отношения к ним, представленные ментальными предикатами (или «психологическими глаголами») «хотеть», «знать», «думать», «предполагать», «надеяться», «бояться» и т.д. (см. 6.3.1 и 7.4.1). Вопрос о ложности или истинности содержания пропозиций в подобных конструкциях приобретает подчеркнуто субъективный характер. Например, если некий персонаж по имени Петя «считает, что идет дождь», то справедливость этого утверждения остается (в первом приближении — см. 9.4.1) на совести Пети. Отметим очевидную неполноту этого подхода. В качестве основы мышления человека здесь рассматривается исключительно важное, но все же явно ограниченное подмножество средств двух высших уровней функциональной организации интеллекта, а именно уровней Ε и F. Рассматривая в предыдущей главе (см. 8.1.4 и 8.4.3) основные виды четакогнитив-ных координации, мы отмечали, что в их число входят и невербальные метапроцедуры воображения, позволяющие строить пространственные модели ситуаций и подвергать их изменениям, напоминающим изменения, которые возникают в ходе предметной деятельности. Предположение о сугубо формальной, пропозициональной основе внутренних репрезентаций проблематично в целом ряде отношений, прежде всего с точки зрения того, как мы решаем простейшие задачи с учетом пространственных отношений. Предположим (вслед за Джонсон-Лэйрдом — см. 8.2.2), что нам даны следующие условия «Анна сидит слева от Маши, а Маша сидит слева от Джона». Нужно определить взаимное положение Анны и Джона. Сделать это, используя только свойства логической транзитивности, невозможно, так как в том случае, если Анна, Маша и Джон сидят за круглым столом, Анна будет находиться не слева, а справа от Джона. Пропозициональное описание оказывается в принципе недостаточным, если оно строится без учета предметной ситуации, то есть с позиций декларируемого методологического солипсизма. Полезным расширением теории языка мысли могла бы стать, например, ее интеграция с теорией перцептивных символьных систем (см. 6.4.2). Отдавая дань доминирующей в последнее десятилетие нейрокогнитивной парадигме, Фо-дор и другие сторонники рассматриваемого подхода признают сегодня, что функционирование языка мысли непосредственно коренится в работе нейрофизиологических систем мозга, сохраняя при этом, тем не менее, свой основанный на абстрактных вычислительных операциях характер. Так, например, порождение на языке мысли синонима русской фразы «Я боюсь» приводит к активации миндалины, затем ядер гипоталамуса, выделению адреналина и т.д., причем происходит все это столь же автоматически, как выполнение команд в компьютерной системе, где, скажем, появление на входе последовательности символов вида «begin print» ведет к распечатке текста. Самым общим аргументом в пользу вычислительного подхода слу-310 жит ссылка на возможности машины Тьюринга. Утверждается, что всякая критика данного подхода, если она непротиворечива, должна допускать формализацию в виде программы работы машины Тьюринга. Это устройство, как отмечалось (см. 2.1.1), использует гомогенную систему репрезентации — цепочку символов из конечного алфавита. В таком же коде, как функция состояния и символа на ленте, описывается и поведение машины Тьюринга. Поэтому всякая логичная критика машинных моделей познавательных процессов может быть переведена если и не в реально, то, по крайней мере, в потенциально реализуемые программы вычислений18. Заслуживающие внимания критические замечания, следовательно, могут быть ассимилированы и использованы для демонстрации универсальности вычислительного подхода. С этой целью А. Ньюэлл и Г. Саймон разработали программу, моделирующую картину движений глаз шахматистов. Такие исследования проводились ранее советскими критиками искусственного интеллекта — O.K. Тихомировым и его коллегами (см., например, Тихомиров, 1969). Этот аргумент, конечно, основан на ряде недоразумений. Его авторы не учитывают развитие самой математической логики. Во-первых, анализ вопроса о границе между реальной и потенциальной вычислимостью функций показал, что с помощью машины Тьюринга могут быть вычислены лишь сравнительно простые функции: формальные модели сложных систем оказываются более сложными, чем сами эти системы (Doyle, 2003)19. Во-вторых, средствами исчисления предикатов первого порядка («булевой алгебры»), с которой имеет дело машина Тьюринга, невозможно решать задачи новых разделов математической логики — конструктивной и модальной логики, прежде всего, подклассов так называемых временных и интенциональных (или эпистемических), логик, в случае которых, до известной степени, учитываются ресурсы, знания и интенции субъекта (см. 9.2.3). Впрочем, недостаточно убедительны и радикальные аргументы против возможности вычислительной интерпретации человеческого интеллекта. Упоминавшаяся в самом начале данного подраздела китайская комната Сёрла отнюдь не единственный такой аргумент. Двумя другими, наиболее частотными аргументами являются ссылки на теорему Гёделя о неполноте формальных систем и на «проблему фрейма» (последнюю не следует путать с частными проблемами, возникающими в связи
" Упомянутая здесь проблема вычислимости по-разному ставится для разных классов с использованием «фреймов» в качестве определенного формата представления знаний — см. 2.3.2 и 6.3.1). Согласно теореме о неполноте, доказанной Куртом Гёделем в 1931 году, во всякой строго формальной системе имеются некоторые утверждения, которые не могут быть ни доказаны, ни опровергнуты в рамк.ах данной системы10. Следовательно, полагают современные критики вычислительного подхода, формальное описание таких сложных систем, как сознание или интеллект человека, также обречены на неполноту и полноценный искусственный интеллект невозможен. Это рассуждение едва ли правомерно, так как вычислительные теории в когнитивной науке никогда и не претендовали (в действительности, не могли претендовать) на строгость таких формальных систем, как арифметика. Всякая попытка исчерпывающего логического описания когнитивных структур заведомо должна была бы кончиться неудачей, поскольку в психологии, как отмечал еще Кант, особенно выражена зависимость данных от процедуры исследования и, кроме того, сам объект исследования имеет непрерывный характер. Существуют многочисленные примеры эмпирически мотивированных дополнений в вычислительных моделях языка и мышления. К ним относятся постулаты значения Карнапа (см. 6.1.1), а также разнообразные эвристики мышления и принятия решений, впервые систематизированные как раз видными представителями работ в области искусственного интеллекта Ньюэллом и Саймоном (см. 8.1.1 и 8.4.1).
|