![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Нецифровая вычислительная программа как теория
Электронная цифровая вычислительная машина представляет собой устройство для очень быстрого сложения, вычитания, умножения и деления. Но вычислительная машина не просто устройство, оперирующее цифрами, она является и устройством, оперирующим символами. Символы, которыми она оперирует, могут представлять числа, буквы, слова или даже нецифровые, несловесные образы. Вычислительная машина имеет поистине общие способности чтения символов или образов, хранения символа в памяти, сравнения символов для опознания их, обнаружения особых различий между их образами и возможности действовать тем способом, который обусловлен результатами этих процессов. Теперь вернемся к нашему испытуемому. Его поведение, которое мы хотим объяснить, состоит из последовательности символических выражений. Это положение не зависит от методики «мышления вслух», использованной в экспериментах. Оно было бы также справедливо и в том случае, если бы испытуемый давал ответы на задачу письменно или нажатием кнопок. Во всех случаях его поведение может быть интерпретировано как последовательность символов — в последнем приведенном случае — последовательность «Л» и «П», где «Л» используется для «левой кнопки», а «П» — для «правой кнопки».
Рис. 1. Уровни информационных процесс в теории мышления человека Ньюэлл Л., Шоу Дж.С, Саймон Г.А., Моделирование мышления... 657 управляемых нервными сигналами, также являются процессами оперирования символами, т.е. образы, различным способом закодированные, могут быть уловлены, зафиксированы, переданы, сохранены, скопированы и т.д. с помощью механизмов этой системы. Мы не будем защищать этот постулат подробнее, его подлинная защита — в его возможности объяснить поведение. Вместо этого мы используем тактику, весьма успешную в других науках, допускающую объяснения на нескольких различных уровнях. Так же, как мы объясняем то, что происходит в испытываемой трубке путем химических уравнений, и потом объясняем химические уравнения с помощью механизмов квантовой физики, так мы попытаемся объяснить то, что происходит в процессе мышления и решения задачи с помощью организации процессов оперирования с символами, поставив задачу объяснения этих процессов в нейрофизиологических терминах. Подход к построению теории сложного поведения изображен на рис.1. Мы имеем дело с верхней половиной схемы — со сведением высшего поведения к информационным процессам. Если это сведение может быть осуществлено, тогда вторая часть теории будет нуждаться в объяснении информационных процессов на основе нейрологических механизмов. Мы надеемся, что прорыть туннель сквозь горы нашего незнания с двух сторон будет легче, чем пытаться преодолеть все расстояние только с одной стороны. Мы постулируем, что поведение испытуемого подчиняется программе, включающей группу элементарных информационных процессов. Мы кодируем группу подпрограмм для цифровой вычислительной машины, каждая из которых осуществляет процесс, соответствующий одному из этих постулированных информационных процессов. Затем мы записываем программу, составленную из этих подпрограмм, которая заставит вычислительную машину действовать тем же способом, каким действует испытуемый; производить, по существу, тот же поток символов, когда обоим дается одна и та же проблема. Если мы достигнем успеха в создании программы, которая имитирует поведение испытуемого достаточно точно в значительном ряде ситуаций решения задачи, тогда мы сможем рассматривать программу как теорию поведения. Как высоко мы оценим теорию, зависит, как и в случае всех теорий, от ее всеобщности и ее экономичности, от того, насколько широк род явлений, объясняемых ею, и от того, насколько экономично выражение ее. Можно увидеть, что такой подход не предполагает, что «оснащение» вычислительных машин и мозга подобно, за исключением предположения, что и вычислительная машина, и мозг — общецелевые устройства, оперирующие символами, и что вычислительная машина может быть запрограммирована для выполнения элементарных информационных процессов, которые функционально подобны тем, которые осуществляются мозгом. 42 Зак. 2228 Тема 16. Основные теоретические подходы к изучению познания Общий решатель проблем Наша попытка объяснить процесс решения задач принимает форму программы вычислительной машины, которую мы называем Общий решатель проблем (ОРП). Проблема, приведенная выше, внутренне представляется в форме выражений, которые означают «преобразовать» 1 в 2. Мы называем символические структуры, соответствующие логическим выражениям, объектами; структуры, соответствующие проблемным задачам и аналогичным положениям, — целями. Программа достигает целей путем применения к объектам операторов1 превращая таким образом эти цели в новые объекты. Программа включает действия по применению операторов к объектам. Она включает также процессы сравнения пар объектов; эти процессы создают (внутренне) символы, которые обозначают отличия между сравниваемыми объектами. Действия ОРП группируются вокруг трех типов целей и небольшого числа методов достижения целей этих типов. 1. Преобразование целей. Эти процессы имеют форму, которая уже Метод 1. Сравнить а с b, для того чтобы найти различие d между ними; если нет различий, проблема решена. Создать цель: уменьшение различия d между а и b. Если действие успешно, результат будет преобразованием а в новый объект с. Теперь создать новую цель преобразованием с в b. Достижение этой цели и будет решением первоначальной проблемы. 2. Цели применения операторов. Эти операции имеют форму: при Метод 2. Определить, отвечает ли a условиям применения q? Если да, применить q, если нет, определить различие между а и объектом, к которому q применим. Если это действие успешно, будет создан новый объект а', который является модификацией а. Теперь попытаться приложить q к а'. 3. Цели уменьшения различий. Как мы видели, они имеют форму: Метод 3. Найти оператор q, соответственный данному различию (значение соответствия — релевантности — будет позже объяснено). Создать цель применения q к а. Если операция успешна, то результат будет преобразованием о в новый объект с, который не будет сильно отличаться от b. Таким образом, Общий решатель проблем представляет собой программу вычислительной машины, включающую общие процессы заклю- 1 Операторы — правила преобразования в математической логике. (Примечание переводчика источника.) Ньюэлл Л., Шоу Дж..С., Саймон Г.А., Моделирование мышления.. чения относительно итогов (целей) и средств (операторов). Она является общей (general) в том смысле, что сама по себе программа не привязана к самой природе объектов, различий и операторов, с которыми она имеет дело. Следовательно, ее возможности в решении задач могут быть перенесены с одного типа задач на другой, если он содержит информацию относительно типов объектов, различий и операторов, которые характеризуют и описывают конкретные условия задачи. Испытание теории Вопрос о том, насколько адекватной является программа как теория информационных процессов при решении задачи человеком, может быть поставлен на нескольких специфических уровнях. На самом общем уровне мы можем задать вопрос, будет ли программа фактически решать задачи таким же образом, как и человек. Она определенно это делает. Общие типы анализа отношения средств — целей, которые использует Общий решатель проблем, являются в то же время методами, отмечаемыми и в протоколах испытуемых. Мы изучили в деталях около 20 протоколов испытуемых, решавших логические проблемы. Фактически все поведение, описанное в этих протоколах, протекает в рамках анализа средств — целей. Три типа целей, рассмотренных нами, составляют три четверти всех целей испытуемых, а дополнительные типы целей, которые появляются в протоколах, тесно связаны с теми, которые мы описали. Три метода, выделенных нами, представляют подавляющее большинство методов, примененных к данным проблемам испытуемыми. Протоколы поведения человека при решении проблем в различных сферах деятельности — при игре в шахматы, решении загадок, написании программ вычислительной машины — содержат много последовательных действий, которые также подобны анализу средств — целей Общего решателя проблем. Мы не можем, конечно, на основе такого типа доказательств заключать, что ОРП дает адекватное объяснение всем типам поведения при решении задач. Наряду с содержащимися в нем механизмами могут быть включены и многие другие механизмы. Только когда программа имитирует полную последовательность поведения, например, осуществляет тот же самый шахматный анализ, что и человек, у нас складывается убеждение, что мы постулировали группу процессов, которая достаточна для осуществления поведения в данном случае. Общий решатель проблем не единственная существующая программа этого типа. Есть программа, предшественница ОРП, которая также отыскивает доказательства теоремы, но только по символической ло- Тема 16. Основные теоретические подходы к изучению познания гике. Существуют программы для доказательства теорем в геометрии, для конструирования электромоторов, генераторов и трансформаторов, для создания музыки и игры в шахматы. Существуют программы, которые «обучаются», т.е. такие, которые изменяются в различных отношениях на основе опыта. Успех, уже достигнутый в синтезировании механизмов, которые решают трудные проблемы тем же способом, что и человек, позволяет рассчитывать на создание весьма специфической и операционной теории решения проблем. Наша цель — распространить некоторые положения этой теории на творческое мышление. Сделать это — значит утверждать, что творческое мышление является просто специальным видом поведения при решении проблем. Это кажется нам полезной рабочей гипотезой. Сформулированные так откровенно наши намерения кажутся утопичными. Насколько они являются утопичными — или, скорее, насколько отдалена их реализация, — зависит от того, как широко или узко мы интерпретируем термин «творческий». Если мы намерены рассматривать всю сложную деятельность человека по решению задач как творческую, то, как мы покажем, удачные программы для механизмов, которые имитируют человека, решающего задачу, уже существуют и известен ряд их основных характеристик. Если мы оставляем термин «творческий» для деятельности, подобной открытию специальной теории относительности или созданию бетховенской Седьмой симфонии, тогда в настоящее время не существует примеров творческих механизмов. Решение проблем и творчество В психологической литературе «творческим мышлением» обозначается специальный тип деятельности с несколько неопределенными и нечеткими границами. Решение задач характеризуется как творческое в той мере, в какой оно удовлетворяет одному или большему числу следующих условий. 1. Продукт мыслительной деятельности обладает новизной и ценностью (либо для индивида, либо для его культуры). 2. Мыслительный процесс также отличается новизной, требует преобразования или отказа от ранее принятых идей. 3. Мыслительный процесс характеризуется наличием сильной мотивации и устойчивости, протекая либо в течение значительного периода времени (постоянно или с перерывами), либо с большой интенсивностью. 4. Проблема, поставленная первоначально, смутна и плохо определена, так что одной из наших задач было формулирование самой проблемы. Ньюэлл Л., Шоу Дж.С, Саймон Г.А. Моделирование мышления... Наблюдается высокая корреляция между творчеством (по крайней мере в области наук) и успешностью в выполнении самых шаблонных интеллектуальных заданий, которые обычно используются для измерения одаренности. Таким образом, творческую деятельность можно охарактеризовать просто как вид деятельности по решению специальных задач, который характеризуется новизной, нетрадиционностью, устойчивостью и трудностью в формулировании проблемы. Когда мы говорим, что эти программы вычислительных машин имитируют процесс решения задачи человеком, мы не просто подразумеваем, что они решают задачи, которые раньше решались только человеком, хотя они делают и это. Мы подразумеваем, что они решают эти проблемы путем использования методов и процессов, которые в большей или меньшей степени подобны методам и процессам, используемым человеком. Самый последний вариант «логика-теоретика»1 был спроектирован полностью как имитация (частичная) человека, поведение которого было запротоколировано в лабораторных условиях. Деятельность, осуществляемая вычислительными программами, предназначенными для решения задач, протекает в области, не столь далекой от той, которая обычно рассматривается как «творческая». Нахождение доказательств математических теорем, сочинение музыки, проектирование технических конструкций и игра в шахматы обычно рассматриваются как творческие процессы, если продукт деятельности оригинален и высококачествен. Следовательно, отношение этих программ к теории творчества очевидно, даже если настоящие программы не точно имитируют психические процессы человека — они приносят вполне земной плод. Рассмотрим более детально вопрос о том, следует ли считать «логика-теоретика» творческим механизмом. Что касается проблем, которые мы действительно ставили ему, а ими были теоремы, выведенные из гл. 2 «Principia Mathematica» (1925—1927) Уайтхеда и Рассела, он находил доказательство в трех случаях из четырех. Если написание этих книг было творчеством для Уайтхеда и Рассела, то возможно, что и переоткрытие «логиком-теоретиком» значительной части гл. 2 — открытие заново в большом числе случаев тех же самых доказательств, что Уайт-хед и Рассел открыли первоначально, — тоже творчество. Если мы хотим серьезно возражать против того, что «логик-теоретик» объявляется творческим механизмом, мы должны основываться на анализе тех проблем, которые он выбирает, а не на его деятельности при их решении. Так, можно считать, что программа — это лишь математическое орудие, основывающееся на решениях значительного числа задач, 1 «Логик-теоретик» — это программа вычислителя, способного найти доказательства теорем в области элементарной символической логики, используя методы, подобные тем, которые используются людьми. 662 Тема 16. Основные теоретические подходы к изучению познания предложенных Уайтхедом и Расселом; «логик-теоретик» просто ищет ответы на них, в то время как подлинное творчество заключается прежде всего в выборе проблемы. Это является четвертой характеристикой, выдвигаемой нами при определении творчества. Но «логик-теоретик» обладает способностью к выбору задач. Работая с конца, т.е. отправляясь от цели доказать данную теорему, он может выдвигать новые теоремы и ставить себе подцели — доказать их. Исторически, хотя и в более широких рамках, этот процесс и был осуществлен Уайтхедом и Расселом, когда они создавали теоремы, которые затем доказывали. Для этой работы они сначала выбрали для себя основные постулаты арифметики и вывели их как теоремы из аксиом логики. Абстрактная модель поведения при решении задачи Мы обращаемся теперь к общей теории решения задачи, с тем чтобы позже вернуться к специфическим вопросам «творческой» части спектра процесса решения задач. Лабиринт представляет подходящую абстрактную модель для большинства видов деятельности по решению задач. Лабиринт является группой путей (возможно, частично перекрывающихся), в которой какая-то подгруппа отличается от других тем, что в конце путей имеются цели (награды, подкрепления). Пути этой подгруппы являются «правильными» путями: найти один из них — значит решить задачу прохождения лабиринта. Мы можем подняться на следующую ступень абстракции и охарактеризовать решение задачи при помощи следующих положений: дана группа Р, найти член подгруппы S из группы Р, имеющий специальные свойства. Существуют различные пути классификации процессов, используемых людьми при решении задачи. Полезным является различение процессов нахождения возможных решений (создание членов Р, которые могут принадлежать к S) от процессов определения того, будет ли найденное предложение фактически решением (проверяя, относится ли к S созданный элемент Р). Мы называем процессы первого класса процессами выработки решения, а второго класса — процессами проверки (верификации). В достаточно малом лабиринте, где члены S, как только они открыты, легко могут быть опознаны как решение, нахождение решения тривиально (примером является Т-образный лабиринт для крыс с пищей на одной из дорожек). Трудности при сложном процессе поисков решения возникают в связи с комбинацией двух факторов: размеров группы воз- Ньюэлл Л.., Шоу Дж.С Саймон Г.А, Моделирование мышления... 663 можных решений, которые должны быть исследованы, и задачей установления того, действительно ли соответствует предложенное решение условиям задачи. Используя нашу формальную модель решения задачи, мы можем часто получать значащие меры трудности конкретных проблем и меры эффективности конкретных устройств и процессов решения задачи. Рассмотрим некоторые примеры. Обратимся к выбору хода в шахматах. В среднем шахматист, чья очередь совершать ход, осуществляет свой выбор из 20 или 30 альтернатив. Поэтому нахождение возможных ходов не представляет трудностей, но огромные трудности существуют при определении того, будет ли конкретный дозволенный ход хорошим ходом. Проблема не в генераторе, а в проверочном компоненте деятельности. Однако принципиальный метод для оценки хода состоит в рассмотрении некоторых противоположных возможных ответов, собственных ответов и т.д., только попытки оценить результаты позиций после этого лабиринта возможных последовательностей ходов осуществляются с некоторой глубиной. Лабиринт последовательности ходов чрезвычайно велик. Если мы рассматриваем пять последовательных ходов для каждого игрока, предполагая в среднем 25 дозволенных продолжений на каждой ступени, мы находим, что Р, группа таких последовательностей ходов, включает около 1014 (100 миллионов миллионов) членов. Еще один пример будет полезен для уяснения того, как различные устройства сокращают количество проб, требуемых для нахождения решения задачи. Рассмотрим сейф, замок которого включает 10 независимых дисков, каждый из них пронумерован от 00 до 99. Сейф будет иметь 10010=1020 или 100 биллионов возможных положений дисков, только одно из которых будет открывать его. Однако если сейф неисправен и всякий раз возникает легкий щелчок, когда любой диск установлен в правильном положении, то потребуется в среднем только 50 проб, чтобы открыть сейф. 10 последовательных щелчков, предупреждающих взломщика, когда «теплее», вот и все отличие неразрешимой задачи от тривиальной. Итак, если мы можем получить информацию, которая подсказывает нам, какое решение испытать, и, в частности, если мы можем получить информацию, которая позволяет нам раздробить большую проблему на несколько небольших задач и узнать, успешно ли мы решили каждую из них, — поисковая деятельность может быть значительно сокращена. Эвристика для решения задач Мы рассмотрим некоторые примеры успешных программ решения задач для того, чтобы понять, что имеет место при выработке решения и проверке его и как программы сокращают задачи до приемлемых разме- 664 Тема 16. Основные теоретические подходы к изучению познания ров. Мы используем термин «эвристический» при определении любого принципа или устройства, которые вносят вклад в сокращение среднего числа проб при решении. Хотя еще не существует общей теории эвристики, мы можем иметь дело с некоторыми эвристиками, применяемыми при решении человеком сложных задач. Эффективные генераторы Даже когда группа Р велика, как это обычно бывает в сложных процессах решения, генератор решений может рассматривать на ранней стадии те части Р, которые скорее всего бесплодны. Например, многие проблемы имеют следующую форму: группа решений включает все элементы Р со свойством А, свойством В и свойством С. Нет генераторов, которые будут создавать элементы, обладающие всеми тремя свойствами. Однако могут существовать генераторы, которые создают элементы, обладающие двумя какими-то свойствами из этих трех. То, какой генератор будет выбран, зависит от того, какие требования наиболее сложны, и от относительной стоимости выработки решений. Вели большинство элементов отвечает А, тогда обосновано создание элементов С и В, так как можно ожидать, что А скоро появится. Если элементы с А редки, лучше создавать элементы, которые имеют свойство А. «Логик-теоретик» дает нам четкий пример этого типа эвристики. Вспомним, что задача «логика-теоретика» заключается в поисках доказательств. Доказательство представляет собой список логических выражений, удовлетворяющих следующим требованиям. A. Начало списка включает известные теоремы (любое число их). B. Все другие выражения в списке являются прямыми и истинны C. Последнее выражение списка является выражением, которое до Наиболее эффективным является генератор, который отвечает условиям В и С. Если фиксируется последнее выражение как желаемое, то создаваемые списки включат только действительные выводы В, ведущие к последнему выражению. Проблема решена тогда, когда создан список, отвечающий условиям А, т.е. выражениям, которые все являются теоремами. При этом типе генератора элементы создаются как бы «с конца», идя от желаемого результата по направлению к данным задачам. Этим путем идет «логик-теоретик» при открытии доказательств. Конкретная ситуация, которую мы встречаем здесь (множество возможных начальных точек в противоположность одной конечной) и которая предрасполагает к работе в направлении от конца к началу, является сравнительно распространенной. Ньюэлл Л., Шоу Дж. С., Саймон Г.А., Моделирование мышления... Простые селективные эвристики Когда субъект, решающий задачу, сталкивается с группой альтернатив, обычный эвристический прием состоит в выявлении с самого начала возможных путей при помощи относительно доступного текста. Чтобы определить ценность этого приема, рассмотрим лабиринт, содержащий т альтернатив в каждой узловой точке и имеющий длину к. Если есть один правильный путь к цели, то для того, чтобы найти его при помощи случайных поисковых действий, потребуется в среднем 1/2т* проб. Если эвристический тест позволит отбросить как бесполезные половину альтернатив в каждой узловой точке, тогда при случайном поиске с применением этой эвристики в среднем потребуется только 1/2-(1/2тк) проб. Это сокращает число проб в отношении 2*, что составит при лабиринте, включающем лишь 7 звеньев, число 128, а при лабиринте в 10 звеньев — свыше тысячи. «Логик-теоретик» использует ряд таких эвристик выбора. С помощью одной эвристики он отделял новые выражения, которые казались «недоказуемыми» на основе определенных критериев правдоподобия; с помощью другой эвристики отсеивались выражения, которые казались «недоказуемыми» на основе определенных критериев правдоподобия; с помощью другой эвристики отсеивались выражения, которые казались слишком сложными в плане наличия в них большого числа отрицательных знаков. Эти две эвристики сократили число проб, потребовавшихся для нахождения решения, в 2, 7 раза. Стратегии при выработке решения Обычно информация, необходимая для выбора подходящих путей, поступает лишь при осуществлении поиска. Обследование путей дает нам точки, обозначающие «холоднее» — «горячее», чем мы и руководствуемся при дальнейшем поиске. Мы уже приводили простой, но эффективный пример неисправного сейфа. Существуют, в общем, два различных способа описания любой конкретной точки выбора в проблемном лабиринте. В шахматах, например, конкретная позиция может быть определена путем обозначения (словесно или при помощи диаграммы) того, какие фигуры занимают ту или иную клетку доски. С другой стороны, позиция может быть определена при помощи выделения последовательности ходов, которые ведут к ней от начальной позиции. Мы будем называть первый метод определения элемента Р спецификацией путем описания состояния, второй метод — спецификацией путем описания процесса. 666 Тема 16. Основные теоретические подходы к изучению познания Когда игрок рассматривает конкретный ход, он может построить в своем воображении картину доски после того, как ход осуществлен. Он может затем исследовать это новое состояние для того, чтобы выяснить, какие черты его благоприятны, какие — неблагоприятны и какие возможные продолжения оно подсказывает. Таким образом он исследует несколько путей в лабиринте (если он хороший игрок, его эвристический прием обычно натолкнет его на обследование важных путей), и он может проанализировать достаточное число ходов, для того чтобы быть в состоянии прямо оценить достигнутые конечные позиции. Мы отмечаем, что сильнейшие шахматисты не обследуют больше, чем несколько десятков продолжений, а те, в свою очередь, на глубину порядка от нескольких до 10 и более ходов. Способность шахматиста-мастера глубоко анализировать партию, столь удивляющая, новичка, возникает из способности первого анализировать очень избирательно, не пропуская в то же время важные варианты. «Сигналы», которые он отмечает, неуловимые для новичка, очевидны для него. Эвристики планирования Другой класс широко применимых эвристик, увеличивающих избирательность генераторов решений, составляют эвристики, которые идут под рубрикой «планирование». Рассмотрим лабиринт длиной в q шагов с т альтернативами в каждой точке выбора. Предположим, что вместо сигналов, обозначающих правильный путь в каждой точке выбора, есть лишь сигналы в каждой второй точке. Тогда задача прохождения лабиринта легко может быть расчленена на ряд подзадач достижения тех точек выбора, которые отмечены сигналами. Такая группа подзадач составит план. Вместо начальной задачи прохождения лабиринта длиной в к шагов перед субъектом, решающим проблему, встанет задача прохождения {к/2) лабиринтов, каждый из которых длиной в два шага. Ожидаемое число путей, которые должны быть обследованы при решении первой проблемы, будет, как и раньше, равно l/2mh. Ожидаемое число проб при решении второй проблемы 1/2 (k/2) m2. Если начальный лабиринт будет иметь в длину 6 шагов при двух альтернативах в каждой точке, среднее число требуемых проб будет сокращено с 32 до 6, к которым, в свою очередь, следует добавить усилия, необходимые для того, чтобы найти план. Мы используем подобный метод планирования, когда путешествуем. Сначала мы набрасываем общий маршрут от города к городу, затем, имея в виду эти города как подцели, мы решаем подзадачи, как попасть из одного в другой. Ньюэлл Л., Шоу Дж.С., Саймон Г.А. Моделирование мышления…
|