WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     || 2 | 3 | 4 |
-- [ Страница 1 ] --

.. АМОСОВ Искусственный интеллект сегодня Системы и модели Восприятие и память Действия с моделями Взаимодействие моделей в интеллекте Функциональный акт Сознание и подсознание

Интеллект уровня человека Искусственный интеллект в человеческом обществе На пути Проект к интеллекту алгоритмической выше человеческого модели интеллекта АЛГОРИТМЫ РАЗУМА Киев НАУКОВА ДУМКА 1979 Возможно ли создать искусственный ин­ теллект? Будет ли он способен к полноцен­ ному мышлению и творчеству? Кем пред­ стоит ему стать — помощником или сопер­ ником человеческого разума? Эти вопросы давно уже обсуждаются многими учеными.

Свою точку зрения по ним высказывает академик АН УССР.. Амосов. Автор известен своими работами в области модели­ рования мышления и поведения. В книге из­ лагаются его идеи в их дальнейшем разви­ тии. Анализируются возможные пути по­ строения искусственного интеллекта. Поды­ тожен опыт отдела биокибернетики Институ­ та кибернетики АН УССР по моделированию интеллекта и личности.

Рассчитана на широкий круг специали­ стов в области кибернетики, психологов, а также на всех интересующихся вопросами современной науки.

Ответственный редактор А. М. КАСАТКИН Редакция научно-популярной литературы 30501- А БЗ-5-5-79 М221(04)- © Издательство «Наукова думка», Предисловие Искусственный интеллект можно определить как свойство цифровой вычислительной машины или сети нейро ноподобных элементов реагировать на информацию, поступающую на ее входные устройства, почти так же, как реагирует в тех же информационных условиях некоторый задуманный или конкретный человек. Машина и моделируемый человек одинаково по своим результатам распознают образы и ситуации, решают логические и другие задачи, принимают одни и те же решения в конфликт­ ных ситуациях, то есть, кратко говоря, демонстрируют одинако­ вые результаты мышления. Если машина имеет достаточный на­ бор гибких выходных органов, то машина и человек совершают одинаковые движения, что в целом приводит к одинаковым ре­ зультатам в поведении. В идеальном случае эмоциональная окра­ ска результатов мышления и поведения у машины-модели и чело­ века — объекта моделирования — также должна быть одина­ ковой.

Подобным же модельным образом можно определить и интел­ лект коллектива либо целого общества людей. Устранение в ре­ зультате обучения модели ошибочных реакций позволяет поста­ вить задачу о построении искусственного интеллекта, более со­ вершенного, чем интеллект человека. Вопросы создания «сверх­ интеллекта» рассматриваются в данной книге.

Требование равных для машины и моделируемого человека результатов мышления и поведения является общепринятым сре­ ди ученых при определении искусственного интеллекта. Но отно­ сительно способов достижения этого равенства существуют разно­ гласия. Некоторые ученые допускают, чтобы машина получала те же результаты только по своим, более свойственным ей алго­ ритмам. К таким машинным алгоритмам относятся программы, основанные на последовательном опробовании многих вариантов решения по целесообразно выбранным критериям — принцип са­ моорганизации модели. Другие же ученые (к ним принадлежит и автор этой книги академик АН УССР.. Амосов) считают, что алгоритмы, по которым получаются одинаковые результаты мышления и поведения у машины и моделируемою объекта, дол­ жны совпадать. Способ открытия таких алгоритмов интеллекта — эвристический. Он основан на разновидности имитационных мето­ дов моделирования — эвристическом моделировании, разработан­ ном.. Амосовым для моделирования разнообразных слож­ ных систем.

Характерной чертой имитационных методов моделирования является то, что они исходят из общих представлений автора мо­ дели об объекте. Экспериментальные данные или опытная про­ верка не требуются принципиально. Так, например, при построе­ нии модели трудовой активности личности достаточно указать об­ щий характер нелинейных зависимостей типа «труд—плата», «плата—чувство», «чувство—труд» и др.

Подобно тому как это делается при имитационном динамиче­ ском моделировании Дж. Форрестера, характеристики элементов системы задаются автором модели машине, которая, решая полу­ ченную ею систему уравнений при различных начальных и гра­ ничных условиях, демонстрирует на дисплее возможные «сцена­ рии» — варианты происходящих в системе процессов. При этом подтверждается, что система вовсе не является простой суммой ее элементов, так же как и решение системы уравнений не яв­ ляется суммой решений каждого из них.

Эвристическое моделирование.. Амосова, в отличие от ди­ намического моделирования Дж. Форрестера, оперирует в основ­ ном графическими нелинейными характеристиками элементов, а не их дифференциальными уравнениями, хотя использование по­ следних не исключается. Это допустимо, так как изучаются толь­ ко постоянно действующие установившиеся зависимости (об огра­ ничениях области рассмотрения, принятой в книге, будет сказано ниже). Наблюдающийся сейчас несомненный успех применения и быстрое распространение имитационных методов моделирова­ ния объясняются удачным распределением «обязанностей» между человеком и машиной. Человек хорошо придумывает поэлемент­ ные характеристики, а машина хорошо обобщает их в единую си­ стему уравнений, решая которую получает искомые результаты.

Слабой стороной имитационных методов моделирования является их субъективный характер. Если изменятся представления автора модели о характеристиках элементов объекта, то изменятся и модели. К тому же практически сколько авторов — столько и мо делей. Двух авторов с совершенно одинаковыми представлениями об объекте найти трудно. Здесь уместно напомнить читателю о существовании других, объективных методов моделирования, та­ ких, как метод эвристической самоорганизации моделей, основан­ ных на обработке небольшой таблицы опытных данных. Различие состоит в том, что имитационные методы моделирования, не тре­ буя опытных данных, позволяют получить модели некоторых обобщенных объектов, тогда как экспериментальные методы дают модель конкретной личности, коллектива и общества.

В данной книге рассматривается имитационное моделирова­ ние указанных объектов в постановочном плане. На первых по­ рах искусственный интеллект может не достигать полного совпа­ дения модели и объекта. Моделирование вначале может решать только часть интересующих нас актуальных задач.

Основные ограничения следующие: динамика процессов вы­ бора цели (целеполагания) и образования «установки» не рассма­ тривается;

цель объекта и система правил поведения считаются заданными или уже выработанными;

эмоции не моделируются;

рассматривается только неслучайная, регулярная составляющая психологических процессов;

динамика не учитывается, поскольку уравнения элементов системы задаются как установившиеся ха­ рактеристики.

В книге оговаривается, что эмоции человека в описываемых алгоритмах пока не моделируются. Кроме того, моделирование учитывает только так называемую регулярную составляющую ре­ зультатов мышления и поведения, обусловленную воздействия­ ми — «стимулами». При этом учитываются как точка зрения би хевиористических теорий (закон «стимул—реакция»), элементы гештальт-психологии (учет «врожденной», то есть заложенной при создании машины образной информации), так и предыстория одновременного взаимодействия многих элементов (обучение).

Случайная составляющая результатов моделированию не подле­ жит. Поясним это. Мышление, как известно, связано с процеду­ рой постановки задач и принятия решений. Каждое из решений происходит в условиях воздействия на личность многих призна­ ков (термины «признак», «стимул» и даже «критерий» в данном контексте являются синонимами). В области задачи, где все при­ знаки действуют согласованно, в одном направлении, решение является регулярным, однозначным, определенным. Например, если все рецепторы свидетельствуют о том, что распознаваемая буква есть буква А, то другая классификация буквы исключает­ ся. Отметим, что нас будет интересовать область случайных или нерегулярных решений задач, где действуют противоречивые при­ знаки или стимулы. Грубо говоря, если сумма противоречивых стимулов с учетом их важности близка к нулю, например часть рецепторов утверждает: «буква А», а другая часть — «буква Б», то мозг принимает «чисто» случайные, равновероятные решения.

Именно в этой области проявляется так называемая свобода вы­ бора. В книге указывается, что в случае нерегулярности, соглас­ но учению о доминанте, происходит всемерное усиление внима­ ния и разрешающей способности, но если и оно не помогает, то в действие вступает случай.

Предсказать случайное решение принципиально невозможно, так же как нельзя регулярно угадывать результат тиража «спортлото» или предвидеть, на какую сторону упадет подбро­ шенная вверх монета. Область случайных решений поддается моделированию только в том смысле, что и в модели можно предусмотреть генератор случайных движений. Однако направле­ ние случайного движения регулярно угадывать нельзя. Все ска занное хорошо согласуется с известной теорией многокритериаль­ ного управления Парето (1909 г.), в соответствии с которой в об ласти эффективных решений, где критерии противоречат друг другу, математика, а следовательно, и моделирование бессильны.

Здесь для принятия решений обычно привлекаются эксперты, ко­ торые знают, что же нужно выбрать. Машина может только су­ щественно помочь выбору, используя дополнительно процедуру прогнозирования будущего для каждого из входящих в область решений Парето (журн. «Автоматика», 1978, № 2). Добавление процедуры прогнозирования можно использовать и для сокраще­ ния области случайных решений человека. Область, где моделиро­ вание возможно, при этом расширяется. Вопрос о принципиаль­ ной возможности моделирования сводится к выяснению соот­ ношения области регулярности и области случайного выбора в актуальных задачах. Профессор В. В. Налимов, например, утверждает, что в интересующих нас задачах биологии и социо­ логии участвует такое множество противоречивых воздействий, что моделирование невозможно (журн. «Автоматика», 1977, №4).

Конечно, это является преувеличением... Амосов исходит из того, что область регулярных неслучайных решений при моде лировании интеллекта достаточно содержательна, и ограничивает свое рассмотрение этой областью.

Привлечение идей Парето позволит в какой-то мере согла­ совать позиции сторон в научной дискуссии об эксперименталь­ но-вербальном, психологическом и математическом информаци­ онно-кибернетическом подходах в исследовании интеллекта. В ча­ стности, утверждение психологов о том, что в психике человека имеется принципиально не поддающаяся моделированию область решения задач (см., например, Тихомиров О. К. Развитие вычи­ слительной техники и психологическая наука,— Вестник Москов­ ского ун-та. Психология, 1977, № 2, 3, 4), с учетом теории Паре то получает ясное математическое объяснение. Эксперименталь­ ный характер моделирования обеспечивается рядом методов кибернетического подхода, что также соответствует требованиям психологов.

Простейшим применением излагаемой в данной книге теории моделирования интеллекта является создание роботов, управляе­ мых по вычислительным программам, содержащим проявления интеллекта. Созданный под руководством автора книги в отделе биокибернетики Института кибернетики АН УССР робот — трех­ колесная тележка ТАИР — обходит препятствия и находит опти­ мальный путь к цели. Наблюдения за интеллектуальными робо­ тами пока являются своеобразным и, пожалуй, единственным ме­ тодом экспериментальной проверки всей теории в целом: поведе­ ние роботов должно быть «интересным» и «умным».

Излагаемая в книге теория интеллекта в целом далеко выхо­ дит за пределы задачи управления роботами и предназначена для моделирования поведения и интеллектуальной деятельности как отдельной личности, так и коллектива или даже обществен­ ной системы. Робот в виде нейроноподобной аналоговой М-сети с положительной обратной связью только иллюстрирует возмож­ ность реализации значительно более общей идеи.

.. Амосов смело ставит вопросы об имитационном объяс­ нении на основе его моделей самых сложных вопросов психоло­ гии человека — таких, какие возникают при решении задач, ис­ следовании подсознания, сновидений, «озарений» и других слож­ ных явлений.

В заключение автор высказывает сомнение в том, удалась ли ему книга. Я уверен в ее большой пользе, в том, что она очарует не только кибернетиков, но и психологов, воспринявших имита­ ционный метод моделирования, а также всех тех, кого интере­ суют тайны регулярного поведения живого и искусственного ин­ теллектов. Что касается упомянутых выше значительных ограни­ чений области исследования, то они будут поняты как необходи­ мые при первопроходческом характере работы.

Член-корреспондент АН УССР А. Г. ИВАХНЕНКО Введение Механизмы разума интересуют уче­ ных разных специальностей. Для психологов и физио­ логов — это теория их науки, для кибернетиков — пути создания искусственного интеллекта (ИИ). В предлага­ емой вниманию читателя книге я попытаюсь дать изложение представлений о этой проблеме — как ре­ зультат развития работ, ведущихся в отделе биокибер­ нетики Института кибернетики АН УССР начиная с 1962 г. Новые идеи значительно отличаются от ранее опубликованных [1, 3].

Слово «алгоритм» не случайно введено в название книги: мне представляется, что есть возможность «разложить по полочкам» самые сложные проявления интеллекта — и даже с перспективой на его развитие выше уровня человеческого разума. Видимо, я не смо­ гу убедить скептиков — для этого нужно воспроизве сти алгоритмы интеллекта в программах. К сожале­ нию, на этом пути стоят большие трудности. Может быть, излагаемые идеи как-то помогут энтузиастам проблемы? Предупреждаю, что предмет исключитель но сложен для понимания, поскольку лежит на стыке физиологии, психологии, техники и даже философии.

Для упрощения я буду широко пользоваться схемами.

Интеллект определяется как совокупность средств и способов управления сложными системами путем опе­ рирования с их моделями, направляемого критериями Рис. 1. Схема сетевого интеллек­ та (СИ):

Об — объект управления;

Рц — рецеп­ торы;

Э — эффекторы;

ВП — кратко­ временная память;

ПМ — первичная модель;

ПП — постоянная память;

РМ — распознанная модель;

Кр — кри­ терии;

МД — модель действия.

оптимальности управления. Современная наука и тех­ ника дают возможность воспроизводить модели и дей­ ствия с ними техническими средствами и таким обра­ зом отделить разум от мозга, с которым его обычно связывают. Отличие приведенного определения от мно­ жества других состоит в том, что оно подчеркивает это последнее обстоятельство.

Таким образом, говоря об интеллекте, мы будем иметь в виду эту совокупность средств и способов управления, независимо от того, реализована ли она в биологических системах или при помощи искусствен­ но созданных, технических средств. Такое употребле­ ние термина «интеллект» не является общепринятым.

Оно, однако, тесно связано с основной идеей этой кни­ ги. В тех отдельных случаях, когда речь пойдет толь­ ко о естественном интеллекте человека, это будет спе­ циально оговариваться. Что же касается термина «ис­ кусственный интеллект» (ИИ), то он, как это и при­ нято, будет использоваться для обозначения различно­ го рода технических реализаций, моделей интеллекта.

Остановимся на основных понятиях, с тем чтобы постепенно войти в круг обсуждаемых вопросов.

Прежде всего нужно выделить два противоположных подхода к моделированию интеллекта. Условно их можно назвать сетевым и алгоритмическим. Соответ­ ственно будем различать и два типа моделей — сете­ вой (СИ) и алгоритмический (АИ) интеллекты.

Самая простая схема сетевого интеллекта показана на рис. 1. Объект управления (Об) представляет собой некую сложную трехмерную структуру. Она восприни­ мается датчиком — рецепторами Рц (например, глаза­ ми) и передается сигналами в «мозг», где превращает­ ся в первичную модель ПМ. В первом приближении ПМ представлена плоской двухмерной структурой, составленной из возбужденных, активированных эле­ ментов некоторой сети — условного «рецепторного по­ ля». Объект распознается путем наложения ПМ на множество фигур из неактивных элементов, объеди Рис. 2. Схема алгоритмического интеллекта (АИ):

Об — объект управления;

Рц — рецеп­ торы;

ПМ — первичная структурная модель;

П — преобразователь;

ПМ — первичная цифровая модель;

РМ — распознанная модель;

Кр — критерии;

ДП — длительная память;

МД — циф­ ровая модель действия;

П — преобра­ зователь;

Э — эффекторы.

ненных «проторенными» связями. Эти неактивные модели-фигуры представляют собой модели уже изве­ стных объектов и составляют постоянную память ПП.

В соответствии с принципом действия СИ элементы, составляющие постоянную и временную (или актив­ ную) память ВП,— одни и те же;

они отличаются только уровнем активности. Наложением первичной модели на сеть выбирается и активируется одна рас­ познанная модель — фигуры РМ, и от нее включается управляющее воздействие на объект. Это воздействие представлено моделью действия МД, управляющей эф­ фекторами Э. Распознанная модель объекта связана с несколькими моделями действий;

выбор одной, нуж­ ной, определяется критерием Кр. Активированная от РМ и Кр модель действий передает активность на эф­ фекторы, в которых управляющие сигналы превра­ щаются в механическую энергию управляющего воз­ действия. Таким образом, в сетевом интеллекте «дей­ ствия с моделями» представлены изменением актив­ ности элементов сетей, в которых заложены модели.

На рис. 2 показана схема алгоритмического интел­ лекта. Начало его функционирования такое же, как в СИ,— в результате работы рецепторов Рц формиру­ ется первичная структурная модель ПМ1 в виде та­ кой же плоской двумерной структуры. Однако она тут же считывается преобразователем П1 превращаясь в линейную, одномерную модель из набора цифр — ПM2. Все последующие действия осуществляются с этой моделью. Распознавание ПМ2 состоит в последо­ вательном сравнении ее с записанными тем же кодом моделями-эталонами из длительной памяти ДП, где находится распознанная модель РМ. По этой модели выбирается модель действия МД. Процесс этот осуще­ ствляется путем перебора моделей в длительной памя­ ти под управлением критерия Кр. Модель действия пе­ редается на преобразователь П2, где цифровой код превращается в управляющие сигналы эффекторов Э и через управляющие действия — на объект Об.

Основное различие между СИ и АИ состоит в струк­ туре памяти и вытекающих отсюда разных действиях с моделями. Однако в обоих типах интеллекта сохра­ няется принцип управления моделями со стороны кри­ териев управления через их активацию.

Создание СИ и АИ предполагает использование раз­ ных методологических подходов к моделированию одного и того же объекта — разума человека. Каждый из подходов имеет свои сильные и слабые стороны.

Поэтому при построении реальных систем ИИ может оказаться целесообразным представление некоторых функций разума в виде сетевых моделей, а некото­ рых — в виде алгоритмических. Общий принцип здесь таков: чем ниже уровень моделируемой функ­ ции в общей иерархии функций разума, тем вероятнее, что при ее воспроизведении в ИИ наиболее эффектив­ ным окажется сетевой метод.

Дело в том, что реализация многих функций ниж­ него уровня (как, например, нахождение распознанной модели по первичной модели — см. рис. 2) связана с осуществлением больших переборов в длительной памяти. Такие переборы особенно эффективно осущест­ вляются в сетевых моделях, реализующих параллель­ ные процессы переработки информации. В то же вре­ мя сетевые модели имеют другие недостатки, ограни­ чивающие область их применения. На сравнительном анализе достоинств и недостатков сетевых и алгорит­ мических моделей я еще буду неоднократно останавли­ ваться.

Вопросам создания и исследования свойств СИ посвящен ряд работ, выполненных под руководством автора. Получены конкретные результаты, краткий об­ зор которых содержится в первом разделе книги. Все дальнейшее изложение я посвящу описанию принци­ пов построения АИ, не делая больше специальных оговорок, что при практической его реализации ряд функций может быть представлен при помощи сетевых структур.

Искусственный интеллект сегодня Основные этапы и направления исследований Не буду даже пытаться охватить всю проблему искусственного интеллекта. Книга задумана как изложение собственной гипотезы об общих меха­ низмах или алгоритмах интеллекта, которым равно подчиняются разум животных, человека, коллектив­ ный разум общества и которые, как мне кажется, обя­ зательны для любой его модели.

Искусственный интеллект стал особой областью зна­ ния. Существуют специальные комитеты, координиру­ ющие исследования по этой проблематике, издается несколько журналов, созываются международные кон­ ференции. С одной стороны, предмет этих исследований примыкает к теоретической кибернетике, с другой — к технике автоматов и роботов, есть и психофизиологи­ ческий аспект проблемы. Одно скажу сразу: искусст­ венный интеллект не создан. Векселя, которые выдала кибернетика в начале своего развития, претендуя на решение почти всех интеллектуальных задач, остались неоплаченными. Более того — наметился явный песси­ мизм во взглядах на саму возможность воспроизвести разум человека. Сошлюсь на книги Дрейфуса. Тем не менее большинство ученых-кибернетиков смотрит в бу­ дущее с надеждой, хотя теории интеллекта пока нет и все предлагаемые модели представляют собой воспроиз­ ведение частных механизмов мышления. Для того что­ бы дать представление о состоянии дела, приведу очень краткую сводку работ последнего времени.

С самого начала основные надежды кибернетики были связаны с моделированием работы мозга. Было ясно, что здесь можно идти двумя путями — моделиро­ вать нейронные сети и воспроизводить алгоритмы мы­ шления.

Лучшие результаты по моделированию нейронных сетей были получены в работах школы У. Мак-Калло ха [7]. Выяснилось, однако, что сети из формальных нейронов не способны воспроизводить сложные функ­ ции мозга. Неэффективными оказались также попытки использовать такие сети для управления роботами [9].

Большой интерес вызвали работы Ф. Розенблата, кото­ рый сформулировал ряд принципов нейродинамики мозга и использовал их для построения персептро нов — устройств для распознавания образов. Однако строгий анализ, осуществленный М. Минским и С. Пей пертом [8], показал ограниченность существующих здесь возможностей. Таким образом, к началу 70-х гг.

общий кризис нейронного подхода стал очевидным.

Одновременно проводились исследования по алго­ ритмическому моделированию мышления. Оcновные до­ стижения в этой области связаны с именами А. Нью эла и Г. Саймона [12]. Их работы по созданию GPS (общего решателя проблем) привели к формированию отдельного направления — эвристического программи­ рования, влияние которого на исследования по ИИ прослеживается до сих пор. Однако в целом это на­ правление исчерпало свои возможности уже к началу текущего десятилетия. При этом выяснилось, что оно не позволяет приблизиться к сколько-нибудь общей теории мышления, хотя и может обеспечить решение отдельных прикладных задач.

Кризис обоих направлений привлек внимание к ра­ ботам, начатым еще в 50-е гг. и связанным с использо­ ванием формальных методов для решения сложных, «интеллектуальных» задач (доказательство теорем, игры и т. п.). К этому времени здесь был получен ряд интересных результатов. Среди них следует отметить разработку А. Сэмюэлем [11] программы для игры в шашки, которая до сих пор является одной из лучших игровых программ. Работы этого направления и со­ ставили основу нового раздела кибернетики, который занимается проблемой искусственного интеллекта.

В начале 70-х гг. на исследования по ИИ оказывали большое влияние результаты, полученные в области математической логики Дж. Робинсоном. Развитый им метод резольвенций позволил строить мощные процеду­ ры доказательства теорем. Это было использовано для построения нового класса программ, решающих слож­ ные задачи. Наибольшую известность среди них полу­ чила разработанная в Стенфордском исследовательском институте программа STRIPS [14], решающая задачи планирования действий робота. Методы математиче­ ской логики составили также основу теории поиска решений, главные положения которой обобщены в ра­ ботах Н. Нильсона. Однако использование этих методов для широкого круга задач показало их низкую эффек­ тивность, обусловленную в основном большим объемом и громоздкостью соответствующих программ для ЦВМ.

Так что к 1975 г. наметилось разочарование и в этом подходе.

Попытки преодолеть трудности, сопутствующие разработке больших программ, привели к появлению новых методов автоматизации программирования и со­ зданию специальных проблемно-ориентированных язы­ ков. Большие достижения здесь связаны с работами К. Хьюитта по построению языка PLANNER [15, 16], который послужил основой для целого ряда дальней­ ших разработок в этом направлении.

Использование новых языков программирования обеспечило прогресс в сравнительно новой для ИИ области — имитации речевого поведения человека. Пер­ вые значительные успехи здесь были получены Т. Ви­ ноградом [5], разработавшим систему диалогового управления роботом с помощью естественного языка.

Начиная с 1973—1975 гг. проблемы естественной речи привлекают все большее число исследователей. Разра­ батываются проблемы понимания [13], представления знаний, грамматического анализа и др. Проблема по­ нимания активно исследуется также и в другой области ИИ — распознавания зрительных образов. Широко известны работы М. Минского, развивающего теперь новую теоретическую концепцию восприятия, связан­ ную с представлениями о «системах фреймов».

В целом в последние годы опять намечается тен­ денция к использованию в программах ИИ знаний о поведении и мышлении человека, хотя сама задача моделирования человека прямо не ставится.

Меня больше всего интересует как раз эта задача — моделирование человека. Естественно было бы обра­ титься к нейрофизиологии и психологии. Именно эти науки должны описать физиологические механизмы психических явлений и дать рекомендации по их моде­ лированию. Возможно, работающим здесь ученым ка­ жется, что они знают, как мыслят животные и человек, но я не мог уяснить этого из их книг. Не нашел я и возможности переложить их словесные формулировки на цифровые модели. Впрочем, и другие кибернетики тоже не смогли перевести физиологию мозга в модели.

Разумеется, никто не будет отрицать, что именно нейрофизиологам принадлежат основополагающие от­ крытия, благодаря которым стали возможными попыт­ ки строить модели. Перечислю несколько основных.

Первое — учение И. М. Сеченова о возбуждении и торможении. Разный уровень активности нейрона — от полного «молчания» до максимального возбуждения — это важнейший механизм взаимодействия моделей.

Открытие И. П. Павловым условных рефлексов и условных связей дало объяснение обучаемости и само­ организации. Учение А. А. Ухтомского о доминанте позволяет предположить механизм превалирования главной модели над всеми остальными. Если к этому добавить работы о ретикулярной формации, то, вместе взятые, они подсказали идею центрального регулирова­ ния активности коры — систему усиления-торможе­ ния (СУТ) и механизм сознания и подсознания.

3. Фрейд достаточно обосновал большое значение под­ сознания в психической жизни человека. Опыты X. Дельгадо и Н. П. Бехтеревой со вживленными элек­ тродами показали, как центры чувств управляют по­ ведением, являясь источниками активности для моде­ лей коры. Наконец, исследования Н. П. Бехтеревой и др.

обнаружили так называемый «код слов», то есть на­ личие самих моделей слов речи, которые, видимо, запечатлены в нескольких или даже многих ансамблях нейронов. Следует также упомянуть П. К. Анохина, предложившего общие принципы управления физио­ логическими процессами.

Простое перечисление основных идей нейрофизио­ логии показывает, что наша гипотеза об алгоритме интеллекта является лишь одним из возможных вари­ антов их компоновки в единое целое. Это сделано для того, чтобы попытаться применить метод эвристиче­ ского моделирования для изучения мышления и пове­ дения. Если нейрофизиология идет к психике «снизу» путем анализа, от механизмов нейронов и их ансамб­ лей, то кибернетическое моделирование идет «сверху», путем синтеза. Мне представляется, что второй подход имеет право на научность. Не уверен, что модели уже сейчас предложат физиологии новые идеи для экспе­ риментов, но для создания искусственного интеллекта они дадут достаточно материала. К сожалению, попыт­ ки заинтересовать моделями физиологов и психологов пока терпят неудачу. Они кажутся им слишком прими­ тивными в сравнении с огромной сложностью мозга.

Что ж, против этого пока нечего возразить. Нужны более доказательные модели, способные продемонстри­ ровать как можно больше феноменов поведения чело­ века. Именно к этой цели и направлены работы отдела биокибернетики Института кибернетики АН УССР.

Приведу их краткую историю.

Некоторые результаты моделирования сетевого интеллекта В 1963—1964 гг. мною был сформу­ лирован первый вариант гипотезы о механизмах мыш­ ления в обобщенном виде. В 1965 г. эта гипотеза была опубликована в книге «Моделирование мышле­ ния и психики». Два года спустя книгу переиздали в США. Последующее развитие идей нашло отражение в монографии «Искусственный разум», напечатан­ ной в 1969 г.

Модели, реализованные на ЦВМ. В 1963 г. мы на­ чали серию работ по созданию моделей интеллекта, построенных на принципе семантических сетей с СУТ.

Такие сети были названы термином «М-сети», а моде­ ли, построенные на них,— «М-автоматами». В после­ дующие годы создавались новые варианты моделей, однако все они основывались на использовании сете­ вого интеллекта с СУТ. Принцип его действия уже был описан: М-сеть представляет собой систему элемен­ тарных моделей (i-модели), каждой придано опре­ деленное значение, например модель — объект среды, модель действия, чувства, отношения и др. Модели имеют статические и динамические характеристики, в которых отражена величина уровня активности и зависимости от времени- и «входных» раздражите­ лей — то есть от величины некоей энергии, поступаю­ щей по связям с других моделей или от рецепторов.

У первых моделей связи задавались жестко, у после­ дующих проходимость связей менялась в зависимости от использования — тренировки. Это же относится к характеристикам возбуждения i-моделей. Исследова­ ние модели состоит в пересчете на ЦВМ уровня актив­ ности всех элементарных моделей за условный такт времени. СУТ выбирает одну, самую активную модель и еще дополнительно ее усиливает согласно своим ха­ рактеристикам, а все остальные тормозит. «Входами» М-автомата являются внешние объекты, «выхода­ ми» — его действия, направленные на среду. Все это типично для СИ.

Первая модель — РЭМ отображала условный сю­ жет путешествия некоего «искусственного субъекта» в среде, которая содержала полезные и опасные для него объекты. Мотивы поведения субъекта определя­ лись ощущениями усталости, голода и стремлением к самосохранению. Субъект изучал среду, выбирал цель движения, строил план достижения этой цели и затем реализовал его, выполняя действия-шаги, сравнивая результаты, получаемые в ходе движения, с запланированными, дополняя и корректируя план в зависимости от складывающихся ситуаций.

М-сеть РЭМа содержала 90 i-моделей, около связей и была способна воспринимать три типа объек­ тов (входных параметров). Среда могла содержать до 400 объектов, произвольно расположенных на пло­ скости. РЭМ выполнял восемь действий и был постро­ ен как неполный М-автомат, иными словами, кроме М-сети с заданной на ней СУТ, он содержал функцио­ нирующие сопряженно с М-сетью алгоритмические структуры. Большинство из них осуществляло функции планирования. РЭМ был реализован в виде комплекса программ для ЦВМ М-220. Программы содержали свыше 3000 рабочих команд. Время просчета одного такта функционирования М-сети (единицы автомат­ ного времени) — 1,5 мин. В течение каждого такта производился расчет величин возбуждений и парамет­ ров характеристик всех i-моделей, а также параметров всех связей М-сети (эта процедура названа пересче­ том). Последовательность операций, производимых за один такт, такова: восприятие информации из внеш­ ней среды, пересчет, выбор СУТ наиболее возбужден­ ной i-модели, принятие на основании полученной информации решения о взаимодействии со средой, выполнение этого решения. Эксперименты с РЭМом включали просчеты его состояний и регистрацию ре­ шений на протяжении 10—20 тактов.

Результаты исследования РЭМа показали перспек­ тивность использования М-сетей как при построении моделей процессов мышления, так и при разработке систем типа «искусственный разум», способных к са­ мостоятельному эффективному функционированию в сложных условиях. Выяснилась также целесообраз­ ность дальнейшего проведения работ по изучению возможностей аппарата при построении более мощных моделей, а также исследования весьма важного в практическом и теоретическом отношениях вопроса об адаптивных возможностях М-автоматов.

Затем была построена и исследована новая мо­ дель — МОД. При его создании сохранялись как об­ щая схема постановки задачи, так и принципиальная структура выбранного ранее условного сюжета моде­ лирования. МОД также был разработан в виде непол­ ного М-автомата. При этом его алгоритмическая часть отображала процессы планирования, связанные с предварительной организацией движения, а структур­ ная — процессы принятия решений в ходе непосред­ ственного взаимодействия со средой. Обе части целе­ сообразно рассматривать как независимые модели мыслительных процессов, между которыми может быть организовано постоянное взаимодействие. Эти модели названы соответственно МОД-1 и МОД-2.

МОД-1 вырабатывал план деятельности М-автомата в среде в виде совокупности подцелей движения, ос­ новной цели и ожидаемых (предвидимых) состояний автомата в ходе движения. Алгоритмы восприятия внешней информации в МОД-1 моделировали процес­ сы зрительного восприятия человека, построения возможных вариантов плана, их оценки, синтеза окон­ чательного варианта, его разбиения на отдельные этапы, выбора объектов-ориентиров для каждого из этапов, моделировали процессы принятия решения че­ ловеком в условиях отсутствия полной информации о среде.

МОД-1 являлся неполным М-автоматом, основной объем его функций реализовался алгоритмическими структурами. М-сеть здесь содержала 62 i-модели, около 1000 связей и использовалась в основном для представления мотивационной сферы модели. МОД- был реализован в виде комплекса программ для ЦВМ М-220. Программы включали до 15 000 команд, их просчет занимал 20—30 мин машинного времени.

Среда модели могла содержать до 625 объектов (это максимальное число). Каждый из объектов задавался упорядоченным набором из 8—10 признаков (входных воздействий). Выходом модели являлся оптимальный план передвижений в среде. В среднем такой план мог состоять из 30 элементов (целей, подцелей и ожидае­ мых отклонений внутренних состояний).

М-автомат МОД-2 вырабатывал конкретные реали­ зации планов, построенных МОД-1. Его основная осо­ бенность связана с реализацией на М-сети программ самообучения. Последнее осуществлялось путем из­ менения веса первоначально заданных связей, устано­ вления новых связей и порождения новых узлов М-се­ ти. Протекание процессов изменения структуры сети определялось особенностями среды, в которой действо­ вал автомат, соотнесенными с поставленными перед ним задачами. Задачи могли формулироваться, на­ пример, в следующем виде: действовать так, чтобы обеспечить максимальное значение оценки «собствен­ ного комфорта», максимальное соответствие внешних и внутренних реакций автомата реакциям моделируе­ мого объекта или быстрейшее достижение цели. Воз­ можны были и комбинированные задачи.

Автомат может рассматриваться как модель дея­ тельности человека по принятию решений в задачах движения в лабиринте. Кроме того, МОД-2 может быть использован в качестве устройства, управляющего передвижением технических систем, предназначенных для сбора информации, транспортировки и т. п.

В зависимости от цели использования автомата изме­ няется и критерий оценки эффективности его функци­ онирования.

МОД-2 — полный М-автомат. Его М-сеть может содержать до 400 i-моделей и до 2000 связей. На М-сети задана двухуровневая СУТ. МОД-2 был реализо­ ван в виде программы для ЦВМ БЭСМ-6. Программа содержала около 6000 команд. Время просчета одного такта 30—50 сек. Экспериментально были исследованы реакции автомата на протяжении до 300 тактов. На входы автомата подавалась информация о плане дви­ жения и об объектах среды, каждый из которых отно­ сится к одному из шести возможных типов. Всего среда могла содержать до 400 расположенных произ­ вольным образом объектов. Предварительная ин­ формация о некоторых характеристиках среды и структуре оценочных функций задавалась в процессе начальной организации М-сети автомата. Количество выполняемых МОД-2 действий (выходных параметров или решений) — 22. Из них 17 — различного рода дей­ ствия — шаги, перемещающие автомат в среде, а 5 — «активные» действия, изменяющие состояние среды или автомата («есть», «спать», «нести объект», «бросить объект», «создать убежище»). Поведение автомата со­ стояло в формировании последовательностей решений о выполнении тех или иных действий и соответственно их фактическим выполнением. Были разработаны оцен­ ки поведения и предложены процедуры оптимизации автомата. Оптимизация выполнялась варьированием значений шести параметров обучения.

В ходе исследования МОД-2 был решен ряд вспо­ могательных задач-тестов. Представляет самостоятель­ ный интерес результат одной из таких задач, свя­ занной с моделированием процессов формирования понятий человеком. Здесь показана приводимость М-автомата к формам, моделирующим как индивиду­ альное, так и обобщенное групповое поведение. Были продемонстрированы методы такого приведения.

Модель механизмов речи. Одновременно с разра­ боткой МОДа проводилось исследование, цель которого состояла в том, чтобы изучить возможности М-сетей в области нейрофизиологии и нейропсихологии, а так­ же оценить практическую и познавательную важность таких моделей. Был разработан и исследован М-авто мат, моделирующий механизмы речи. В модели пред­ ставлены такие аспекты устной речи, как восприятие, осмысливание, словесное выражение. Преимуществен­ ное внимание уделялось содержательной стороне про­ цессов переработки словесной информации. Модель предназначена для воспроизведения относительно про стых речевых функций — ответов на вопросы ограни­ ченного типа, повторения, называния. Она содержит следующие блоки: слуховых восприятий, сенсорный речевой, проприоцептивный речевой, понятийный, эмо­ ций, мотивационный, двигательный речевой, артикуля торный и блок СУТ. Блоки модели соотнесены с опреде­ ленными мозговыми образованиями. При задании организации М-сети использовались данные нейромор фологии, нейрофизиологии и клинической неврологии.

Модель представлена в виде необучающегося пол­ ного М-автомата. Его М-сеть содержит более i-моделей и 8000 связей между ними. М-автомат реа­ лизован в виде программы для ЦВМ БЭСМ-6, содер­ жащей около 500 команд. Время просчета одного так- та — 2 сек. В экспериментах наблюдалось поведение модели на протяжении до 100 тактов. На вход модели подавались буквы русского алфавита, объединенные в слова и фразы, а также специальные объекты, соот­ ветствующие образам предметов. На выходе модели, в зависимости от режима ее работы, наблюдались последовательности букв русского алфавита, которые были либо ответами на входные вопросы, либо по­ вторением входных слов, либо названиями предметов.

То обстоятельство, что при создании модели широко использовались данные нейрофизиологии, позволило в экспериментах имитировать ряд поражений мозга органического и функционального характера, приво­ дящих к нарушениям функций речи. В частности, получены модельные отображения синдромов сенсор­ ной, моторной, проводниковой и транскортикальной афазий.

Описанные М-автоматы составляют основной фонд «больших» моделей, разработанных и исследованных в процессе изучения возможностей и практических ме­ тодов использования М-сетей.

Нами были выполнены и некоторые модельные раз­ работки, в которых аппарат М-сетей использовался эпизодически или в модифицированном виде. Анализ результатов, полученных в разработках такого рода, может представлять серьезный интерес при оценке возможностей и свойств обсуждаемого нами аппарата.

Весь опыт моделирования поведения «разумного субъекта» в некоей среде — «лабиринте» — с исполь­ зованием М-сети и расчетами на ЦВМ подытожен в монографии [4]. В качестве примера на рис. 3 приве­ дены результаты одного из экспериментов по исследо­ ванию поведения такого «субъекта».

Семь-восемь лет мы занимались созданием сетевых моделей на ЦВМ, пока не убедились, что возможности таких моделей ограничены. Объем расчетов оказался слишком большим даже для компьютера: за один такт нужно пересчитать циркуляцию «энергии» по всем связям и изменения в их проходимости, подсчитать активность всех элементарных моделей, пересчитать изменение их тренированности для следующего такта.

Если же предусмотреть и возможность образования новых связей и новых моделей, иными словами, вос­ произвести принцип самоорганизации, то количество счетной работы будет расти подобно снежному кому.

Затраты машинного времени увеличиваются прибли Рис. 3. Схема движений и действий МОДа по карте.

зительно пропорционально кубу числа моделей в сети.

Но дело не только в расчетах — так же трудно оказа­ лось отладить громоздкие программы. Так или иначе, выйти за предел 1000 моделей и 8000 связей нам не удалось. Формально мы воспроизвели в МОД самые простые программы психики, такие, как сознание и подсознание, оптимизация действий по многим крите риям — чувствам с предвидением и планированием.

Была продемонстрирована разная обобщенность или иерархия моделей, обучение, забывание и даже разли­ чия характера. Но в целом этот «субъект», путешест­ вующий среди врагов и препятствий в поисках пищи, соответствовал лишь довольно примитивному живот­ ному.

Аналоговые модели. Роботы. Тем не менее сущест­ вует много задач, для которых вполне достаточен и такой ограниченный интеллект. В частности — для роботов, предназначенных для специализированной деятельности. Важнейшим требованием для них долж­ на быть автономность, независимость от ЦВМ, что привело к реализации сетевого интеллекта на физиче­ ских элементах. Идея сама по себе проста: предста­ вить каждую элементарную модель в виде усилителя, на вход которого поступает потенциал от других моделей, а на выходе формируется усиленный потен­ циал, который тоже передается по связям и гасится пропорционально их сопротивлению. Из таких элемен­ тов-усилителей можно создать любую сеть, если каж­ дому придать определенное значение — семантику.

Одни элементы — модели предметов, другие — чувств и т. д., как в сетевых моделях РЭМ и МОД. Разные характеристики усилителей и разные сопротивления связей позволяют создать структуры любого назначе­ ния. Модель интеллекта на физических элементах в наибольшей мере приближается к имитации мозга.

К сожалению, есть разница: несоизмеримо мало чис­ ло элементов и связей. Однако сложность такого интел­ лекта целиком определяется технологией. Можно соз­ дать довольно большие сети, во всяком случае доста­ точные для робота.

В 1972 г. были начаты работы по созданию моде­ ли ИИ в виде сети из физических элементов. Цель их — построить систему управления в виде М-сети с системой усиления-торможения (СУТ) и разместить ее на тележке.

Прежде чем приступить к разработке макета, были проверены возможности сети из физических элемен­ тов с СУТ. Первая сеть содержала 26 узлов и около 300 связей и управляла перемещением писчика по условной среде, изображенной на карте. Результаты экпериментальных исследований этой системы оказа­ лись обнадеживающими. Тогда приступили к созданию транспортного робота — ТАИРа.

Конструктивно разрабатываемый макет робота представляет собой трехколесное шасси, на котором смонтированы комплект рецепторов (органов чувств), блок управления, энергосистема и прочие устройства.

Размер шасси 1600x1100x600 мм. Все три колеса являются ведущими и имеют автономный привод от электродвигателей мощностью по 30 Вт. Переднее колесо поворотное. Питание электродвигателей осуще­ ствляется от аккумуляторных батарей. Скорость дви­ жения по ровной поверхности составляет 10—12 м/мин.

Датчики-рецепторы можно разбить на несколько групп.

1. Датчики, определяющие положение робота в пространстве:

а) навигационная система с компасом и двумя радиомаяками;

б) датчики углов наклона тележки в двух плоско­ стях.

2. Датчики информации об окружающей среде:

а) дистантные. Активный оптический дальномер с радиусом действия до 10 м. Система оптических дат­ чиков близости с диапазоном расстояний до 30 см;

б) контактные датчики — система микровыключа­ телей, установленных на гибком чехле, в который за­ ключена тележка.

3. Датчики состояний робота:

а) термодатчики на электродвигателях;

б) датчики крутящего момента на приводах к колесам;

в) датчики напряжения на аккумуляторных бата­ реях;

г) вибродатчик.

4. Датчик времени.

Основу системы управления представляет физиче­ ски реализованная М-сеть. Специфическая СУТ в М-се ти задает положительную обратную связь по возбуж­ дениям узлов и обеспечивает тем самым доминирова­ ние в каждый момент времени одного или нескольких узлов над всеми другими. Ввод и вывод информации в М-сети соответствуют возбуждению определенных ее узлов (входных и выходных).

В настоящее время система управления роботом предполагает осуществление целенаправленного дви­ жения с обеспечением собственной безопасности (объ­ езд препятствий, избегание опасных мест, поддержа­ ние внутренних параметров в заданных пределах) и минимизацию временных и энергетических затрат.

Вся сеть, состоящая из 100 узлов, разбита на шесть сфер.

Сферы оценок и распознавания ситуаций являются входными. Аналогично сенсорным системам мозга человека здесь осуществляется анализ воспринятой датчиками информации, на основе которого выполня­ ется интегральная оценка среды, условий задачи и собственных состояний.

Выбор характера поведения в текущей ситуации производится в сфере решений. При этом может быть принято решение, определяющее направление движе­ ния, осуществление какого-то сложного маневра или даже выполнение некоторого элементарного действия.

Организация самого двигательного поведения осу­ ществляется тремя сферами, являющимися выходны­ ми для сети,— сферами маневров высшего уровня, маневров нижнего уровня и элементарных действий.

Здесь формируется последовательность команд, посту­ пающих к эффекторной системе — системе управления поворотным и тяговыми электродвигателями.

Все узлы сети (i-модели) представляют собой усили­ тели постоянного тока со специальными характе­ ристиками. Узлы каждой из выделенных сфер имеют свои определенные характеристики. Точно так же в каждой сфере действует своя СУТ. Связи между узла­ ми выполнены из резистивных элементов в устройстве матричного типа. Для ввода информации от датчиков в сетевое устройство управления используется 60 ка­ налов.

Внешний вид ТАИРа представлен на рис. 4. В на­ стоящее время мы продолжаем работы по созданию новых систем управления роботами. Эти системы пока не претендуют на достижение высокого уровня интел­ лекта. Правда, для ограниченных целей нейроноподоб ная семантическая сеть на физических элементах с СУТ хорошо себя зарекомендовала и привлекла внима­ ние исследователей и конструкторов, которые думают об автономных роботах. Планы отдела биокибернетики по совершенствованию автоматов предполагают реа­ лизовать обучение, создать ансамблевую организацию из элементов, позволяющую резко увеличить количе­ ство моделей при том же числе элементов, улучшить зрительное восприятие среды и даже дойти до чело­ веческой речи. Я не уверен, что эти планы воплотятся в металл достаточно скоро, не потому, что идеи не Рис. 4. Внешний вид ТАИРа.

состоятельны, а исключительно вследствие трудностей их технической реализации. Почти пятнадцать лет попыток моделирования разума человека привели меня лишь к ответу на вопрос «Что такое интеллект?», но существенно не приблизили к созданию его модели.

Нейроноподобная семантическая сеть с переменной активностью элементов связей и с СУТ кажется наи­ лучшим аналогом коры мозга, но размеры ее жестко ограничены сложностью воспроизведения, элементар­ ные поведенческие реакции, полученные на описанных моделях, весьма далеки от человеческих и ничего не могут доказать. В самом деле, разве несколько сот элементов нашей сети могут заменить 10 миллиардов нейронов мозга? Если к этому прибавить, что каждая нервная клетка представляет собой функциональную систему из многих тысяч макромолекул, что она име­ ет несколько сот «входов» и может участвовать в ра­ боте различных клеточных ансамблей, давая почти астрономическое число моделей, то разве можно все это воспроизвести? К этому нужно добавить самоорга­ низацию в виде избирательной тренировки «входов» — синапсов, обеспечивающих память, и тренировку «вы­ хода», резко повышающую активность нейрона. Нерв­ ная система — не просто сеть из одинаковых элемен­ тов. В ней имеется начальная структура связей и клеток с разной активностью, обеспечивающих вро­ жденные рефлексы, чувства, программу доминирова­ ния. Тренируемость клеток и связей позволяет разви­ вать и адаптировать врожденные реакции и наслаивать на них иерархию функциональных актов различных уровней обобщения и содержания. Все это, вместе взя­ тое, дает человеческий разум — изумительное произ­ ведение природы, которое, раз возникнув, открыло в мозге новые возможности.

После такой характеристики сложности и возмож­ ностей мозга задача его воспроизведения в модели кажется безнадежной. Трудно представить себе искус­ ственную сеть из десятка миллиардов элементарных усилителей, каждый из которых может иметь сотни входов, обладает способностью к тренировке — то есть изменению характеристик. Трудно, но не безнадежно.

В отличие от длительной естественной эволюции про­ гресс науки и техники стремителен и все более уско­ ряется. Поэтому в перспективе возможна и аналоговая сеть, сравнимая по мощности с мозгом. Важно пра­ вильно поставить задачу — в данном случае сказать, какими должны быть элементы и как их соединять друг с другом. Пожалуй, еще важнее представить ал­ горитм интеллекта в достаточно обобщенном виде, позволяющем реализовать его различными средствами.

Велики технологические трудности на пути до аналогового интеллекта. Поэтому так заманчивы уни версальные цифровые машины, которые уже теперь достигли большой мощности. Совершенствуется их внешняя память и растет объем оперативной памяти.

Быстродействие исчисляется миллионами операций в секунду. Разделение времени и создание параллель­ ных программ позволяют повысить эффективность компьютеров. Создается впечатление, что возможности ЦВМ еще не достаточно использованы для реализации алгоритма интеллекта. То обстоятельство, что до сих пор наши попытки создания СИ не увенчались успе­ хом, еще не означает, что исследования закончены.

Нужно сохранить обобщенный алгоритм, но отказать­ ся от сети с тем, чтобы уменьшить объем расчетов.

Однако при этом следует лишь в минимальной мере поступиться принципами. Мы решили предпринять такую попытку — создать алгоритмическую модель интеллекта. Соображения к ее проекту будут пред­ ставлены в заключительной части книги. А пока пе­ рейдем к изложению идей, положенных в основу этой модели.

Системы и модели Современный этап развития науки ознаменован достижением принципиальной важности:

вычислительные машины дали возможность овладеть сложностью. Все значение этого достижения как раз и состоит в том, что появилась надежда на создание количественных моделей, приближающихся по слож­ ности к биологическим системам. Возможно, что при разработке таких моделей недостаточно внимания уде­ ляется значению пространственных структур объектов, хотя наблюдения природы указывают на их исклю­ чительную роль (вспомним двойную спираль молеку­ лы ДНК).

Весь физический мир можно свести к простран­ ственным структурам, состоящим из атомов и молекул, а также к действующим между ними силам, связываю­ щим материальные частицы в комплексы, которые ус­ ловно можно назвать «телами». Общеизвестно, что все объекты в мире взаимосвязаны, однако степень проч­ ности этих связей весьма различна: от жестких связей внутри твердых тел до гравитационных и электромаг­ нитных сил, лишь ограничивающих пространственную свободу частиц. Пространство, энергия и время — вот самые общие координаты частиц и тел. Еще недавно казалось, что энергетические и материальные взаимо­ отношения между частицами и телами достаточно объясняют мир. Но вот появилось понятие информа Закрытая Открытая Рис. 5. Схемы простых си­ система система стем — закрытой и открытой.

Между элементами происхо­ дит обмен энергией Эн и ве­ ществом В.

Среда Среда ции и понятие сигнала как носителя информации, и это поколебало представления об исключительно энер­ гетическом и материальном характере балансов отно­ шений между объектами. Сигнал, несущий ничтожное количество энергии, может вызвать огромные веще­ ственные и энергетические пертурбации в сложной системе, на которую он направлен (пример — атомная война).

Сложность структурных и энергетических отноше­ ний стала самостоятельным и значимым понятием, без учета которого уже невозможно объяснить мир.

Понятие системы тоже более или менее определилось:

это пространственная структура из неких элементов, объединенных внутренними «силами» настолько проч­ но, что она выступает как единое целое, противопо­ ставленное всем другим объектам. Системы зависят друг от друга в обмене энергией и веществом, но в меньшей степени, чем элементы внутри них (рис. 5).

Хотелось бы дать количественное понятие системы, но очень нелегко установить, когда простое сочетание взаимодействующих элементов уже становится систе­ мой. Степень «зрелости» системы условно можно опре­ делить по степени зависимости ее элементов друг от друга: сколько времени они могут «самостоятельно прожить», не распадаясь на более простые частицы, если их отделить от системы. В связи с этим понятие элемента системы тоже не просто — в конце концов все объекты разложимы до элементарных частиц.

Мне кажется, что элементом системы нужно считать некое более простое образование, уже обладающее чертами данной системы. Если взять живые биологи­ ческие объекты, то можно перечислить иерархические ступени их сложности: элементарные частицы, атомы, молекулы, макромолекулы (ДНК, белки), клетки, орга­ ны, организмы, сообщества, биоценозы... Каждый уро­ вень сам по себе достаточно сложен по структуре, что­ бы претендовать на звание «сложности», но все-таки, Рис. 6. Схема сложной систе­ мы:

Рц — рецептор;

Эн — энергия;

В вещество.

какие из них допустимо считать сложными, какие отнести к простым, какие признать лишь элементами сложных? Без условности здесь не обойтись.

Сложные системы Будем считать сложными такие си­ стемы, в которых между элементами циркулируют не только частицы вещества и энергии, но и сигналы (рис. 6). В структуре сложных систем можно условно выделить рабочие подсистемы, ведающие преобразо­ ваниями вещества и энергии, и управляющие, которые воздействуют на рабочие с помощью сигналов. Хотя сигнал тоже имеет физическую, то есть вещественную и энергетическую, природу, но дело не в ней, а в характере сигнала, то есть его временной структуре и, особенно, месте приложения к управляемому объ­ екту — в данном случае к рабочей подсистеме. При таких условиях — обязательность наличия управляю­ щих сигналов и рабочих подсистем — грань сложных систем проходит на уровне одноклеточных существ:

их управляющим органом является генетический ап­ парат ДНК, рабочими подсистемами — органеллы клет­ ки (оболочка, митохондрии, лизосомы и др.). Роль сигналов выполняют информационные РНК. Макро­ молекулы — белки и нуклеиновые кислоты — доста­ точно сложны по структуре, но не удовлетворяют тре­ бованиям, предъявляемым к сложной системе. На бо­ лее высоких уровнях иерархии систем эти условия соблюдены. Например, в организме органами управле­ ния являются нервная и эндокринная системы, сигна­ лами — молекулы гормонов и медиаторов (передатчи­ ки нервных импульсов). Сообщество животных не Рис. 7. Иерархия сложных си­ стем.

Общество Сообщества 0рганизмы Органы Клетки всегда становится сложной системой. Только у выс­ ших млекопитающих и птиц есть внутренняя органи­ зация в стае и система управляющих сигналов, и только у человека эта система приобретает достаточ­ ную «зрелость». В обществе легко обнаружить структу­ ры, аналогичные рабочим и управляющим подсистемам, в нем циркулируют многочисленные и разнообраз­ ные сигналы. Иерархия сложных систем представлена на рис. 7.

Элементом сложной системы каждого уровня являются системы предыдущего уровня, в которых уже заложены некоторые качества высшей системы.

Для организма — это клетки, для общества — люди.

Элементом клетки являются макромолекулы. Они способны воспроизводить себя лишь при наличии фер­ ментов, действующих извне. Именно поэтому макромо­ лекулу нельзя считать сложной системой. Скачок от молекулы до клетки очень велик — этим определяют­ ся трудности объяснения возникновения жизни на Земле. На других, высших уровнях такие качествен­ ные скачки менее выражены. Клетки многоклеточных, будучи отделены от тела, способны еще некоторое вре­ мя жить, так же как и отбившиеся от стаи животные.

А уровень «зрелости» такой системы, как человеческое общество, возрастает буквально на наших глазах.

Еще пять — десять поколений тому назад, когда пре­ обладало натуральное хозяйство, большинство людей было способно существовать в условиях весьма огра­ ниченных связей с обществом. Теперь же брошен­ ный в лесу человек может погибнуть через несколько дней.

Самое общее качество сложных систем «типа жи­ вых» — способность к поддержанию своей целост- ности и к противодействию разрушающим влияниям окружающей среды. Однако оно не беспредельно, по­ этому необходимо другое качество, более сложное в своем структурном выражении,— способность к вос­ произведению самих себя. Еще более сложным каче­ ством является способность к усложнению в процессе воспроизведения. В живой природе это выражается изменчивостью. В человеческом обществе усложнение структуры и функции наблюдается постоянно и явля­ ется следствием феномена творчества и труда, отсут­ ствующих в стае животных.

Принцип структурности предполагает, что для реа­ лизации всех этих качеств должны быть соответствую­ щие структуры. Нужна структура для постоянного возобновления своих разрушающихся частей и для ути­ лизации с этой целью энергии среды, нужны структу­ ры для размножения и структурное выражение про­ граммы их «удвоения» и, наконец, необходимы неко­ торые структурные возможности для наращивания но­ вых структур, то есть для усложнения. Более того, должны быть структуры, отражающие внешний мир, поскольку на него замыкается реализация программ, которые являются выражением названных «способ­ ностей». Программа творчества тоже требует структур­ ного выражения.

Модели Существует хороший термин для обозначения структуры, отражающей другую структу­ ру. Этот термин — модель;

у каждого из нас есть его интуитивное понимание. Модель отражает объект не полностью, а с упрощениями и искажениями — в за­ висимости от того, для какой цели она предназначена и какие есть возможности для ее построения.

Органы управления сложных систем «типа живых» содержат в себе модели и программы (иными словами, тоже структуры), управляющие рабочими подсистема­ ми в соответствии с этими моделями. Программа — это «считывание» модели сигналами, которые регулиру­ ют потоки энергии и вещества между элементами си­ стемы.

Как объяснить, что сравнительно простая структу­ ра — модель в ДНК зародышевой клетки человека — может отразить всю сложность самого человека с его разнообразием клеток и всеми человеческими каче­ ствами? Для того чтобы из яйцеклетки вырос человек, нужно извне получить массу сложных веществ («кир­ пичиков»), а модель должна только предусмотреть, как сложить из них «здание». Само «складывание» состоит в значительной мере в повторении одинаковых операций. В ДНК заложены структуры всех белков организма и порядок, в каком следует «считывать» их при построении органов. Заложены и обратные свя­ зи, отмечающие выполнение этапов формирования организма. Следовательно, принцип управления по модели не исключает возможности построения более сложной, чем сама модель, системы, поскольку в мо­ дели должен быть предусмотрен лишь порядок вклю­ чения структур, получаемых извне.

Мы привыкли к статическим моделям: игрушка, чертеж, текст — все это чистая структура. Основу мо­ делей в органах управления сложных систем тоже составляют структуры: ДНК, сети нейронов в цент­ ральной нервной системе. Несомненна избыточность этих структур — например в каждой клетке имеется полный набор генов, достаточный для построения це­ лого организма. Для реализации управления нужна программа «считывания» структур сигналами, а для этого — активация определенных частей модели. Та­ ким образом, важна не только структура, но и актив­ ность, энергия различных элементов модели. Понятие активности тоже можно свести к изменению структур, только на уровне более низком, например в молеку­ лах, атомах, составляющих структуру. Сам сигнал представляет собой такую «активированную порцию структуры». Пример — информационная РНК или ак­ тивность синапса на теле нервной клетки, когда на него подается импульс с другого нейрона.

Структура нам представляется чем-то стабильным, хотя в действительности это относится лишь к грубым материальным конструкциям из многих молекул и атомов. В живых системах структуры ДНК очень проч­ ны, чего нельзя сказать о структурах нервной системы.

Конечно, нейроны не передвигаются, отростки их у взрослого растут медленно, но тонкие структуры си­ напсов — мест соединения нейронов, обеспечивающих прохождение энергии с одного нейрона на другой,— довольно нестабильны во времени. То же касается и «рабочих» элементов нейрона, обеспечивающих его активность — процесс возбуждения. Рис. 8. Динамические характеристики элементов модели (нейро­ нов) :

«вход» — время раздражения извне, «выход» — величина активности на вы­ ходе элемента. Характеристики отмечают длительность активности после прекращения действия «входа».

Рис. 9. Статические характеристики элементов модели (нейро­ нов):

«вход» - величина раздражителя;

«выход» — уровень активности. Показаны три характеристики — в зависимости от степени тренированности элемента.

Активность элементов модели, так же как и сиг­ налы,— это ее функции. Модель, в которой элементы взаимодействуют друг с другом и с внешней средой через сигналы, можно назвать действующей, в проти­ воположность статичной, лишенной функции и воз­ можности самостоятельно взаимодействовать с внеш­ ним миром. Структуры живых клеток подчиняются закону тренировки и детренировки: при функциони­ ровании их «мощность» возрастает, при покое — уменьшается. Эти процессы развиваются неравномер­ но. Уровень и длительность активности живого струк­ турного элемента не только заложены в его генах, но и являются результатом тренировки в процессе пред­ шествовавшей деятельности. Изменение структуры модели в результате получения сигналов извне состав­ ляет память. Временная активность комплекса струк­ турных элементов модели — это временная или актив­ ная память. Организация новых структур в соедине­ ниях элементов модели — ее длительная или пассивная память. На рис. 8 показаны временные (динамические) характеристики различных типов элементов, а на рис. 9 — статические характеристики их тренирован­ ности.

Итак, сочетание постоянных и изменчивых струк­ тур, состоящих из элементов с разными динамически­ ми характеристиками активности,— вот черты моделей систем «типа живых».

Восприятие и память Восприятие и управление Управляющие органы сложных си­ стем можно представить как их интеллект, «тело» — как рабочие подсистемы. Сигналы представляются комплексами подвижных структур, как, например, РНК в клетках или импульсы в нервных проводниках.

В связи с этим можно говорить о «коде» моделей и сигналов.

Под словом «код» понимается определенный набор структурных элементов, из которых строятся статиче­ ские модели. Письменная речь — это код букв. Есть код рисунков, код математических формул. Структу­ ра клеток и организмов записана генетическим ко­ дом — набором генов, составленных из нуклеотидов и объединенных в ДНК. Структурный код нервной системы — это нервные клетки различного типа.

Функция моделей выражается сигналами, и к ним тоже применяется понятие кода. Примеры — код нерв­ ных импульсов, код информационных РНК, код сиг­ нальных флагов и масса других.

Управление любым объектом предусматривает цепь из трех звеньев: рецептор — датчик, воспринимающий энергию объекта и превращающий ее в сигналы, сами органы управления (моделирующая установка, мозг, разум, интеллект) и эффектор — орган воздействия, превращающий управляющие сигналы, исходящие от интеллекта, в некоторый вид энергии, достаточно мощ- Рис. 10. Схема кратковременной памяти. Мо­ дель представлена кратковременной высокой активностью элементов (нейронов), показан­ ных в виде заштрихованных кружочков.

ный, чтобы изменить деятельность объекта. Рецепторы специфичны: рецептор одного вида воспринимает толь­ ко один вид энергии;

но разные рецепторы одной си­ стемы превращают их в знаки одного кода, характер­ ного для данного управляющего органа, интеллекта, разума. Например, рецепторы глаза, уха, кожи — все кодируют свои сигналы нервными импульсами. То же касается и эффекторов: они превращают сигналы уни­ версального для системы кода в специфическую энер­ гию воздействия. Например, сокращение мышцы или выделение слюны. Рецепторы и эффекторы имеют статические и динамические характеристики, подобные нейронным (см. рис. 8, 9). Как правило, активность рецептора продолжается до тех пор, пока на него падает внешняя энергия.

Если представить себе, что каждый рецептор вос­ принимает энергию из ограниченного пространства внешнего мира или «тела», что он активирует один элемент в моделирующей установке (например, один нейрон «рецепторного поля» мозга), то совокупность активированных в данное время элементов составит мгновенную модель пространства внешнего мира, или «тела», энергию которого воспринимает система ре­ цепторов (рис. 10). Модель будет изменяться так же быстро, как изменяются воспринимаемые объекты внешнего мира, и с той скоростью, с какой их измене­ ния улавливаются рецепторами. Для превращения такой сугубо временной модели в постоянную нужно, чтобы между активированными элементами устано­ вились связи (рис. 11). В этом случае повторное воз­ буждение извне некоторого числа элементов модели по таким связям могло бы активировать всю модель, ины­ ми словами, произошло бы вспоминание воспринятой ранее картины. Однако при этом придется отключать рецепторы, чтобы не наслоились новые картины, вос­ принимаемые извне. Для непрерывного запоминания новых картин нужно подключать к рецепторам новые поля элементов. Тогда мы получим серию картин-мо­ делей, как на кинопленке. Невозможно на одни и те же Рис. 11. Схема длительной памяти. Модель представлена проторенными связями между элементами (нейронами).

элементы воспринимать новые картины и одновре­ менно запоминать их.

Интеллект — это целенаправленные действия с мо­ делями, так можно перефразировать первоначальное его определение. Естественно предположить, что дей­ ствия будут тем более эффективными, чем более под­ робными будут модели. Это значит: необходимо точное отражение структуры объекта управления в моделях, отражение его изменений во времени и про­ странстве. Для этого нужно прежде всего множество рецепторов, поскольку объект можно отразить, либо воспринимая его большим количеством точек одно временно, либо сканируя его с высокой скоростью и передавая энергию всякий раз на новые элементы «рецепторного поля». Первый способ используется гла­ зом, второй — телекамерой. Изображение на телевизи­ онном экране светится, то есть запоминается в виде первичной модели, очень недолго. Чтобы запомнить «впрок», следует записать его на видеомагнитофон, а для этого нужно много кадров. Человек воспринимает глазами и на короткое время отпечатывает в мозге ог­ ромное количество картин, в которых полезная инфор мация составляет ничтожную часть. Именно ее нужно выбрать, а все остальное — забыть, чтобы не перегру­ жать память.

Обобщенность восприятия Основная проблема моделирования сложных объектов для целей интеллекта — это преодо­ ление избыточного разнообразия, борьба с избыточной информацией. Чем более развит интеллект, тем более подробными должны быть модели управляемых объ­ ектов, тем большие отрезки времени они должны отра­ жать. И тем не менее значительная часть информации о внешней среде, не представляющая ценности для целей интеллекта, должна быть отброшена, модели стерты. Но как произвести отбор? Для этого нужны Система-объект Модель 1-го уровня обобщенности Модель 2-го уровня обобщенности Модель 3-го уровня обобщенности Рис. 12. Объект и его отражение в моделях разного уровня обоб­ щенности.

«Входы» и «выходы»: Эн — энергия;

В — вещество.

критерии и способы отбора. При отборе используются все этапы действий с моделями: первичное отражение внешней среды при восприятии, первичное запомина­ ние воспринятого, последующий анализ отраженного в первичной модели. Выход из противоречия между необходимостью запоминать большое количество ин­ формации и ограниченностью памяти только один — в огрублении моделей и в отборе их наиболее важных частей. На рис. 12 показано, как можно отразить слож­ ный объект моделями разного уровня обобщенности.

Разумеется, по мере упрощения теряется информация, возможно, ценная. Но всегда ли ценность — в подроб­ ностях картины, в деталях структуры? Нет, не всегда.

Чаще главная информация представлена в грубой модели. И не все детали одинаково ценны. Следова­ тельно, необходимо воспринимать, запоминать и забы­ вать объекты «выборочно», обязательно «в целом» и, кроме того,— интересующие нас детали.

Огрубление модели я называю термином «обобще­ ние». Он относится одинаково к описанию как прост­ ранственных, так и временных изменений структуры.

Рис. 13. Модель, отражающая про­ странственное расположение объек­ тов внешней среды с различной сте­ пенью активности и фокусирования.

Объект а отражен четко и с высокой активностью. Объект б находится позади него и отражен менее четко и с меньшей активностью. Еще ме­ нее активным является отражение объектов в и г. Объект д находится впереди всех и отражен в модели весьма нечетко.

Понятия «обобщение», «обобщенность» и «степень обобщенности» модели я считаю важнейшими в теории интеллекта. В структурном выражении обобщенная модель — это такая модель, в которой представлены только крупные блоки структуры объекта или про­ странственного расположения объектов, без деталей (см. рис. 12).

Интенсивность возбуждения рецептора зависит не только от количества падающей на него энергии, но и от изменения его чувствительности, что описывается статической и динамической характеристиками. Яр­ кость восприятия отражается активностью элементов первичной модели во временной памяти «рецепторно го поля». Чувствительность рецептора определяется его настройкой и напряжением, регулируемых интеллек­ том. Восприятие объекта рецепторами непосредственно связано с характером первичной модели (ПМ на рис. 1, 2). «Орган зрения» любого интеллекта должен удовлетворять ряду требований. Первое — должно быть возможным фокусирование зрения, позволяю­ щее ярко, с высокой активностью запечатлевать из­ бранные части (детали) картины, а все остальное пред­ ставлять в крупных блоках и с меньшей активностью.

Второе требование относится к восприятию трехмерных структур. В модели нужно отразить не только часть, выделенную на плоскости, но и часть, выделенную по глубине. Все другие части, расположенные с боков, впереди и позади избранной, необходимо представ­ лять в «крупноблочном» изображении и с меньшей активностью (рис. 13). Настройка рецептора должна обеспечить передвижение фокуса с одной части объ­ екта на другую как по плоскости, так и по глубине, фиксируя эти движения в специальной модели на­ стройки. В результате получится несколько кадров с плоскими моделями по типу системы моделей, пред­ ставленной на рис. 17, причем каждый будет марки­ рован «знаком настройки». Передвижение фокуса или центра восприятия по деталям объекта может предста­ вить самостоятельную модель, отражающую его струк­ туру (вспомним детские рисунки из палочек!).

Глаза человека наилучшим образом приспособлены к восприятию внешнего мира с разной степенью обоб­ щенности и разной активностью частей картины. При напряжении внимания предмет рассматривается сфо­ кусированным зрением, при этом мы четко видим мелкие детали в ограниченном пространстве, перифе­ рия же видна очень расплывчато, только в крупных структурных блоках. Если намеренно не фокусировать зрение, можно видеть одновременно большое количе­ ство объектов, но все они будут нечеткими, расплыв­ чатыми. Разная настройка на глубину позволяет получать модели пространственного расположения объектов с выделением значимой фигуры на фоне второстепенных (см. рис. 13). Угол схождения глаз при фокусированном рассмотрении дает расстояние пред­ мета от субъекта.

Виды и механизмы памяти Понятие модели неотделимо от струк туры памяти так же, как и от механизмов восприятия.

На рис. 1, 2 были показаны два варианта ИИ. Их основное отличие — в носителях памяти, которыми определяются различия в действиях с моделями.

Слово «память» имеет два значения. С одной сто­ роны, это явление, феномен фиксации модели в ре­ зультате восприятия объекта рецепторами. С другой — это сами запечатленные модели. В последнем случае первостепенную роль играет носитель памяти.

Основной параметр всякой памяти — длительность запоминания. Наиболее короткая память у рецепторно го элемента: она длится ровно столько времени, сколь­ ко необходимо для накопления энергии, нужной, чтобы выдать в мозг один импульс. В этот момент рецептор освобождается для нового восприятия энергии, его па­ мять мгновенная.

На рис. 1, 2 выделен блок запоминания первичной модели ПM — на время, пока она распознается и по ней активируется распознанная модель РМ, которая Рис. 14. Схема запоминания по­ следовательности звуков. Возбуж­ денные нейроны «рецепторного поля» заштрихованы.

в свою очередь используется для выбора моделей дей­ ствия МД. Память для всех этих моделей естественно назвать активной, кратковременной или оперативной в противоположность длительной памяти — основному хранилищу моделей. Возможен и третий вид памяти — «внешняя», находящаяся вне «мозга», вне интеллекта (например, собственные записи, рисунки, которые мож­ но повторно привлекать к использованию). Деление па­ мяти на такие виды условно, но необходимо. В СИ ак­ тивная и длительная память совмещена на одних сетевых элементах, в АИ массивы памяти совершенно различны.

Характер первичной модели, отражающей трехмер­ ную структуру, был показан на рис. 13. В моделях из длительной памяти структура фона очень неясная и обобщенная, выделяется только фигура. Для алгорит­ ма важны параметры модели и ее частей. Они следу­ ющие: активность определяется яркостью объекта, настройкой и напряжением рецептора, четкость — фокусированием рецептора. Расстояние до рецептора для главной фигуры отмечается точно, а для «фона» — приблизительно. Степень обобщенности модели и ее деталей зависит от параметров настройки, расстояния до рецептора и помех.

В СИ мгновенная первичная модель остается в кратковременной памяти наряду с распознанной мо­ делью. В АИ она перекодируется цифровым кодом, который должен отразить все параметры каждого объ­ екта и их пространственных отношений. Именно это и представляет самую трудную задачу для моделиро­ вания интеллекта.

Модель во временной памяти выступает как единое целое, следовательно, между ее возбужденными эле­ ментами сразу же должны устанавливаться связи, хо тя бы тоже временные. Для примера на рис. 14 пока зана схема запоминания последовательности из семи звуков, составляющих слово. Память на слова есть у высших животных и птиц. По горизонтали отмечены номера условных тактов времени, по вертикали — номера однородных элементов, последовательно соеди­ няемых с одним и тем же рецептором в каждый такт времени. В первый такт возбужден рецептор 1, во вто­ рой такт — рецептор 3, в третий такт — снова рецеп­ тор 1 и т. д. Модель станет действовать как единое целое только в том случае, если последовательно ак­ тивируемые элементы (на рисунке они заштрихованы) в течение семи тактов будут соединены связями и со­ хранят активность все вместе по крайней мере на время от первого до седьмого такта. Без такого усло­ вия — это лишь разрозненные точки, не составляющие единой модели как действующей единицы информа­ ции. Отсюда, однако, следует, что каждый рецептор ный элемент должен иметь связь со многими элемен­ тами «рецепторного поля» и соединяться с ними после­ довательно, всякий раз с новыми. Это не вызывает особых затруднений для случая, рассмотренного в на­ шем примере, где один звук соответствует одному эле­ менту в каждый такт. А как обстоит дело, если мы воспринимаем не последовательность звуков, а, ска­ жем, зрительную картину, то есть множество взаимо­ связанных объектов? Тут нужны уже не столбцы эле­ ментов, а «кадры», которые будут мысленно прокру­ чиваться наподобие киноленты. И сколько же связей нужно установить между возбужденными (яркими) точками кадров!

К сожалению, что-нибудь другое предположить трудно. Можно представить, что энергия с рецептора подается все время на один и тот же, «свой» элемент временной памяти. Допустим, что в следующий мо­ мент активируется другой элемент от другого рецепто­ ра и между ними устанавливается связь. К следую­ щему моменту первый и второй элементы уже утрати­ ли активность, но связь «запомнилась» и т. д. Пред­ положение еще менее вероятное, потому что в таком случае нужны специальные механизмы памяти, отме­ чающие последовательность возбуждения элементов, чтобы, к примеру, иметь возможность повторить слово.

Но для такого «счетчика адресов» тоже нужны струк­ туры.

Память человека действительно обширна. Есть лю­ ди, которые могут прочесть наизусть поэму «Евгений Онегин». Но мало таких, которые способны повторить в точности длинное стихотворение после одного про­ слушивания. Это значит, что «кадры» временной памя­ ти постепенно освобождаются и, таким образом, стано­ вятся способными снова запоминать новые модели.

Правда, они освобождаются не совсем, кое-что перехо­ дит в постоянную память, но очень немногое, если сравнить объем информации, который мы восприни­ маем ежедневно, и то, что из него остается в постоян­ ной памяти. Как правило, мы запоминаем из вос­ принятого только то, что потом многократно мысленно повторяем.

Гипотеза о механизмах памяти Трудно предложить гипотезу о ме ханизмах памяти, пригодную для алгоритма интеллек­ та. Попробую изложить свою попытку. Для обозначе­ ния моделей и их сочетаний я буду пользоваться сле­ дующими заимствованными из лингвистики термина­ ми. «Буква» — элементарная модель, самый малый значимый признак. «Алфавит» — совокупность букв моделей, формируемых одним типом рецепторов;

«ал­ фавитов» может быть много: световые, звуковые и др.

(см. ниже) «Слово» — более сложная модель, состоя­ щая из элементарных моделей, то есть «букв», но очень хорошо организованная и выступающая как од­ но целое. «Фраза» — соединение «слов», чаще всего временное и непрочное. «Буква обобщенности» —знак, указывающий уровень обобщения моделей, их место в «иерархии блочности».

Модели и ансамбли нейронов. У человека в коре очень много нейронов, их количество оценивают в и более миллиардов. Каждый нейрон соединяется с многими сотнями других. Таким образом, имеются почти беспредельные возможности для образования структур из нейронов, объединенных проходимыми («проторенными») связями. Такие структуры — ней­ ронные ансамбли — могут выступать в качестве мо­ делей объектов внешнего мира. Один нейрон может включаться в несколько ансамблей, как это показано на рис. 15. Модель повторно возбуждается («вспомина­ ется»), если возбудится некоторый процент входящих в ее ансамбль нейронов. Почему не возбуждаются все 1-й ансамбль 2-й ансамбль 3-й ансамбль 4-й ансамбль 5-й ансамбль Рис. 15. Нейронные ансамбли.

нейроны коры? Ведь связей между ними вполне доста­ точно. Чтобы ответить на этот вопрос, нужно сделать еще одно предположение: когда один нейрон возбуж­ дается, соседние тормозятся. Этот принцип «индуктив­ ного торможения» установлен И. П. Павловым. Таким образом, если допустить, что 30% нейронов данной модели возбудятся извне, то все окружающие дол­ жны бы затормозиться. Так и происходит, но связи к остальным 70% нейронов данной модели настолько проторены, что эти нейроны больше возбуждаются по связям, чем тормозятся «по площади». В результате активируется весь ансамбль, вся модель, а другие мо­ дели остаются заторможенными, несмотря на то что часть возбужденных в данной модели нейронов входит и в них. Такова гипотеза об ансамблях нейронов.

Для проверки этой гипотезы сотрудниками отдела биокибернетики разработан макет нейронной сети, содержащий 22 узла и наборное поле, которое позво­ ляет осуществлять все возможные соединения между узлами. Узлы (модели нейронов) представляют собой усилители постоянного тока с нелинейной (S-образной) характеристикой. В качестве связей использованы по­ стоянные резисторы. Вес связи считается обратно про­ порциональным сопротивлению резистора.

Макет создавался для получения ответа на следую­ щие основные вопросы:

— можно ли технически реализовать устойчиво работающую сеть из нейронных ансамблей так, чтобы при возбуждении одного ансамбля не возбуждались одновременно и другие, связанные с ним;

— можно ли построить устойчивую сеть, если ансам­ бли пересекаются, то есть одни и те же узлы входят в состав различных ансамблей;

— можно ли добиться четкого перехода возбуждения с одного ансамбля на другой, если они пересекаются значительной частью своих узлов.

Эксперименты с макетом дали положительные от­ веты на все эти вопросы. Оказалось, однако, что для успешной работы необходимо использовать централи­ зованную систему, управляющую активностью всей сети. По своим свойствам и назначению эта система аналогична системе усиления-торможения (СУТ), кото­ рая подробно будет описана ниже. Следует отметить, что многие исследователи, пытавшиеся построить устойчивую ансамблевую сеть без централизованной системы управления активностью, встретились с боль­ шими трудностями и вынуждены были накладывать жесткие ограничения на допустимую структуру сети.

На макете было также показано, что устойчиво работающая ансамблевая сеть может иметь число ансамблей, превышающее число узлов сети. Поэтому в некоторых задачах, используя ансамблевые сети, можно получить более экономную аппаратурную реа­ лизацию. С увеличением числа узлов эта экономия становится все более ощутимой. К сожалению, построе­ ние ансамблевых сетей большого объема связано пока со значительными трудностями.

Устройство «рецепторного поля». На рис. 16 пока­ зана гипотетическая схема «рецепторного поля», объ­ ясняющая принцип совмещения временной и постоян­ ной памяти. Такое совмещение, несомненно, имеет ме­ сто в коре мозга.

Система рецепторов Рц подает активность на «ре цепторное поле», состоящее из довольно большого ко­ личества кадров, построенных так, что в каждом из них имеются представительства — элементы для каж­ дого рецептора. Для удобства понимания кадры распо­ ложены в виде кольца. Число кадров значительное, но не бесконечное. Предположим, что есть переключа­ тель в центре кольца, который или поворачивает его на один кадр в каждый такт времени, или поочередно переключает связи от рецепторов с одного кадра на другой, соседний. Имеется настройка кадров Я, обеспе­ чивающая фокусирование, то есть позволяющая им Рис. 16. Схема «рецепторного поля»:

Рц — рецепторы, Н — настройка.

Рис. 17. Система моделей разной степени обобщенности, отражаю­ щая объект.

четко воспринимать избранную деталь и неясно видеть весь объект. Она же передвигает фокус по структуре объекта. Еще одно условие: настройка «устает», по­ этому после нескольких тактов рецептор отключается совсем.

Характеристики затухания активности элементов очередного кадра после отключения от них рецептора имеют вид, показанный на рис. 8. Затухание актив­ ности в самом первом кадре происходит раньше, чем завершится полный круг переключения.

Картины, представленные в кадрах, показаны на рис. 17. В первый такт времени система рецепторов при отсутствии фокусировки неясно воспринимает объект как целое, и он отражается в виде наиболее об­ общенной модели (рис. 17, а). Между активированны­ ми элементами возникают связи. Предположим, что объект «заинтересовал» интеллект (об этом — ниже), тогда в следующий такт, приходящийся на следующий кадр, зрением, умеренно сфокусированным на верхнем левом углу, преимущественно воспринимается часть объекта, обозначенная цифрой 1. Создается временная модель этой части, представляющая собой не очень четкое воспроизведение последней при обобщении всего остального объекта (рис. 17, б). Затем фокусировка переходит на часть 2, далее на часть 3 объекта, и они отпечатываются в модели. Модели в предыдущих кад­ рах еще сохраняют активность, и от них проторяются связи к следующему кадру. В каждом кадре на соот­ ветствующих элементах отмечаются направление и сте­ пень фокусировки всей системы рецепторов (назовем ее «глазом»). После того как настройка на крупные части обойдет их и они отпечатаются на кадрах, структу­ ра их расположения вырисуется в «модели-схеме» (рис. 17, в). Вся серия картин, отображенных в кад­ рах, объединена продольными связями. На этом вос­ приятие может закончиться, но может быть продол­ жено на следующий цикл, состоящий в еще большей фокусировке (напряжении) «глаза», нацеленной на детальное рассматривание каждого блока с отражени­ ем тонких подробностей его структуры, «привязанных» к блоку, а через него — и к общей структуре объекта.

На рис. 17, г этому случаю соответствует модель, фор­ мирующаяся при восприятии части 1 объекта сильно сфокусированным зрением. Весь процесс рассматрива­ ния объекта запечатлевается в серии кадров. В це­ лом — это «фраза» изучения предмета, запечатленная в кадрах рецепторного поля.

Вспоминание, обобщение, забывание В первое время вся система моделей в серии кадров активна, и если отключить рецепторы, то можно заново их просмотреть с начала до конца, как бы повторив процесс реального изучения, повторно активируя запечатленные образы. Так человек и дела­ ет, мысленно повторяя только что услышанную фразу или воссоздавая в воображении процесс рассматрива­ ния сложного объекта. Это бывает в том случае, когда объект или фраза заинтересовывает наш разум. При таком повторении связи между элементами проторяют­ ся и происходит процесс перехода временной памяти в длительную, поэтому картину еще можно вспомнить некоторое время спустя. При многократном вспомина­ нии связи проторяются сильно и объект может запом Рис. 18. Типичная динамическая характеристика связи между эле­ ментами А и Б. Повышенная про­ ходимость связи остается после прекращения возбуждения эле­ мента А (заштрихованный уча­ сток на оси времени). — оста­ точная проходимость связи, опре­ деляющая «вклад» связи в по­ стоянную память.

ниться во всех его деталях. Если же значимость пред­ мета не очень велика и повторения не имеют большой активности, то происходит обобщение, то есть посте­ пенное сокращение модели за счет забывания мало­ значащих ее частей, которые были неактивны при вос­ приятии или не привлекли интереса во время повто­ рения. Так исчезают из памяти целые кадры.

В конце концов может остаться лишь очень обоб­ щенная модель предмета, однако при этом сохраняется воспоминание о самом факте детального изучения объ­ екта, знание о том, что он был изучен подробно. Види­ мо, это обобщенная модель самого процесса переклю­ чения настройки «глаза».

Образ предмета запечатлевается не в одном кадре памяти, а целой их серии, многократно, хотя и с раз­ ными деталями. Это соответствует данным физиологии о том, что удаление какой-либо части затылочной области коры не разрушает определенных участков зрительной картины, а просто обедняет ее всю.

Если объект не имел ценности и картина его не вспоминается повторно, то образ совершенно исчезает из памяти, поскольку для проторения первично воз­ никающих связей необходима повторная активация элементов модели. Но, так или иначе, с течением вре­ мени происходит закономерное «освобождение» памя­ ти, потому что запомненная картина-модель всегда значительно упрощена по сравнению с воспринимае­ мой и, следовательно, не занимает все элементы «ре цепторного поля».

При восприятии изменяющейся картины рецепто­ ры повторно подключаются к предмету, в результате получается новая серия моделей-кадров, имеющая свя­ зи с первой.

В соответствии с этой гипотезой кратковременная и длительная память реализуется на одних и тех же элементах «нейронной сети» в одном рецепторном Рис. 19. Схема постепенного забывания и сокращения модели объекта, первоначально состоящей из серии кадров с разной обобщенностью и детальностью,— линия а. Менее значимые и похожие детали заменяются одной — линия б. Потом остаются только две крайние модели (линия в) и, наконец, лишь одна обобщенная модель г.

поле, первая — за счет активности элементов, вторая — за счет развития связей. Переход между ними возмо­ жен в виде кратковременной памяти связей. Последняя задается характеристикой изменения проходимости связи во времени по такому же типу, как и харак­ теристика изменения активности элемента, но удли­ ненной во времени и уменьшающейся не до нуля, а до некоторой остаточной величины, определяющей «вклад» связи в длительную память. При повторном использовании данной связи такие «вклады» () на­ капливаются и определяют прочность памяти (рис. 18).

Если модель повторно не возбуждается, то связи не функционируют, и их проходимость уменьшается. По­ вторная активация модели сопровождается трениров­ кой ее элементов, что выражается в изменении ее статической и динамической характеристик, а также в повышении уровня спонтанной, собственной «актив­ ности покоя» модели.

На рис. 19 показаны этапы забывания и постепен­ ного сокращения модели, так что в результате остается только несколько обобщенных и связанных с ней «частных» моделей, характеризующих объект лишь в отношении его значимости, то есть полезности.

Разумеется, для того чтобы с помощью элементов одного «рецепторного поля» запоминать все новые и новые модели, нужно допустить наличие большого количества кадров. Кроме того, необходимо предполо­ жить торможение моделей как состояние, противопо- ложное активности, возбуждению. Торможение — от­ рицательная активность, требующая для своего пре­ одоления дополнительной «мощности», идущей по связи от внешнего источника — рецептора или сосед­ него возбужденного элемента.

О реализации гипотезы Наша гипотеза предполагает строение «рецепторного поля» в виде сети из элементов с не­ ограниченно большим количеством связей. Примерно такая структура имеет место в коре мозга. Воспроиз­ вести ее техническими средствами пока не представля­ ется возможным, разве что в очень ограниченных пре­ делах, которые едва ли смогут обеспечить демонстра­ тивность устройства. Все надежды на алгоритмический интеллект.

В АИ все виды памяти должны существовать раз­ дельно. Время нужно делить на такты и все расчеты активности моделей и проходимости связей осущест­ влять «ступенчато», от такта к такту. Первый вид па­ мяти в АИ — это картина с рецептора. Она существует очень короткое время и считывается, перекодируется по определенным правилам, которые еще нужно со­ здать. Получается ряд цифр, отражающих как саму структуру объекта, так и перечисленные выше парамет­ ры модели. Главный из них — это уровень активности каждого объекта модели картины. Поскольку процесс рассматривания даже неподвижной картины выража­ ется в серии кадров типа показанных на рис. 17, то и цифровое выражение модели объекта будет состоять из нескольких строк цифр, кодирующих каждый кадр восприятия. Связи выразятся адресами кадров. Тогда два-три кадра составят «фразу» — модель объекта во временной памяти. Параметр активности кадра в це­ лом и его отдельных объектов будет понижаться по определенной характеристике, сходной с представлен­ ной на рис. 18. По мере отдаления во времени кадры станут «бледнеть», утрачивать детали, так что вся «фраза» будет становиться все короче и короче. Если не произойдет повторного привлечения внимания и ак­ тивации «фразы», модель сотрется из памяти. Если же активность и связи будут подновляться повторным использованием модели, то через некоторое время, пре­ дусмотренное характеристикой, модель перейдет в длительную память вместе со своими связями-адреса­ ми. Пересчет активности и связей всех моделей в кратковременной памяти обязателен для каждого такта.

Длительная память в АИ выражена «фразами», перешедшими из кратковременной памяти. Сейчас трудно представить всю организацию массива памяти.

Думаю, что он должен состоять из большого числа «словарей фраз», построенных из 2—4 «слов» каждая.

Во «фразах» будут широко использоваться обобщенные модели.

В СИ все модели постоянно сохраняют хотя бы минимальную активность, вследствие чего связи меж­ ду ними постоянно изменяются. Это очень затрудняет воспроизведение СИ на ЦВМ, поскольку с увеличени­ ем объема сетей катастрофически возрастает объем расчетов. АИ позволяет уменьшить расчеты за счет удлинения интервалов времени между пересчетами связей массива длительной памяти.

Действия с моделями Здесь мы рассмотрим только важней­ шие действия с моделями. К ним можно отнести дей­ ствия активации моделей, их сравнения, а также до­ писывания «фразы» и обобщения моделей.

Активация моделей В памяти находится масса моделей, составленных из «слов», «фраз», «букв» разных «ал­ фавитов». Модели объединены связями, по которым они взаимодействуют друг с другом. Большинство моделей находится в неактивном состоянии. В част­ ности, это касается всех моделей длительной памяти АИ и в меньшей степени — СИ, в котором нет разделе­ ния активной и пассивной (кратковременной и дли­ тельной) памяти. Деятельность интеллекта связана с активацией новых моделей в длительной памяти и постепенным затуханием активности моделей в крат­ ковременной памяти. В мозге и в ИИ на физических сетях каждый элемент модели — нейрон — или целую модель — ансамбль из нейронов — можно представить как генератор специальной («нервной») энергии, воз­ никающей в ответ на действие такой же энергии, кото­ рая поступает по связям от других моделей. Генератор работает по статическим и динамическим характе­ ристикам, подобным показанным на рис. 8 и 9. Энер­ гия передается по связям на другие модели;

количе­ ство ее определяется проходимостью связи.

Активное состояние модели можно назвать физио­ логическим термином «возбуждение». В нейронах моз­ га оно выражается частотой импульсов, в СИ на физи­ ческих сетях — это электрический потенциал. В ИИ, моделируемом на цифровых машинах, уровень актив­ ности моделей — это главный параметр, «буква», вы­ раженная числом, и его нужно пересчитывать для каждого временн'ого такта по статическим и динами­ ческим характеристикам. Впрочем, для АИ это каса­ ется только моделей в кратковременной памяти. Опе­ рации активирования моделей могут быть двух видов:

извлечение модели из длительной памяти с расчетом ее активности или пересчет уровня активности модели, уже находящейся в кратковременной памяти, если она получает дополнительный импульс по связям от дру­ гой модели.

В СИ выбор новой модели для активации определя­ ется структурой связей, идущих от активной модели.

В АИ новая модель вызывается из длительной памяти по «адресу», записанному в «словаре фраз», в котором первым «словом» является уже возбужденная модель.

Например, есть «словарь» предмет—действие, в нем есть модель «хлеб», ей соответствует модель действия «жевать». Последняя и будет вызвана, если в оператив­ ной (кратковременной) памяти содержится возбуж­ денное «слово» «хлеб». Уровень активности модели «жевать» будет подсчитан, исходя из статической характеристики коэффициента проходимости свя­ зи, записанного в «словаре», и активности модели «хлеб».

В соответствии с нашей гипотезой для функциони­ рования интеллекта необходимо еще другое состояние, противоположное по знаку возбуждению,— так назы­ ваемое «торможение». Этот термин принят в нейро­ физиологии. Мы его представляем как отрицательную активность, которая тоже генерируется специальными центрами и вычитается из положительной активности при расчетах. Впрочем, необходимость в торможении нужно еще уточнять при проектировании ИИ.

Сравнение моделей и распознавание образов Второй тип операции с моделями — это их сравнение между собой с целью установления как общности, так и различия. Реализация действия целиком зависит от вида интеллекта и организации памяти. В мозге сравнение осуществляется, по всей ве­ роятности, путем условного «наложения» моделей друг на друга. При этом их сходство и различие определяют­ ся по количеству общих элементов. Из физиологии из­ вестно, что очаг возбуждения в коре генерирует тормо­ жение на окружающие участки, затем возбуждение первого очага падает, его «соседи» освобождаются от торможения, и возбуждается другой очаг коры. Можно предполагать, что этим следующим очагом, то есть моделью, будет такой очаг, у которого много связей с первым или много общих нейронов в составляющих модели ансамблях. Сходство и различие определяются по отношению к каким-то третьим моделям-признакам, связи к которым идут от первой и второй из сравни­ ваемых моделей. Допустим, что первая возбужденная модель вызвала к активности признак 1, а вторая — активированная по сходству — возбудила признак 2.

Степень совпадения признаков — это мера общности и различия моделей. У животных нет количественного выражения для этой меры, у человека, овладевшего счетом, она есть.

Для АИ сравнение моделей — банальная операция вычитания двух строк цифр. Выраженная цифрами модель разделена на разряды со своими значениями.

Можно предположить, что в первом разряде представ­ лена наиболее обобщенная модель (какое-то матери­ альное тело), во втором — крупные структурные блоки (голова, туловище, ноги, отличающие человека), в по­ следующих разрядах — детали. Такой образ всегда имеет место, когда мы воспринимаем объект, даже при фокусировке зрения на его деталях. По этим раз­ рядам и будет осуществляться сравнение.

Сравнение известной модели с неизвестными лежит в основе распознавания образов. По модели объекта, отпечатанного с рецептора в кратковременной памяти, которая не имеет связей с другими моделями и, сле довательно, является неизвестной, нужно найти модель-эталон, имеющую такие связи, иначе говоря, входящую в различные «фразы» и числящуюся в «словарях». Именно связями определяется то, насколь­ ко знаком нам тот или иной объект: чем больше свя­ зей, тем лучше мы его знаем. Вероятность распозна­ вания определяется точностью совпадений неизвест­ ной модели с эталонами. Множественное число я упо­ требил не случайно: объект может походить на не­ сколько других, известных.

Распознавание в СИ осуществляется автоматиче­ ски: ансамбль возбужденных с рецептора элементов, который представляет собой модель неизвестного объ­ екта, накладывается на другую модель. Она активи­ руется, а затем активируются связанные с ней модели, опознающие объект. Поочередно может активировать­ ся несколько похожих моделей, каждая со своей сте­ пенью сходства.

В АИ для распознавания модели нужна специаль­ ная программа извлечения из постоянной памяти се­ рии моделей и сравнение каждой из них с моделью объекта. Выборка моделей из памяти должна произво­ диться начиная с самого обобщенного признака — «буквы». По ней выбирается «словарь» и далее срав­ ниваются вторые и следующие «буквы», так же как производится поиск значения «слова» по «словарю».

«Известность» наиболее близкого из искомых «слов» определяется числом вхождений его в «словари фраз».

Степень вероятности опознания объекта определяется совпадением последних «букв» — деталей, потому что по первым «буквам», определяющим обобщенные при­ знаки, всегда можно найти много похожих. Человека легко отличить от других объектов, труднее распо­ знать — кто есть кто.

Остановлюсь на двух обстоятельствах, осложняю­ щих распознавание. Первое — «неполнота» модели объекта, обусловленная помехами восприятия, даль­ ностью расстояния или недостаточным напряжением рецептора. Неполнота или неясность первичной модели выражается в отсутствии ряда деталей, в «крупноблоч­ ности». При этом всегда присутствует «буква», объ­ ясняющая неполноту,— показатель низкой настройки рецептора или наличия внешних помех. Я намеренно не употребил понятие «обобщенность» применительно к такой модели, потому что оно предусматривает вы­ ражение модели крупными блоками в результате спе- Рис. 20. Схема гипотетических «рельсов» в «рецепторном поле», позволяющих производить приведе­ ние модели к одному определенному размеру. В памяти хранится мо­ дель а. При восприятии объекта с близкого расстояния большая мо­ дель б уменьшается до размеров а;

при восприятии объекта с большого расстояния малые модели в или г увеличиваются до размеров а.

циального отказа от деталей, а не отсутствия их из-за плохого восприятия. Неполную модель можно распо­ знать, только сравнивая ее с обобщенными моделями эталонами, чем и определяется полнота распознавания.

Например, видно, что объект — человек, но мужчина это или женщина, определить нельзя из-за неясности образа. Более четкую первичную модель можно полу­ чить за счет настройки рецепторов или приближения к объекту.

Второе обстоятельство — это различие в размерах первичной модели и моделей-эталонов. Общеизвестно, что человек может распознать объект с разного рас­ стояния, если он хорошо изучен вблизи. Распознава­ ния прямым наложением моделей здесь не получится.

Нужно допустить специальный механизм приведения модели к одному определенному размеру в виде свое­ образных «рельсов» в «рецепторном поле», как по­ казано на рис. 20. «Рельсы» эти позволяют изменять размер первичной модели, сохраняя сходство. По всей вероятности, нечто подобное есть в зрительной области коры. Для АИ перекодирование первичной модели цифровым кодом должно предусматривать приведение к стандартному размеру моделей-эталонов.

Есть еще ряд обстоятельств, затрудняющих распо­ знавание: различия исходных положений объекта, его деформации и др. Многие из возникающих здесь вопросов подробно исследовались кибернетиками, и полученные ими результаты можно применить и для АИ.

Дописывание «фразы» — вспоминание Операцией дописывания «фразы» можно назвать активацию какой-либо одной модели, являющейся следствием активации другой модели.

Активация происходит по связи, соединяющей обе эти модели. Такую операцию можно еще обозначить тер­ мином «вспоминание». Активация последовательности «слов» во «фразе» осуществляется по принципам, опи­ санным в начале этого раздела. «Фразы» могут быть самыми различными, в них может запечатлеваться любая последовательность воспринятых образов, за­ крепленная в памяти повторным вспоминанием. В АИ «фразы» записаны в «словарях фраз». Их много:

предмет—действие, предмет—качество и др., и на­ оборот. Важными являются, так сказать, вертикаль­ ные «фразы»: «вверх» — от детали к обобщению, «вниз» — как расшифровка обобщенной модели деталь­ ными вариантами. Память в АИ должна состоять из коротких «фраз» в 2—4 «слова», а длинные последова­ тельности моделей должны составляться из нескольких «фраз». Это проще, чем создавать «словари» длинных «фраз». Человеческий разум тоже оперирует коротки­ ми «фразами» образов. Вызов следующего «слова» «фразы» возможен только в случае достаточной актив­ ности первого «слова» и достаточной проходимости связи от него ко второму. Активность рассчитывается по входам на первое «слово» от других моделей (по другому «словарю»), а параметр связи записан в «сло­ варе».

Обобщение моделей Операция выделения обобщенной мо­ дели из серии конкретных моделей осуществляется их последовательным сравнением и выделением общего признака сходства между ними (пример — «четверо­ ногие»). При этом все остальные признаки, по которым модели серии отличаются друг от друга, становятся все более неясными, иными словами, в обобщенной модели они выступают с низкой активностью. Такая обобщенная модель, полученная на материале ряда конкретных моделей, имеет «букву обобщения», ука зывающую название действия, в результате которого модель образовалась. Этой «буквой» она отличается от неясной модели конкретного объекта, при которой стоит «буква восприятия».

Замена ряда конкретных моделей одной обобщен­ ной является весьма распространенной операцией. Идя по лесу, вы видите множество деревьев. Все они отражаются во временной памяти, и некоторое время спустя еще можно припомнить отдельные деревья.

Однако потом конкретные образы заменятся неким обобщенным деревом, усредняющим виденные распро­ страненные экземпляры («лес из высоких сосен»). При этом обобщенная модель сопровождается «буквами» с адресами действий, отрезков пространства или вре­ мени. Обычно обобщенная модель имеет структурный ранг на одну степень выше, чем конкретные составля­ ющие. Например, в «обобщенном дереве» ветки и ли­ стья не дифференцируются по породам. «Обобщенный человек» выглядит бесполым, поскольку его черты совершенно неясны.

Обобщение касается всех видов моделей — зритель­ ных и слуховых образов, моделей действий, моделей качеств, иногда самых специфичных. «Ранг обобще ния» может быть самым различным, но образное выра­ жение обобщений высокого ранга затруднительно, и они выражаются только с помощью речи. Например, можно представить «обобщенный стул» в виде неясно­ го образа предмета со спинкой, сиденьем и ножками, но как зрительно представить себе «обобщенную ме­ бель»? Здесь совершенно разные предметы обобщены по признаку функции или места нахождения. Если потребовать: «Представьте мебель», то выступает ряд неясных предметов мебели и «буква обобщения», ука­ зывающая, что есть еще много подобных образов.

Только речь позволила обозначить этот уровень обоб­ щения и таким образом дала возможность произвести сами действия.

Можно ли образно представить «вещь»? Или «ма­ териальное тело»? Можно, в виде неясной структуры, отграниченной от других. Зрительный образ такой структуры имеется как «что-то», но выделить его по­ зволили только слова речи — «вещь», «тело», «суще­ ство», «человек», «животное». Можно предполагать, что черты обобщения всегда присутствуют в конкрет­ ной модели. Так, например, понятие «материальное тело» присутствует в модели стула, отражая то обсто ятельство, что стул — это пространственная структура, отграниченная от среды.

Для цифрового кодирования образов при создании АИ нужно, вероятно, отразить отдельными цифрами принадлежность данной конкретной вещи к основным уровням структурной иерархии обобщения. Для этого необходимо создать систему обозначений. Разумеется, нельзя в модели представить все возможные парамет­ ры, по которым можно обобщить, например, стулья, но следует отметить, что они принадлежат к приспо­ соблениям для сидения, к мебели, к предметам (то есть неживым телам). Это удлинит конкретную модель, но упростит операции с ней. Впрочем, не стоит вда­ ваться в детали, поскольку возможны разные системы перекодирования образов в цифровые модели.

На этом я закончу рассмотрение операций с мо­ делями, хотя далеко не исчерпал их варианты. Важно усвоить главные, потому что они постоянно присутст­ вуют в программах интеллекта, и хотелось бы при дальнейшем изложении не касаться деталей операции, а просто обозначать ее.

Взаимодействие моделей в интеллекте В предыдущих главах мы разобрали следующие вопросы:

1. Принципы структурного и энергетического по­ строения среды, в которой действуют интеллекты. Два основных типа искусственного интеллекта — сетевой (СИ) и алгоритмический (АИ).

2. Понятие о моделях, их структурное и энергети­ ческое выражение. Хранение моделей — память.

3. Основные программы действий с моделями — в смысле их превращений и обращения с разными вида­ ми памяти.

Последние два пункта разделены довольно условно.

Теперь можно перейти к главному: как должны взаимодействовать модели в интеллекте, чтобы в ре­ зультате выполнялось его назначение — управление объектами внешней среды, собственным «телом» и да­ же самим собой.

Если возможно бесконечное количество моделей любого сложного объекта, то мыслимо и бесконечное количество интеллектов для управления им. Посколь­ ку трудно сразу объяснить самые высшие проявления интеллекта, придется проследить его эволюцию от про­ стого к наиболее сложному.

Объекты внешней среды воспринимаются рецепто­ рами, которые направляют соответствующий код в мо­ делирующую установку («мозг»). Здесь создаются модели среды, по которым выбираются модели дей­ ствий, реализуемых через органы действий или эффек­ торы (у живых существ — мышцы). Кроме того, интел­ лекту должно быть обязательно придана энергетиче­ ская установка («тело»), которая снабжает энергией мозг, рецепторы и особенно — эффекторы, поскольку они должны развивать некоторые усилия для воздей­ ствия на объект. В свою очередь «тело» должно полу­ чать энергию или вещество извне, причем в результате деятельности интеллекта, направленной на среду. Важ­ нейшим элементом интеллекта являются критерии управления объектом, которые в то же время управ­ ляют действиями с моделями. Получается своеобраз­ ная цепь: объект управляется через эффекторы, по­ следние — моделями, а сами модели управляются критериями. Какова же природа критериев?

Один из критериев ясен: для того, чтобы интел­ лект мог выполнять свои функции, он должен получать энергию, следовательно, должен обеспечивать снабже­ ние «тела» извне, и качество этого снабжения являет­ ся критерием деятельности интеллекта. Итак, «тело» диктует разуму. Это старая истина, вполне объясняю­ щая разум животных. Он выполняет роль компьюте­ ра для реализации программ инстинктов, заложенных в генах. Однако даже для животных дело обстоит не так просто: критерии для своей деятельности форми­ рует сам мозг на основе восприятия и переработки сигналов, поступающих от тела. И еще сложнее: не­ которые критерии черпаются из внешней среды. Ни­ какого парадокса тут нет — животное само является частью среды, продуктом эволюции, в которой среда всегда присутствует в качестве фактора отбора.

Разум животных давно превзойден разумом чело­ века. Поэтому понятие критериев гораздо сложнее, чем кажется на первый взгляд.

Как говорилось, при познании сложных систем возможно бесконечное множество моделей. Это касает­ ся не только моделирования неизменных структур, пределом которого является повторение, копирование объекта, как делается в технике. Изменение объекта во времени — тоже предмет познания, поскольку са­ мо управление состоит в изменении его во времени в нужном направлении. Предметом моделирования ста­ новятся прошлое, настоящее, будущее и не только сам объект, но и среда, его окружающая. Так же бесконеч­ ны пределы моделирования управляющих действий, Рис. 21. Расширенная схема интеллекта.

— природа;

— техника;

ВМ — внешние модели;

О — общество. «Входы» и «выходы»: И — информация, сигналы;

Эн — энергия;

ТУ — технические устройства;

Рц — рецепторы;

Рцэ — рецепторы органов воздействия;

Н — настройка рецепторов;

Рцт—рецепторы «Тела»;

МУ — моделирующая уста­ новка «Мозг»;

МД — модели действий;

Э — эффекторы.

поскольку их можно создавать в процессе творчества, а не ограничиваться выбором из заданных. Более то­ го, так как критерии заложены в мозге и тоже являют­ ся моделями некоторых качеств — объекта, среды, те­ ла, самого мозга, то возникает возможность умножать критерии. Разум может быть относительно самостоя­ тельным фактором развития мира.

На рис. 21 показана схема интеллекта уровня человека и его отношения к внешнему миру, к среде.

На схеме она представлена четырьмя составляющими.

Это прежде всего природа, понимаемая во всей сово­ купности ее факторов. Затем — техника, под которой подразумеваются орудия воздействия на природу. Еще выше внешние модели — это наука. Наконец, навер­ ху — общество. Новая схема отличается от предыду­ щей тем, что рецепторы получают не только энергию, косвенно сигнализирующую о внешней среде, но и прямую информацию в виде сигналов — от общества и внешних моделей. Между средой и рецепторами Рц встроены технические устройства ТУ1. Это всевозмож­ ные приборы, предназначенные для усиления внешних воздействий и превращения невоспринимаемых орга­ нами чувств видов энергии в воспринимаемые. Точно так же эффекторы Э могут быть вооружены инструмен­ тами ТУ2, значительно увеличивающими мощность их воздействий. От эффекторов идут стрелки, показы­ вающие движение не только энергии, но и информа ции — сигналов, направленных в высшие системы, например в общество. Рецепторы имеют органы на­ стройки Н, а эффекторы — свои собственные рецепто­ ры Рцэ, обеспечивающие сигналы обратной связи. Ре­ цепторы есть и в теле (Рцт). Моделирующая установка МУ («Мозг») содержит модели внешней среды, тела, а также модели собственных программ и моделей дей­ ствий Д. Наиболее разнообразны критерии Кр: в них представлены не только значимые качества тела, но и всех отделов внешней среды и, что самое интерес­ ное,— некоторые качества работы МУ («мозга»).

В любом интеллекте заложены исходные модели, первичная структура связей и основные критерии. Все это обеспечивает начало деятельности. Дальнейшее саморазвитие интеллекта зависит от количества эле­ ментов и их исходных характеристик — главным обра­ зом их тренируемости и способности к образованию связей. Такой интеллект, получая извне информацию, становится способным к обучению и воспитанию под действием общества и его моделей. Воспитание понима­ ется как изменение первичных критериев и формиро­ вание новых. Высшим проявлением развития интеллек­ та являются творчество, самопознание и самовоспита­ ние, то есть способность не только создавать новые модели воздействий и претворять их в вещи с помо­ щью техники, но и формировать новые критерии, из­ меняющие направление деятельности интеллекта в сторону от программ, заложенных при его создании и воспитании со стороны общества.

Высшим проявлением интеллекта является воспро­ изведение самого себя техническими средствами и по­ следующий неограниченный рост его мощности. Мно­ гие фантастические предположения в этом направлении вполне допустимы, и их реализация является лишь вопросом времени и средств. Но разговор об этом еще впереди. А пока обратимся к подробному рассмотре­ нию программ интеллекта, начиная с наиболее про­ стых его вариантов.

Критерии, потребности, чувства, стимулы Основу деятельности интеллекта как действий с моделями составляют изменения активно­ сти его элементов. Активность — это энергия. В живых системах каждый нейрон генерирует специфическую энергию нервных импульсов, источником которой яв­ ляется химическая энергия, получаемая в каждой клетке в ее митохондриях. Они преобразуют энергию глюкозы и жиров в фосфорные соединения, которые и используются клеткой для своих нужд: в нейроне — на нервные импульсы, в мышце — на механическое сокращение, в железе — на синтез новых молекул.

Мощности этой «электростанции» изменяются за счет тренированности или детренированности — процессов, которые в свою очередь определяются «запросами на специфическую функцию», предъявляемыми к клетке организмом как целым через его регулирующие воз­ действия.

В искусственном интеллекте также необходимо со­ хранить параметры активности элементарной модели, ее тренированности и детренированности как важней­ шие средства его деятельности. Без этих параметров я не мыслю возможности создания ИИ. Другое дело, что энергетические затраты на активацию элементов ИИ могут быть ничтожно малы и не иметь значения (впрочем, они невелики и в организме), но выражение активности числом необходимо для осуществления про­ грамм взаимодействия моделей.

В живом мозге каждая нервная клетка — трениру­ емый «генератор импульсов», но для того чтобы она функционировала, выдавала эти импульсы, ей нужна стимуляция, то есть раздражение извне. Источником раздражения является прежде всего тело и во вторую очередь — внешняя среда. Тело действует не только через рецепторы, но и при помощи активных химиче­ ских веществ, целенаправленно раздражающих центры в подкорке, являющиеся носителями тех самых крите­ риев, о которых говорилось выше. Рецепторы, воспри­ нимающие воздействия внешней среды, не только акти­ вируют нейроны «рецепторных полей», но действуют и более сложным образом. Путем обработки моделей среды выделяются сигналы, воздействующие на специ­ фические нейронные ансамбли, которые соответствуют критериям — определенным качествам внешней среды, влияющим на поведение животного наряду с «требова­ ниями тела», такими очевидными, как голод. Приме­ ром «внешних» критериев является любознательность.

Этот критерий — стимул поведения животных, хотя для него нет «представительства» в теле, а качество новизны, возбуждающее центры любознательности, принадлежит среде.

Рис. 22. Зависимость чувства от « платы ».

Чувство изменяется от «неприятно» НПр до «приятно» Пр в зависимости от удов­ летворения потребности измеряемой ве­ личины «платы», которую нужно доба­ вить к ее исходному уровню а, с тем чтобы получить полное удовлетворение.

Реальный стимул к некоторому действию для удовлетворения потребности измеря­ ется приращением чувства Ч от исход­ ного уровня а до уровня б ожидаемой «платы». Притязание — это «плата», необ­ ходимая для получения максимума чув­ ства. Пунктирными линиями показаны новые характеристики потребностей, получаемые после адаптации: если потребность систематически не удовлет­ воряется, характеристика смещается влево, то есть притязание уменьшае­ тся, если же потребность удовлетворяется, характеристика смещается вправо, то есть притязание возрастает.

Понятие об информационных критериях как неко­ торых моделях-центрах, которые возбуждаются путем выделения информации из воздействий среды, но в то же время сами являются источником активности для других отделов мозга, исключительно важное. Его значение еще недостаточно осознано физиологами.

У животных есть врожденные модели — программы переработки внешней информации и выделения из нее значимых, ценных качеств — критериев. Их суб­ страт — «центры» критериев — представляется осо­ бенно активным «генератором» нервной энергии, сти­ мулирующим деятельность мозга. Значимые качества внешней среды могут быть самыми различными: но­ визна, превосходство собратьев по стае и пр.

Структурно критерии можно представлять при по­ мощи моделей, имеющих «входы», «выходы» и харак­ теристики примерно такого типа, как показано на рис. 22. Поскольку критерий является источником энергии для деятельности интеллекта, его можно свя­ зать с понятием стимула. Возможен случай, когда в результате деятельности совершаются процессы, даю­ щие отрицательный стимул, то есть тормозящие ис­ ходную деятельность.

С понятием критерия тесно связано еще одно пси­ хологическое понятие — потребность, неудовлетворе­ ние которой побуждает к действию. Потребность явля­ ется источником энергии для активации моделей. Ее можно выразить через критерий, как это сделано на рис. 22. Логично предположить, что когда потребность полностью удовлетворена, стимул для деятельности, направленной на ее удовлетворение, должен прибли- зиться к нулю. И наоборот, когда потребность совсем не удовлетворяется, иными словами, когда субъект — интеллект — не получает никакой «платы» от среды, стимул должен быть максимальным. Словом «плата» я буду широко пользоваться, понимая под ним все материальные, информационные и любые другие воз­ действия среды, получаемые интеллектом в ответ на его деятельность.

Явление адаптации тоже известно в психологии:

если животное голодает, оно готово есть любую пищу, если же оно все время сыто, его пищевой центр адап­ тируется и требования к пище возрастают — подавай только вкусную. Однако если его снова заставить по­ голодать, все станет на свое место. Особенно распро­ странена адаптация к приятному, к избытку «платы».

К сильному голоду адаптироваться нельзя. При чисто психических функциях возможна значительная адап­ тация и к недостатку «платы» (пример — бедность информации). Уровнем притязаний можно назвать ве­ личину «платы», которая необходима для полного удовлетворения потребности, когда стимул приближа­ ется к нулю. Выражение конкретной потребности — это приращение «платы» от ее данного среднего уров­ ня до уровня притязаний, до насыщения.

Понятия потребности и стимула тесно связаны с другим термином из психологии: «чувство». Его мож­ но трактовать как субъективную меру удовлетворения потребности. Известно, что разная степень удовлетво­ рения одной и той же потребности дает противополож­ ные чувства — приятные или неприятные. Полный голод, когда потребность не удовлетворена,— неприя­ тен. По мере насыщения наступает момент «нулевого чувства», если продолжать есть, появляется отчетливо приятное чувство. Оно достигает максимума при пол­ ной сытости, и стимул к еде в этот момент равен нулю.

Стимул как источник деятельности начинается от пол­ ного голода, уменьшается по мере насыщения и исче­ зает при полной сытости. Таким образом, он изменя­ ется от нуля до максимума. Величина чувства изменя­ ется от отрицательного значения (неприятное чувство) до положительного (приятное). Стимул — это прира­ щение алгебраической суммы чувств Ч от исходно­ го до ожидаемого конечного их состояния.

Психологические компоненты приятного и непри­ ятного наличествуют в каждой потребности. Сум­ марный уровень душевного комфорта (УДК) или Рис. 23. Формирование оптимального напряжения действия (тру­ да) при взаимодействии системы и среды.

А — характеристики среды: а — изменение величины «платы» в ответ на напряжение;

б — изменение величины сопротивления среды в ответ на на­ пряжение. В — характеристики рабочего элемента: изменения положитель­ ного чувства Чпл в ответ на «плату» и чувства утомления Ут от преодоле­ ния сопротивления среды. В — суммарная характеристика: сумма чувств Ч имеет максимум, определяющий интенсивность труда. Уровню напряже­ ния в соответствует «плата» г, сопротивление среды д и «тормоз» деятель­ ности е.

усредненный уровень счастья — это тот показатель, к максимуму которого стремится каждый интеллект в живой природе, соответствующим образом выбирая свою деятельность. Этот показатель, как будто не имеющий отношения к искусственному интеллекту, тем не менее и для него является важнейшим рабо­ чим параметром, так же как понятия чувств. Как ни странно, но мне кажется невозможным создание высо­ коразвитого искусственного интеллекта без этих пара­ метров. Конечно, их можно было бы обозначить каки­ ми-то абстрактными символами, но это не упрости­ ло бы понимания сути дела. Я глубоко убежден, что без моделирования многих, казалось бы, чисто челове­ ческих или даже животных чувств, создание ИИ вооб­ ще невозможно.

На рис. 23 показано формирование оптимального напряжения действия (труда) как результат суммиро­ вания критерия-стимула и критерия-«тормоза» функ­ циональной системы, взаимодействующей со средой.

«Плата» а подается на рабочий элемент, формирую­ щий соответствующее чувство ЧПЛ. Одновременно дея­ тельность встречает сопротивление б, вызывающее уто­ мление Ут. Это «тормоз», ослабляющий стимул ЧПЛ.

За счет нелинейности обеих характеристик устанавли­ вается некоторое равновесие между насыщением кри­ терия-чувства, «тормозом» и уровнем напряжения деятельности. Практически же происходит колебатель ный процесс за счет тренированности и детренирован ности рабочего элемента. С другой стороны, управляю­ щий элемент — критерий-стимул — действует по дру­ гим законам: он способен к адаптации.

Принцип адаптации состоит в том, что характери­ стика управляющего элемента, в частности генератора критерия-стимула, своеобразно изменяется. Если по­ требность постоянно удовлетворяется, то крутизна его характеристики уменьшается (притязания возраста­ ют);

если она недостаточно удовлетворяется, то она увеличивается (притязания уменьшаются). Статическая характеристика рабочего элемента зависит от трениро­ ванности (см. рис. 9). Динамика адаптации и трениро­ ванности, то есть скорости изменения характеристики управляющего и рабочего элементов, неодинакова, по­ этому саморегулирующийся комплекс, составленный из них, функционирует даже в неизменяющейся сре­ де с некоторыми колебаниями около среднего уровня, на который был «спроектирован» комплекс — приро­ дой или конструктором. На рис. 9 показаны характе­ ристики тренированности и детренированности рабо­ чего элемента, а на рис. 22 — адаптация управляюще­ го элемента при разной степени удовлетворения по­ требности. Такая система рассчитана на работу в сре­ де, сопротивление которой не изменяется.

В действительности же среда не стабильна. «Сопро­ тивление» ее улавливается «тормозом». В первом приближении — это «утомление» рабочего элемента в зависимости от сопротивления его деятельности со стороны «выхода» в среде, на которую направлена его работа. На рис. 23 показаны характеристики «тормо­ за» в зависимости от напряжения деятельности рабо­ чего элемента и сопротивления среды.

«Плата» — это совсем не обязательно внешние воздействия среды. Источником активности могут быть внутренние структуры интеллекта (мозга), напри­ мер модели некоторых качеств внешней среды, выде­ ленные в процессе анализа ее моделей. Важно другое:

модель, обозначающая критерий-стимул, становится усилителем, генерирующим избыточные мощности, которые этот усилитель передает другим моделям, сти­ мулируя их активность. Проще всего предполо­ жить, что подобные модели-усилители запроектирова­ ны в генах живых существ. В действительности так и есть для некоторых врожденных чувств, выражаю­ щих потребности как функции инстинктов. Однако у Рис. 24. Характеристики потреб­ ностей и соответствующих чувств а, б, в. Разная значимость чувств выражается в различиях абсцисс на универсальной шкале «непри­ ятно» — «приятно» (НПр—Пр).

человека, кроме биологических потребностей, появи­ лись социальные, часть которых в генах не предусмот­ рена и которые выражаются в так называемых «убе­ ждениях». По мощности стимулов они иногда конку­ рируют с биологическими;

Социальные потребности выражаются привитыми обществом моделями словес­ ных формул, например долга («как надо»). Видимо, усилителем может стать любая модель, если ее актив­ но тренировать. Биологический субстрат разума — нервные клетки — это позволяют. Соответственно тре нируются и связи с этими «приобретенными чувства­ ми», так что в результате по значимости они действи­ тельно становятся в ряд с биологическими чувствами, которые уже изначально заложены как усилители.

Между прочим, воспитанием можно детренировать ли­ бо натренировать и биологические центры потребно стей, и их «коэффициент усиления» изменится.

Можно предположить, что как у моделей биологи ческих, так и у натренированных приобретенных по требностей высок уровень собственной, спонтанной ак тивности, обеспечивающий им постоянное воздействие на другие модели.

Pages:     || 2 | 3 | 4 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.