WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 20 | 21 || 23 | 24 |   ...   | 28 |

Если воспользоваться сравнением языка с шахматной игрой, к которому часто прибегают математики и логики вслед за Гильбертом и лингвисты вслед за Соссюром, то употребление языка человеком в обществе можно было бы сравнить со многими партиями, разыгрываемыми гроссмейстерами одновременно на разных досках. Хотя в реальном языковом общении каждый следующий «ход» в одной из партий (каждый разговор с новым собеседником) может и отделяться большим временем от всех предыдущих, в памяти эти партии (разговоры) должны храниться одновременно (все ходы записываются). Поэтому модель сеанса одновременной игры на разных досках и модель языкового общения в основном тождественны. Благодаря смысловым особенностям эгоцентрических слов человек обычно справляется с такой задачей.

Приведенная выше схема разговора робота, играющего в кубики, с человеком [115] содержит предельное упрощение за счет сведения обоих собеседников к паре постоянных партнеров. Поэтому эгоцентрические слова (я, ты) в такой схеме :водятся к ярлыкам (собственным именам), тождественным одному из партнеров. Если же представить себе реальные возможности общения на естественном языке многих людей с вычислительной машиной в режиме разделения времени (когда машина может одновременно обмениваться сообщениями с целым рядом потребителей), то одну из существенных трудностей при общении может представить понимание машиной эгоцентрических слов.

145

При общении машины со многими людьми практически существенной задачей может оказаться различение каждого участвующего в обмене информацией. Человек различает своих собеседников не благодаря эгоцентрическим словам, а вопреки им (к каждому из собеседников приложимы одни и те же личные местоимения). При опознании индивидуального человека вычислительной машиной были бы полезны не личные местоимения, а способы типа «собственной песни» или позывных, как каждый из нас умеет отличить знакомых по голосу, например при разговоре по телефону; согласно новейшим экспериментальным данным, эта функция выполняется «неречевым» — правым полушарием [25]; моделирование ее на автомате — анализаторе речи наталкивается на значительные трудности [30]. Высказывания, начинающиеся с я, означают всего лишь «источник данного сообщения» и не могут способствовать опознанию данного лица иначе как путем его отождествления с автором или источником сообщения.

Трудности (по-видимому, на сегодняшний день едва ли легко преодолимые), которые возникли бы при попытке обучения машины пониманию предложений, содержащих эгоцентрические слова, можно было бы пояснить на примере изречения Декарта я мыслю, следовательно, я существую. Логический анализ этого высказывания приводит к выводу, что оно содержит квантор существования ( □ ) существует мысль. Очевидно, изречение Декарта могло бы быть сообщено машине (или проанализировано ею самой) в форме: В источнике настоящего сообщения существует мысль, следовательно, источник настоящего сообщения существует. В этой форме сохранено эгоцентрическое слово «настоящий» («настоящее сообщение» употребляется в смысле индивидуального знака — 9). Можно себе представить, что каждое вводимое в машину сообщение нумеруется, т. е. индивидуальные знаки хранятся в памяти, закодированные соответствующими числами (это в точности соответствует идее Рей-хенбаха, предлагавшего считать номер каждого 9 индивидуальным знаком для этого 9).

Пусть изречение Декарта закон ровано как 9г. Тогда само сообщение 9; должно быть понято следующим образом: В источнике сообщения 9г существует мысль, следовательно, источник сообщения 9г существует (принципы формализованного изложения этой идеи намечены еще в XVII веке Спинозой в книге «Основы философии Декарта, доказанные геометрическим способом»).

Для обучения машины естественному языку в нее необходимо ввести некоторые предпосылки понимания значения слов (другой возможностью является формирование самой машиной системы

146

таких предпосылок, иначе говоря, определенной модели мира, по некоторым вводимым в нее исходным данным). К этим предпосылкам безусловно должно относиться и предположение, что у каждого вводимого в машину сообщения есть некоторый источник. В таком случае вторая половина изречения 9г автоматически следует из самого наличия сообщения 0г, введенного в машину. Что же касается первой половины, его интерпретация машиной зависит от понимания слова мысль. Если, как это представляется возможным, это слово понимается как равнозначное «переработке информации», то первая половина сообщения 9г будет понята как указание на наличие переработки информации Б самом источнике сообщения 0г. Это, по-видимому, также должно соответствовать некоторым предпосылкам понимания языка. В той мере, в какой сообщение 0г может быть понято машиной, оно все оказывается выводимым из предпосылок понимания языка и в этом смысле не несет никакой новой информации.

СООБЩЕНИЕ И ЕГО АВТОР

Определение смысла эгоцентрических слов невозможно без отождествления источника данного сообщения 9 с конкретным лицом. Но само это отождествление происходит чаще либо через это же сообщение 9 (как в примере с изречением Лютера, разобранным Рейхенбахом), либо через предшествующие сообщения, исходившие от того же источника. Большинство имен незнакомых ему лично людей, известных современному интеллигентному человеку, он определяет как авторов определенных сочинений (характерны обычные определения в кроссвордах: «Роман русского писателя XIX века» и т. п.).

В «Ревизоре» Гоголя Хлестаков в сцене хвастовства перед городничихой и ее дочерью приписывает себе множество популярных в те годы литературных сочинений:

«Хлестаков... Все это, что было под именем барона Брам-беуса, «Фрегат Надежды» и «Московский телеграф»... все это я написал.

Анна Андреевна. Скажите, так это вы были Брамбеус

Хлестаков. Как же, я им всем поправляю статьи. Мне Смирдин дает за это сорок тысяч.

Анна Андреевна. Так, верно и «Юрий Милославский» ваше сочинение

Хлестаков. Да, это мое сочинение.

Анна Андреевна.Я сейчас догадалась.

Марья Антоновна. Ах, маменька, там написано, что это господина Загоскина сочинение.

147

Анна Андреевна. Ну вот: я и знала, что даже будешь спорить.

Хлестаков. Ах да, это правда, это точно Загоскина; а есть другой «Юрий Милославский», так тот уж мой.

Анна Андреевна. Ну, это, верно, я ваш читала...»

Рассмотрим языковые высказывания двух видов: Я это написал (0i) и Загоскин — автор «Юрия Милославского» (92). Первое сообщение (9i) утверждает, что х — источник сообщения 0i, ранее был источником некоторого письменного сообщения 0^ (обозначено эгоцентрическим словом это). Во втором предложении (02) утверждается, что лицо у, носящее собственное имя Загоскин, является автором письменного сообщения 0;, известного под заглавием «Юрий Милославский». Сходство обоих высказываний, 0i и 02, заключается в том, что оба они утверждают связь автора (источника) с некоторыми сообщениями. Различие между ними состоит в эгоцентрическом характере высказывания 0ь Каждое из этих высказываний может быть записано на логическом языке с помощью йота-оператора: обозначая автора (источник сообщения) как А, можно записать

е] как (и) (Ляе*) &о*) (Лх8() при е^в*

% как (1у){Лу0,)

Различие между 0i и 02 обнаруживается в логической записи, из которой видно, что в 0i) утверждается двойное авторство х — по отношению к 0^ и к 0Ь В 02 утверждается, что существует один и только один индивид, который является автором 0; — «Юрия Милославского» и этот индивид тот же самый, что и Загоскин (на специальном языке математической логики можно сказать, что у имен Загоскин и автор «Юрия Милославского» — один денотат). Хлестаков сперва нарушает эту предпосылку правильного понимания языка, а потом выходит из положения, объявляя, что есть два разных романа с таким названием, а у них два автора: у одного (0) —Загоскин, а у другого (0^) —сам Хлестаков.

Следует подчеркнуть, что исключительная сложность и величина сообщения типа 0, составляющего целую книгу, делает в принципе невозможной в логической записи передачу всего такого сообщения в знаковых кавычках (^ 6 */), т. е. передачу прямой речи. Это касается не только письменного сообщения, но и достаточно обширных устных. Следовательно, утверждения авторства относятся обычно не к самим сообщениям, а к другим индивидуальным объектам, их обозначающим (к заглавиям на письменном естественном языке).

Той же практической невозможностью повторить все сообщение в целом объясняется то, что в библиотечных каталогах

148

большинстве справочно-библиографических изданий письменные сообщения кодируются условно их заглавиями и авторами. Именно это и создает те особые трудности переработки растущего множества научных изданий, для частичного преодоления которые издаются реферативные журналы и разрабатываются информационно -логические машины.

ПАМЯТЬ КУЛЬТУРЫ

Современное общество характеризуется наличием специальной памяти коллектива (в частности, книгохранилищ, архивов, дискотек, фильмотек и т. п.). В ней хранится огромное число письменных и иных сообщений с указанием их авторов. Количество и сложность всего этого массива сообщений вызвало к жизни документалистику — дисциплину, изучающую этот массив и способы его организации (в документалистику в широком смысле входит библиотечное и архивное дело и книговедение).

Ученый, работающий в какой-либо из бурно развивающихся областей современного знания, решает задачу, отчасти сходную с описанной выше моделью сеанса игры со многими партнерами (в режиме разделенного времени). Но число партий, разыгрываемых ученым, обычно существенно больше, чем при повседневном устном общении. Он должен постоянно следить за потоком научных сообщений в своей области и нескольких (а иногда и многих) пограничных с ней областях.

Трудности усугубляются разнообразием языков, на которых эти сообщения печатаются, многочисленностью (иногда и редкостью) соответствующих журналов. Поэтому естественна попытка облегчить труд ученого: часть этой непосильной вспомогательной работы перелагается на вычислительную машину. Предполагается, что сообщения в какой-либо определенной области (например, в органической химии, где существенную трудность может представить обнаружение вновь синтезированного соединения в списках уже ранее описанных) могут храниться в информационно-логической машине (или комплексе таких машин), к которой ученый может по мере необходимости обращаться за справками. Число конкретных достижений за 20 с лишним лет напряженной работы в этой области еще не очень велико, хотя в ряде стран машины помогают уже в обработке патентов и в решении некоторых других задач, связанных с поиском информации в большом массиве документов. Уже начинают выходить научные журналы (например, американский «Журнал вычислительной лингвистики»), приспособленные к обработке на машинах.

Размеры всей информации, накопленной в печатных изданиях

149

и рукописях человечеством, до настоящего времени оцениваются примерно как 1014 бит (двоичных единиц информации). Этот расчет, предложенный чл.-корр. АН СССР Н С. Кардашевым [129], основан на том, что общее число всех печатных изданий и рукописей на Земле составляет около 108; в каждой из книг содержится в среднем 10б бит (что равно среднему объему оперативного запоминающего устройства современной вычислительной машины). Однако несомненно, что значительная часть этой информации может быть представлена существенно более сжатым образом, что в первом приближении дает величину порядка 1011 бит.

Число нейронов в мозге каждого человека превышает 10, а согласно новейшим данным число нейронных соединений суще ственно превышает число самих нейронов, доходя до 10 — 10 Поэтому современные работы по оценке информации, накопленной всем человечеством, приводят к неожиданному и парадоксальному результату: вся эта информация в принципе может быть усвоена и переработана мозгом одного человека.

Но эта возможность, теоретически существующая, реализуется в известной мере только у немногих людей Для более широкой реализации этих потенциальных возможностей необходима более разумная организация всею комплекса наших знаний.

Эта же задача ставится и при использовании вычислительных (в частности, информационно-логических) машин для хранения научной информации. Ясно, например, что оперативную память машины объемом порядка 10е бит было бы неразумно занимать одной книгой, которая при введении ее в машину на естественном языке заполнила бы весь этот объем. Между тем для переработки научной информации этот наименее экономный способ оказывается и наименее эффективным.

Машина может успешно оперировать с этой информацией в случае ее представления на особом искусственном языке, который вместе с тем позволил бы и гораздо более сжато хранить в машине весь этот объем данных. Задача, следовательно, сводится к разумной перекодировке накопленного массива информации: книгу имеет смысл держать не в виде той (буквенной) информации, которая характерна для левого полушария (а именно количество этой информации и можно оценить в битах), а в виде комплекса значений, специфических для правого полушария (и представляющих существенные трудности для количественной оценки).

Основная трудность усвоения всей этой информации как машиной, так и одним человеком, заключается в том, что до сих пор она сохранилась и передавалась не в виде единой системы знаний, а в качестве суммы текстов разных авторов. Научная ин-

150

формация в библиотеках хранится в виде множества сообщений 0i, 02,.. 0П, при п—> да), принадлежащих определенным авторам. Внутри каждого такого сообщения содержится обычно значительное число повторений (в пересказе или в цитатах) предшествующих сообщений. Текст 0т содержит обычно ссылки на тексты 0„ 0,+ь... 0m-i или частичное (а иногда и полное) повторение этих текстов. В некоторых гуманитарных науках сообщения о предшествующих сообщениях составляют существенную часть всего научного текста; то же самое относится и к обзорным статьям или монографиям по любой области знания

Уже этим обусловливается значительное число повторов, делающих существенную долю научных текстов избыточной. Повторы нельзя считать оправданными даже и с точки зрения помехоустойчивости сообщений при их передаче во времени: история науки показывает, что чаще всего такие повторяющиеся от работы к работе (и в этом смысле помехоустойчивые, легко доходящие до следующих поколений) утверждения позднее оказываются устаревшими (а в конечном счете ложными), тогда как единичные (и не повторяющиеся в других трудах) высказывания в дальнейшем могут подтвердиться и найти развитие.

Pages:     | 1 |   ...   | 20 | 21 || 23 | 24 |   ...   | 28 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.