WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 9 | 10 || 12 | 13 |   ...   | 15 |

Членами Консорциума являются крупнейшие поставщики програм много обеспечения, представители мировых религий, региональные ор ганизации и учреждения образования, правительственные организа ции разных стран. Стандарт Юникод (в нынешней 4 й версии) предо ставляет более миллиона возможных кодов символов, что позволяет ис пользовать в едином тексте все современные и исторические письмен ности. 65 000 символов составляют Базовую многоязыковую плос кость, которая должна обеспечить б льшую часть письменной комму никации. Однако такое разнообразие стоит денег. В своей базовой фор ме UTF 32 текст в Юникод занимает в 4 раза больше места в сравне нии с аналогичным текстом в ASCII. Многие разработчики программ предполагали, что пользователи не захотят получить такое «наказание» за пользование многоязычным текстом, особенно если работа на ком пьютере происходит в моноязычном контексте24. Юникод предлагает другие виды кодирования с символами переменной длины, которые бо 24 Так это или нет – важный вопрос, не получивший достаточного рассмотрения в научной литературе.

3. Языковое разнообразие в Интернете лее эффективны, но ценовое бремя переносится на нелатинские языки, которые вынуждены занимать больше места. И хотя за последние 10 лет цены на хранение данных сильно упали, позволяя снизить проб лемы Юникода, работа с этой кодировкой по прежнему сильно услож няет задачу разработчикам программ, поскольку большинство прило жений требуют взаимодействия с ASCII. Кроме того, большой размер документов в Юникоде требует больших затрат на пересылку, сжатие и распаковку, и эти расходы – достаточное основание для того, чтобы в ряде случаев отказаться от использования Юникода.

Несмотря на крупные изменения в деле интернационализации об работки данных с помощью Юникода, проблемы с использованием многоязычного текста в Интернете еще далеко не решены. По ряду тех нических, экономических и организационных причин разработка при емлемого технического стандарта идет медленнее, чем развитие самого Интернета. Как следствие, международное использование Интернета поддерживало языки, основанные на латинице (английский язык в осо бенности), чему способствовало наличие широко распространенного стандарта кодировки, принятого до распространения Интернета. Что бы в Интернете можно было одинаково использовать все языки мира, Юникод должен получить более широкое распространение. Как и в слу чае с DNS, может потребоваться модернизация ряда Интернет прото колов и приведение их в состояние, совместимое с Юникодом.

Языки разметки и программирования Есть и другой инструмент, благодаря которому в Интернете сохраняют ся технические сдвиги в пользу английского языка, – это компьютерные «коды», т. е. языки разметки и программирования, которые использу ются для конфигурации Интернет контента и услуг. Первым и наиболее очевидным способом создания технических сдвигов является поддерж ка этими языками многоязычного контента. Языки разметки, такие как Hypertext Markup Language (HTML) и eXtensible Markup Language (XML), должны уметь описывать текст на всех возможных человеческих язы ках. Консорциум Всемирной сети предпринял для этого ряд шагов, по требовав поддержать Юникод как элемент своих стандартов. Это озна чает, что там, где поддержки Юникода недостаточно, поддержки HTML и XML тоже недостаточно. Именно это происходит сейчас с большинст вом языков Западной и Юго Восточной Азии, а также южной части Измерение языкового разнообразия в Интернете Центральной Азии. Так создается общая основа для предпочтения опре деленных языков. Языки программирования также должны быть со вместимы с многоязычным текстом. К сожалению, многие распростра ненные языки программирования, такие как С, пока еще не обеспечи вают стандартной поддержки Юникода25. Растущее число языков, соз данных для веб приложений (в их числе широко используемые Java, JavaScript, Perl, PHP, Python, Ruby), способны на поддержку Юникода, но другие системы, как, например, программное обеспечение для баз данных, непостоянны в своей поддержке Юникода. Организация элек тронной коммерции на различных языках, а не только на английском, предполагает, что совместимые с Юникодом базы данных получат ши рокое распространение.

Следующий путь создания сдвига в сторону английского языка – дизайн самих языков разметки и программирования. Языки програм мирования предлагают самый простой из имеющихся интерфейс для управления компьютером, который является посредником между ког нитивными процессами программистов и логическими возможностями самих компьютеров. Число языков программирования огромно – от 2500 до количества, превышающего число человеческих языков. Не смотря на такое очевидное разнообразие, подавляющее большинство этих языков берет свое начало в FORTRAN – самом первом из языков программирования высокого уровня, созданного IBM в 1957 г. (Levenez, 2003). Эти языки широко используют английские ключевые слова для определения важных компонентов программирования, таких как услов ные операторы (if, then, else, case и др.) и итерационные циклы (while, for, until и др). Несмотря на то, что во многих человеческих языках есть эквиваленты этих слов, они никогда не используются вместо этих анг лийских слов в выполняемой программе. Так, Руби, работающий в соав торстве с японским программистом Юкихиро Матсумото и обращаю щий особое внимание на интернационализацию, также использует ан глийские ключевые слова.

HTML и XML в этом отношении очень похожи. Тэги HTML представ ляют собой, как правило, мнемонические аббревиатуры английских 25 Веб сайт «International Components for Unicode» предлагает С библиоте ку с открытым кодом, поддерживающую использование Юникода (http://oss.software.ibm.com/icu/).

3. Языковое разнообразие в Интернете слов (например, b для bold – полужирный шрифт, ul для unordered list – неупорядоченный список, li для list item – элемент списка и др.). И, хотя XML не является языком разметки, это – синтаксис для определения языков разметки, все языки разметки, базирующиеся на XML, исполь зуют английский (например, MathML для математических выражений и XML: FO для форматирования текстовых документов), несмотря на стандарт XML, использующий Юникод. Эта тенденция усугубляется в связи с проектом развития Семантического веба («Semantic Web»), цель которого в том, чтобы привнести во Всемирную сеть идеологию «общеизвестного знания». Предполагается, что крупные базы данных искусственного интеллекта, такие как Cyc (Reed and Lenat, 2002) и WordNet (Fellbaum and Miller, 1998), будут использоваться для разра ботки новых языков разметки, и эти языки будут способствовать тому, что Интернет программы смогут находить и обрабатывать информа цию для пользователей. Такие базы данных уже подверглись критике с позиций культуры стран Северного полушария за сексистские, патри архальные предпочтения (Adam, 1998). Именно поэтому проекты типа Семантического веба, которые обещают дать жизнь «новому поколе нию» Интернет услуг, несут в себе опасность углубления существующих языковых и культурных сдвигов.

Потенциальную опасность языковых сдвигов, заложенную в язы ках программирования и разметке, следует анализировать парал лельно с культурной природой вычислений. Современная система вы числений основывается на многовековой истории математических знаний, и распространение этой системы на современном этапе мож но сравнить по характеру и по значению с распространением систе мы десятичного исчисления. Десятичные числа были изобретены в Северной Индии около VII века н.э. и распространились по всему миру, вытесняя другие системы исчислений. При этом культурная пе редача десятичных чисел не требовала импортирования словарного состава; многие языки модифицировали свои названия чисел для вос приятия нового метода. Компьютер развивает принципы десятичных чисел путем автоматизации работы с ними. Однако в отличие от де сятичных чисел распространение компьютеров принесло с собой объемные и сложные английские словари – языки программирования.

Нет сомнения, что компьютер, как физический артефакт, привязы вая символы к действиям, играет определенную роль в их взаимосвязи.

Точное сочетание символа и действия имеет произвольный характер, Измерение языкового разнообразия в Интернете и поэтому адаптировать можно любой язык, но это – довольно сложная задача, выполнение которой далеко не тривиально. Как следствие, один важный вопрос, касающийся языкового разнообразия, не получил должного внимания в научной литературе, а именно: до какой степени различные характеристики языков программирования способствуют тому, что их воспринимают и используют люди, говорящие на разных языках26 Хорошо известны эффекты переноса у людей, говорящих на одном языке и изучающие другой. Вполне естественно, что языки программирования, как формальные лингвистические системы, могли проявлять существующий в естественных языках перенос, создавая систематические проблемы или ошибки у людей, говорящих на опреде ленных языках. По своим свойствам языки программирования сильно отличаются друг от друга. Возможно ли, что люди, говорящие на ка ком то языке, получают более качественные услуги от того языка про граммирования, который больше соответствует их родному языку Тог да, может быть, языки программирования могут быть составлены с учетом различных культурных и языковых традиций Поможет ли та кая адаптация людям, говорящим на каком то определенном языке, освоить ресурсы информационных технологий ЮНЕСКО и другие агентства ООН испытывают настоятельную потребность увидеть ответы на эти вопросы, особенно тогда, когда для продвижения языкового разнообразия необходимо решать за дачи в области образования. Компьютерное программирование сделало язык живым и сильным, способным видоизменять культу ры. Жаль, что сегодня такую поддержку получил, в основном, анг лийский язык. Если цифровая грамотность в области языков про граммирования требует языковых и/или культурных знаний на ан глийском, тогда люди, говорящие на других языках, должны нести большие расходы на образование и, возможно, на культуру, чтобы заявить о своем праве на информационные ресурсы Интернета.

Коммуникационные режимы Несмотря на то, что Интернет стал известен большинству людей благо даря Всемирной сети (а многие считают, что это одно и то же), он пред 26 См. Anis (1997) для ознакомления с предложениями по данному вопросу.

3. Языковое разнообразие в Интернете ставляет собой более разнородную среду, предлагающую различные ва рианты коммуникации. Более того, дизайн Интернета подразумевает возможность создания и недорогого разворачивания новых вариантов.

Сегодня мы широко используем электронную почту, Сеть и мгновенный обмен сообщениями в Интернете и не знаем, что мы будем использо вать в будущем. Определенные коммуникационные режимы стали очень популярны и периодически инкорпорируют технические формы языковых сдвигов.

Одним из таких коммуникационных режимов является Usenet News, изначально созданная в 1978 г. как сеть трех университетских компьютерных систем (Spencer and Lawrence, 1998). Usenet – это кол лекция тысяч «новостных групп», пространство для публичных сообще ний с именами, позволяющими отнести их к определенной теме. Сер висное и клиентское программное обеспечение Usenet имеется в сво бодном доступе, и его администрация относительно открыта. Админис траторы Usenet могут в индивидуальном порядке устанавливать объем, скорость и частоту обмена сообщениями с другими серверами, так что они могут быстро оптимизировать пользование сетью в районах с пло хой связью. Таким образом, барьеры для доступа в Usenet относительно невысоки. Usenet – чрезвычайно важный международный ресурс.

По состоянию на 1999 г. доступ в Usenet имели 205 стран (Smith, 1999).

Как техническая система, Usenet – это микрокосм Интернета. Сис тема имен для новостных групп носит иерархический характер и ис пользует подсистему ASCII, почти так же, как DNS. Она имеет иерархии верхнего уровня и локальные, региональные и национальные иерар хии27. Текст сообщений должен быть совместим с ASCII. Тексты на ки тайском и японском языках используют в Usenet особые кодировки.

Как и в остальной части Интернета, имеет место преобладание англий ского языка в родовых иерархиях верхнего уровня. Так, в иерархии comp. – родовой категории записей, касающихся компьютерных сис тем, почти нет записей на японском языке, даже на comp.lang.ruby.

Только в иерархии fj.comp. можно найти дискуссии по вычислительной технике на японском языке. В ветви иерархии soc.culture. есть место для многоязычного трафика, но, в основном, на европейских языках.

27 Пространство имен в Usenet, как и пространство имен в DNS, было использова но с серьезными нарушениями.

Измерение языкового разнообразия в Интернете Таким образом, несмотря на низкую стоимость для стран с ограничен ными ресурсами, Usenet плохо приспособлена для международного ис пользования и обладает множеством технических сдвигов в направле нии английского языка. Некоторые из этих сдвигов приводят к допол нительным возникающим сдвигам.

Второй коммуникационный режим, ставший популярным в начале 1990 х годов, – ретранслируемый Интернет чат (Internet Relay Chat, IRC), многосторонний синхронный режим коммуникации в реальном времени. Участники этого канала коммуникации общаются между со бой в реальном времени почти так же, как если бы они участвовали в телефонной конференции, с той лишь разницей, что разговоры запи сываются. Соединенные в общую сеть, серверы IRC могут объединять тысячи каналов, и эта сеть, как и EFNet или UnderNet, открывает куль турные, региональные или национальные темы и привлекает участни ков со всего мира (Paolillo, 2001). IRC был создан в Северной Европе, так что некоторые его характеристики, такие как допустимые символы в текстовых сообщениях и имена участников, отличаются от принятых в Usenet. Однако поддержка многоязычных текстов в IRC нисколько не лучше, чем в Usenet. Фактически, отображение текстов на амери канском варианте английского языка на компьютерах в странах Север ной Европы обнаруживает очевидные проблемы, в числе которых заме на знаками препинания символов диакритических гласных в сканди навских именах и словах.

Pages:     | 1 |   ...   | 9 | 10 || 12 | 13 |   ...   | 15 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.