WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 10 | 11 || 13 | 14 |   ...   | 15 |

Итак, несмотря на притязания этих двух систем на международное использование, они обладают недостатками, которые берут свое начало в языковых сдвигах, составляющих часть дизайна этих систем. Понят но, что новые коммуникационные режимы, такие как Instant Messaging, Web logging, Web chat и другие, появляются постоянно. Несмотря на то, что часть из них изначально инкорпорирует XML и Юникод, состояние этих стандартов таково, что только небольшая часть населения мира и мировых языков может пользоваться услугами этих технологий. Мно гие сторонники технического развития возлагают надежды на новые коммуникационные протоколы, такие как voice over internet (голос че рез Интернет) или multi modal interfaces (мультимодальные интерфей сы). Но даже если они смогут решить какие то языковые вопросы, оста нутся другие проблемы, и в их числе поддержка людей с дефектами слуха и зрения. Более того, существующие технические сдвиги усили вают сдвиги, появляющиеся по демографическим, экономическим 3. Языковое разнообразие в Интернете и другим причинам. Чтобы минимизировать эти явления в Интернете, новые коммуникационные режимы должны быть внимательно изучены на предмет наличия латентных технических сдвигов до того, как они будут предложены для массового использования.

Многие «технофилы» возлагали надежды на машинный перевод как на решение проблем многоязычной коммуникации в Интернете.

Уже сейчас существует большой спрос на переводческие услуги, предла гаемые компаниями типа Systran – поставщиком системы перевода BabelFish, – и в определенных ситуациях, например, в случае перевода с каталонского языка на испанский и обратно, машинный перевод ре шил серьезные коммуникационные проблемы (Climent et al., 2004). Так смогут ли люди получать доступ в Интернет на своем родном языке, просто используя одну из онлайновых систем перевода Этот вопрос носит слишком оптимистический характер – и причин тому несколько.

Во первых, наличие системы машинного перевода предполагает, что «мирские» проблемы представления и понимания текста на опреде ленном языке уже решены, в то время как для большинства языков ми ра это не так. Во вторых, создание систем машинного перевода слиш ком трудоемко. При переводе любой пары языков могут возникнуть спе цифические проблемы, которые решаются только для этой конкретной пары языков. Так что перевод с любого языка на любой другой язык ми ра – это задача, которая вряд ли будет решена в ближайшем будущем.

В третьих, создание систем машинного перевода требует огромного объема материалов на языках, с которых и на которые будет осуществ ляться перевод28; на сегодняшний день эти материалы собирают с веб сайтов на тех языках, на которые будет реализован перевод (Grefenstette, 1999; Resnik, 1999), и поэтому они должны быть составле ны носителями этих языков. Такая работа не будет сделана, пока не бу дет подготовлена адекватная техническая поддержка для каждого кон кретного языка. Наконец, машинный перевод никогда не будет так же хорош, как перевод, выполненный человеком (Kay et al., 1993). Поль зователи систем машинного перевода должны приспосабливаться к странным обрывкам слов и их порядку, которые просто представляют 28 Для этого нельзя использовать любой текст. Как правило, требуются двуязыч ные тексты, сопоставленные по каждому предложению. Их создание стоит до вольно дорого, и для всех пар языков таких текстов нет.

Измерение языкового разнообразия в Интернете собой скрытую форму языкового сдвига, собственно, и приведшего к необходимости перевода. Следовательно, не приходится ожидать, что такие технологические подходы, как машинный перевод, сумеют су щественным образом сократить проблемы языковых сдвигов в Интер нете.

Выводы Изучение потенциальных источников сдвигов, рассмотренных в дан ной статье, вскрыло большое количество источников языковых сдвигов в Интернете, как исторических и технологических, так и возникаю щих. Следовательно, можно ответить утвердительно на вопрос, сущест вуют ли языковые предпочтения в Интернете. Основные последствия сдвигов заключаются в благоприятствовании большим языкам с хоро шо развитыми техническими стандартами, самым значительным из которых является английский язык, и это не случайно, т. к. именно английский был языком основателей Интернета и предшествующих проектов. Однако также очевидно, что причины и следствия сдвигов разнообразны, неявны и, во многих случаях, непредсказуемы. Если ЮНЕСКО серьезно надеется решить проблему языковых сдвигов в Интернете, нам надо больше работать над собственным образованием и образованием отвечающих за развитие Интернета основных действу ющих лиц в двух сферах: проявления языковых сдвигов, и значение и ценность языкового разнообразия.

Глоссарий Возникающий сдвиг (Emergent bias) – по Фридману и Ниссенбауму (Friedman and Nissenbaum, 1997) – это предпочтение, которое является следствием взаимодействия технических систем в разных социальных контекстах.

Всемирная сеть (Сеть, World Wide Web, Web) – приложение для обмена форматированными документами, программами и мульмедийным кон тентом по Интернету. Это также весь набор документов и контента, дос тупных в Сети. Сеть – самое популярное приложение Интернета, благо даря простоте работы веб браузеров при обработке запросов на доку менты и другого контента.

3. Языковое разнообразие в Интернете Интернет (Internet) – глобальная компьютерная сеть, возникшая в резуль тате слияния ARPANET и других региональных компьютерных сетей.

Исторический сдвиг (Pre existing bias) – по Фридману и Ниссенбауму (Friedman and Nissenbaum, 1997) – любые предпочтения, вызванные социальными причинами и возникшие до появления конкретного тех нологического приложения, в котором они проявились.

Консорциум Юникод (Unicode Consortium) – организация, осуществ ляющая контроль над развитием Юникода.

Протокол (Protocol) – стандартизированный набор сообщений и пра вил для обмена сообщениями между компьютерами в Сети. Протоколы – это сложные системы, часто обсуждаемые в терминах т. н. «уровней»:

прикладной уровень, канальный уровень и т. п.

Регистратор доменных имен (Domain name registry) – организация, которая по контракту с ICANN осуществляет руководство некой частью пространства имен DNS. Как правило, регистратор отвечает за ведение одного или более TLD. Примерами регистраторов доменных имен явля ются Verisign и Educause.

Технический сдвиг (Technical bias) – по Фридману и Ниссенбауму (Friedman and Nissenbaum, 1997) – любые предпочтения, являющиеся составной частью технической системы. Предпочтение в ASCII амери канского варианта английского языка является типичным примером технического сдвига.

Техно лингвистическая жизнеспособность (Techno linguistic vitality) – возможность этно лингвистического сообщества воспользоваться пре имуществами технологий, в особенности информационных технологий, и возможность использовать родной язык при работе с этими технологи ями. По аналогии с этно лингвистической жизнеспособностью.

Хост (Host, Internet host) – любой компьютер, подключенный к Интернету.

Юникод (Unicode) – 64 битный стандарт кодирования символов, нахо дящийся на стадии развития и позволяющий представить знаки прак тически всех письменных языков. Разработкой Юникод занимается Консорциум Юникод совместно с ISO и W3C, что должно обеспечить со вместимость стандартов всех трех организаций.

Измерение языкового разнообразия в Интернете Язык разметки (Markup Language) – система, внедряющая форматиро вание или другие коды («разметку») в текстовые документы, позволяющие форматировать текст или интерпретировать его с помощью устройства, понимающего разметку. Примером языка разметки является HTML (язык гипертекстовой разметки); другие языки, такие как SVG (Scalable Vector Graphics – масштабируемая векторная графика), работают по сходной схеме, но выполняют совершенно разные функции. См.: XML.

ACM (Association for Computing Machinery) – Ассоциация по вычисли тельной технике – крупнейшая международная профессиональная ор ганизация в области вычислительной техники. Ассоциация образует множество специальных групп, которые занимаются техническими, со циальными и политическими вопросами, имеющими отношение к ком пьютерам и компьютерным сетям.

APNIC (Asia Pacific Network Information Center) – Сетевой информацион ный центр, осуществляющий контроль за работой Интернета в Азии и Тихоокеанском регионе. Под его контролем находятся Австралия, Ки тай, Япония, Корея, Индонезия, Малайзия и все страны островов Тихо го океана.

ARIN (American Registry for Internet Numbers) – американское бюро регист рации адресов в Интернете. Это сетевой информационный центр, кото рый осуществляет контроль за работой Интернета в Северной Америке.

ASCII (American Standard Code for Information Interchange) – один из первых 7 битных стандартов кодирования компьютерных текстов, который получил повсеместную поддержку в большинстве компьютер ных приложений. Большинство современных текстовых кодов, вклю чая Юникод, совместимы с ASCII, сеть битов которого позволяла коди ровать 128 разных символов. Расширенный ASCII – это 8 битный вари ант прежнего ASCII, который не имеет стандарта; разные поставщики поддерживают разные версии этого расширенного ASCII, которые друг с другом не совместимы.

BMP (Basic Multilingual Plane) – Базовая многоязыковая плоскость, область значений кодов Юникод, содержащая символы практически для всех со временных письменностей и большое число специальных символов.

ccTLD (Country Code Top Level Domain) – домены верхнего уровня, кото рые ассоциируются с определенными странами. ccTLD идентичны ко 3. Языковое разнообразие в Интернете дам стран ISO 3166. В качестве примеров можно привести.uk (Велико британия) и.za (ЮАР).

CMC (Computer Mediated Communication) – компьютерно опосредован ная коммуникация – любая форма коммуникации «человек человек», ко торая происходит при помощи сетевых компьютеров как средства ком муникации.

CNNIC (China Network Information Center) – китайский сетевой инфор мационный центр, осуществляющий контроль за работой Интернета в Китае.

DNS (Domain Name System) – система доменных имен – техническая сис тема, которая находится под управлением ICANN, что позволяет присва ивать мнемонические коды компьютерам, объединенным в Сеть.

Ethnologuе – база данных, ведение которой осуществляет SIL International (редактор – Barbara Grimes). База содержит записи, пред ставляющие общую дескриптивную информацию всех известных язы ковых популяций мира.

GPL (Gnu Public License) – юридическое лицензирующее соглашение, ко торое используется в ряде программ с открытым кодом и предназначе но для защиты авторского права, предоставляя при этом для разработ чиков открытый доступ к исходному коду программ.

gTLD (Generic Top Level Domain) – родовой домен верхнего уровня. Доме ны верхнего уровня присваиваются «родовым» категориям, без обяза тельной ссылки на страну. Общие gTLD – это.com (коммерческие),.edu (высшие учебные заведения США),.mil (организации военного ведомст ва США),.net (сетевые провайдеры),.org (неприбыльные и некоммер ческие организации) и т. д.

HTML (Hypertext Markup Language) – гипертекстовый язык разметки, который используется для форматирования страниц во Всемирной се ти. Это – простой язык разметки, понимаемый широким спектром веб браузеров и другим программным обеспечением, со стандартом, кото рый теперь поддерживается W3C.

IANA (Internet Assigned Numbers Authority) – уполномоченная организа ция по распределению нумерации в Интернете.

Измерение языкового разнообразия в Интернете ICANN (Internet Corporation for Assigned Names and Numbers) – Корпора ция Интернета для специализированных адресов и номеров, контроли рующая выдачу доменных имен верхнего уровня и отвечающая за ад ресное пространство Интернета.

ICT (Information and Communications Technology) – информационно коммуникационные технологии.

IP (Internet protocol) – Интернет протокол. См.: TCP/IP.

IPv4 – IP версия 4. Это версия IP, имеющая сегодня самое широкое при менение. Она характеризуется 32 битными номерами адресов для каж дого хост компьютера Интернета. Адресное пространство под IPv4 ограничено и, как следствие, Интернет сегодня переживает пере ход от IPv4 к IPv6.

IPv6 – IP версия 6. Это – версия «следующего поколения» Интернет протоко ла с использованием 128 битных адресов. Поддержка IPv6 расширяется в целом ряде сетевых приложений, но широкого применения она пока еще не нашла, поскольку приложения IPv4 не совместимы с хостами IPv6.

IRC (Internet Relay Chat) – протокол приложений для одновременной мно госторонней коммуникации в Интернете в режиме реального времени.

В программах «чатов», включая и частные программы, есть много заимст вований из IRC. Существует множество сетей IRC, которыми пользуются миллионы людей во всем мире, в основном, в досуговых целях.

ISO 8859–1, Latin 1 – 8 битный стандартный текстовый код, поддер живающий большинство европейских языков, использующих латин ский алфавит.

NIC (Network Information Center) – сетевой информационный центр, тех ническая организация, контролирующая работу Интернета на регио нальном или местном уровне. Существует 3 основных региональных центра: ARIN, RIPE, APNIC – для Северной Америки, Европы и Азиатско Тихоокеанского региона соответственно.

RIPE (R seaux IP Europ ens) – Координационный Центр распределения ресурсов сети Интернет в Европейском регионе, сетевой информацион ный центр, контролирующий работу Интернета в Европе.

3. Языковое разнообразие в Интернете SGML (Standard Generalized Markup Language) – стандартный общий язык разметки, широко использующийся в печатной и издательской сфере. Язык HTML был изначально разработан как приложение SGML.

TCP/IP (Transmission Control Protocol/Internet Protocol) – набор сетевых про токолов, на которых базируется Интернет. TCP и IP – это практически незави симые «уровни» сетевых Интернет протоколов, поскольку отвечают за раз ные аспекты функционирования сети, но часто используются вместе.

TLD (Top Level Domain) – домен верхнего уровня. Доменное имя, присва иваемое ICANN регистратору доменных имен, который объединяет вза имосвязанные хосты, как правило, в рамках одной страны или в орга низационных целях.

Usenet (news) – компьютерная сеть, используемая для обмена открыты ми опубликованными и широко распространяемыми сообщениями («новостями») между сетевыми компьютерами. Это также вся совокуп ность новостей, которыми обмениваются подобным образом. Usenet – важный элемент Интернета, т. к. этот недорогой и легко устанавливае мый протокол обеспечивает работу почты и не требует выделенного ка нала. Как следствие, именно Usenet является первым приложением Интернета при подключении нового пользователя.

Pages:     | 1 |   ...   | 10 | 11 || 13 | 14 |   ...   | 15 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.