WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     || 2 |
-- [ Страница 1 ] --

Московский международный институт эконометрики, информатики, финансов и права Кириченко А.А.

Максимова Т.Ю.

Бовт В.В.

Интернет-технологии для бизнеса Москва 2003 УДК 004.7 ББК 32.81 К 431 Кириченко А.А., Максимова Т.Ю., Бовт В.В. Интернет-технологий для бизнеса - М. Московский международный институт эконометрики, информатики, финансов и права. 2003. – 113 с.

Рекомендовано Учебно-методическим объединением по образованию в области прикладной информатики (по областям) в качестве учебного пособия для студентов высших учебных заведений, обучающихся по специальности 351400 «Прикладная информатика (по областям)» и другим междисциплинарным специальностям.

© Максимова Т.Ю., 2003 © Бовт В.В., 2003 © Кириченко А.А., 2003 © Московский международный институт эконометрики, информатики, финансов и права, 2003 2 Содержание Введение 5 Глава 1. Виды Интернет - представительств.............................................. 1.1. Web присутствия в Интернет............................................................. 1.2. Web для информирования клиентов о производимых товарах и услугах........................................................................................................ 1.3. Web для продвижения товаров и услуг............................................ 1.4. Web с обратной связью (для изучения мнений, социологи- ческих исследований, оценки эффективности,...)................................... 1.5. Web электронной коммерции.......................................................... 1.6. Web сервисного и гарантийного обслуживания............................ 1.7. Web внутрифирменного обучения сотрудников........................... 1.8. Web виртуального сообщества фирмы........................................... 1.9. Web для совместного проектирования........................................... Глава 2. Возможности Интернет по обеспечению функционирования представительств фирм................................................................................. 2.1. Адресация ресурсов Internet............................................................. 2.2. Электронная почта и ее использование для поиска, отправления и получения информации.................................................... 2.3. Служба FTP........................................................................................ 2.4. Использование удаленных ресурсов (Telnet)................................. 2.5. Телеконференции (News)................................................................. 2.6. Непосредственное общение (IRC)................................................... 2.7. Всемирная паутина (WWW)............................................................ 2.8. Службы поиска информации, важнейшие русскоязычные и мировые источники информации............................................................. 2.9. Средства архивации и восстановления информации.................... 2.10. Мультимедиа в Интернет-технологии (видеоконференции, междугородние переговоры, realaudio,...)................................................ Глава 3. Инструментарий для создания Web - представительств.......... 3.1. Гипертекст, последовательность создания гипертекстовых систем.......................................................................................................... 3.2. Архитектура сервиса WWW............................................................ 3.3. WYSIWYG - системы проектирования Web-сайтов..................... 3.4. Состав, структура и функциональные возможности FrontPage... 3.5. Проводник FrontPage (FrontPage Explorer)..................................... 3.6. Редактор FrontPage (FrontPage Editor)............................................ 3.7. Динамические Web-документы....................................................... 3.8. Средства гипертекстовой разметки................................................. Глава 4. Технология создания и ведения Интернет – представи-тельства.

Глава 5. Исследование эффективности использования Web - представительства....................................................................................... Литература................................................................................................... Основная.................................................................................................... Дополнительная........................................................................................ Ссылки на ресурсы Интернет................................................................. Глоссарий..................................................................................................... Введение Значение новых информационных технологий, связанных с использованием Internet для бизнеса, трудно переоценить. В текущем году емкость информационного Internet - рынка в США составила млрд. долларов за год. Благодаря Internet создано более 1 млн. рабочих мест. Одна из Internet - компаний, созданная год назад, продана за млрд долларов.

Internet работает 24 часа в сутки. В течение всего этого времени можно ознакомить со своим бизнесом тысячи потенциальных клиентов, предложить им свою продукцию или услуги без своего непосредственного участия.

Internet обеспечивает возможность прямой продажи продукции или услуг. Содержание информации в Internet о планах фирмы, политике цен, предполагаемых изменениях в выпуске продукции, по сравнению с соответствующей информацией в других средствах массовой информации (СМИ) может меняться очень быстро, практически одновременно с возникновением таких изменений. В Internet можно получить обратную связь от потенциальных клиентов и благодаря этому проверить идею выпуска новой продукции или предоставления новых видов услуг без значительных затрат на рекламу в традиционных СМИ.

Все это определяет актуальность освоения Интернет для предпринимательской деятельности.

Но работа в Интернет требует наличия специальных знаний и навыков. В дисциплине "Интернет-технологии для бизнеса" затрагиваются вопросы построения представительств различных фирм в Интернет - сервисе "WWW". Рассматриваются особенности различных видов Web - представительств, инструментарий для их создания, технология создания. Для эффективного использования созданного Web - представительства необходим постоянный надзор за его состоянием, обновление содержащейся на нем информации. С этой целью дисциплина включает в себя разделы, в которых рассматриваются возможности Интернет по обеспечению эффективного функционирования созданных представительств фирм, даются основные приемы работы с различными видами сервиса Интернет.

Учебное пособие предназначено для студентов, изучающих такие дисциплины, как : “Создание Web-представительства”, “Создание электронного портала”, “Создание Web-представительства. Контент- инжениринг”, и может быть использован в качестве пособия при изучении таких дисциплин, как “Электронная коммерция”, “Интернет маркетинг в банковском деле”, “Электронная система расчетов”, и др.

Глава 1. Виды Интернет - представительств.

В основе любой коммерческой деятельности лежит маркетинг - система управления производственно-сбытовой деятельностью фирмы, ориентированная на получение прибыли с помощью активного влияния на рыночные условия и процессы. В основе маркетинга лежит решение трех укрупненных проблем: выяснение сегодняшнего состояния фирмы, выработка планов на будущее, определение путей осуществления этих планов, которые могут быть детализированы в виде коммерческих задач следующим образом: чтобы получить прибыль, необходимо продать товар или услугу. Чтобы продать что-то, надо его иметь, и надо информировать потенциальных покупателей о Вашей готовности продать. Кроме того, проданный товар (или услугу) надо доставить до потребителя. Отсюда, основными коммерческими задачами фирмы являются: получение товара (его изготовление, или покупка,...);

выяснение состава потенциальных потребителей;

выяснение состава потенциальных покупателей;

информирование потенциальных покупателей и потребителей о наличии у Вас этого товара и Вашем намерении его продать (или готовности предоставить данную услугу);

продажа товара (предоставление услуги) и получение денег за реализованный товар или услугу;

доставка товара;

гарантийное обслуживание. Кроме того, существуют дополнительные коммерческие задачи, связанные с проведением специальных мероприятий по изучению рынков.

С точки зрения специалистов по автоматизации перечисленные задачи сводятся к следующему набору элементарных операций:

-при проведении рыночных исследований: поиск информации;

ее получение;

обработка;

-при продвижении товаров: создание образа фирмы;

реклама товаров и услуг;

формирование положительного отношения к результатам деятельности фирмы;

-при реализации товаров: информирование покупателей;

оформление заявок на товары и услуги;

оплата;

доставка.

Использовать Internet при решении этих задач можно в виде следующих услуг:

- коммуникационные услуги (обмен информацией с филиалами, поставщиками, клиентами, общественностью);

- автоматизированный поиск информации;

- получение информации с помощью электронной почты, ftp, телеконференций,...;

- использование удаленного доступа для обработки информации в режиме ONLINE;

- предоставление информационных услуг;

- разработка и размещение в Сети Web - представительства фирмы для проникновения на рынок, продвижения товаров, информирования покупателей, оформления заявок на товары и услуги, изучения мнений покупателей, потребителей, специалистов;

для проведения других специальных мероприятий по изучению рынков;

для реализации торгового процесса (оплата товаров и услуг, их доставка покупателю, и др.).

Среди перечисленных услуг особое место по своим возможностям занимает создание и ведение (эксплуатация) Web - представительства фирмы.

Исходя из общих задач коммерческой деятельности в Интернет, Web - представительство фирмы может быть использовано в следующих целях:

1) Присутствие в Internet, т.е. объявление о существовании такой фирмы, роде ее деятельности, имидже (Web присутствия в Интернет).

2) Информирование потенциальных клиентов фирмы о производимых ею товарах и услугах (информационный Web, или Web для информирования клиентов о производимых товарах и услугах).

3) Продвижение товаров и услуг (Web для продвижения товаров и услуг).

4) Обратная связь: изучение мнений покупателей, потребителей, специалистов оптовой и розничной торговли, промышленности (Web с обратной связью).

5) Проведение специальных мероприятий по изучению рынков (исследовательский Web и Web виртуального сообщества фирмы).

6) Прием от клиентов заявок на товары и услуги (Web электронной коммерции).

7) Оплата товаров и услуг (Web электронной коммерции).

8) Доставка товаров и услуг покупателю (Web электронной коммерции).

9) Сервисное и гарантийное обслуживание клиентов (Web сервисного и гарантийного обслуживания).

10) Внутрифирменное обучение сотрудников (например, при большой разбросанности фирмы) - Web внутрифирменного обучения сотрудников.

11) Совместная реализация проектов удаленными исполнителями (Web для совместного проектирования).

Каждый из перечисленных видов Web - представительств имеет свои особенности, которые отражаются в его структуре и функциях.

Некоторые средства для создания Web - представительств (например, Microsoft FrontPage) содержат специальные мастера, позволяющие автоматизировать процесс изготовления Web - сайта заданной архитектуры.

При создании Web - представительства фирмы может преследоваться несколько целей, в результате чего усложняется структура представительства. Рассмотрим особенности элементарных видов Web - представительств.

1.1. Web присутствия в Интернет.

Основная его задача - объявить миру о существовании данной фирмы. Такое объявление имеет определенный коммерческий смысл, так как наличие своей Web - странички создает определенный имидж фирме, она выглядит более солидной, современной. На Web - страничке фирмы обычно размещается ее название, род деятельности, адрес электронной почты, телефон, факс. Иногда размещается информация о руководящем составе фирмы. Если фирма имеет собственный товарный знак (логотип), он так же размещается на Web - страничке и способствует в дальнейшем узнаванию фирмы при встрече с ее продукцией. Наличие такой странички на одном из Host - компъютеров Интернет каких - либо дивидендов фирме не принесет, посетителей у странички будет немного, повторно посетить такую страничку вряд ли кто захочет. Но со временем страничка попадет в какой-либо справочник ресурсов Интернет, что увеличит количество однократных ее посетителей (например, заглянувших для того, чтобы узнать адрес электронной почты данной фирмы).

Web присутствия обычно занимает одну страницу (один - два экрана), вследствие чего называется Web - страницей (тогда, как Web, содержащий много страниц, называется сайтом). Web присутствия является основой любого сайта, его главной страничкой, появляющейся на экране при каждом посещении данного Web - сайта. Эта страничка обычно называется домашней (home pages) и расположена в файле index.html (или index.htm).

1.2. Web для информирования клиентов о производимых товарах и услугах.

Такой Web является уже средством массовой информации (СМИ).

Это значит, что он должен работать в реальном масштабе времени, а расположенная на нем информация должна соответствовать реальному состоянию фирмы. В качестве домашней странички на таком Web обычно используется Web присутствия. Чаще всего на таком Web размещается информация в виде прайс-листов, содержащих название товара (услуги), его основные характеристики, цену, номер телефона для заказа товара и получения дополнительной информации. Некоторые владельцы Web располагают так же на нем более подробную информацию о своих товарах и услугах: технические характеристики товара, его потребительские свойства. На таких Web располагаются пресс-релизы, электронные каталоги, в которых приводится информация не только о реализуемых фирмой товарах и услугах, но и о сопутствующих товарах, дополнительных услугах партнеров данной фирмы.

Основной трудностью содержания такого Web является необходимость постоянно обновлять выведенную на него информацию.

Идеальным для такого сайта было бы указание в публикуемом прайс листе количества экземпляров данного товара на складе фирмы. Но это - очень быстро изменяющаяся информация. Отследить ее изменение можно только в автоматическом режиме, например, связав данный Web с базой данных склада фирмы. В этом случае клиент, зашедший на Web, получает на свой компьютер слепок базы данных фирмы на момент соединения с Web.

Для повышения интереса пользователей к своему сайту фирма может кроме перечисленных атрибутов разместить какую-либо завлекательную информацию. Эта информация может быть не связана напрямую с деятельностью фирмы, но должна представлять интерес для ее потенциальных клиентов. Для подготовки и постоянного обновления такой информации необходим штат сотрудников - корреспондентов.

1.3. Web для продвижения товаров и услуг.

Это прежде всего - средство массовой информации, так как основными инструментами продвижения товаров и услуг являются publicity, advertising, public relations - дисциплины, которые в зарубежных ВУЗах изучаются при подготовке специалистов по “communications” (в Российских ВУЗах аналога такой специальности нет. В вольной интерпретации communications можно рассматривать, как средства и методы общения в бизнесе, информационного воздействия на потребителя).

Publicity - это упоминание в рассказе, репортаже, статье о товаре или услуге с указанием, кто реализует этот товар или услугу. Это еще не реклама, это просто упоминание о фирме, реализующей данный товар или услугу, но упоминание в положительном ключе.

Advertising - это более серъезное упоминание (извещение, объявление) о фирме, товаре, услуге, построенное по определенной структуре. В нашей стране advertaising чаще всего отождествляется с рекламой.

Public relations - это дисциплина, изучающая способы формирования общественного мнения. Поскольку формировать общественное мнение можно разными способами, в public relations выделяется т.н. “черный пиар (PR - от Public Relations)”, в котором допускается обман, сокрытие информации, дезинформация, и др.

Специалисты PR в целях борьбы с черным пиаром создали всемирную организацию, которая имеет свой устав. В этом уставе определены допустимые принципы и способы воздействия на общественное мнение.

Поскольку Web для продвижения товаров и услуг является средством массовой информации, огромное значение для него имеет аудитория, которая в данном конкретном случае состоит из посетителей сайта.

Структура такого Web представляет собой либо электронную доску объявлений (BBS - Bulletin Board System), либо журнал, либо бюллетень, либо электронную газету, содержащую значительное количество статей. Домашняя страница такого Web обычно содержит оглавление, из которого с помощью гиперссылок можно перейти к требуемому разделу данного СМИ.

Кроме домашней страницы и страниц с основным материалом (пресс-релизы, реклама, специальные статьи и репортажи), Web - сайт может содержать специальные разделы, привлекающие посетителей и формирующие у них желание посетить данный сайт повторно.

За достоверность публикуемой на Web информации владелец Web ответственности может и не нести. Ответственность может быть возложена на того, кто предоставил информацию - об этом обычно делается предупреждение на домашней страничке.

1.4. Web с обратной связью (для изучения мнений, социологических исследований, оценки эффективности,...).

Для реализации обратной связи с клиентами и проведения специальных мероприятий по изучению рынков (например, изучение мнений покупателей, потребителей, специалистов;

определение цены на новые товары;

выявление товаров-аналогов, товаров-конкурентов,...) Web - сайт должен иметь интерактивный характер, т.е. должен быть не только источником, но и приемником информации. Причем, приниматься информация от клиентов должна в реальном режиме времени - при посещении клиентом Web - сайта. Для этого некоторые из Web - страниц изготовляются в виде опросников, т.е. их текст содержит вопросы, а программное обеспечение сайта позволяет зафиксировать ответы клиентов в базе данных Web.

Характер специальных исследований и методы их проведения, а так же алгоритмы обработки получаемой в таких исследованиях информации являются предметом рассмотрения специальных дисциплин, таких, как социология, социальная (общественная) психология. Значительный вклад в разработку специальных методов исследования рынков сделан отечественными специалистами при разработке Системы Комплексного Исследования и Прогнозирования Спроса (СКИПС), разрабатывавшегося для Министерства торговли СССР в 70-80 г.г. К специальным исследованиям рынков относятся мероприятия по созданию источников информации (например, панелей потребителей, покупателей, специалистов промышленности, оптовой и розничной торговли;

сообщества торговых корреспондентов, дающих информацию о наличии в торговых точках определенного перечня товаров;

торговых представителей оптовых предприятий;

автоматизированных информационных систем, например, создаваемых на основе поисковых систем Интернета, и т.д.);

по проведению специальных мероприятий, таких, как выставки-просмотры, выставки продажи, аукционы, и др., на которых исследуется отношение покупателей к новым товарам, определяется возможная цена нового товара, и др. К специальным методам исследования рынков относятся анкетные опросы посетителей сайта или специально подобранной аудитории, наблюдения за поведением покупателей в торговых точках (в том числе - в виртуальных магазинах), и т.д.

Использование обратной связи с клиентами позволяет выяснить, чего ожидают от товара потребители, какое положение среди потребительских предпочтений занимает продукция конкурентов, какая часть спроса не удовлетворяется продукцией фирмы, и др.

1.5. Web электронной коммерции.

Web этого типа представляет собой электронный магазин, называемый иногда виртуальным магазином или виртуальным прилавком. Такой Web должен содержать домашнюю страничку с перечнем услуг, предоставляемых посетителям. В числе услуг, предоставляемых виртуальным магазином, должны быть: информация о магазине, об имеющихся товарах (например, в виде прайс-листов), система оформления заявки на товары.

Для оплаты товаров и услуг может потребоваться не только специальное программное обеспечение, но и специальные технические средства или носители информации (например, “электронные деньги”).

Доставка товаров и услуг покупателю может производиться различными способами. Напрямую с Web - сайта можно доставить лишь ограниченный круг товаров и услуг (например, электронная книга, оцифрованное музыкальное произведение, хранящееся в виде файла;

оцифрованный видеоролик, консультация специалиста, выполненная сотрудниками фирмы проектная работа, результаты исследования рынка, компьютерная игра, и др.). Для товаров и услуг, требующих физического перемещения (например, доставка стиральной машины), Web - сайт может организовать доставку: принять адрес, согласовать время, и т.д. Для реализации этой цели на Web - сайте должна содержаться своя база данных.

1.6. Web сервисного и гарантийного обслуживания.

Сервисное и гарантийное обслуживание клиентов может производиться с Web - сайта, построенного аналогично сайтам, рассмотренным в п.п. 1.2 - 1.4. Но может потребоваться и специальная функция Internet - типа chatting. В этом случае Web - сервер, на котором расположен Web - сайт должен иметь специальное программное обеспечение и, иногда - технические средства.

Поскольку на сайт этого типа обращаются уже состоявшиеся клиенты фирмы, этот сайт можно рассматривать, как место сбора (кучкования) целевой аудитории. Естественно желание фирмы сделать такой сайт оперативно информирующим, предоставлять на нем свежую информацию, ее последнюю версию, чтобы удержать людей, которым интересна данная тематика.

1.7. Web внутрифирменного обучения сотрудников.

Web - сайты для внутрифирменного обучения сотрудников имеют специальную организацию, в которой значительное место занимает защита от несанкционированного доступа. Web - сайт делается закрытым, т.е. доступ к нему могут иметь только зарегистрированные пользователи, которым информация выдается в соответствии с учебной программой порциями. Программное обеспечение предусматривает предоставление учебных материалов, контроль усвоения материала, консультирование, обсуждение на семинарах (в реальном времени) и телеконференциях (каждый участник обязан высказать свою точку зрения, например, в течении недели).

1.8. Web виртуального сообщества фирмы.

В западных компаниях вводятся специальные должности для отслеживания целевой аудитории. Такую аудиторию нужно найти, сформировать, привлечь на свой сайт, удержать. После этого ее можно использовать для проведения специальных исследований по интересующей фирму тематике. Во многом успешность создания своего виртуального сообщества зависит от правильности построения Web - сайта фирмы.

Создание виртуального сообщества фирмы можно вести открыто, анкетируя посетителей, устраивая им формальную регистрацию при посещении сайта. Но можно создавать сообщество и закрытым способом - с помощью фильтрации посетителей через наблюдение (т.е. в течение некоторого времени изучать, какие страницы сервера просматривает тот или иной посетитель, какие кнопки чаще всего нажимает, и на основании этого делать вывод об интересах пользователя). Посетители могут и не знать о проводящемся исследовании.

Одно из самых важных преимуществ Интернета по сравнению с другими СМИ - персонализация содержания, продуктов и рекламы, которая и может быть реализована после выявления интересов посетителя. Web в этом случае работает с посетителем активно и может вовлечь посетителя в сотрудничество, в результате которого пользователи сами указывают на свои предпочтения, определяют рейтинги различных частей узла, предлагаемых товаров или услуг, и т.д.

С помощью наблюдения можно идентифицировать пользователей со схожими интересами. Для них можно организовать встречи, знакомство, переписку, клубы по интересам. Забота о посетителях им всегда приятна и привлекает их на сайт, в котором им интересно.

Цель выхода в Интернет у любой фирмы - брендинг, создание впечатления, имиджевая презентация компании. Она особенно удается, если компания по-настоящему заботится о создании своего виртуального сообщества.

Изучение интересов целевой аудитории помогает фирме структурировать содержание своих сайтов и строить политику по отношению к рекламодателям и конкурентам. Знание особенностей целевой аудитории помогает привлечь рекламодателей и правильно планировать рекламные акции.

В 1997 г. World Wide Web Consorcium (W3C) одобрил в качестве стандарта для исследований аудитории программу Open Profiling Standart (OPS), суть которой в следующем: на компьютере клиента создается (пользователь сам и создает его) специальный файл-портрет пользователя, в который помещается набор сведений о нем (имя, адрес, телефон, адрес электронной почты, хобби). Этот файл доступен для чтения с Web - серверов. Наличие такого файла на компьютере клиента освобождает пользователя от необходимости постоянно регистрироваться и вводить пароли, путешествуя по Сети. Web - сайты же могут запросить этот файл и использовать его для создания виртуального сообщества фирмы.

В результате создания виртуального сообщества фирмы формируются списки рассылки (адресная книга), способствующие достижению своей целевой аудитории с помощью электронной почты.

1.9. Web для совместного проектирования.

Этот Web предназначен для организации совместной работы специалистов, находящихся на значительном расстоянии друг от друга.

Для совместной работы необходимо иметь общий согласованный со всеми план действий. Каждый участник должен знать, с какой целью ведется данная работа, какую часть общей работы кто выполняет, в какие сроки должна быть выполнена та или иная часть работы, какие получены промежуточные результаты другими участниками работы. На таком Web помещается оперативная информация, связанная с общей работой. Если при выполнении проекта необходимо совместное использование имеющихся в наличии ресурсов, на Web размещаются средства, позволяющие согласовывать, кто, когда, в каком объеме будет использовать эти ресурсы. Это “место кучкования” участников совместного проекта.

Для совместной реализации проектов удаленными исполнителями используется специальная организация Web - сайта и может потребоваться специальное программное обеспечение типа персональных информационных менеджеров (PIM - Personal Information Manager).

Основное назначение бизнеса - находить потребителей и удерживать их. Значительную помощь в этом могут оказать Web - представительства. Однако, надо отметить, что создание и ведение Web - представительства связано со значительными затратами, и при том не решает всех проблем фирмы.

В полном объеме фирма должна иметь в Интернет систему сбора информации, ее систематизации и анализа (для которой необходимы СУБД, поисковые системы, пакеты статистического анализа, и др.);

систему проведения рекламной компании (для которой необходимы e mail, WWW - сервер, телеконференции);

интерактивную систему фиксации поступающих заказов;

систему расчетов с клиентами;

систему послепродажного сервиса, и т.д.

Глава 2. Возможности Интернет по обеспечению функционирования представительств фирм.

Internet - это “сеть сетей”. Это не глобальная вычислительная сеть, а структура, объединяющая глобальные вычислительные сети.

Сначала считалось, что глобальная вычислительная сеть (ГВС) должна иметь в своей основе базовую сеть передачи данных (СПД).

Поэтому ГВС можно было построить на основе МГТС (МеждуГородней Телефонной Связи) или какой-либо отраслевой системы связи, например, МПС или Газпром. Но по мере развития ГВС выяснилось, что глобальные вычислительные сети можно создавать и на основе аренды систем связи, например - Фидонет.

В каждой ГВС используется ограниченная номенклатура технических средств, обычно - ЭВМ одного типа (IBM 360, ЕС ЭВМ, IBM PC, Apple, и др.). Форматы используемой в них информации и системы команд различны. Сети, в которых используется один вид ЭВМ, называются однородными. Для того, чтобы соединить две ГВС, построенные на разных типах ЭВМ (разнородные ГВС), необходимы специальные технические и программные средства, реализованные в виде “шлюзов” (или “маршрутизаторов”). В шлюзах осуществляется перекодировка информации из кодов, действующих в одной сети в коды, действующие в другой (например, из КОИ-7 в ДКОИ или в ASCII, и обратно), и преобразовываются другие данные (например, адреса абонентов сети) в соответствии с правилами, принятыми в каждой ГВС.

При большом количестве разнородных глобальных вычислительных сетей для связи друг с другом эти ГВС должны иметь большое количество шлюзов, что связано с большими материальными затратами.

Значительно более эффективным является разработка общих для всех правил обмена информацией и способов ее представления.

При создании Internet разработана стандартная система адресации ресурсов (URL - Uniform Resource Locator) и правила обмена информацией - протоколы TCP (Transmission Control Protocol) и IP (Internet Protocol), используемые обычно совместно и известные под именем TCP/IP. URL и протоколы TCP/IP являются стандартом Internet и обязательны для использования всеми ГВС для внешнего обмена информацией в составе Internet.

URL - адресация имеет иерархический характер. Уровни иерархии образуют домены. Домены верхнего уровня классифицируют ресурсы по типам или по регионам. По типам домены именуются трехбуквенными идентификаторами: gov (government) - правительственные;

edu - educational - образовательные;

org - organization - организации;

net - домен сетеобразующих организаций;

com - commercial - коммерческие;

mil - military - военные. По регионам домены именуются двухбуквенными идентификаторами: uk - англия;

jp - Япония;

au - Австралия;

ch - Чехия;

ru - Россия;

su - Советский Союз;

kg - Киргизия, и т.д.

Домены второго и следующих уровней являются именами постоянно подключенных к Интернет компьютеров.

Доменная система адресации позволяет адресовать не только абонентов (в качестве которых могут выступать серверы, клиентские компьютеры, абонентские пункты, сетевые принтеры, и др.), но и информационные единицы, вплоть до файлов.

Согласно протоколу TCP, передаваемая информация разбивается на маленькие фрагменты - пакеты. Соединение пакетов в соответствии с этим протоколом происходит на принимающей машине после их поступления (поступать они могут на принимающую машину вразбивку и по различным маршрутам). Протокол IP определяет наилучший маршрут от одной ЭВМ к другой и управляет передачей пакетов.

Internet реализована с ориентацией на технологию “клиент - сервер”, т.е. предусматривает наличие Host - компьютеров (Host - компьютером называется каждая постоянно подключенная к сети ЭВМ с установленным на ней программным обеспечением сервера), с которыми связываются компьютеры - клиенты.

Структуру Internet можно упрощенно представить в виде сети, связывающей различные ГВС через шлюзы. Структура таких ГВС может быть различной. В их составе можно увидеть три вида провайдеров Internet: ISP, IPP, PCP и различные виды серверов (E-mail, FTP, WAIS, Gopher, Telnet).

ISP (Internet Service Provider) - поставщик услуг Internet, т.е.

организации или частные лица, предоставляющие доступ в Internet. ISP подключены к Internet постоянно и имеют постоянный IP-адрес (IP адрес является частью URL). Остальные пользователи (клиенты) подключаются к ISP на время работы (IP-адрес присваивается им ISP каждый раз при подключении, а при отключении - отбирается и может быть отдан кому-нибудь другому). ISP, как правило, предоставляет своим клиентам удаленный доступ по коммутируемым каналам телефонной связи (это называется “dual-up service”). Для этого ISP арендует у местной телефонной компании телефонные линии, по которым с ним можно связаться. Как минимум одна из этих линий должна быть выделенной, используемой для постоянной связи ISP с Internet.

IPP (Internet Presence Provider) это поставщик, обеспечивающий своим клиентам присутствие в Internet. Он так же подключен к Internet постоянно и имеет постоянный IP-адрес. В отличие от ISP, он не предоставляет услуг dual-up service. Он может только размещать на своих серверах публикации других лиц, рекламу, Web - сайты, и т.д.

PCP (Private Content Publisher) - издатель собственных материалов, является участником межсетевого обмена, который готовит информацию для размещения в Internet.

В Internet насчитываются миллионы Host - компьютеров, принадлежащих различным глобальным вычислительным сетям (в 1969г. было всего 4 "хоста", в 1996г. количество Host-компьютеров возросло до 8,3 млн.).

В таком количестве Host-компьютеров хранится огромное количество информации. Практически можно считать, что в Internet есть любая информация. Проблема заключается в том, как найти и получить нужную информацию в нужный момент? Для этого существуют сервисы Internet. Они постоянно совершенствуются и дополняются. К ранним видам сервиса относятся: электронная почта (e-mail);

телеконференции (news);

использование вычислительных и информационных ресурсов компьютера в режиме удаленного терминала (telnet);

служба хранения, поиска и пересылки файлов - FTP (File Transfer Protocol);

Archie - поисковая система FTP;

информационная система Gopher;

глобальная информационная система WAIS, ведущая поиск по ключевым словам;

WWW (World Wide Web) - всемирная паутина (в ее составе в июле 1993г. было 130 Host-компьютеров, а в июне 1996г. 230000).

В последнее время появляются новые виды сервиса: коммерческие информационные системы по производителям товаров и услуг, котировкам акций на фондовых биржах;

системы для заказа товаров по сети (цветы, пицца, авиабилеты, номер в гостинице…);

библиотечные системы, электронные издания газет и журналов, сервисные представительства фирм, и др.

Каждый сервис требует своего программного обеспечения.

Поэтому, работа в Internet связана с высокими требованиями к квалификации пользователя. Это значит, что для успешного использования многих видов сервиса необходимы глубокие профессиональные знания.

Но Internet ценен тогда, когда в нем может работать каждый, в том числе - не имеющий профессиональной подготовки. Поэтому при развитии сервисов большое внимание уделяется "дружественности к пользователю" создаваемых программных средств. Именно поэтому стал особенно бурно развиваться сервис WWW.

Однако, использование в Интернет в целях бизнеса только одного сервиса WWW (например в виде Web - представительства фирмы) не решает всех проблем. Фирма должна пользоваться различными сервисами: электронной почтой, телеконференциями, различными поисковыми системами. При этом нужно иметь в виду, что в WWW - сервисе сосредоточена далеко не вся информация Интернет (по некоторым оценкам - не более 20%).

Если фирма располагает адресом электронной почты, можно сказать, что она уже имеет сетевой филиал, который в дальнейшем может быть оснащен Gopher или FTP -сервером, Web - сайтом, или WWW - сервером. Нужно так же помнить, что клиенты фирмы могут располагать доступом только к электронной почте, в результате чего Web-сайт фирмы таким клиентам будет недоступен. Поэтому, если фирма ограничится только созданием Web - сайта, это может отрицательно сказаться на ее бизнесе. Наиболее оптимальным в этом случае для фирмы представляется помимо Web-сайта создание Gopher - Считается, что у Internet нет хозяина. Координацию работы Сети ведет Сообщество Internet (ISOC), работающее на общественных началах (находится в Рестоне, штат Вайоминг, США).

ISOC избирает координационный Совет Internet (IAB), который разрабатывает техническую политику, инициирует разработку стандартов для работы в Сети.

Непосредственную исследовательскую и техническую работу ведут координационные и рабочие группы, создаваемые IAB.

Однако, децентрализация сети имеет предел, связанный с присвоением адресов host - компьютерам. Международная организация Internic (http://www.internic.net/), где NIC означает Network Information Centre (Сетевой Информационный Центр) производит регистрацию host - компьютеров (т.е. контролирует домены верхних двух уровней) и следит за уникальностью регистрируемых адресов.

При регистрации в Internic определяется корневой домен, к которому относится регистрируемый host - компьютер, и отправляется заявка на регистрацию в этом домене его имени. Имя должно быть уникальным (отсутствующим в Internic), легко запоминаться и вводиться с клавиатуры. За регистрацию своего имени домена уплачивается взнос.

Отдельная плата раз в два года вносится за сопровождение этого имени (т.е. за хранение этого имени в базе данных Internic).

В этой работе Internic`у помогают другие организации. Так, Российский НИИ Развития Общественных Сетей (РосНИИРОС) регистрирует имена доменов второго уровня в домене "ru".

Получив свое доменное имя, Вы можете стать ISP или IPP (ISP в отличие от IPP имеет право предоставлять своим клиентам домены третьего уровня. Никаких согласований с Internic или РосНИИРОС при этом не требуется).

2.1. Адресация ресурсов Internet.

Ресурсами Internet являются host - машины, машины - клиенты, программы (например, сервер WWW, сервер FTP, и др.), информационные ресурсы (файлы на серверах, host - машинах и машинах - клиентах).

Все ресурсы в Internet имеют свой адрес. Полный адрес (идентификатор) состоит из двух частей: IP-адреса машины (или хост машины, или глобальной сети), и URL для идентификации ресурсов на данной машине (иногда считается, что URL включает в себя IP - адрес).

IP - адрес имеет доменную структуру и может быть представлен в символьном или цифровом виде.

Хост - машина является доменом, т.е. административной единицей, обладающей правом предоставления адресов подчиненным объектам, которые образуют “дерево” хоста.

Синтаксис IP-адреса определяет, что полное имя компьютера включает в качестве крайнего правого элемента имя домена первого уровня. Подчиненные домены перечисляются левее домена первого уровня и отделяются друг от друга точкой.

Например, mesi.ru/ - это полное имя хост - компьютера Московского Государственного университета экономики, статистики и информатики (МЭСИ), зарегистрированное в домене первого уровня “ru” (от RUssia).

Все ЭВМ, подключенные к этому хосту, объединяются в группу, имеющую такое же значение первых двух уровней адреса. Если университет имеет в своем составе институт информационного менеджмента (im), то host-компьютер, стоящий в этом подразделении, образует свой домен (более низкого уровня). Полный IP-адрес этого нового домена будет:

im.mesi.ru/ Если одному из host-компьютеров в институте информационного менеджмента присвоено имя “cafedra_vms”, то полный IP-адрес этой ЭВМ будет:

cafedra_vms.im.mesi.ru/ Доменная система адресации гарантирует, что во всем Internet нет двух ЭВМ с одинаковыми адресами.

В имени может быть любое число доменов. Но чаще всего используются имена с количеством доменов не более трех - пяти.

Каждая группа, имеющая домен, может создавать и изменять адреса, находящиеся под ее контролем. Например, если в институте с адресом im.mesi.ru будет создано новое подразделение - лаборатория аналитических исследований, то для именования его host-компьютера институт не должен спрашивать ни у кого разрешения. Достаточно добавить новое имя (например, analysts), в результате чего любой пользователь Internet сможет обращаться к этой ЭВМ по адресу:

analysts.im.mesi.ru/ Для подчиненных доменов (т.е. доменов нижних уровней) можно использовать любые неповторяющиеся имена. Но для названия доменов самого верхнего уровня существует стандарт (соглашение): таким именем могут быть две буквы, определяющие страну, в которой расположен адресуемый узел (всего таких имен 244):

ru - Россия;

su - Советский Союз;

de - Германия;

fr - Франция;

uk - Великобритания;

ua - Украина;

kg - Киргизия;

и т.д.

или три буквы, обозначающие род деятельности:

com - коммерческие организации;

net - сетевые организации;

edu - учебные и научные заведения;

gov - правительственные учереждения;

mil - военные организации;

org - прочие организации.

Домен второго уровня - это уникальное для Интернет имя хост компьютера, которое не должно повторяться в домене первого уровня (за этим и следит РосНИИРОС).

Домен третьего уровня может так же означать уникальное для домена второго уровня имя хост-компьютера, но может являться и виртуальным объектом - именем Web - сайта, расположенном на хост компьютере, зарегистрированном в домене второго уровня.

В настоящее время производится регистрация доменов второго уровня на русском языке, на языках стран СНГ и балтии. Планируется применение в доменных адресах иероглифов.

Цифровые IP - адреса состоят из четырех целых чисел, каждое из которых не превышает 256. Числа отделяются друг от друга точками: например, 194.84.93.10 или 200.5.78.175. В цифровом виде IP адрес имеет длину 32 бита.

Преобразование имен в цифровые адреса производится автоматически с помощью Internet - службы DNS (Domain Name System). Серверы DNS хранят информацию о соответствии символьных и цифровых имен.

Пользователи работают с цифровыми адресами довольно редко:

при подключении к Internet указывается цифровой адрес DNS - сервера;

при работе с Intranet цифровой адрес используется для указания своего сервера WWW.

Доменная система адресации (IP-адресация) используется для адресации подключенных к Internet электронных вычислительных машин. Но на этих ЭВМ имеется большое количество разнообразных ресурсов (базы данных, файловые библиотеки, Web - сайты, почтовые ящики,...), адресация которых выполняется с помощью URL (Universal Resource Lokator) - Универсального Локатора Ресурсов. URL - это адрес любого ресурса Internet, включающий в себя и IP - адрес ЭВМ, на которой этот ресурс расположен, с указанием того, по какому протоколу к этому ресурсу надо обращаться. Пример URL - адреса:

http://www.microsoft.com/ie Здесь http - название протокола (WWW);

ie - имя каталога;

www.microsoft.com - имя сервера WWW.

Адрес ftp://www.mycompany.ru/business/index.html описывает доступ к файлу index.html, расположенному в каталоге business на сервере www.mycompany.ru. Символы ftp указывают, что обращение идет именно к файлу, а не к Web - странице, хранящейся в этом файле (т.е. работа с файлом index.html будет вестись по протоколу ftp, а не http, или иными словами, работать с файлом будут программы ftp - сервиса Internet, а не www - сервиса, хотя файл с таким именем по умолчанию является домашней страницей Web - сайта ).

Расширение файла состоит из четырех букв, а не трех (как принято в MS DOS). Это связано с тем, что ЭВМ в Internet работают под управлением операционных систем, отличных от DOS. Но довольно часто расширения файлов имеют и по 3 символа.

После доменного адреса ЭВМ может находиться номер порта, т.е.

номер программы, которую надо загрузить на сервере для обработки поступившего запроса. Пример:

ftp://123.45.6.78:9535/workarea/common/main/text.doc.

Здесь номер порта отделен от IP - адреса двоеточием.

Обычно порты указывать нет необходимости - они используются по умолчанию.

Типы протоколов современные программы так же опознают самостоятельно. Поэтому вместо http://www.kat.ru/users можно использовать www.kat.ru/users. Вот если к этому каталогу надо обратиться по другому протоколу, то его необходимо указывать явно.

Адреса электронной почты состоят из двух частей, разделяемых символом @. Справа от этого символа располагается IP - адрес ЭВМ, на которой находится почтовое отделение абонента. Слева от него расположено имя абонента. Например:

ivanov@analysts.im.mesi.ru.

Навигация в Internet (т.е.переход от одного ресурса к другому) часто может производиться без набора длинных URL - адресов, по так называемым “гиперссылкам”. Гиперссылки бывают текстовые и графические. Каждая гиперссылка состоит из двух частей: указателя (Anchor) и адресной части (URL reference). При использовании текстовых гиперссылок пользователь видит указатель - специально выделенное слово или группу слов (обычно указатель выделяется синим цветом и подчеркивается). При использовании графических гиперссылок указатели никак не выделяются. Просто картинка или ее часть сделана активной. Обнаружить любую гиперссылку можно кусором мыши - если он попадает на указатель текстовой или графической гиперссылки, то его форма меняется на сжатую в кулак руку с отогнутым указательным пальцем.

Адресная часть гиперссылки пользователю не видна. Она представляет собой полный URL - адрес объекта, к которому необходимо перейти. Находится она в описании того, каким образом необходимо отобразить на экране используемый ресурс, т.е. в тэгах языка HTML.

Если ресурс находится на своем компьютере, то вместо URL - адреса набирается полный адрес данного ресурса в нотации MS DOS.

Например: d:\institut\web-site\index.htm.

2.2. Электронная почта и ее использование для поиска, отправления и получения информации.

Назначение и сфера применения протоколов электронной почты.

На host-компьютере ISP выделяются почтовые ящики для пользователей, в которых накапливается вся приходящая для них корреспонденция.

При подключении пользователя к узлу (host-компьютеру ISP) письма из почтового ящика соответствующего пользователя пересылаются на его ЭВМ. При этом пользователь остается подключенным к Интернет (и оплачивает) только то время, которое необходимо для обмена корреспонденцией с почтовым ящиком.

Остальная работа ведется в режиме offline. Это - одно из преимуществ электронной почты.

Для нормального функционирования современной электронной почты на host-компьютере необходимо иметь два почтовых сервера:

сервер исходящей почты SMTP (Simple Mail Transfer Protokol) - простой транспортный почтовый протокол - накапливает отправленные абонентами данного узла письма и рассылает их по указанным в письмах адресам;

сервер входящей почты POP3 (Post Office Protokol) - почтовый протокол - принимает приходящую от других узлов корреспонденцию, разносит ее по почтовым ящикам и может осуществлять перекодировку приходящих сообщений, например, из КОИ-8 в Windows 1251.

До появления протоколов SMTP и POP3 для работы с электронной почтой использовался протокол UUCP (Unix to Unix Copy Program) - программа копирования с Unix на Unix. Этот протокол не является сервисом Интернета и не использует протоколов TCP/IP. Но некоторые глобальные вычислительные сети работают с электронной почтой по этому протоколу.

В последнее время появился еще один Интернет - протокол для работы с электронной почтой: MIME (Multipurpose Internet Mail Extension) - многоцелевое расширение электронной почты для Интернет. Он обеспечивает передачу данных, которые кроме чистого текста в формате KOI-8, ASCII или Windows 1251 содержат данные в двоичной системе, что позволяет пересылать вперемежку с текстом графику, аудио- и видеофайлы, тогда, как предыдущие протоколы позволяют лишь подключать бинарные файлы к основному тексту письма в качестве дополнительной единицы, сопровождающей текст письма.

Какие из перечисленных протоколов доступны клиенту для работы - зависит от ISP, от того, какие серверы e-mail установлены на host компьютере.

Программа Internet Mail.

Эта программа входит в комплект браузера Internet Explorer и устанавливается вместе с ним.

При первом запуске программы инициируется мастер настройки Internet Mail, с помощью которого устанавливаются необходимые параметры для работы с электронной почтой в Интернет. При настроенной программе мастер настройки не вызывается.

При настройке электронной почты необходимо указать программе свое имя или псевдоним, по которому к Вам будут обращаться при переписке;

свой адрес e-mail (который определяется Вашим ISP);

адреса входящего (POP3) и исходящего (SMTP) серверов электронной почты;

пароль для доступа к электронной почте;

способ связи с Интернет (через локальную сеть, вручную или с помощью модема).

При обращении к программе на экран вызывается основное рабочее окно.

Заголовок окна и меню в нем - стандартные для Windows 95.

Ниже строки меню находится панель инструментов, на которой расположены кнопки: “Создать сообщение”, “Отправить отправителю”, “Ответить всем”, “Переслать”, “Доставить почту”, “Удалить”.

Под строкой панели инструментов расположен открывающийся список “Папки”, который используется для работы с приходящей и отправляемой корреспонденцией.

Центральная часть окна программы разделена на две половины: в верхней части отображено содержание открытой папки;

в нижней части - тексты писем.

В самом низу окна программы находится строка состояния, в которой появляются сообщения программы о выполняемых ею действиях.

Команда меню “Сообщение” позволяет произвести подстройку программы (для этого служит опция этой команды “Параметры (Options)”. Подстройка позволяет изменить параметры, установленные мастером настройки программы, выбрать шрифт, включить проверку орфографии, и др.

Для обращения к Internet Mail из Internet Explorer необходимо щелкнуть мышью по кнопке “Почта (Mail)” в меню окна Internet Explorer.

Создание почтового ящика на mail.ru.

В учебных лабораториях программа Internet Mail обычно настраивается только на создание и отправку корреспонденции.

В то же время, в Интернет есть IPP, предоставляющие в качестве бесплатной услуги поддержку личного почтового ящика. В Российской части Интернет такие IPP имеют имена:

- mail.ru - chat.ru - i-connect.ru В иностранной части Интернет аналогичные услуги предоставляют:

- geocities.com - tripod.com - angelfire.com - xoom.com С помощью браузера установите связь с Web -сайтом:

http://www.mail.ru выберите на нем услугу: “Создание почтового ящика”, далее следуйте выводимым на экран указаниям. При регистрации может возникнуть ситуация, когда Вы получаете неожиданный отказ (диагностической информации при этом выводится очень мало). Одной из причин такого отказа в регистрации может быть, что у данного IPP уже зарегистрирован пользователь с таким именем.

Создание, отправка, получение и чтение письма.

Создание сообщения.

Для создания сообщения на панели инструментов основного окна программы Internet Mail имеется кнопка “Создать сообщение (New Message)”. При щелчке по этой кнопке появляется окно “Создание сообщения”. Три строки этого окна имеют вид, стандартный для Windows 95. Следующие строки являются заголовком письма. Они определяют: “Кому (To)” (здесь указывается адрес e-mail получателя), “Копия (CC-Carbon Copy)” - определяет адреса получателей копии письма при массовой рассылке, “Тема (Subject)” - содержит краткую аннотацию письма, которая будет необходима при получении ответа на него, так как одному и тому же адресату может быть отправлено несколько писем, требующих ответа. В правой части строки “Кому” находится марка письма - значок, позволяющий указать его важность.

Для выбора требуемой марки необходимо щелкнуть по ней мышкой и выбрать в появившемся меню один из трех видов важности: “Высокая”, “Обычная”, “Низкая”.

Под заголовком письма находится поле для основного текста.

Переключение курсора между полями можно производить мышью или клавишей “Tab” клавиатуры.

После заполнения всех полей необходимо отправить письмо - для этого служит крайняя левая кнопка панели инструментов (третья сверху строка окна). Письмо помещается в папку “Исходящие (Outbox)” - оно готово к отправке. Сразу отправка не происходит, так как для этого надо подключиться к Интернет а программа Internet Mail позволяет готовить письма и накапливать их в папке “Исходящие” в режиме offline.

Для отправки письма необходимо закрыть окно “Создание сообщения”, а в основном окне программы Internet Mail открыть папку “Исходящие” (для этого служит 4 сверху строка). На экране появится содержание этой папки, в котором можно найти и составленное только что письмо - его имя набрано курсивом, что значит: письмо готово к отправке, но еще не отправлено. Если на панели инструментов основного окна нажать кнопку “Переслать (Send and Receive), программа начнет подключение к Интернет (при этом запросит имя пользователя и пароль). После подключения к провайдеру процесс передачи сообщения адресату иллюстрируется на экране в окне “Доставка”.

После отправки сообщения соединение с ISP может сохраниться или быть разорванным - это определяется флажком “Отключиться после доставки почты”, который устанавливается и сбрасывается при выборе в меню основного окна программы Internet Mail команды: “Сообщения - > Параметры”.

Подготовленное к отправке (но не отправленное) письмо можно удалить - для этого письмо сначала выделяется (например, щелчком мыши по нему), а затем нажимается кнопка “Удалить (Delete)” на панели инструментов основного окна программы - выделенное письмо перемещается в папку “Удаленные (Deleted items)”. Из этой папки письмо можно еще восстановить.

Получение почты.

Для проверки содержимого почтового ящика необходимо активироватьпрограмму Internet Mail, и в ее основном окне щелкнуть по кнопке “Переслать (Send and Receive). Программа начинает подключение к Интернет, после установления связи с провайдером проверяет почтовый ящик на компьютере ISP, и содержимое его переписывает на компьютер абонента. После завершения переписи корреспонденции связь с поставщиком услуг Интернет разрывается (если установлен флажок “Отключиться после доставки почты”).

Поступившая корреспонденция размещается в папке “Входящие (Inbox)”. Содержимое папки высвечивается на экране в виде таблицы, содержащей три колонки: колонка “От”, колонка “Тема”, колонка “Получено” с указанием даты.

Слева от каждого сообщения значок в виде открытого конверта помечает прочитанные сообщения. Закрытый конверт отмечает новые, непрочитанные сообщения.

При щелчке мышью на непрочитанном письме, его содержание отображается в нижней части окна программы Internet Mail. Значок слева от названия письма превращается в открытый конверт.

Если при отправке корреспонденции был указан неверный адрес, то такое сообщение возвращается отправителю с пометкой Returned Mail: User Unknown (Возвращенная почта: абонент неизвестен). Такое письмо содержит техническую информацию: через какие узлы Интернет письмо шло к адресату, и др.

Поскольку разные корреспонденты работают с разными почтовыми стандартами, полученное письмо может быть выполнено в такой кодировке, что его нельзя будет прочесть. Программа Internet Mail пытается самостоятельно определить, в каком коде написано пришедшее письмо и преобразовать его в необходимый код. Однако, это удается не всегда. Тогда необходимо воспользоваться командой “Вид” в основном меню Internet Mail. В открывшемся окне необходимо выбрать функцию “Набор символов” - откроется окно с перечнем известных программе кодировок. Зная, откуда пришло письмо, можно подобрать необходимый код. Наиболее распространенными кодировками являются “Кириллица [KOI8-R]” и “Кириллица [Windows]”.

Создание ответа на письмо.

Ответ на пришедшие письма необходимо составлять так, чтобы получивший его мог вспомнить, о чем шла речь раньше. Для этого ответ должен содержать цитаты из предыдущей корреспонденции. Для создания цитат необходимо копировать текст из предыдущего письма.

Программа Internet Mail предусматривает использование текста пришедшего письма при подготовке ответа на него.

Письмо, на которое составляется ответ, отмечается щелчком мыши, после чего на панели инструментов основного окна программы нажимается кнопка “Ответить отправителю (Reply to Autor)”. При ответе в поле “Кому” будет помещен обратный адрес отправителя письма, на которое составляется ответ, в поле “Тема сообщения” помещается тема исходного письма, а содержание письма - ответа состоит из содержания исходного письма, каждая строка которого помечена знаком >, обозначающим цитаты. Далее стандартными средствами работы с текстами Windows 95 из цитаты убирается лишняя часть, и пишется ответ.

Электронная автоподпись письма.

Под электронной автоподписью понимается текст (или файл), который автоматически вставляется в конец написанного письма.

Для создания такой подписи в основном окне программы Internet Mail выбирается команда меню “Сообщения -> Параметры”. При выполнении этой команды открывается диалог настройки, в котором необходимо выбрать вкладку “Подпись (Signature)”. На этой вкладке устанавливается флажок “Текст”, после чего в поле ввода набирается электронной подписи - это может быть просто имя и фамилия;

или фамилия, имя и отчество;

или то же самое со словами “Искренне Ваш”, и т.д.

После набора текста необходимо установить два флажка в нижней части окна. Один из них “Помещать автоподпись в конец исходящих сообщений”, другой - “Не использовать автоподпись при ответах и пересылке”. Если оба флажка установлены (помечены галочкой), то в конец каждого написанного письма в момент отправки будет автоматически добавляться составленный текст подписи.

Адресная книга.

При активной работе с электронной почтой накапливается большое количество адресов. Программа Internet Mail позволяет хранить эти адреса и связанную с ними информацию в адресной книге.

Обращение к адресной книге для работы с ней производится из меню в основном окне программы по команде: “Файл -> Адресная книга” (“File - > Adress Book”). На экран выводится окно адресной книги, на панели инструментов которой имеются кнопки: “Создать адрес”, “Создать группу”, “Свойства” и “Удалить”. Щелчок по кнопке “Создать адрес” выводит на экран окно “Свойства! с пустыми полями, в которые вводятся имя, отчество, фамилия, адрес электронной почты (это основная информация, необходимая для работы электронной почты).

Кроме того, в адресную книгу может быть внесена и дополнительная информация личного и служебного характера, а так же - заметки, связанные с каждым адресатом.

Информация в адресной книге может быть отсортирована по разным признакам, что облегчает поиск информации при большом объеме книги. Для сортировки в основном окне адресной книги выбирается команда “Вид” - > “Сортировка”. Появляется окно, содержащее список критериев сортировки. После выбора одного из критериев (например, “фамилия”) все записи будут отсортированы по выбранному полю (критерию).

Использование адресной книги при создании сообщения заключается в том, что в окне “Создание сообщения” левее поля “Кому (To)” имеется значок, щелчок по которому вызывает на экран адресную книгу в виде окна “Выбор получателей (Select Recipients)”. Подсветка требуемой фамилии и нажатие кнопки “Кому” приводит к заполнению соответствующих полей создаваемого сообщения содержимым адресной книги. Если требуется разослать письмо в несколько адресов, после заполнения основного адресата подсвечивается другая фамилия и нажимается кнопка “Копия (CC - Carbon Copy)”. Основной адрес - только один. Копии могут рассылаться по целому списку, который создается в окне “Копия”. После окончания работы с адресной книгой нажимается клавиша “ОК” и закрывается диалог “Выбор получателей”, а выбранные адреса заполняют соответствующие поля создаваемого сообщения.

Для удаления записей из адресной книги в основном меню Inernet Mail выбирается команда: “Файл” -> “Адресная книга”, выделяется подсветкой удаляемая запись, нажимается кнопка “Удалить”. После подтверждения намерения об удалении выделенная запись выводится из адресной книги без возможности автоматического восстановления.

Адресная книга позволяет упростить массовую рассылку сообщения, если такая рассылка производится регулярно в одни и те же адреса. Для этого служат “групповые имена” или “группы”.

Групповые имена создаются щелчком по кнопке “Создать группу (New Group)” в панели инструментов адресной книги. Для изменения состава группы в адресной книге помечается (подсвечивается) требуемая группа и производится щелчок мышью по кнопке “Свойства”.

Каждой группе дается свое имя. После заполнения информации, характеризующей состав группы, имя группы может быть использовано в поле “Кому” или “Копия” отсылаемого сообщения. Сообщение будет отправлено всем, кто входит в эту группу.

Пересылка файлов по e-mail.

Электронная почта предназначена для пересылки текстовых сообщений, не содержащих среди текстовых символов практически никаких служебных знаков.

При попытке передачи по электронной почте двоичный файл (например, программу или рисунок) могут возникнуть затруднения у почтовой службы провайдера - некоторые комбинации битов передаваемого двоичного файла могут совпадать с кодами служебных символов, управляющих работой почтовой службы.

Поэтому, при необходимости переслать двоичный файл по электронной почте, этот файл “прикрепляется” к письму и рассматривается как вложение в конверт.

Для того, чтобы присоединить файл к письму, необходимо в окне “Создание сообщения” щелкнуть по значку канцелярской скрепки в панели инструментов - на экране откроется окно “Вставка приложений”, в котором нужно указать, какой именно файл присоединяется к письму и где (на каком диске, в какой папке) он находится.

К одному и томуже письму можно присоединить несколько файлов, последовательно выполняя процедуру присоединения для каждого из них.

Если пришедшее письмо содержит присоединенный файл, то Internet Mail извещает об этом значком канцелярской скрепки слева от параметра “От (кого)”. При двойном щелчке по заголовку письма открывается окно просмотра содержимого письма, в нижней части которого содержится полоса с изображением файла. Для отсоединения файла от письма необходимо подсветить файл, щелкнув по нему мышкой (или поместив на него курсор мыши) и щелкнуть правой кнопкой мыши. Откроется окно с контекстным меню. Необходимо выбрать команду “Сохранить как (Save As)” - появится окно “Сохранить вложение как (Save Attach As)”, в котором необходимо выбрать папку для хранения полученного вложения.

По электронной почте можно таким образом передавать лишь файлы ограниченного объема. Обычно перед передачей файлы архивируются.

Использование почтовых роботов для поиска, запроса и получения информации.

С помощью электронной почты можно не только обмениваться письмами, но и получать любую информацию из Интернет. Для этого используются почтовые роботы (почтовые системы), имеющиеся в некоторых сервисах Интернет.

Почтовым роботом называется программа, которая получает электронную почту, приходящую в ее адрес, определяет, на какую информацию был прислан запрос и выполняет необходимые действия по выполнению пришедшего запроса. Полученные результаты отправляются на e-mail запросившего информацию клиента.

Работа с почтовым роботом строится следующим образом: клиент составляет текстовый запрос на информацию и отправляет его письмом по e-mail почтовому роботу, после чего отключается от Интернет. Через некоторое время, необходимое для получения письма почтовым роботом и организации им необходимой работы для выполнения заявки, клиент связывается со своим почтовым ящиком. Если ответ почтового робота получен, клиент переписывает его на свою ЭВМ, отключается от Интернет, и в режиме offline продолжает работу с полученной информацией. Это очень экономный режим, т.к. связь с Интернет продолжается только для работы с почтовым ящиком (отправка корреспонденции в Интернет и получение поступивших сообщений).

Практически со всеми роботами можно общаться одинаково: Вы посылаете ему письмо с пустым полем “Тема” (Subject), а в тексте письма пишете команды, которые он должен выполнить. Набор команд у разных роботов различен. Но все они распознают команду Help (помощь), в ответ на которую присылают инструкцию по работе с данным роботом и его системой команд. Ответа от робота можно ждать довольно долго - вплоть до недели (нормально - один день), так как бесплатные запросы он выполняет при наличии свободного времени.

По e-mail не следует запрашивать слишком большие файлы, так как при плохом качестве связи Вы не сможете получить ни их, ни пришедшую после них почту.

Файлы, приходящие по e-mail, закодированы в формате UUENCODE. Для их просмотра необходима перекодировка. Для раскодирования полученных файлов необходима программа uudecode.exe, при запуске которой в качестве аргумента указывается имя перекодируемого файла с указанием пути к нему.

С помощью e-mail возможна работа с такими услугами Интернет, как Archie (поиск файлов), FTP (получение файлов), WAIS (поиск документов по ключевым словам), News (поиск, получение и отправка новостей).

Получить инструкцию по работе с почтовым роботом Archie, действующим на хост-компьютере archie.doc.ik.ak.uk можно следующим образом:

- создаем новое письмо: в поле “кому” указываем адрес почтового робота: archie@archie.doc.ik.ak.uk.

- поле “Тема” оставляем пустым;

- в тексте письма пишем всего одно слово: help - отправляем созданное письмо и ждем ответа.

Адреса некоторых почтовых роботов:

- робот BITFTP: bitftp@pucc.princeton.edu - робот FTPMAIL: ftpmail@sunsite.doc.ik.ak.uk - робот архива новостей: mail-server@rtfm.mit.edu - робот на Европейском сервере FTPMAIL: ftpmail@grasp.insa lyon.fr - робот на сервере из США: ftpmail@decwrl.dec.com.

2.3. Служба FTP.

Коммуникативную функцию в Internet выполняет электронная почта (electronic mail, или сокращенно e-mail). Второй основной функцией является хранение информации. Эта функция нашла в Internet свое отражение в сервисе FTP (File Transfer Protokol). FTP - архивы являются одним из основных информационных ресурсов Internet.

Фактически - это хранилища текстов, программ, фильмов, фотографий, аудио записей и прочей информации, записанные в виде файлов во внешних ЗУ ЭВМ, разбросанных по всему миру.

Вся хранимая в FTP - архивах информация может быть представлена в виде трех разновидностей: freeware, shareware и коммерческая.

Freeware - это свободно распространяемые информационные ресурсы. К ним относится все, что можно получить в сети бесплатно и без специальной регистрации.

Shareware - это информационные ресурсы ограниченного использования (условно-бесплатные ресурсы). К ним чаще всего относятся ресурсы с ограниченным временем использования, которое дается пользователю для ознакомления, или с ограниченным набором функций. По истечении установленного времени пользователь должен пройти регистрацию (и заплатить), в противном случае ресурс перестает работать (например, в shareware - программу встраивается контроль даты, и после окончания срока ознакомления программа сама себя разрушает).

Коммерческая - это защищенная информация, режим доступа к которой определяется ее владельцем и разрешается по специальному соглашению с потребителем.

FTP - архивы обычно являются коммерческими, предназначенными для обслуживания зарегистрированных пользователей. Но каждый из них имеет открытую часть, содержащую freeware и shareware - ресурсы. Для регистрации в открытой части FTP - архива пользователь набирает имя “anonymous”. Программа, обслуживающая таких пользователей, называется “анонимным FTP - сервером”. После регистрации анонимный сервер запрашивает пароль.

На этот запрос необходимо сообщить свой адрес электронной почты.

Иногда в качестве пароля используется слово “guest”.

Как уже отмечалось, FTP - архив имеет иерархическую структуру:

файлы расположены в директориях, которые могут являться поддиректориями директориев вышестоящего уровня. Для просмотра информационного наполнения FTP - архива (для навигации) необходима специальная программа “FTP - клиент”. Наиболее известной программой - клиентом FTP является “cutftp”, но в браузерах Internet Explorer и Netckape Navigator версий выше 3.0 встроены свои FTP - клиенты.

Поэтому, для навигации по FTP - архиву из Internet Explorer, например, достаточно набрать в строке URL адрес FTP - сервера и нажать “Enter”.

Адрес FTP - сервера желательно набирать с указанием протокола, например:

ftp://ftp.funnet.fi, ftp://ftp.symbol.ru.

Список ftp-серверов всего мира можно найти по адресу:

http://hoohoo.ncsa.uiuc.edu:80/ftp.

Браузер выводит информацию с FTP - сервера на экран локального компьютера пользователя в виде столбца ссылок, каждая из которых указывает на файл или вложенный подкаталог (поддиректорий). Рядом со ссылкой указывается дата и время создания файла (подкаталога).

Каталоги обозначаются словом “Directory”, а для файлов приводится их размер в байтах. Многие FTP - серверы содержат в своей структуре специальный каталог /pub, содержащий файлы для свободного копирования. Кроме того, в каждый каталог включаются файлы “readme” или (и) “index”, в которых находятся список и описание назначения файлов, собранных в данном каталоге. Поиск файлов в ftp можно вести по адресу: www.filesearch.ru.

Программа cutftp относится к классу shareware-программ.

Пользоваться ею после установки разрешается в течение тридцати дней, после чего необходимо либо прекратить ее использование, либо заплатить и пройти регистрацию.

Программа позволяет выбрать FTP - сервер, просмотреть структуру FTP - сервера, перемещаясь по иерархической системе каталогов, читать текстовые файлы, копировать их на свой компьютер, копировать файлы со своего компьютера на удаленный FTP - сервер.

Управление программой производится с помощью диалогового окна и напоминает работу с проводником Windows 95.

Обслуживание запросов на анонимном FTP - сервере ведет программа - робот, которая управляется командами FTP. При обращении к такому серверу по электронной почте необходимо в тексте письма указывать команды, на которые реагирует почтовый робот. К числу таких команд относятся:

cd имя - команда перехода к каталогу “имя”;

dir - запрос содержания текущего каталога;

ascii - команда, предупреждающая робот, что запрашиваемый файл - текстовый;

binary - команда, предупреждающая робот, что запрашиваемый файл - двоичный (т.е. программа, рисунок, аудиофайл, архивный файл, и т.д.);

get имя - команда копирования файла “имя” из текущего каталога;

quit - окончание работы с почтовым роботом.

Необходимо помнить, что разные почтовые роботы (такие, как ftpmail, bitftp,...) могут использовать разные системы команд. Поэтому начинать работать с новым роботом нужно с запроса “help”. Названия команд обычно можно набирать любыми буквами - прописными или строчными, тогда как названия директориев и файлов надо набирать строго в соответствии с их начертанием.

Работа с FTP - архивами предусматривает несколько операций:

- поиск адресов FTP - архивов;

- установление связи с FTP - сервером, на котором хранится данный FTP - архив;

- поиск каталога (директория), в котором хранится искомый файл;

- проверка: есть ли искомый файл в данном каталоге;

- копирование файла на свой компьютер.

При отсутствии на сервере FTP индексного указателя файлов с аннотациями приходится ориентироваться только на имена файлов.

Поиск сервера, каталога и файла, содержащего необходимую информацию, превращается в сложную задачу.

Для облегчения поиска информации в сервисе FTP разработана программа Archie, ведущая поиск по централизованно составленным спискам - указателям файлов, доступных на анонимных FTP - серверах.

База данных Archie включает указатели на несколько миллионов файлов, расположенных более чем на тысяче анонимных серверах. Для снижения нагрузки на серверы Archie, которые ежедневно обрабатывают десятки тысяч запросов, система Archie располагается на нескольких дублирующих друг друга серверах (зеркальных серверах - mirrors).

Для поиска файлов в Archie с помощью Internet Explorer необходимо воспользоваться шлюзом с Archie, который включается в некоторые Web-страницы в виде формы для запросов к базе данных Archie. Примеры таких страниц:

http://hoohoo.ncsa.uiuc.edu/archie.html http://www-ns.rutgers.edu/htbin/archie http://www.spiretech.com/archie-form.html http://www.thegroup.net/AA.html Доступ к Archie возможен и по e-mail, например, через робот archie@cs.mcgilla.ca, и с помощью специальной программы - клиента Archie.

Кроме Archie ориентироваться в информационных ресурсах Internet помогают иерархические каталоги текстов и двоичных файлов Gopher.

Gopher - это ориентированная на меню система, позволяющая пользователям просматривать ресурсы Internet путем передвижения по цепочке тех меню, которые создаются администратором сервера Gopher.

Каждый пункт меню указывает на фрагмент данных, который может быть подменю или компьютерным файлом. Пункты меню Gopher во многом похожи на гипертекстовые ссылки: выбор пункта меню отсылает к определенному информационному ресурсу (к файлу, или к другому меню), который может находиться на любом компьютере Internet. Адрес сервера Gopher, работающего в Сан-Франциско: gopher://well.sf.ca.us. К Gopher - серверу университета Миннесота можно обратиться по адресу:

http://gopher2.tc.umn.edu/. Адрес сервера Gopher, работающего в Джорджтауне: gopher://gopher.georgtown.edu/.

В Internet много серверов Gopher, найти в них нужные сведения сложно из-за большого количества информации. Для облегчения поиска в Gopher - пространстве разработана поисковая система Veronica, ведущая поиск по всему Gopher - пространству (по заданному поисковому образу Veronica производит поиск во всех известных ей меню Gopher). Результаты поиска оформляются в виде нового меню, работающего так же, как и меню Gopher.

Для локального поиска на выбранном Gopher - сервере иногда используется поисковая система Jughead.

Как Archie, так и Gopher, и поисковые системы типа Veronica позволяют произвести поиск информационных ресурсов Internet, хранящихся в виде файлов. Получить найденные файлы можно с помощью сервиса FTP.

2.4. Использование удаленных ресурсов (Telnet).

С помощью Telnet можно установить связь с другим компьютером и использовать его возможности в интерактивном режиме. Это простейший сервис, одна из самых старых технологий Internet.

Программа - клиент Telnet позволяет установить соединение с другим компьютером и запустить на нем (как на своем собственном) какую либо программу. Дальнейшее взаимодействие с удаленной ЭВМ определяется интерфейсом запущенной программы.

Обычно сервис Telnet разрешается использовать только зарегистрированным клиентам. Но существуют Telnet-серверы, допускающие незарегистрированных клиентов к части имеющихся ресурсов. Например, с помощью Telnet можно получить доступ к Archie - серверу, к Gopher - серверу, к информационно-поисковой системе WAIS, и т..д.

Windows 95 стандартно включает в себя программу - клиент Telnet, поэтому при работе с Telnet через Internet Explorer проблем с подключением не возникает.

Обратиться к Telnet можно через имеющиеся в WWW шлюзы, например, по адресу: gopher://gopher.micro.umn.edu/ можно выбрать шлюз: “Other Gopher and Information Servers”, в котором имеется пункт:

“Terminal Based Information”, позволяющий войти в Telnet - приложения.

В каждом приложении необходимо регистрироваться. Например, в Telnet - сессии с университетом штата Аппалач (Appalachian State University) на предложение: “Enter username” необходимо ответить:

“INFO” - появится главное меню сервера распределения информации Университета. В других случаях могут использоваться для регистрации имена: “guest”,”visitor”, “kids”, “new”, “public”, и др.

2.5. Телеконференции (News).

В 1979г. была реализована идея аспирантов из университетов Дюка и Каролины, искавших возможность обмена информацией между компьютерами своих учебных заведений. Первоначально для такого обмена использовался протокол UUCP (Unix to Unix Copy Protoсol).

Поток информации был довольно большим, и разрозненные сообщения стали объединять в общие темы, чтобы облегчить ориентацию. На этой основе и возникли телеконференции, которые постоянно обновляли информацию по своим темам и создали базу для широкого обмена мнениями. С 1986г. введен новый специальный протокол обмена новостями - NNTP (Network News Transfer Protocol), совместимый с TCP/IP.

Такая система распределенных по темам сообщений стала основой телеконференций Internet, ведущее положение среди которых занимают телеконференции Usenet. В Internet действуют и другие телеконференции: Bitnet, Clarinet, Relcom, Demos, Glasnet,...

Система Usenet насчитывает более 10000 дискуссионных групп.

Эти телеконференции обеспечивают обмен мнениями на международном уровне.

Телеконференции делятся на два вида: свободные, и управляемые модератором (модератор получает все поступающие сообщения и определяет, соответствует ли тематике телеконференции поступившее сообщение, не нарушает ли оно сложившихся традиций данной конференции (например, поскольку большинство телеконференций обслуживается университетами, ограничивается коммерческое использование хост - компьютеров), кроме того, модератор делает обобщение содержания сообщений для размещения в Usenet).

По тематике все телеконференции образуют иерархическую структуру. Верхний уровень этой иерархии образуют следующие рубрики (Таблица 1).

Таблица 1. Рубрики верхнего уровня иерархии.

№ п/п Имя рубрики Содержание рубрики 1 alt Альтернативные группы новостей 2 bit Список рассылки Bitnet LISTSERV 3 biz Реклама для бизнеса 4 clarinet Служба новостей (только по подписке) 5 comp Все темы, связанные с компьютерами, с делением на группы - от новичков до профессионалов 6 k12 Образование (дошкольное и школьное) 7 misc Темы, не относящиеся ни к одной другой группе 8 news Информация и новости, связанные с Usenet 9 rec Досуг и хобби 10 sсi Различные темы из области научных исследований 11 soc Социальная тематика, культура 12 talk Обсуждение спорных вопросов (множество дискуссий по различной тематике) Каждая из приведенных рубрик образует древовидную структуру, аналогичную организации файловой системы.

Конференции Bitnet предоставляют возможность обмена мнениями в международном масштабе на базе электронной почты. Для этой цели в Bitnet с помощью программы LISTSERV ведутся списки рассылки (т.е. списки абонентов, которым рассылаются сообщения по выбранной ими тематике).

Relcom, Demos и Glasnet - это русскоязычные телеконференции, тематика которых довольно широка: от бесед на произвольные темы (relcom.talk) до четко ориентированных профессиональных дискуссий.

Для коммерческих целей созданы группы relcom.commerce.*.

Кроме разделения телеконференций по тематическим рубрикам, имеет место и региональное деление - для тех случаев, когда обсуждение нужно вести только с местным кругом пользователей.

Для участия в работе телеконференций необходимо соблюдать сетевой этикет (в который включены, например, такие правила, как “необходимо пользоваться ближайшим к Вам источником информации, чтобы не перегружать сеть”), использовать общепринятый стиль общения, стандартные сокращения, и т.д. Для новичков, только осваивающих работу, в системе телеконференций, существуют специальные “пробные телеконференции” (например, alt.test;

misk.test).

В состав Internet Explorer включено клиентское программное обеспечение Internet News. После его настройки необходимо определиться, какие группы новостей Вас интересуют. Этот процесс называется подпиской (Subscribe) на группу. IP - адрес Вашего сервера новостей задается ISP при подключении к Internet.

2.6. Непосредственное общение (IRC).

Internet позволяет не только получать разнообразную информацию и обмениваться сообщениями, но и общаться в реальном масштабе времени с любым пользователем сети, где бы он не находился. Данная услуга называется IRC (Internet Relay Chat - Беседа через Интернет).

Общение ведется с помощью клавиатуры. Непосредственным такое общение (или разговором в реальном масштабе времени) данный сервис называется из-за того, что между посылкой сообщения и ответом на него проходит очень мало времени. Часто этот вид сервиса называют “чатом” или “чаттингом”. В WWW он реализован на многих серверах под названием “диван” или “кроватка” (имеется в виду, что “удобно расположившись на диване, ведется неторопливая беседа”).

Для реализации сервиса IRC необходимы специальные программы, например, chat.exe, или alphachat.exe, или mirc.exe, и др. В зависимости от используемой программы интерфейс реализован по разному. Но в любом случае для участия в разговоре необходимо сначала представиться (зарегистрироваться), сообщив свой псевдоним (имя, которое будет сопровождать Ваши сообщения). В нижней части экрана есть по меньшей мере одна строка, в которой с помощью клавиатуры набирается Ваше сообщение. Центральная часть экрана отводится для фиксации сообщений всех участников разговора.

Кроме досуга IRC позволяет реализовать и более серъезные мероприятия: организовать сервисное обслуживание проданных товаров или оказанных услуг (вреальном времени! В любое время суток);

провести обсуждение потребительских свойств товара или качества обслуживания;

организовать аукцион;

провести совещание с удаленными сотрудниками фирмы;

при использовании IRC в учебных целях можно проводить семинары с удаленными слушателями, и т.д.

Некоторые программы IRC позволяют протоколировать ход беседы и сохранять протокол в виде файла.

Фирма Microsoft выпустила freeware - программу для общения в реальном времени - NetMeeting. Эта программа позволяет двум или более лицам обмениваться информацией через Internetв реальном масштабе времени с использованием набираемых на клавиатуре письменных сообщений, передачей звуковых файлов, рисунков, выполняемых на специальной “доске”. Кроме того, эта программа позволяет совместно использовать файлы (что позволяет одновременно работать нескольким лицам с одним и тем же файлом Word или Excel).

NetMeeting совместим с более чем 20 программными продуктами различных фирм для проведения конференций.

Получить NetMeeting можно с Web-сайта фирмы Microsoft:

http://www.microsoft.com/ie/conf/.

Не устанавливая программу на свой компьютер, обратиться к NetMeeting из Internet Explorer можно по адресам:

http://uls.microsoft.com...

http://uls5.microsoft.com.

2.7. Всемирная паутина (WWW).

Свое начало этот вид сервиса ведет с марта 1989г., когда Тим Бернерс-Ли из CERN предложил руководству этого международного европейского научного центра концепцию новой распределенной информационной системы, которую назвал World Wide Web (WWW или W3). С начала 1995г. практически все компьютерные издания обратили внимание на этот вид сервиса: "наконец-то появился удобный интерфейс для работы в Internet". Программное обеспечение WWW предусматривало наличие двух основных составляющих: WWW-сервера и WWW-клиента. Последний назывался "браузером". К 1995 году были разработаны программы - браузеры Netscape, Arena, Chimera. В последствии к ним добавилась Microsoft Internet Explorer.

Бернерс-Ли считал, что информационная система, построенная на принципах гипертекста, должна объединить все множество информационных ресурсов CERN, которое состояло из базы данных отчетов, компьютерной документации, списков почтовых адресов, информационной реферативной системы, наборов данных, полученных в экспериментах, и т.п. Гипертекстовая технология должна была позволить легко "перепрыгивать" из одного документа в другой.

В начале 1992г. Марк Андрессен из Национального Центра Суперкомпьютерных Приложений (NCSA) построил на принципах W программу MOSAIC - мультипротокольный переносимый интерфейс, который обеспечил бурный рост популярности этого вида сервиса. При создании новых браузеров ставилась цель - многопротокольная работа:

не только в WWW, но и в FTP, telnet, Gopher, WAIS, и др. Благодаря этому в настоящее время, работая в WWW, можно использовать практически все сервисы Internet.

В WWW клиент - это интерпретатор HTML. В зависимости от команд HTML он выполняет различные функции: размещение текста на экране;

обмен информацией с сервером по мере анализа полученного HTML-текста или графических образов;

запуск внешних программ для работы с документами в форматах, отличных от HTML (GIF, JPEG, MPEG, Postscript, и др.). Наибольшее распространение получили Web - броузеры Netscape Navigator (Netscape Communicator), Microsoft Internet Explorer.

Сервер протокола HTTP обеспечивает работу WWW, управляет имеющимися базами данных документов в формате HTML и программным обеспечением, разработанным в стандарте CGI. Получили известность такие серверы HTTP, как Netsite (Netscape), Apache (Apache Group), Open Market Secure Web Server (Open Market), NCSA HTTP (NCSA), Netscape Enterprise Server (Netscape), O`Reilly Website (O`Reilly), Internet Information Server (Microsoft), Personal Web Server (Microsoft).

2.8. Службы поиска информации, важнейшие русскоязычные и мировые источники информации.

Классификация информации (что можно искать в Internet).

С точки зрения потребителя вся информация в Internet может быть разделена на телекоммуникационные информационные рынки (рис. 1.).

Телекоммуникационные информационные рынки Рынок электронной Рынок электронных Рынок электронных Рынок сетевых Рынок информации сделок услуг коммуникаций программного обеспечения Банковские и Системное межбанковские Трудоустройство Электронная почта программное операции обеспечение Системы Электронные торги Обучение и Телеконференции организации консультации данных Электронные доски Программное Резервирование Поиск информации в объявлений обеспечение для (билетов, мест в глобальных сетях делопроизводства гостинницах,...) Создание Провайдерские услуги Медицинские Заказ товаров информационных (ISP) системы систем... Обучающие Расчеты на ЭВМ программы Провайдерские услуги (IPP, PCP) Игры......

Деловая инфорация Юридическая Информация для Массовая информация специалистов потребительская информация Биржевая и Указы Научно-техническая Новости, пресса финансовая Экономическая и Постановления Справочная (физика, Потребительская статистическая техника, информатика) информация Законы Профессиональная Погода Коммерческая Справочные данные Инструкции Спец.информация из Программы радио и предприятий области разных наук телепередач Библиографическая и Расписание транспорта Деловые новости реферативная информация Полнотекстные Отели, рестораны электронные данные Прокат...

Рис.1. Структура телекоммуникационных информационных рынков.

Поисковые системы (классификация и сферы использования).

Поиск необходимых сведений в большом объеме достаточно разнообразной информации - задача, которую человечество решает уже многие столетия. По мере роста объема информационных ресурсов были разработаны достаточно совершенные поисковые средства и приемы, позволяющие найти необходимый документ. В качестве основного инструмента для поиска информации в библиотеках используются каталоги (алфавитные, систематические и предметные). Однако каждый инструмент имеет свои недостатки. При больших объемах информации (которые характерны для Internet) поиск информации становится очень сложной процедурой. Для того, чтобы найти нужные сведения в Inernet необходимо иметь специальные знания и навыки. Специалист, обладающий такими знаниями и навыками и осуществляющий поиск информации по поступившим заказам называется информационным брокером. Он знает, как устроены классификаторы, как их интерпретируют систематизаторы, какие существуют инструменты для поиска информации в Inernet, технологические приемы и методики поиска, особенности различных поисковых машин и т.д. В беседе с заказчиком он изучает его информационную потребность и превращает ее в поисковое предписание. В нашей стране специалисты такого профиля - пока редкость, хотя потребность в них уже ощущается.

В Internet доступны информационно-поисковые системы (ИПС) трех типов: классификационные, словарные и предметные.

Классификационные ИПС используют иерархическую организацию информации, которая описывается с помощью классификатора. Разделы классификатора называются рубриками. В библиотечном деле для этой цели используется, например, систематический каталог.

Классификатор разрабатывается и совершенствуется коллективом авторов. Затем его использует другой коллектив специалистов, называемых систематизаторами, которые, зная классификатор, читают документы и приписывают им классификационные индексы, указывающие, каким разделам классификатора эти документы соответствуют. В качестве примера классификационной ИПС в Internet можно назвать Yahoo! (www.yahoo.com), в которой одновременно работает более 100 систематизаторов, Excite, Look Smart, Yellow Web, “Созвездие Интернет”, “Ау”.

Классификационные ИПС обладают рядом специфических недостатков. Разработка классификатора связана с оценкой относительной важности различных областей человеческой деятельности. Любая оценка является социальным действием - она связана с обществом, культурой, социальной группой, к которой принадлежит производящий оценку человек. Поэтому классификаторы, созданные разными коллективами в разных странах сильно различаются.

Кроме того, у систематизаторов возникают сложности с интерпретацией материалов, написанных на иностранных языках (не только исходных документов, но и классификаторов). Поскольку абсолютно строгой классификации не удается сделать никому, всегда существуют документы, которые можно отнести к нескольким разделам классификатора.

Систематизаторы в сложных случаях (когда неясно, к какому из разделов должен быть отнесен документ) применяют два приема:

отсылка и ссылка. Отсылка (в Yahoo! она обозначается знаком @) помещается в тех разделах классификатора, в которые не попал данный документ - в ней указывается, к какой рубрике он отнесен систематизатором. Ссылка используется в тех случаях, когда аналогичная информация может находиться в других разделах классификатора.

Словарные ИПС используют базу данных, построенную из слов, встречающихся в документах Internet`а. В такой базе при каждом слове хранится список документов, из которых оно взято. Поскольку все морфологические единицы в словаре упорядочены, поиск нужного слова может выполняться достаточно быстро, без последовательного просмотра.

По одному слову найти требуемую информацию довольно сложно.

Поэтому, каждая словарная ИПС имеет свой язык запросов, позволяющий комбинировать слова, наиболее полно характеризующие искомую информацию.

К словарным ИПС Internet`а относятся такие, как Alta Vista, Rambler, Яndex, Апорт.

Словарные ИПС способны выдавать списки документов, содержащие миллионы ссылок. Даже простой просмотр таких списков затруднителен. Поэтому многие словарные ИПС предоставляют возможность ранжирования результатов поиска - наиболее важные документы помещаются в начало списка. В языке запросов таких ИПС предусмотрены специальные средства, например, в режиме сложного поиска в Alta Vista можно указать перечень терминов, которые повышают ранг найденного документа (что для этой ИПС особенно актуально, так как она показывает только первые 200 найденных документов). Rambler и Яndex позволяют указать вес каждого из терминов, что позволяет довольно точно настраивать порядок следования найденных документов.

В предметных ИПС с поисковым образом связаны списки ресурсов Сети, содержащих нужную информацию и ссылки на близкие по тематике сайты. В таких ИПС создаются кольцевые ссылочные структуры. Так, сервер www.webring.org содержит несколько десятков тысяч тематических колец (средний размер кольца - около 12 серверов, но есть и кольца-гиганты, в состав которых входят тысячи серверов).

Пока кольца были небольшими, поиск информации трудностей не представлял. Для облегчения поиска на указанном сервере используются свои классификационная и словарная ИПС, помогающие найти необходимую информацию.

С помощью информационно-поисковых систем можно искать вполне определенные информационные объекты, список которых приведен на рис. 2.

Что можно найти в Internet Материалы Термины Данные Библиографию Адреса телеконфе ренций Письмо от В первом Цифровые Ссылки на По заданного абзаце документ фамилии лица документа Письмо об Во всем Иллюстрации Ссылки в По интересующе тексте документе известному м объекте документа слову Все о Справочники заданной теме В заголовках Географические (в т.ч. В в конкретной документов карты библиографи- конкретной группе ческие) стране новостей Web-cтраницы В телекон- Поиск FAQ по Музыкальные на ференциях заданной произведения заданном host- Usenet тематике компьютере Текстовые документы Файлы Программы для ЭВМ Аплеты Java Рис. 2. Поисковые объекты в Internet.

Описание поисковых систем.

Поисковая система Alta Vista.

У каждой поисковой системы существует свой язык запросов, который определяет правила, в соответствии с которыми формулируются запросы на поиск информации.

В классификационных и словарных ИПС запрос составляется на основе ключевых слов, которые являются наиболее яркой характеристикой искомой информации (по сути, без этих слов данная информация обойтись не может). Лучше, если эти ключевые слова имеют специфический смысл, присущий только искомому информационному материалу, отличающему данный материал от всех остальных.

Поисковая система AltaVista относится к разряду словарных ИПС и является одной из самых информационно насыщенных. Обратиться к ней можно по адресам:

http://www.altavista.digital.com/ http://altavista.telia.com/tgi-bin/telia?country=ru&lang=ru (этот адрес позволяет обратиться к поисковой системе, работающей на русском языке);

http://home.microsoft.com/intl/ru/access/allinome.asp (по этому адресу содержится доступ к нескольким поисковым машинам, в том числе - работающим на русском языке).

Рассмотрим правила составления поисковых запросов, использования операторов и команд в языке запросов системы AltaVista:

1) Запрос на поиск информации (поисковое предписание) представляет собой поисковый образ.

2) Поисковый образ может состоять из одного или нескольких ключевых слов.

3) В зависимости от способа соединения ключевых слов в поисковом запросе различают простые и сложные запросы.

4) Сложный запрос отличается от простого тем, что в нем можно указать дату создания искомого документа (чтобы выделить материалы, имеющие последнее обновление после указанной даты), специальную логику поиска (определяемую использованием операторов AND, OR, NOT, NEAR), выбрать один из трех вариантов упорядочивания результатов поиска при их выводе: “только в качестве итога”, “компактная форма”, и “стандартная форма” (последняя используется по умолчанию), и использовать круглые скобки для выделения логически самостоятельных частей запроса.

5) Ключевые слова могут набираться на разных регистрах клавиатуры - в зависимости от этого поисковая машина будет по разному проводить поиск.

Наличие в ключевом слове заглавной буквы заставит поисковую машину при простом поиске искать слова именно с таким написанием, как в запросе. Если же заглавные буквы не использовались, то поисковая машина учитывает любые варианты написания этих слов. Например, если поисковое предписание состоит из одного слова Computer, будут найдены информационные материалы, содержащие это слово именно в таком начертании. Если же это слово не будет содержать заглавных букв, то при поиске будут учитываться слова в таких начертаниях, как computer, COMPUTER, COMPuter, и др. Необходимо учитывать, что при использовании поискового образа, состоящего только из одного слова computer, AltaVista предоставляет около 2000 ссылок. Просмотреть такое количество ссылок практически невозможно, а значит, информационный поиск нельзя считать эффективным (при правильно составленном запросе необходимая информация находится в числе первых двух десятков ссылок).

6) В том случае, если неизвестно правильное написание слова, или интерес представляет множество однокоренных слов, используется оператор неопределенности - “*” (звездочка). Поставив этот символ после любой последовательности букв (не менее трех), влияние которых необходимо учесть при поиске, можно произвести широкий поиск, при котором ключевое слово будет модифицироваться: поиск будет весьтись как для жестко указанной до звездочки совокупности букв, так и для слов, содержащих любые буквы (числом до 5) вместо звездочки.

Например, если указать ключевое слово comp*, то при поиске будут учитываться, как ключевые - computer, computers, compute, и др.

7) Для соединения нескольких ключевых слов могут использоваться операторы “пробел”, “кавычки”, логические операторы “+”, “-”, AND, OR, NOT, NEAR.

8) Оператор “пробел” соединяет слова в поисковом предписании таким образом, что для поиска каждое из этих слов используется отдельно. При этом, порядок слов в запросе не имеет значения. В процессе поиска учитывается только расстояние каждого слова от начала документа и частота его использования в документе.

9) Оператор “кавычки” соединяет слова так, что они образуют фразу, в которой все указанные в предписании слова в документе стоят рядом друг с другом и в той же последовательности, как это указано в предписании. Поэтому, если задать поисковое предписание в виде слов “personal computer” и в виде “computer personal”, то результаты поиска будут разными.

10) Оператор “+”, соединяющий слова, сообщает поисковой машине, что в документе необходимо искать основное слово (первое), но документ надо показывать в результате поиска только если далее в тексте встречаются остальные слова из поискового предписания.

Оператор ставится непосредственно перед каждым второстепенным словом. Например, по поисковому образу:

computer +personal +digital будет вестись поиск основного слова computer, но текст будет считаться актуальным только если в нем встречаются так же слова personal и digital.

11) Оператор “-”, стоящий перед словом, обозначает, что основное слово должно использоваться в тексте без второстепенного. Например, поисковое предписание computer -personal сообщает поисковой машине, что надо искать основное слово computer, но в тексте не должно встречаться слово personal (т.е. интересуют материалы о компьютерах, но не персональных).

12) Операторы AND, OR, NOT, NEAR используются в сложных запросах.

13) Оператор AND (вместо него можно использовать символ &) определяет, что соединяемые им слова должны встречаться вместе (т.е. в простых запросах он эквивалентен знаку “+”).

14) Оператор OR (вместо него можно использовать знак “|”) определяет, что соединяемые им слова независимы друг от друга (в простых запросах он эквивалентен пробелу).

15) Оператор NOT обозначает отрицание (в простых запросах он эквивалентен знаку “-”).

16) Оператор NEAR (вместо него можно использовать символ “~”) определяет, что в искомом тексте указанное им ключевое слово отстоит от основного не далее, чем на 10 слов (например, в поисковом предписании:

провайдер* NEAR “очень дешево” предусматривается, что в искомом тексте слово “провайдер” и словосочетание “очень дешево” находятся не в разных концах текста, а рядом друг с другом - между ними может находиться не более 10 слов).

17) Для ограничения поиска используются специальные команды (тэги): anchor, applet, title, url, host, link, image,from, subject.

18) Команда anchor позволяет найти в Сети слово, содержащееся в “теле” ссылки. Для этого после команды anchor через двоеточие указывается искомое слово. Например, поисковый образ содержит:

anchor:home По этому запросу будет найдено все множество страниц, содержащих внутри ссылок слово home, в том числе - и в такой ссылке: “If you would like go home, press here”.

19) Команда applet позволяет найти заданный названием модуль Java. Например, если модуль Java называется word, то найти его можно, записав поисковый образ: applet:word.

20) Команда title используется в том случае, если искомое слово находится в заголовке текста. Например, по запросу вида:

title:links будут найдены документы, содержащие слово links в заглавии, в том числе текст с заглавием “Cool Links”.

21) Команда url предписывает искать url-адрес, содержащий заданное слово. Например, если неизвестно, в каком корневом домене находится host-компьютер МЭСИ, можно задать поисковое предписание: url:mesi. Среди множества адресов с таким словом будет и адрес http://www.mesi.ru/.

22) Команда host позволяет узнать, какие Web-сайты есть на заданном host-компьютере. Например, для того, чтобы узнать, какие сайты есть на хосте www.intel.ru необходимо набрать запрос: host:intel.ru. Если же в запросе указать только часть имени, то в результате поиска будут найдены сайты, имеющие другие адреса, но содержащие заданную часть имени.

Используя эту команду, можно вести поиск в заданной стране.

Например, по запросу host:*.ru +kreml будет найдена информация о Московском, Рязанском и других Кремлях. При этом нужно помнить, что поиск ведется только для сайтов, зарегистрированных в поисковой системе AltaVista, другие сайты ей недоступны.

23) Команда link позволяет найти адреса страниц (сайтов), содержащих ссылку на конкретную (заданную в поисковом образе) Web страницу. Например, для того, чтобы узнать, кто ссылается на сайт www.mesi.ru необходимо задать предписание: link:www.mesi.ru.

Результатом будет список страниц, на которых содержатся ссылки на сайт mesi.ru.

24) Команда image позволяет найти иллюстрацию в Internet. Для этого надо знать название файла, в котором она хранится. Формат команды тот же.

25) Команда from позволяет искать в телеконференциях Usenet почтовое сообщение, отправленное конкретным человеком, имя которого указывается после двоеточия в команде. Например: from:Иван +Федоров (или Ivan +Fedorov).

26) Команда subject позволяет искать сообщения в телеконференциях Usenet на конкретную, заданную в поисковом предписании тему.

Поисковая система AltaVista может работать (и вести поиск) на разных языках, в том числе и на русском.

Описанные принципы управления поисковой системой во многом аналогичны используемым и в других поисковых системах.

Поисковая система Yandex.

В 1997г. по адресу: http://www.yandex.ru открылась новая российская поисковая машина Yandex (или Яndex). По набору своих поисковых возможностей она не уступает самым сложным поисковым машинам Запада, специально рассчитана на русскоязычные запросы и учитывает особенности русской лексики, предлагает несколько больше возможностей для интеллектуального поиска.

Аналогично AltaVista, Yandex различает заглавные и прописные буквы. Если ключевое слово написано прописными буквами, то поисковая машина не различает прописные и заглавные буквы, т.е при задании ключевого слова computer в поиске будут учитываться и Computer, и COMPUTER, и др. Тогда, как если в поисковом образе будет содержаться хотя бы одна заглавная буква, при поиске будут приниматься во внимание только слова, имеющие данное начертание.

В Yandex нет необходимости использовать оператор неопределенности (аналогичный звездочке в AltaVista), так как при задании ключевого слова прописными буквами в процессе поиска будут использоваться и слова, стоящие в других падежах, в различных склонениях, в единственном и множественном числе.

В Yandex так же, как в AltaVista можно строить простые и сложные запросы. Но построение сложных запросов требует более высокой квалификации лица, проводящего поиск.

Для соединения ключевых слов в простых запросах используются операторы, обозначаемые символами: &, |, ~, (, ). Среди них только тильда (~) имеет другое назначение - в Yandex она обозначает отрицание (и эквивалентна знаку “-” в AltaVista). Однако, указанные операторы имеют существенную особенность: ключевые слова, соединяемые ими, должны находиться в пределах одного абзаца.

Удваивание оператора связи указывает, что слова должны находиться в пределах всего текста (а не только одного абзаца).

В Yandex предусмотрен “поиск с расстоянием” - можно указать, что ключевые слова в искомом тексте должны находиться на расстоянии не более, например, трех слов (и в одном абзаце). Расстояние задается символом /, за которым следует цифра, определяющая расстояние.

Например, задав предписание:

круглый /3шар поисковая машина будет искать документы, содержащие в пределах одного абзаца слова “круглый” и “шар”, причем, разделены они могут быть не более, чем тремя словами. Если расстояние задано отрицательным числом, это значит, что второе слово предшествует первому.

Вместо одного слова в поисковом предписании можно использовать целые выражения. Логически самостоятельные элементы этих выражений могут заключаться в скобки.

Особенности поиска информации в Интернет.

Интернет как глобальное средство обмена информацией нередко используется для поиска необходимых данных. Способов поиска информации множество (в скобках указаны случаи, когда такой способ поиска наиболее применим): Поиск с помощью поисковых машин (конкретные вещи) Каталоги и коллекции ссылок (более общие понятия) Рейтинги (самые популярные ресурсы) Конференции, чаты и страницы ссылок на тематических сайтах (редкие, специализированные вещи). Ограниченные временные, физические и финансовые возможности людей вынуждают чаще всего применять для этого специальные каталоги и поисковые машины (поисковики) – своего рода библиотекари, индексирующие доступный им массив информации в Интернет. В данном разделе выделены особенности и рассмотрены общие правила работы наиболее известных каталогов и поисковых систем.

Каталоги представляют собой систематизированные группы адресов, объединенные, как правило, по тематике. К удобству их применения можно отнести то, что, если пользователю известна тема искомого документа, он будет исследовать соответствующую ветвь каталога, не отвлекаясь на посторонние, не относящиеся к делу документы. Однако, объем каталога ограничен физическими возможностями редакторской группы и ее субъективностью в выборе материала. В них отсутствует информация на узкие, специальные темы, да и саму тематику искомого документа не всегда можно сформулировать в пределах классификации каталога. Ниже приведены возможности зарубежных и российских каталогов.

Yahoo! - Самый популярный каталог, содержащий обширную информацию о десятках тысяч Web-узлов. Первый уровень иерархии содержит 14 тематических категорий, которые разветвляются еще на 4 - 5 подуровней. Имеет собственную машину поиска, позволяющую: 1) искать по базе Yahoo!, по Usenet или по адресам электронной почты;

2) ограничить поиск материалами, размещенными за последний день, неделю, месяц, год или 3 года;

3) выдать статьи, содержащие хотя бы одно ключевое слово или все ключевые слова;

4) искать по однокоренным словам или только по указанным ключевым;

5) выдать результаты по 10, 25, 50 или 100 на одной странице (подробнее ниже).

Excite Reviews - Содержит обзоры 60 тыс. узлов Интернет (иерархический каталог) City.Net - сведения о странах и городах.

Galaxy - Иерархический каталог с подробным описанием тематических категорий на первой странице. Осуществляет поиск по категории поиска, по одному или нескольким ключевым словам, краткий и подробный вывод результатов поиска, переход на страницы Gopher и Telnet.

Yellow Pages - Поиск информации о 16 млн. американских компаниях в различных областях деятельности, а также персональные данные и электронные адреса частных лиц.

Russia on the Net - Первый каталог русских ресурсов.

Созвездие Интернет - Охватывает около 400 серверов.

Возможность усечения терминов. Содержит названия и краткие характеристики серверов. Привлекательная графика. Небольшая зона поиска, слабая иерархия.

Желтые страницы Интернет - Около 1200 Web-серверов.

Большой объем информации, хорошо продуманная структура.

Сокровища Интернет - Каталог Web-ресурсов на сервере Relcom.

АУ! - Молодой, быстроразвивающийся каталог.

Таблица 2. Сводная таблица некоторых предметных каталогов List.Ru Апорт Яндекс Rambler Общая 19 разделов 14 разделов 10 осн. разделов, 56 разделов характе- верхнего верхнего 7 комбинир., допол- (Рейтинг ристика уровня, каталог уровня, каталог нительная классиф-я одноуровнев ресурсов по ресурсов по по региону, ый каталог) регионам регионам источнику инф-и, (подраздел (подраздел целевой аудитории рубрики рубрики Страны и сектору Государство и регионы) экономики.

Российское) Сортировка Алфавит, Алфавит, хиты Алфавит, дата по посеща ресурсов оценка гидов, (посещаемость), добавления, индекс емости внутри популярность лига (оценка цитируемости (кол раздела (посещаемость), гидов), индекс во ссылок на дата цитируемости данный ресурс с (оценка числа других ресурсов) ссылок на данный ресурс), оценка (мнение пользователей) Булевские язык Яndex язык Апорт язык Яndex язык Rambler операторы Поиск по фразе Префиксы Итеративный поиск (в результатах) Замена части слова Поисковых серверов всего известно более 150, различающихся по регионам охвата, принципам проведения поиска (а следовательно, по входному языку и характеру воспринимаемых запросов), объему индексной базы, скорости обновления информации, способности искать "нестандартную" информацию и тому подобное. Основными критериями выбора поисковых серверов являются объем индексной базы сервера и степень развитости самой поисковой машины, то есть уровень сложности воспринимаемых ею запросов. Традиционно поисковые системы имеют три элемента:

1. Робот (кроулер, паук, агент), который перемещается по Сети и собирает информацию;

Кроулеры просматривают заголовки и возвращают только первую ссылку.

Пауки – программы, осуществляющие общий поиск информации в Сети и сообщающие о содержании найденного документа, индексируя его и извлекая итоговую информацию.

Агенты - самые "интеллектуальные" из поисковых средств. Они могут делать больше, чем просто искать: они могут выполнять даже транзакции от Вашего имени. Уже сейчас они могут искать cайты специфической тематики и возвращать списки cайтов, отсортированных по их посещаемости. Администраторы поисковых систем могут определить, какие сайты или типы сайтов агенты должны посетить и проиндексировать. Агенты могут обрабатывать содержание документов, находить и индексировать другие виды ресурсов, не только страницы.

Некоторые, например, индексируют каждое отдельное слово во встречающемся документе, в то время как другие индексируют только наиболее важных 100 слов в каждом, индексируют размер документа и число слов в нем, название, заголовки и подзаголовки и так далее. Они могут также быть запрограммированы для извлечения информации из уже существующих баз данных.

Роботы реализованы как программная система, которая запрашивает информацию из удаленных участков Интернет, используя стандартные сетевые протоколы. Первый робот был создан для того, чтобы обнаружить и посчитать количество веб-серверов в Сети. Все роботы могут быть запрограммированы так, чтобы переходить по различным ссылкам различной глубины вложенности, выполнять индексацию и даже проверять ссылки в документе. Из-за их природы они могут застревать в циклах (черных дырах). На практике роботы сохраняют почти всю информацию о том, где они побывали. Даже если робот смог определить, должна ли указанная страница быть исключена из его базы данных, он уже понес накладные расходы на запрос самого файла, а робот, который решает игнорировать большой процент документов, очень расточителен. Пытаясь исправить эту ситуацию, Интернет-сообщество приняло "Стандарт исключений для роботов".

Этот стандарт описывает использование простого структурированного текстового файла, доступного в известном месте на сервере ("/robots.txt") и используемого для того, чтобы определить, какая из частей ссылок сервера должна игнорироваться роботами. Все "умные" поисковые машины сначала обращаются к этому файлу, который должен присутствовать на каждом сервере. На сегодняшний день этот файл обязательно запрашивается поисковыми роботами только таких систем как Altavista, Excite, Infoseek, Lycos, OpenText и WebCrawler. Это средство может быть также использовано для того, чтобы предупредить роботов о черных дырах. Каждому типу роботов можно передавать определенные команды, если известно, что данный робот специализируется в конкретной области. Этот стандарт является свободным, но его очень просто осуществить и в нем имеется значительное давление на роботов с попыткой их подчинения.

1. База данных, которая содержит всю информацию, собираемую роботами.

Проиндексировать произвольный документ, находящийся в Сети, очень сложно. Первые роботы просто сохраняли название документа и якори (anchor) в самом тексте, но новейшие роботы уже используют более продвинутые механизмы и вообще рассматривают полное содержание документа. Проиндексированная информация отсылается базе данных (БД) поискового механизма. Вид построенного индекса определяет, какой поиск может быть сделан пользователем поискового механизма и как полученная информация будет интерпретирована.

Люди могут помещать информацию прямо в индекс, заполняя особую форму для того раздела, в который они хотели бы поместить свою информацию. БД автоматически обновляются за определенный период времени с тем, чтобы мертвые ссылки были обнаружены и удалены.

2. Пользовательский интерфейс для взаимодействия с БД поисковика.

Когда пользователь ищет информацию в Интернет, он заполняет поисковую форму на странице поисковика. Здесь могут использоваться ключевые слова, даты и другие критерии. Критерии в поисковой форме должны соответствовать критериям, используемым агентами при индексации ресурсов Сети. Как формат, так и семантика запросов варьируются в зависимости от применяемой поисковой машины и конкретной предметной области. Запросы составляются так, чтобы область поиска была максимально конкретизирована и сужена.

Предпочтение отдается использованию нескольких узких запросов по сравнению с одним расширенным. Языки запроса различных машин поиска в основном являются сочетанием следующих функций (Таблица 3).

Операторы булевой алгебры AND, OR, NOT:

AND (И) - осуществляется поиск документов, содержащих все термины, соединенные данным оператором;

OR (ИЛИ) - искомый текст должен содержать хотя бы один из терминов, соединенных данным оператором;

NOT (НЕ) - поиск документов, в тексте которых отсутствуют термины, следующие за данным оператором.

Операторы расстояния - ограничивают порядок следования и расстояния между словами, например:

NEAR - второй термин должен находиться на расстоянии от первого, не превышающем определенного числа слов;

FOLLOWED BY - термины следуют в заданном порядке;

ADJ - термины, соединенные оператором, являются смежными.

Возможность усечения терминов - использование символа " * " вместо окончания термина позволяет включить в искомый список все слова, производные от его начальной части (шаблона).

Учет морфологии языка - машина автоматически учитывает все формы данного термина, возможные в языке, на котором ведется поиск.

Возможность поиска по словосочетанию, фразе.

Ограничение поиска элементом документа (слова запроса должны находиться именно в заголовке, первом абзаце, ссылках и т.д.).

Ограничения по дате опубликования документа.

Ограничения на количество совпадений терминов.

Возможность поиска графических изображений.

Чувствительность к строчным и прописным буквам.

Таблица. 3. Языки запроса различных машин поиска На основе введенной пользователем поисковой строки в БД отыскивается предмет запроса и выводится список соответствующих ссылок. Число документов, полученных в результате поиска по запросу, может быть огромно. Однако, благодаря ранжированию документов, применяемому в большинстве поисковых машин, на первых страницах списка практически все документы окажутся релевантными (в идеале).

Основные принципы определения релевантности следующие:

1. Количество слов запроса в текстовом содержимом документа (в html коде).

2. Тэги, в которых эти слова располагаются.

3. Местоположение искомых слов в документе.

4. Удельный вес слов (густота), относительно которых определяется релевантность, в общем количестве слов документа.

Эти принципы применяются всеми поисковыми системами. А представленные ниже используются некоторыми, но достаточно известными (вроде AltaVista, HotBot).

5. Время - как долго страница находится в базе поискового сервера.

Множество сайтов живут максимум месяц. Если же сайт существует довольно долго, это означает, что владелец весьма опытен в данной теме.

6. Индекс цитируемости - число ссылок на данную страницу с других страниц, зарегистрированных в БД.

Существуют особенности показа полученного списка - некоторые поисковики показывают только ссылки;

другие выводят ссылки c первыми несколькими предложениями, содержащимися в документе или заголовок документа вместе с ссылкой.

Результат запроса (список ссылок) обрабатывается в два этапа. На первом этапе (автоматическая обработка) производится отсечение очевидно нерелевантных источников, попавших в выборку в силу несовершенства поисковой машины или недостаточной "интеллектуальности" запроса. Дальнейшая (ручная) обработка производится пользователем путем последовательного обращения на каждый из найденных ресурсов и анализа находящейся там информации.

Когда пользователь щелкает на ссылку из списка, то перед запросом соответствующего документа у того сервера, на котором он находится, поисковики заносят в свою БД отметку о пользовательском предпочтении. Собранная информация о поведении пользователей (формулировки запросов и выбранные из списка ресурсы) успешно используется в рекламных компаниях в Сети.

Ниже сравниваются наиболее известные не-россиские поисковики.

AltaVista. Охватывает более 30 млн. страниц на 225000 серверах, обеспечивает доступ к 3 млн. статей в 14000 телеконференциях Usenet.

Имеет два режима: Simple query и Advanced query. В режиме Simple можно вводить шаблоны для поиска не менее чем с тремя указанными символами в начале слова. Если слово содержит хотя бы одну заглавную букву, ведется поиск с учетом регистра. Ниже строки ввода выдаются советы по поиску. В режиме Advanced можно создавать сложные запросы, основанные на логических операторах AND, OR, NOT, NEAR и указывать критерии сортировки полученных результатов. Можно указывать диапазон дат опубликования. Предоставляет возможность поиска изображений. Удобный интерфейс. Высокое быстродействие, многовариантное поисковое предписание, возможность поиска на русском языке с учетом морфологии. Система не упорядочивает результаты поиска, поэтому ее целесообразно применять для специфического или исчерпывающего поиска. Индексирование в этой системе осуществляется при помощи робота. При этом робот имеет следующие приоритеты:

• слова, содержащиеся в теге имеют высший приоритет;</p><p> </p><p> • ключевые фразы в <Meta> тэгах;</p><p> </p><p> • ключевые фразы, находящиеся в начале странички;</p><p> </p><p> • ключевые фразы в ALT - ссылках • ключевые фразы по количеству вхождений\присутствия слов\фраз;</p><p> </p><p> Если тэгов на странице нет, использует первые 30 слов, которые индексирует и показывает вместо описания (tag description) Наиболее интересная возможность AltaVista - это расширенный поиск. </p><p> Здесь стоит сразу оговориться, что, в отличие от многих других систем AltaVista поддерживает одноместный оператор NOT. Кроме этого, имеется еще и оператор NEAR, который реализует возможность контекстного поиска, когда термины должны располагаться рядом в тексте документа. AltaVista разрешает поиск по ключевым фразам, при этом она имеет довольно большой фразеологический словарь. Кроме всего прочего, при поиске в AltaVista можно задать имя поля, где должно встретиться слово: гипертекстовая ссылка, applet, название образа, заголовок и ряд других полей. К сожалению, подробно процедура ранжирования в документации по системе не описана, но видно, что ранжирование применяется как при простом поиске, так и при расширенном запросе. Реально эту систему можно отнести к системе с расширенным булевым поиском. </p><p> HotBot - Охватывает 54 млн. страниц. Возможен поиск на русском языке. Является популярным поисковым средством благодаря наличию механизмов построения сложных поисковых запросов. В основном, 1-я страница результатов, полученных в ответ на поисковый запрос, приходит из Direct Hit, затем берутся результаты из Inktomi. Список каталогов предоставляется Open Directory. HotBot начал предоставлять свои услуги в мае 1996 года, а в октябре 1998 года он был куплен Lycos. </p><p> Infoseek. Охватывает 1,5 млн. страниц. Язык запросов позволяет использовать все возможные варианты логических выражений. Менее полные, чем на других серверах, результаты поиска, неудобный интерфейс. В этой системе индекс создает робот, но он индексирует не весь сайт, а только указанную страницу. При этом робот имеет такие приоритеты: </p><p> • слова в заголовке <title> имеют наивысший приоритет;</p><p> </p><p> • слова в теге keywords, description и частота вхождений\повторений в самом тексте;</p><p> </p><p> • при повторении одинаковых слов рядом выбрасывает из индекса • Допускает до 1024 символов для тега keywords, 200 символов для тэга description;</p><p> </p><p> • Если тэги не использовались, индексирует первые 200 слов на странице и использует как описание;</p><p> </p><p> Система Infoseek обладает довольно развитым информационно поисковым языком, позволяющим не просто указывать, какие термины должны встречаться в документах, но и своеобразно взвешивать их. </p><p> Достигается это при помощи специальных знаков "+" - термин обязан быть в документе, и "-" - термин должен отсутствовать в документе. </p><p> Кроме этого, Infoseek позволяет проводить то, что называется контекстным поиском. Это значит, что, используя специальную форму запроса, можно потребовать последовательной совместной встречаемости слов. Также можно указать, что некоторые слова должны совместно встречаться не только в одном документе, а даже в отдельном параграфе или заголовке. Имеется возможность указания ключевых фраз, представляющих собой единое целое, вплоть до порядка слов. </p><p> Ранжирование при выдаче осуществляется по числу терминов запроса в документе, по числу фраз запроса за вычетом общих слов. Все эти факторы используются как вложенные процедуры. Подводя итоги, можно сказать, что Infoseek относится к традиционным системам с элементом взвешивания терминов при поиске. </p><p> Infoseek Ultra - 50 млн. страниц WWW, возможен поиск на русском языке, поиск изображений. </p><p> Lycos. Охватывает 68 млн. страниц. Можно выбрать параметры поиска: одно, несколько ключевых слов или фраза;</p><p> усечение терминов;</p><p> </p><p> ограничения на число совпадений;</p><p> степень соответствия результатов поиска ключевым словам;</p><p> форму вывода результатов (краткую или подробную);</p><p> количество найденных терминов на каждой странице. </p><p> Невысокие быстродействие и оперативность обновления информации. В Lycos используется следующий механизм индексации: </p><p> • слова в <title> заголовке имеют высший приоритет;</p><p> </p><p> • слова в начале страницы;</p><p> </p><p> • слова в ссылках;</p><p> </p><p> • если в его базе индекса есть сайты, ссылка с которых указывает на индексируемый документ - релевантность этого документа возрастает. </p><p> Как и большинство систем, Lycos дает возможность применять простой запрос и более изощренный метод поиска. В простом запросе в качестве поискового критерия вводится предложение на естественном языке, после чего Lycos производит нормализацию запроса, удаляя из него так называемые stop-слова, и только после этого приступает к его выполнению. Почти сразу выдается информация о количестве документов на каждое слово, а позже и список ссылок на формально релевантные документы. В списке против каждого документа указывается его мера близости запросу, количество слов из запроса, попавших в документ, и оценочная мера близости, которая может быть больше или меньше формально вычисленной. Пока нельзя вводить логические операторы в строке вместе с терминами, но использовать логику через систему меню Lycos позволяет. Такая возможность применяется для построения расширенной формы запроса, предназначенной для искушенных пользователей, уже научившихся работать с этим механизмом. Таким образом, видно, что Lycos относится к системе с языком запросов типа "Like this", но намечается его расширение и на другие способы организации поисковых предписаний. </p><p> В октябре 1998 Lycos приобрел HotBot, который, в настоящее время, используется как отдельная служба. </p><p> WAIS является одной из наиболее изощренных поисковых систем Internet. В ней не реализованы лишь поиск по нечетким множествам и вероятностный поиск. В отличие от многих поисковых машин, система позволяет строить не только вложенные булевые запросы, считать формальную релевантность по различным мерам близости, взвешивать термины запроса и документа, но и осуществлять коррекцию запроса по релевантности. Система также позволяет использовать усечения терминов, разбиение документов на поля и ведение распределенных индексов. Не случайно именно эта система была выбрана в качестве основной поисковой машины для реализации энциклопедии "Британика" на Internet. </p><p> Yahoo. Секрет успеха Yahoo заключается в людях. Yahoo имеет около 150 редакторов, для того, чтобы составлять и редактировать содержимое своих каталогов. Yahoo имеет базу данных в более чем млн. проиндексированных сайтов. Также, в случае нехватки своей собственной базы данных, Yahoo использует базу данных Google (до июля 2000 года Yahoo пользовался базой данных Inktomi). Yahoo является старейшей поисковой системой, которая начала предоставлять свои услуги в 1994 году. Язык Yahoo достаточно прост: все слова следует вводить через пробел, они соединяются связкой AND либо OR. </p><p> При выдаче не указывается степень соответствия документа запросу, а только подчеркиваются слова из запроса, которые встретились в документе. При этом не производится нормализация лексики и не проводится анализ на "общие" слова. Хорошие результаты поиска получаются только тогда, когда пользователь знает, что в базе данных Yahoo информация есть наверняка. Ранжирование производится по числу терминов запроса в документе. Yahoo относится к классу простых традиционных систем с ограниченными возможностями поиска. </p><p> Табл.4. Сводная таблица по ведущим поисковым машинам Яндекс Rambler Апорт! AltaVista Google Зона Русская часть Русская часть Русская часть Спец.поиск Спец.поиск по поиска Интернета. Поиск Интернета. Интернета. по новостям, университетам по страницам Спец.поиск товарам, США, Apple, сайтов из раздела по новостям, развлечени- Linux, BSD каталога, по товарам, ям, аудио регионам, спец. картинкам, (MP3) и поиск по MP3 видео. </p><p> новостям, товарам, картинкам. </p><p> База на Более 31 млн. Более 12 млн. Более 14 млн. Более 250 1,25 млрд нач. 2001 док. док. док. млн. док. страниц Тип полнотекстовая полнотекст. полнотекст. полнотекст. полнотекст. </p> <div class="po5"></div> <div class='stranici1'><b class='temiser'>Pages:</b>     |<div class='kr'><a class="kn1" href="/1/12381-1-moskovskiy-mezhdunarodniy-institut-ekonometriki-informatiki-finansov-prava-kirichenko-maksimova-bovt-i.php" title=""> 1 </a></div>|<a class="kn1" href="/1/12381-2-moskovskiy-mezhdunarodniy-institut-ekonometriki-informatiki-finansov-prava-kirichenko-maksimova-bovt-i.php" title=""> 2 </a>|</div> <div class="separator2"></div> <div class="po122"> <img class="doc" src="/images/doc.gif" border="0" alt="" ><a class="menusil" href="/1/" title=""><b class="jir">Книги, научные публикации</b></a> </div> <div class="niz2"> <br><br> <noindex> <center> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <!-- dislib-kvadrat (niz) --> <ins class="adsbygoogle" style="display:inline-block;width:336px;height:280px" data-ad-client="ca-pub-9894471784993021" data-ad-slot="3110193131"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </center> </noindex> <br> <div class="naverh"><A href="#verh" >наверх</a><img src="/images/s.gif" hspace="3" width="5" height="11" border="0" alt="" align="top" vspace="3" ></div> </td></tr></table> <table width="100%" cellspacing="0" cellpadding="0" border=0> <tr> <td bgcolor="#CCCCFF" height="1"> </td> </tr> <tr> <td class="menu-niz"> <center> <table cellspacing="0" cellpadding="0" border=0> <tr> <td class="menu-niz1"> |  • <a href="/" title="На главную">Главная</a>  |  • <a href="/admin/contact-kontakti-dissertatsii.php" title="Контакты">Контакты</a> |  </td> </tr> </table> </center> </td> </tr> <tr><td class="line1"></td> </tr> </table></td><td class="line"><img class="lin" src="/images/spaser1.gif" border="0" alt=""></td></tr></table> </td><td valign="top"> <table width="5" border="0" cellspacing="0" cellpadding="0"> <tr> <td></td></tr></table></td></tr></table> </td><td class="site2"></td></tr><tr><td colspan="3"> <noindex> <script type='text/javascript' src='http://recreativ.ru/rcode.97536708c5.js'></script> <script type='text/javascript' src='http://recreativ.ru/rcode.88aa634d1b.js'></script> <script type='text/javascript' src='http://recreativ.ru/rcode.30746632cd.js'></script> </noindex> <table width="100%" border="0" cellspacing="0" cellpadding="0"> <tr> <td valign="top" class="cap1"> <font color="#808080">© 2011 www.dissers.ru - «Бесплатная электронная библиотека»<br><br> <noindex> Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам. <br> Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, <a href="/admin/contacts.php" title="">напишите нам</a>, мы в течении 1-2 рабочих дней удалим его. </noindex> </font> </div> </td> </tr> </table> <noindex> <!-- Yandex.Metrika counter --> <script src="//mc.yandex.ru/metrika/watch.js" type="text/javascript"></script> <script type="text/javascript"> try { var yaCounter78166 = new Ya.Metrika({id:78166,type:1}); } catch(e) { } </script> <noscript><div><img src="//mc.yandex.ru/watch/78166?cnt-class=1" style="position:absolute; left:-9999px;" alt="" /></div></noscript> <!-- /Yandex.Metrika counter --> </noindex></td></tr></table> </body> </html>