WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 3 | 4 || 6 | 7 |

«Perl для системного администрирования Дэвид Я. Бланк-Эделъман Canlm /iCj Lx Lx '/ Дэвид Н. Бланк-Эдельман Perl для системного ...»

-- [ Страница 5 ] --

Учетными записями/пользователями Файлами журналов Управлением хранением (пространство на диске и т. д.) дзаимодействие с SQL-сервером из Perl Управлением процессами Вопросами взаимодействия Резервными копиями Безопасностью Звучит знакомо? Мы можем и даже должны знать обо всем этом.

3. Perl - язык для склейки, и можно доказать, что один из лучших.

Много усилий потрачено на интеграцию Perl с базами данных, в ос новном, благодаря колоссальной энергии, окружающей разработку для Интернета. Подобные достижения следует использовать в собственных интересах. Хотя Perl можно интегрировать с базами данных разных форматов, скажем, Unix DBM, Berkeley DB и т. д., в этой главе внимание будет уделено интерфейсу с масштабными ба зами данных. Об остальных форматах речь пойдет в других главах.

Системный администратор, разбирающийся в базах данных, должен хоть немного «говорить» на структурированном языке запросов (SQL), «официальном» для большинства коммерческих и нескольких неком мерческих систем. Создание сценариев на Perl для администрирова ния баз данных тоже требует некоторого знания SQL, т. к. в подобных сценариях встречаются простые встроенные операторы SQL. Доста точную для начала информацию о SQL можно найти в приложении D «Пятнадцатиминутное руководство по SQL». Чтобы не уходить в сто рону от вопросов системного администрирования, в примерах из этой главы используются те же базы данных, что и ранее.

Взаимодействие с SQL-сервером из Perl Существует два стандартных способа взаимодействия с SQL-сервером:

DBI (DataBase Interface) и ODBC (Open DataBase Connectivity). Когда то DBI был стандартом Unix, a ODBC - стандартом Win32, но эти гра ницы начали расплываться после того, как ODBC стал доступным в ми ре Unix, a DBI был перенесен на Win32. Еще сильнее стирает эти гра ницы пакет DBD: : ODBC - DBD-модуль, «говорящий» на ODBC из DBI. DBI и ODBC очень похожи как в своем предназначении, так и в ис пользовании, поэтому рассматриваться они будут одновременно. И DBI, и ODBC можно считать «промежуточным программным обеспече Помимо стандартов, обсуждаемых здесь, существует несколько отличных серверов и механизмов, зависящих от операционной системы. Одним из примеров является Sybperl Майкла Пеплера (Michael Peppier), предназна ченный для взаимодействия Perl и Sybase. Многие из этих нестандартных механизмов вызываются как DBI-модули. Например, большая часть функ ций Sybperl доступна теперь в D B D : : Sybase. На платформе Win32 все боль шее распространение получают объекты данных ActiveX (ADO), о которых говорилось в главе 6.

266 Глава 7. Администрирование баз данных нием» (middleware). Они создают уровень абстракции, позволяющей программисту писать программы, применяя вызовы DBI/ODBC, йе имея представления об API какой-либо конкретной базы данных. Це, редать эти вызовы на уровень, зависящий от баз данных, дело DBl/ ODBC. Модуль DBI обращается для этого к драйверу DBD;

менеджер ODBC вызывает зависящий от источника данных ODBC драйвер, кото рый заботится обо всех частностях, необходимых для соединения с сервером. На рис. 7.1 показана архитектура DBI и ODBC. В обоих слу чаях получается по меньшей мере трехъярусная модель:

Архитектура DBI Архитектура ODBC Сценарий Peri, использующий f Приложение методы, DBIAPI, API DBI OLE...СЛ Рис. 7.1. Архитектура DBI и ODBC 1. Лежащая в основе система управления базами данных (Oracle, MySQL, Sybase, Microsoft SQL Server и т. д.).

2. Уровень, зависящий от базы данных, который выполняет созданные программистом запросы к серверу. Программисты не работают с этим уровнем напрямую;

они используют третий ярус. В DBI с этим уровнем имеет дело специальный модуль DBD. Для взаимодействия с базой данных Oracle будет применяться модуль DBD:.Oracle. В про цессе компилирования модули DBD обычно связываются с клиентс кой библиотекой данного сервера, поставляемой создателем сервера.

В ODBC с этим уровнем работает ODBC-драйвер, зависящий от ис точника данных и устанавливаемый поставщиком.

действие с SQL-сервером из Perl Мост над пропастью между базами данных Unix и NT/ Очень часто системные администраторы, работающие в много платформенном окружении, задают вопрос: «Как я могу исполь зовать Microsoft SQL Server из Unix?» Если центральная систе ма администрирования или наблюдения построена на Unix, то установка нового MS-SQL-сервера представляет собой трудную задачу. Я знаю три способа справиться с этой ситуацией. Второй и третий способы не зависят от SQL-сервера, поэтому даже если вы применяете не Microsoft SQL-сервер, однажды они могут вам пригодиться.

1. Скомпилируйте и используйте D B D : : Sybase. Модуль DBD: : Sybase потребует некоторых библиотек для соединения с базой дан ных. Существует два набора библиотек, а этого более чем дос таточно. Первый набор - библиотеки Sybase OpenClient - мо жет быть доступен для вашей платформы (так, они бесплатно распространяются с некоторыми дистрибутивами Linux как часть пакета Sybase Adaptive Server Enterprise). Если вы ис пользуете MS-SQL-сервер версии 6.5 или ниже, то DBD: :Sybase, собранный с этими библиотеками, будет работать. Если это сервер версии 7.0 или выше, для совместимости может понадо биться «файл-заплата» от Microsoft. Информацию о нем следу ет искать на http://support.Microsoft.com/support/kb/articles/ q239/8/83.asp (KB статья Q239883). Второй вариант - устано вить библиотеки FreeTDS, которые можно найти на http:// www.freetds.org. Изучите инструкции на этом сайте, чтобы со брать нужную версию для своего сервера.

2. Используйте D B D : : P r o x y. Этот модуль DBD входит в состав DBI. Он позволяет на машине с MS-SQL-сервером запустить дополнительный маленький, который будет служить проз рачным прокси-сервером для запросов от Unix-клиентов.

3. Получите и применяйте Unix ODBC из DBD: :ODBC. Некоторые разработчики, включая MERANT (http://www.merant.com) и OpenLink Software (http://www.openlinksw.com), продают такое программное обеспечение;

но стоит попытаться использовать то, что было создано разработчиками из проекта Open Source.

Подробную информацию можно найти на странице freeODBC Брайана Джепсона (Brian Jepson) на http://users.ids.net/~bjep son/'freeODBC. Вам понадобится и драйвер ODBC для Unix платформы (разработанный производителем базы данных) и менеджер ODBC (подобный unixODBC или 10DBC).

268 Глава 7. Администрирование баз данных SQL 3. Уровень независимого от базы данных интерфейса прикладного программирования (API). Очень скоро мы будем писать сценарии на Perl, взаимодействующие с этим уровнем. В DBI он известен как уровень DBI (т. е. будут выполняться DBI-вызовы). В ODBC обычно происходит взаимодействие с менеджером ODBC-драйверов через вызовы ODBC API.

Прелесть ситуации состоит в том, что код, написанный для DBI или ODBC, можно без осложнений переносить с одного сервера на другой.

API-вызовы остаются прежними, поскольку не зависят от использу емой базы данных. Эта идея остается справедливой практически во всех случаях программирования баз данных. К сожалению, програм мы, которые мы будем писать (т. е. предназначенные для администри рования баз данных), обречены зависеть от сервера, т. к. практически нет двух серверов, которые администрировались бы хоть отдаленно похожим образом.1 Опытные системные администраторы любят пере носимые решения, но, увы, их не ожидают.

Впрочем, это грустные размышления, лучше посмотрим, как исполь зовать DBI и ODBC. Обе технологии выполняют одни и те же действия, поэтому может показаться, что в объяснениях или по крайней мере в заголовках присутствует избыточность.

В следующем разделе мы будем исходить из того, что сервер баз дан ных и необходимые модули Perl уже установлены. В некоторых при мерах кода для DBI будет использоваться сервер MySQL;

а для ODBC Microsoft SQL Server.

Использование DBI Вот что следует делать для использования DBI. Информацию о самом DBI можно найти в книге «Programming the Perl DBI»2 Аллигатора Декарта (Alligator Descartes) и Тима Ванса (Tim Bunce) (O'Reilly).

Шаг 1: Загрузите нужный модуль Здесь нет ничего особенного, нужно лишь написать:

use DBI;

Шаг 2: Соединитесь с базой данных и получите дескриптор соединения Код на Perl, устанавливающий DBI-соединение с базой данных MySQL и возвращающий дескриптор базы данных, выглядит при' мерно так:

MS-SQL первоначально был написан на основе исходного кода Sybase, так что это один из редких примеров обратного.

Аллигатор Декарт, Тим Бане «Программирование на Perl DBI», издатель ство «Символ-Плюс», 2000 г.

DBI # соединиться с базой данных Sdatabase, используя заданное имя П пользователя и пароль, вернуть дескриптор базы данных Sdatabase = "sysadm";

$dbh = DBI->connect("DBI:mysql:$database",$username,$pw);

die "Ошибка! Невозможно соединиться: $DBI::errstr\n" unless (defined $dbh);

До соединения с сервером DBI загрузит низкоуровневый DBD драйвер (DBD: :mysql). Перед тем как двигаться дальше, проверим, что соединение (при помощи connect()) установлено. DBI предостав ляет два параметра для connect () - R a i s e E r r o r и Print E r r o r, определя ющие, будет ли DBI выполнять эту проверку или сообщит об ошиб ках, когда они возникнут. В частности, если применить:

$dbh = DBI->connect("DBI:mysql:$database", $username,$pw,{RaiseError => 1});

то DBI вызовет die, при условии, что соединение с базой данных не произошло.

Шаг 3: Отправьте команды SQL-серверу Когда модуль загружен и соединение с сервером баз данных уста новлено, начинается самое интересное. Пошлем серверу несколько SQL-команд. Мы будем использовать запросы, приведенные в ка честве примеров из приложения D. В этих запросах для заключе ния в кавычки применяется оператор q (т. е. something записывается как q{something}), следовательно, не нужно беспокоиться о кавыч ках внутри запросов. Вот первый из двух DBI-методов, существую щих для отправки команд:

$results=$dbh->do(q{UPDATE hosts SET bldg = 'Main WHERE name = 'bendir'});

die "Невозможно выполнить обновление:$DBI::errstr\n" unless (defined Sresults);

Переменная $ results равна либо количеству обновленных записей, либо undef, если произошла ошибка. И хотя важно знать, сколько записей было обработано, такой метод абсолютно не подходит для операторов, подобных SELECT, где необходимо увидеть сами данные.

Следовательно, нужно применить второй метод.

Для использования второго метода необходимо сначала подгото вить оператор SQL (с помощью команды prepare), а затем выпол нить (execute) его на сервере. Вот пример:

$sth = $dbh->prepare(q{SELECT * from hosts}) or die "Ошибка! Невозможно подготовить запрос:".$dbh->errstr."\n";

$rc = $sth->execute or die "Ошибка! Невозможно выполнить запрос:".$dbh->errstr."\n";

270 Глава 7. Администрирование баз данных SQ[ Команда ргераге( ) возвращает нечто новое, чего мы раньше никогда не встречали: дескриптор команды. Так же, как дескриптор базы данных ссылается на открытое соединение с базой данных, де скриптор команды ссылается на конкретный SQL-оператор, кото рый был подготовлен с помощью ргераге( ). Получив дескриптор ко манды, можно использовать execute для отправки запроса на сер вер. Позже подобный дескриптор команды будет применяться для получения результатов запроса.

Вероятно, вас удивляет, зачем сначала подготавливать оператор, вместо того чтобы напрямую выполнить его. Подобная операция позволяет драйверу DBD (или, что более вероятно, вызываемой биб лиотеке) выполнить синтаксический разбор SQL-запроса. После то го как оператор подготовлен, можно повторно выполнить его через дескриптор команды, не проводя больше синтаксический анализ.

Зачастую это основной фактор повышения эффективности. В дейст вительности, DBI-метод do(), используемый по умолчанию, для каждой выполняемой команды применяет сначала ргераге(), а за тем execute().

Как и вызов do, рассмотренный ранее, метод executeO возвращает количество обработанных записей. Если результатом запроса явля ется ноль записей, возвращается строка ОЕО, эта строка при логичес кой проверке воспримется как «истина». Если драйверу неизвест но, сколько записей было обработано, возвращается -1.

Перед тем как перейти к ODBC, стоит упомянуть еще об одной осо бенности ргераге(), поддерживаемой большинством DBD-модулей, а именно о заполнителях (placeholders). Заполнители, также назы ваемые позиционными маркерами, позволяют подготовить коман ду с оставленными в ней «дырами», в которые можно внести значе ния во время выполнения команды (executeO). Подобное свойство помогает конструировать запросы на лету, не затрачивая лишнего времени на их синтаксический разбор. Знак вопроса используется как заполнитель для одного скалярного значения. Вот пример кода на Perl, демонстрирующий такое применение заполнителей:

©machines = qw(bendir shimmer sander);

$sth = $dbh->prepare(q{SELECT name, ipaddr FROM hosts WHERE name = ?});

foreach Sname (©machines) { $sth->execute($name);

сделать-что-то-с-результатами Каждый раз, проходя через цикл foreach, запрос SELECT выполняет ся с разными условиями WHERE. Можно применять и несколько за" полнителей:

$sth->prepare( q {SELECT name, ipaddr FROM hosts ользование DBI Исп WHERE (name = ? AND bldg = ? AND dept = ?)});

$sth->execute($name,$bldg,$dept);

Теперь, когда известно, как получить количество записей, обраба тываемых запросом, отличным от SELECT, посмотрим, как получить результаты запросов SELECT.

Шаг 4: Получите результаты запроса SELECT Механизм, рассмотренный здесь, похож на историю о курсорах из приложения D. Когда серверу при помощи executeO посылается запрос SELECT, применяется способ, позволяющий возвращать ре зультаты построчно.

Для получения данных в DBI используется один из методов, пере численных в табл. 7.1.

Таблица 7.1. DBI-методы получения данных Возвращает, Возвращает Имя если больше нет записей fetchrow_arrayref() Ссылка на анонимный массив со значени- undef ями, являющимися полями следующей записи Массив со значениями, являющимися по- Пустой список fetchrow_array() лями следующей записи fetchrow_hashref() Ссылка на анонимный хэш, ключами ко- undef торого являются имена полей, а значения ми - значения полей следующей записи Ссылка на fetchall_arrayref() Ссылка на массив массивов пустой массив Посмотрим, как работают эти методы в нашем случае. Для каждого из примеров будем считать, что перед вызовом метода выполнено следующее:

$sth = $dbh->prepare(q{SELECT name, ipaddr, dept from hosts}) or die "Невозможно подготовить запрос: ".$dbh->errstr. "\n";

$sth->execute or die "Невозможно выполнить запрос: ". $dbh->errstr. "\n";

Вот метод f e t c h r o w _ a r r a y r e f ( ) в действии:

while ($aref = $sth->fetchrow_arrayref){ print "name: ". $aref->[0]. "\n";

print "ipaddr: ". $aref->[1]. "\n";

print "dept: ". $aref->[2]. "\n";

В документации по DBI говорится, что f e t c h r o w _ h a s h r e f ( ) менее эф фективен, чем fetchrow_arrayref ( ), из-за дополнительной обработ 272 Глава 7. Администрирование баз данных SQL ки, но данный метод позволяет получить более" читаемый код. Вот пример:

while ($href = $sth->fetchrow_hashref){ print "name: ". $href->{name}. "\n";

print "ipaddr: ". $href->{ipaddr}. "\n";

print "dept: ". $href->{dept}. "\n";

А теперь рассмотрим «удобный» метод f e t c h a l l _ a r r a y r e f ( ). Он за гружает весь полученный результат в одну структуру данных, возв ращая ссылку на массив ссылок. При использовании данного мето да будьте осторожны и учитывайте размер запросов, поскольку ре зультаты целиком считываются в память. Если размер результата равен 100 Гбайт, это может вызвать проблемы.

Каждая ссылка выглядит точно так же, как и результат вызова ме тода f e t c h r o w _ a r r a y r e f () (рис. 7.2).

Вот какой код выводит результат запроса целиком:

$aref_aref = $sth->fetchall_arrayref;

foreach $rowref (@$aref_aref){ print "name: ". $rowref->[0] print "ipaddr: ". $rowref->[1] print "dept: ". $rowref->[2] print ' - ' x 3 0, " \ n " ;

Этот пример применим только к конкретному набору данных, по скольку предполагается, что количество полей фиксировано и они следуют в определенном порядке. Например, считается, что имя машины возвращается в первом поле запроса ($rowref->[0]).

Можно переписать предыдущий пример и сделать его более общим, если использовать атрибуты (часто называемые метаданными) де скриптора команды. В частности, если после запроса посмореть на $sth->{NUM_OF_FIELDS}, то можно узнать количество полей в получен Г |< -j row | row row row ref j ref ref aJ.•• •ma.

[ columnl, column?, columns, column. • [columnl, coluinn2, columns, column.. ] [ columnl, column2, columns, column.. ] [ columnl, column2, columns, column,. ] „ Puc. 7.2. Структура данных, возвращаемая fetchrow_arrayref Использование DBI. ных данных. $sth->{NAME} содержит ссылку на массив названий по лей. Последний пример можно переписать так:

$aref_aref = $sth->fetchall_arrayref;

foreach $rowref (@$aref_aref){ for ($1=0;

$1 < $sth->{NUM_OF_FIELDS},$i++){ print $sth->{NAME}->[$i].": ".$rowref->[$i]."\n";

} print '-'x30,"\n";

} Обязательно изучите документацию по DBI, чтобы подробно узнать об остальных метаданных.

Шаг 5: Закройте соединение с сервером С DBI это очень просто сделать:

# сообщаем серверу, что данные из дескриптора команды больше П не нужны (необязательно, т. к. мы собираемся завершить и соединение) $sth->finish;

# разорвать соединение дескриптора с базой данных $dbh->disconnect;

Что еще надо сказать о DBI Осталось еще две темы, которые стоит обсудить, прежде чем перехо дить к ODBC. Во-первых, это набор методов, которые я называю «удоб ными» (shortcut methods). Методы, приведенные в табл. 7.2, объеди няют перечисленные шаги 3 и 4.

Таблица 7.2. Удобные методы DBI Название Объединяет в себе следующие методы selectrow_arrayref($stmnt) prepare($stmnt), executeQ, f etch row_ar ray ref () selectcol_arrayref($stmnt) prepare($stmnt), execute(), (@{fetchrow_arrayref()})[0] (т. е. возвращает первое поле для каждой записи) selectrow_array(Sstmnt) prepare(Sstmnt), execute(),fetchrow_array() Во-вторых, заслуживает внимания способность DBI связывать пере менные с результатами запроса. Методы b i n d _ c o l ( ) и b i n d _ c o l u m n s ( ) ис пользуются для автоматического помещения результатов запроса в указанную переменную или список переменных. Обычно это заменяет дополнительный шаг, а то и два при написании программы. Ниже приведен пример, включающий bind_columns():

$sth = $dbh->prepare(q{SELECT name,ipaddr,dept from hosts}) or die "Невозможно подготовить запрос:".$dbh->errstr".\n";

$rc = $sth->execute or 274 Глава 7. Администрирование баз данных SQL die "Невозможно выполнить запрос :".$dbh->errstr".\n";

и эти переменные получат 1-й, 2-й и 3-й столбцы из SELECT $rc = $sth->bind_columns(\$name,\$ipaddr, \$dept);

while ($sth->fetchrow_arrayref){ # $name, $ipaddr и $dept автоматически получают значения из и результатов запроса сделать-что-то-с-результатами Использование ODBC Основные шаги при использовании ODBC похожи на только что рас смотренные действия с DBI.

Шаг 1: Загрузите нужный модуль Perl use Win32: :ODBC;

Шаг 2: Соединитесь с базой данных и получите дескриптор соединения Перед тем как установить соединение в ODBC, следует выполнить один дополнительный шаг. Нужно создать имя источника данных (Data Source Name, DSN). DSN - это именованная ссылка, в кото рой хранится конфигурационная информация (например, имя сер вера и базы данных), необходимая для доступа к источнику инфор мации, такому как SQL-сервер. Имена источников данных бывают двух типов: пользовательские (user) и системные (system), разли чающиеся тем, будет ли соединение доступно одному пользователю на машине либо любому пользователю или службе. DSN можно создать либо из панели управления ODBC в Windows NT/2000, либо программным образом из Perl. Мы пойдем вторым путем, хотя бы для того, чтобы не вызывать насмешек со стороны пользователей Unix. Вот как можно поступить для создания поль зовательского имени источника данных на сервере MS-SQL:

# создаем пользовательское имя источника данных на Microsoft-SQL-сервере # Замечание: чтобы создать системное имя источника данных, и замените ODBC_ADD_DSN на ODBC_ADD_SYS_DSN if (Win32:: ODBC ::ConfigDSN( ODBC_ADD_DSN, "SQL Server", ("DSN=PerlSysAdm", ••DESCRIPTION=DSN for PerlSysAdnf, Существует еще и третий тип - файловый (file), который записывает кон фигурационную информацию DSN в файл, который могут использовать не сколько машин. Рассматриваемый модуль Win32::ODBC не содержит мето ™= пг>янпляюших создать DSN такого типа.

Использование ODBC "SERVER=mssql.happy.edu", # имя сервера "ADDRESS=192.168.1.4", # IP-адрес сервера "DATABASE=sysadm", ft наша база данных "NETWORK=DBMSSOCN", # Библиотека сокетов TCP/IP ))){ print "DSN создан\п";

} else { die "Невозможно создать DSN:". Win32::ODBC::Error(). "\n";

} После того как имя источника данных создано, его можно ис пользовать для открытия соединения с базой данных:

П соединяемся с DSN, возвращаем дескриптор базы данных $dbh=new Win32::ODBC("DSN=PerlSysAdm;

UID=$username;

PWD=$pw;

");

die "Невозможно соединиться с DSN PerlSysAdm:". Win32::ODBC::Error()..

"\n" unless (defined $dbh);

Шаг З: Отправьте команды SQL на сервер ODBC-эквивалент DBI-командам do(), prepare() и execute() немного проще, потому что модуль W i n 3 2 : :ODBC имеет один метод S q l ( ) для отправки команды на сервер. Хотя в ODBC теоретически упомина ется о подготовке команды и заполнителях, это не реализовано в те кущей версии модуля W i n 3 2 : : ODBC. 1 В W i n 3 2 : : ODBC также не использу ются дескрипторы команд;

взаимодействие происходит через де скриптор базы данных, открытый ранее при помощи метода new.

Так что нам остается команда с простейшей структурой:

$rc = $dbh->Sql(q{SELECT * from hosts});

Есть разница между методами ODBC и DBI: в отличие от do() из DBI, Sql() возвращает undef, если запрос был завер шен успешно, и некоторое ненулевое значение, если запрос не был выполнен.

Если необходимо узнать, сколько записей было обработано в ре зультате запроса INSERT, DELETE или UPDATE, следует использовать ме тод RowCount(). В документации по Win32: :ODBC сказано, что этот вы зов реализован не во всех драйверах ODBC (либо реализован не для всех операторов SQL), поэтому не стоит слепо полагаться на драй вер, лучше сначала все проверить. Как и в случае с методом execute() В то время, когда писалась эта книга, Дейв Рот тестировал новую версию Win32: : ODBC, позволяющую связывать параметры. Применяемый в этом слу чае синтаксис похож на DBI (т. е. сначала выполняется Ргераге(), а затем Sql()), но включает некоторые особенности ODBC. Подробную информа цию можно найти на http://www.roth.net.

276 Глава 7. Администрирование баз данных SQL из DBI, RowCount() вернет -1, если драйверу недоступна информация о количестве полученных записей.

Вот как выглядит пример использования d o ( ) из предыдущего раз дела для ODBC:

if (defined $dbh->Sql(q{UPDATE hosts SET bldg = 'Main' WHERE name = 'bendir'})){ die "Невозможно выполнить обновление: ".Win32::ODBC::Error()."\n" > else { Sresults = $dbh->RowCount();

} Шаг 4: Получите результаты запроса SELECT Получение результатов запроса SELECT для ODBC выполняется по добно тому, как это было сделано для DBI, но с одним отличием. Во первых, получение данных с сервера и обращение к ним являются двумя разными шагами в W i n 3 2 : : ODBC. Метод FetchRow() получает сле дующую запись, возвращает 1, если все прошло успешно, и undef, ес ли что-то было не так. Когда запись получена, можно выбрать один из двух методов, чтобы обратиться к ней.

Метод Data() возвращает список полученных полей, если вызывает ся в списочном контексте, и все поля, склеенные вместе, если вызы вается в скалярном контексте. D a t a ( ) может принимать в качестве необязательного аргумента список, определяющий, какие поля воз вращать и в каком порядке (иначе, в соответствии с документа цией, они возвращаются в «неопределенном» порядке).

Метод D a t a H a s h ( ) возвращает хэш, ключами которого являются имена полей. Это очень похоже на DBI-метод f e t c h r o w _ h a s h r e f (), с тем исключением, что он возвращает хэш, а не ссылку на хэш. Как и Oata(), D a t a H a s h ( ) тоже может принимать список в качестве необяза тельного аргумента для определения того, какие поля возвращать.

В нашем случае эти методы выглядят так:

if ($dbh->FetchRow()){ @ar = $dbh->Data();

сделать-что-то-со-значениями @аг } и:

if ($dbh->FetchRow()){ %ha = $dbh->DataHash('name','ipaddr');

сделать-что-то-со-значениями-$Ьа{пате)-и-$Ьа{1рас1с1г} } Справедливости ради надо отметить, что информацию, передава емую через атрибут дескриптора команды {NAME} в DBI, в мире W i n 3 2 : :ODBC можно получить при помощи метода FieldNames(). Для то Документирование сервера го чтобы узнать количество полей (как в {NUM_OF_FIELDS}), придется пересчитать элементы в списке, возвращенном методом FieldNames().

Шаг 5: Закройте соединение с сервером $dbh->close();

Если вы создали имя источника данных и хотите удалить его, что бы убрать за собой, используйте оператор, похожий на тот, который применялся для его создания:

# замените ODBC_REMOVE_DSN на ODBC_REMOVE_SYS_DSN, если вы # создавали системное имя источника данных if (Win32::ODBC::ConfigDSN(ODBC_REMOVE_DSN, "SQL Server","DSN=PerlSysAdm")){ print "DSN удален\п";

} else { die "Невозможно удалить DSN:".Win32::ODBC::Error()."\n";

} Теперь известно, как работать с базами данных из Perl, используя DBI и ODBC. Применим эти знания на практике и поработаем с более слож ными примерами из области администрирования баз данных.

Документирование сервера Очень много времени и энергии уходит на настройку SQL-сервера и объектов, расположенных на нем. Способ документирования подобной информации может пригодиться в ряде ситуаций. Если база данных будет повреждена, а резервной копии не окажется, вам придется вос станавливать все ее таблицы. При необходимости перенести данные с одного сервера на другой важно знать конфигурацию источника и при емника данных. Даже для собственных баз данных может пригодить ся возможность просмотреть карту таблиц.

Чтобы передать всю «прелесть» непереносимой (nonportable) природы администрирования баз данных, приведу пример реализации одной простой задачи для трех различных SQL-серверов с использованием как DBI, так и ODBC. Каждая из этих программ делает одно и то же:

выводит список всех баз данных на сервере, их таблицы и структуру каждой таблицы. Эти сценарии можно очень легко расширить для предоставления более подробной информации о каждом объекте. На пример, бывает полезно узнать, в каких полях есть значения NULL или NOT NULL. Вывод всех трех программ выглядит одинаково:

---sysadm— hosts name [char(30)j ipaddr [char(15)] Глава 7. Администрирование баз данных SQ|_ [ aliases [char(50)] owner [char(40)] dept [char(15)] bldg [char(10)] room [char(4)] manuf [char(10)] model [char(10)] —hpotter— customers cid [char(4)] cname [varchar(13)] city [varchar(20)] discnt [real(7)] agents aid [char(3)] aname [varchar(13)] city [varchar(20)] percent [int(10)] products pid [char(3)] pname [varchar(13)] city [varchar(20)] quantity [int(10)] price [real(7)] orders ordno [int(10)] month [char(3>] cid [char(4)] aid [char(3)] pid [char(3)] qty [int(10)] dollars [real(7)] Сервер MySQL и DBI Вот как выглядит способ получить эту информацию с сервера MySQL с использованием DBI. Существующее в MySQL дополнение команды SHOW очень упрощает эту задачу:

use DBI;

print "Введите имя пользователя: ";

chomp($user = );

print "Введите пароль для $user: ";

chomp($pw = );

$start = "mysql";

# первоначально будем подсоединяться к этой базе данных 8 соединяемся с базой данных $dbh = DBI->connect("DBI:mysql:$start",$user,$pw);

die "Невозможно соединиться: ".$DBI::errstr."\n" unless (defined $dbh);

II документирование сервера # ищем базы данных на сервере $sth=$dbh->prepare(q{SHOW DATABASES}) or die "Невозможно подготовить запрос show databases: ". $dbh->errstr. "\n" $sth->execute or die "Невозможно выполнить запрос show databases: ". $dbh->errstr. "\n";

while ($aref = $sth->fetchrow_arrayref ) { push(@dbs,$aref->[0]);

} $sth->finish;

# ищем таблицы в каждой базе данных foreach $db (@dbs) { print "-— $db— \n";

$sth=$dbh->prepare(qq{SHOW TABLES FROM $db}) or die "Невозможно подготовить запрос show tables: ". $dbh->errstr. "\n" $sth->execute or die "Невозможно выполнить запрос show tables: ". $dbh->errstr. "\n";

@tables=();

while ($aref = $sth->fetchrow_arrayref ) { push(@tables, $aref->[0]);

$sth->finish;

9 ищем информацию о полях для каждой таблицы foreach Stable (©tables) { print "\t$table\n";

$sth=$dbh->prepare(qq{SHOW COLUMNS FROM Stable FROM $db}) or die "Невозможно подготовить запрос show columns: ". Sdbh >errstr. "\n";

$sth->execute or die "Невозможно выполнить запрос show columns: ". $dbh->errstr. "\n" while (Saref = $sth->fetchrow_arrayref) { print "\t\t",$aref->[0], " [",$aref->[1], "]\n";

$sth->finish;

$dbh->disconnect;

Добавим несколько комментариев к приведенной программе:

• Мы соединяемся с начальной базой данных только для того, чтобы удовлетворить принятой в DBI семантике соединения, но такой контекст возникает не обязательно благодаря командам SHOW. В сле дующих двух примерах этого не будет.

280 Глава 7. Администрирование баз данных SQL • Если читатель думает, что команды подготовки и выполнения за просов SHOW TABLES и SHOW COLUMNS являются отличными кандидатами на использование заполнителей, то он совершенно прав. К сожале нию, именно эта комбинация DBD драйвера/сервера не поддержива ет заполнители в таком контексте (по крайней мере, это было так в период написания данной книги). В следующем примере мы столк немся с подобной ситуацией.

• Имя пользователя базы данных и его пароль запрашиваются инте рактивно, поскольку альтернативы (прописывание их в коде или передача в командной строке, при которых любой, кто просматри вает список процессов, сможет их увидеть) еще хуже. В данном слу чае символы пароля будут отображаться при вводе. Для большей осторожности стоит применять что-то подобное T e r m : : Read key, что бы подавить отображение символов.

Сервер Sybase и DBI В этом подразделе представлен аналог для Sybase. Внимательно про смотрите программу, а после этого поговорим о некоторых существен ных моментах:

use DBI;

print "Введите имя пользователя: ";

chomp($user = );

print "Введите пароль для $user: ";

chomp($pw = );

$dbh = DBI->connect('dbi:Sybase:',$user,$pw);

die "Невозможно соединиться: $DBI::errstr\n" unless (defined $dbh);

# ищем базы данных на сервере $sth = $dbh->prepare(q{SELECT name from master.dbo.sysdatabases}) or die "Невозможно подготовить запрос к sysdatabases: ".$dbh->errstr."\n";

$sth->execute or die "Невозможно выполнить запрос к sysdatabases: ".$dbh->errstr."\n";

while ($aref = $sth->fetchrow_arrayref) { push(dbs, $aref->[0]);

} $sth->finish;

foreach $db (@dbs) { $dbh->do("USE $db") or die "Невозможно использовать $db: ",$dbh->errstr."\n";

print " —-$db---\n";

# найти таблицы в каждой базе данных $sth=$dbh->prepare(q{SELECT name FROM sysobjects WHERE type="U"}) or die "Невозможно подготовить запрос к sysobjects: ".$dbh->errstr."\n";

документирование сервера $sth->execute or die "Невозможно выполнить запрос к sysobjects: ". $dbh->errstr. "\n";

@tables=();

while ($aref = $sth->fetchrow_arrayref ) { push(@tables, $aref->[0]);

> $sth->finish;

П мы должны быть "внутри" базы данных для следующего шага $dbh->do("use $db") or die "Невозможно изменить $db: ".$dbh->errstr. "\n";

8 ищем поля для каждой таблицы foreach Stable (©tables) { print "\t$table\n";

$sth=$dbh->prepare(qq{EXEC sp_columns Stable}) or die "Невозможно подготовить запрос sp_columns: ".$dbh->errstr. "\n";

$sth->execute or die "Невозможно выполнить запрос sp_columns: ".$dbh->errstr. "\n";

while ($aref = $sth->fetchrow_arrayref ) { print "\t\t",$aref->[3], " [-',$aref->[5], "(", $aref->[6],")]\n";

} $sth->finish;

$dbh->disconnect or warn "Невозможно отсоединиться: ",$dbh->errstr. "\n";

Вот обещанные заметные моменты:

• Sybase хранит информацию о базах данных и таблицах в специаль ных системных таблицах sysdatabases и sysobjects. Каждая база данных содержит таблицу sysobjects, в то время как сервер хранит обобщенную информацию о них в одной таблице sysdatabases, рас положенной в основной базе данных. Мы используем более явный синтаксис databases, owner, table в первом запросе SELECT, чтобы не двусмысленно обратиться именно к этой таблице. Для перехода к sysobjects каждой базы данных можно применять этот же синтак сис, вместо того чтобы явно переключаться между ними при помо щи USE. Более того, как и при переходе в каталог средствами cd, та кой контекст упрощает написание других запросов.

• Запрос SELECT к sysobjects применяет ключевое слово WHERE, чтобы вернуть информацию только о пользовательских таблицах. Это бы ло сделано для ограничения размера вывода. Если бы мы хотели включить также и все системные таблицы, то могли бы изменить запрос на:

WHERE type="U" AND type="S" 282 Глава 7. Администрирование баз данных SQL • Складывается впечатление, что заполнители в DBD : : Sybase реализо ваны так для того, чтобы препятствовать их употреблению с храни мыми процедурами. Будь реализация другой, следовало бы исполь зовать заполнители в EXEC sp_columns.

Сервер MS-SQL и ODBC Наконец, вот код для получения той же информации с сервера MS-SQL через ODBC. Заметьте, что применяемый синтаксис SQL практически идентичен предыдущему примеру благодаря связи Sybase/MS-SQL.

Интересны отличия между этим примером и предыдущим:

• Использование DSN, которое предоставляет нам контекст базы дан ных по умолчанию, так что нет необходимости указывать, где ис кать таблицу sysdatabases.

• Употребление $dbh~>DropCursor( ) в качестве грубой аналогии $sth->f i nish.

• Неудобный синтаксис, который приходится применять для запуска хранимых процедур. Информацию о хранимых процедурах и дру гих подобных аномалиях ищите на веб-страницах по Win32 : : ODBC.

Вот как выглядит программа:

use Win32: :ODBC;

print "Введите имя пользователя: ";

chomp($user = );

print "Введите пароль для $user: ";

chomp($pw = );

$dsn="sysadm";

tt имя источника данных, которое мы используем и ищем доступные DSN, создаем переменную $dsn, если она еще не существует die "Невозможно запросить доступные DSN", Win32:

-.ODBC: :Error(). "\n" unless (%dsnavail = Win32: ;

ODBC: :DataSources());

if (! defined $dsnavail{$dsn}) { die "невозможно создать DSN:". Win32: :ODBC: :Error(). "\n" unless (Win32: :ODBC: :ConfigDSN(ODBC_ADD_DSN, "SQL Server", ("DSN=$dsn", "DESCRIPTION=DSN for PerlSysAdm", "SERVER=mssql. happy. edu", "DATABASE=master", "NETWORK=DBMSSOCN", и библиотека сокетов TCP/IP # соединение с основной базой данных $dbh = new Win32: :ODBC("DSN=$dsn;

UID=$user;

PWD=$pw;

");

die "Невозможно соединиться с DSN $dsn: ".Win32: :ODBC: :Error(). "\n" Документирование сервера unless (defined $dbh);

# ищем базы данных на сервере г |' if (defined $dbh->Sql(q{SELECT name from sysdatabases})){ die "Невозможно послать запрос к базе данных:". Win32: :ODBC: :Error(). "\n";

while ($dbh->FetchRow()){ push(@dbs, $dbh->Data("name"));

} $dbh->OropCursor();

# ищем пользовательские таблицы в каждой базе данных foreach $db (@dbs) { if (defined $dbh->Sql("use $db"))< die "Невозможно изменить базу данных на $db:".

Win32: :ODBC::Error(). "\n";

} print " — -$db---\n";

@tables=();

if (defined $dbh->Sql(q{SELECT name from sysobjects WHERE type="U"})){ die "Невозможно запросить таблицы из $db:".

Win32: :ODBC::Error(). "\n";

} while ($dbh->FetchRow()) { push (©tables, $dbh->Data( "name"));

} $dbh->DropCursor();

# ищем информацию о полях для каждой таблицы foreach Stable (@tables) { print "\t$table\n";

if (defined $dbh->Sql(" {call sp_columns (\'$table\' )} " ) ){ die "Невозможно запросить поля из таблицы Stable.-".Win32:: ODBC ::Error(). "\n";

} while ($dbh->FetchRow()) { @cols=();

@cols=$dbh->Data("COLUMN_NAME", "TYPE_NAME", "PRECISION");

- print "\t\t",$cols[0], [",$cols[1],"(",$cols[2],")]\n";

} $dbh->DropCursor();

$dbh->Close();

die "Невозможно удалить DSN: ".Win32: : ODBC: :Error( ). "\n" unless (Win32: :OD6C: :ConfigDSN(ODBC_REMOVE_DSN, "SQL Server", "DSN=$dsn"));

284 Глава 7. Администрирование баз данных SQL.

Учетные записи баз данных Как упоминалось раньше, администраторы баз данных вынуждены иметь дело с рядом тех же вопросов, с которыми борются системные администраторы, в частности, с поддержкой регистрационных имен и учетных записей. Например, днем на работе мы ведем занятия по программированию баз данных. Каждый студент, посещающий эти занятия, получает регистрационное имя на сервере Sybase и свою собственную (пусть и маленькую) базу данных, с которой он может ра ботать. Вот упрощенная версия программы, которую мы используем для создания таких баз данных и регистрационных имен:

use DBI;

и ИСПОЛЬЗОВАНИЕ: syaccreate $admin = 'за' ;

print "Введите пароль для Sadmin: ";

chomp($pw = );

$user=$ARGV[0];

ft генерируем «фиктивный* пароль, основываясь на имени # пользователя, записанном в обратном порядке, и дополняем его и дефисами, чтобы его длина составляла 6 символов $genpass = reverse join(' ', reverse split(//,$user));

Sgenpass.= "-" x (6-lengtn($genpass));

# вот перечень SQL-команд, которые используем ft мы: 1) создаем базу данных на устройстве USER_DISK # с журналом регистрации в USER_LQG и 2) добавляем регистрационное имя для пользователя и на сервере, делая новую базу базой по умолчанию и 3) переключаемся на вновь созданную базу данных ft 4) изменяем владельца базы данных на пользователя ©commands = ("create database Suser on USER_DISK=5 log on USER_LOG=5", "sp_addlogin $user,\"$genpass\", $user", "use Suser", "sp_changedbowner $user");

# соединяемся с сервером $dbh = OBI->connect( 'dbi:Sybase: ',$admin,$pw);

die "Невозможно соединиться: $DBI: :errstr\n", unless (defined $dbh);

I # обходим в цикле массив команд и выполняем последовательно все команды for (^commands) { $dbri->do($_) or die "He могу $_: ". $dbh->errstr. "\n";

$dbh->disconnect;

т учетные записи баз данных Поскольку эта задача заключается в выполнении ряда команд, кото рые не возвращают данных, можно записать их в компактном цикле, в котором вызывается повторно $dbh->do(). Можно было бы использо вать полностью идентичный сценарий для удаления этих учетных за писей и баз данных, когда занятия завершатся:

use DBI;

и ИСПОЛЬЗОВАНИЕ: syacdelete Sadmin = 'sa';

print "Введите пароль для Sadmin: ";

Chomp($pw = );

$user=$ARGV[0];

» перечень SQL-команд, которые мы будем использовать;

# мы: удаляем базу данных пользователя и удаляем регистрационное имя с сервера @commands = ("drop database $user", "sp_droplogin $user");

# соединяемся с сервером $dbh = DBI->connect('dbi:Sybase:', Sadmin, $pw);

die "Невозможно соединиться: $DBI::errstr\n" unless(defined $dbh);

# обходим в цикле массив команд, выполняя их последовательно for (@commands) { $dbh->do($_) or die "Невозможно $_: ". $dbh->errstr. "\n";

\ / $dbh->disconnect or warn "Невозможно рассоединиться: ". $dbh->errstr. "\n";

Существует много функций, связанных с учетными записями, кото рые можно добавить в эту программу. Вот лишь некоторые идеи:

Проверка паролей Утилита соединяется с сервером и получает список баз данных и учетных записей;

затем пытается установить связь, применяя не надежные пароли (регистрационные имена, пустые пароли, пароли по умолчанию).

Карта пользователей Создаем список регистрационных имен и баз данных, доступных пользователям с этими регистрационными именами.

Управление паролями Система ограничения срока действия паролей.

286 Глава 7. Администрирование баз данных SQ|_ Мониторинг состояния сервера В качестве последнего примера рассмотрим несколько способов наб людения за состоянием SQL-сервера. Программы такого рода по своей природе похожи на службы наблюдения за сетью, уже рассмотренные в главе 5 «Службы имен TCP/IP».

Наблюдение за свободным пространством Если на мгновение вникнуть в технические тонкости, то сервер баз данных - это место для хранения разного добра. И если места для его хранения не остается, то это либо плохо, либо очень плохо. Так что программы, помогающие следить за свободным и занятым пространст вом на сервере, действительно очень полезны. Посмотрим на DBI программу, созданную для наблюдения за дисковым пространством на сервере Sybase.

Вот отрывок вывода программы, которая в графическом виде показы вает, как любая база данных использует место на сервере. В каждом разделе отражено, сколько процентов пространства занято данными и журналом. В следующей диаграмме d соответствует пространству, за нятому данными, а 1 - журналам. Для каждой диаграммы указан объем занятого и доступного пространства (в процентах):

Iddddddd |15.23%/5MB hpotter 1 | | |0.90%/5МВ Iddddddd |15.23%/5MB dumbledore I | |1.52%/5МВ Idddddddd |16.48%/5MB hgranger 1 | | 11.52%/5МВ Iddddddd |15.23%/5MB rweasley 1 I |1 |3.40%/5МВ |ddddddddddddddddddddddddddd |54.39%/2МВ hagrid 1 I I- no log I Вот как генерировался этот вывод:

use DBI;

$admin = 'sa';

print "Введите пароль для $admin: ";

chomp($pw = );

Spages = 2 ;

ft данные хранятся в 2-килобайтных страницах Мониторинг состояния сервера 9 соединяемся с сервером $dbh = DBI->connect('dbi:Sybase:',$admin,$pw);

die "Невозможно соединиться: $DBI::errstr\n" unless (defined $dbh);

9 получаем имена баз данных на сервере $sth = $dbh->prepare(q{SELECT name from sysdatabases}) or die "Невозможно подготовить запрос к sysdatabases: ".$dbh->errstr."\n";

$sth->execute or die "Невозможно выполнить запрос к sysdatabases: ".$dbh->errstr."\n";

while ($aref = $sth->fetchrow_arrayref) { push(@dbs, $aref->[0]);

} $sth->finish;

П получаем состояние для каждой из баз данных foreach $db (@dbs) { 9 получаем и суммируем значения из поля size для всех 9 сегментов, не относящихся к журналам регистрации $size = &querysum(qq{SELECT size FROM master.dbo.sysusages WHERE dbid = db_id(V$db\') AND segmap != 4});

9 получаем и суммируем значения из поля size для сегмента, и соответствующего журналам регистрации $logsize = &querysum(qq{SELECT size FROM master.dbo.sysusages WHERE dbid = db_id(\-$db\') AND segmap =4});

# переходим к другой базе данных и получаем информацию об 9 используемом пространстве $dbh->do(q{use $db}) or die "Невозможно изменить базу данных на $db: ".$dbh->errstr."\n";

# мы использовали функцию reserved_pgs, чтобы вернуть 9 количество страниц, используемых под данные (doampg) и 9 индекс (ioampg) $used=&querysum(q{SELECT reserved_pgs(id,doampg)+reserved_pgs(id,ioampg).FROM sysindexes WHERE id != 8});

9 то же самое, только на этот раз получаем информацию по 9 журналам регистрации $logused=&querysum(q{SELECT reserved_pgs(id, doampg) FROM sysindexes WHERE id=8});

9 выводим информацию в графическом виде &graph($db,$size,Slogsize,Sused,$logused);

} $dbh->disconnect;

9 готовим/выполняем запрос SELECT, получаем сумму результатов ч 288 Глава 7. Администрирование баз данных SQi sub querysum { my($query) = shift;

my($sth,$aref,$sum);

$sth = $dbh->prepare($query) or die "Невозможно подготовить запрос Squery: ".$dbh->errstr."\n";

$sth->execute or die "Невозможно выполнить запрос Squery: ".$dbh->errstr."\n";

while ($aref=$sth->fetchrow_arrayref) { $sum += $aref->[0];

$sth->finish;

$sum;

ft выводим в виде диаграммы имя базы данных, ее размер, размер журнала ft регистрации и информацию об использовании пространства sub graph { my($dbname,$size,$logsize,$used,Slogused) = @_;

(f строка для информации об использовании пространства данными print ' 'х15. T - ' d ' x (50 *($used/$size)).

' 'х (5Q-(50*($used/$size))). • ) • ;

и использованное пространство и общий объем, отведенный под данные printf("%,2f",($used/$size*100));

print "%/". (($size * $pages)/1024)."MB\n";

print Sdbname.'-'x(14-length($dbname)).'-|'.(' 'x 49)."|\n";

if (defined Slogsize) { ft строка для информации об ft использовании пространства под журналы регистрации print ' 'х15. 'Г • '1'х (50 *($logused/$logsize)).

' 'х (50-(50*($logused/$logsize))). 'Г;

ft использованное пространство и общий объем, отведенный ft под журналы регистрации printf("%.2f",($logused/$logsize*100));

print "%/". ((Slogsize * $pages)/1024)."MB\n";

else { ft у некоторых баз данных нет отдельного места для ft журналов регистрации print ' 'х15. "|- no log".(' 'х 41)."|\п";

print "\n";

Читатель, разбирающийся в SQL, вероятно, удивится, зачем использо вать специальную подпрограмму ( q u e r y s u m ) для суммирования данных из одного столбца вместо того, чтобы применить отличный оператор SUM из SQL. q u e r y s u m ( ) придумана только в качестве примера того, что можно сделать на лету из Perl. Подпрограмма на Perl подходит, ско рее, для более сложных задач. Например, если нужно отдельно про суммировать данные, выбирая их по регулярному выражению, лучше Мониторинг состояния сервера это сделать из Perl, чем обращаться к серверу и просить его составить таблицы (даже если это можно сделать).

Где выполняется вся работа?

Вопрос, который может возникнуть при написании SQL-прог рамм из Perl, звучит так: «Нужно ли обрабатывать данные на сервере при помощи SQL или на клиенте при помощи Perl?» Час то SQL-функции на сервере (например, SUM()) и операторы Perl пересекаются.

Так, было бы эффективнее использовать ключевое слово DISTINCT, чтобы удалить повторяющиеся записи из возвращаемых дан ных, перед тем как передавать их программе на Perl, даже если эту операцию легко можно выполнить в самом Perl.

К сожалению, существует слишком много переменных, чтобы можно было быстро и точно решить, какой метод применять.

Вот несколько факторов, которые следует учитывать:

• Насколько эффективно сервер обрабатывает определенный запрос?

• Сколько данных обрабатывается?

• Сколько нужно обрабатывать данные и насколько сложна эта обработка?

• Каковы скорость сервера, клиента и сети (если она использу ется)?

• Хотите ли вы, чтобы код можно было перенести на другой сервер баз данных?

Зачастую приходится испытать оба способа, прежде чем сделать выбор.

Наблюдение за использованием процессорного времени на SQL-сервере В последнем примере этой главы DBI будет выводить обновляемую раз в минуту строку состояния, содержащую информацию об использова нии процессорного времени на SQL-сервере. Чтобы сделать задачу бо лее интересной, можно из одного и того же сценария одновременно наблюдать за двумя серверами. Комментарий к сценарию последует позже:

use DBI;

Ssyadmin = "sa";

print "Пароль администратора базы данных Sybase: ";

chomp($sypw = );

Глава 7. Администрирование баз данных SQi Smsadmin = "sa";

print "Пароль администратора базы данных MS-SQL: ";

chomp($mspw = );

tt соединяемся с сервером Sybase Ssydbh = DBI->connect( "dbi : Sybase : serve r=SYBASE", Ssyadmin, $sypw) ;

die "Невозможно соединиться с сервером Sybase: $DBI: :errstr\n" unless (defined $sydbh);

tt включаем параметр ChopBlanks, чтобы удалить концевые пробелы из столбцов $sydbh->{ChopBlanks} = 1;

я соединяемся с сервером MS-SQL (очень здорово, что мы можем и использовать для этого DBD: :Sybase! ) Smsdbh = DBI->connect( "dbi : Sybase : server=MSSQL", Smsadmin, Smspw) ;

die "Невозможно соединиться с сервером mssql: $DBI: :errstr\n" unless (defined Smsdbh);

tt включаем параметр ChopBlanks, чтобы удалить концевые пробелы $msdbh->{ChopBlanks} = 1;

$|=1;

it выключаем буферизацию вывода STDOUT ft инициализируем обработчик сигнала с тем, чтобы можно было в корректно завершиться $SIG{INT} = sub {Sbyebye = 1;

};

if бесконечный цикл, который завершится при установке ft нашего флага прерывания while (1) { last if ($byebye);

ft запускаем хранимую процедуру spjnonitor Ssysth = $sydbh->prepare(q{sp_monitor}) or die "Невозможно подготовить sy spjnonitor:". $sydbh->errstr. "\n";

$systh->execute or die "Невозможно выполнить sy sp_monitor:".$sydbh->errstr. "\n";

tt цикл для получения нужных нам строк.

и мы знаем, что у нас есть все, что нужно, когда мы П получаем информацию cpu_busy while($href = $systh->fetchrow_hashref or $systh->{syb_more_results}) { в есть то, что нужно, перестаем спрашивать last if (defined $href->{cpu busy});

} $systh->finish;

tt заменяем все, кроме %, значениями, которые мы # получили for (keys %{$href» { $href->{$J =' s/.»-(\ tt собираем все нужные нам данные в одну строку $info = "Sybase: (". $href ->{cpu_busy}. " CPU), " "I ^ониторинг состояния сервера "(".$href->{io_busy}. " 10), ".

"(".$href->{idle}. " idle) ";

# отлично, теперь сделаем то же самое и для другого сервера # (MS-SQL) $mssth = $msdbh->prepare(q{sp_monitor}) or die "Невозможно подготовить ms sp_monitor:".$msdbh->errstr. "\n";

$mssth->execute or die "Невозможно выполнить ms sp_monitor:".$msdbh->errstr. "\n";

while($href = $mssth->fetchrow_hashref or $mssth->{sybjnore_results}) { П есть то, что нужно, перестаем спрашивать last if (defined $href->{cpu_busy});

> $mssth->finish;

tt заменяем все, кроме % for (keys %{$href}) { $href->{$_} =- s/.

$info.= "MSSQL: (". $href->{ 'cpu_busy' }. " CPU), ".

"(".$href->{'io_busy'}." 10), ".

"(".$href->{iidle'}." idle)";

print " "x78, "\r";

print $info, "\r";

sleep(5) unless (Sbyebye);

n попадаем сюда, только если мы прервали цикл $sydbh->disconnect;

$msdbh->disconnect;

Сценарий выводит эту строку на экран и обновляет ее каждые пять се кунд:

Sybase: (33% CPU), (33% 10), (0% idle) MSSQL: (0% CPU), (0% 10), (100% idle) Основу данной программы составляет хранимая процедура sp_monitor, существующая как на Sybase-, так и на MS-SQL-сервере. Вывод sp_mo nitor выглядит примерно так:

last_run current_run seconds Aug 3 1998 12:05AM Aug 3 1998 12:05AM cpu_busy io_busy idle 0(0)-0% 0(0)-0% 40335(0)-0% 292 Глава 7. Администрирование баз данных SQ^ packets_received packets_sent packet_errors 1648(0) 1635(0) 0(0) total_read total_write total_errors connections 391(0) 180(0) 0(0) 11(0) К сожалению, spjnonitor показывает непереносимую особенность Sybase, которая прекочевала к MS-SQL: множественные наборы ре зультатов. Каждая из строк возвращается в виде отдельного результа та. Модуль DBD:: Sybase справляется с этим, устанавливая специальный атрибут команды. Вот как возникла эта проверка:

while($href = $systh->fetchrow_hashref or $systh->{syb_more_results}) { и вот почему следовало выйти из цикла до того, как были замечены нужные поля:

# есть то, что нужно, перестаем спрашивать last if (defined $href->{cpu_busy});

Сама программа будет выполняться в вечном цикле до тех пор, пока не получит сигнал прерывания (наиболее вероятно, что это будет нажа тие клавиш + пользователем). Получив такой сигнал, мы делаем самую безопасную вещь из тех, что можно сделать с обработчи ком сигнала, и устанавливаем флаг возврата. Подобную технологию рекомендуют использовать на страницах perlipc для безопасной обра ботки сигналов. После получения сигнала INT будет установлен соот ветствующий флаг, который выбросит нас из цикла на следующей ите рации. Получение этого сигнала позволяет программе «деликатно» закрыть дескрипторы баз данных, перед тем как сбросить «этот брен ный шум о. Эта небольшая программа всего лишь затронула возможности наблю дения за состоянием сервера, доступные нам. Было бы несложно, взяв полученные от sp_monitor результаты, построить график, чтобы полу чить более наглядное представление о том, как используется сервер' Но... оставим заботы об украшательстве читателю.

Текст оригинала «before shuffling off this mortal coil» - почти цитата и монолога Гамлета: «When we have shuffled off this mortal coil...» - в перев° де М. Лозинского эта строка выглядит так: «Когда мы сбросим этот брей ный шум...». — Примеч. ред.

Информация о модулях из этой главы Информация о модулях из этой главы Идентификатор на CPAN Версия Модуль TIMB 1. DBI : :mysql) JWIED 1. MEWP 0. DBD::Sybase W i n 3 2 : :ODBC (с http://www.roth.net) GBARR рекомендуемая дополнительная литература SQL http://w3.one.net/~jhoffman/sqltut.htm - содержит отличное руковод ство по SQL Джеймса Хоффмана (James Hoffman);

в конце руко водства можно найти ссылки на сайты, посвященные SQL.

DBI «Advanced Perl Programming», Sriram Srinivasan (O'Reilly, 1997).

офици http://www.symbolstone.org/technology/perl/DBI/index.html альная домашняя страница DBI;

это должно быть вашей первой ос тановкой.

«Programming the Perl DBI», Alligator Descartes, Tim Bunce (O'Reilly, 2000).

ODBC http://www.microsoft.com/odbc - информация об ODBC от Microsoft.

Можно также поискать информацию об ODBC и о библиотеках ODBC в MDAC SDK на сайте http://msdn.microsoft.com.

http://www.roth.net/perl/odbc/ - официальная страница W i n 3 2 : :ООВС.

«Win32 Perl Programming: The Standard Extensions», Dave Roth (Mac millan Technical Publishing, 1999). Книга автора W i n 3 2 : : ODBC, на нас тоящий момент это лучший справочник по программированию мо дулей для Win32 Perl.

Прочее http://sybooks.sybase.com - вся документация от Sybase с удобным ин терфейсом поиска и простой системой навигации. Иногда бывает полезна не только для решения вопросов по Sybase/MS-SQL,.но и для общих вопросов по SQL.

http://www.mbay.net/~mpeppler/ - домашняя страница Майкла Пепп лера (автора SybPerl и D B D : : Sybase). Содержит информацию не толь ко по Sybase, но и по программированию баз данных в целом.

• Отправка почты • Распространенные ошибки при отправке почты • Получение почты • Информация о модулях из этой главы • Рекомендуемая дополнительная литература Электронная почта В отличие от других глав книги, здесь не обсуждается администриро вание какой-либо службы, технологии или предметной области. Вмес то этого мы собираемся рассмотреть, как использовать электронную почту из Perl в качестве инструмента системного администрирования.

В контексте системного администрирования Perl может быть полезен, как посылая, так и отправляя почту. Электронная почта - это отлич ный способ сообщить о чем-либо: например о том, что в программе про исходит что-то не то;

или о результатах выполнения автоматического процесса (скажем, службы планировщика заданий или сгоп), или об изменениях чего-то, за чем необходимо следить. Мы выясним, как по сылать такую почту из Perl, а также узнаем о некоторых ловушках, связанных с отправкой почты самим себе.

Также мы рассмотрим, применение Perl для обработки входящей поч ты, повышая ее эффективность. Perl поможет бороться со спамом разбираться с вопросами пользователей.

Будем впредь считать, что у вас уже есть надежная, работоспособная почтовая система. Кроме того, будем исходить из того, что в ней при меняются протоколы, соответствующие спецификации IETF для от правки и получения почты. В примерах этой главы используется про токол SMTP (простой протокол передачи почты, RFC821), а сообщения соответствуют RFC822. Но всему свое время.

Отправка почты Начнем с рассмотрения механизмов отправки почты, а затем перейдет к более сложным вопросам. Традиционный (для Unix) Perl-код Отправка почты отправки почты бывает похож на пример, включенный в список часто задаваемых вопросов:

и считаем, что sendmail установлен open(SENDMAIL, "|/usr/lib/sendmail -oi -t -odq") or die "Невозможно запустить процесс для sendmail: $!\n";

print SENDMAIL «"EOF";

From: от кого To: кому Subject: Тема сообщения Тело сообщения следует после пустой строки и может состоять из любого количества строк.

EOF close(SENDMAIL) or warn "Невозможно закрыть sendmail ";

Когда в Perl 5 изменились правила интерполяции масси вов (по сравнению с Perl 4), очень много сценариев, от правляющих почту, перестали работать. Даже сейчас будьте осторожны и следите за таким кодом:

Saddress = "fred@example.com";

Чтобы все работало верно, его надо заменить на одну из следующих строк:

$address="fred\@example.com";

$address='fred@example.com';

$address= join('@', ' f r e d 1, 'example.com');

Код, вызывающий sendmail, как было в нашем примере, во многих случаях будет работать отлично, но если в операционной системе не установлен агент передачи почты с именем «sendmail» (например, в NT или MacOS), он не будет работать никогда. В таких операционных системах выбор действий невелик.

Получение sendmail (или иного агента передачи почты) Если вы работаете на Win32, то вам повезло, т. к. я знаю по крайней мере о трех версиях sendmail, перенесенных под Win32:

о трех версиях sendmail, перенесенных под Win32:

• Перенесенная версия sendmail от Cygwin (http://dome/weeg.ui owa.edu/pub/domestic/sos/ports) • Коммерческая версия sendmail от Mercury Systems (http://www.de mobuilder.com/sendmail.htm) • Коммерческая версия Sendmail for NT от Sendmail, Inc. (http:// www.sendmail.com) 296 Глава 8. Электронная почта Тем, кому нужно что-то менее тяжеловесное и кто хочет внести неко торые изменения в программу на Perl, чтобы поддержать различные аргументы командной строки, возможно, помогут достичь цели дру.

гие программы для Win32:

• blat (http://www.interlog.com/~tcharron/blat.html) • netmail95 (http://www.geocities.com/SiliconValley/Lakes/2382/net mail.html) • wmailto (http://www.impaqcomp.com/jgaa/wmailto.html) Преимущества такого подхода состоят в том, что можно выбросить и сценария все сложности отправки почты. Хороший агент передачи почты (МТА) пытается повторно соединиться с почтовым сервером, ес ли тот в данный момент недоступен, выбирает нужный целевой сервер (ищет записи Mail eXchanger в DNS и осуществляет переходы между ними), при необходимости переписывает заголовки, справляется с внезапными коллизиями и т. д. Если можно избежать необходимости заботиться обо всем этом в Perl, то это просто замечательно.

Использование IPC, специфичных для операционной системы В MacOS или Windows NT можно управлять почтовым клиентом, ис пользуя IPC (Interprocess Communication, межпроцессные взаимо действия).

Я не знаю о существовании версий sendmail для MacOS, но в нем для управления почтовым клиентом можно применять AppleScript:

$to="someone\@example.com";

$from="me\@example.com";

$subject="Hi there";

$body="message body\n";

MacPerl: :DoAppleScript(«EOC);

tell application "Eudora" make message at end of mailbox "out" -- 0 is the current message set field \"fron\" of message 0 to \"$from\" set field \"to\" of message 0 to \"$to\" set field \"subject\" of message 0 to \"$subject\" set body of message 0 to \"$body\" queue message connect with sending without checking quit end tell EOC Отправка почты В этом примере запускается очень простая программа AppleScript, ко торая общается с почтовым клиентом Eudora. Сценарий создает новое сообщение, помещает его в очередь для отправки, а затем отдает ин струкции почтовому клиенту об отправке сообщения из очереди перед выходом.

Еще один, более эффективный способ написать подобный сценарий со стоит в том, чтобы использовать модуль Мае: : Glue, уже рассмотренный в главе 2 «Файловые системы».

use Mac::Glue ':glue';

$e=new Mac::Glue 'Eudora';

$to="someone\@example.com";

$from="me\@example.com";

$subject="Hi there";

$body="message body";

$e->make( new => 'message', at => location(end => $e->obj(mailbox => 'Out')) );

$e->set($e->obj(field => from => message => 0), to => $from);

$e->set($e->obj(field => to => message => 0), to => $to);

$e->set($e->obj(field => subject => message => 0), to => $subject);

$e->set($e->prop(body => message => 0), to => $body);

$e->queue($e->obj(message => 0));

$e->connect(sending => 1, checking => 0);

$e->quit;

В NT можно обратиться к библиотеке Collaborative Data Objects Lib rary (раньше она называлась Active Messaging), простой в использова нии надстройке на архитектуре MAPI (интерфейс прикладного прог раммирования систем передачи сообщений). Вызвать эту библиотеку для управления таким почтовым клиентом, как Outlook можно, при менив модуль W i n 3 2 : ;

OLE следующим образом:

$to="me\@example.com";

$subject="Hi there";

$body="message body\n";

use Win32::OLE;

ft инициализируем OLE и COINIT_OLEINITIALIZE, необходимые при 8 использовании объектов MAPI.Session Win32::OLE->Initialize(Win32::OLE::COINIT_OLEINITIALIZE);

die Win32::OLE->LastError(), "\n" if Win32::OLE->LastError();

ft создаем объект сессии, который вызовет Logoff при уничтожении 298 Глава 8. Электронная почта my Ssession = Win32::OLE->new('MAPI.Session','Logoff');

die Win32::OLE->LastError(),"\n" if Win32::OLE->LastError();

и регистрируемся в этой сессии, используя OL98 Internet Profile по умолчанию $session->Logon('Microsoft Outlook Internet Settings');

die Win32::OLE->LastError(),"\n" if Win32::OLE->LastError();

tt создаем объект message my Smessage = $session->Outbox->Messages->Add;

die Win32::OLE->LastError(),"\n" if Win32::OLE->LastError();

ft создаем объект recipient my $recipient = $message->Recipients->Add;

die Win32::OLE->LastError(),"\n" if Win32::OLE->LastError();

tt заполняем данными объект recipient $recipient->{Name} = $to;

$recipient->{Type} = 1 ;

tt 1 = "To:", 2 = "Cc:", 3 = "Вес:" ft все адреса должны быть расшифрованы по справочнику tt (в этом случае, скорее всего, по вашей адресной книге) tt Полные адреса расшифровываются сами в себя, так что эта ft строка в большинстве случаев не изменит объект recipient $recipient->Resolve();

die Win32::OLE->LastError(),"\n" if Win32::OLE->LastError();

tt заполняем строку Subject: и тело сообщения $message->{Subject} = Ssubject;

$message->{Text} = $body;

и помещаем сообщение в очередь для отправки 8 1-й аргумент = сохранить копию сообщения tt 2-й аргумент = позволить пользователю изменить сообщение tt перед отправкой в диалоговом окне ft 3-й аргумент = родительское окно диалога, если 2-й аргумент True $message->Send(0, О, О);

die Win32::OLE->LastError(),"\n" if Win32::OLE->LastError();

Я явно уничтожить объект Ssession, вызвав $session->Logoff undef Ssession;

В отличие от предыдущего примера, программа всего лишь помещает письмо в очередь. Это уже дело почтового клиента (такого как Outlook) или транспортного агента (например Exchange) периодически иници ировать отправку почты. Существует CDO/AM 1.1 - метод для объекта Session под названием DeliverNowO, обращающийся к MAPI с заданием очистить все очереди входящих и исходящих сообщений. К сожале нию, в некоторых ситуациях он недоступен или не работает, поэтому его нет и в предыдущем примере.

Отправка почты В упомянутом примере управление MAPI производится «вручную» при помощи вызовов OLE. Если вы хотите использовать MAPI, «не пачкая рук», можно применить модуль W i n 3 2 : :МАР1, который берет на себя все функции (модуль находится на http://www.generation.net/ -aminer/Perl/ ).

Программы, полагающиеся на AppleScript/Apple Events или MAPI, так же непереносимы, как и вызов программы sendmail. Они берут на себя часть работы, но относительно неэффективны. К этим методам нужно прибегать в последнюю очередь.

Общение напрямую по почтовым протоколам Последний выбор - написать программу, общающуюся с почтовым сервером на его родном языке. Большая часть этого языка документи рована в RFC821. Вот как выглядит основной обмен данными по SMTP (Simple Mail Transfer Protocol, простой протокол передачи почты).

Данные, которые мы посылаем, выделены жирным шрифтом:

X telnet example.com 25 -- соединяемся с SMTP-портом на example.com Trying 192.168.1.10...

Connected to example.com.

Escape character is ' " ] '.

220 mailhub.example.com ESMTP Sendmail 8. 9. 1 a / 8. 9. 1 ;

Sun, 11 Apr 15:32:16 -0400 (EOT) HELO client.example.com --идентифицируем машину, с которой мы пришли (можно использовать EHLO) 250 mailhub.example.com Hello dnb@client.example.com [192.168.1.11], pleased to meet you MAIL FROM: - определим отправителя 250 ... Sender ok RCPT TO: -- определяем получателя 250 ,.. Recipient ok DATA - начинаем отправлять данные, не забы вая о некоторых ключевых заголовках 354 Enter mail, end with ". " on a line by itself From: David N. Blank-Edelman (David N. Blank-Edelman) To: dnb@example.com Subject: SMTP - хороший протокол Просто хочу напомнить себе о том, насколько я люблю SMTP.

С миром, dNb -- завершаем сообщение 250 РАА26624 Message accepted for delivery -- конец сессии QUIT 221 mailhub.example.com closing connection Connection closed by f o r e i g n host.

300 Глава 8. Электронная поЧТа Несложно записать в сценарий подобную беседу. Можно было бы ис пользовать модуль Socket или что-нибудь вроде N e t : : Telnet, как в главе «Службы каталогов». Но существует несколько хороших модулей д ля отправки почты, которые упрощают эту задачу. Среди них модуль Женды Крыницки (JendaKrynicky) Mail: '.Sender, Mail: :Sendmail Миди вожа Ивковича (Milivoj Ivkovic) и Mail::Mailer из пакета MailToois Грэхема Бара (Graham Barr). Все эти модули не зависят от операцион ной системы и будут работать практически везде, где доступен совре менный дистрибутив Perl. Мы рассмотрим Mail::Mailer, поскольку он предлагает единый интерфейс к двум способам отправки почты, кото рые обсуждались до сих пор. Как и в случае с большинством модулей написанных в объектно-ориентированном стиле, первый шаг заклю чается в создании экземпляра нового объекта:

use Mail::Mailer;

$from="me\@example.com";

$to="you\@example.com";

$subject="Hi there";

$body="message body\n";

$type="smtp";

$server="mail.example.com";

my Smaller = Mail::Mailer->new($type, Server => Sserver) or die "Невозможно создать новый объект mailer:$!\n";

Переменная $type позволяет выбрать один из следующих типов пове дения:

smtp Посылает почту, обращаясь к модулю N e t : : SMTP (часть пакета lib net), доступному и для большинства не-Unix версий Perl. Если ис пользуется MailToois версии 1.13 или выше, можно задать имя SMTP-сервера, применяя приведенную выше символику =>. В про тивном случае, придется устанавливать имя сервера во время про цедуры установки libnet.

mail Отправка почты при помощи почтового агента mall (или любого другого, который задан вторым необязательным аргументом). Это напоминает недавнее использование AppleScri.pt и MAPI.

sendmail Отправка почты с помощью программы sendmail, как и в первом случае из данного раздела.

Кроме того, можно установить переменную окружения PERL_MAILERS, чтобы изменить путь, установленный по умолчанию для поиска прог рамм (например, sendmail) в системе.

распространенные ошибки при отправке почты Вызов метода open () для нашего объекта Mai Г. -.Mailer заставляет послед ний выполнять роль дескриптора для исходящего сообщения. В этом вызове передаются заголовки сообщения ссылке на анонимный хэш:

$mailer->open({From => $from, То => $to, Subject => $subject}> or die "Невозможно заполнить объект mailer:$!\n";

Тело сообщения выводится в этот псевдодескриптор, который потом закрывается для отправки сообщения:

print Smailer Sbody;

$mailer->close;

Этого вполне достаточно, чтобы отправка почты из Perl не зависела от системы.

В зависимости от того, какой тип поведения $type был выбран при ра боте с модулем, могут оказаться скрытыми (а могут и не оказаться) бо лее сложные вопросы, относящиеся к МТА, о которых уже говори лось. В предыдущем примере использовалось поведение smtp, а это оз начает, что программа должна быть достаточно умна, чтобы обрабаты вать такие сбои как недоступность сервера. Приведенный пример не настолько «сообразителен». Обязательно позаботьтесь о таких момен тах, когда будете писать программы.

Распространенные ошибки при отправке почты Что ж, можно приступить к использованию электронной почты для отправки извещений. Однако когда мы начнем писать программы для выполнения этой функции, то быстро обнаружим, что вопрос как посы лать почту, отнюдь не так интересен, как вопросы когда и что посылать.

В данном разделе мы исследуем эти вопросы, действуя «от противно го». Если рассмотреть, что и как не надо посылать, то сами вопросы можно изучить глубже. Так что поговорим об ошибках, допускаемых наиболее часто при написании программ системного администрирова ния, отправляющих почту.

Слишком частая отправка сообщений Самая распространенная ошибка- это отправка слишком большого количества сообщений. Иметь сценарии, отправляющие почту, вооб ще говоря, отличная идея. Если с какой-либо службой случится что-то неприятное, то отправка обычного электронного сообщения или сооб щения на пейджер - очень хороший способ привлечь внимание чело 302 Глава 8. Электронная почта века к случившейся проблеме. Но в большинстве случаев, раз в пять минут отправлять по сообщению о неприятностях - это очень плох0е решение. Слишком усердные почтовые генераторы очень быстро попа дают в почтовые фильтры тех, кто должен был их читать. В результате оказывается, что важная почта просто игнорируется.

Контроль над частотой отправки почты Самый простой способ избежать лишней почты - добавить в програм му меры предосторожности, чтобы устанавливать задержку между со общениями. Если сценарий запущен постоянно, то очень просто за помнить время отправки последнего сообщения:

$last_sent = time;

Если программа запускается один раз в N минут или часов через сгоп в Unix или механизмы планирования задач NT, эту информацию можно переписать в файл, состоящий из одной строки, и считывать его при следующем запуске программы. В подобном случае обязательно обра тите внимание на меры предосторожности, перечисленные в главе «Введение».

В зависимости от ситуации можно поэкспериментировать с временем задержки. В этом примере показана экспоненциальная задержка (ex ponential backoff):

$max = 24*60*60;

# максимальная задержка в секундах (1 день) $unit = 60;

# увеличиваем задержку относительно этого значения ( минута) # интервал времени, прошедший с момента отправки предыдущего # сообщения и последняя степень 2, которая использовалась для # расчета интервала задержки. Созданная нами подпрограмма # возвращает ссылку на анонимный массив с этой информацией sub time_closure { my($stored_sent,$stored_power)=(0,-1);

return sub { (($stored_sent,$stored_power) = @_) if @_;

[$stored_sent,$stored_power];

};

$last_data=&time_closure;

# создаем замыкание # возвращаем значение "истина" при первом вызове и затем после 8 задержки sub expbackoff < my($last_sent,$last_power) = @{&$last_data};

# возвращаем true, если это первое наше обращение или если # текущая задержка истекла с тех пор, как мы спрашивали 5|н1ространенные ошибки при отправке почты И последний раз. Если мы возвращаем значение true, мы # запоминаем время последнего утвердительного ответа и и увеличиваем степень двойки, чтобы вычислить задержку, if (!$last_sent or ($last_sent + (($unit * 2**$last_power >= $max) ?

$max : $unit » 2**$last_power) <= &$last_data(time(),++$last_power);

return 1;

} else { return 0;

Подпрограмма expbackoff() возвращает значение t r u e (1), если нужно отправить сообщение, и false (0), если нет. При первом вызове она воз вращает true, а затем быстро увеличивает время задержки до тех пор, пока значение t r u e не станет появляться лишь раз в день.

Чтобы сделать программу более интересной, я применил необычную конструкцию под названием замыкание (closure) для хранения време ни последней отправки сообщения и последней степени двойки, ис пользуемой для расчета задержки. Замыкание используется как спо соб скрытия важных переменных от остальной программы. В данной маленькой программе это было сделано из любопытства, но польза от такой технологии очень быстро становится очевидной в программах большего размера, где более вероятно, что другой код может случайно перезаписать значения этих переменных. Вот, вкратце, как работают замыкания.

Подпрограмма &time_closure() возвращает ссылку на анонимную под программу, по существу, на небольшой отрывок кода без имени. Поз же данная ссылка будет вызывать этот код, используя стандартный синтаксис символических ссылок: &$last_data. Код из анонимной под программы возвращает ссылку на массив, поэтому и используется та кая масса знаков пунктуации, чтобы получить доступ к возвраща емым данным:

my($last_sent,$last_power) = @{&$last_data};

Вот и вся тайна, которая скрывается за замыканиями: поскольку ссылка создается в том же блоке, что и переменные $stored_sent и $sto red_power (посредством my()), то они схватываются в уникальном кон тексте. Переменные $stored_sent и $stored_power можно прочитать и из менить только при выполнении кода из этой ссылки. Кроме того, они сохраняют свои значения между вызовами. Например:

# создаем замыкание $last_data=&time_closure;

304 Глава 8. Электронная почта # вызываем подпрограмму, устанавливающую значения переменных &$last_data(1,1);

№ пытаемся изменить их за пределами подпрограммы $stored_sent = $stored_power = 2;

Я выводим их текущие значения, используя подпрограмму print "@{&$last_data}\n";

Результатом выполнения этого кода будет "1 1 ", хотя и создается впе чатление, что в третьей строке были изменены значения переменных $stored_sent и $stored_power. Да, значения глобальных переменных с теми же именами были изменены, но невозможно затронуть копии, за щищенные замыканиями.

Можно говорить о переменной из замыкания как о спутнике на орбите планеты. Спутник удерживается гравитацией планеты, так что куда,)Г| движется планета, туда перемещается и спутник. Позицию спутника можно описать только относительно планеты: чтобы найти спутник, сначала нужно отыскать планету. Каждый раз, когда вы находите планету, там же будет и спутник, на том же месте, где был и прошлый раз. Можно считать, что переменные из замыкания находятся на орби те вокруг ссылки на анонимную подпрограмму, отдельно от вселенной остальной программы.

Но оставим астрофизику в покое и вернемся к рассуждениям об от правке почты. Иногда лучше, чтобы программа вела себя как двухлет ний ребенок, жалующийся с течением времени все чаще. Вот еще одна программа, похожая на предыдущий пример. На этот раз со временем увеличивается количество дополнительно посылаемых сообщений.

Начинаем мы с отправки сообщений один раз в день, а затем уменьша ем время задержки до тех пор, пока минимальная задержка не станет равной пяти минутам:

$лш = 60*60*24;

и максимальная задержка в секундах (1 день) $min = 60*5;

# минимальная задержка в секундах (5 минут) $unit = 60;

и уменьшаем задержку относительно этого значения (1 минута $start_power = int log($max/$unit)/log(2);

и ищем ближайшую степень двойки sub time_closure { my($last_sent, $last_power)=(0,$start_power+1);

return sub { (($last_sent,$last_power) = @_) if @_;

и keep exponent positive $last_power = ($last_power > 0) ? $last_power : 0;

[$last_sent,$last_power];

$last_data=&time_closure;

# создаем замыкание распространенные ошибки при отправке почты # возвращаем true при первом вызове и затем после роста # экспоненты sub exprampup { my($last_sent,$last_power) = @{&$last_data};

# возвращаем true, если это первое обращение или если # текущая задержка истекла с момента последнего обращения, ft Если сообщение отправляется, то мы запоминаем время # последнего ответа и увеличиваем степень 2, используемую « для расчета задержки if (!$last_sent or ($last_sent + (($unit * 2**$last_power <= $min) ?

$min : $unit * 2**$last_power) <= &$last_data(time(),++$last_power1);

return 1;

} else { return 0;

В обоих примерах вызывалась дополнительная подпрограмма (&$last_data), которая позволяла выяснить, когда было отправлено последнее сообщение и как вычислялась задержка. Позже, при необ ходимости изменить программу, такое деление позволит изменить способ хранения состояния. Например, если переписать программу так, чтобы она выполнялась периодически, а не постоянно, то замыка ние совсем нетрудно заменить обычной подпрограммой, сохраняющей нужные данные в текстовом файле и потом считывающей их оттуда.

Контролируем количество сообщений Другая разновидность синдрома «чрезмерной отправки почты» - это проблема «каждый в сети за себя». Если все машины из сети решат пос лать вам чуточку почты, вы вполне можете пропустить что-то действи тельно важное в этом потоке сообщений. Было бы лучше, если бы все сообщения отправлялись в центральный репозиторий. А затем в соб ранном виде почта поступала бы в одном сообщении.

Давайте рассмотрим несколько надуманный пример. Предположим, что каждая машина в сети записывает в разделяемый каталог файл, состоящий из одной строки. 2 Имя каждого файла совпадает с именем машины и в каждом из них хранятся результаты научных вычисле В тексте оригинала «--$last_power». Изменено в соответствии с логикой из ложения. - Примеч. науч. ред.

Другое подходящее место для подобной информации - база данных.

306 Глава 8. Электронная почта ний, сделанных прошлой ночью. В файле будет одна строка следующе го формата:

имя-узла удача-или-неудача количество-завершенных-вычислений Программа, проверяющая эту информацию и отсылающая результа ты, может выглядеть так:

use Mail: : Mailer;

use Text: :Wrap;

ft список машин, отправляющих сообщения $repolist = "/project/machinelist";

ft каталог, куда они записывают файлы Srepodir = "/project/reportddir";

ft разделитель файловой системы, используется для переносимости.

ft Можно было бы использовать модуль File: :Spec $separator= "/";

# отправляем почту "с" этого адреса $reportf romaddr = "project\@example.com";

# отправляем почту на этот адрес $reporttoaddr = "project\@example.com";

ft считываем список машин в хэш. Позже будем вынимать из этого ft хэша по мере доклада машин, оставив только те машины, которые ft не принимали участие в действии open(LIST, $repolist) or die "Невозможно открыть список $repolist:$!\n";

while(){ chomp;

$missing{$_}=1;

$machines++;

ft считываем все файлы из центрального каталога ft замечание: этот каталог должен автоматически очищаться другим ft сценарием opendir(REPO, $repodir) or die "Невозможно открыть каталог $repodir:$!\n";

while(defined($statfile=readdir(REPO))){ next unless -f $repodir.$separator.$statfile;

ft открываем каждый файл и считываем информацию о состоянии open(STAT, $repodir. $separator. $statf ile) or die "Невозможно открыть $statfile:$!\n";

chomp($report = );

(Shostname, Sresult, $details)=split( ' ', Sreport, 3);

warn "В файле $statfile утверждается, что он был сгенерирован машиной Shostname! \n" if($hostname ne $statfile);

распространенные ошибки при отправке почты # имя узла больше не считается пропущенным delete $missing{$hostname};

и заполняем значениями хэши if ($result eq "success")!

$success{$hostname}=$details;

$succeeded++;

} else { $fail{$hostname}=$details;

$failed++;

} close(STAT);

} closedir(REPO);

# создаем информативный заголовок для сообщения if (Ssucceeded == $machines){ $subject = "[report] Success: Smachines";

> elsif (Sfailed == $machines or scalar keys %missing >= Smachines) { Ssubject = "[report] Fail: $machines";

} else { Ssubject = "[report] Partial: Ssucceeded ACK, Sfailed NACK".

((%missing) ? ", ".(scalar keys %missing)1. " MIA" : " ) ";

П создаем объект mailer и заполняем заголовки $type="sendmail";

my $mailer = Mail: :Mailer->new($type) or die "Невозможно создать новый объект :$!\п" ;

$mailer->open({From=>$reportfromaddr, To=>$reporttoaddr, Subject=>$subject}) or die "Невозможно заполнить объект mailer:$!\n";

# создаем тело сообщения print Smaller "Run report from $0 on ". scalar localtime(time). "\n";

if (keys %success){ print Smaller "\n==Succeeded==\n";

foreach Shostname (sort keys %success){ print Smaller "Shostname: $success{$hostname}\n";

Наличие скобок обязательно из-за приоритета операций, выявлено при компиляции. - Примеч. науч. ред.

308 Глава 8. Электронная почта if (keys %fail){ print Smaller "\n==Failed==\n";

foreach $hostname (sort keys %fail){ print Smaller "Shostname: $fail{$hostname}\n";

if (keys %missing){ print Smaller "\n==Missing==\n";

print Smaller wrapf"', "", join(" ".sort keys %missing)), "\n";

it отправляем сообщение $mailer->close;

Сначала программа считывает список имен машин, участвующих в данном предприятии. Затем, чтобы проверить, встречались ли маши ны, не поместившие файл в общий каталог, используется хэш, создан ный на основе этого списка. Мы открываем каждый файл из данного каталога и выделяем из него информацию о состоянии. Получив ре зультаты, создаем сообщение и отправляем его.

Получается такой отчет:

Date: Wed, 14 Apr 1999 13:06:09 -0400 (EOT) Message-Id : <1 99904141706. NAA08780@example. com> Subject: [report] Partial: 3 ACK, 4 MACK, 1 MIA To: project@example.com From: project@example.com Run report from reportscript on Wed Apr 14 13:06:08 ==Succeeded== barney: computed 23123 oogatrons betty: computed 6745634 oogatrons fred: computed 56344 oogatrons ==Failed== bambam: computed 0 oogatrons dino: computed 0 oogatrons pebbles: computed 0 oogatrons wilma: computed 0 oogatrons ==Missing== mrslate Другой способ изучить подобные результаты состоит в том, чтобы со здать демон журналов регистрации и посылать отчет от каждой машИ' ны через сокет. Сначала взгляните на код для сервера. Он совпадает с кодом из предыдущего примера. Рассмотрим новую программу и обсу дим ее важные особенности:

Распространенные ошибки при отправке почты : use 10::Socket;

use Text::Wrap;

# используется для создания аккуратного вывода # список машин, посылающих отчеты Srepolist = "/project/machinelist";

# номер порта для соединения с клиентами Sserverport = "9967";

&loadmachines;

tt загружаем список машин # настраиваем нашу сторону сокета $reserver = 10::Socket::INET->new(LocalPort => $serverport, Proto => "tcp", Type => SOCK_STREAM, Listen => 5, Reuse => 1) or die "Невозможно настроить сокет на нашей стороне: $!\п";

# начинаем слушать порт в ожидании соединений while(($connectsock,$connectaddr) = $reserver->accept()){ # имя подсоединившегося клиента $connectname = gethostbyaddr((sockaddr_in($connectaddr))[1],AF_INET);

chomp($report=$connectsock->getline);

($hostname,$result,$details)=split(' ',$report,3);

# если нужно сбросить информацию, выводим готовое к # отправке сообщение и заново инициализируем все Я хэши/счетчики if (Shostname eq "DUMPNOW"){ &printmail($cormectsock);

close($connectsock);

undef %success;

undef %fail;

Ssucceeded = $failed = 0;

&loadmachines;

next;

warn "$connectname говорит, что был сгенерирован $hostname!\n" if($hostname ne Sconnectname);

delete $missing{$hostname};

if (Sresult eq "success"){ $success{$hostname}=$details;

$succeeded++;

} else { $fail{$hostname>=$details;

$failed++;

310 _ ^ Глава 8. Электронная почта close($connectsock);

} close($reserver);

tt загружаем список машин из заданного файла sub loadmachines { undef %missing;

undef Smachines;

open(LIST, Srepolist) or die "Невозможно открыть список $repolist:$!\n" while(){ chomp;

$missing{$_}=1;

$machines++;

и выводим готовое к отправке сообщение. Первая строка - тема, и последующие строки - тело сообщения sub printmail{ ($socket) = $_[0];

if (Ssucceded == $machines){ Ssubject = "[report] Success: $machines";

} elsif ($failed == Smachines or scalar keys %missing >= Smachines) { Ssubject = "[report] Fail: $machines";

} else { Ssubject = "[report] Partial: Ssucceeded ACK, Stalled NACK".

((%missing) ? ", ".(scalar keys %missing)V MIA" : "");

print Ssocket "$subject\n";

print Ssocket "Run report from $0 on ".scalar localtime(time)."\n";

if (keys %success){ print Ssocket "\n==Succeeded==\rf;

foreach Shostname (sort keys %success){ print Ssocket "Shostname: $success{$hostname}\n";

if (keys %fail){ print Ssocket "\n==Failed==\n";

foreach Shostname (sort keys %fail){ Наличие скобок обязательно из-за приоритета операций, выявлено компиляции. - Примеч. науч. ред.

распространенные ошибки при отправке почты print Ssocket "$hostname: $fail{$hostname}\n";

if (keys %missing){ print $socket "\n==Missing==\n";

print Ssocket wrapf", "", join(" ",sort keys %missing)), "\n";

Кроме переноса части кода в отдельные подпрограммы, главное изме нение заключается в том, что добавлен код для работы с сетью. Модуль 10 : : Socket позволяет без труда открывать и использовать сокеты, кото рые можно сравнить с телефоном. Сначала нужно установить свою сторону сокета (10: : Socket ->new()), как бы включая свой телефон, а за тем ждать «звонка» от клиента (10 : : Socket->accept( )). Программа при остановлена (или «заблокирована») до тех пор, пока не установлено соединение. Когда соединение установлено, запоминается имя подсо единившегося клиента. Затем из сокета считывается строка ввода.

Мы предполагаем, что строка ввода выглядит точно так же, как и строки из отдельных файлов в предыдущем примере. Единственное различие - это загадочное имя узла DUMPNOW. Если это имя встре чается, подсоединившемуся клиенту выводится тема и тело готового к отправке сообщения, при этом сбрасываются все счетчики и хэш-таб лицы. За отправку сообщения, полученного от сервера, ответственен клиент. Теперь посмотрим на пример клиента и узнаем, что он может сделать с этим сообщением:

use 10: :Socket;

# номер порта для соединения с клиентом Sserverport = "9967";

tt и имя сервера Sservername = "reportserver";

# преобразуем имя в IP-адрес Sserveraddr = inet_ntoa(scalar gethostbyname($servername));

Sreporttoaddr = "project\@exairiple.com";

Sreportf romaddr = "project\@example.com";

$reserver = 10: :Socket: :INET->new(PeerAddr => Sserveraddr, PeerPort => $serverport, Proto => "tcp", Type => SOCK_STREAM) or die "Невозможно создать сокет на нашей стороне:: $!\п";

if ($ARGV[0] ne "-m"){ print $reserver $ARGV[0];

312 Глава 8. Электронная почта else { use Mail:

-.Mailer;

print $reserver "DUMPNOW\n";

chomp($subject = <$reserver>);

$body = join("",<$reserver>);

$type="sendmail";

my $mailer = Mail: :Mailer->new($type) or die "Невозможно создать новый объект mailer :$!\n";

$mailer->open({ From => $reportf romaddr, To => Sreporttoaddr, Subject => Ssubject }) or die "Невозможно заполнить объект mailer :$!\n";

print Smaller $body;

$mailer->close;

close($reserver);

Эта программа проще. Сначала открывается сокет с сервером. В боль шинстве случаев ему передается информация о состоянии (полученная в командной строке как $ARGV[0]) и соединение закрывается. При же лании создать клиент-серверную систему регистрации, подобную этой, вероятно, нам пришлось бы перенести данный клиентский код в подпрограмму и вызывать ее из другой, гораздо более крупной.

Если передать сценарию ключ -т, он отправит серверу «DUMPNOW» и прочитает полученную от него строку темы сообщения и тело сооб щения. Затем этот вывод передается модулю Mail: : Mailer и отправля ется в виде почтового сообщения при помощи той же программы, кото рую мы видели раньше.

Для ограничения размера примера и для того, чтобы не уходить в сто рону от дискуссии, здесь представлен лишь костяк кода для клиента и сервера. В нем нет ни проверки ошибок или ввода, ни управления дос тупом, ни авторизации (в сети любой, получивший доступ к серверу» может взять с него данные), ни постоянного хранилища данных (а что, если машина не работает?), ни даже мало-мальских мер предосторож ности. Мало того, в каждый момент времени можно обрабатывать только один запрос. Если клиент остановится в середине транзакций, мы «влипли». Более изощренные примеры можно найти в книгах «Advanced Perl Programming» (Углубленное программирование на Perl) Шрирама Шринивасана (Sriram Srinivasan) и «Perl Cookbook» («Perl: Библиотека программиста») Тома Кристиансена (Tom Christi ansen) и Натана Торкингтона (Nathan Torkington), обе выпущены Распространенные ошибки при отправке почты тельством O'Reilly. Модуль N e t : : Daemon Джошена Вьедмана (Jochen Wi edmann) также поможет создавать более сложные программы-демоны.

Однако пора вернуться к рассмотрению других ошибок, допускаемых в программах для системного администрирования, отправляющих поч товые сообщения.

Пропуск темы сообщения Строка Subject:- это такая «вещица», которую не стоит пропускать.

При автоматической отправке почты можно на лету создавать инфор мативную строку Subject: для каждого сообщения. Так что практичес ки нет прощения тому, кто отправляет в почтовый ящик сообщения с заголовками:

Super-User File history database merge report Super-User File history database merge report Super-User File history database merge report Super-User File history database merge report Super-User File history database merge report Super-User File history database merge report Super-User File history database merge report в то время как они могли бы выглядеть так:

Super-User Backup OK, 1 tape, 1.400 GB written.

Super-User Backup OK, 1 tape, 1.768 GB written.

Super-User Backup OK, 1 tape, 2.294 GB written.

Super-User Backup OK, 1 tape, 2.817 GB written.

Super-User Backup OK, 1 tape, 3.438 GB written.

Super-User Backup OK, 3 tapes, 75.40 GB written.

Строка Subject: должна содержать краткую и четкую информацию, описывающую происходящее. Из темы сообщения должно быть оче видно, докладывает ли программа об успехе, неудаче или о чем-то среднем. Незначительные добавочные усилия с лихвой окупаются экономией времени при чтении почты.

Недостаточная информация в теле сообщения Эта ошибка попадает в ту же категорию, что и предыдущая. Если сце нарий собирается сообщать о проблемах или ошибках в почтовых сооб щениях, значит сгенерировать какую-то информацию, которая долж на там присутствовать. Они сводятся к каноническим вопросам жур налистики:

Кто?

Какой сценарий сообщает об ошибке? Добавьте содержимое пере менной $0 (если не устанавливали ее явно), чтобы показать полный 314 Глава 8. Электронная почта путь к текущему сценарию. Сообщите о версии сценария, если та ковая у него имеется.

Где?

Сообщите что-то о том месте в сценарии, где возникает проблема.

Функция са!1ег() из Perl возвращает всю нужную для этого инфор мацию:

и замечание: то, что возвращает caller(), может зависеть от # версии Perl, так что обязательно загляните в документацию по Я perlfunc (Spackage, Sfilename, $Hne, Ssubroutine, $hasargs, $wantarray, Sevaltext, $is_require) = caller($frames);

Где $f rames - это количество нужных фреймов на стеке (если вызы вались подпрограммы из подпрограмм). Чаще всего вы будете уста навливать $ frames в 1. Вот пример списка, возвращаемого функцией caller() в середине кода для сервера из последнего полного примера:

('main','repserver',32,'main::printmail',1,undef) Подобная запись указывает, что сценарий, запущенный из файла repserver в строке 32, находился в пакете main. В этот момент выпол нялся код из подпрограммы m a i n : : p r i n t m a i l (у нее есть аргументы, кроме того, она не вызывается в списочном контексте).

Если вы не хотите вручную применять callerQ, можете воспользо ваться отчетом о проблемах, предоставляемым модулем Сагр.

Когда?

Опишите состояние программы в момент возникновения ошибки.

К примеру, какой была последняя строка прочтенных данных?

Почему?

Если сумете, ответьте на незаданный читателем вопрос: «Зачем бес покоить меня этим почтовым сообщением?» Ответ может быть очень простым, например: «данные об учетных записях не были полностью обработаны», «DNS-сервер сейчас недоступен» или «в серверной пожар». Это даст читающему представление о предмете разговора (и, возможно, побудит к изучению).

Что?

Ну и наконец, надо сказать о том, что же пошло не так раньше всего.

Вот небольшой пример на Perl, который охватывает все эти пункты:

use Text::Wrap;

sub problemreport { # Sshortcontext - описание проблемы в одной строке # Susercontext - подробное описание проблемы (Получение почты # $nextstep - лучшее предположение о том, что делать, чтобы исправить проблему my($shortcontext, Susercontext, Snextstep) = @_;

my($filename, Sline, Ssubroutine) = ( c a l l e r ( 1 ) ) [ l, 2, 3 ] ;

push (@return, "Проблема с $filename: $snortcontext\n");

push(@return, "*** Сообщение о проблеме с $filename ***\n\n");

push(@return,fill("", "", "- Проблема: Susercontext"). "\n\n");

push(@return, "- Место: строка $line файла Sfilename в $subroutine\n\n");

push(@return, "- Произошла: ".scalar localtime(time). "\n\n");

push(@return, "- Дальнейшие действия: $nextstep\n");

\@return;

sub fireperson { $report = &problemreport(" компьютер горит ",«EOR,«ON);

При составлении отчета загорелась задняя часть компьютера. Случилось это сразу же после обработки пенсионного плана для ORA.

EOR Пожалуйста, потушите пожар, а потом продолжайте работу.

EON print @{$report};

ifireperson;

Обращение к Sproblem report выведет, начиная с темы сообщения, отчет о проблеме, согласующийся с Mail : : Mailer, как и в предыдущих приме рах. Ну a & f i r e p e r s o n является примером тестирования этой подпро граммы.

Теперь, разобравшись с отправкой почты, перейдем к другой стороне медали.

Получение почты Обсуждая в этом разделе получение почты, мы не будем говорить о ее сборе (fetching). Передача почты с одной машины на другую не пред ставляет особого интереса. Модули M a i l : :POP3Client Сина Дауда (Sean Dowd) и Mail: :Cclient Малколма Битти (Malcolm Beattie) легко могут передать почту по протоколам POP (Post Office Protocol) или IMAP (In ternet Message Access Protocol). Гораздо интереснее посмотреть, что с этой почтой делать после ее получения, и именно на этом мы и остано вимся.

316 Глава 8. Электронная почта Начать следует с основ, поэтому рассмотрим инструменты, позволяю щие разбить как отдельные сообщения, так и почтовые ящики. Чтобы рассмотреть первое, вновь обратимся к пакету MailTools Грэма Бара (Graham Barr), на этот раз прибегнем к модулям Mail: :Internet и Ma il: :Header.

Разбиение отдельных сообщений Модули Mail: '.Internet и Mail::Header предлагают удобный способ раз бить заголовки почтового сообщения, соответствующего RFC822.

RFC822 определяет формат почтового сообщения, включая имена до пустимых заголовков и их форматов.

Модулю M a i l : : Internet необходимо передать либо файловый дескриптор файла с сообщением, либо ссылку на массив, содержащий его строки:

use Mail::Internet;

$messagefile = "mail";

open(MESSAGE,"$messagefile") or die "Невозможно открыть $messagefile:$!\n";

$message = new Mail:'.Internet \*MESSAGE;

close(MESSAGE);

Если мы хотим анализировать сообщение, поступающее в стандартный поток ввода (т. е. переданное через конвейер на стандартный ввод), можно поступить так:

use Mail::Internet;

$message = new Mail::Internet \*STDIN;

M a i l : : Internet возвращает экземпляр объекта сообщения. Чаще всего с этим экземпляром объекта будет применяться один из двух методов:

body() и head(). Метод body() возвращает ссылку на анонимный массив, содержащий строки тела сообщения. head() более интересен и предла гает плавное продолжение модуля M a i l : : Header.

При загрузке Mail: :Internet неявно загружается Mail::Header. Если вызвать метод head() модуля Mail:'.Internet, он вернет экземпляр объекта заголовка Mail::Header. Это будет тот же экземпляр объекта, который можно получить, если использовать не M a i l : :Internet, а на прямую M a i l : : H e a d e r :

use Mail::Header;

Smessagefile = "mail";

open(MESSAGE,"Smessagefile") or die "Невозможно открыть $messagefile:$!\n $header = new Mail::Header VMESSAGE;

close(MESSAGE);

Объект $header содержит заголовки сообщения и предлагает нескольК удобных способов для получения данных. Например, чтобы вывести Получение почты отсортированный список встречающихся имен заголовков (которые в модуле называются «тегами»), можно добавить такую строчку в конец предыдущего примера:

print join("\n".sort $header->tags);

В зависимости от сообщения можно увидеть что-то подобное нижесле дующему:

Сс Date From Message-Id Organization Received Reply-To Sender Subject To Необходимо получить все заголовки Received: из сообщения. Вот как это можно сделать:

©received = $header->get("Received");

Часто методы M a i l : : H e a d e r используются вместе с объектом M a i l : : I n ternet. Если применять M a i l : : I n t e r n e t для возвращения объекта, со держащего и тело и заголовки сообщения, можно сцепить вместе неко торые методы из этих модулей:

©received = $message->head->get("Received");

Обратите внимание, что get ()вызывается в списочном контексте. В ска лярном контексте метод вернул бы только первое вхождение этого те га, в случае, если бы мы не задали вторым аргументом порядковый но мер тега. Например, get ("Received", 2) вернет вторую строку Received:

из сообщения. Модуль Mail: : Header предоставляет и другие методы для удаления и добавления тегов в заголовки;

подробную информацию можно найти в документации.

Разбиение почтового ящика Перейти на следующий уровень, где мы разобьем на части почтовые ящики, довольно просто. Если почта хранится в формате «классичес кого mbox» или qmail (еще один агент передачи почты, подобный sendma.il), можно использовать модуль M a i l : : Folder Кевина Джонсона (Kevin Johnson). Многие из распространенных почтовых агентов (не в Unix), таких как Eudora, тоже хранят почту в классическом формате Unix mbox, так что этот модуль может быть полезным на многих плат формах.

318 Глава 8. Электронная почт;

;

Что-то подобное мы уже видели:

use Mail::Folder::Mbox;

и для классического формата Unix mbox Sfolder = new Mail::Folder('mbox',"filename");

Конструктор new() принимает тип формата почтового ящика и имя файла для анализа. Он возвращает экземпляр объекта folder, через ко торый можно запрашивать, добавлять, удалять и изменять сообщения Чтобы получить шестое сообщение, нужно применить следующее:

Smessage = $folder->get_message(6);

Теперь Smessage содержит экземпляр объекта M a i l : : I n t e r n e t. С этим эк земпляром объекта можно применять все только что обсужденные мето ды. Если вам нужен только заголовок сообщения, можно использовать:

$header = $folder->get_header(6);

Здесь нет никаких сюрпризов;

возвращается ссылка на экземпляр объекта M a i l : : H e a d e r. Чтобы узнать о других доступных методах, за гляните в документацию по Mai 1:: Folde r.

Отслеживание спама Теперь, когда мы знаем, как можно разбить на части сообщение, по смотрим, что делать с этим умением на практике. Первое, что можно рассмотреть, - это непрошеная коммерческая электронная почта, или спам. Большинству пользователей не нравится получать такие сооб щения. Системные администраторы не любят спам за то, что он попус ту забивает каталоги почтовых очередей и журналы регистрации.

Кроме того, каждое непрошеное коммерческое письмо вызывает недо вольство пользователей, так что в почтовом ящике системного адми нистратора на каждое письмо «из спама» зачастую приходится более десятка возмущенных писем от пользователей.

Лучший способ сдерживать подобный напор- создать такую «атмос феру», в которой спам недопустим и, помимо этого, его очень сложно посылать. Жалобы интернет-провайдеру спамера (у большинства из которых определены строгие правила на этот счет) часто приводят к тому, что виновнику отказывают в услугах. Если это происходит вновь и вновь, то со временем спамеру все сложнее найти провайдера. А чем сложнее спамеру продолжать свое дело, тем меньше вероятность, что он в нем останется.

Жалобы провайдерам затруднены по следующим причинам:

• Спамеры часто подделывают часть своих сообщений, пытаясь скрыть следы. Сам по себе этот факт является еще одной причиной не любить спамеров. В конце концов, это красноречиво говорит об их намерениях.

Получение почты • Спамеры часто посылают свою «макулатуру» через посторонние (и совершенно невинные, но неверно настроенные почтовые серверы).

Этот процесс называется «ретрансляцией» (relaying), поскольку в большинстве случаев такая почта ни исходит от кого-либо с такого сервера, ни предназначена кому-либо там. Почтовый сервер высту пает лишь в качестве передатчика. Системные администраторы серверов, допускающих ретрансляцию, часто оказываются в слож ном положении. Их атакованные почтовые серверы начинают стра дать от непредвиденных загрузок (вероятно, в ущерб полезным службам), имена их серверов попадают в черные списки и довольно большая часть почты «проникнута» ненавистью тех, кто подвергся «атаке» спамера.

С помощью Perl можно проанализировать сообщение и найти его источ ник. Начнем мы с малого и затем перейдем к более сложным вопросам, применяя то, что узнали в главе 5 «Службы имен TCP/IP» и главе 6.

Если читателю хочется посмотреть на очень сложный Perl-сценарий для борьбы со спамом, советую взглянуть на adcomplain Билла Макфад дена (Bill McFadden), который можно найти на http://www.rdrop.com/ users/billmc/adcomplain.html.

Вот копия настоящего спамерского сообщения, тело которого измене но, чтобы не доставить его автору удовольствия:

Received: from isiteinc.com (www.isiteinc.com [206.136.243.2]) by mailhost.example.com (8.8.6/8.8.6) with ESMTP id NAA for ;

Fri, 7 Аид 1998 13:55:41 -0400 (EOT) From: responses@example.com Received: from extreme (host-209-214-9-150.mia.bellsouth.net [209.214.9.150]) by isiteinc.com (8.8.3/8.8.3) with SMTP id KAA19050 for webadmin@example.com;

Fri, 7 Аид 1998 10:48:09 -0700 (EOT) Date: Fri, 7 Аид 1998 10:48:09 -0700 (EOT) Received: from login_0246.whynot.net mx.whynot.net[206.212.231.88]) by whynot.net (8.8.5/8.7.3) with SMTP id XAA06927 for ;

Fri, 7 August 1998 13:48:11 -0700 (EOT) To: Subject: ***ADVERTISE VACATION RENTALS - $25/year*** - http://www.example.com Reply-To: sample@whynot.net X-PMFLAGS: 10322341. X-UIDL: 10293287J92832. Comments: Authenticated Sender is Message-Id: <77126959_36550609> Мы рады представить вам новый веб-сайт http://www.example.com от Extreme Technologies, Inc.

Наш новый сайт, посвященный путешествиям, содержит список некоторых из самых интересных путешествий, которые только можно отыскать в WWW. На нашем сайте вы легко найдете информацию об аренде и продаже жилья, о предоставляемых 320 Глава 8. Электронная почта услугах и многом другом. Наш список сопровождается цветными фотографиями, анимированной графикой, точными описаниями и информацией о том, как напрямую связаться с арендатором/поставщиком. Кроме того, мы изменяем графику на сайте каждый месяц!

Давайте критически оценим это сообщение. Во-первых, большинство его заголовков подозрительны. Как вы видели в предыдущем разделе этой главы, большинство заголовков (То:, From: и т. д.) передаются почтовой программе в разделе DATA передачи сообщения. Это единст венный набор заголовков, которые трудно подделать и которые добав ляются агентом передачи почты, когда сообщение проходит через поч товую систему.

В особенности нужно внимательно посмотреть на заголовки Received:.

Спамер может подделать строки Received:, но он не сумеет убрать те из них, которые были добавлены последующими почтовыми системами.

Можно вставить фальшивые, но это потребует определенных и доволь но серьезных знаний (например, как подделать TCP/IP-пакет или сфабриковать записи в DNS), которыми рядовые спамеры очень редко обладают.

Начнем с того, что выделим заголовки Received: из сообщения и пред ставим их на экране в более читаемом виде. Мы выведем их в той по следовательности, в которой передавалось сообщение, начиная с пер вого почтового сервера, получившего сообщение, и заканчивая местом назначения (нашим сайтом):

use Mail: '.Header;

Sheader = new Mail::Header \*STDIN;

$header->unfold('Received');

©received = $header->get('Received');

for (reverse @received){ chomp;

parseline($_);

if (!defined $ehelo and '.defined $validname and !defined $validip){ print "$_\n";

} else { write;

format STDOUT = @>««««««««««« ©<«««««««««« @<««««««« Sehelo,$validname,Svalidip sub parseline { Получение почты ту $Нпе = $_;

# "нормальный" -- от HELD (REAL [IP]) if (/from\s+(\w\S+)\sA((\S+)\sA[(\d+\.\d+\.\ct+\.\d+)/){ ($ehelo,$validname,$validip) = ($1,$2, $3);

} tt невозможно выполнить обратное разыменование -- от HELO ([IP]) elsif (/from\s+(\w\S+)\s+\(\[(\d+\Ad+\.\d+\.\d+)\]/){ ($ehelo,$validname,$validip) = ($1,undef, $2);

} ft exim -- из [IP] (helo=[HELO IP]) elsif (/ from\s+\[(\d+\Ad+\.\d+\.\d+)\]\s+\(helo=\[(\d+\.\d+\.\d+\.\d+)\]/){ ($validip,$ehelo,$validname) = ($1,$2, undef);

} tt Sun Internet Mail Server -- из [IP] by HELO elsif (/from\s+\[(\d+\.\d+\Ad+\.\d+)\]\s+by\s+(\S+)/){ ($validip,$ehelo,$validname) = ($1,$2, undef);

} ft Microsoft SMTPSVC -- из HELO - (IP) elsif (/from\s+(\S+)\s+-\s+(\d+\.\d+\Ad+\.\d+)\s+/){ ($ehelo,$validname,$validip) = ($1,$2, $3);

} else { ft punt!

$ehelo = Svalidname = $validip = undef;

return [$ehelo,$validname,$validip];

Первым делом из сообщения выбираются (при помощи u n f o l d ( ) ) заго ловки Received:. Метод u n f o l d ( ) удаляет из заданных строк символы новой строки и символы продолжения. Это делается для упрощения анализа.

Все строки просматриваются в обратном порядке (по сравнению с тем, как они были найдены в сообщении). По существу, движение идет от центра сообщения к периферии, т. к. каждая система, через которую оно проходило, добавляла еще один уровень заголовков Received:.

Большая часть работы выполняется подпрограммой &parseline. Ис пользуя несколько регулярных выражений, попробуем выделить сле дующее из заголовков Received::

Имя узла HELO/EHLO Имя, представленное в обмен на HELO или EHLO при SMTP-«бесе де».

«Действительный» IP адрес IP-адрес клиента, замеченный агентом передачи почты во время со единения. Он, скорее всего, будет «действительным», поскольку Глава 8. Электронная почт использует информацию, не зависящую от того, что предоставил клиент во время SMTP-диалога. Это важно, поскольку клиент спа мера, скорее всего, будет заядлым лжецом. Слово действительны^ берется в кавычки потому, что существуют способы сфабриковать ц эту информацию.

«Действительное» имя Имя клиента, найденное агентом передачи почты при обратном ра зыменовании IP-адреса через DNS. Эта информация, как и преды дущая, поступает не от клиента (хотя она тоже может быть фаль шивой).

Формат правильной строки Received: определяется в RFC821 и RFC822. Однако, если просмотреть доставленную почту (как сделал я, создавая использованные регулярные выражения), можно заметить, что не все агенты передачи почты следуют данному правилу. В нашей программе будут применяться наиболее распространенные форматы, но существуют и другие способы, которые обязательно надо учитывать, если есть намерение в дальнейшем расширять код. Чтобы иметь пред ставление о возможных форматах, посмотрите в сценарий adcomplain.

Вот как выглядит вывод программы, выполненной для сообщения, приведенного ранее:

login_0246.whynot.net mx.whynot.net 206.212.231. extreme host-209-214-9-150.mia 209.214.9. isiteinc.com www.isiteinc.com 206.136.243. В первом столбце перечислены имена, используемые машинами при идентификации;

во втором - имена этих машин, указанные серверу при соединении;

а в третьем - IP-адреса инициаторов данного соедине ния. Как уже отмечалось, в построенном списке последняя строка со ответствует машине, передавшей сообщение на наш почтовый сервер.

Спамеры не могут удалить строки Received:, но они могут изменить их содержимое, задав фальшивое имя во время приветствия HELO или EHLO. Подтверждение этому можно увидеть во второй строке приме ра, поскольку имя узла из первого столбца не имеет ничего общего с именем из второго столбца, который более достоверен.

Но предположим, что они совпадают. Как же тогда узнать, что строка Received: была подделана? Один из способов - сверять «действитель ный» IP-адрес из каждой строки Received: с «действительным» име нем узла и сообщать об отклонениях. Приведенная ниже подпрограМ" ма вернет значение (1), если разыменованное имя не совпадет с 1Р-аД" ресом, в противном случае - (0). Вскоре этот код будет добавлен к ос новной программе:

use Socket;

sub checkrev{ ролучение почты --- ^. — my($ip, $name) = @_;

return 0 unless ($ip and $name);

my $namelook = gethostbyaddr(inet_aton($ip), AF_INET);

my Siplook = gethostbyname($name);

Siplook = inet_ntoa($iplook) if Siplook;

# может быть записан в различных регистрах if (Siplook eq $ip and Ic Snamelook eq Ic $name){ return 0;

} else { return 1;

Такая проверка не совсем надежна, потому что, как ни обидно, у впол не законных узлов может отсутствовать информация для обратного разыменования. Кроме того, серверам имен может быть предписано отвечать неверно, предоставляя фиктивную информацию (т. е. на gethostbyaddr( ) нельзя безоговорочно полагаться).

Много о чем можно догадаться из заголовков Received:, прежде чем от следить владельцев каждого хопа (hop). Например, кем разделяется мнение, что любой из хопов является известным источником спама?

Поиск в локальном черном списке На некоторых сайтах ведутся локальные черные списки узлов, извест ных как распространители спама. Такая тактика была взята на воору жение, когда спам только начал появляться, и некоторые провайдеры отказывались принимать меры даже против самых закоренелых кли ентов-спамеров. В ответ на это в основных агентах передачи почты по явились механизмы, отвергающие соединения от узлов и доменов, входящих в список антисоциальных.

Можно использовать такой черный список, чтобы разобраться, прохо дило ли сообщение через узлы, известные своим спамерством. Ясно, что в черном списке нет сервера, передавшего нам почту (иначе с ним просто не было бы установлено соединение), но любой из остальных почтовых серверов, указанный в заголовках Received:, вполне может там быть.

Не существует способа написать одну программу, проверяющую все возможные черные списки агентов передачи почты, поскольку разные агенты хранят эту информацию в различных форматах. Большая часть узлов в Интернете в настоящее время применяет в качестве аген та передачи почты sendmail, так что в нашем примере будет применять ся его формат черного списка. В новых версиях sendmail черный спи 324 Глава 8. Электронная почта сок хранится в базе данных при помощи библиотек Berkeley DB 2. V доступных на http://www.sleepycat.com. ' Поль Маркес (Paul Marquess) написал модуль BerkeleyDB, специально предназначенный для работы с библиотеками Berkeley 2.x/3.x. Это цо жет сбить с толку, поскольку в документации по DB_File, еще одному из вестному модулю Маркеса, входящему в состав дистрибутива Perl, так же рекомендуется применять библиотеки 2.х/3.х. DB_File использует библиотеки BerkeleyDB 2.x/3.x в «режиме совместимости» (в частнос ти, библиотека собирается с ключом --enable-compat185, так что досту пен API версии 1.x API). Модуль BerkeleyDB позволяет программисту на Perl применять расширенные возможности из API версии 2.х/3.х.

Агент передачи sendmail использует формат Berkeley DB 2.x/3.x, так что нужно включить модуль BerkeleyDB. Вот пример, который выводит содержимое локального черного списка:

Sblacklist = "/etc/mail/blacklist. db";

use BerkeleyDB;

Ясвяжем хэш %blist с черным списком, используя Berkeley DB # для получения значений tie %blist, 'BerkeleyDB: : Hash', -Filename => Sblacklist or die "Невозможно открыть файл Sfilename: $! $BerkeleyDB: :Error\n" ;

tt обходим в цикле каждый ключ и значение из этого файла, и выводя только записи REJECT while(($key,$value) = each %blist){ # в списке также могут быть записи "OK", "RELAY" и др.

next if (Svalue ne "REJECT");

print "$key\n";

Принимая за основу этот код, можно написать подпрограмму, прове ряющую, находится ли данный узел или домен (содержащий этот узел) в черном списке. Если нужно узнать об узле mailserver.spam mer.com, следует обойти в цикле все записи из черного списка (в кото ром могут находиться mailserver.spammer.com, spammer.com или даже просто spammer), чтобы проверить, содержатся ли в имени узла какие либо записи из него.

Существует много способов написать на Perl программу, сравниваю щую список значений с какими-либо данными. Но для того чтобы программа была эффективной и интересной, мы будем использовать две продвинутые технологии. Они созданы для уменьшения числа компиляций регулярных выражений, которые применяются в ходе выполнения программы. Каждый раз, когда программа использует «новое» регулярное выражение, Perl должен компилировать его заНО" Получение почты во. Например, в этом отрывке кода Perl вынужден обрабатывать новое значение на каждой итерации:

Я вообразите себе внешний цикл, в котором этот код вызывается № множество раз foreach $match (qw(alewife davis porter harvard central kendall park)){ Sstation =" /$match/ and print "found our station stop!";

Этот процесс требует больших вычислительных затрат, так что если бы можно было сократить количество вычислений, программа стала бы намного эффективней. Время, потраченное на компиляцию регу лярных выражений, становится значительным в программах, где в цикле рассматривается список различных регулярных выражений.

Вот пример первой технологии, созданной для решения указанной проблемы:

use BerkeleyDB;

$blacklist = "/etc/mail/blacklist, db";

&loadblist;

# принимаем имя узла в качестве аргумента командной строки и и сообщаем, если оно есть в черном списке if (defined &cneckblist($ARGV[0])){ print "*** Sfound найден в черном списке \п";

# загружаем черный список в массив анонимных подпрограмм sub loadblist{ tie %blist, 'BerkeleyDB::Hash', -Filename => $blacklist or die "Невозможно открыть Sfilename: $! $BerkeleyDB::Error\n" while(my($key,$value) = each %blist){ # в черном списке могут быть "OK", "RELAY" и пр.

next if (lvalue ne "REJECT");

push(@blisttests, eval 'sub {$_[0] =' /\Q$key/o and $key}');

sub checkblist{ my($line) = shift;

foreach Ssubref (@blisttests){ return Sfound if ($found = &$subref(Sline));

return undef;

} 326 Глава 8. Электронная почта I В этом примере используются анонимные подпрограммы — техноло гия, продемонстрированная в книге Джозефа Хола (Joseph Hall) «Ef fective Perl Programming» (Эффективное программирование на Perl) (Addison Wesley). Для каждой записи из черного списка создается ано нимная подпрограмма. Каждая подпрограмма сверяет переданные ей данные с одним из элементов черного списка. Если они совпадают, та кая запись возвращается. Ссылки на эти подпрограммы хранятся в списке. Вот строка, в которой создается подпрограмма и ссылка на нее добавляется к списку:

push(@blisttests, eval 'sub {$_[0] =" /\Q$key/o and $key}');

Так что, если в черном списке есть запись spammer, ссылка на код, до бавленная в массив, будет указывать на подпрограмму, по сути экви валентную следующей:

sub { $_[0] =" /\Qspammer/o and "spammer";

} \Q в начале регулярного выражения присутствует для того, чтобы точ ки (как в.сот) или другие зарезервированные знаки пунктуации не считались бы метасимволами регулярных выражений.

Позже в программе будет обойден в цикле список ссылок на код и вы полнена каждая маленькая подпрограмма для переданных данных.

Если результатом каких-либо из этих вычислений окажется значение «истина», мы вернем код возврата подпрограммы:

return $found if ($found = &$subref($line));

Компиляция регулярного выражения, которая нас так беспокоит, происходит всего один раз - при создании ссылки на подпрограмму.

Можно вызывать каждую подпрограмму столько раз, сколько надо, не теряя время на компиляцию регулярного выражения.

Существует и другой, чуть менее продвинутый подход, который мож но применять, если у вас Perl версии 5.005 или выше. В Perl 5.005 бы ла введена новая синтаксическая конструкция, названная «прекомпи лируемым регулярным выражением», которая делает подобную зада чу несколько проще. Переписать код, используя эту новую конструк цию, можно было бы примерно так:

sub loadblist{ tie %blist, 'BerkeleyDB::Hash', -Filename => Sblacklist or die "Невозможно открыть файл $filename: $! SBerkeleyDB::Error\n" I while(my($key,$value) = each %blist){ # в черном списке могут быть записи "OK", "RELAY" и пр.

next if ($value ne "REJECT");

push(@blisttests,[qr/\Q$key/,$key]);

^лучение почты sub checkblist{ my($line) = shift;

foreach my $test (@blisttests){ my($re,$key) = @{$test};

return $key if ($line =" /$re/);

} return undef;

На этот раз ссылка была перенесена на анонимный массив в @blisttest.

Первый элемент этого массива - скомпилированное регулярное выра жение, созданное с применением нового синтаксиса qr//. Это позволя ет сохранить регулярное выражение после его компиляции. Такая форма обработки значительно увеличивает скорость выполнения прог раммы при дальнейшем поиске соответствия. Второй элемент аноним ного массива - сама запись из черного списка, которая будет возвра щена при найденном соответствии скомпилированному регулярному выражению.

Поиск в черном списке для всего Интернета В последнем примере программы на вопрос «Спамер ли это?» мы отве чали, руководствуясь собственным мнением об узле или домене, не принимая во внимание опыт остальных пользователей Интернета. Су ществуют несколько спорные службы1, предлагающие простой доступ к глобальным черным спискам спамеров или известных узлов, откры то допускающих ретрансляцию почты. Две хорошо известные службы такого типа - Realtime Blackhole List (RBL) от Mail Abuse Prevention System и Open Relay Behaviour-modification System (ORBS). Для полу чения доступа к этим спискам:

1. Измените на обратный порядок следования элементов проверяемо го IP-адреса. Например, 192. 168. 1. 34 станет 34. 1. 168. 192.

2. Добавьте специальное имя домена к полученному числу. Для про верки адреса в RBL необходимо использовать 34.1. 168. 192. r b l. m a p s.

vix.com.

3. Выполните запрос к DNS-серверу для данного адреса.

Споры ведутся о том, нужно ли вести подобные черные списки, кто должен их поддерживать, как их нужно применять, при каких обстоятельствах уз лы должны добавляться туда и удаляться оттуда и о многих других «поли тических» моментах, которые только можно себе представить. Информацию о таких службах можно найти на сайтах http://www.maps.vix.com и http:// www.orbs.org.

328 Глава 8. Электронная почта Если вы получите положительный ответ (т. е. запись о ресурсах А), эт означает, что данный IP-адрес находится в черном списке.

Несколько менее спорным является список Dial-up User List, такд^е поддерживаемый силами специалистов из Mail Abuse Prevention Sys tem. Это список диапазонов IP-адресов, динамически присваиваемых модемным пулам. Теоретически, SMTP-соединения не должны исхо дить от какого-либо из этих узлов. Почта с таких узлов должна отправ ляться через почтовый сервер провайдера (которого нет в этом списке) Вот один из способов проверить, находится ли IP-адрес в каком-либо из этих списков:

sub checkaddr{ my($ip, $domain) = @_;

return undef unless (defined Sip);

my $lookupip = ]oin( '.', reverse split(/\./,$ip));

if (gethostbyname($lookupip. $domain)){ return $ip;

} else { return undef;

Очень скоро эта подпрограмма будет добавлена в предпоследний при мер этого раздела. А пока, располагая существенно большим объемом информации о каждом из заголовков Received:, попробуем вычислить человека или людей, ответственных за администрирование каждой машины из списка. Модуль Net: :Whois, уже рассмотренный в главе 6, вероятно, первым будет использоваться для решения этой проблемы.

К сожалению, этот модуль специализируется только на получении ин формации о связи имен и доменов (name-to-domain information). Кро ме того, он «предполагает», что информация будет представлена в ви де, используемом InterNIC. Нам могут понадобиться сведения о связи IP-адресов и доменов (IP address-to-domain information) от WHOIS серверов на http://whois.arin.net (American Registry for Internet Num bers), http://whois.ripe.net (European IP Address Allocations) и http'./l whois.apnic.net (Asia Pacific Address Allocations). Отсутствие соот ветствующего модуля - первое препятствие, которое необходимо пре одолеть.

Но даже если бы мы знали, как соединиться со всеми этими реестрами и обработать их различные форматы вывода, было бы неясно, к како му из них нужно обращаться для поиска информации о данном 1Р-&Д' ресе. Нам необходимо определить, к какому серверу нужно обратить ся, и это второе препятствие. К счастью, если обратиться к ARIN с за получение почты просом по адресу, не принадлежащему его базе данных, он направит нас на нужный реестр. Так что, если мы спросим ARIN об адресе из Японии, он отправит нас на APNIC.

Для преодоления первого препятствия можно использовать модуль об щего назначения, подобный Net : : Telnet из главы 6. Другой путь - уже рассмотренный модуль 10: : Socket. Что выбрать- дело личных пред почтений, ну и, конечно, необходима возможность доступа к нему с ва шей платформы.

Служба WHOIS работает на порту 43 TCP, хотя ее имя будет использо ваться только в целях предосторожности. С WHOIS-сервером очень просто общаться. Необходимо соединиться, выполнить запрос (в на шем случае это IP-адрес) и получить ответ. Программа, запрашиваю щая произвольный WHOIS-сервер, очень проста:

sub getwhois{ my($ip) = shift;

my($info);

$cn = new Net : : Telnet (Host => $whoishost, Port => 'whois', Errmode => "return", Timeout => 30) or die "Невозможно установить соединение с $whoishost connection:$!\n";

unless ($cn->print($ip."\n")){ $cn->close;

die "Невозможно послать $ip на Swhoishost: ".$cn->errmsg. "\n";

while ($ret = $cn->get){ $info.=$ret;

$cn->close;

return $info;

} Для преодоления второго препятствия, состоящего в выборе нужного реестра, есть, по крайней мере, две возможности. Можно послать за прос к http://whois.arin.net и проанализировать ответ. Например, вот запись диалога с ARIN по поводу IP-адреса японской машины. Жир ный шрифт используется для выделения текста, введенного человеком:

% telnet whois.arin.net Trying 192.149.252.22...

Connected to whois.arin.net.

Escape character is '"]•.

330 Глава 8. Электронная почта 210.161.92. Asia Pacific Network Information Center (NETBLK-APNIC-CIDR-BLK) Level 1 - 33 Park Road Milton, AU Netname: APNIC-CIDR-BLK Netblock: 210.0.0.0 - 211.255.255. Coordinator:

Administrator, System (SA90-ARIN) sysadm@APNIC.NET +61-7-3367- Domain System inverse mapping provided by;

SVC01.APNIC.NET 202.12.28. NS.TELSTRA.NET 203.50.0. NS.KRNIC.NET 202.30.64. NS.RIPE.NET 193.0.0. *** please refer to whois.apnic.net for more information *** «** before contacting APNIC *** *** use whois -h whois.apnic.net *** Record last updated on 04-Mar-99.

Database last updated on 19-Apr-99 16:14:16 EOT.

Подобные результаты означают, что запрос нужно послать к http:// whois.apnic.net.

Другой способ - послать запрос к «умному» WHOIS-серверу, который сделает всю работу сам. Из них мне больше всего нравится сервер http://whois.geektools.com.1 «Умник» проанализирует ваш запрос, от правит его на нужный WHOIS-сервер и вернет результаты. Тому, кто пользуется этой службой, не нужно беспокоиться о том, на каком именно сервере хранится информация.

Чтобы код программы сильно не разрастался, а мы не отвлекались от обсуждаемой темы, будем пользоваться вторым (более простым) спосо бом.

Поместим все эти маленькие запросы в одну большую программу и за пустим ее. Итак, если нужно выполнить все приведенные выше под" программы с нашим примером сообщения:

use Mail::Header;

use Socket;

Кстати, WHOIS прокси-сервер GeekTools написан на Perl. Детальную формацию об этой службе и копию кода можно найти на http:

geektools.com.

^Получение почты use BerkeleyDB;

use Net::Telnet;

$neader = new Mail:.'Header \*STDIN;

$header ->unfold('Received');

©received = $header->get('Received');

Srbldomain = ".rbl.maps.vix.com";

Sorbsdomain = ".relays.orbs.org";

Sduldomain = ".dul.maps.vix.com";

$blacklist = "/etc/mail/blacklist.db";

Swhoishost = "whois.geektools.com";

&loadblist;

for (reverse @received){ chomp;

parseline($_);

if (! defined $ehelo and ! defined $validname and ! defined $validip){ print "$_\n";

} else { $flags = (&checkaddr($validip,$rbldomain) ? "R" : "");

и в RBL?

Sflags.= (&checkaddr($validip, Sorbsdomain) ? "0" : "");

# в ORBS?

Sflags.= (&checkaddr($validip, Sduldomain) ? "0" : "");

в в DUL?

Sflags.= (&checkblist($_) ? "B" : "");

# в нашем списке?

$flags.= (&checkrev($validip,$validname) ? "L" : "");

# rev-lookup?

push(@iplist, Svalidip);

write;

for (@iplist){ print "\nWHOIS info for $_:\n";

print &getwhois($_);

format STDOUT = §>««««««««««< @<«««««««««« @<««««««« @«« Sehelo, Svalidname, $validip, $f lags то будут получены такие результаты (слегка сокращенные):

login_0246.whynot.net mx.whynot.net 206.212.231.88 L extreme host-209-214-9-150.mia 209.214.9.150 DB isiteinc.com www.isiteinc.com 206.136.243.2 OB 332 Глава 8. Электронная почта WHOIS info for 206.212.231.88:

WHOIS info for 209.214.9.150:

BellSouth.net Inc. (NETBLK-BELLSNET-BLK4) 1100 Ashwood Parkway Atlanta, GA Netname: BELLSNET-BLK Netblock: 209.214.0.0 - 209.215.255. Maintainer: BELL Coordinator:...

WHOIS info for 206.136.243.2:

Brainsell Incorporated (NET-ISITEINC) 4105-R Laguna St.

Coral Gables, FL US Netname: ISITEINC Netnumber: 206.136.243. Coordinator:...

Гораздо лучше! Теперь нам известно:

• Спамер дал неверные ответы HELO/EHLO.

• Первый узел, по всей вероятности, фальшивый (не удалась попыт ка разыменования, и по нему нет информации WHOIS).

• Сообщение, скорее всего, попало в сеть через соединение по теле фонным линиям.

• Два из этих адресов уже находятся в нашем черном списке.

• ORBS они тоже не нравятся.

• Кроме того, нам известна контактная информация для связи с про вайдером.

Perl помог разобраться с непрошеной коммерческой почтой.

Pages:     | 1 |   ...   | 3 | 4 || 6 | 7 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.