WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 3 | 4 || 6 | 7 |

«Г. Россум, Ф.Л.Дж. Дрейк, Д.С. Откидач Язык программирования Python Г. Россум, Ф.Л.Дж. Дрейк, Д.С. Откидач, М. Задка, М. Левис, С. Монтаро, Э.С. Реймонд, А.М. Кучлинг, М.-А. Лембург, К.-П. Йи, Д. Ксиллаг, ...»

-- [ Страница 5 ] --

Если аргумент pid меньше -1, запрашивается информация для любого процесса в группе с идентификатором -pid (абсолютное значение аргумента pid).

WNOHANG (UNIX) При использовании этой опция функция waitpid() не ожидает завершения про цесса, а возвращает информацию только, если она сразу доступна.

Следующие функции позволяют извлечь информацию из закодированного кода за вершения, возвращаемого функциями system(), wait() и waitpid():

WIFSTOPPED(code) (UNIX) Возвращает истину, если процесс был остановлен.

21.1. os — основные службы операционной системы WIFSIGNALED(code) (UNIX) Возвращает истину, если процесс был завершен сигналом.

WIFEXITED(code) (UNIX) Возвращает истину, если процесс был завершен системным вызовом функции exit().

WEXITSTATUS(code) (UNIX) Если выражение WIFEXITED(code) верно, возвращает целочисленный параметр, использованный при системном вызове функции exit(), в противном случае воз вращаемое значение не несет какого-либо смысла.

WSTOPSIG(code) (UNIX) Возвращает номер сигнала, который привел к остановке процесса.

WTERMSIG(code) (UNIX) Возвращает номер сигнала, который привел к завершению процесса.

21.1.6 Различная системная информация confstr(name) (UNIX) Возвращает строку, содержащую системную конфигурационную информацию. Ар гумент name должен быть строкой с именем системного значения или целым числом. Известные для данной ОС имена системных значений даны в словаре confstr_names. Если системное значение name не задано, возвращает пустую строку. Если имя name неизвестно, генерируется исключение ValueError. Если имя не поддерживается ОС (даже если оно включено в confstr_names), генери руется исключение OSError с errno.EINVAL в качестве номера ошибки.

confstr_names (UNIX) Словарь, отображающий имена, воспринимаемые функцией confstr(), к целым значениям для этих имен.

sysconf(name) (UNIX) Возвращает целое системное конфигурационное значение. Аргумент name должен быть строкой с именем системного значения или целым числом. Известные для данной ОС имена системных значений даны в словаре sysconf_names. Если системное значение name не задано, возвращает -1. Если имя name неизвест но, генерируется исключение ValueError. Если имя не поддерживается ОС (да же если оно включено в sysconf_names), генерируется исключение OSError с errno.EINVAL в качестве номера ошибки.

sysconf_names (UNIX) Словарь, отображающий имена, воспринимаемые функцией sysconf(), к целым значениям для этих имен.

Следующие константы используются при работе с именами путей. Операции вы сокого уровня над именами путей определены в модуле os.path.

280 Глава 21. Доступ к средствам, предоставляемым операционной...

curdir Строка, используемая для ссылки на текущий каталог, например ’.’ или ’:’.

pardir Строка, используемая для ссылки на родительский каталог, например ’..’ или ’::’.

sep Символ, который используется ОС для разделения компонент пути, например, ’/’, ’\’ или ’:’.

altsep Альтернативный символ, используемый ОС для разделения компонент пути, или None, если имеется только один символ. В DOS и Windows эта константа имеет значение ’/’.

pathsep Символ, который обычно используется ОС для разделения имен путей в списке (как в переменной окружения PATH), например, ’:’ или ’;

’.

defpath Путь поиска исполняемых файлов по умолчанию, если не установлена переменная окружения PATH.

linesep Последовательность символов, которая используется для завершения строк на дан ной платформе, например, ’\n’, ’\r’ или ’\r\n’.

21.2 os.path — работа с именами путей Этот модуль определяет полезные операции над именами путей.

abspath(path) Возвращает нормализованную абсолютную версию пути path. На большинстве платформ вызов этой функции эквивалентен вызову ‘normpath(join(os.getcwd(), path))’.

basename(path) Возвращает основное имя (basename) пути path. Это второй элемент пары split(path). Обратите внимание, что поведение этой функции отличается от поведения программы basename, которая для ’/foo/bar/’ выводит ’bar’, в то время как функция basename() возвращает пустую строку.

commonprefix(list) Возвращает наибольшую общую часть путей в списке list (произвольная после довательность), полученную посимвольным сравнением (то есть результат может и не быть корректным путем). Если список list пуст, возвращает пустую строку (’’).

21.2. os.path — работа с именами путей dirname(path) Возвращает имя каталога в пути path. Это первый элемент пары split(path).

exists(path) Возвращает 1, если путь с именем path (файл или каталог) существует, иначе возвращает 0.

expanduser(path) Возвращает аргумент с компонентом вида ‘~’ или ‘~user’, замененным домашним каталогом пользователя. ‘~’ заменяется значением переменной окружения HOME, поиск имени домашнего каталога для пользователя user производится с помощью модуля pwd. Если замена по каким-либо причинам не может быть произведена или путь не начинается с символа ‘~’, возвращает path без изменений.

expandvars(path) Возвращает аргумент с компонентами вида ‘$name’ и ‘${name}’, замененными значением переменной окружения name. Некорректные имена и имена, ссылаю щиеся на неопределенные переменные, оставляются в строке path без изменений.

При использовании ОС Macintosh всегда возвращает path без изменений.

getatime(path) Возвращает время (число секунд с начала эпохи, см. описание модуля time) по следнего доступа к файлу (каталогу) path. Генерирует исключение IOError, если файл не существует или не доступен.

getmtime(path) Возвращает время (число секунд с начала эпохи, см. описание модуля time) последнего внесения изменений в файл (каталог) path. Генерирует исключение IOError, если файл не существует или не доступен.

getsize(path) Возвращает размер в байтах файла (каталога) path. Генерирует исключение IOError, если файл не существует или не доступен.

isabs(path) Возвращает 1, если путь path является абсолютным.

isfile(path) Возвращает 1, если путь path указывает на существующий обычный файл, иначе возвращает 0. Эта функция следует символическим ссылкам, то есть функции islink() и isfile() могут обе возвращать истину для одного и того же пути.

isdir(path) Возвращает 1, если путь path указывает на существующий каталог, иначе возвра щает 0. Эта функция следует символическим ссылкам, то есть функции islink() и isdir() могут обе возвращать истину для одного и того же пути.

islink(path) Возвращает 1, если путь path является символической ссылкой, иначе возвращает 0. Всегда возвращает 0, если символические ссылки не поддерживаются.

282 Глава 21. Доступ к средствам, предоставляемым операционной...

ismount(path) Возвращает 1, если путь path является точкой монтирования, то есть каталог path и родительский для него каталог находятся на разных устройствах (разделах) или ссылаются на один и тот же узел (i-node) одного устройства.

join(path1 [, path2...]) Объединяет компоненты пути. Если какой-либо компонент является абсолютным путем, все предыдущие компоненты отбрасываются и объединение продолжает ся. Возвращаемое значение является объединением всех непустых строк path1, path2 и т. д., в качестве разделителя используется os.sep. Если последний ар гумент является пустой строкой, результат заканчивается символом os.sep.

normcase(path) Возвращает path с нормализованным регистром букв. На платформах UNIX воз вращает аргумент без изменений. Для файловых систем, нечувствительных к ре гистру букв, преобразует все буквы к нижнему регистру. Под Windows также заменяет символы косой черты (os.altsep) на символы обратной косой черты (os.sep).

normpath(path) Возвращает нормализованное имя пути path. Эта функция сворачивает излишние разделители и ссылки на текущий и родительский каталоги, то есть имена путей ’A//B’, ’A/./B’ и ’A/foo/../B’ преобразуются к ’A/B’. Под Windows также заменяет символы косой черты (os.altsep) на символы обратной косой черты (os.sep). Функция normpath() не нормализует регистр букв — для этих целей используйте функцию normcase().

samefile(path1, path2) (UNIX, Macintosh) Возвращает 1, если оба пути ссылаются на один и тот же файл (каталог), ина че возвращает 0. Генерирует исключение IOError, если вызов os.stat() для какого-либо пути заканчивается ошибкой.

sameopenfile(file1, file2) (UNIX, Macintosh) Возвращает 1, если файловые объекты file1 и file2 ссылаются на один и тот же файл (файловые объекты могут представлять разные файловые дескрипторы), иначе возвращает 0.

samestat(stat1, stat2) (UNIX, Macintosh) Возвращает 1, если кортежи stat1 и stat2 (результат, возвращаемый функциями fstat(), lstat() и stat()) ссылаются на один и тот же файл.

split(path) Разбивает имя пути path на пару строк ‘(head, tail)’, где tail — последний компонент пути и head — остальная часть пути. tail никогда не содержит сим вола os.sep: если путь path заканчивается этим символом, tail будет пустой строкой. Завершающие символы os.sep в head отбрасываются, за исключением случаев, когда path ссылается на корневой каталог. В любом случае ‘join(head, tail)’ дает путь, эквивалентный path.

21.3. stat — интерпретация os.stat() splitdrive(path) Разбивает имя пути path на пару строк ‘(drive, tail)’, где drive — специ фикатор логического диска или пустая строка и head — остальная часть пути. В системах, которые не используют спецификаторы логических дисков drive всегда является пустой строкой. В любом случае выражение ‘drive + tail == path’ всегда верно.

splitext(path) Разбивает имя пути path на пару строк ‘(root, ext)’ так, чтобы выполнялось условие ‘root + ext == path’ и строка ext была пустой или начиналась с точки и содержала не более одной точки.

walk(path, visit, arg) Вызывает ‘visit(arg, dirname, names)’ для каждого каталога в дереве, начи ная с path (включая каталог path). Аргумент dirname указывает имя каталога, для которого вызывается функция visit, а names является списком файлов и каталогов в каталоге dirname (os.listdir(dirname), то есть используется путь относительно каталога dirname). Функция visit может вносить изменения в names и, тем самым, оказывать влияние на то, какие каталоги будут посещать ся далее по дереву, то есть чтобы избежать посещения каких-либо частей дерева каталогов.

21.3 stat — интерпретация os.stat() Этот модуль определяет константы и функции, необходимые для интерпретации эле ментов кортежа ‘(st_mode, st_ino, st_dev, st_nlink, st_uid, st_gid, st_size, st_atime, st_mtime, st_ctime...)’, возвращаемого функциями os.stat(), os.lstat() и os.fstat().

S_ISDIR(st_mode) Истина, если аргумент st_mode получен для каталога.

S_ISCHR(st_mode) Истина, если аргумент st_mode получен для специального файла, представляю щего устройство посимвольного ввода/вывода.

S_ISBLK(st_mode) Истина, если аргумент st_mode получен для специального файла, представляю щего блочное устройство.

S_ISREG(st_mode) Истина, если аргумент st_mode получен для обычного файла.

S_ISFIFO(st_mode) Истина, если аргумент st_mode получен для именованного канала (FIFO).

284 Глава 21. Доступ к средствам, предоставляемым операционной...

S_ISLNK(st_mode) Истина, если аргумент st_mode получен для символической ссылки.

S_ISSOCK(st_mode) Истина, если аргумент st_mode получен для канала сетевого соединения (socket).

S_IMODE(st_mode) Возвращает часть состояния, которую можно установить с помощью функции os.chmod() — доступ, sticky bit, set-group-id и set-user-id.

S_IFMT(st_mode) Возвращает часть состояния, описывающую тип файла (используется функциями S_IS*(), описанными выше).

Обычно гораздо удобнее воспользоваться функциями os.path.is*() (см. описа ние модуля os.path) для определения типа файла. Описанные в этом разделе функции полезны в тех случаях, когда необходимо выполнить несколько проверок для одного и того же файла, и Вы хотите избежать накладных расходов на вызов системной функции stat() для каждой проверки.

Следующие переменные являются символическими индексами для кортежа, воз вращаемого функциями os.stat(), os.fstat() и os.lstat().

ST_MODE Режим защиты файла.

ST_INO Внутренний номер файла (i-node).

ST_DEV Номер устройства, на котором файл расположен.

ST_NLINK Количество (жестких) ссылок на файл.

ST_UID Идентификатор пользователя-владельца.

ST_GID Идентификатор группы-владельца.

ST_SIZE Размер файла в байтах.

ST_ATIME Время последнего доступа.

ST_MTIME Время последнего внесения изменений.

21.4. statvfs — интерпретация os.statvfs() ST_CTIME Время последнего изменения статуса.

Приведем простой пример:

import os, sys from stat import * def visit(arg, dir, names):

for name in names:

fullname = os.path.join(dir, name) mode = os.stat(fullname)[ST_MODE] if S_ISDIR(mode):

print ’’, fullname elif S_ISREG(mode):

print ’ ’, fullname else:

print ’ ’, fullname if name == ’main’:

os.path.walk(sys.argv[1], visit, None) 21.4 statvfs — интерпретация os.statvfs() Каждая из констант, определенных в этом модуле является индексом элемента корте жа, возвращаемого функцией os.statvfs(), содержащего определенную информацию.

Использование этих констант позволяет избежать необходимости помнить “магические индексы”.

F_BSIZE Предпочтительный размер блоков для данной файловой системы.

F_FRSIZE Основной размер блоков для данной файловой системы.

F_BLOCKS Общее число блоков.

F_BFREE Число свободных блоков.

F_BAVAIL Число свободных блоков, доступных рядовому пользователю.

F_FILES Общее число файловых узлов (то есть максимальное возможное число файлов).

286 Глава 21. Доступ к средствам, предоставляемым операционной...

F_FFREE Число свободных файловых узлов.

F_FAVAIL Число файловых узлов, доступных рядовому пользователю.

F_FLAG Флаги, их значение зависит от используемой системы.

F_NAMEMAX Максимальная длина имен файлов.

21.5 filecmp — сравнение файлов и каталогов Модуль filecmp предоставляет функции для быстрого и полного сравнения файлов и каталогов.

cmp(f1, f2 [, shallow]) Сравнивает файлы с именами f1 и f21. Возвращает 1, если они одинаковые, ина че возвращает 0. По умолчанию производится поверхностное сравнение, используя информацию, возвращаемую функцией os.stat(). Однако, если задан и является ложью аргумент shallow, при необходимости будет производиться полное срав нение содержимого файлов.

Результаты сравнений содержимого файлов сохраняются во внутреннем кэше и используются при повторном сравнении, если информация для этих файлов, воз вращаемая функцией os.stat() не изменилась.

cmpfiles(dir1, dir2, common [, shallow]) Сравнивает файлы, имена которых перечислены в common (произвольная после довательность), в каталогах dir1 и dir21. Возвращает кортеж из трех списков имен ‘(match, mismatch, errors)’. Список match содержит имена файлов, одинаковых в обоих каталогах, список mismatch — разных и errros содержит имена файлов, которые по каким-либо причинам не удается сравнить (например, к ним нет доступа). Аргумент shallow имеет такое же значение, как и в функции cmp().

Кроме того, модуль определяет класс, позволяющий сравнивать содержимое ката логов (включая содержимое вложенных каталогов):

dircmp(dir1, dir2 [, ignore]) Конструирует новый объект, предназначенный для сравнения каталогов dir1 и dir2. Имена, перечисленные в списке ignore (по умолчанию равен ‘[’RCS’, ’CVS’, ’tags’]’), игнорируются.

На самом деле функции cmp() и cmpfiles() имеет еще один необязательный аргумент. Мы намеренно его не документируем, так как его использование не переносимо, а иногда и опасно.

21.5. filecmp — сравнение файлов и каталогов Экземпляры класса dircmp имеют следующие методы и атрибуты данных:

report() Выводит на стандартный поток вывода (sys.stdout) подробный отчет о сравне нии каталогов.

report_partial_closure() Выводит на стандартный поток вывода (sys.stdout) подробный отчет о сравне нии каталогов и одного уровня вложенных каталогов.

report_full_closure() Выводит на стандартный поток вывода (sys.stdout) подробный отчет о сравне нии каталогов и рекурсивно всех вложенных каталогов.

left_list Список имен файлов и каталогов в dir1, не указанных в аргументе ignore.

right_list Список имен файлов и каталогов в dir2, не указанных в аргументе ignore.

common Список имен файлов и каталогов, которые присутствуют как в dir1, так и в dir2.

left_only Список имен файлов и каталогов, которые присутствуют только в dir1.

right_only Список имен файлов и каталогов, которые присутствуют только в dir2.

common_dirs Список имен каталогов, которые присутствуют как в dir1, так и в dir2.

common_files Список имен файлов, которые присутствуют как в dir1, так и в dir2.

common_funny Список имен, найденных в обоих каталогах, но имеющих разный тип или дающих ошибку при вызове функции os.stat().

same_files Список файлов, одинаковых в обоих каталогах (сравнивается только информация, возвращаемая функцией os.stat()).

diff_files Список файлов, присутствующих в обоих каталогах, содержимое которых различа ется.

funny_files Список файлов, присутствующих в обоих каталогах, которые по каким-либо при чинам не удается сравнить (например, к ним нет доступа).

288 Глава 21. Доступ к средствам, предоставляемым операционной...

subdirs Словарь, отображающий имена каталогов из списка common_dirs в экземпляры класса dircmp для этих каталогов.

Заметим, что значения атрибутов вычисляются по мере необходимости, а не сразу при конструировании объекта. Это позволяет избежать излишних расходов при запросе значений только тех атрибутов, которые можно быстро вычислить. Однажды вычислен ное значение сохраняется и используется при дальнейших запросах.

21.6 popen2 — доступ к потокам ввода/вывода дочерних процессов Модуль доступен в операционных системах UNIX и Windows (начиная с версии 2.0).

Модуль popen2 позволяет порождать подпроцессы и иметь доступ к их стандарт ным потокам ввода, вывода и ошибок. Во всех случаях команда выполняется в стан дартном для данной платформы интерпретаторе команд (устанавливается переменной окружения SHELL в UNIX и COMSPEC в Windows). Заметим, что, начиная с версии 2.0, функциональность этого модуля доступна через одноименные функции модуля os, имеющие аналогичный интерфейс, но возвращающие кортеж с другим порядком следо вания элементов.

Основной интерфейс модуля представлен тремя функциями. Для всех функций ар гумент bufsize определяет размер буфера каналов и mode (начиная с версии 2.0) — режим, в котором будут открыты каналы (’t’ — текстовый, используется по умолча нию, или ’b’ — двоичный).

popen2(cmd [, bufsize [, mode]]) Выполняет команду cmd в качестве дочернего процесса и возвращает для него кор теж из файловых объектов, представляющих стандартные потоки вывода и ввода.

popen3(cmd [, bufsize [, mode]]) Выполняет команду cmd в качестве дочернего процесса и возвращает для него кортеж из файловых объектов, представляющих стандартные потоки вывода, ввода и ошибок.

popen4(cmd [, bufsize [, mode]]) Выполняет команду cmd в качестве дочернего процесса и возвращает кортеж из двух файловых объектов: соответствующий его объединенному потоку вывода и ошибок и стандартному потоку ввода. Функция доступна, начиная с версии 2.0.

Кроме того, модуль определяет следующие классы (на платформе UNIX они ис пользуются для реализации описанных выше функций):

21.7. time — определение и обработка времени Popen3(cmd [, capturestderr [, bufsize]]) (UNIX) Конструирует и возвращает объект, представляющий дочерний процесс. Если за дан и является истиной аргумент capturestderr, возвращаемый объект будет перехватывать стандартный поток ошибок дочернего процесса. Аргумент bufsize указывает размер буфера потоков.

Popen4(cmd [, bufsize]) (UNIX) Этот класс аналогичен классу Popen3, но всегда направляет стандартные потоки вывода и ошибок дочернего процесса в один файловый объект.

Экземпляры классов Popen3 и Popen4 имеют следующие методы и атрибуты данных:

poll() Возвращает -1, если выполнение дочернего процесса еще не закончилось, в про тивном случае возвращает код завершения.

wait() Ждет окончания выполнения дочернего процесса и возвращает код завершения.

fromchild Файловый объект, представляющий стандартный поток вывода дочернего процесса.

Для экземпляров класса Popen4 этот объект представляет объединение стандарт ных потоков вывода и ошибок дочернего процесса.

tochild Файловый объект, представляющий стандартный поток ввода дочернего процесса.

childerr Файловый объект, представляющий стандартный поток ошибок дочернего процес са, если аргумент capturestderr конструктора являлся истиной, иначе None.

Для экземпляров класса Popen4 всегда равен None.

pid Идентификатор дочернего процесса.

21.7 time — определение и обработка времени Модуль time предоставляет различные функции для работы со временем. Этот модуль всегда доступен, но не все функции определены для всех платформ.

Немного о терминологии и принятых соглашениях.

• Отсчет времени начинается с начала эпохи, 0 часов 1 января определенного года.

Для платформ UNIX это 1970 год. Чтобы определить начало эпохи для Вашей платформы, взгляните на gmtime(0).

290 Глава 21. Доступ к средствам, предоставляемым операционной...

• Функции в этом модуле не могут работать с временем до начала эпохи и после некоторого момента в будущем. Последняя точка определяется библиотекой языка C, лежащей в основе реализации. Для платформы UNIX это обычно 2038 год.

• Реализация библиотек Python зависит от библиотеки языка C для данной платфор мы, которая обычно не имеет проблем с 2000 годом, так как время представляется числом секунд, прошедших с начала эпохи. Функции, работающие с представле нием времени в виде кортежа, как правило, требуют все четыре цифры года. Для совместимости с предыдущими версиями допускается использование двух цифр, если переменная accept2dyear не равна нулю. По умолчанию эта переменная равна 1, однако, если переменная окружения PYTHONY2K установлена и равна непустой строке, accept2dyear инициализируется нулем. Таким образом, Вы можете запретить использование только двух цифр, установив переменную окру жения PYTHONY2K равной непустой строке.

Если представление года двумя цифрами воспринимается, оно преобразуется в соответствии со стандартами POSIX и X/Open: значения 69–99 преобразуются к 1969–1999 и 0–68 к 2000–2068. Значения 100–1899 в любом случае запрещены.

• UTC — Universal Coordinated Time, универсальное синхронизированное время, из вестное также как GMT (Greenwich Mean Time, среднее время по Гринвичу).

• DST — Daylight Saving Time, летнее время — корректировка часового пояса (обыч но) на один час в течение части года. Правила перехода на летнее время опреде ляются местными законами и могут меняться от года к году. Библиотека языка C имеет таблицу с локальными правилами и является в этом отношении единствен ным верным источником.

• Точность различных функций, работающих в реальном времени, может быть мень ше, чем Вы могли бы предположить исходя из единиц, с которыми они работают.

С другой стороны, точность функций time() и sleep() выше, чем точность од ноименных функций библиотеки C на платформе UNIX: время в них выражается вещественным числом, функция time() наиболее точное время (используя функ цию gettimeofday() языка C, если она доступна), функция sleep() восприни мает время с ненулевой дробной частью (используя функцию select() языка C, если она доступна).

• Представление времени в виде кортежа, возвращаемое функциями gmtime(), localtime() и strptime() и воспринимаемое функциями asctime(), mktime() и strftime(), содержит 9 целочисленных элементов:

Индекс Назначение поля Диапазон значений 0 год например 1993, смотрите правила обработки выше 1 месяц 1– 2 день (число) 1– 3 час 0– 4 минута 0– 21.7. time — определение и обработка времени Индекс Назначение поля Диапазон значений 5 секунда 0–61;

значения 60 и 61 использу ются изредка для согласования с солнечным календарем 6 день недели 0–6;

0 соответствует понедельнику 7 юлианское представление даты 1– (числом дней от начала года) 8 флаг коррекции летнего времени 0, 1 или -1;

смотрите ниже Обратите внимание, что в отличие от аналогичной структуры в языке C, значения месяцев находится в диапазоне 1–12, а не 0–11. Значение года обрабатывается так, как описано выше. Флаг коррекции для летнего времени равный -1, как правило, приводит к автоматическому выбору правильного состояния.

Модуль определяет следующие функции и объекты данных:

accept2dyear Если эта переменная не равна нулю, допускается использование представле ния года двумя цифрами. По умолчанию эта переменная равна 1, однако, ес ли переменная окружения PYTHONY2K установлена и равна непустой строке, accept2dyear инициализируется нулем. Таким образом, Вы можете запретить использование только двух цифр, установив переменную окружения PYTHONY2K равной непустой строке. Вы можете также менять значение accept2dyear во время выполнения программы.

altzone() Сдвиг локального часового пояса с учетом перехода на летнее время в секундах на запад от UTC. Это значение всегда отрицательно, если часовой пояс находится восточнее UTC (в том числе и Россия). Используйте эту функцию, только если значение переменной daylight не равно нулю.

asctime(time_tuple) Преобразует кортеж time_tuple, представляющий время (возвращается функ циями gmtime(), localtime() и strptime()), в строку из 24 символов вида ’Sun Jun 20 23:21:05 1993’. Обратите внимание, что в отличие от одно именной функции языка C, строка не завершается символом перехода на новую строку.

clock() Возвращает текущее процессорное время в секундах в виде вещественного чис ла. Точность возвращаемого времени зависит от точности одноименной функции библиотеки языка C. Функция clock() может быть использована, например, для замера производительности.

ctime(secs) Преобразует время secs, выраженное в секундах с начала эпохи в строку, пред ставляющую локальное время. Эквивалентно asctime(localtime(secs)).

292 Глава 21. Доступ к средствам, предоставляемым операционной...

daylight Эта переменная имеет ненулевое значение, если определен часовой пояс с перехо дом на летнее время (DST).

gmtime(secs) Преобразует время secs, выраженное в секундах с начала эпохи в кортеж, пред ставляющий универсальное время (UTC).

localtime(secs) Преобразует время secs, выраженное в секундах с начала эпохи в кортеж, пред ставляющий локальное время. Флаг коррекции времени равен 1 (последний эле мент), если применяется переход на летнее время (DST).

mktime(time_tuple) Эта функция выполняет преобразование, обратное функции localtime(). Аргу мент time_tuple должен быть кортежем из 9 элементов, представляющим ло кальное время. Для совместимости с функцией time() возвращает вещественное число. Если time_tuple не представляет корректного времени, генерирует ис ключение OverflowError.

sleep(secs) Приостанавливает выполнение на secs секунд. Аргумент secs может быть веще ственным числом для указания более точного времени. Реальное время, на которое приостанавливается выполнение программы, может быть меньше secs, так как лю бой перехваченный сигнал прерывает выполнение функции sleep(), после чего выполняется обработчик сигнала. Кроме того, время может быть и больше secs из-за планирования активности различных задач системы.

strftime(format, time_tuple) Возвращает время, выраженное кортежем time_tuple, в виде строки в соот ветствии с форматом format. Строка формата помимо обычных символов может содержать следующие управляющие последовательности (названия месяцев, дней недели и т. п. зависят от текущих национальных установок — см. описание модуля locale):

Последовательность Назначение %a Сокращенное название дня недели.

%A Полное название дня недели.

%b Сокращенное название месяца.

%B Полное название месяца.

%c Общепринятое (в соответствии с текущими националь ными установками) представление даты и времени.

%d Десятичное представление числа (дня месяца), ’01’– ’31’.

%H Десятичное представление часа, ’00’–’23’.

%I Десятичное представление часа, ’01’–’12’.

21.7. time — определение и обработка времени Последовательность Назначение %j Десятичное представление дня года, ’001’–’366’.

%m Десятичное представление месяца, ’01’–’12’.

%M Десятичное представление минут, ’01’–’59’.

%p Национальный эквивалент обозначения ‘AM’ (до полу дня) или ‘PM’ (после полудня).

%S Десятичное представление секунд, ’00’–’61’. Значе ния 60 и 61 используются изредка для согласования с солнечным календарем.

%U Десятичное представление порядкового номера недели года, ’00’–’53’. Считается, что неделя начинается с воскресенья, все дни в новом году до первого воскре сенья относятся к неделе с номером 0.

%w Десятичное представление дня недели, ’0’–’6’ (’0’ соответствует воскресенью).

%W Десятичное представление порядкового номера недели года, ’00’–’53’. Считается, что неделя начинается с понедельника, все дни в новом году до первого поне дельника относятся к неделе с номером 0.

%x Общепринятое (в соответствии с текущими националь ными установками) представление даты.

%X Общепринятое (в соответствии с текущими националь ными установками) представление времени.

%y Представление года без указания века (двумя десятич ными цифрами), ’00’–’99’.

%Y Полное десятичное представление года (четырьмя цифрами).

%Z Название часового пояса (или пустая строка, если ча совой пояс не задан).

%% Буква ‘%’.

Некоторые платформы могут поддерживать дополнительные управляющие после довательности и позволяют указать ширину поля.

strptime(string [, format]) (большинство современных вариантов UNIX) Разбирает строковое представление времени string в соответствии с форматом format и возвращает кортеж с числами, описанный выше. В аргументе format должны использоваться такие же управляющие последовательности, как и в строке формата функции strftime(). По умолчанию format равен строке ’%a %b %d %H:%M:%S %Y’, соответствующей формату, используемому функцией ctime().

Если строка string не соответствует формату format, генерируется исключение ValueError.

294 Глава 21. Доступ к средствам, предоставляемым операционной...

time() Возвращает универсальное время (UTC) в виде вещественного числа в секундах с начала эпохи. Заметим, что не все платформы предоставляют время с точностью большей, чем 1 секунда.

timezone Сдвиг локального часового пояса (без учета перехода на летнее время) в секундах на запад от UTC (то есть положительное в США, равное нулю в Великобритании и отрицательное в России).

tzname Возвращает кортеж из двух строк: первая является названием локального часового пояса без учета перехода на летнее время и вторая — с учетом перехода на летнее время (если таковой не определен, эта строка не должна быть использована).

21.8 sched — планирование задач Модуль sched определяет класс, позволяющий планировать запуск задач:

scheduler(timefunc, delayfunc) Возвращает объект, являющийся планировщиком задач общего назначения. Аргу менты — функции, взаимодействующие с внешним миром. Функция timefunc вызывается без аргументов и должна возвращать число (время, в любых едини цах). Функция delayfunc вызывается с одним аргументом — временем (в тех же единицах, которые использует функция timefunc), должна осуществлять при остановку выполнения на указанное время. Кроме того, чтобы дать возможность выполняться другим потокам в многопоточных приложениях, после выполнения каждой задачи функция timefunc вызывается с аргументом 0.

Экземпляры класса scheduler имеют следующие методы:

enterabs(time, priority, action, arguments) Планирует выполнение новой задачи в указанное время. Аргумент time должен быть числом, выражающим время в тех же единицах, которые использует функция timefunc. В указанное время будет вызвана функция action с аргументами arguments (кортеж). Задачи, запланированные на одно и то же время, будут выполняться в порядке их приоритетов (аргумент priority).

Метод возвращает объект, представляющий запланированную задачу, который мо жет быть использован для ее снятия с помощью метода cancel(), описанного ниже.

enter(delay, priority, action, arguments) Планирует выполнение новой задачи через указанное время. Аргумент delay 21.9. getpass — запрос пароля и определение имени пользователя должен быть числом, выражающим время в тех же единицах, которые исполь зует функция timefunc, по прошествии которого должна быть запущена задача.

Остальные аргументы и возвращаемое значение имеют такое же значение, как и для метода enterabs().

cancel(task) Удаляет задачу из очереди. Если в очереди отсутствует задача task, генерирует исключение RuntimeError.

empty() Возвращает 1, если очередь пуста, иначе возвращает 0.

run() Выполняет все запланированные задачи. Этот метод будет ожидать (используя функцию delayfunc, переданную конструктору) наступления времени, в которое должна быть выполнена каждая задача, выполнит ее и т. д. до тех пор, пока не будут выполнены все задачи в очереди.

Исключения, сгенерированные функциями timefunc, delayfunc и action не обрабатываются. Если исключение сгенерировала функция action, планировщик не будет пытаться выполнить эту задачу при последующих вызовах метода run().

Приведем простой пример:

>>> import sched, time >>> s=sched.scheduler(time.time, time.sleep) >>> def print_time():

... print " print_time:", time.time()...

>>> def print_some_times():

... print time.time()... s.enter(5, 1, print_time, ())... s.enter(10, 1, print_time, ())... s.run()... print time.time()...

>>> print_some_times() 930343690. print_time: 930343695. print_time: 930343700. 930343700. 21.9 getpass — запрос пароля и определение имени поль зователя Модуль getpass определяет две функции:

296 Глава 21. Доступ к средствам, предоставляемым операционной...

getpass([prompt]) (UNIX, Windows, Macintosh) Запрашивает пароль у пользователя без отображения вводимых символов.

В качестве приглашения используется строка prompt (по умолчанию равна ’Password: ’).

getuser() (UNIX, Windows) Возвращает регистрационное имя пользователя. Эта функция последовательно про веряет переменные окружения LOGNAME, USER, LNAME и USERNAME и воз вращает значение первой переменной, имеющей непустое значение. Если ни одна из этих переменных не установлена, используется модуль pwd там, где он доступен (в противном случае генерируется исключение ImportError).

21.10 getopt — обработка опций в командной строке Модуль getopt помогает обрабатывать аргументы, переданные программе в командной строке (sys.argv). Функция getopt() модуля использует такие же правила, как и одноименная функция языка C в UNIX, включая специальное значение аргументов ‘ ’ и ‘--’. Длинная запись опций, аналогичных тем, которые используются программами GNU, также может быть использована, если задан третий аргумент функции getopt().

getopt(args, options [, long_options]) Обрабатывает список аргументов args (обычно sys.argv[1:]).

Аргумент options должен быть строкой из букв, которые будут распознаваться как опции. Если опция требует наличия аргумента, после соответствующей буквы в строке options должно следовать двоеточие (‘:’).

Если задан аргумент long_options, он должен быть списком строк с именами опций, которые будут распознаваться в виде длинной записи, без приставки ‘ -’. После имени опций, требующих аргумента, в строке должен следовать знак равенства (‘=’).

Функция возвращает кортеж из двух элементов: первый является списком пар ‘(option, value)’ (имя опции и соответствующее ей значение) и список аргу ментов, оставшихся необработанными (концевой срез последовательности args).

Строки option в списке пар начинаются с одного дефиса для опций с короткой записью и с двух дефисов для опций с длинной записью. value является аргумен том соответствующей опции или пустой строкой, если опция не имеет аргумента.

Опции в списке следуют в том же порядке, в котором они следовали в args.

Допускается смешение короткой и длинной записи опций.

GetoptError error Исключения этого класса генерируются, если в списке аргументов найдена нерас познанная опция или опция, требующая аргумента, записана без него. Исключение 21.10. getopt — обработка опций в командной строке также будет сгенерировано, если при использовании длинной записи задан аргу мент для опции, которая его не требует. Исключения класса GetoptError имеют следующие атрибуты:

msg Сообщение об ошибке.

opt Имя опции, с которой связана ошибка, или пустая строка, если ошибка не связана с определенной опцией.

Имя GetoptError появилось в версии 1.6. Для совместимости с более старыми версиями присутствует имя error, ссылающееся на GetoptError.

Приведем небольшой пример, использующий только короткую запись опций:

>>> import getopt >>> args = ’-a -b -cfoo -d bar a1 a2’.split() >>> args [’-a’, ’-b’, ’-cfoo’, ’-d’, ’bar’, ’a1’, ’a2’] >>> optlist, args = getopt.getopt(args, ’abc:d:’) >>> optlist [(’-a’, ’’), (’-b’, ’’), (’-c’, ’foo’), (’-d’, ’bar’)] >>> args [’a1’, ’a2’] Использовать длинную запись опций так же просто:

>>> s = ’--condition=foo --testing --output-file... abc.def -x a1 a2’ >>> args = s.split() >>> args [’--condition=foo’, ’--testing’, ’--output-file’, ’abc.def’, ’-x’, ’a1’, ’a2’] >>> optlist, args = getopt.getopt(args, ’x’, [... ’condition=’, ’output-file=’, ’testing’]) >>> optlist [(’--condition’, ’foo’), (’--testing’, ’’), (’--output-file’, ’abc.def’), (’-x’, ’’)] >>> args [’a1’, ’a2’] В реальной программе модуль getopt используется обычно примерно следующим образом:

import getopt, sys 298 Глава 21. Доступ к средствам, предоставляемым операционной...

USAGE = """\...

""" def main():

try:

opts, args = getopt.getopt(sys.argv[1:], ’ho:’, [’help’, ’output=’]) except getopt.GetoptError:

# :

print << sys.stderr, USAGE sys.exit(2) output = None for o, a in opts:

if o in (’-h’, ’--help’):

print USAGE sys.exit() if o in (’-o’, ’--output’):

output = a #...

if name == ’main’:

main() 21.11 tempfile — создание временных файлов Этот модуль предоставляет переносимый способ генерации уникальных имен для вре менных файлов и их создания:

mktemp([suffix]) Возвращает уникальное имя временного файла. Это абсолютный путь файла, кото рый в момент вызова функции не существует. При последующих вызовах функция mktemp() никогда не вернет такое же имя. Если задан аргумент suffix, он будет использоваться в качестве последней части (суффикса) имени файла.

TemporaryFile([mode [, bufsize [, suffix]]]) Возвращает файловый (или аналогичный) объект, который может быть использо ван для временного хранения данных. Файл создается максимально безопасным способом в соответствующем временном каталоге. В UNIX каталог, в котором находится файл, удаляется, что позволяет избежать атак, касающихся создания символической ссылки на файл или замены файла ссылкой на другой файл. В лю бом случае файл автоматически удаляется, как только он будет закрыт (включая неявное закрытие при достижении нуля количества ссылок на файловый объект).

Аргумент mode указывает режим, в котором файл будет открыт. По умолчанию он равен ’w+b’, что позволяет как записывать, так и читать из файла не закрывая 21.12. errno — символические имена стандартных системных... его. Аргумент bufsize имеет такое же значение, как и во встроенной функции open(). Если задан аргумент suffix, он будет использоваться в качестве послед ней части (суффикса) имени файла.

gettempprefix() Возвращает приставку к имени, которая будет использоваться для создания вре менных файлов (не включает в себя имя каталога).

Модуль определяет следующие глобальные переменные, определяющие, каким об разом будет конструироваться имя временного файла. Заметим, что присваивание им нового значения невозможно, если Вы использовали инструкцию вида ‘from tempfile import...’ для импортирования модуля.

tempdir Если эта переменная имеет значение отличное от None, определяет имя каталога, в котором будут создаваться временные файлы. Инициализируется при первом вызо ве функции mktemp(). Значение по умолчанию берется из переменной окружения TMPDIR, TEMP или TMP. Если ни одна из этих переменных не установлена, ис пользуется общепринятая для данной платформы (‘/var/tmp’, ‘/usr/tmp’ или ‘/tmp’ в UNIX) или текущий каталог.

template Если эта переменная имеет значение, отличное от None, определяет пристав ку к именам временных файлов. Инициализируется при первом вызове функции mktemp(). По умолчанию используется ’@pid.’ в UNIX, ’~pid-’ в Windows NT, ’Python-Tmp-’ в Macintosh и ’tmp’ на других платформах.

21.12 errno — символические имена стандартных систем ных ошибок Этот модуль предоставляет символические имена для стандартных системных ошибок.

Значением каждой символической константы является целое число, которое использу ется в качестве кода ошибки в исключениях класса IOError (атрибут errno).

errorcode Словарь, отображающий код ошибки к его имени в данной системе. Например, выражение errorcode[EPERM] дает ’EPERM’.

Для получения сообщения об ошибке, соответствующего ее коду, используйте функцию os.strerror().

Ниже перечислены основные символические константы (в соответствии со стан дартами POSIX.1, ISO C). Из этого списка модуль определяет только те константы, которые используются на данной платформе (Вы можете получить полный список имен доступных констант как результат выражения errno.errorcode.values()):

300 Глава 21. Доступ к средствам, предоставляемым операционной...

EPERM Недопустимая операция.

ENOENT Нет такого файла или каталога.

ESRCH Нет такого процесса.

EINTR Прерван системный вызов.

EIO Ошибка ввода/вывода.

ENXIO Нет такого устройства или адреса.

E2BIG Слишком длинный список аргументов.

ENOEXEC Неверный формат аргументов системного вызова exec().

EBADF Неверный дескриптор файла.

ECHILD Нет дочернего процесса.

EAGAIN Ресурс временно недоступен.

ENOMEM Не хватает памяти.

EACCES Доступ запрещен.

EFAULT Неверный адрес.

EBUSY Устройство или ресурс занят.

EEXIST Файл уже существует.

EXDEV Неверная ссылка (на файл, находящийся на другом устройстве).

ENODEV Нет такого устройства.

21.12. errno — символические имена стандартных системных... ENOTDIR Не является каталогом.

EISDIR Является каталогом.

EINVAL Неверный аргумент.

ENFILE Слишком много открытых файлов в системе (переполнение таблицы файлов).

EMFILE Слишком много открытых файлов.

ENOTTY Неверная операция управления вводом/выводом (устройство должно быть терми налом).

ETXTBSY Текстовый файл занят (например, при попытке выполнить файл, открытый для записи).

EFBIG Файл слишком большой.

ENOSPC На устройстве не осталось свободного места.

ESPIPE Неверное перемещение указателя.

EROFS Файловая система доступна только для чтения.

EMLINK Слишком много ссылок.

EPIPE Нарушен канал (pipe).

EDOM Аргумент математической операции выходит за пределы области допустимых зна чений.

ERANGE Результат математической операции не представим.

EDEADLK Выполнение операции привело бы к взаимной блокировке.

ENAMETOOLONG Слишком длинное имя файла.

302 Глава 21. Доступ к средствам, предоставляемым операционной...

ENOLCK Блокировка записей недоступна.

ENOSYS Функция не реализована.

ENOTEMPTY Каталог не является пустым.

EBADMSG Неверное сообщение.

EILSEQ Неверная последовательность байтов.

EMSGSIZE Слишком длинное сообщение.

ETIMEDOUT Истекло время ожидания завершения операции.

EINPROGRESS Операция в процессе выполнения.

21.13 glob — раскрытие шаблона имен путей Модуль glob находит все имена путей, удовлетворяющих определенному шаблону, в соответствии с правилами, используемыми в UNIX shell. Этот модуль не раскрывает имя домашнего каталога, записанного с помощью символа ‘~’, но корректно сопостав ляет имена, возвращаемые функцией os.listdir() с заданным шаблоном с помощью функции fnmatch.fnmatch() (см. описание модуля fnmatch для ознакомления с син таксисом шаблонов). Если Вы хотите раскрыть имя домашнего каталога, воспользуйтесь функцией os.path.expanduser().

glob(pathname) Возвращает (возможно, пустой) список имен путей, удовлетворяющих шаблону pathname. Аргумент pathname должен быть строкой, содержащей имя пути (аб солютное или относительное) и, возможно, групповые символы (см. описание мо дуля fnmatch). Групповые символы не удовлетворяют разделителю компонент имени пути2.

Допустим, к примеру, что текущий каталог содержит только файлы ‘1.gif’, ‘2.txt’ и ‘card.gif’. Тогда функция glob() будет работать следующим образом (обратите внима ние, что запись начала пути сохраняется):

Специальные последовательности вида ’[seq]’ и ’![seq]’ не должны содержать символы разде лителей имени пути, так как это приведет к некорректной работе функции.

21.14. fnmatch — сопоставление имен файлов с шаблоном >>> from glob import glob >>> glob(’./[0-9].*’) [’./1.gif’, ’./2.txt’] >>> glob(’*.gif’) [’1.gif’, ’card.gif’] >>> glob(’?.gif’) [’1.gif’] 21.14 fnmatch — сопоставление имен файлов с шаблоном Этот модуль предоставляет возможность сопоставления имен файлов (каталогов) с ша блоном, содержащим групповые символы в стиле UNIX shell. Возможность использова ния более сложных шаблонов (регулярных выражений) предоставляет модуль re.

Шаблон может содержать следующие специальные последовательности (групповые символы):

Последовательность Назначение * Удовлетворяет любому количеству любых символов.

? Удовлетворяет (одному) любому символу.

[seq] Удовлетворяет (одному) любому символу, содержащемуся в последовательности seq.

[!seq] Удовлетворяет (одному) любому символу, не содержащемуся в последовательности seq.

Обратите внимание, что разделители компонент имени пути (‘/’, ‘\’, ‘:’) не имеют специального значения. Точка в начале имени файла не рассматривается отдельно и удовлетворяет групповым символам ‘*’ и ‘?’.

fnmatch(filename, pattern) Возвращает 1, если имя файла (каталога) удовлетворяет шаблону pattern, ина че возвращает 0. Если ОС не чувствительна к регистру имен файлов, оба ар гумента перед сопоставлением будут приведены к одному регистру функцией os.path.normcase(). Функция os.path.normcase() также заменяет все вхождения os.altsep на os.sep, то есть, например в Windows, символы ‘\’ и ‘/’ могут использоваться взаимозаменяемо (шаблоны ’/’ и ’\\’ удовлетворяют как ’/’, так и ’\\’).

fnmatchcase(filename, pattern) Возвращает 1, если имя файла (каталога) удовлетворяет шаблону pattern, иначе возвращает 0. Аргументы не подвергаются никакой обработке, сравнение всегда производится с учетом регистра букв.

304 Глава 21. Доступ к средствам, предоставляемым операционной...

Модуль glob позволяет раскрыть шаблон, то есть найти все файлы, удовлетворя ющие шаблону.

21.15 shutil — операции над файлами высокого уровня Модуль shutil предоставляет набор операций высокого уровня над файлами и коллек циями файлов.

Предостережение: в операционных системах Macintosh не используются ответв ления ресурсов и другие метаданные. Это означает, что при копировании файлов ресур сы будут утрачены, тип и коды создателя файлов не будут правильными.

copyfile(src, dst) Копирует содержимое файла именем src в файл с именем dst. Если файл dst существует, он будет заменен.

copyfileobj(fsrc, fdst [, bufsize]) Копирует содержимое файлового (или подобного) объекта fsrc в файловый (или подобный) объект fdst. Если задан аргумент bufsize, он используется в каче стве размера буфера (отрицательные значения означают, что файл не будет копи роваться по частям).

copymode(src, dst) Устанавливает у файла с именем dst биты разрешений доступа такие же, как у файла src.

copystat(src, dst) Устанавливает у файла с именем dst биты разрешений доступа, время последне го доступа и время последнего внесения изменений такие же, как у файла src.

Содержимое файла, владелец и группа остаются неизменными.

copy(src, dst) Копирует файл с именем src в файл с именем dst. Если dst является каталогом, создает (или заменяет) в нем файл с таким же (основным) именем, как и src.

Биты разрешения доступа также копируются.

copy2(src, dst) Работает аналогично функции copy(), но также устанавливает у файла с именем dst время последнего доступа и время последнего внесения изменений такие же, как у файла src (то есть работает аналогично команде ‘cp -p’ в UNIX).

copytree(src, dst [, symlinks]) Рекурсивно копирует дерево каталогов src в dst. Каталог с именем dst не дол жен существовать — он будет создан. Копирование всех файлов производится с помощью функции copy2(). Если задан и является истиной аргумент symlinks, символические ссылки в исходном дереве будут представлены символическими 21.16. signal — обработка асинхронных событий ссылками в новом дереве, в противном случае, в новое дерево будет скопирова но содержимое файлов, на которые указывают символические ссылки. Ошибки, возникающие при копировании, выводятся на стандартный поток ошибок.

Эту функцию следует воспринимать скорее как пример (см. исходный текст моду ля), нежели как реальное средство для работы с файлами.

rmtree(path [, ignore_errors [, onerror]]) Удаляет полностью дерево каталогов path. Если установлен и является истиной аргумент ignore_errors, ошибки, возникающие при удалении, будут проигнори рованы, в противном случае для обработки ошибок вызывается функция onerror (или генерируется исключение, если аргумент onerror не задан).

Обработчик ошибок onerror должен поддерживать вызов с тремя аргументами:

function, path и excinfo. function — функция, которая сгенерировала ис ключение (os.remove() или os.rmdir()), path — имя пути, которое было пе редано функции function, и excinfo — информация об исключении, возвраща емая функцией sys.exc_info(). Исключения, сгенерированные обработчиком ошибок, не обрабатываются.

21.16 signal — обработка асинхронных событий Этот модуль предоставляет возможность устанавливать обработчики сигналов. Несколь ко общих правил:

• Однажды установленный обработчик сигнала остается до тех пор, пока Вы явно не восстановите исходный обработчик. Единственное исключение из этого правила — обработчик сигнала SIGCHLD, работа которого зависит от реализации на данной платформе.

• Не существует способа временно заблокировать сигналы в критических местах.

• Хотя обработчики сигналов и вызываются асинхронно, это может произойти толь ко между атомными инструкциями интерпретатора Python. Это значит, что если сигнал поступает в момент длительной работы процедуры, полностью реализован ной на языке C (например, использование регулярного выражения для поиска в длинном тексте), его обработка может быть отложена на произвольное время.

• При поступлении сигнала во время выполнения операции ввода/вывода после за вершения обработки сигнала может быть сгенерировано исключение.

• Не имеет особого смысла обработка синхронных ошибок, таких как SIGFPE или SIGSEGV.

• Интерпретатор устанавливает некоторое количество обработчиков по умолчанию:

сигнал SIGPIPE игнорируется (таким образом, уведомление об ошибках при ра боте с каналами и сетевыми соединениями может быть выполнено генерацией обычных исключений) и SIGINT генерирует исключение KeyboardInterrupt.

Вы можете заменить любой из этих обработчиков.

306 Глава 21. Доступ к средствам, предоставляемым операционной...

• Следует проявлять некоторую осторожность при использовании модуля в много поточных программах. Основное правило: всегда вызывайте функцию signal() только в основном потоке. Любой поток может использовать функции alarm(), getsignal() и pause(), но только основной — устанавливать обработчик и получать сигнал. Таким образом, сигналы не могут быть использованы для связи между потоками — для этих целей следует использовать блокировки.

Модуль signal определяет следующие константы и функции:

SIG_DFL Используется в качестве аргумента функции signal() и значения, возвращаемо го функцией getsignal() для обозначения обработчика, который используется системой (не интерпретатором) по умолчанию.

SIG_IGN Используется в качестве аргумента функции signal() для обозначения обработ чика, игнорирующего сигнал.

SIG* Символические константы для номеров сигналов. Модуль определяет константы только для тех сигналов, которые поддерживаются в данной системе.

NSIG Имеет значение на единицу большее, чем максимальный номер сигнала в данной системе.

alarm(time) (UNIX) Если аргумент time не равен нулю, запрашивает посылку сигнала SIGALRM теку щему процессу через time секунд. Ранее запланированная посылка сигнала при этом отменяется. Возвращает время в секундах, которое оставалось до посылки ранее запланированного сигнала. Если аргумент time равен нулю, отменяет ранее запланированную посылку сигнала и возвращает время, которое оставалось до его посылки. Если функция alarm() возвращает 0, посылка сигнала до этого не была запланирована.

getsignal(signalnum) Возвращает текущий обработчик сигнала с номером signalnum. Возвращаемое значение может быть объектом, поддерживающим вызов, или одним из специаль ных значений: signal.SIG_IGN, signal.SIG_DFL или None. Значение None означает, что обработчик не был установлен интерпретатором.

pause() (UNIX) Приостанавливает выполнение процесса до получения сигнала, после чего будет вызван соответствующий обработчик.

signal(signalnum, handler) Устанавливает handler в качестве обработчика сигнала с номером signalnum.

Аргумент handler может объектом, поддерживающим вызов, или одним из спе циальных значений: SIG_IGN или SIG_DFL. Возвращает предыдущий обработчик сигнала.

21.17. socket — сетевой интерфейс низкого уровня Функция handler будет вызываться для обработки сигнала signalnum с двумя аргументами: номер сигнала и текущий кадр стека (или None).

В многопоточной программе при попытке вызвать эту функцию из неосновного потока генерируется исключение ValueError.

Приведем простой пример, использующий функцию alarm() для того, чтобы огра ничить время ожидания открытия файла. Это может быть полезно, если файл является последовательным устройством, который может быть не включенным. Использование функции os.open() для таких файлов приведет к зависанию. Для того, чтобы решить эту проблему, можно перед открытием файла запросить посылку сигнала SIGALRM че рез 5 секунд: если операция займет слишком много времени, будет послан сигнал и обработчик сгенерирует исключение.

import signal, os def handler(signum, frame):

raise IOError("Couldn’t open device!") # signal.signal(signal.SIGALRM, handler) # signal.alarm(5) # fd = os.open(’/dev/ttyS0’, os.O_RDWR) # signal.alarm(0) 21.17 socket — сетевой интерфейс низкого уровня Модуль socket предоставляет низкоуровневый доступ к сетевым соединениям. Этот модуль доступен для всех современных вариантов UNIX, Windows, Macintosh, BeOS, OS/2 и, возможно, для некоторых других платформ.

Адреса для сетевых соединений представляются одной строкой для семейства AF_UNIX и как пара ‘(host, port)’ для семейства AF_INET, где host — стро ка, содержащая имя узла (например, ’daring.cwi.nl’) или IP адрес (например, ’100.50.200.5’), и port — номер порта. Воспринимаются также две специальные формы IP адресов: пустая строка соответствует INADDR_ANY и строка ’’ соответствует INADDR_BROADCAST.

Поддержка режима без блокировки осуществляется через метод setblocking().

Модуль socket определяет следующие константы и функции:

308 Глава 21. Доступ к средствам, предоставляемым операционной...

error Исключения этого класса генерируются в случае возникновения ошибок, связан ных с сетевым соединением или адресом. Аргументами исключения являются стро ка, описывающая причину возникновения ошибки, и, возможно, системный код ошибки (см. описание модуля errno).

AF_UNIX (UNIX) AF_INET Эти константы используются в качестве первого аргумента конструктора socket() и указывают семейство, к которому относится адрес соединения (UNIX соединение или соединение с Internet).

SOCK_STREAM SOCK_DGRAM SOCK_RAW SOCK_RDM SOCK_SEQPACKET Эти константы используются в качестве второго аргумента конструктора socket() и указывают тип соединения (обычно используются только первые два типа).

INADDR_* IP_* IPPORT_* IPPROTO_* MSG_* SO_* SOL_* SOMAXCONN Множество констант такого вида определено в этом модуле и обычно использу ются в качестве аргументов методов setsockopt() и getsockopt() объектов, представляющих сетевое соединение. Информацию о них Вы можете получить в документации UNIX по сетевым соединениям и протоколу IP.

getfqdn([name]) Возвращает полное уточненное доменное имя для name. Если аргумент name опу щен или является пустой строкой, он считается соответствующим локальному уз лу. Для того, чтобы получить полное уточненное имя, проверяется сначала имя узла, возвращаемое функцией gethostbyaddr(), затем псевдонимы, если они имеются. Выбирается первое имя, содержащее точку. В случае, если уточненное имя не доступно, возвращает имя узла. Функция доступна, начиная с версии 2.0.

gethostbyname(hostname) Возвращает строку, содержащую IP адрес узла с именем hostname. Если строка hostname содержит IP адрес, она возвращается без изменений.

gethostbyname_ex(hostname) Возвращает кортеж ‘(mainhostname, aliaslist, ipaddrlist)’, где mainhostname — основное имя узла, соответствующего hostname, aliaslist — список (возможно пустой) альтернативных имен для того же 21.17. socket — сетевой интерфейс низкого уровня адреса и ipaddrlist — список IP адресов для того же интерфейса к тому же узлу (обычно содержит одну строку).

gethostname() Возвращает строку, содержащую имя узла машины, на которой в данный момент выполняется интерпретатор языка Python. Если Вы хотите получить IP адрес те кущей машины, используйте gethostbyname(gethostname()). Заметим, что функция gethostname() не всегда возвращает полное имя — для этих целей следует использовать getfqdn(gethostname()).

gethostbyaddr(ip_address) Возвращает кортеж ‘(hostname, aliaslist, ipaddrlist)’, где hostname — основное имя узла, соответствующего IP адресу ip_address, aliaslist — список (возможно пустой) альтернативных имен для того же адреса и ipaddrlist — список IP адресов для того же интерфейса к тому же узлу (обычно содержит одну строку).

getprotobyname(protocolname) Возвращает число, подходящее для использования в качестве третьего аргумен та функции socket() и соответствующее протоколу с именем protocolname.

Это необходимо только, если Вы открываете соединение в “прямом” режиме (SOCK_RAW), для остальных типов соединений правильный протокол выбирается автоматически, если соответствующий аргумент опущен или равен нулю.

getservbyname(servicename, protocolname) Возвращает номер порта для службы с именем servicename и протоколом с именем protocolname. Имя протокола должно быть равным ’tcp’ или ’udp’.

socket(family, type [, proto]) Создает новое сетевое соединение и возвращает соответствующий ему объект.

family — семейство адресов (AF_INET или AF_UNIX), type — тип соединения (одна из констант SOCK_*) и proto — номер протокола. Если аргумент proto опущен, протокол выбирается автоматически.

fromfd(fd, family, type [, proto]) Создает объект сетевого соединения из файлового дескриптора fd и возвращает его. Файловый дескриптор должен соответствовать сетевому соединению (однако это не проверяется — последующие операции могут вызвать ошибку, если де скриптор непригоден). Остальные аргументы имеют такое же значение, как и для функции socket().

ntohl(x) Преобразует представление 32-битового целого числа с общепринятым в сети по рядком следования байтов к представлению с порядком следования байтов на дан ной машине.

ntohs(x) Преобразует представление 16-битового целого числа с общепринятым в сети по рядком следования байтов к представлению с порядком следования байтов на дан ной машине.

310 Глава 21. Доступ к средствам, предоставляемым операционной...

htonl(x) Преобразует представление 32-битового целого числа с порядком следования бай тов на данной машине к представлению с общепринятым в сети порядком следо вания байтов.

htons(x) Преобразует представление 16-битового целого числа с порядком следования бай тов на данной машине к представлению с общепринятым в сети порядком следо вания байтов.

inet_aton(ip_string) Возвращает строку из четырех символов, содержащую IP адрес ip_string (стро ка вида ’123.45.67.89’) в упакованном двоичном виде. Эта функция может быть полезна для связи с программой, использующей стандартную библиотеку языка C.

inet_ntoa(packed_ip) Возвращает строку с IP адресом, полученным распаковкой строки из четырех сим волов packed_ip, содержащей упакованное двоичное представление адреса.

SocketType Тип объекта сетевого соединения, возвращаемого функцией socket().

Объекты сетевого соединения, возвращаемые функцией socket(), имеют следу ющие методы:

accept() Принимает соединение и возвращает пару ‘(conn, address)’, где conn — но вый объект сетевого соединения, подходящий для посылки и получения данных, и address — адрес другого конца сетевого соединения. Объект сетевого соеди нения, к которому применяется метод accept(), должен быть привязан к адресу (метод bind()) и ожидать соединения (метод listen()).

bind(address) Привязывает сетевое соединение к адресу address. Перед вызовом этого мето да объект не должен быть привязанным к адресу. Формат аргумента зависит от семейства, к которому относится адрес (см. начало раздела).

close() Закрывает сетевое соединение, после чего все операции над объектом будут вы зывать ошибку. Сетевое соединение автоматически закрывается при достижении нуля количества ссылок на объект сетевого соединения.

connect(address) Подсоединяется к удаленному узлу с адресом address. Формат аргумента зависит от семейства, к которому относится адрес (см. начало раздела).

connect_ex(address) Работает аналогично методу connect(), но возвращает код ошибки, возвращае мый системной функцией connect() вместо того, чтобы генерировать исключе ние. Возвращаемое значение равно 0 в случае успешного выполнения операции и 21.17. socket — сетевой интерфейс низкого уровня значению системной переменной errno при возникновении ошибки. Метод может быть полезен для асинхронных соединений.

fileno() Возвращает файловый дескриптор сетевого соединения (целое число). Может быть полезен совместно с функцией select.select().

getpeername() Возвращает адрес удаленного узла, с которым установлено соединение. Формат возвращаемого значения зависит от семейства, к которому относится адрес (см.

начало раздела). Метод может быть полезен, например, для определения номера порта на другом конце IP соединения.

getsockname() Возвращает собственный адрес. Формат возвращаемого значения зависит от семей ства, к которому относится адрес (см. начало раздела). Метод может быть полезен, например, для определения номера порта.

getsockopt(level, optname [, buflen]) Возвращает значение опции optname. В качестве аргумента optname может быть использована одна из символических констант вида SO_*, определенных в модуле.

Если аргумент buflen опущен, возвращает целочисленное значение опции. Если аргумент buflen задан, он указывает максимальную длину возвращаемой строки.

listen(backlog) Ожидает установления сетевого соединения. Аргумент backlog определяет мак симальное число соединений в очереди и должен быть не меньше единицы (макси мальное значение зависит от системы, обычно равно 5).

makefile([mode [, bufsize]]) Возвращает файловый объект (типа file, см. раздел 11.7), ассоциированный с се тевым соединением. Файловый объект ссылается на дубликат файлового дескрип тора для сетевого соединения, таким образом, файловый объект и объект сетевого соединения могут быть закрыты (в том числе неявно — при достижении нуля ко личества ссылок на объект) независимо друг от друга. Аргументы mode и bufsize имеют такое же значение, как и для встроенной функции open().

recv(bufsize [, flags]) Получает данные через сетевое соединение и возвращает их в виде строки. Мак симальное количество данных, получаемое за один раз, определяется аргументом bufsize. Описание возможных значений аргумента flags смотрите в докумен тации для системной функции recv().

recvfrom(bufsize [, flags]) Работает аналогично методу recv(), но возвращает пару ‘(string, address)’, где string — строка с полученными данными и address — адрес, с которого данные были посланы. Формат address зависит от семейства, к которому отно сится адрес (см. начало раздела).

312 Глава 21. Доступ к средствам, предоставляемым операционной...

send(string [, flags]) Посылает данные через сетевое соединение. Соединение должно быть установ ленным. Аргумент flags имеет такое же значение, как и для метода recv().

Возвращает размер посланных данных в байтах.

sendto(string [, flags], address) Посылает данные на узел с адресом address. Соединение не должно быть уста новленным. Аргумент flags имеет такое же значение, как и для метода recv().

Возвращает размер посланных данных в байтах. Формат аргумента зависит от се мейства, к которому относится адрес (см. начало раздела).

setblocking(flag) Если flag равен 0, устанавливает режим без блокировки, иначе устанавливает режим с блокировкой. Изначально все сетевые соединения находятся в режиме с блокировкой. В режиме без блокировки, если операция recv() или send() не может быть выполнена немедленно, генерируется исключение error. В режиме с блокировкой вызов методов recv() или send() приведет к блокированию до тех пор, пока операция не будет выполнена.

setsockopt(varlevel, optname, value) Устанавливает значение опции optname равным value. В качестве аргумента optname может быть использована одна из символических констант вида SO_*, определенных в модуле. Аргумент value может быть целым числом или строкой с упакованными данными.

shutdown(how) Отключает одну или обе половины соединения. Если аргумент how равен 0, в дальнейшем получение данных будет запрещено. Если аргумент how равен 1, за прещена будет передача данных. Если аргумент how равен 2, в дальнейшем будет запрещено как получение, так и передача данных.

Приведем два простых примера, использующих TCP/IP протокол: сервера, посы лающего назад полученные данные (обслуживая только одного клиента), и клиента, его использующего. Обратите внимание, что сервер должен вызвать последовательно мето ды socket(), bind(), listen(), accept() (возможно повторяя вызов accept(), если необходимо обслуживать несколько клиентов), в то время как клиенту необходи мо выполнить только socket(), connect(). Кроме того, сервер применяет методы send() и recv() не к объекту, ожидающему соединения, а к новому объекту, возвра щаемому методом accept().

# import socket # HOST = ’’ # PORT = 21.18. select — ожидание завершения ввода/вывода s = socket.socket(socket.AF_INET, socket.SOCK_STREAM) s.bind((HOST, PORT)) s.listen(1) conn, addr = s.accept() print ’ ’, addr while 1:

data = conn.recv(1024) if not data: break conn.send(data) conn.close() # import socket # HOST = ’daring.cwi.nl’ #, PORT = s = socket.socket(socket.AF_INET, socket.SOCK_STREAM) s.connect((HOST, PORT)) s.send(’Hello, world’) data = s.recv(1024) s.close() print ’ :’, ‘data‘ 21.18 select — ожидание завершения ввода/вывода Этот модуль предоставляет доступ к системным функциям select() и poll(). За метим, что в Windows функция select() работает только для сетевых соединений. В UNIX средства, предоставляемые модулем, работают также с другими типами файлов, в частности, каналами. Однако эти средства не могут быть использованы для определения увеличения в размерах обычного файла.

error Исключения этого класса генерируются при возникновении различных ошибок. В качестве аргументов при инициализации используются номер системной ошибки и соответствующая ему поясняющая строка.

select(iwtd, owtd, ewtd [, timeout]) Первые три аргумента — списки, которые могут содержать файловые дескрип торы или объекты с методом fileno(), возвращающим файловый дескриптор.

iwtd — список объектов для ввода, owtd — для вывода и ewtd — для исключи тельных ситуаций (вывода ошибок). Аргумент timeout указывает максимальное 314 Глава 21. Доступ к средствам, предоставляемым операционной...

время ожидания, если он опущен, функция блокирует выполнение до тех пор, пока один из дескрипторов не будет готов.

Функция select() возвращает кортеж из трех списков, являющихся подсписками аргументов iwtd, owtd и ewtd и содержащих объекты, готовые к вводу/выводу.

При достижении максимального времени ожидания, возвращает кортеж из трех пустых списков.

poll() (большинство вариантов UNIX) Возвращает объект, поддерживающий регистрацию файловых дескрипторов и реа лизующий их опрос на предмет наступления событий ввода/вывода.

Объекты, возвращаемые функцией poll(), имеют следующие методы:

register(fd [, eventmask]) Регистрирует файловый дескриптор (или объект с методом fileno(), возвра щающим файловый дескриптор) fd. При последующих вызовах метода poll() файловый дескриптор будет проверяться на предмет наступления событий вво да/вывода. Аргумент eventmask может быть комбинацией (с помощью оператора ‘|’) констант POLLIN, POLLPRI и POLLOUT и указывает интересующие типы собы тий. По умолчанию проверяется наступление событий всех трех типов. Повторная регистрация одного и того же файлового дескриптора не является ошибкой.

unregister(fd) Снимает с регистрации файловый дескриптор (или объект с методом fileno(), возвращающим файловый дескриптор) fd. При попытке снять с регистрации объ ект, который не был зарегистрирован, будет сгенерировано исключение KeyError.

poll([timeout]) Опрашивает зарегистрированные файловые дескрипторы на предмет наступления событий ввода/вывода и возвращает список пар вида ‘(fd, event)’, где fd — файловый дескриптор, для которого наступило событие и возникла ошибка, и event — комбинация констант (см. ниже), описывающих наступившее событие или возникшую ошибку. Аргумент timeout указывает максимальное время ожи дания, если он опущен, метод блокирует выполнение до тех пор, пока один из дескрипторов не будет готов. При достижении максимального времени ожидания, возвращает пустой список.

Ниже приведены константы, комбинации которых могут быть использованы в каче стве аргумента eventmask метода register() и в результате, возвращаемом методом poll():

POLLIN Имеются данные для чтения.

POLLPRI Имеются экстренные данные для чтения.

21.19. mmap — отображение файлов в память POLLOUT Файловый дескриптор готов к выводу (то есть запись не приведет к блокированию).

POLLERR Исключительная ситуация.

POLLHUP Зависание.

POLLNVAL Неверный запрос: дескриптор не открыт.

21.19 mmap — отображение файлов в память Модуль mmap доступен в операционных системах UNIX и Windows и позволяет отобра жать файлы в память. Объекты, представляющие отображенные в память файлы, ведут себя с одной стороны как изменяемые строки, с другой — как файловые объекты. В большинстве случаев вы можете использовать эти объекты вместо строк. Например, с помощью модуля re Вы можете осуществлять поиск в отображенном в память файле.

Вы можете вносить изменения в файл как в изменяемую последовательность (напри мер, ‘mapped_file[i] = char’ или ‘mapped_file[i:j] = string’) различными способами, если эти изменения не требуют изменения размера файла.

Модуль определяет следующий конструктор:

mmap(fd, size [, *platform_args]) Отображает в память size байт файла, соответствующего файловому дескриптору fd. Если Вы хотите отобразить файл, соответствующий файловому объекту, — используйте его метод fileno().

Назначение дополнительных аргументов (platform_args) зависит от использу емой платформы. В Windows может быть указано имя создаваемого отображе ния (повторное использование имени приведет к использованию ранее созданного отображения). В UNIX могут быть указаны два дополнительных аргумента: flags и prot. Аргумент flags может иметь значение MAP_SHARED (используется по умолчанию) или MAP_PRIVATE и определяет характер отображения. В качестве аргумента prot может использоваться комбинация из констант PROT_* (по умол чанию используется PROT_READ | PROT_WRITE), определяющих желаемую сте пень защиты памяти.

В качестве значений аргументов, характерных для UNIX, Вы можете использовать следующие константы (наиболее важные):

MAP_SHARED Отображение является общим для всех процессов.

316 Глава 21. Доступ к средствам, предоставляемым операционной...

MAP_PRIVATE Отображение является частным. При внесении изменений создается копия. Таким образом, все изменения видны только текущему процессу.

PROT_READ Обеспечивает доступ к отображению на чтение.

PROT_WRITE Обеспечивает доступ к отображению на запись.

Объекты, представляющие отображенный в память файл, имеют следующие мето ды:

close() Закрывает отображение. Последующие операции над объектом приведут к ошибке.

find(string [, start]) Возвращает наименьший индекс, указывающий, где найдена подстрока string.

Аргумент start является индексом, указывающим с какого места необходимо производить поиск (по умолчанию он равен 0).

flush([offset, size]) Сбрасывает на диск изменения, внесенные в отображение файла. Без вызова этого метода не гарантируется, что внесенные изменения будут записаны до того, как объект отображения будет уничтожен. Если указаны аргументы offset и size, то сбрасываются только изменения в диапазоне (в байтах) от offset до offset + size, в противном случае сбрасывается все содержимое.

move(dest, src, count) Копирует count байт из диапазона, начинающегося с индекса src, в диапазон, начинающийся с индекса dest.

read_byte() Считывает и возвращает один символ из отображенного файла, то есть возвращает строку с одним символом в текущей позиции отображенного файла и перемещает указатель на 1.

readline() Считывает и возвращает строку из отображенного файла, начиная с текущей пози ции, до символа перехода на новую строку (включая его) или конца отображения.

resize(newsize) Изменяет размер отображенного в память файла. Размер отображения становится равным newsize байт.

seek(pos [, whence]) Устанавливает текущую позицию в файле. Необязательный аргумент whence ука зывает на точку отсчета: 0 (по умолчанию) — начало файла, 1 — текущая позиция и 2 — конец файла.

21.19. mmap — отображение файлов в память size() Возвращает размер файла в байтах, который может быть больше размера отобра женной в память области.

tell() Возвращает текущую позицию в файле.

write(string) Записывает строку string в отображенный файл, начиная с текущей позиции.

После этого указатель устанавливается на следующий после записанной строки байт.

write_byte(byte) Записывает один символ byte в отображенный файл (перемещает указатель на 1).

Глава Средства организации многопоточных программ thread Создание нескольких потоков и управление ими.

threading Средства высокого уровня организации потоков.

Queue Синхронизированные очереди.

22.1 thread — создание нескольких потоков и управление ими Модуль thread предоставляет средства низкого уровня для работы с несколькими пото ками, совместно использующими глобальные данные. Для синхронизации модуль предо ставляет простые средства блокировки.

error Исключения этого класса генерируются в случае возникновения ошибок, специ фичных для этого модуля.

LockType Объект типа для объектов блокировки.

start_new_thread(function, args [, kwargs]) Создает новый поток и выполняет в нем функцию function, используя в качестве позиционных и именованных аргументов args (кортеж) и kwargs (словарь).

exit() exit_thread() Генерирует исключение SystemExit. Если исключение (в данном потоке) не об рабатывается, выполнение потока будет молча завершено. Имя exit_thread() определено для совместимости со старыми версиями.

allocate_lock() Возвращает новый объект, реализующий блокировку. Изначально объект не явля ется заблокированным.

22.1. thread — создание нескольких потоков и управление ими get_ident() Возвращает идентификатор текущего потока (отличное от нуля целое число). По сле завершения работы потока его идентификатор может быть использован повтор но для нового потока.

Объекты, возвращаемые функцией allocate_lock, имеют следующие мето ды:

acquire([waitflag]) При вызове без аргументов захватывает (блокирует) объект, дождавшись, если это необходимо, его освобождения другим потокам (возвращает None). Если задан ар гумент waitflag (целое число), поведение функции зависит от его значения: 1 — функция ожидает освобождения объекта другим потокам (так же, как и с опущен ным аргументом), 0 (и другие значения) — объект захватывается только, если это может быть сделано немедленно. При наличии аргумента функция возвращает 1, если захват объекта прошел успешно, в противном случае возвращает 0.

release() Освобождает объект. Объект должен быть захвачен ранее, но не обязательно в этом же потоке.

locked() Возвращает текущий статус объекта: 1, если объект захвачен (заблокирован), ина че — 0.

Замечания:

• Если доступен модуль signal, прерывание (исключение KeyboardInterrupt) получает основной поток. Однако, если модуль signal недоступен, прерывание может получить любой поток.

• Вызов функций sys.exit() и thread.exit() и генерация исключения SystemExit эквивалентны.

• Не все функции, реализованные на языке C, при ожидании ввода/вывода позволяют выполняться другим потокам, но наиболее популярные (функции time.sleep() и select.select(), метод read() файловых объектов) рабо тают правильно.

• Невозможно прервать выполнение метода acquire() объектов, предназначенных для блокировки, — исключение KeyboardInterrupt будет сгенерировано только после захвата объекта.

• Поведение при завершении работы основного потока раньше других зависит от платформы. Обычно остальные потоки немедленно завершают свою работу без выполнения ветвей finally инструкций try и вызова деструкторов объектов.

320 Глава 22. Средства организации многопоточных программ 22.2 threading — средства высокого уровня организации потоков Модуль threading предоставляет средства высокого уровня для работы с несколькими потоками, реализованные поверх модуля thread. Этот модуль безопасен для импорти рования с помощью инструкции ‘from threading import *’.

activeCount() Возвращает число объектов, представляющих активные потоки. Это значение рав но длине списка, возвращаемого функцией enumerate().

Condition([lock]) Создает и возвращает объект, реализующий условие. Этот объект позволяет одно му или нескольким потокам ожидать уведомления от другого потока. Если задан аргумент lock, он должен быть объектом, возвращаемым функцией Lock() или RLock(). Этот объект будет использован для блокировки. По умолчанию создает ся новый объект с помощью функции RLock().

currentThread() Возвращает объект, соответствующий текущему потоку. Если текущий поток не был создан с помощью модуля threading, возвращаемый объект будет иметь ограниченную функциональность.

enumerate() Возвращает список объектов, соответствующих активным потокам, созданным с помощью модуля threading (в том числе и фоновые). Список всегда включает объекты для текущего и основного потока и не включает объекты, соответствую щие потокам, которые уже завершили или еще не начали свое выполнение.

Event() Создает и возвращает объект, реализующий событие. Этот объект позволяет пото ку ожидать наступления (установки в другом потоке) события.

Lock() Создает и возвращает объект, реализующий примитивную блокировку. В текущих реализациях является псевдонимом для функции thread.allocate_lock().

RLock() Создает и возвращает объект, реализующий блокировку. В отличие от объекта, возвращаемого функцией Lock(), допускает повторный захват в том же потоке.

Объект должен быть освобожден тем же потоком ровно столько раз, сколько он был захвачен.

Semaphore([count]) Создает и возвращает объект, реализующий семафор. Семафор может быть захва чен не более count раз (по умолчанию 1). При последующих попытках захватить семафор ожидает, пока другой поток не освободит его.

22.2. threading — средства высокого уровня организации потоков Thread([keyword_list]) Этот класс используется для представления потока. Конструктор воспринимает несколько именованных аргументов (keyword_list). Действия, выполняемые при запуске потока, могут быть установлены с помощью аргумента с именем target — должен быть объектом, поддерживающим вызов. Этот объект вызыва ется из метода run() с позиционными и именованными аргументами, заданными соответственно аргументами с именами args и kwargs (по умолчанию исполь зуются пустые кортеж и словарь). Аргумент с именем name указывает имя пото ка;

по умолчанию используется ’Thread-N’, где N — десятичное представление небольшого целого числа.

Интерфейсы объектов описаны в следующих разделах.

22.2.1 Объекты, реализующие блокировку Функции Lock() и RLock() возвращают объекты, имеющие одинаковый набор мето дов:

acquire([waitflag]) При вызове без аргументов захватывает (блокирует) объект, дождавшись, если это необходимо, его освобождения другим потокам (возвращает None). Если задан ар гумент waitflag (целое число), поведение функции зависит от его значения: 1 — функция ожидает освобождения объекта другим потокам (так же, как и с опущен ным аргументом), 0 (и другие значения) — объект захватывается только, если это может быть сделано немедленно. При наличии аргумента функция возвращает 1, если захват объекта прошел успешно, в противном случае возвращает 0.

release() Освобождает объект. Объект должен быть захвачен ранее. Если метод применяется к объекту, возвращаемому функцией RLock(), объект должен быть захвачен этим же потоком.

В то время как объекты, возвращаемые функцией Lock(), реализуют примитив ную блокировку (объект может быть захвачен один раз), для объектов, возвращаемых функцией RLock(), метод acquire() может быть вызван многократно одним пото ком — для того, чтобы объект мог быть захвачен другим потоком, необходимо ровно столько же раз вызвать метод release().

22.2.2 Условия Объекты, возвращаемые функцией Condition() всегда ассоциированы с объектом, реализующим блокировку. Такой объект может быть указан в качестве аргумента при инициализации или, по умолчанию, будет создан конструктором.

322 Глава 22. Средства организации многопоточных программ Объект, представляющий условие, имеет методы acquire() и release(), кото рые вызывают соответствующие методы ассоциированного объекта, реализующего бло кировку. Он также имеет методы wait(), notify() и notifyAll(), которые должны вызываться только после того, как будет вызван метод acquire(). При вызове метода wait() объект-условие освобождает ассоциированный объект и блокирует выполнение до тех пор, пока из другого потока не будет вызван метод notify() или notifyAll().

После пробуждения метод снова захватывает ассоциированный объект. Вы можете ука зать максимальное время ожидания.

Методы notify() и notifyAll() не освобождают ассоциированный объект, реа лизующий блокировку. Таким образом, поток или потоки, вызвавшие метод wait(), бу дут пробуждены только после того, как поток, вызвавший notify() или notifyAll() окончательно освободит ассоциированный объект.

Приведем простой пример с производством и потреблением объектов. Пусть функ ция make_an_item_available() производит объект, get_an_available_item() его потребляет и an_item_is_available() возвращает истину, если есть в наличии произведенные (но еще не употребленные) объекты. Тогда следующие фрагменты кода могут быть использованы в потоках производителя и потребителя соответственно:

# cv.acquire() make_an_item_available() cv.notify() cv.release() # cv.acquire() while not an_item_is_available():

cv.wait() get_an_available_item() cv.release() acquire([...]) release() Вызывают одноименные методы ассоциированного объекта, реализующего блоки ровку.

wait([timeout]) Освобождает ассоциированный объект, реализующий блокировку, ожидает, пока другим потоком не будет вызван метод notify() или notifyAll(), и сно ва захватывает ассоциированный объект. Если задан и не равен None аргумент timeout (вещественное число), он указывает максимальное время ожидания в секундах. По умолчанию время ожидания не ограничено.

Если для блокировки используется объект, возвращаемый функцией RLock(), этот метод использует его детали реализации для полного освобождения и вос становления уровня захвата объекта.

22.2. threading — средства высокого уровня организации потоков notify() Пробуждает один поток, ожидающий выполнения условия, если таковой имеется.

notifyAll() Пробуждает все потоки, ожидающие выполнения условия.

22.2.3 Семафоры Объекты, возвращаемые функцией Semaphore() имеют такой же набор методов, как и объекты, реализующие блокировку (см. раздел 22.2.1). Семафор управляет внутренним счетчиком, который уменьшается при каждом вызове метода acquire() и увеличива ется при каждом вызове метода release(). Начальное значение счетчика определяет аргумент, переданный конструктору Semaphore(). Значение счетчика не может стать меньше нуля: вызов метода acquire() при значении счетчика равным нулю блокирует выполнение до тех пор, пока значение не увеличится, то есть пока другой поток не вызовет метод release().

22.2.4 События Объекты, возвращаемые функцией Event() реализуют простейший механизм взаимо действия потоков: один поток подает сигнал о возникновении события и один или более потоков ожидают его. Объект-событие имеет внутренний флаг. Если этот флаг являет ся истиной, событие считается наступившим. Изначально (при создании объекта) флаг является ложью.

isSet() Возвращает 1, если событие наступило (внутренний флаг является истиной).

set() Устанавливает наступление события (внутренний флаг становится истинным). Все потоки, ожидающие события, пробуждаются.

clear() Отменяет наступление события (внутренний флаг становится ложным).

wait([timeout]) Ожидает наступления события, то есть, если внутренний флаг является ложью, блокирует выполнение потока до тех пор, пока другой поток не вызовет метод set(). Если задан и не равен None аргумент timeout (вещественное число), он указывает максимальное время ожидания в секундах. По умолчанию время ожидания не ограничено.

324 Глава 22. Средства организации многопоточных программ 22.2.5 Объекты, представляющие потоки Экземпляры класса Thread представляют действия, выполняемые в отдельном потоке.

Существует два способа определить эти действия: передача объекта, поддерживающего вызов, в качестве аргумента с именем target или переопределение метода run() в производных классах. В производных классах не следует переопределять другие методы, за исключением, возможно, конструктора. Если Вы переопределяете конструктор, не забудьте вызвать конструктор дочернего класса (Thread.init()) до того, как Вы будете что-либо делать с потоком.

После создания объекта, представляющего поток, Вы можете запустить его с по мощью метода start(). После запуска поток считается активным до тех пор, пока не закончится выполнение метода run().

Каждый поток, реализованный с помощью Thread или производного от него клас са имеет имя. Имя может быть задано при инициализации или с помощью метода setName() и извлечено с помощью метода getName().

Поток может “присоединиться” к другому потоку, вызвав метод join() объекта, представляющего этот поток. При этом выполнение потока, вызвавшего метод join() приостанавливается до тех пор, пока не завершится выполнение потока, к объекту ко торого был применен метод.

Поток может быть помечен как фоновый (daemon). Выполнение всей программы будет завершено только после того, как активными останутся только фоновые потоки.

Начальное значение наследуется от текущего потока. Этот флаг может быть изменен с помощью метода setDaemon() и извлечен с помощью метода getDaemon().

Существует также объект, соответствующий основному потоку. Основной поток не является фоновым. Возможно также создание объектов, соответствующих “посто ронним” потокам, то есть потокам, созданным без помощи модуля threading. Такие объекты имеют ограниченную функциональность. Они всегда считаются активными, фо новыми и к ним нельзя присоединиться с помощью метода join().

start() Запускает выполнение задачи (метод run() объекта) в отдельном потоке. Этот метод может быть вызван не более одного раза.

run() Этот метод представляет задачу, которая должна быть выполнена в отдельном потоке. Вы можете переопределить этот метод в производном классе. Стандартный метод run() вызывает функцию, указанную при инициализации объекта (аргумент с именем target).

join([timeout]) Этот метод приостанавливает работу текущего потока (который вызвал метод) до окончания выполнения потока, к объекту которого метод применяется. Если задан и не равен None аргумент timeout (вещественное число), он указывает макси 22.3. Queue — синхронизированные очереди мальное время в секундах ожидания завершения работы потока. По умолчанию (и если аргумент timeout равен None) время ожидания не ограничено.

К одному потоку можно присоединиться несколько раз. Поток не может присоеди ниться к самому себе, так как это привело бы к (мертвой) блокировке самого себя.

К потоку нельзя присоединиться до того, как он будет запущен.

getName() Возвращает имя потока.

setName(name) Устанавливает имя потока. Имя потока является строкой, которая может быть использована для его идентификации. Несколько потоков могут иметь одинаковое имя. Начальное имя устанавливается конструктором.

isAlive() Возвращает 1, если поток активен. Поток считается активным с момента вызова метода start() и до завершения выполнения задачи (метода run()).

isDaemon() Возвращает значение внутреннего флага, который является истиной, если поток выполняется в фоновом режиме.

setDaemon(daemonic) Устанавливает значение внутреннего флага, определяющего, в каком режиме вы полняется поток, равным daemonic: если флаг является истиной, поток будет выполняться в фоновом режиме. Этот метод должен вызываться до запуска пото ка. Начальное значение наследуется от потока, создавшего данный поток.

Работа всей программы может быть завершена только после завершения работы всех нефоновых потоков.

22.3 Queue — синхронизированные очереди Модуль Queue определяет класс, реализующий очередь (FIFO), доступ к которой может осуществляться из нескольких потоков. Доступность этого модуля зависит от наличия модуля thread.

Queue(maxsize) Создает и возвращает объект-очередь. Аргумент maxsize (целое число) определя ет максимальное количество элементов, которое можно поместить в очередь. По умолчанию, а также если maxsize меньше или равен нулю, размер очереди не ограничен.

Empty Исключения этого класса генерируются при попытке извлечь из пустой или за блокированной очереди элемент с помощью метода get_nowait() (или get() с аргументом block равным нулю).

326 Глава 22. Средства организации многопоточных программ Full Исключения этого класса генерируются при попытке добавить в полную или за блокированную очередь элемент с помощью метода put_nowait() (или put() с аргументом block равным нулю).

Экземпляры класса Queue имеют следующие методы:

qsize() Возвращает количество элементов в очереди (в момент вызова метода).

empty() Возвращает 1, если очередь (в момент вызова метода) пуста, иначе возвращает 0.

full() Возвращает 1, если очередь (в момент вызова метода) содержит максимальное количество элементов, иначе возвращает 0.

put(item [, block]) Добавляет элемент в очередь. Если аргумент block опущен или является истиной, выполнение потока при необходимости приостанавливается до тех пор, пока в оче реди не появится свободное место. Если аргумент block является ложью, элемент добавляется в очередь только, если это можно сделать немедленно, в противном случае генерируется исключение Full.

put_nowait(item) Эквивалентно вызову put(item, 0).

get([block]) Извлекает (удаляет) элемент из очереди и возвращает его. Если аргумент block опущен или является истиной, выполнение потока при необходимости приостанав ливается до тех пор, пока в очереди не появится элемент. Если аргумент block является ложью, элемент извлекается из очереди только, если это можно сделать немедленно, в противном случае генерируется исключение Empty.

get_nowait() Эквивалентно вызову get(0).

Не следует полагаться на значения, возвращаемые методами qsize(), empty() и full(): к моменту их получения ситуация может уже измениться.

Глава Работа с базами данных Модули, описанные в этой главе, предоставляют доступ к простым базам данных, реа лизуя интерфейс, аналогичным словарям. Во всех случаях в качестве ключа и значения могут использоваться только обычные строки1. Если Вы хотите хранить объекты языка Python другого типа, воспользуйтесь модулем shelve.

anydbm Универсальный интерфейс к базам данных в стиле DBM.

dumbdbm Медленная, но переносимая реализация интерфейса DBM.

dbhash Интерфейс в стиле DBM к библиотеке баз данных BSD.

dbm Интерфейс к библиотеке (n)dbm.

gdbm Интерфейс к библиотеке gdbm.

whichdb Определяет, какой модуль с интерфейсом DBM был использован для со здания файла базы данных.

bsddb Интерфейс к библиотеке баз данных BSD.

23.1 Интерфейс к базам данных в стиле DBM Модуль anydbm предоставляет универсальный интерфейс в стиле DBM к различным вариантам баз данных: dbhash (требует наличие модуля bsddb), gdbm или dbm. Если ни один из этих модулей не доступен, будет использована медленная, но полностью переносимая реализация на языке Python в модуле dumbdbm.

Модуль dbhash доступен в операционных системах UNIX и Windows и предостав ляет интерфейс в стиле DBM к библиотеке BSD db. Для работы этого модуля необходим модуль bsddb.

Модули dbm и gdbm доступны только в операционных системах UNIX.

Заметим, что форматы файлов, создаваемых различными модулями не совместимы друг с другом.

Реализация некоторых из приведенных здесь модулей такова, что они позволяют использовать любые объекты с интерфейсом буфера. Однако использование этой возможности приведет к непереносимости базы данных, а также может привести к конфликтам ключей.

328 Глава 23. Работа с базами данных 23.1.1 Общая для всех модулей часть интерфейса Все перечисленные выше модули определяют функцию-конструктор и исключение:

open(filename [, flag [, mode]]) Открывает файл с именем filename базы данных и возвращает соответствующий ему объект. Если файл уже существует, функция anydbm.open() использует для определения его типа модуль whichdb и для файла используется соответствующий модуль. При создании нового файла anydbm.open() использует первый модуль из перечисленных выше, который может быть импортирован.

Аргумент flag может иметь одно из следующих значений:

’r’ Открыть существующий файл только для чтения (используется по умолча нию).

’w’ Открыть существующий файл для чтения и записи.

’c’ Открыть файл для чтения и записи. Если файл не существует, он будет создан.

’n’ Создать новую пустую базу данных (старый файл перезаписывается) и от крыть ее для чтения и записи.

В функции dbhash.open() на платформах, поддерживающих блокировку, к фла гу может быть добавлен символ ‘l’, если блокировка должна быть использована.

В функции gdbm.open() к флагу может быть добавлен символ ‘f’ для открытия файла в “быстром” режиме: в этом случае измененные данные не будут автомати чески записываться в файл при каждом внесении изменений (см. также описание метода sync() в разделе 23.1.3).

Аргумент mode указывает биты разрешений, которые будут установлены для фай ла, принимая во внимание маску разрешений (umask). По умолчанию используется 0666.

error Класс исключений, которые генерируются в случае возникновения различных оши бок, характерных для данного модуля. Заметим, что если в базе данных отсутствует запись с определенным ключом, генерируется исключение KeyError.

Имя dbhash.error является псевдонимом для класса bsddb.error.

В модуле anydbm эта переменная ссылается на кортеж классов исключений, ко торые могут быть сгенерированы непосредственно модулем anydbm (первый эле мент) или одним из модулей, реализующим доступ к базе данных. Это не вносит каких-либо неудобств, так как кортежи с классами исключений, указанные после ключевого слова except, могут быть вложенными произвольным образом.

Объекты, возвращаемые функциями open() всех перечисленных модулей, поддер живают большинство операций, характерных для отображений: извлечение, установка и 23.1. Интерфейс к базам данных в стиле DBM удаление значений по ключу, а также методы has_key() и keys(). Ключи и значения должны быть обычными строками. Кроме того, эти объекты имеют еще один метод:

close() Закрывает файл с базой данных.

Объекты, возвращаемые функциями dbhash.open() и gdbm.open(), имеют до полнительные методы, описанные ниже.

23.1.2 Дополнительные методы объектов, возвращаемых функцией dbhash.open() first() Возвращает кортеж с ключом и значением первой записи в базе данных. Если база данных не содержит ни одной записи, генерируется исключение KeyError. Ис пользуя методы first() и next() Вы можете обойти все записи в базе данных.

next() Возвращает кортеж с ключом и значением следующей записи. Например, следую щий код выводит все записи, содержащиеся в базе данных, не создавая их список в памяти:

k, v = db.first() try:

print k, v k, v = db.next() except KeyError:

pass sync() Сбрасывает на диск все не записанные данные.

23.1.3 Дополнительные методы объектов, возвращаемых функцией gdbm.open() firstkey() Возвращает ключ первой записи в базе данных. Вы можете перебрать все записи базы данных с помощью методов firstkey() и nextkey().

nextkey(key) Возвращает ключ к записи, следующей за записью с ключом key. Следующий пример выводит ключи для всех записей, не создавая списка ключей в памяти:

k = db.firstkey() while k != None:

print k k = db.nextkey(k) 330 Глава 23. Работа с базами данных reorganize() Реорганизует файл базы данных, удаляя из него неиспользуемые участки. Может быть полезен после удаления большого количества записей (reorganize() — единственный метод, который может привести к уменьшению размера файла).

sync() Сбрасывает на диск все не записанные данные.

23.2 whichdb — определение формата файла базы данных Этот модуль определяет единственную функцию, которая пытается определить, какой модуль должен быть использован для открытия базы данных: dbm, gdbm или dbhash.

whichdb(filename) Возвращает None — если файл filename отсутствует или к нему нет доступа на чтение, пустую строку (’’) — если формат файла неизвестен. В остальных случаях возвращает строку с именем модуля (например, ’gdbm’), который должен быть использован для открытия файла.

23.3 bsddb — интерфейс к библиотеке баз данных BSD Модуль bsddb предоставляет интерфейс к библиотеке BSD db2. С помощью этого мо дуля Вы можете создавать и работать с файлами баз данных типа “Hash”, “BTree” и “Record”. Объекты, возвращаемые функциями модуля, ведут себя аналогично словарям.

Первые три аргумента всех функций одинаковы: filename — имя файла базы данных, flag — флаги, определяющие способ открытия файла, и mode — биты раз решений (по умолчанию используется 0666), которые будут установлены для файла, принимая во внимание маску разрешений (umask). Аргумент flag может иметь одно из следующих значений:

’r’ Открыть существующий файл только для чтения (используется по умолчанию).

’w’ Открыть существующий файл для чтения и записи.

’c’ Открыть файл для чтения и записи. Если файл не существует, он будет создан.

Обычно используется библиотека версии 1.85. Начиная с Python 2.0, версия библиотеки может быть указана при сборке. Следует помнить, что версии 1.85 и 2.0 библиотеки db несовместимы.

23.3. bsddb — интерфейс к библиотеке баз данных BSD ’n’ Создать новую пустую базу данных (старый файл перезаписывается) и открыть ее для чтения и записи.

На платформах, поддерживающих блокировку, к флагу может быть добавлен символ ‘l’, если блокировка должна быть использована.

Остальные аргументы используются достаточно редко, Вы можете узнать об их назначении из документации к функции dbopen() библиотеки BSD db.

hashopen(filename [, flag [, mode [, bsize [, ffactor [, nelem [, cachesize [, hash [, lorder]]]]]]]]) Открывает файл базы данных в формате “Hash” и возвращает соответствующий ему объект.

btopen(filename [, flag [, mode [, btflags [, cachesize [, maxkeypage [, minkeypage [, psize [, lorder]]]]]]]]) Открывает файл базы данных в формате “BTree” и возвращает соответствующий ему объект.

rnopen(filename [, flag [, mode [, rnflags [, cachesize [, psize [, lorder [, reclen [, bval [, bfname]]]]]]]]]) Открывает файл базы данных в формате “Record” и возвращает соответствующий ему объект.

error Класс исключений, которые генерируются в случае возникновения различных оши бок, характерных для этого модуля. Заметим, что если в базе данных отсутствует запись с определенным ключом, генерируется исключение KeyError.

Объекты, возвращаемые функциями hashopen(), btopen() и rnopen(), под держивают большинство операций, характерных для отображений: извлечение, установ ка и удаление значений по ключу, а также методы has_key() и keys() (ключи и значения должны быть обычными строками). Кроме того, доступны следующие мето ды:

close() Закрывает файл с базой данных.

set_location(key) Устанавливает указатель на запись с ключом key и возвращает кортеж, содер жащий ключ и значение для этой записи. Этот метод не может быть применен к объектам, созданным с помощью функции hashopen().

first() Возвращает кортеж с ключом и значением первой записи в базе данных. Если база данных не содержит ни одной записи, генерируется исключение KeyError. Ис пользуя методы first() и next() Вы можете обойти все записи в базе данных.

332 Глава 23. Работа с базами данных next() Возвращает кортеж с ключом и значением следующей записи. Например, следую щий код выводит все записи, содержащиеся в базе данных, не создавая их списка в памяти:

k, v = db.first() try:

print k, v k, v = db.next() except KeyError:

pass last() Возвращает кортеж с ключом и значением последней записи в базе данных. Если база данных не содержит ни одной записи, генерируется исключение KeyError.

Используя методы last() и previous() Вы можете обойти все записи в базе данных в обратном порядке. Этот метод не может быть применен к объектам, созданным с помощью функции hashopen().

previous() Возвращает кортеж с ключом и значением предыдущей записи. Этот метод не может быть применен к объектам, созданным с помощью функции hashopen().

sync() Сбрасывает на диск все не записанные данные.

Пример:

>>> import bsddb >>> db = bsddb.btopen(’/tmp/spam.db’, ’c’) >>> for i in xrange(10): db[’%d’ % i] = ’%d’ % (i*i)...

>>> db[’3’] ’9’ >>> db.keys() [’0’, ’1’, ’2’, ’3’, ’4’, ’5’, ’6’, ’7’, ’8’, ’9’] >>> db.first() (’0’, ’0’) >>> db.next() (’1’, ’1’) >>> db.last() (’9’, ’81’) >>> db.set_location(’2’) (’2’, ’4’) >>> db.previous() (’1’, ’1’) >>> db.sync() Глава Сжатие данных zlib Интерфейс низкого уровня к операциям сжатия, с использованием алго ритма, совместимого с gzip.

gzip Работа с файлами, сжатыми программой gzip.

zipfile Чтение и запись zip-архивов.

24.1 zlib — алгоритм сжатия, совместимый с gzip Функции, определенные в этом модуле, позволяют упаковывать (сжимать) и распако вывать данные с помощью библиотеки zlib (http://www.info-zip.org/pub/infozip/zlib/, RFC 1950). Версия используемой библиотеки zlib языка C определена в виде констан ты:

ZLIB_VERSION Строка с версией библиотеки.

Аргумент level в описанных ниже функциях должен быть равным Z_DEFAULT_COMPRESSION, 0 (Z_NO_COMPRESSION) или целым числом от (Z_BEST_SPEED) до 9 (Z_BEST_COMPRESSION) и определяет уровень сжатия:

Z_NO_COMPRESSION Сохранить данные без сжатия.

Z_BEST_SPEED Обеспечивает максимальную скорость при меньшем сжатии.

Z_BEST_COMPRESSION Обеспечивает наилучшее сжатие с меньшей скоростью.

Z_DEFAULT_COMPRESSION Использует уровень, обеспечивающий компромисс между скоростью и степенью сжатия. В текущей версии библиотеки соответствует уровню 6.

Аргумент wbits (в текущей версии может быть целым числом от 8 до 15) опреде ляет размер окна буфера истории равным 2**wbits. Большее значение обеспечивает 334 Глава 24. Сжатие данных лучшее сжатие при больших затратах памяти. При использовании отрицательных зна чений подавляется стандартный заголовок (эта недокументированная возможность поз воляет использовать модуль zlib для работы с zip-файлами). Использование значения отличного от MAX_WBITS при распаковке может привести к возникновению ошибки. По умолчанию всегда используется значение MAX_WBITS.

Текущая версия библиотеки позволяет использовать единственный метод (аргу мент method) сжатия:

Z_DEFLATED Метод DEFLATE (см. RFC 1951).

Модуль определяет следующие исключение и функции:

error Исключения этого класса генерируются в случае возникновения ошибок при упа ковке или распаковке.

adler32(string [, value]) Вычисляет контрольную сумму Adler-32 строки string. Контрольная сумма, вы численная по этому алгоритму практически настолько же надежна, как и CRC32, но вычисляется гораздо быстрее. Если задано число value, оно используется в качестве начального значения контрольной суммы, в противном случае использу ется фиксированное значение по умолчанию. Это позволяет вычислять контроль ную сумму длинного потока по частям. Алгоритм Adler-32 недостаточно сильный, чтобы использовать его в криптографических целях.

compress(string [, level]) Возвращает строку, полученную в результате упаковки строки string.

compressobj([level [, method [, wbits [, mem_level [, strategy]]]]]) Возвращает объект, реализующий упаковку потока данных. Аргумент mem_level определяет использование памяти: 1 — использовать минимум памяти, но что сильно замедляет процесс, 9 — использовать максимум памяти, что дает мак симальную скорость. По умолчанию используется DEF_MEM_LEVEL (8). Аргу мент strategy может иметь значение Z_DEFAULT_STRATEGY, Z_FILTERED или Z_HUFFMAN_ONLY и определяет стратегию сжатия (см. документацию к библиоте ке zlib языка C).

crc32(string [, value]) Вычисляет контрольную сумму CRC32 (Cyclic Redundancy Check) строки string.

Если задано число value, оно используется в качестве начального значения кон трольной суммы, в противном случае используется фиксированное значение по умолчанию. Это позволяет вычислять контрольную сумму длинного потока по ча стям. Алгоритм CRC32 недостаточно сильный, чтобы использовать его в крипто графических целях.

24.1. zlib — алгоритм сжатия, совместимый с gzip decompress(string [, wbits [, bufsize]]) Возвращает строку, полученную в результате распаковки строки string. Аргу мент bufsize определяет начальный размер буфера вывода (при необходимости буфер будет увеличен).

decompressobj([wbits]) Возвращает объект, реализующий распаковку потока данных. Аргумент wbits имеет такое же значение, как и для функции decompress().

Объекты, реализующие упаковку потока данных, имеют следующие методы:

compress(string) Упаковывает строку string и возвращает строку с упакованными данными как минимум для части строки string. Часть данных может быть оставлена во вну треннем буфере для дальнейшей обработки. Возвращаемая строка должна быть добавлена к строкам, полученным в результате предыдущих вызовов метода.

flush([mode]) Обрабатывает содержимое внутреннего буфера и возвращает строку с упакован ным остатком данных.

В качестве аргумента mode метода flush() может быть использована одна из следую щих констант:

Z_SYNC_FLUSH Обрабатывает содержимое внутреннего буфера. Данные могут быть использованы для распаковки до текущего места.

Z_FULL_FLUSH Аналогично Z_SYNC_FLUSH, но также сбрасывает состояние. Распаковка может быть перезапущена с этого уровня, если предыдущие сжатые данные оказались поврежденными или необходим произвольный доступ к сжатым данным.

Z_FINISH Полностью завершает сжатие, используется по умолчанию. После этого объект не может быть использован для упаковки данных.

Объекты, реализующие распаковку потока данных, имеют следующие атрибут дан ных и методы:

unused_data Строка с неиспользованными данными. Должна быть пустой, если объекту была передана вся строка с упакованными данными.

decompress(string) Распаковывает строку string и возвращает строку с распакованными данными как минимум для части строки string. Часть данных может быть оставлена во внутреннем буфере для дальнейшей обработки. Возвращаемая строка должна быть добавлена к строкам, полученным в результате предыдущих вызовов метода.

336 Глава 24. Сжатие данных flush() Обрабатывает содержимое внутреннего буфера и возвращает строку с распакован ным остатком данных. После вызова этого метода объект не может быть использо ван для распаковки данных.

24.2 gzip — работа с файлами, сжатыми программой gzip Метод сжатия, предоставляемый модулем zlib, совместим с методом, используемым программой GNU gzip. Модуль gzip реализован поверх модуля zlib и предоставляет класс GzipFile, реализующий чтение и запись файлов в gzip-формате (RFC 1952).

Упаковка и распаковка данных происходит автоматически, так что экземпляры клас са GzipFile ведут себя аналогично обычным файловым объектам. Заметим, что этот модуль не позволяет работать с файлами дополнительных форматов (созданных програм мами compress и pack), которые могут быть распакованы программой gzip (gunzip).

GzipFile(filename [, mode [, compresslevel [, fileobj]]]) Возвращает объект аналогичный файловому, обеспечивающий прозрачную упаков ку и распаковку данных. Экземпляры класса GzipFile имеют большинство мето дов, характерных для файловых объектов, кроме seek() и tell().

Если задан и не равен None аргумент fileobj (файловый или подобный объект), он будет использован для чтения/записи (аргумент filename в этом случае будет использован только в заголовке gzip-файла и может быть равен None), иначе будет открыт файл с именем filename.

Аргумент mode должен иметь одно из трех значений: ’rb’, ’ab’ или ’wb’. По умолчанию используется ’rb’.

Уровень сжатия устанавливается аргументом compresslevel, который должен быть целым числом от 1 до 9. По умолчанию используется значение 9, обеспечи вающее максимальную степень сжатия.

Вызов метода close() экземпляра класса GzipFile не закрывает файловый объ ект fileobj. Это позволяет добавить дополнительные данные, а также извлечь результат, используя метод getvalue() экземпляра класса StringIO.

open(filename [, mode [, compresslevel]]) Эквивалентно вызову ‘GzipFile(filename, mode, compresslevel)’.

24.3 zipfile — работа с zip-архивами Этот модуль доступен, начиная с версии 1.6, и позволяет записывать и читать zip архивы.

24.3. zipfile — работа с zip-архивами error Исключения этого класса генерируются, если указанный файл не является zip архивом или поврежден.

is_zipfile(path) Возвращает 1, если path является zip-архивом, иначе возвращает 0. Текущая реализация модуля не позволяет работать с архивами, содержащими комментарий.

ZipFile(filename [, mode [, compression]]) Возвращает объект, реализующий автоматическую упаковку/распаковку при чте нии/записи файла с именем filename. Аргумент mode может иметь одно из трех значений: ’r’ (чтение), ’w’ (запись в новый архив) или ’a’ (добавление к существующему архиву). По умолчанию используется ’r’. В качестве аргу мента compression может быть использована одна из приведенных ниже кон стант, при попытке использования недоступного метода генерируется исключение RuntimeError.

PyZipFile(filename [, mode [, compression]]) Этот класс является производным от класса ZipFile и реализует один дополни тельный метод, позволяющий создавать архивы файлов библиотек и пакетов языка Python.

ZipInfo([filename [, date_time]]) Создает и возвращает объект, описывающий файл в архиве. Аргумент filename определяет имя файла (по умолчанию используется ’NoName’), date_time — дату и время создания файла (кортеж из целых чисел: год, месяц, число, час, минута, секунда).

В настоящий момент модуль поддерживает только два метода сжатия (аргумент compression конструктора ZipFile):

ZIP_STORED Упаковка данных без сжатия (используется по умолчанию).

ZIP_DEFLATED Наиболее часто используемый в zip-файлах метод сжатия. Этот метод требует наличия модуля zlib.

Экземпляры классов ZipFile и PyZipFile имеют следующие атрибуты данных и методы:

namelist() Возвращает список имен файлов, содержащихся в архиве.

infolist() Возвращает список экземпляров класса ZipInfo, представляющих описание фай лов, содержащихся в архиве.

338 Глава 24. Сжатие данных printdir() Выводит в стандартный поток вывода (sys.stdout) оглавление архива.

testzip() Считывает все файлы архива и проверяет для них контрольные суммы. Возвращает имя первого файла, для которого контрольная сумма не сходится или None, если тест прошел успешно.

getinfo(name) Возвращает экземпляр класса ZipInfo, представляющий описание файла name.

read(name) Считывает файл с именем name из архива и возвращает его содержимое в виде строки.

write(filename [, arcname [, compress_type]]) Помещает файл с именем filename в архив под именем arcname (по умолча нию используется имя исходного файла) используя метод compress_type (по умолчанию используется метод, указанный при инициализации экземпляра).

writestr(zinfo, bytes) Помещает файл в архив. В качестве содержимого файла используется аргумент bytes, информация об имени файла, времени его создания, методе сжатия и т. д.

берется из объекта zinfo, который должен быть экземпляром класса ZipInfo.

close() Закрывает файл (если архив был открыт для записи, дописывает завершающую запись).

Экземпляры класса PyZipFile имеют дополнительный метод:

writepy(pathname [, basename]) Если pathname является каталогом пакета, рекурсивно добавляет все ‘.py’-файлы в архив, если pathname является обычным каталогом — добавляет в архив файлы, находящиеся в этом каталоге, в противном случае pathname должен быть ‘.py’ файлом, который будет добавлен в архив. Все модули (‘.py’-файлы) добавляются в архив в компилированном виде (‘.pyo’ или ‘.pyc’).

Экземпляры класса ZipInfo имеют следующие (основные) атрибуты, описываю щие файл в архиве, и метод:

filename Имя файла.

date_time Дата и время создания файла, кортеж из целых чисел: год, месяц, число, час, минута, секунда.

24.3. zipfile — работа с zip-архивами compress_type Метод сжатия.

comment Комментарий (для каждого файла).

extra Строка дополнительных данных.

CRC Контрольная сумма CRC32 распакованного файла.

compress_size Размер сжатого представления файла.

file_size Размер распакованного файла.

FileHeader() Печатает строку информации о файле в архиве.

Глава Отладка и оптимизация кода на языке Python Средства, описанные в этой главе, позволяют отлаживать и замерять производитель ность кода на языке Python. Эти средства представлены двумя (основными) модулями, которые также могут быть использованы в качестве готовых программ.

pdb Средства отладки кода на языке Python.

profile Замер производительности кода на языке Python.

pstats Обработка статистических данных и вывод отчетов.

25.1 Отладчик кода на языке Python Модуль pdb реализует интерактивный отладчик программ, написанных на языке Python.

Он позволяет устанавливать точки останова, использовать пошаговое выполнение строк исходного кода, исследовать кадры стека, выводить исходный код и выполнять инструк ции языка Python в контексте любого кадра стека. Этот модуль также позволяет осуще ствить “вскрытие трупа” программы или интерактивных инструкций, выполнение кото рых завершилось генерацией исключения.

Вы можете расширить возможности отладчика: все описанные в этом разделе функ ции реализованы с помощью класса Pdb (в настоящий момент не документирован).

Запуск под контролем отладчика производится следующим образом (в качестве приглашения отладчика используется ‘(Pdb) ’):

>>> import pdb >>> import mymodule >>> pdb.run(’mymodule.test()’) > (0)?() (Pdb) continue > (1)?() (Pdb) continue NameError: "There is no... named ’spam’" > (1)?() (Pdb) 25.1. Отладчик кода на языке Python Или Вы можете осуществить “вскрытие” уже после возникновения ошибки:

>>> import mymodule >>> mymodule.test() Traceback (most recent call last):

File "", line 1, in ?

File "mymodule.py", line 2, in test print spam NameError: There is no variable named ’spam’ >>> import pdb >>> pdb.pm() > mymodule.py(2)test() -> print spam (Pdb) Файл ‘pdb.py’ может быть также использован в качестве программы для отладки других программ:

/usr/local/lib/python1.5/pdb.py myscript.py 25.1.1 Функции запуска отладчика Модуль pdb определяет следующие функции, запускающие отладчик различными спо собами:

run(statements [, globals [, locals]]) Выполняет инструкции в строке statements (аналогично инструкции exec) под контролем отладчика. Приглашение отладчика появляется перед выполнением пер вой инструкции: Вы можете установить точки останова или использовать пошаго вый режим выполнения. Аргументы globals и locals определяют окружение, в котором выполняются инструкции;

по умолчанию используются пространства имен модуля main (см. также раздел 10.3.11).

runeval(expression [, globals [, locals]]) Вычисляет выражение в строке expression (аналогично встроенной функции eval()) под контролем отладчика и (если вычисление прошло успешно) возвра щает его значение. В остальном поведение этой функции аналогично поведению функции run().

runcall(function [, arg1...]) Вызывает функцию function (или другой объект, поддерживающий вызов) с ука занными аргументами под контролем отладчика и (если вызов функции прошел успешно) возвращает значение, возвращаемое этой функцией. Приглашение от ладчика появляется перед выполнением первой инструкции тела функции.

342 Глава 25. Отладка и оптимизация кода на языке Python set_trace() Запускает отладчик в кадре стека блока, из которого эта функция вызывается.

Может быть полезна для жестко запрограммированных точек останова в точках, где, например, не выполняются отладочные утверждения.

post_mortem(tb) Производит “вскрытие” объекта tb (типа traceback).

pm() Производит “вскрытие” объекта sys.last_traceback.

25.1.2 Команды отладчика Ниже описаны команды, распознаваемые отладчиком. Большинство команд можно вве сти в сокращенном виде;

например, запись ‘h(elp)’ означает, что для выполнения дан ной команды следует ввести ‘h’ или ‘help’ (но не ‘he’, ‘hel’, ‘H’, ‘Help’ или ‘HELP’).

Аргументы команды должны быть отделены символами пропуска. Необязательные аргу менты команды указаны в квадратных скобках (‘[]’), альтернативные варианты разделены вертикальной чертой (‘|’).

При вводе пустой строки отладчик повторяет последнюю выполненную команду.

Исключение: если последней была команда ‘list’, при вводе пустой строки выводятся следующие 11 строк исходного кода.

Все не распознанные отладчиком команды воспринимаются как инструкции языка Python, которые выполняются в контексте отлаживаемой программы. Команды, начина ющиеся с восклицательного знака (‘!’), всегда воспринимаются как инструкции языка Python. Выполнение произвольных инструкций является мощным средством отладки:

Вы можете изменить значение переменной или вызвать функцию. Если при выполнении такой инструкции генерируется исключение, выводится информация об исключении, но состояние отладчика не изменяется.

Вы можете ввести несколько команд отладчика в одной строке, используя в ка честве разделителя ‘;

;

’ (‘;

’ используется в качестве разделителя инструкций языка Python). Заметим, что отладчик не располагает “интеллектом”, достаточным для того, чтобы распознать ‘;

;

’ в середине строк, заключенных в кавычки.

Если в текущем и/или домашнем каталоге пользователя присутствует конфигура ционный файл ‘.pdbrc’, его строки выполняются при запуске отладчика, как если бы Вы вводили их в ответ на приглашение интерпретатора (сначала читается файл в домашнем каталоге пользователя, затем — в текущем). Такая возможность особенно полезна для определения псевдонимов.

h(elp) [command] ?[command] При использовании этой команды без аргументов выводит список всех возможных команд. С аргументом — выводит подсказку об использовании команды command.

Команда ‘help pdb’ выводит полностью файл документации отладчика, используя 25.1. Отладчик кода на языке Python программу постраничного просмотра, заданную в переменной окружения PAGER.

Так как аргумент command должен быть идентификатором, для получения под сказки об использовании команды ‘!’ необходимо ввести ‘help exec’.

w(here) Выводит информацию о месте, на котором выполнение было приостановлено.

d(own) Перемещается на один кадр вниз по стеку (к более новому кадру стека).

u(p) Перемещается на один кадр вверх по стеку (к более старому кадру стека).

b(reak) [([filename:]lineno | function) [, condition]] Устанавливает точку останова в строке с номером lineno в файле filename (по умолчанию в текущем файле) или на первой инструкции функции function.

Если указан аргумент condition, точка останова будет принята во внимание только в тех случаях, когда выражение condition является истиной. Каждой точке останова присваивается порядковый номер, который может быть использован для ее снятия.

Без аргументов выводит информацию обо всех установленных точках останова.

tbreak [([filename:]lineno | function) [, condition]] Эта команда работает аналогично команде ‘break’, но устанавливает временную точку останова, которая будет снята после первого использования.

cl(ear) [bpnumber [bpnumber...]] Если задан список номеров точек останова (bpnumber), снимает их. При исполь зовании без аргументов снимает все точки останова, предварительно запросив под тверждение.

disable [bpnumber [bpnumber...]] Временно отключает точки останова с номерами, указанными в списке аргументов.

Вы можете снова включить их с помощью команды ‘enable’.

enable [bpnumber [bpnumber...]] Включает точки останова, номера которых указаны в списке аргументов.

ignore bpnumber [count] Указывает, что точка останова с номером bpnumber должна быть проигнорирована count (по умолчанию 0) раз.

condition bpnumber [condition] Устанавливает условие, при котором точка останова будет приниматься во вни мание: точка останова будет срабатывать только, если выражение condition является истиной. Если аргумент condition опущен, точка останова становится безусловной.

s(tep) Выполняет инструкции в текущей строке и останавливается при первом удобном случае: либо в вызываемой функции, либо на следующей строке текущей функции.

344 Глава 25. Отладка и оптимизация кода на языке Python n(ext) Продолжает выполнение до следующей строки в текущей функции или до возврата из нее. Разница между ‘next’ и ‘step’ состоит в том, что команда ‘step’ выпол няет в пошаговом режиме вызываемые функции, в то время как команда ‘next’ выполняет их без остановок.

r(eturn) Продолжает выполнение до возврата из текущей функции.

c(ont(inue)) Продолжает выполнение до первой (активной) точки останова.

l(ist) [first [, last]] Выводит строки исходного кода. При использовании без аргументов выводит строк вокруг текущей, с одним аргументом — вокруг указанной. Если указаны оба аргумента, выводит строки в диапазоне от first до last или, если число last меньше first, last строк, начиная с first.

a(rgs) Выводит список аргументов текущей функции.

p expression Вычисляет значение выражения expression и выводит его значение. Заметим, что для этих целей Вы можете использовать инструкцию print языка Python, однако ‘print’ не является командой отладчика.

alias [name [command]] Создает псевдоним name для команды command. Команда не должна быть заклю чена в кавычки. Фрагменты ‘%1’, ‘%2’ и т. д. заменяются первым, вторым и т. д.

аргументами, переданными команде name, а ‘%*’ — на все аргументы. Если аргу мент command опущен, выводит команду для псевдонима name. При вызове без аргументов выводит список всех псевдонимов.

Команда command может использовать все, что можно вводить в ответ на при глашение интерпретатора, в том числе другие псевдонимы. Замена псевдонима производится только для первого слова команды, все остальное остается без изме нений.

Приведем примеры двух полезных псевдонимов, которые можно поместить в конфигурационный файл ‘.pdbrc’: команда ‘alias pi for k, v in %1.dict.items(): print "%1.", k, -", v’ создает псевдоним ‘pi’, выводящий атрибуты указанного экземпляра, а команда ‘alias ps pi self’ со здает псевдоним ‘ps’, выводящий атрибуты экземпляра, в теле метода которого псевдоним используется.

unalias name Удаляет псевдоним name.

[!]statements Выполняет одну строку statements с инструкциями языка Python в текущем ка дре стека. Восклицательный знак может быть опущен, за исключением случаев, 25.2. Замер производительности когда первое слово инструкции является командой (или псевдонимом) отладчика.

Следует помнить, что для изменения глобальных переменных необходимо исполь зовать инструкцию global, например:

(Pdb) global list_options;

list_options = [’-l’] (Pdb) q(uit) Выходит из отладчика. Выполнение отлаживаемой программы прерывается.

25.2 Замер производительности Модули profile и pstats, описанные в этом разделе, позволяют осуществлять замер производительности программ на языке Python, анализировать результат и выводить отчет.

Copyright © 1994, by InfoSeek Corporation, all rights reserved.

Permission to use, copy, modify, and distribute this Python software and its associated documentation for any purpose (subject to the restriction in the following sentence) without fee is hereby granted, provided that the above copyright notice appears in all copies, and that both that copyright notice and this permission notice appear in supporting documentation, and that the name of InfoSeek not be used in advertising or publicity pertaining to distribution of the software without specific, written prior permission. This permission is explicitly restricted to the copying and modification of the software to remain in Python, compiled Python, or other languages (such as C) wherein the modified or derived code is exclusively imported into a Python module.

INFOSEEK CORPORATION DISCLAIMS ALL WARRANTIES WITH REGARD TO THIS SOFTWARE, INCLUDING ALL IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL INFOSEEK CORPORATION BE LIABLE FOR ANY SPECIAL, INDIRECT OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.

25.2.1 Введение Настоящее введение предоставляет краткий обзор основных средств. Он позволит Вам быстро осуществить замер производительности, не вникая в подробности.

Для того, чтобы вывести профиль выполнения функции ‘foo()’ (время выполнения ‘foo()’ и вызываемых из нее функций), следует выполнить следующие инструкции:

Pages:     | 1 |   ...   | 3 | 4 || 6 | 7 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.