WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 | 2 || 4 | 5 |   ...   | 7 |

«Г. Россум, Ф.Л.Дж. Дрейк, Д.С. Откидач Язык программирования Python Г. Россум, Ф.Л.Дж. Дрейк, Д.С. Откидач, М. Задка, М. Левис, С. Монтаро, Э.С. Реймонд, А.М. Кучлинг, М.-А. Лембург, К.-П. Йи, Д. Ксиллаг, ...»

-- [ Страница 3 ] --

setdefault(k [, v]) Если отображение содержит запись с ключом k, возвращает m[k], в противном случае возвращает значение v, предварительно добавив его в отображение с клю чом k. Если аргумент v опущен, он считается равным None. Поведение этого метода похоже на поведение метода get(), за исключением того, что если запись с заданным ключом отсутствует, значение по умолчанию не только возвращается, но и добавляется в отображение.

Порядок следования элементов в списке не определен. Однако, если вызвать ме тоды keys() и values(), не внося между их вызовами изменений в отображение, то порядок следования элементов в возвращаемых списках будет одинаковый. Это поз воляет создавать список пар (value, key), используя встроенную функцию map():

‘pairs = map(None, m.values(), m.keys())’.

11.4 Объекты, поддерживающие вызов В этом разделе описаны типы объектов, для которых определена операция вызова (obj(arglist)). Вы можете узнать, поддерживает ли объект операцию вызова, с по мощью встроенной функции callable().

11.4. Объекты, поддерживающие вызов 11.4.1 Функции, определенные пользователем Объекты-функции (function) создаются при определении функции с помощью инструк ции def или оператора lambda. Единственная операция, определенная для функций — их вызов: ‘func(arglist)’.

Объекты-функции имеют следующие атрибуты:

func_doc doc Строка документации или None, если она не определена.

func_name name Имя функции.

func_defaults Значения аргументов по умолчанию или None, если ни один аргумент не имеет значения по умолчанию.

func_code Объект кода (code), представляющий собой байт-компилированное тело функции.

func_globals Ссылается на словарь, представляющий глобальное пространство имен модуля, в котором определена функция (имена, являющиеся для функции глобальными).

Атрибутам func_doc (или doc), func_defaults и func_code можно при своить новые значения, остальные — доступны только для чтения9.

11.4.2 Методы, определенные пользователем Объект-метод (instance method) создается при обращении к атрибуту класса или экземпляра класса, определенному как функция-атрибут класса. Если же Вы обратитесь к нему напрямую через специальный атрибут класса dict, Вы получите объект функцию в неизменном виде. Метод может быть привязанным к экземпляру класса (если Вы обращаетесь к нему как к атрибуту экземпляра класса) и не привязанным (если Вы обращаетесь к нему как к атрибуту класса). Важно понимать, что преобразо вание атрибута-функции в атрибут-метод производится, только если функция является атрибутом класса. Функции, являющиеся атрибутами экземпляра класса в метод не преобразуются.

func_globals является объектом изменяемого типа — Вы можете внести в него изменения, напри мер, используя методы, но не можете присвоить новое значение. Следует понимать, что при этом будет изменено глобальное пространство имен модуля, в котором определена функция, и изменения отразятся на других объектах, определенных в этом модуле.

150 Глава 11. Встроенные типы данных Объекты-методы имеют следующие атрибуты:

im_func Объект-функция, реализующая метод. Атрибут доступен только для чтения.

im_self Экземпляр класса, к которому применяется метод (None, если метод не привязан).

Атрибут доступен только для чтения.

im_class Класс, в котором метод определен. Атрибут доступен только для чтения.

name Имя метода (то же самое, что и im_func.name).

doc Строка документации (то же самое, что и im_func.doc).

При вызове метода, не привязанного к экземпляру класса, вызывается лежащая в его основе функция (im_func) с одной лишь разницей: если первый аргумент не яв ляется экземпляром класса im_class или производного от него класса, генерируется исключение TypeError. Если же метод привязан к определенному экземпляру класса, функция im_func вызывается со списком аргументов, в начало которого вставлен эк земпляр im_self. То есть, если класс C содержит определение функции f и x является экземпляром класса C, то вызов x.f(1) эквивалентен вызову C.f(x, 1).

Заметим, что преобразование объекта-функции в (привязанный или не привязан ный к экземпляру класса) метод происходит при каждом обращении к атрибуту класса или его экземпляра. В некоторых случаях Вы можете немного ускорить работу про граммы, присвоив метод локальной переменной и затем используя ее для многократного вызова метода.

11.4.3 Встроенные функции и методы Встроенные функции и методы представляются в языке Python объектами одного типа — builtin_function_or_method. Количество и тип воспринимаемых ими аргументов определяется реализацией. Объекты, представляющие встроенные функции и методы, являются неизменяемыми и не содержат ссылок на изменяемые объекты.

Объекты builtin_function_or_method имеют следующие атрибуты:

doc Строка документации (None, если строка документации не определена).

name Имя функции/метода.

11.5. Модули self Ссылка на объект, к которому должен применяться метод или None для встроен ных функций.

11.4.4 Классы Когда вызывается объект-класс, создается и возвращается новый экземпляр этого клас са. При этом подразумевается вызов специального метода класса init (если он определен) с аргументами, с которыми вызывается объект-класс. Если метод init не определен, объект-класс должен вызываться без аргументов. Свойства объектов классов описаны в разделе 11.6.1.

11.4.5 Экземпляры классов Если для класса определить метод call() (см. раздел 11.6.3), то его экземпля ры будут поддерживать вызов: вызов экземпляра (x(arglist)) преобразуется в вызов метода call() с теми же аргументами (x.call(arglist)). Свойства эк земпляров классов описаны в разделе 11.6.2.

11.5 Модули Единственная операция, поддерживаемая объектами-модулями — доступ к их атрибу там: m.name, где m — модуль и name — имя, определенное в пространстве имен модуля m (Вы можете как получить, так и присвоить новое значение атрибуту модуля). Для со здания объекта модуля предназначена инструкция import (см. раздел 10.3.10).

Объекты модули имеют следующие атрибуты:

dict Словарь, являющийся таблицей имен модуля. Внося в него изменения, Вы меняете таблицу имен модуля, однако присваивание атрибуту dict невозможно (то есть Вы можете написать m.dict[’a’] = 1, тем самым определив m.a равным 1, но не можете написать m.dict = {}).

name Имя модуля.

doc Строка документации модуля.

file Полное имя файла, содержащего определение модуля (у модулей, статически встроенных в интерпретатор, атрибут file отсутствует).

152 Глава 11. Встроенные типы данных 11.6 Классы и экземпляры классов 11.6.1 Классы Объект-класс создается с помощью определения класса (см. раздел 10.4.6). Простран ство имен класса реализовано в виде словаря, доступного через специальный атрибут dict. Ссылка на атрибут класса преобразуется в поиск соответствующего имени в словаре, например, C.x преобразуется в C.dict[’x’]. Если атрибут не найден, поиск продолжается в базовых классах. Поиск производится сначала в глубину, затем слева направо, в порядке следования их в списке базовых классов. Если атрибуту соот ветствует объект function, то объект преобразуется в не привязанный к экземпляру объект-метод (см. раздел 11.4.2). Атрибут im_class этого объекта-метода указывает на класс, в котором найден соответствующий ему объект-функция (он может быть одним из базовых классов).

Присваивание атрибуту класса вносит изменения в словарь этого класса, но ни когда не изменяет словари базовых классов.

Объект-класс может быть вызван, для получения экземпляра класса (см. раздел 11.4.4).

Объекты-классы имеют следующие атрибуты:

name Имя класса.

module Имя модуля, в котором класс определен.

dict Словарь атрибутов класса. Вы можете изменять его содержимое, тем самым добав лять и удалять атрибуты класса и изменять их значения. Вы даже можете присво ить dict новое значение, но это может спровоцировать довольно странные ошибки.

bases Кортеж базовых классов в порядке их следования в списке базовых классов. Вы можете изменить значение этого атрибута, однако вряд ли найдется достаточно веская причина для подобных манипуляций.

doc Строка документации класса или None, если она не определена.

11.6.2 Экземпляры классов Объект-экземпляр класса возвращается при вызове объекта-класса (см. раздел 11.4.4).

Пространство имен объекта-экземпляра реализовано в виде словаря, в котором поиск 11.6. Классы и экземпляры классов атрибутов производится в первую очередь. Если атрибут не найден, поиск продолжается среди атрибутов класса (см. раздел 11.6.1). При этом атрибут класса, являющийся мето дом, становится привязанным к данному экземпляру класса (см. раздел 11.4.2). Если нет атрибута класса с таким именем, вызывается специальный метод getattr(). Если же метод getattr() не определен, генерируется исключение AttributeError.

Присваивание атрибуту и его удаление вносят изменения в словарь экземпляра класса, но никогда не изменяют словарь класса. Если определены специальные методы setattr() и delattr(), то вызываются эти методы вместо того, чтобы вносить изменения в словарь экземпляра напрямую.

Объекты-экземпляры имеют следующие атрибуты:

dict Словарь атрибутов экземпляра класса. Вы можете изменять его содержимое, тем самым добавлять и удалять атрибуты экземпляра и изменять их значения. Вы даже можете присвоить dict новое значение, однако это может спровоцировать довольно странные ошибки (часто программы на языке Python рассчитывают на возможность добавить атрибут к экземпляру класса, присваивание же dict нового значения может привести к мистическим исчезновениям таких атрибутов).

class Объект-класс, экземпляром которого объект является. Вы можете изменить зна чение этого атрибута, однако вряд ли найдется достаточно веская причина для подобных манипуляций.

11.6.3 Специальные методы Определив для класса методы со специальными именами, Вы можете реализовать над его экземплярами определенные операции, которые вызываются с помощью специального синтаксиса.

Инициализация и очистка init(self [, args...]) Вызывается при создании экземпляра класса (конструктор). args... — аргу менты, с которыми вызывается объект-класс. Если базовый класс имеет метод init(), метод init() производного класса должен явно вызвать его, для инициализации части экземпляра, определенной в базовом классе.

del(self) Вызывается перед уничтожением экземпляра (деструктор). Если базовый класс имеет метод del(), метод del() производного класса должен явно вы звать его, для очистки части экземпляра, определенной в базовом классе. Заметим, что можно (но не рекомендуется) предотвратить уничтожение экземпляра, создав новую ссылку на него. Метод del() будет вызван снова — при удалении 154 Глава 11. Встроенные типы данных этой ссылки. Если во время выхода из интерпретатора экземпляр все еще присут ствует, вызов деструктора для него не гарантируется.

Замечания:

•Инструкция ‘del x’ не вызывает напрямую x.del(), а лишь удаляет имя ’x’ из локального пространства имен, тем самым уменьшая число ссы лок на объект на единицу. Когда число ссылок на объект достигает нуля, для него вызывается метод del(). Наиболее часто встречающаяся причина, по которой количество ссылок на объект не достигает нуля — существование циклических ссылок между объектами. Такая ситуация возникает, например, при использовании двоесвязных списков или графов. В этом случае единствен ное средство — явно разорвать циклы. Циклические ссылки также создают ся, если Вы сохраняете объект traceback, полученный с помощью функции sys.exc_info() (см. описание модуля sys). В интерактивном режиме объ ект traceback, относящийся к последнему не перехваченному исключению, хранится в sys.last_traceback. Он содержит ссылку на кадр стека функ ции, в которой возникла исключительная ситуация, и, соответственно, на все переменные функции. Чтобы разорвать эту связь достаточно присвоить None переменной sys.last_traceback.

•В связи с тем, что условия, при которых вызывается метод del(), зави сят от многих обстоятельств, не перехваченные исключения, возникающие во время его выполнения, игнорируются и на sys.stderr выводится соответ ствующее предупреждение. Кроме того, если объект удаляется при удалении объекта-модуля, в котором он определен (например, по окончании выполнения программы), другие глобальные объекты этого модуля уже могут быть удале ны. По этой причине метод del() должен выполнять минимум операций поддержки внешних ресурсов. Гарантируется, что глобальные объекты, не яв ляющиеся объектами-модулями, имя которых начинается с одного символа подчеркивания, удаляются раньше других.

•“Сборщик мусора” (см. описание модуля gc) автоматически обрабатывает только объекты, не имеющие деструктора. Наличие в цикле ссылающихся друг на друга, но недоступных извне объектов экземпляра с методом del() приведет к тому, что все объекты цикла останутся не уничтоженными.

Истинность и сравнение cmp(self, other) Вызывается (для первого или второго операнда) при выполнении всех опера ций сравнения, кроме случаев, когда оба операнда являются экземплярами клас сов и при этом для первого операнда не определен метод cmp(). Дол жен возвращать целое число: отрицательное, если self < other, ноль, если self == other, и положительное целое число, если self > other (см. также описание функции cmp() в главе 12). Если метод cmp() (или rcmp()) не определен, сравнение экземпляров производится по идентификаторам.

rcmp(self, other) Вызывается для второго операнда, если оба операнда являются экземплярами 11.6. Классы и экземпляры классов классов и при этом для первого операнда не определен метод cmp(). Дол жен возвращать целое число: отрицательное, если self > other, ноль, если self == other, и положительное целое число, если self < other. Нет смыс ла определять cmp(y, x) отличным от -cmp(x, y), поэтому метод rcmp() обычно определяют в виде:

def rcmp(self, other):

return -cmp(self, other) hash(self) Метод предназначен для получения хэш-значения объекта. Вызывается для объек тов, используемых в качестве ключа при операциях над словарями, а также при использовании встроенной функции hash(). Должен возвращать 32-битное це лое число. Объекты, которые при сравнении считаются равными, должны иметь равные хэш-значения. Рекомендуется использовать своего рода смесь (используя, например, исключающее ИЛИ) хэш-значений компонентов объекта, играющих роль при сравнении. Если для класса не определен метод cmp(), то по умолчанию в качестве хэш-значения для его экземпляров будет использоваться идентифика тор объекта, определение же метода hash() лишь замедлит выполнение про граммы. Если же у класса есть метод cmp(), но нет метода hash(), его экземпляры не могут быть использованы в качестве ключа в операциях над слова рями. Хэш-значение должно быть постоянно на протяжении всего времени жизни объекта, поэтому изменяемые объекты не должны иметь метода hash().

nonzero(self) Вызывается для определения истинности объекта, должен возвращать 0 или 1.

Если этот метод не определен, используется метод len() (см. раздел 11.6.3);

если же для класса не определен ни один из этих методов, все его экземпляры будут истинными.

Доступ к атрибутам Вы можете изменить действия, выполняемые при доступе к атрибутам: получении значе ния, присваивании и удалении. Для повышения производительности эти методы кэширу ются в объекте-классе в момент выполнения определения класса. Поэтому их изменение после выполнения определения класса не даст желаемого результата.

getattr(self, name) Вызывается, если атрибут не доступен обычным способом (то есть экземпляр, класс, экземпляром которого он является, и все его родительские классы не име ют атрибута с именем name). Метод должен возвращать значение (вычисленное) атрибута или генерировать исключение AttributeError.

Обратите внимание, что в отличие от setattr() и delattr(), метод getattr() не вызывается, если атрибут найден обычным способом. Такой вариант эффективней и позволяет получить доступ из этих методов к другим атри бутам.

156 Глава 11. Встроенные типы данных setattr(self, name, value) Вызывается при попытке присваивания атрибуту вместо обычного механизма, кото рый сохраняет значение в словаре dict экземпляра. name — имя атрибута, value — присваиваемое значение.

Обратите внимание, что попытка присвоить значение атрибуту экземпляра (напри мер, ‘setattr(self, name, value)’) внутри метода setattr() приве дет к его рекурсивному вызову. Вместо этого следует добавить соответствующую запись в словарь атрибутов экземпляра: ‘self.dict[name] = value’.

delattr(self, name) Вызывается при попытке удаления атрибута. Этот метод следует определять только в том случае, когда для объектов имеет смысл инструкция ‘del self.name’.

Операция вызова call(self [, args...]) Вызывается при вызове экземпляра класса, то есть ‘x(arg1, arg2,...)’ явля ется короткой записью для ‘x.call(arg1, arg2,...)’.

Эмуляция последовательностей и отображений Для того, чтобы определенные Вами объекты вели себя так же, как и встроенные типы string, tuple, list и dictionary, для них необходимо определить методы, описан ные в этом разделе. Разница между последовательностями и отображениями заключа ется в том, что для последовательностей допустимыми ключами (индексами) являются целые числа k, такие что 0 <= k < N, где N — длина последовательности. Для отобра жений же ключом может являться объект любого типа10. Кроме того, при применении к последовательности операции среза, в качестве ключа выступает объект, представляю щий один (объект типа slice или ellipsis) или несколько (кортеж из объектов типа slice и ellipsis) срезов (см. раздел 11.8.3).

Кроме описанных здесь методов, для отображений рекомендуется реализовать методы keys(), values(), items(), has_key(), get(), clear(), copy(), и update(), ведущие себя так же, как и для объектов dictionary (см. раздел 11.3);

для изменяемых последовательностей следует реализовать методы, характерные для объектов list: append(), count(), index(), insert(), pop(), remove(), reverse() и sort() (см. раздел 11.2.6). И, наконец, специальные методы add(), radd(), iadd(), mul(), rmul() и imul(), реализующие характерные для последовательностей операции сложения (объединение последователь ностей) и умножения (размножение последовательностей), описаны в разделе 11.6.3.

Для совместимости с предыдущими версиями, могут быть определены специальные ме Тип dictionary налагает дополнительные ограничения: для его ключа должна быть определена операция получения хэш-значения (см. описание встроенной функции hash() в главе 12).

11.6. Классы и экземпляры классов тоды getslice(), setslice() и delslice() (см. ниже), которые будут обрабатывать операции с простой (но не расширенной) записью среза.

len(self) Вызывается для реализации встроенной функции len(). Возвращаемое значение должно быть целым числом, большим или равным нулю. Кроме того, если для объекта не определен метод nonzero(), истинность объекта определяется по значению, возвращаемому методом len().

getitem(self, key) Вызывается для реализации получения элемента по индексу или ключу (self[key]). Интерпретация отрицательных индексов (если Вы реализуете по следовательность) должна производиться самим методом getitem(). Если key имеет несоответствующий тип, следует генерировать исключение TypeError.

Если Вы эмулируете последовательность, то, в случае выхода индекса за пределы допустимых значений (с учетом преобразований отрицательных индексов), метод должен генерировать исключение IndexError (таким образом при переборе эле ментов последовательности определяется ее конец). Если отображение не содер жит записи с ключом key, принято использовать исключение KeyError.

setitem(self, key, value) Вызывается для реализации присваивания элементу с заданным ключом или ин дексом (‘self[key] = value’). Этот метод необходим только для отображений, допускающих изменение значения, соответствующего определенному ключу, или добавление записи с новым ключом, а также для последовательностей, допускаю щих изменение элементов. Если Вы эмулируете последовательность, то, в случае выхода индекса за пределы допустимых значений (с учетом преобразований отри цательных индексов), следует генерировать исключение IndexError.

delitem(self, key) Вызывается для реализации удаления элемента с заданным индексом или ключом (‘del self[key]’). Этот метод необходим только для последовательностей и отображений, допускающих удаление элементов. Соглашения об использовании исключений такие же, как и для метода getitem.

До версии 2.0, для того, чтобы последовательность поддерживала операцию с про стой записью среза, необходимо было определить следующие три метода (для неизме няемых последовательностей нужен только метод getslice()). Для всех трех методов опущенные значения индексов i и j заменяются на ноль и sys.maxint соот ветственно. Если в записи среза используются отрицательные индексы, к ним добавля ется длина последовательности. Если же метод len() не реализован, генерирует ся исключение AttributeError. Заметим, что нет никакой гарантии того, что после добавления длины последовательности индекс не будет отрицательным. Индексы, пре вышающие длину последовательности, остаются неизменными. Обратите внимание, что эти методы используются только для реализации операций с простой записью среза.

158 Глава 11. Встроенные типы данных getslice(self, i, j) Вызывается для реализации получения подпоследовательности (self[i:j]).

setslice(self, i, j, sequence) Вызывается для реализации присваивания срезу, то есть замены подпоследователь ности (‘self[i:j] = sequence’).

delslice(self, i, j) Вызывается для реализации удаления подпоследовательности (‘del self[i:j]’).

Для реализации операций, касающихся расширенной записи срезов, используют ся методы getitem(), setitem() и delitem(). В этом случае в качестве ключа выступает объект типа slice, объект Ellipsis или кортеж из них (см. раздел 11.8.3). Если вы реализовали поддержку расширенной записи среза, то, начиная с версии 2.0, нет необходимости реализовывать методы getslice(), setslice() и delslice(): при их отсутствии автоматически будет вызван метод methodgetitem(), setitem() или delitem().

Следующий пример показывает, как Вы можете сохранить возможность работы Ва шей программы (модуля) со старыми версиями интерпретатора (предполагается, что ме тоды methodgetitem(), setitem() или delitem() поддерживают объ екты, представляющие срез, в качестве аргумента):

class MyClass:

...

def getitem(self, item):

...

def setitem(self, item, value):

...

def delitem(self, item):

...

if sys.hexversion<0x020000F0:

#, # 2.0 () def getslice(self, i, j):

return self[max(0, i):max(0, j):] def setslice(self, i, j, seq):

self[max(0, i):max(0, j):] = seq def delslice(self, i, j):

del self[max(0, i):max(0, j):]...

Обратите внимание на использование функции max(). В то время как методы *item() всегда получают индексы без изменений, перед вызовом методов *slice() к отрицательным индексам добавляется длина последовательности. По сле такого преобразования индекс может остаться отрицательным и быть неверно ин терпретирован метами *item(). Использование max(0, i) гарантирует, что ин дексы всегда будут интерпретироваться корректно.

11.6. Классы и экземпляры классов Оператор in реализуется путем перебора элементов последовательности и срав нения их с искомым значением. Однако для некоторых последовательностей его можно реализовать более эффективно. Для этих целей в версии 1.6 добавлен еще один специ альный метод:

contains(self, item) Вызывается для реализации операторов in и not in (‘item in self’, ‘item not in self’). До версии 1.6, а также если метод contains не определен, для реализации этих операторов используется последовательный пере бор элементов последовательности и сравнение их с искомым значением. Опера торы in и not in всегда возвращают 0 или 1, определяющие истинность возвра щаемого методом contains объекта (см. раздел 10.2.5).

Приведение объектов к базовым типам В этом разделе описаны специальные методы, реализующие приведение объектов к стро ковому и числовым типам. Для того, чтобы объект можно было привести к встроенным типам последовательностей, достаточно определить специальные методы len() и getattr() (см. раздел 11.6.3).

Строковое представление repr(self) Вызывается встроенной функцией repr() и при использовании обратных ка вычек (‘expr‘) (а также функцией str() и инструкцией print, если метод str() не определен) для получения формального строкового представления объекта. Обычно такое представление должно выглядеть как выражение языка Python, пригодное для создания объекта с тем же самым значением. По традиции, объекты, для которых нельзя получить такое строковое представление достаточно простым способом, дают строку вида ’< >’ (представле ние такого вида будет получено для экземпляра класса, если он не имеет метода repr()).

str(self) Вызывается встроенной функцией str(), инструкцией print и оператором фор матирования с символом формата ‘s’ для получения строкового представления, наиболее пригодного для вывода.

oct(self) hex(self) Вызываются для реализации встроенных функций oct() и hex() соответственно.

Должны возвращать строковое значение.

Приведение к числовым типам 160 Глава 11. Встроенные типы данных complex(self) int(self) long(self) float(self) Вызывается при использовании встроенных функций complex(), int(), long(), и float(), а также оператора форматирования с символами формата, отличными от ‘s’. Должны возвращать значение соответствующего типа.

Арифметические и битовые операции Определение описанных в этом разделе методов позволит производить над объектами соответствующие арифметические и битовые операции привычным способом, то есть, используя операторы и встроенные функции.

Унарные операции neg(self) pos(self) invert(self) abs(self) Вызывается для реализации унарных операторов -, +, ~ и встроенной функции abs().

Бинарные операции Для того, чтобы вычислить выражение x op y, предпринимаются следующие шаги (op() и rop() — методы, реализующие оператор op, например, add() и radd() реализуют оператор +):

1. Если x является строкой и op является оператором форматирования (%), выпол няется форматирование и все остальные шаги пропускаются.

2. Если x является экземпляром класса:

(a) Если для x определен метод coerce(), x и y заменяются зна чениями, содержащимися в кортеже x.coerce(y);

если же метод coerce() возвращает None, перейти к пункту 3.

(b) Если после преобразований ни x, ни y не является экземпляром, перейти к пункту 4.

(c) Если для x определен метод op, вернуть x.op(y), в противном случае восстановить значения x и y, которые были перед выполнением пункта 2a.

11.6. Классы и экземпляры классов 3. Если y является экземпляром класса:

(a) Если для y определен метод coerce(), x и y заменяются зна чениями, содержащимися в кортеже x.coerce(y);

если же метод coerce() возвращает None, перейти к пункту 4.

(b) Если после преобразований ни x, ни y не является экземпляром, перейти к пункту 4.

(c) Если для y определен метод rop, вернуть y.rop(x), в противном случае восстановить значения x и y, которые были перед выполнением пункта 3a.

4. (a) Если x является последовательностью и op — + или *, выполняется объеди нение и размножение соответственно.

(b) В противном случае оба операнда должны быть числами. По возможности они приводятся к общему типу, и для этого типа выполняется соответствующая операция.

coerce(self, other) Вызывается для приведения операндов к общему11 типу. Должен возвращать кор теж, содержащий self и other, приведенные к общему типу, или None, если осуществить преобразование невозможно. В тех случаях, когда общий тип будет типом второго аргумента (other), эффективнее вернуть None, так как интерпрета тор также будет пытаться вызвать метод coerce второго аргумента (иногда, однако, реализация другого типа не может быть изменена, в этом случае полезно осуществить приведение к типу второго аргумента здесь).

add(self, other) sub(self, other) mul(self, other) div(self, other) mod(self, other) divmod(self, other) pow(self, other [, modulo]) lshift(self, other) rshift(self, other) and(self, other) xor(self, other) or(self, other) Вызываются (для правого операнда) для реализации бинарных операторов +, -, *, /, %, встроенной функции divmod(), оператора ** и встроенной функции pow(), операторов <<, >>, &, ^ и | соответственно. Например, для того чтобы вычислить выражение x+y, где x является экземпляром класса, имеющим метод add, Иногда полезно возвратить значения разного типа, например список и целое число.

162 Глава 11. Встроенные типы данных вызывается x.add(y). Обратите внимание, что, если должен поддерживать ся вызов встроенной функции pow() с тремя аргументами, метод pow() должен быть определен с третьим необязательным аргументом.

radd(self, other) rsub(self, other) rmul(self, other) rdiv(self, other) rmod(self, other) rdivmod(self, other) rpow(self, other) rlshift(self, other) rrshift(self, other) rand(self, other) rxor(self, other) ror(self, other) Вызываются (для левого операнда) для реализации перечисленных выше операций, если правый операнд не имеет соответствующего метода (без буквы ‘r’). Например, для того чтобы вычислить выражение x-y, где y является экземпляром класса, имеющим метод rsub, вызывается y.rsub(x). Обратите внимание, что функция pow(), вызванная с тремя аргументами, не будет пытаться использовать метод rpow() (правила приведения типов были бы слишком сложными).

iadd(self, other) isub(self, other) imul(self, other) idiv(self, other) imod(self, other) ipow(self, other) ilshift(self, other) irshift(self, other) iand(self, other) ixor(self, other) ior(self, other) Вызываются для реализации операций с присваиванием (изменением исходного объекта) +=, -=, *=, /=, %=, **= <<=, >>=, &=, ^= и |= соответственно. Эти ме тоды должны не возвращать результат, а модифицировать объект, к которому ме тод применяется. Если соответствующий метод не определен, операция ‘x op= y’ выполняется как ‘x = x op y’.

11.7. Файловые объекты 11.7 Файловые объекты Объекты типа file создаются встроенной функцией open() (см. главу 12), а также с помощью функций os.popen() и os.fdopen() (см. описание модуля os). Кроме того, различные модули предоставляют пути создания объектов с аналогичным интер фейсом (например, метод makefile() объектов, представляющих сетевое соединение).

Переменные sys.stdin, sys.stdout и sys.stderr (см. описание модуля sys) ини циализируются файловыми объектами, соответствующими стандартным потокам ввода, вывода и ошибок.

Если при выполнении операции над объектом-файлом возникает ошибка ввода вывода, включая ситуации, при которых по каким-либо причинам операция не определе на (например, метод seek() файлового объекта, представляющего устройство tty, или запись в файл, открытый для чтения), генерируется исключение IOError.

Объекты file имеют следующие методы:

close() Закрывает файл. При попытке произвести какую-либо операцию над закрытым фай лом генерируется исключение ValueError. Допускается вызов метода close() более одного раза.

flush() Сбрасывает содержимое внутреннего буфера.

isatty() Возвращает истину, если файл соответствует устройству tty, иначе возвращает 0 (ложь). Если объект с интерфейсом, характерным для файловых объектов, не ассоциирован с реальным файлом, для него этот метод не должен быть реализован.

fileno() Возвращает дескриптор файла (целое число), используемый для запросов к опе рационной системе для выполнения операций ввода/вывода. Может быть полезен для выполнения операций низкого уровня, использующих дескрипторы (например, определенные в модулях os и fcntl). Если объект с интерфейсом, характерным для файловых объектов, не ассоциирован с реальным файлом, для него этот метод не должен быть реализован.

read([size]) Считывает не более size байт из файла (меньше, если конец файла достигается раньше, чем прочитано size байт). Если аргумент size опущен или отрицатель ный, считывается все содержимое файла. Считанные байты возвращаются в ви де строкового объекта. Для некоторых файлов (например, устройства tty) вполне осмысленно продолжение чтения после достижения конца файла.

readline([size]) Считывает и возвращает строку из файла, включая завершающий символ новой 164 Глава 11. Встроенные типы данных строки12 (в последней строке файла он может отсутствовать). Если задан неотрица тельный аргумент size, считывается не более size байт (учитывая завершающий символ новой строки). В этом случае возвращаемая строка может быть неполной.

readlines([sizehint]) Считывает все содержимое файла и возвращает список строк. Если задан неотри цательный аргумент sizehint, считывает (по сумме длин строк) примерно sizehint байт (sizehint округляется в большую сторону таким образом, чтобы значение было кратным размеру внутреннего буфера). Объекты с интерфейсом, характерным для файловых объектов, могут игнорировать значение sizehint.

seek(offset [, whence]) Устанавливает текущую позицию в файле. Необязательный аргумент whence ука зывает на точку отсчета: 0 (по умолчанию) — начало файла, 1 — текущая позиция и 2 — конец файла.

tell() Возвращает текущую позицию в файле.

truncate([size]) Усекает файл до заданного (size) размера. По умолчанию размер равен текущей позиции. Наличие этого метода зависит от операционной системы.

write(s) Записывает строку s в файл. Заметим, что из-за использования буферизации строка на самом деле может не быть записана в файл до тех пор, пока не будет вызван метод flush() или close().

writelines(slist) Записывает строки из списка slist в файл. Метод writelines() не добавляет разделители строк. Начиная с версии 1.6, slist может быть последовательностью любого типа, не обязательно list.

Файловые объекты также имеют следующие атрибуты:

closed Текущее состояние файлового объекта: истина, если файл закрыт, иначе ложь.

Доступен только для чтения, значение изменяется при использовании метода close(). Этого атрибута может не быть у объектов, аналогичных файловым.

mode Режим ввода/вывода. Если файловый объект был создан с помощью встроенной функции open(), равен переданному ей аргументу mode. Доступен только для чтения. Этого атрибута может не быть у объектов, аналогичных файловым.

Основным достоинством того, что завершающий символ строки остается в возвращаемой строке, является возможность использования пустой строки для обозначения достижения конца файла.

11.8. Вспомогательные объекты name Если файловый объект был создан с помощью встроенной функции open(), равен имени файла. В противном случае, равен строке, которая указывает на проис хождение файлового объекта, в виде ‘<>’. Доступен только для чтения.

softspace Показывает, должен ли выводиться пробел перед выводом следующего значения с помощью инструкции print (истина) или нет (ложь). При создании собственных типов файловых объектов следует позаботиться о наличии доступного для записи атрибута softspace, который должен быть инициализирован нулем. Для классов, реализованных на языке Python, это происходит автоматически.

11.8 Вспомогательные объекты 11.8.1 Пустой объект Тип None принимает единственное значение, и существует единственный объект этого типа, который доступен через встроенное имя None. Объект None используется для указания на отсутствие значения во многих ситуациях (например, если функция не возвращает явно никакого значения). Значение None всегда ложно.

11.8.2 Объекты типа Объекты типа (type) представляют типы различных объектов. Вы можете получить объект типа для любого объекта (в том числе и для самого объекта типа) с помощью встроенной функции type(). В стандартном модуле types определены объекты типа для всех встроенных типов.

Объекты типа имеют следующие атрибуты, доступные только для чтения:

doc Строка документации, описывающая назначение объектов данного типа, или None.

name Имя типа. Именно эти имена используются в настоящей книге: Вы можете найти описание любого встроенного типа, воспользовавшись предметным указателем.

Строковое представление объектов типа выводится (например, инструкцией print) в виде .

166 Глава 11. Встроенные типы данных 11.8.3 Представление расширенной записи среза Эллипсис Тип ellipsis принимает единственное значение, и существует единственный объект этого типа, который доступен через встроенное имя Ellipsis. Объект Ellipsis ис пользуется для указания на использование эллипсиса (‘...’) в расширенной записи среза. Значение объекта Ellipsis всегда истинно.

Срез Объекты типа slice используются для представления расширенной записи сре зов, то есть, если срез записывается с использованием двух символов двое точия (obj[i:j:s]), указывается несколько срезов или используется эллипсис (obj[i:j, k:l], obj[..., i:j]). Кроме того, Вы можете создать объект slice, используя встроенную функцию slice().

Объекты среза имеют следующие атрибуты, доступные только для чтения (каждый из них может быть любого типа и равен None, если соответствующий аргумент в записи среза ‘start:stop:step’ опущен):

start Нижняя граница.

stop Верхняя граница.

step Шаг.

Фактически объект среза представляет множество индексов ‘range(start, stop, step)’.

11.9 Детали реализации 11.9.1 Объекты кода Объекты кода (code) используются для представления байт-компилированного испол няемого кода, такого как тело функции. Разница между объектом-кодом и объектом функцией состоит в том, что объект-функция содержит явную ссылку на словарь, пред ставляющий глобальное пространство имен модуля, в котором определена функция, в то время как объект-код “не знает” контекста, в котором он будет выполняться. Кроме того, 11.9. Детали реализации значения аргументов по умолчанию сохраняются в объекте-функции, так как они вычис ляются во время выполнения. Объект-код, в отличие от объекта-функции, неизменяем и не содержит ссылок (прямо или косвенно) на изменяемые объекты.

Объект-код создается с помощью встроенной функции compile(), а также мо жет быть извлечен из объекта-функции используя его атрибут func_code. Объект-код можно выполнить с помощью инструкции exec или вычислить представляемое им вы ражение с помощью встроенной функции eval().

Объекты кода имеют следующие атрибуты, доступные только для чтения:

co_name Содержит имя функции (или ’?’, если объект-код создан с помощью функции compile()).

co_argcount Число позиционных аргументов функции (включая аргументы, имеющие значения по умолчанию).

co_nlocals Число локальных переменных (включая аргументы функции).

co_varnames Кортеж, содержащий имена локальных переменных.

co_code Строка, представляющая последовательность байт-компилированных инструкций.

co_consts Кортеж, содержащий значения используемых литеральных выражений.

co_names Кортеж всех используемых в байт-коде имен.

co_filename Имя файла, из которого объект-код был скомпилирован.

co_firstlineno Номер первой строки определения функции в файле.

co_lnotab Строка, представляющая отображение смещения в байт-коде в номера строк (пу стая строка, если включена оптимизация).

co_stacksize Необходимый для выполнения размер стека (включая локальные переменные).

co_flags Число, представляющее различные флаги интерпретатора. Для co_flags опреде лены следующие биты (наиболее важные): бит 0x04 установлен, если функция 168 Глава 11. Встроенные типы данных использует запись ‘*args’ (воспринимает произвольное число позиционных аргу ментов);

бит 0x08 установлен, если функция использует запись ‘**kwds’ (воспри нимает произвольное число именованных аргументов).

Если объект кода представляет функцию, то первый элемент кортежа co_consts всегда является строкой документации (или None, если строка документации не опре делена).

11.9.2 Кадр стека Объект frame представляет кадр стека функции, “окружение”, в котором выполняют ся инструкции кода. Вы можете получить объект кадра стека через атрибут tb_frame объекта traceback (см. раздел 11.9.3). Объекты frame имеют следующие атрибуты (атрибутам f_trace, f_exc_type, f_exc_value и f_exc_traceback можно при своить новое значение, остальные доступны только для чтения):

f_back Ссылка на предыдущий кадр стека (то есть, если мы рассматриваем кадр стека функции func, то этот атрибут ссылается на кадр стека функции, вызвавшей функцию func) или None, если рассматриваемый кадр стека является последним (то есть относится не к функции, а к коду, исполняемому в глобальной области видимости).

f_code Объект кода (см. раздел 11.9.1), который выполняется в рассматриваемом кадре стека.

f_locals Словарь, используемый для поиска локальных имен.

f_globals Словарь, используемый для поиска глобальных имен.

f_builtins Словарь, используемый для поиска встроенных имен.

f_restricted Флаг, указывающий на то, что функция выполняется в защищенном режиме.

f_lineno Номер последней выполненной в рассматриваемом кадре стека строки.

f_lasti Номер последней выполненной в рассматриваемом кадре стека инструкции байт кода (может использоваться в качестве индекса для строки байт-кода объекта code).

11.9. Детали реализации f_trace Функция, которая будет вызываться в начале каждой строки исходного кода, или None (используется отладчиком).

f_exc_type f_exc_value f_exc_traceback Эти атрибуты представляют последнее перехваченное в рассматриваемом кадре исключение.

11.9.3 Объекты traceback Объект traceback представляет путь, пройденный с момента генерации исключения до его перехвата. Таким образом, он создается при возникновении исключительной ситуа ции. Вы можете получить объект traceback в качестве третьего элемента кортежа, воз вращаемого функцией sys.exc_info() (см. описание модуля sys). Если программа не содержит подходящего обработчика исключения, информация, хранящаяся в объекте traceback, выводится в стандартный поток ошибок. В интерактивном режиме объект traceback для последнего не перехваченного исключения доступен через переменную sys.last_traceback.

Объекты traceback имеют следующие атрибуты, доступные только для чтения:

tb_next Ссылка на объект traceback, представляющий следующий уровень на пути в сторону кадра стека, в котором возникла исключительная ситуация, или None, если рассматриваемый объект представляет последний уровень.

tb_frame Ссылка на кадр стека, представляющего текущий уровень.

tb_lineno Номер строки (на текущем уровне), в которой возникла исключительная ситуация.

tb_lasti Номер (на текущем уровне) инструкции байт-кода, которая привела к возникно вению исключительной ситуации (может использоваться в качестве индекса для строки байт-кода объекта code).

Значения атрибутов tb_lineno и tb_lasti объекта traceback могут отличать ся от значений атрибутов f_lineno и f_lasti объекта frame, если исключительная ситуация возникла в теле инструкции try без подходящей ветви except или имеющей ветвь finally.

Глава Встроенные функции Существует некоторый набор функций, встроенных в интерпретатор и, таким образом, всегда доступных для использования. Ниже приведены все встроенные функции в алфа витном порядке.

import(name [, globals [, locals [fromlist]]]) Эта функция вызывается инструкцией import. Вы можете заменить ее другой функцией, имеющей совместимый с import() интерфейс для того, чтобы изменить семантику инструкции import. Чтобы получить представление как и за чем это следует делать, смотрите описание стандартных модулей ihooks и rexec.

Обратите также внимание на встроенный модуль imp, в котором определены неко торые операции, полезные для написания собственной функции import.

Например, инструкция ‘import spam’ приводит к выполнению ‘import(’spam’, globals(), locals(), [])’, а инструкция ‘from spam.ham import eggs’ — к выполнению ‘import(’spam.ham’, globals(), locals(), [’eggs’])’. Несмотря на то, что locals() и [’eggs’] передаются в качестве аргументов, сама функция import() не устанавливает локальную переменную eggs. На самом деле, стандартная функция import() вообще не использует аргумент locals, а аргумент globals использует только для определения контекста инструкции import.

Если аргумент name задан в виде ’.’ и список fromlist пу стой, функция import() возвращает объект-модуль, соответствующий име ни ’’ (часть имени name до первой точки), а не объект-модуль с именем name. Однако, если задан не пустой аргумент fromlist, функция import() возвращает объект-модуль, соответствующий имени name. Это сделано для совме стимости байт-кода, сгенерированного для разных вариантов инструкции import:

при использовании ‘import spam.ham.eggs’, объект модуль spam должен быть помещен в пространство имен, соответствующее области видимости, в котором выполняется инструкция import, в то время как при использовании ‘from spam.ham import eggs’, объект-модуль spam.ham должен быть использован для поиска объекта eggs. Для получения объекта Вы можете воспользоваться встроенной функцией getattr(), например:

import string def my_import(name):

mod = import(name) components = string.split(name, ’.’) for comp in components[1:]:

mod = getattr(mod, comp) return mod abs(x) Возвращает абсолютное значение аргумента. Для комплексных чисел возвраща ет x*x.conjugate(). Поведение функции abs() применительно к экземплярам определяется специальным методом abs() (см. раздел 11.6.3).

apply(object, args [, keywords]) Аргумент object должен быть объектом, поддерживающим вызов (см. раздел 11.4) и аргумент args должен быть последовательностью (если args не является кортежем, последовательность сначала преобразуется в кортеж). Необязательный аргумент keywords должен быть словарем, ключи которого являются строками.

Возвращает результат вызова функции object с позиционными аргументами args и именованными аргументами keywords. Начиная с версии 1.6, тот же результат Вы можете получить, используя расширенную запись вызова: ‘object(*args, **keywords)’.

buffer(object [, offset[, size]]) Создает и возвращает объект buffer, который ссылается на object (см. раздел 11.2.5). object должен быть объектом, поддерживающим соответствующий ин терфейс (string, unicode, array, buffer). Объект buffer представляет срез от offset (или от начала, если аргумент offset опущен) длиной size (до конца объекта object, если аргумент size опущен).

callable(object) Возвращает истину, если аргумент object поддерживает вызов, иначе возвращает ложь (см. также раздел 11.4).

chr(i) Возвращает строку, состоящую из одного символа, код которого равен i. Напри мер, chr(97) возвращает строку ’a’. Аргумент i должен быть целым числом от 0 до 255 включительно, если i выходит за пределы указанного диапазона, ге нерируется исключение ValueError. Обратная операция выполняется функцией ord(). См. также описание функции unichr().

cmp(x, y) Сравнивает объекты x и y и возвращает целое число: отрицательное, если x < y, ноль, если x == y, и положительное, если x > y.

coerce(x, y) Пытается привести объекты x и y к общему типу используя такие же правила, как и для арифметических операций, и возвращает результат в виде кортежа из двух объектов. Если оба аргумента являются экземплярами класса, специальный метод coerce() вызывается только для первого.

172 Глава 12. Встроенные функции compile(string, filename, kind) Компилирует строку string и возвращает объект кода (см. раздел 11.9.1). Ар гумент filename указывает имя файла, из которого создается объект кода. Ис пользуйте строку вида ’<>’, если исходный текст берется не из файла (например, ’’). Аргумент kind указывает какого рода объект кода дол жен быть создан: используйте ’exec’, если string состоит из последователь ности инструкций, ’eval’, если string содержит единственное выражение, или ’single’, если string содержит одну инструкцию для интерактивного режима (в последнем случае результат выполнения инструкции-выражения отличный от None будет выведен в стандартный поток вывода).

complex(real [, imag]) Преобразует аргумент числового типа real к комплексному типу, добавляет к нему imag*j (аргумент imag должен быть числового типа, по умолчанию равен нулю) или преобразует строку real в комплексное число (аргумент imag при этом игнорируется) и возвращает результат.

delattr(object, name) Удаляет атрибут с именем name (строка) у объекта object, если объект поз воляет это сделать. Например, вызов ‘delattr(x, ’foobar’)’ эквивалентен инструкции ‘del x.foobar’.

dir([object]) Без аргументов, возвращает список имен, определенных в локальной области ви димости (с точностью до порядка следования, эквивалентно locals().keys()).

С заданным аргументом, возвращает список атрибутов объекта object. Эта информация собирается из атрибутов объекта dict, methods и members, если они определены. Заметим, что функция dir() выдает список лишь тех атрибутов, которые определены непосредственно для объекта object.

Так, например, применительно к классу, не включаются атрибуты, определенные для базовых классов, а применительно к экземплярам, не включаются атрибуты класса. Имена в возвращаемом списке располагаются в алфавитном порядке.

divmod(a, b) Возвращает кортеж из двух чисел1: целой части и остатка при делении a на b. К операндам применяются обычные правила приведения к общему типу, как и при выполнении других арифметических операций. Если оба операнда целые (int или long int), результат будет равен ‘(a / b, a % b)’. Для чисел с плавающей точкой результат будет равен ‘(q, a % b)’, где q (типа float) обычно равно ‘math.floor(a / b)’, но может быть на единицу меньше. В любом случае, значение выражения ‘q * b + a % b’ очень близко к a, а ‘a % b’ (если не равно нулю) имеет тот же знак, что и b. Кроме того, всегда выполняется условие ‘0 <= abs(a % b) < abs(b)’.

eval(expression [, globals [, locals]]) Строка expression разбирается и вычисляется ее значение как выражения на Могут быть произвольного типа, если a или b является экземпляром класса с методом divmod и rdivmod соответственно.

языке Python, используя словари globals и locals в качестве глобального и ло кального пространств имен. Если опущен аргумент locals, он считается равным globals. Если опущены оба необязательных аргумента, выражение вычисляется в том окружении, из которого была вызвана функция eval(). Возвращает результат вычисления выражения. Например:

>>> x = >>> eval(’x+1’) Функция может быть также использована для вычисления байт-компилированного с помощью функции compile() (аргумент kind должен быть равен ’eval’) выражения. В этом случае аргумент expression должен быть объектом кода.

См. также описание инструкции exec (раздел 10.3) и функций execfile(), globals() и locals().

execfile(file [, globals [, locals]]) Эта функция является аналогом инструкции exec, но обрабатывает файл вместо строки. От инструкции import она отличается тем, что не использует управление модулями — считывает файл независимо от каких-либо условий, не создает (и не использует) байт-компилированную версию файла и не создает объект-модуль.

Файл с именем file считывается, разбирается и выполняется как последова тельность инструкций языка Python (аналогично модулям), используя словари globals и locals в качестве глобального и локального пространств имен. Ес ли опущен аргумент locals, он считается равным globals. Если опущены оба необязательных аргумента, выражение вычисляется в том окружении, из которого была вызвана функция execfile().

filter(function, list) Возвращает список из тех элементов последовательности list, для которых функ ция function (любой объект, поддерживающий вызов с одним аргументом, или None) возвращает истину. Если list является строкой (string) или кортежем, результат будет иметь тот же тип. В противном случае возвращаемое значение бу дет иметь тип list. Если аргумент function равен None, возвращаемый список будет содержать элементы последовательности list, являющиеся истиной.

float(x) Преобразует строку или число (кроме комплексного) к вещественному типу и воз вращает результат. Если аргумент является строкой, он должен содержать толь ко десятичную запись целого или вещественного числа, заключенную, возможно, в символы пропуска (whitespace). Заметим, что ограничения, накладываемые на аргумент-строку, зависят от реализации библиотеки языка C. Экземпляры классов также могут быть преобразованы к вещественному типу, если для них определен специальный метод float.

getattr(object, name [, default]) Возвращает значение атрибута с именем name объекта object. Если object 174 Глава 12. Встроенные функции не имеет атрибута с именем name (строка), возвращается значение необяза тельного аргумента default (если он задан) или генерируется исключение AttributeError.

globals() Возвращает словарь, представляющий глобальное пространство имен текущего мо дуля (внутри функции — это глобальное пространство имен модуля, в котором определена функция, а не тот, в котором она используется).

hasattr(object, name) Возвращает 1, если объект object имеет атрибут с именем name (строка), иначе возвращает 0. Функция реализована следующим образом: производится попытка получить значение атрибута с указанным именем и, если генерируется (любое) исключение, то считается, что объект не имеет атрибута с таким именем.

hash(object) Возвращает хэш-значение объекта object. Если для объекта не может быть по лучено хэш-значение, генерирует исключение TypeError. Хэш-значения исполь зуются для быстрого сравнения ключей при поиске в словарях. Равные объекты (в том числе и разного типа, например, 1 и 1.0) должны иметь равные хэш-значения.

hex(x) Возвращает шестнадцатеричное представление целочисленного (int или long int) аргумента. Результат является правильным литеральным выражением языка Python (для длинного целого в конце будет добавлен суффикс ‘L’). Заметим, что результат всегда беззнаковый, например, на 32-разрядных платформах hex( 1) дает ’0xffffffff’. При использовании результата в качестве литерального выражения на платформе с таким же размером слова, Вы получите -1. На плат формах с другим размером слова Вы можете получить большое положительное число или будет сгенерировано исключение OverflowError.

id(object) Возвращает идентификатор объекта object — целое число (типа int или long int). Гарантируется уникальность идентификатора на всем протяжении жизни объекта. Два объекта, промежутки времени существования которых не пе ресекаются, могут иметь одинаковые идентификаторы. В настоящее время иденти фикатор является адресом объекта.

input([prompt]) Эквивалентно eval(raw_input(prompt)) (запрашивает выражение, вычисляет и возвращает его значение).

int(x [, radix]) Преобразует строку или число (любого типа, кроме комплексного) x в простое целое (int). Если аргумент x является строкой, он должен содержать только десятичную запись целого числа, заключенную, возможно, в символы пропуска (whitespace). В этом случае, начиная с версии 1.6, Вы можете задать другое осно вание системы счисления radix (в более ранних версиях, Вы можете воспользо ваться функцией string.atoi) от 2 до 36 включительно2 или 0. Если аргумент 10 цифр плюс 26 букв латинского алфавита.

radix равен нулю, основание системы исчисления (8, 10 или 16) определяет ся автоматически исходя из записи числа аналогично тому, как обрабатываются числовые литеральные выражения. Если задан аргумент radix, а x не являет ся строкой, генерирует исключение TypeError. Преобразование вещественных чисел зависит от реализации библиотеки языка C. Обычно число округляется в сторону нуля3.

intern(string) Добавляет строку string в специальную таблицу строк (если такой строки там не было) и возвращает тот же объект-строку или возвращает строку с таким же значением, ранее помещенную в эту таблицу. Это позволяет немного повысить производительность при поиске по ключу в словарях благодаря тому, что сравне ние таких строк можно производить по идентификаторам (вместо обычного лекси кографического сравнения). Эта процедура выполняется автоматически для всех имен, используемых в программах на языке Python, для ускорения поиска в слова рях, представляющих пространства имен модулей, классов и экземпляров классов.

Строки, помещенные в специальную таблицу, никогда не уничтожаются.

isinstance(object, class) Возвращает 1, если object является (прямо или косвенно) экземпля ром класса class или является объектом типа class, иначе возвраща ет 0. В первом случае результат будет таким же, как и у выражения ‘issubclass(object.class, class)’, во втором — таким же, как и у вы ражения ‘type(object) is class’. Если class не является объектом-классом или объектом-типом, генерирует исключение TypeError.

issubclass(class1, class2) Возвращает 1, если класс class1 является (прямо или косвенно) производным от класса class2. Считается, что класс также является производным от само го себя. Если какой-либо аргумент не является объектом-классом, генерируется исключение TypeError.

len(object) Возвращает длину (количество элементов) объекта. Аргумент может быть после довательностью, отображением или экземпляром класса, для которого определен специальный метод len().

list(sequence) Возвращает список, составленный из элементов последовательности sequence.

Порядок следования элементов сохраняется. Если последовательность sequence уже является списком, возвращается его копия (аналогично sequence[:]). На пример, list(’abc’) возвращает [’a’, ’b’, ’c’], а list((1, 2, 3)) возвращает [1, 2, 3].

locals() Возвращает словарь, представляющий локальное пространство имен. Не следует изменять его, внесенные изменения могут не отразиться на значениях локальных переменных, используемых интерпретатором.

Такое поведение неприятно — определение языка должно требовать округления в сторону нуля.

176 Глава 12. Встроенные функции long(x [, radix]) Преобразует строку или число (любого типа, кроме комплексного) x в длинное це лое (long int). Если аргумент x является строкой, он должен содержать только десятичную запись целого числа (сразу после последней цифры может присутство вать символ ‘l’ или ‘L’), заключенную, возможно, в символы пропуска (whitespace).

В этом случае, начиная с версии 1.6, Вы можете задать другое основание системы счисления radix (в более ранних версиях, Вы можете воспользоваться функци ей string.atol) от 2 до 36 включительно или 0. Если аргумент radix равен нулю, основание системы исчисления (8, 10 или 16) определяется автоматически исходя из записи числа аналогично тому, как обрабатываются числовые литераль ные выражения. Если задан аргумент radix, а x не является строкой, генерирует исключение TypeError. Преобразование вещественных чисел зависит от реали зации библиотеки языка C. Обычно число округляется в сторону нуля. См. также описание функции int().

map(function, seq...) Последовательно применяет function (любой объект, поддерживающий вызов, или None) к каждому элементу последовательности seq и возвращает список результатов. Функции map() может быть передано более одной последовательно сти. В этом случае количество воспринимаемых объектом function аргументов должно быть равным количеству переданных последовательностей. Если один или несколько списков окажутся короче других, недостающие элементы будут счи таться равными None. Если значение аргумента function равно None, подразу мевается функция, возвращающая свой аргумент (для одной последовательности) или кортеж своих аргументов (для нескольких последовательностей). Аргументы последовательности могут быть любого типа, результат всегда будет иметь тип list.

max(seq) max(v1, v2...) С единственным аргументом seq, возвращает наибольший элемент последователь ности. Если последовательность пустая, генерируется исключение ValueError.

Если задано несколько аргументов, возвращает наибольший из них.

min(seq) min(v1, v2...) С единственным аргументом seq, возвращает наименьший элемент последователь ности. Если последовательность пустая, генерируется исключение ValueError.

Если задано несколько аргументов, возвращает наибольший из них.

oct() Возвращает восьмеричное представление целого (int или long int) аргумен та. Результат является правильным литеральным выражением языка Python (для длинного целого в конце будет добавлен суффикс ‘L’). Заметим, что резуль тат всегда беззнаковый, например, на 32-разрядных платформах oct(-1) дает ’037777777777’. См. также описание функции hex().

open(filename [, mode [, bufsize]]) Открывает файл и возвращает соответствующий ему файловый объект (см. раздел 11.7). filename — имя файла, mode — строка, указывающая, в каком режиме файл будет открыт. Возможные режимы: ’r’ — для чтения (файл должен суще ствовать), ’w’ — для записи (если файл не существует, он создается, в противном случае его содержимое удаляется), ’a’ — для добавления в конец файла (если файл не существует, он создается;

текущее положение в файле устанавливается указывающим на его конец;

на некоторых платформах метод seek() игнорирует ся), ’r+’, ’w+’ и ’a+’ — для чтения и записи (для открытия в режиме ’r+’ файл должен существовать, в режиме ’w+’ содержимое существующего файла удаляется). При добавлении символа ‘b’ к режиму гарантируется, что файл будет открыт в двоичном режиме. На некоторых платформах файлы по умолчанию от крываются в текстовом режиме, в котором операционная система автоматически заменяет некоторые символы. Во избежание возможной порчи данных лучше все гда принудительно выставлять двоичный режим (даже на платформах, где файл по умолчанию открывается в двоичном режиме — подумайте о переносимости Ваших программ). Если файл не может быть открыт, генерируется исключение IOError.

Если аргумент mode опущен, он считается равным ’r’.

Необязательный целый аргумент bufsize указывает желаемый размер буфера: означает отсутствие буферизации, 1 — построчная буферизация, любое другое по ложительное число означает буфер (примерно) указанного размера. Если bufsize опущен или меньше нуля, используется системное значение по умолчанию4: обыч но построчная буферизация для устройств tty и довольно большое значение для других файлов.

ord(c) Возвращает код символа. Аргумент c должен быть строкой (string или unicode), состоящей из одного символа. Например, ord(’a’) возвращает 97, ord(u’\u2020’) возвращает 8224. Обратное преобразование может быть выпол нено с помощью функций chr() для обычных символов и unichr() для символов Unicode.

pow(x, y [, z]) С двумя аргументами возвращает x в степени y (эквивалентно ‘x ** y’). С заданным третьим аргументом, результат будет такой же, как и у выражения ‘pow(x, y) % z’, однако вычисление производится более эффективно. Со сме шанными типами операндов, применяются обычные правила для арифметических операций. Эффективный тип операндов также является и типом результата. Если результат не может быть выражен в рамках этого типа, генерируется соответ ствующее ситуации исключение. Например, pow(2, -1) генерирует исключение ValueError, а pow(2, 35000) генерирует исключение OverflowError.

range([start,] stop [, step]) Эта гибкая функция создает и возвращает арифметическую прогрессию от start (включительно;

по умолчанию 0) до stop (исключая само значение stop) с ша гом step (по умолчанию 1;

если задан шаг, аргумент start становится обяза тельным). Все аргументы должны быть простыми целыми (int), если аргумент На системах, библиотека языка C которых не имеет функцию setvbuf(), размер буфера, независимо от bufsize, будет иметь значение по умолчанию.

178 Глава 12. Встроенные функции step равен нулю, генерируется исключение ValueError. Если step — поло жительное число, последним элементом списка будет наибольшее число из ряда start + i * step, которое меньше, чем stop (i — натуральное число или ноль). Если step — отрицательное число, последним элементом списка будет наименьшее число из ряда start + i * step, которое больше stop. Несколько примеров:

>>> range(10) [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] >>> range(1, 11) [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] >>> range(0, 30, 5) [0, 5, 10, 15, 20, 25] >>> range(0, 10, 3) [0, 3, 6, 9] >>> range(0, -10, -1) [0, -1, -2, -3, -4, -5, -6, -7, -8, -9] >>> range(0) [] >>> range(1, 0) [] raw_input([prompt]) Если задан аргумент prompt, его значение (точнее строковое представление, по лученное аналогично тому, как это делают функция str() и инструкция print) выводится на стандартный поток вывода (в отличие от инструкции print, символ новой строки в конце не добавляется). Функция считывает строку из стандартного потока ввода и возвращает ее (исключая завершающий символ перехода на новую строку). Если при считывании достигается конец файла, генерируется исключение EOFError. Например:

>>> s = raw_input(’--> ’) --> Monty Python’s Flying Circus >>> s "Monty Python’s Flying Circus" Если загружен модуль readline, функция raw_input() будет использовать его, предоставляя возможности редактирования строки и использования истории вве денных строк (некоторые операционные системы, например Windows NT, предо ставляют аналогичные возможности автоматически).

reduce(function, sequence [, initializer]) Последовательно применяет function (объект, поддерживающий вызов с двумя аргументами) сначала к двум первым элементам последовательно сти sequence, затем к результату и третьему элементу и т. д. Напри мер, ‘reduce(operator.add, [1, 2, 3, 4, 5])’ вычисляет сумму ((((1+2)+3)+4)+5). Если задан необязательный аргумент initializer, при вычислении он помещается перед первым элементом. Если общее количество элементов (initializer, если он задан, плюс элементы последовательности sequence) равно 1, возвращается его (единственного элемента) значение, если общее количество элементов равно 0 (то есть не задан аргумент initializer и используется пустая последовательность), генерируется исключение TypeError.

reload(module) Заново считывает и инициализирует уже импортированный модуль. Аргумент module должен быть объектом-модулем, представляющим ранее успешно импор тированный модуль. Возвращает объект-модуль (тот же самый, что и module). Эта функция может быть полезна при одновременном редактировании и тестировании в интерактивном режиме (не покидая интерпретатора) модулей.

Если в исходном тексте модуля нет синтаксических ошибок, но они возникают во время его инициализации, первая инструкция import для этого модуля не со здаст соответствующую ему локальную переменную, а лишь сохранит (частично инициализированный) объект-модуль в sys.modules. Для того, чтобы перезагру зить модуль, необходимо сначала повторно импортировать с помощью инструкции import (при этом создается локальная переменная, ссылающаяся на частично ини циализированный объект-модуль) и лишь затем использовать функцию reload().

При перезагрузке модуля старый словарь, представляющий глобальное простран ство имен модуля сохраняется. Новые определения перезаписывают старые, так что это обычно не вызывает проблем. Если новая версия не определяет какое-либо имя, для него остается прежнее значение. Эта особенность может быть исполь зована модулем, если он поддерживает глобальную таблицу или кэш объектов: с помощью инструкции try Вы можете определить наличие таблицы и, при желании, пропустить ее инициализацию.

Перезагрузка встроенных и динамически связываемых модулей в принципе допу стима (кроме модулей sys, main и builtin), однако не настолько по лезна. Некоторые дополнительные модули, однако, не приспособлены к повторной инициализации, что может привести к всевозможным ошибкам.

Если Вы импортируете объекты из модуля, используя инструкцию ‘from...

import...’, перезагрузка модуля не приведет к переопределению этих объек тов — после перезагрузки необходимо повторно выполнить инструкцию ‘from...

import...’.

Если Вы определили экземпляры класса, перезагрузка модуля, в котором определен класс, не изменит определения методов для экземпляров — они будут продолжать использовать старые определения. То же самое верно и для производных классов.

repr(object) Возвращает строку, содержащую представление объекта object. Тот же эф фект Вы можете получить, заключив выражение object в обратные кавычки (‘object‘). По возможности функция repr() возвращает строку, пригодную для восстановления объекта с тем же значением с помощью функции eval(). См.

также описание функции str().

round(x [, n]) Возвращает вещественное число, полученное округлением x до n цифр после де сятичной точки. По умолчанию n считается равным нулю. То есть возвращает 180 Глава 12. Встроенные функции ближайшее к x число, кратное 10-n. Из двух одинаково близких чисел выбира ется то, которое находится дальше от нуля (то есть round(0.5) дает 1.0 и round(-0.5) дает -1.0).

setattr(object, name, value) Присваивает атрибуту с именем name (строка) объекта object значение value. name может быть именем уже существующего или нового атрибута.

Например, вызов ‘setattr(x, ’foobar’, 123)’ эквивалентен инструкции ‘x.foobar = 123’.

slice([start,] stop [, step]) Возвращает объект среза (см. раздел 11.8.3). Если какой-либо необязательный аргумент опущен, используется None для обозначения значения по умолчанию.

str(object) Возвращает строковое представление, наиболее пригодное для вывода. В отличие от repr(), функция str() даже не пытается создать строку, являющуюся пра вильным выражением языка Python. Точно такое представление используется для объектов при выводе их с помощью инструкции print.

tuple(sequence) Возвращает кортеж, составленный из элементов последовательности sequence.

Порядок следования элементов сохраняется. Если последовательность sequence уже является кортежем, он возвращается без изменений (нет смысла создавать его копию, так как кортежи являются неизменяемыми объектами). Например, tuple(’abc’) возвращает (’a’, ’b’, ’c’), а tuple([1, 2, 3]) возвра щает (1, 2, 3).

type(object) Возвращает тип объекта object. Возвращаемое значение является объектом ти па (см. раздел 11.8.2). В стандартном модуле types определены имена для всех встроенных типов. Например:

>>> import types >>> if type(x) == types.StringType:

... print " x " unichr(i) Возвращает строку Unicode, состоящую из одного символа, код которого равен i.

Например, unichr(97) возвращает строку u’a’. Аргумент i должен быть целым числом от 0 до 65535 включительно, если i выходит за пределы указанного диа пазона, генерируется исключение ValueError. Обратная операция выполняется функцией ord(). См. также описание функции chr().

unicode(string [, encoding [, errors]]) Преобразует строку string из кодировки encoding (по умолчанию ’utf-8’) в строку Unicode и возвращает результат. Поведение при возникновении ошибок определяется значением аргумента errors: ’strict’ (используется по умолча нию) означает, что при возникновении ошибки будет сгенерировано исключение UnicodeError, ’ignore’ — недопустимые символы игнорируются (удаляются), ’replace’ — недопустимые символы заменяются универсальным символом за мены (“REPLACEMENT CHARACTER”, u’\uFFFD’).

vars([object]) Без аргументов возвращает словарь, соответствующий локальному пространству имен. Если в качестве аргумента передан объект, представляющий модуль, класс или экземпляр класса (или любой другой объект, имеющий атрибут dict), возвращает словарь, соответствующий пространству имен объекта. Не следует вно сить изменения в возвращаемый словарь: эффект на соответствующее простран ство имен не определен5.

xrange([start,] stop [, step]) Эта функция работает аналогично функции range(), но возвращает объект xrange (см. раздел 11.2.4) вместо списка. Этот тип последовательности позволяет получать точно такие же значения, как и соответствующий список (полученный с помощью функции range() с такими же аргументами), на самом деле не храня их.

Преимущества функции xrange() над функцией range() обычно минимальны и проявляются только на очень длинных рядах чисел.

zip(seq1...) Возвращает список, каждый i-й элемент которого является кортежем, составлен ным из i-х элементов последовательностей seq1,..., seqN в порядке их следо вания в списке аргументов. Требуется как минимум один аргумент, в противном случае, генерируется исключение TypeError. Длина возвращаемого списка равна длине самой короткой из последовательностей seq1,..., seqN. Если все последова тельности имеют одинаковую длину, функция zip ведет себя аналогично функции map с None в качестве первого аргумента. Функция доступна, начиная с версии 2.0.

В текущих реализациях локальные переменные не могут быть изменены таким способом, а простран ства имен объектов — могут. Ситуация может измениться в будущих версиях.

Глава Встроенные классы исключений Исключения в языке Python могут быть экземплярами классов и строками. Поддерж ка строк в качестве исключений оставлена для совместимости с ранними версиями и может быть удалена в будущем. Классы встроенных исключений определены в стандарт ном модуле exceptions. Нет необходимости явно импортировать этот модуль — все определенные в нем классы исключений всегда доступны аналогично другим встроенным объектам (определены в пространстве встроенных имен).

Если в ветви except инструкции try указывается объект-класс C, эта ветвь бу дет обрабатывать любое “совместимое” с указанным классом исключение, то есть ес ли оно является экземпляром C или производного от него класса. Например, ветвь ‘except ValueError:’ будет обрабатывать исключения UnicodeError1, но ‘except UnicodeError:’ не будет перехватывать исключения ValueError. Два класса исклю чений, ни один из которых не является производным (прямо или косвенно) от другого, никогда не будут эквивалентными, даже если они имеют одинаковое имя (под именем исключения подразумевается имя класса, то есть значение атрибута name объекта класса).

Описанные ниже встроенные исключения генерируются интерпретатором, встро енными функциями и методами объектов встроенных типов. Исключения могут иметь ассоциированное с ним значение (аргумент или несколько аргументов, используемые при его инициализации), описывающее причину возникновения исключительной ситуа ции. Если класс исключения является производным от стандартного класса Exception, аргументы, используемые при инициализации, сохраняются в атрибуте args.

Пользовательский код также может генерировать исключения встроенных типов для тестирования обработчиков ошибок, а также, если необходимо сообщить об ошибке (или другой исключительной ситуации), для которой данный встроенный класс исклю чений предназначен.

Ниже приведена иерархия встроенных классов исключений.

Exception Базовый класс для всех встроенных классов исключений. Рекомендуется также ис пользовать его для всех пользовательских классов исключений. Атрибут args его Здесь и далее под “исключениями SomeError” или “исключениями типа SomeError” подразуме ваются “исключения, являющиеся экземплярами класса SomeError”, если речь идет о генерируемом исключении, и “исключения, являющиеся экземплярами SomeError и производных от него классов”, если речь идет о перехватываемом исключении.

экземпляров содержит список аргументов, которые использовались при его ини циализации. Встроенная функция str(), при применении к экземплярам класса Exception, возвращает строковое значение аргумента (если при инициализации использовался один аргумент), кортежа аргументов (если при инициализации ис пользовалось более одного аргумента) или пустую строку (если конструктор вызы вался без аргументов). Кроме того, Вы можете получить доступ (только для чтения) к аргументам, используя операцию получения элемента по индексу (exc[i]).

StandardError Базовый класс исключений, предназначенных для генерации при возникнове нии стандартных ошибок (то есть всех ошибок, которые могут возникнуть при использовании встроенных средств языка).

ArithmeticError Базовый класс исключений, генерируемых при возникновении арифмети ческих ошибок.

FloatingPointError Исключения этого класса генерируются, если возникают проблемы с выполнением операции с плавающей точкой (могут генерироваться только если Python сконфигурирован с опцией --with-fpectl или в файле ‘config.h’ определено имя WANT_SIGFPE_HANDLER).

OverflowError Используется, когда результат арифметической операции слишком большой, чтобы его можно было представить в рамках используемо го типа. Заметим, что этого не может произойти при использовании длинного целого типа (long int) — скорее будет сгенерировано ис ключение MemoryError. Из-за того, что обработка ошибок при опера циях с плавающей точкой в языке C не стандартизована, большинство таких операций не проверяются. Для обычных целых чисел (int), все операции, которые могут привести к переполнению, проверяются, за исключением сдвига влево, так как в этом случае потеря старших бит считается предпочтительнее генерации исключения.

ZeroDivisionError Используется, если второй операнд операторов деления и получения остатка от деления равен нулю.

AssertionError Исключения этого класса генерируются, если не выполняется условие, указанное в инструкции assert.

AttributeError Исключения этого класса генерируются в случаях, когда невозможно по лучить значение атрибута с определенным именем, удалить его или при своить ему новое значение. Если объекты данного типа вообще не поддер живают используемый доступ к атрибутам (получение значения, удаление или присваивание), генерируется исключение TypeError.

EOFError Исключения этого класса генерируются некоторыми встроенными функ циями (input(), raw_input()), если достигается конец файла и, при этом, из него не считано ни байта информации. Обратите внимание на то, 184 Глава 13. Встроенные классы исключений что методы read() и readline() файловых объектов при достижении конца файла возвращают пустую строку.

EnvironmentError Базовый класс исключений, генерируемых при ошибках, возникающих за пределами интерпретатора Python. Если при инициализации исключений этого типа используются 2 или 3 аргумента, первый из них считается кодом ошибки, второй — строкой, поясняющей причину ее возникнове ния, и третий (необязательный) — имя файла, с которым связана возник шая ошибка. В этом случае аргументы (помимо унаследованного атрибу та args) сохраняются соответственно в атрибутах errno, strerror и filename и используются для создания строкового представления (функ ция str()) в виде ’[Errno errno] strerror’ или ’[Errno errno] strerror: filename’.

IOError Используется при ошибках ввода/вывода, например, если не найден файл с указанным именем или на носителе нет свободного места.

OSError Исключения этого класса (доступного также как os.error) в основ ном генерируются функциями модуля os.

WindowsError Используется при ошибках, специфичных для операционных си стем Windows или код ошибки не соответствует значению errno.

Значения атрибутов errno и strerror создаются из значе ний, возвращаемых функциями Windows API GetLastError() и FormatMessage() соответственно. Добавлен в версии 1.6.

ImportError Исключения этого класса генерируются, если модуль с указанным в ин струкции import именем не может быть импортирован или в модуле не найдено имя, указанное в инструкции from... import....

KeyboardInterrupt По умолчанию, если интерпретатор получает сигнал SIGINT, например, при прерывании с клавиатуры (обычно клавишами Ctrl-C), генерирует ся исключение KeyboardInterrupt. Вы можете изменить реакцию на сигнал SIGINT, воспользовавшись функцией signal.signal(). Преры вание в момент ожидания ввода, при использовании функций input() и raw_input(), а также методов read(), readline() и readlines() файлового объекта, представляющего устройство tty, также генерируется исключение KeyboardInterrupt2.

LookupError Базовый класс исключений, генерируемых, если последователь ность или отображение не содержит элемента с заданным индек сом или ключом. Может быть сгенерировано напрямую функцией sys.setdefaultencoding().

На самом деле, поведение зависит от используемой платформы. Например, под Windows NT при пре рывании в момент работы функций input() и raw_input() сначала будет сгенерировано исключение EOFError.

IndexError Используется в случаях, когда индекс, используемый для получения элемента последовательности, выходит за пределы диапазона. Заме тим, что индексы среза в этом случае считаются указывающими на конец или начало последовательности, и ошибки не возникает. Если индекс не является обычным целым числом, генерируется исключение TypeError.

KeyError Исключения этого класса генерируются, если в отображении не най дена запись с указанным ключом. В качестве аргумента при инициа лизации экземпляра исключения обычно используется ключ.

MemoryError Используется, если для выполнения операции не хватает памяти, но из сложившейся ситуации еще можно выйти, удалив некоторые объекты. Эк земпляр исключения может быть инициализирован строкой, указывающей род (внутренней) операции, для выполнения которой не хватило памяти.

Заметим, что лежащая в основе интерпретатора архитектура управления памятью (функция malloc() языка C) не всегда позволяет полностью восстановиться из подобных ситуаций. В любом случае генерируется ис ключение MemoryError и сообщение об ошибке (включая информацию о месте ее возникновения) может быть выведена в стандартный поток ошибок.

NameError Исключения этого класса генерируются, если используемое в программе локальное или глобальное имя не найдено. Это имя используется в каче стве аргумента при инициализации экземпляра исключения.

UnboundLocalError Используется в случае, если Вы неявно ссылаетесь на глобальную переменную (не использовав предварительно инструкцию global), а затем пытаетесь удалить ее или присвоить ей новое значение. Добав лен в версии 1.6.

RuntimeError Используется при ошибках времени выполнения, которые не попадают ни в одну из описанных выше категорий. В качестве аргумента при инициа лизации используется строка с информацией об ошибке. Это исключение является пережитком прошлых версий языка и в настоящее время исполь зуется не слишком часто.

NotImplementedError Исключения этого класса следует использовать при определении аб страктных методов пользовательских классов-интерфейсов для того, чтобы показать, что метод должен быть переопределен в производных классах.

SyntaxError Используется синтаксическим анализатором при обнаружении синтакси ческих ошибок. Подобные ошибки могут возникнуть при использовании инструкций import и exec, функций eval() и input(), а также при чтении инструкций из файла или стандартного потока ввода (в том числе 186 Глава 13. Встроенные классы исключений в интерактивном режиме).

Экземпляры этого класса исключений имеют атрибуты: filename и lineno — имя файла и номер строки в которых обнаружена ошибка, text — текст строки, содержащей ошибку, offset — место в строке, где ошибка была обнаружена синтаксическим анализатором, и msg — сообщение об ошибке. Экземпляр исключения инициализируется в ви де ‘SyntaxError(msg, (filename, lineno, offset, text))’.

Функция str(), применительно к экземплярам исключения, возвраща ет только сообщение об ошибке (атрибут msg).

SystemError Исключения этого класса генерируются в случае обнаружения внутренних ошибок. В качестве аргумента при инициализации используется строка, с подробностями (используется терминология низкого уровня). О возник новении подобных ошибок следует сообщать авторам языка.

TypeError Исключения этого класса генерируются, какая-либо операция применяет ся к объекту несоответствующего типа. В качестве аргумента при иници ализации исключения используется строка, указывающая на детали несо ответствия типа.

ValueError Исключения этого класса генерируются, какая-либо операция применяет ся к объекту правильного типа, но имеющего несоответствующее значе ние, и ситуация не может быть описана более точно с помощью исключе ния другого типа (например, IndexError).

UnicodeError Используется при ошибках преобразования строки в определенной ко дировке в строку Unicode и наоборот. Добавлен в версии 1.6.

SystemExit Исключения этого класса генерируются функцией sys.exit(). Если исклю чение не обрабатывается, выполнение программы молча прерывается. В каче стве аргумента при инициализации используется целое число — код ошибки, передаваемый функции exit() языка C. По умолчанию и, если используется None, код завершения считается равным 0. Если при инициализации исполь зован аргумент другого типа или несколько аргументов, аргумент или кортеж аргументов выводится в стандартный поток ошибок. В любом случае, аргумент или кортеж аргументов сохраняется в виде атрибута code. SystemExit яв ляется производным непосредственно от Exception, а не StandardError, так как фактически исключения SystemExit не являются ошибкой.

Вызов функции sys.exit() преобразуется в генерацию исключения для то го, чтобы могла быть выполнена очистка (ветвь finally инструкции try) и отладчик мог выполнить программу без потери контроля. Если все же необ ходимо немедленно прервать выполнение программы (например, после вы зова функции os.fork() в дочернем процессе), воспользуйтесь функцией os._exit().

Часть III Библиотека стандартных модулей Описание языка Python было бы неполным без описания библиотеки — огромной коллекции модулей. Некоторые модули написаны на C и встраиваются в интерпрета тор, другие написаны на языке Python и доступны в исходном виде. Некоторые модули предоставляют услуги, характерные для языка Python (например, вывод сообщений об ошибках) или определенной операционной системы (например, доступ к определенным аппаратным средствам), другие определяют интерфейсы, характерные для некоторой об ласти применения (например, WWW).

К сожалению, невозможно в рамках однотомного издания описать даже стандарт ные модули, обычно поставляемые вместе с интерпретатором языка. Поэтому мы поста раемся остановиться на основных, наиболее универсальных.

Глава Конфигурационные модули 14.1 site — общая конфигурация Этот модуль автоматически импортируется при каждом запуске интерпрета тора (за исключением случаев, когда используется опция командной строки -S) и предназначен, в первую очередь, для добавления путей поиска модулей, характерных для данной машины. По умолчанию в пути поиска добавляются каталоги с имена ми ‘sys.prefix + ’/lib/site-packages’’ и ‘sys.prefix + ’/site-python’’ (UNIX) или sys.prefix (другие платформы). Кроме того, модуль обрабатывает кон фигурационные файлы путей вида ‘package.pth’ во всех указанных каталогах. Эти кон фигурационные файлы должны содержать дополнительные пути (по одному каталогу в строке), которые будут включены в sys.path. Пустые строки и строки, начинающиеся с ‘#’, игнорируются.

Например, пусть стандартные библиотеки установлены в каталоге ‘/usr/lib/python1.5’, в котором присутствует подкаталог ‘site-packages’. Пусть ката лог ‘/usr/lib/python1.5/site-packages’ в свою очередь содержит вложенные каталоги ‘foo’, ‘bar’ и ‘spam’ и конфигурационные файлы ‘foo.pth’ и ‘bar.pth’. Предположим, файл ‘foo.pth’ содержит следующие строки:

# foo package configuration foo bar bletch и ‘bar.pth’ содержит:

# bar package configuration bar Тогда в sys.path будут добавлены каталоги ‘/usr/lib/python1.5/site-packages/bar’ и ‘/usr/lib/python1.5/site-packages/foo’.

Обратите внимание, что каталоги ‘bletch’ и ‘spam’ не добавляются, так как не су ществует файла или каталога с именем ‘bletch’ и каталог ‘spam’ не упомянут ни в одном из конфигурационных файлов.

14.2. user — конфигурация пользователя После выполнения перечисленных манипуляций с путями, производится попытка импортировать модуль sitecustomize, в который может выполнять дополнительные настройки. Если при импортировании генерируется исключение ImportError, оно мол ча игнорируется.

14.2 user — конфигурация пользователя В целях безопасности интерпретатор не выполняет автоматически конфигурационный файл пользователя. Только в интерактивном режиме интерпретатор выполняет файл, указанный в переменной окружения PYTHONSTARTUP. Однако некоторые программы могут позволить загрузить стандартный конфигурационный файл пользователя. Програм ма, желающая использовать такой механизм, должна выполнить инструкцию ‘import user’.

Модуль user ищет файл с именем ‘.pythonrc.py’ в домашнем каталоге пользователя и выполняет его с помощью встроенной функции execfile() в своем собственном (модуля user) глобальном пространстве имен. Ошибки, возникающие при выполнении ‘.pythonrc.py’ модулем user не обрабатываются. Если домашний каталог не может быть определен, выполняется файл ‘.pythonrc.py’ в текущем каталоге.

Будьте сдержаны в том, что Вы помещаете в свой файл ‘.pythonrc.py’. Так как Вы не знаете, какие программы будут его использовать, изменение поведения стандартных модулей и функций вряд ли будет хорошей идеей.

Рекомендация для программистов, желающих использовать описанный здесь меха низм: простейший способ устанавливать параметры — определить переменные в файле ‘.pythonrc.py’. Например, модуль spam может определить, насколько подробными пользо ватель хочет видеть его сообщения, с помощью следующих инструкций:

import user try:

#, verbose = user.spam_verbose except AttributeError:

# verbose = Программам, имеющим большое количество пользовательских параметров, следует использовать отдельный конфигурационный файл. Программы, имеющие отношение к безопасности, а также модули общего назначения, не должны импортировать модуль user.

Глава Служебные модули Модули, описанные в этой главе, являются служебными по отношению к интерпретатору языка Python и его взаимодействию с окружением.

sys Доступ к характерным для системы параметрам и функциям.

atexit Регистрирует функции и выполняет их при окончании работы програм мы types Имена для всех встроенных типов.

operator Операторы языка Python в виде функций.

traceback Модуль для работы с объектами traceback.

imp Доступ к операциям, производимым инструкцией import.

pprint Представление и вывод данных в более привлекательном виде.

repr Альтернативная реализация функции repr() с ограничением размера.

15.1 sys — характерные для системы параметры и функции Этот модуль предоставляет доступ к переменным, используемым или поддерживаемым интерпретатором, и функциям, которые интенсивно взаимодействуют с интерпретато ром. Модуль sys всегда доступен.

argv Список аргументов, переданных в командной строке программе на языке Python.

argv[0] является именем программы (является имя полным или нет, зависит от используемой операционной системы). Если интерпретатор запущен с опцией, argv[0] является строкой ’-c’. При чтении команд со стандартного потока ввода (в том числе в интерактивном режиме) argv[0] является строкой ’-’ или ’’ в зависимости от того, использовалась опция ‘-’ или нет.

byteorder Строка, указывающая характерный для платформы порядок следования байтов:

’big’ (big-endian) или ’little’ (little-endian). Переменная доступна, начиная с версии 2.0.

15.1. sys — характерные для системы параметры и функции builtin_module_names Кортеж строк — имен всех модулей, встроенных в интерпретатор. Эта информация не может быть получена никаким другим путем (modules.keys() дает список имен импортированных модулей).

copyright Строка, содержащая авторские права на интерпретатор языка Python.

dllhandle (Windows) Целое число, дескриптор DLL интерпретатора Python.

exc_info() Возвращает кортеж из трех значений, описывающих исключение, которое в дан ный момент обрабатывается (в текущем потоке). Под обработкой исключения здесь подразумевается выполнение ветви except (в том числе и вызванных из нее функ ций) инструкции try (см. раздел 10.4.4).

Если в настоящий момент обработка исключения не выполняется, возвращаемый кортеж содержит три объекта None. В противном случае, возвращается ‘(type, value, traceback)’, где type — тип исключения (класс или строка), value — значение исключения (экземпляр класса) или ассоциированное значение (строка) и traceback — объект traceback (см. раздел 11.9.3), представляющий прой денный путь от места возникновения исключительной ситуации.

Важное замечание: присваивание traceback локальной переменной в функ ции, обрабатывающей исключение, приведет к образованию циклических ссылок между объектами. Таким образом, удаление объекта будет возможным, только ес ли интерпретатор собран со сборщиком мусора (см. описание модуля gc). Так как в большинстве случаев объект traceback не нужен, наилучшим решением будет использование функции в виде ‘type, value = sys.exc_info()[:2]’ для получения только типа и значения исключения. Если Вам необходим объ ект traceback, удостоверьтесь в том, что Вы удаляете его после использова ния (лучше всего это делать в ветви finally инструкции try) или используйте exc_info() в отдельной функции, вызванной из ветви except.

exc_type exc_value exc_traceback Присутствуют только для совместимости со старыми версиями — используйте функцию exc_info(). Так как они являются глобальными переменными, содер жат значения для исключения, обработка которого была начата последней. Таким образом, их использование не безопасно в многопоточных программах. Если в дан ный момент исключение не обрабатывается, значение exc_type равно None и переменные exc_value и exc_traceback не определены.

exec_prefix Строка, содержащая начало пути к зависимым от платформы файлам интер претатора Python (зависит от параметров сборки и/или установки). Напри мер, конфигурационные файлы на платформах UNIX располагаются в каталоге ‘sys.exec_prefix + ’/lib/python’ + sys.version[:3] + ’/config’’.

194 Глава 15. Служебные модули executable Строка с (полным) именем исполняемого файла интерпретатора Python, если оно имеет смысл для данной системы.

exit([exit_code]) Прерывает выполнение программы. Реализуется путем генерации исключения SystemExit, то есть страховочный код (ветвь finally инструкции try) при нимается во внимание и попытка выхода может быть прервана на внешнем уровне путем обработки исключения. Необязательный аргумент может быть целым чис лом (по умолчанию 0, что соответствует успешному завершению;

многие системы требуют, чтобы это число было от 0 до 127), которое будет использовано в ка честве кода завершения, или объект любого другого типа. В последнем случае использование None эквивалентно 0, для других объектов на стандартный поток ошибок выводится строковое представление (полученное аналогично тому, как это делает встроенная функция str()) и в качестве кода завершения используется 1.

В частности инструкция ‘sys.exit(’ ’)’ является бы стрым способом прервать выполнение программы с выводом сообщения об ошибке.

exitfunc Эта переменная на самом деле не определена самим модулем, но Вы можете при своить ей объект-функцию, которая будет вызвана (без аргументов) при заверше нии работы интерпретатора. Функция exitfunc() не вызывается, если процесс прерван с помощью некоторых сигналов, при возникновении фатальной ошибки и при вызове функции os._exit(). Мы настоятельно не рекомендуем устанавли вать переменную exitfunc напрямую (это может привести к некорректной работе других компонент программы) — воспользуйтесь модулем atexit, который предо ставляет возможность регистрировать несколько функций.

getdefaultencoding() Возвращает текущую кодировку, используемую по умолчанию при преобразовании обычных строк в строки Unicode и наоборот. Функция доступна, начиная с версии 2.0.

getrefcount(object) Возвращает число ссылок на объект object. Число будет на единицу больше, чем Вы, возможно, ожидали, так как оно включает временно созданную ссылку на объект как аргумент функции getrefcount().

getrecursionlimit() Возвращает текущее ограничение рекурсии — максимальную глубину стека интер претатора Python. Это ограничение предотвращает переполнение стека при беско нечных рекурсиях. Ограничение рекурсии может быть установлено с помощью функции setrecursionlimit(). Эта функция доступна, начиная с версии 2.0.

hexversion Номер версии в виде одного целого числа. Гарантируется, что это число будет возрастать с каждой новой версией, включая отладочные выпуски. Например, для того, чтобы убедиться, что версия интерпретатора не меньше, чем 1.5.2 (финальный выпуск), воспользуйтесь следующим кодом:

15.1. sys — характерные для системы параметры и функции if sys.hexversion >= 0x010502F0:

#.

...

else:

# #.

...

Функция названа ‘hexversion’ потому, что возвращаемое ей значение выгля дит действительно осмысленным, только если смотреть на его шестнадцатеричное представление (например, полученное с помощью встроенной функции hex()).

Информация о версии в более дружественном виде хранится в переменной version_info.

last_type last_value last_traceback Эти три переменные не всегда определены. Им присваиваются значения в слу чае, если исключение не обрабатывается и интерпретатор выводит информацию об ошибке. Наличие этих переменных позволяет пользователю в интерактивном режиме импортировать модуль отладчика и сделать “вскрытие трупа” программы, исключив необходимость повторного запуска команд, приведших к возникновению ошибки. Для этого достаточно выполнить ‘import pdb;

pdb.pm()’ (см. главу 25.1).

Значения переменных аналогичны элементам кортежа, возвращаемого функцией exc_info() (так как может быть только один интерактивный поток, использова ние глобальных переменных безопасно).

maxint Наибольшее целое число, которое может быть представлено в рамках типа int.

Это число не меньше, чем 231 - 1. Наименьшее представимое в рамках int целое число на большинстве платформ равно -maxint-1.

modules Словарь, отображающий имена импортированных модулей в объекты-модули. Вы можете манипулировать им, например, для принудительной перезагрузки модулей или для того, чтобы сделать доступными для импортирования динамически создан ные модули (см. описание модуля new). Заметим, что последовательное удаление модуля из modules и повторное его импортирование — это не совсем то, что делает встроенная функция reload().

path Список строк — путей поиска модулей. Изначально эта переменная содержит ка талог, в котором находится исполняемая в данный момент программа (или пустую строку, если команды считываются со стандартного потока ввода;

пустая строка используется для обозначения текущего каталога), пути, указанные в перемен ной окружения PYTHONPATH и зависящие от платформы пути по умолчанию.

Обратите внимание, что каталог, в котором находится программа, идет первым (path[0]).

196 Глава 15. Служебные модули platform Строка, содержащая идентификатор платформы, например, ’sunos5’, ’linux1’ или ’win32’. Может использоваться, например, для добавления характерных для платформы путей в path.

prefix Строка, содержащая начало пути к независимым от платформы файлам интер претатора Python (зависит от параметров сборки и/или установки). Например, основная коллекция модулей на платформах UNIX устанавливается в каталог ‘sys.prefix + ’/lib/python’ + sys.version[:3]’, в то время как неза висимые от платформы заголовочные файлы (все, кроме ‘config.h’) располагаются в ‘sys.prefix + ’/include/python’ + sys.version[:3]’.

ps ps Обычно строки, определяющие, соответственно, первичное и вторичное пригла шения интерпретатора. Определены и используются, только если интерпретатор находится в интерактивном режиме. В этом случае они имеют начальные значе ния ’>>> ’ и ’... ’. Если значения этих переменных не являются строковыми объектами, в качестве приглашений используются их строковые значения, полу ченные аналогично встроенной функции str(). Строковое значение каждый раз вычисляется заново — такое поведение может быть использовано для реализации динамических приглашений.

setcheckinterval(interval) Устанавливает интервал, через который интерпретатор будет проверять (контроли ровать) такие вещи, например, как переключение между потоками и обработчики сигналов. interval — целое число (по умолчанию 10), количество выполнен ных байт-инструкций языка между проверками. Увеличивая интервал, Вы можете повысить производительность многопоточных программ, уменьшая — ускорить ре акцию. При значениях интервала меньше или равных нулю, проверка производится после выполнения каждой байт-инструкции, обеспечивая максимальную оператив ность в ущерб производительности.

setdefaultencoding(encoding) Устанавливает кодировку, которая будет использоваться по умолчанию при пре образовании обычных строк в строки Unicode и наоборот. Если строка encoding не соответствует доступной кодировке, генерирует исключение LookupError. Эта функция предназначена для использования в модуле site (или sitecustomize), после этого она обычно удаляется из пространства имен модуля sys. Функция до ступна, начиная с версии 2.0.

setprofile(profilefunc) Устанавливает системную функцию, реализующую замер производительно сти (profiling) различных компонент программы (см. главу 25.2). Функция profilefunc будет вызываться аналогично трассировочной функции (см. описа ние функции settrace()), но не для каждой выполненной строки кода, а только при вызове и возврате из функций и при генерации исключений.

15.1. sys — характерные для системы параметры и функции setrecursionlimit(limit) Устанавливает максимальную глубину стека интерпретатора Python. Это ограниче ние предотвращает переполнение стека при бесконечных рекурсиях. Максималь ная возможная глубина стека зависит от платформы. Вам может понадобиться установить более высокое значение, если Ваша программа использует глубокие ре курсивные вызовы. Однако делать это следует с осторожностью, так как слишком большое значение может привести к аварийному завершению работы интерпрета тора. Эта функция доступна, начиная с версии 2.0.

settrace(tracefunc) Устанавливает системную трассировочную функцию, которая будет вызываться для каждой выполненной строки кода. Это позволяет в рамках языка Python реа лизовать отладчик (см. главу 25.1).

stdin stdout stderr Файловые объекты, соответствующие стандартным потокам ввода, вывода и оши бок интерпретатора. stdin используется интерпретатором для операций ввода, таким как input() и raw_input(). stdout используется интерпретатором для операций вывода с помощью инструкции print, инструкций-выражений и для вы вода приглашений функциями input() и raw_input(). Для вывода собственных приглашений интерпретатора в интерактивном режиме и вывода сообщений об ошибках (не перехваченных исключениях) используется stderr. Для корректной работы встроенных возможностей языка Python stdout и stderr должны быть объектами (произвольного типа), имеющими метод write(). Для корректной ра боты функций input() и raw_input() объект, на который ссылается stderr должен иметь метод readline(). Заметим, что изменение этих переменных не оказывает влияния на стандартные потоки ввода/вывода порождаемых (например, функциями os.popen() или os.system()) процессов.

stdin stdout stderr Эти переменные хранят исходные значения для stdin, stderr и stdout при запуске программы и могут быть использованы для их восстановления.

tracebacklimit Если этой переменной присвоено целое значение, она определяет максимальное число уровней информации, представляемой объектом traceback, которое будет выводиться при возникновении (необрабатываемой) исключительной ситуации. По умолчанию выводится не более 1000 уровней. Значение меньше или равное нулю запрещает вывод такой информации — выводится только тип исключения и его строковое представление.

version Строка, содержащая информацию о версии, номере и времени сборки интер претатора Python и компиляторе, который был использован, в виде ’version (#build_number, build_date, build_time) [compiler]’. Первые три 198 Глава 15. Служебные модули символа используются для идентификации версии в именах каталогов, в которые производится установка. version используется в первой выводимой при запуске интерпретатора в интерактивном режиме строке: ’Python ’+sys.version+’ on ’+platform.

version_info Кортеж из пяти объектов, описывающих номер версии: ‘(major, minor, micro, releaselevel, serial)’. Все элементы, кроме releaselevel яв ляются целыми числами. releaselevel может иметь одно из четырех значений:

’alpha’, ’beta’, ’candidate’ или ’final’. Значение version_info, соот ветствующее финальному выпуску Python 2.0, будет ‘(2, 0, 0, ’final’, 0)’.

Переменная определена, начиная с версии 1.6.

winver (Windows) Строка с версией интерпретатора, используемая для имени ключа системного ре естра на платформах Windows (обычно первые три символа переменной version).

Переменная предоставляется в информационных целях, ее изменение не оказывает влияние на имя используемого интерпретатором ключа.

15.2 gc — управление “сборщиком мусора” Этот модуль предоставляет интерфейс к необязательному “сборщику мусора” (garbage collector, GC): возможность отключить его, настроить частоту работы, установить отла дочные параметры, а также предоставляет доступ к “потерянным”1 объектам, найденным “сборщиком мусора”, которые, однако, не могут быть удалены. Так как “сборщик мусо ра” дополняет механизм подсчета ссылок, уже используемый интерпретатором Python, Вы можете отключить его, если уверены, что программа не создает циклических ссы лок. Автоматический сбор может быть отключен вызовом gc.disable(). Для поиска утечек памяти при отладке, следует вызвать gc.set_debug(gc.DEBUG_LEAK).

Модуль gc предоставляет следующие функции:

enable() Включает автоматический “сбор мусора”.

disable() Выключает автоматический “сбор мусора”.

isenabled() Возвращает 1, если автоматический “сбор мусора” включен, иначе возвращает 0.

“Потерянными” (или недоступными) мы будем называть объекты, на которые не ссылается ни одна переменная. Единственный способ удалить их или получить к ним доступ — воспользоваться “сборщиком мусора”.

15.2. gc — управление “сборщиком мусора” collect() Запускает полный “сбор мусора” и возвращает общее количество найденных недо ступных объектов. Список объектов, которые не могут быть удалены “сборщиком мусора”, становится доступными через переменную garbage.

set_debug(flags) Устанавливает параметры отладки. Вся отладочная информация будет выводиться на стандартный поток ошибок. Отладочные флаги (см. ниже) можно комбиниро вать с помощью оператора битового ИЛИ. Полностью отключить отладку можно с помощью инструкции set_debug(0).

get_debug() Возвращает параметры отладки, которые в настоящий момент установлены.

set_threshold(threshold0 [, threshold1 [, threshold2]]) Устанавливает пороги запуска (частоту) автоматического “сбора мусора”. Значе ние threshold0 равное нулю отключает автоматический “сбор мусора”.

Различаются три поколения объектов в зависимости от того, сколько запусков сборщика они пережили. Новые объекты — самые молодые, относятся к поко лению 0. После каждого запуска сборщика объект “взрослеет”, перемещается в поколение 1, затем в поколение 2. Так как поколение 2 самое старшее, объекты остаются в нем после последующих запусков сборщика. Для того, чтобы решить, когда производить запуск, сборщик подсчитывает количество созданных и уда ленных объектов после последнего запуска. Когда разница между ними достигает threshold0, запускается “сборщик мусора”. Изначально анализируется только самое молодое поколение. Если поколение 0 анализировалось более threshold раз после последнего анализа поколения 1, также анализируется и поколение 1.

Аналогично threshold2 контролирует количество запусков сборщика для поко ления 1, перед тем как обрабатывать поколение 2.

get_threshold() Возвращает кортеж текущих порогов запуска “сборщика мусора” в виде ‘(threshold0, threshold1, threshold2)’.

Следующая переменная доступна только для чтения:

garbage Список недоступных объектов, найденных “сборщиком мусора”, которые не могут быть удалены. Экземпляры классов, имеющие специальный метод del() и входящие в цикл ссылающихся друг на друга объектов, делают весь цикл неуда ляемым. Если установлена опция отладки DEBUG_SAVEALL, в этой переменной сохраняются все найденные недоступные объекты (“сборщик мусора” их при этом не удаляет).

Для установки параметров отладки модуль предоставляет следующие константы флаги:

200 Глава 15. Служебные модули DEBUG_STATS Выводить статистику при запусках сборщика. Эта информация может быть исполь зована при выборе частоты запусков.

DEBUG_COLLECTABLE Выводить информацию о найденных недоступных объектах, которые подлежат уда лению.

DEBUG_UNCOLLECTABLE Выводить информацию о найденных недоступных объектах, которые не могут быть удалены. Эти объекты будут добавлены в список garbage.

DEBUG_INSTANCES Если установлен флаг DEBUG_COLLECTABLE или DEBUG_UNCOLLECTABLE, выво дить информацию о найденных экземплярах классов.

DEBUG_OBJECTS Если установлен флаг DEBUG_COLLECTABLE или DEBUG_UNCOLLECTABLE, выво дить информацию о найденных объектах, не являющихся экземплярами классов.

DEBUG_SAVEALL При использовании этого флага все найденные недоступные объекты будут добав ляться в garbage, в том числе и те, которые могут быть удалены.

DEBUG_LEAK Флаги, необходимые для вывода информации, полезной при поиске утечек памя ти (DEBUG_COLLECTABLE | DEBUG_UNCOLLECTABLE | DEBUG_INSTANCES | DEBUG_OBJECTS | DEBUG_SAVEALL).

15.3 atexit — выполнение действий при окончании работы программы Доступен, начиная с версии 2.0.

Модуль atexit определяет единственную функцию, предназначенную для реги страции. Зарегистрированные с помощью нее функции будут автоматически вызваны при нормальном окончании работы программы. Функции не будут вызваны, если про цесс программы был прерван с помощью некоторых сигналов, возникла фатальная вну тренняя ошибка интерпретатора, а также при вызове функции os._exit().

Модуль предоставляет альтернативный интерфейс к функциональности, предостав ляемой переменной sys.exitfunc. Таким образом, модуль может работать некоррект но при использовании кода, который устанавливает sys.exitfunc напрямую. В част ности, стандартные модули языка Python могут использовать atexit не предупреждая об этом. Во избежание конфликтов, авторам, использующим sys.exitfunc следует внести соответствующие изменения в программы.

15.4. types — имена для всех встроенных типов register(func...) Регистрирует func как функцию, которая должна быть выполнена при завершении работы программы. Все остальные аргументы (позиционные и именованные) будут сохранены и использованы для вызова func.

При нормальном завершении выполнения программы (завершение выполнения основного модуля, вызов функции sys.exit() или возникновение исключитель ной ситуации), все зарегистрированные функции вызываются в порядке, обратном порядку их регистрации. Предполагается, что модули низкого уровня обычно им портируются раньше модулей высокого уровня и, таким образом, вызываемые в конце функции для них выполняются позже.

Следующий пример демонстрирует, как модуль может инициализировать счетчик из файла при импортировании и сохранять его новое значение автоматически при за вершении работы программы.

try:

_count = int(open("/tmp/counter").read()) except IOError:

_count = def incrcounter(n):

global _count _count = _count + n def savecounter():

open("/tmp/counter", "w").write("%d" % _count) import atexit atexit.register(savecounter) См. также реализацию модуля readline, демонстрирующую использование воз можностей модуля atexit для чтения и записи файлов истории команд.

15.4 types — имена для всех встроенных типов Этот модуль определяет имена для всех встроенных типов объектов, используемых ин терпретатором (сами типы описаны в главе 11). Вполне безопасно использовать ин струкцию ‘from types import *’ — модуль не определяет никаких имен, кроме тех, которые здесь перечислены. Все имена, которые будут добавлены в будущих версиях этого модуля, будут иметь окончание ‘Type’.

Имена для объектов-типов чаще всего используют в функциях, если действия, которые необходимо выполнить, зависят от типа аргумента. Например:

202 Глава 15. Служебные модули from types import * def delete(list, item):

if type(item) is IntType:

del list[item] else:

list.remove(item) Модуль определяет следующие имена:

NoneType Объект, имеющий тип None. Существует только один объект этого типа — None (пустой объект).

TypeType Объект, имеющий тип type (тип) — тип объектов, возвращаемых встроенной функцией type(). Все объекты, определенные в этом модуле, являются объектами именно этого типа.

IntType Объект, имеющий тип int (целое число, например, 1).

LongType Объект, имеющий тип long int (длинное целое число, например, 1L).

FloatType Объект, имеющий тип float (вещественное число, например, 1.0).

ComplexType Объект, имеющий тип complex (комплексное число, например, 1.0j).

StringType Объект, имеющий тип string (строка, например, ’Python’).

UnicodeType Объект, имеющий тип unicode (строка Unicode, например, u’Python’).

TupleType Объект, имеющий тип tuple (кортеж, например, ‘(1, 2, 3)’).

XRangeType Объект, имеющий тип xrange. Объекты этого типа возвращаются встроенной функцией xrange().

BufferType Объект, имеющий тип buffer (буфер, создается встроенной функцией buffer).

ListType Объект, имеющий тип list (список, например, ‘[1, 2, 3]’).

15.4. types — имена для всех встроенных типов DictType DictionaryType Два альтернативных имени для объекта, представляющего тип dictionary (сло варь, например, ‘{’’: ’Python’, ’’: ’2.0’}’).

FunctionType LambdaType Два альтернативных имени для объекта, представляющего тип function (функ ция, определенная пользователем). Такой тип имеют объекты, определенные с по мощью инструкции def или оператора lambda.

CodeType Объект, имеющий тип code (объект кода, например, возвращаемый встроенной функцией compile()).

ClassType Объект, имеющий тип class (класс). Объект-класс создается инструкцией class.

InstanceType Объект, имеющий тип instance (экземпляр класса). Экземпляры создаются при применении операции вызова к объекту-классу.

MethodType UnboundMethodType Два альтернативных имени для объекта, представляющего тип method (метод, определенный пользователем).

BuiltinFunctionType BuiltinMethodType Два альтернативных имени для объекта, представляющего тип builtin_function_or_method (встроенная функция или метод, например, abs()).

ModuleType Объект, имеющий тип module (модуль).

FileType Объект, имеющий тип file (файловый объект, например, создаваемый встроенной функцией open()).

SliceType Объект, имеющий тип slice (срез). Объекты этого типа создаются при использо вании расширенной записи среза и встроенной функцией slice().

EllipsisType Объект, имеющий тип ellipsis. Существует только один объект этого типа — Ellipsis (эллипсис), он указывает на использование троеточия в расширенной записи среза.

204 Глава 15. Служебные модули TracebackType Объект, имеющий тип traceback. Объекты этого типа предназначены для отсле живания пути между местом возникновения исключительной ситуации и местом ее обработки.

FrameType Объект, имеющий тип frame (кадр стека). Объекты этого типа представляют окру жение, в котором выполняется блок кода.

15.5 operator — операторы в виде функций Модуль operator определяет набор функций, реализованных на языке C, соответству ющих операторам языка Python. Обычно функции имеют такие же имена, как и специ альные методы классов, предназначенных для выполнения соответствующих операций.

Например, выражения ‘operator.add(x, y)’ и ‘x + y’ эквивалентны. Для удобства также определены имена без ‘’ в начале и конце имени.

Модуль определяет следующие функции:

add(x, y) add(x, y) Возвращает x + y.

sub(x, y) sub(x, y) Возвращает x - y.

mul(x, y) mul(x, y) Возвращает x * y.

div(x, y) div(x, y) Возвращает x / y.

mod(x, y) mod(x, y) Возвращает x % y.

neg(x) neg(x) Возвращает -x.

pos(x, y) pos(x, y) Возвращает +x.

15.5. operator — операторы в виде функций abs(x) abs(x) Возвращает абсолютное значение x (см. описание встроенной функции abs()).

inv(x) inv(x) invert(x) invert(x) Возвращает ~x. Имена invert() и invert() добавлены в версии 2.0.

lshift(x, y) lshift(x, y) Возвращает x << y.

and_(x, y) and(x, y) Возвращает x & y.

or_(x, y) or(x, y) Возвращает x | y.

xor(x, y) xor(x, y) Возвращает x ^ y.

not_(x) not(x) Возвращает not x.

truth(x) Возвращает 1, если x является истиной, иначе возвращает 0.

concat(seq1, seq2) concat(seq1, seq2) Возвращает seq1 + seq2, где seq1 и seq2 должны быть последовательностями встроенного типа.

repeat(seq, n) repeat(seq, n) Возвращает seq * n, где seq должен быть последовательностью встроенного типа, а n — целым числом.

contains(x, y) contains(x, y) sequenceIncludes(x, y) Возвращает результат проверки вхождения y in x. Обратите внимание на поря док следования операндов. Имя contains() определено, начиная с версии 206 Глава 15. Служебные модули 2.0, имя sequenceIncludes() присутствует лишь для совместимости с преды дущими версиями.

countOf(x, y) Возвращает число вхождений y в x. Эта функция никогда не использует метод count() экземпляров-последовательностей, а просто последовательно перебирает и сравнивает с y все элементы последовательности x.

indexOf(x, y) Возвращает индекс первого элемента x, равного y. Эта функция никогда не исполь зует метод index() экземпляров-последовательностей, а просто последовательно перебирает и сравнивает с y элементы последовательности x. Если x не содержит y, генерируется исключение ValueError.

getitem(x, y) getitem(x, y) Возвращает x[y].

setitem(x, y, z) setitem(x, y, z) Выполняет присваивание ‘x[y] = z’.

delitem(x, y) delitem(x, y) Эквивалентно инструкции ‘del x[y]’.

getslice(x, y, z) getslice(x, y, z) Возвращает x[y:z].

setslice(x, y, z, v) setslice(x, y, z, v) Выполняет присваивание ‘x[y:z] = v’.

delslice(x, y, z) delslice(x, y, z) Эквивалентно инструкции ‘del x[y:z]’.

isCallable(obj) Возвращает 1, если объект obj поддерживает вызов, иначе возвращает 0. Эта функция существует для совместимости с предыдущими версиями — используйте вместо нее встроенную функцию callable().

isMappingType(obj) Возвращает 1, если объект obj может быть отображением, то есть является слова рем или экземпляром (произвольного) класса, иначе возвращает 0. Не существует надежного способа определить, поддерживает ли экземпляр класса все операции, характерные для отображения.

15.5. operator — операторы в виде функций isNumberType(obj) Возвращает 1, если obj может быть объектом числового типа, то есть является объектом встроенного числового типа или экземпляром (произвольного) класса, иначе возвращает 0. Не существует надежного способа определить, поддерживает ли экземпляр класса все операции, характерные для чисел.

isSequenceType(obj) Возвращает 1, если obj может быть объектом числового типа, то есть является последовательностью одного из встроенных типов или экземпляром (произвольно го) класса, иначе возвращает 0. Не существует надежного способа определить, поддерживает ли экземпляр класса все операции, характерные для последователь ностей.

Чаще всего определенные здесь функции используются в качестве первого ар гумента встроенных функций map() и reduce(). Например, самый быстрый спо соб подсчитать сумму элементов последовательности seq — вычислить выражение ‘reduce(operator.add, seq)’.

Для удобства ниже приведена таблица соответствия операторов функциям, опре деленным в модуле operator.

Оператор Функция a (точнее not not a) truth(a) not a not_(a) -a neg(a) a + b add(a, b) a - b sub(a, b) a * b mul(a, b) a / b div(a, b) a % b mod(a, b) ~a invert(a) a & b and_(a, b) a ^ b xor(a, b) a | b or_(a, b) a << b lshift(a, b) a >> b rshift(a, b) seq1 + seq2 concat(seq1, seq2) seq * i repeat(seq, i) o in seq contains(seq, o) o[k] getitem(o, k) o[k] = v setitem(o, k, v) del o[k] delitem(o, k) seq[i:j] getslice(seq, i, j) seq[i:j] = values setslice(seq, i, j, values) del seq[i:j] delslice(seq, i, j) 208 Глава 15. Служебные модули 15.6 traceback — модуль для работы с объектами traceback Этот модуль предоставляет средства для извлечения, форматирования и вывода инфор мации, которую несут объекты traceback (см. раздел 11.9.3). Он позволяет полностью имитировать поведение интерпретатора и может быть полезен для вывода сообщений об ошибках без потери контроля над выполнением.

Модуль traceback определяет следующие функции:

print_tb(traceback [, limit [, file]]) Выводит до limit уровней информации из объекта traceback, начиная с места перехвата исключения, в сторону места, где оно было сгенерировано (именно так описывают путь вложенные друг в друга объекты traceback).

Если аргумент limit опущен или равен None, выводится информация для sys.tracebacklimit (10000, если переменная sys.tracebacklimit не опре делена) вложенных объектов traceback. Вся информация выводится в file (дол жен быть объектом с методом write()) или стандартный поток вывода, если аргумент file не задан.

print_exception(type, value, traceback [, limit [, file]]) Работает аналогично функции print_tb(), но помимо вывода информации из объекта traceback выполняет следующие действия:

•Если аргумент traceback не равен None, выводит заголовок ‘Traceback (most recent call last):’.

•Выводит информацию о возникшем исключении (type и value;

должны быть объектами, описывающими тип и значение исключения).

•Если type is SyntaxError и value имеет соответствующий формат, вы водит строку, в которой возникла синтаксическая ошибка с символом ‘^’, указывающим на место обнаружения ошибки интерпретатором.

Именно таким образом выводятся сообщения об ошибке самим интерпретатором.

print_exc([limit [, file]]) Вызов этой функции эквивалентен вызову ‘print_exception(*(sys.exc_info() + (limit, file)))’.

print_last([limit [, file]]) Вызов этой функции эквивалентен вызову ‘print_exception(sys.last_type, sys.last_value, sys.last_traceback, limit, file)’.

15.6. traceback — модуль для работы с объектами traceback print_stack([frame [, limit [, file]]]) Отслеживает и выводит путь по стеку от кадра стека frame до корня программы (модуля main). Если аргумент frame опущен или равен None, считается равным кадру стека блока, из которого функция print_stack() была вызвана.

Необязательные аргументы limit и file имеют такое же значение, как и в функции print_exception().

extract_tb(traceback [, limit]) Возвращает информацию о пути, содержащуюся в объекте traceback, в виде списка (каждый элемент представляет кадр стека, соответствующий очередно му вложенному объекту traceback) кортежей ‘(filename, line_number, function_name, text)’, где filename — имя файла, line_number — но мер строки в файле, function_name — имя функции и text — строка исходно го текста с обрезанными символами пропуска (whitespace) в начале и конце или None. Необязательный аргумент limit имеет такое же значение, как и в функции print_exception().

extract_stack([frame [, limit]]) Возвращает информацию, описывающую путь от указанного или текущего кадра стека до корня программы. Возвращаемое значение имеет такой же формат, как и значение, возвращаемое функцией extract_tb(). Необязательные аргументы frame и limit имеют такое же значение, как и в функции print_stack().

format_list(list) Возвращает список готовых к выводу (например, методом writelines файлового объекта) строк, полученных форматированием списка кортежей list — результа та функции extract_tb() или extract_stack(). Каждая строка возвращаемо го списка соответствует элементу с таким же индексом аргумента. Каждая строка заканчивается символом перехода на новую строку и может содержать несколько символов перехода на новую строку, если последний элемент соответствующего кортежа (строка исходного текста) не равен None.

format_exception_only(type, value) Возвращает список строк, подготовленный для вывода (например, методом writelines файлового объекта) информации об исключении. Каждая строка в возвращаемом списке заканчивается символом перехода на новую строку. type и value должны быть объектами, представляющими тип и значение исклю чения. Обычно список содержит только одну строку. Однако для исключений SyntaxError список будет состоять из нескольких строк, содержащих, в том числе, фрагмент исходного текста программы и информацию о месте обнаружения синтаксической ошибки. Строка, описывающая исключение, всегда идет в списке последней.

format_exception(type, value, traceback [, limit]) Возвращает список строк, подготовленный для вывода (например, методом writelines файлового объекта) информации об исключении и информации, пред ставляемой объектом traceback. Аргументы имеют такое же значение, как и со ответствующие аргументы функции print_exception(). Каждая строка в воз 210 Глава 15. Служебные модули вращаемом списке заканчивается символом перехода на новую строку и может содержать несколько символов перехода на новую строку. Вывод этих строк (на пример, с помощью метода writelines файлового объекта) дает такой же ре зультат, как и вызов функции print_exception().

format_tb(traceback [, limit]) Вызов этой функции эквивалентен вызову ‘format_list(extract_tb(traceback, limit))’.

format_stack(frame [, limit]) Вызов этой функции эквивалентен вызову ‘format_list(extract_stack(frame, limit))’.

tb_lineno(traceback) Возвращает номер текущей строки, представленной объектом traceback. Обычно возвращаемое значение равно traceback.tb_lineno. Однако при включенной оптимизации атрибут tb_lineno не обновляется корректно, в то время как функ ция tb_lineno() всегда возвращает правильное значение.

Следующий пример реализует простейший интерактивный интерпретатор, анало гичный стандартному:

import sys, traceback def run_user_code(envdir):

source = raw_input(">>> ") try:

exec source in envdir except:

print " :" print ’-’* traceback.print_exc(file=sys.stdout) print ’-’* envdir = {} while 1:

run_user_code(envdir) Для создания более сложных интерактивных интерпретаторов лучше воспользо ваться классами, определенными в модуле code.

Важное замечание: модуль traceback для считывания строк исходного кода использует модуль linecache, который держит в памяти содержимое всех файлов, к которым когда-либо были обращения. В долгоживущих программах, позволяющим поль зователю каким-либо образом (например, путем ввода интерактивных команд) выполнять код из различных файлов, это может привести к нежелательному использованию боль шого количества памяти. Чтобы этого избежать, следует периодически очищать кэш с помощью функции linecache.clearcache().

15.7. imp — доступ к операциям, производимым инструкцией... 15.7 imp — доступ к операциям, производимым инструкци ей import Этот модуль предоставляет интерфейс к операциям, используемым для реализации ин струкции import. Он определяет следующие функции:

get_magic() Возвращает магическое строковое значение, используемое в самом начале байт компилированных файлов кода для того, чтобы их можно было распознать. Это значение может быть разным для разных версий интерпретатора.

get_suffixes() Возвращает список кортежей, каждый из которых имеет вид ‘(suffix, mode, type)’ и описывает определенный тип модулей: suffix — строка, добавляемая к имени модуля для образования имени файла;

mode — строка режима, которую необходимо передать встроенной функции open() для того, чтобы открыть файл на чтение (’r’ для текстовых файлов и ’rb’ для двоичных);

type — тип файла, может иметь значение PY_SOURCE, PY_COMPILED или C_EXTENSION (см. ниже).

find_module(name [, path]) Пытается найти модуль с именем name в путях path. Производится поиск файла с любым из суффиксов, возвращаемых функцией get_suffixes(), по очереди в каждом из каталогов в списке path. Неверные имена каталогов молча игнориру ются, но все элементы списка должны быть строками. Если аргумент path опущен или равен None, поиск производится сначала среди встроенных (C_BUILTIN) и вложенных (PY_FROZEN) модулей, среди ресурсов (PY_RESOURCE) в операцион ных системах Macintosh или файлов, указанных в системном реестре Windows, затем в каталогах, перечисленных в sys.path.

Pages:     | 1 | 2 || 4 | 5 |   ...   | 7 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.