WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 || 3 |

Применение разбиения Вороного-Делоне к структурам белковых и белок-нуклеиновых комплексов стало возможным благодаря принципиально новому алгоритму вычислений. Все ранее применяемые методы использовали алгоритмы, в которых зависимость времени работы от числа рассматриваемых точек N была пропорциональна N3, в лучших алгоритмах N2lnN. В нашей работе предложен и использован алгоритм, время работы которого пропорционально числу точек N в рассматриваемом ансамбле.

С помощью вычислений демонстрируется замечательная устойчивость разбиения Вороного-Делоне. По этому свойству метод Вороного-Делоне значительно превосходит существующие методы определения контактов по расстоянию. Варьирование каждой координаты атомов возможно до 1 в любом направлении без потери значимых контактов. Кроме того, в рамках данного метода можно оценивать значимость каждого контакта по размеру площади и расстоянию между атомами.

Статистические модели случайно и специфически контактирующих аминокислот Для полноценной интерпретации полученных данных, для того, чтобы оценить и выявить отклонения от случайных процессов, была разработана математическая статистическая модель контактирующих аминокислот: два круга бросают на некоторую область случайным образом, и каждый раз фиксируют площадь перекрывания. Выразим dP плотность вероятности случайных пересечений как зависимость от dS площади пересечения S в параметрическом виде:

dP L =, dS L r(R - 2r)2 1 (1) 4r S(L) = 2(r2 arcsin( 1 - L2 Lr 1 - L) - ).

4r2 2 4r В случае специфических взаимодействий можно предположить, что контакты обладают некоторой, отличной от нуля средней площадью контакта, обусловленной физико-химической природой взаимодействия остатков. В этом случае распределение расстояний между центрами кругов подчиняется нормальному распределению. Выразим распределение площадей неслучайных контактов также в параметрическом виде:

( L-a) f (L) = e, (2) L2 Lr LS(L) = 2(r2 arcsin( 1 - ) - 1 - ).

4r2 2 4r 0.0.0.C 0.B 0.A 0.Площадь контакта между остатками, 2, согласно модели Рисунок 1. Графики, отражающие системы (1) и (2), моделируют распределения площадей случайных (А) и неслучайных (В) контактов. (A) График системы (1) в параметрической форме. График отражает распределение площадей случайных контактов. (B) График системы (2) в параметрической форме. График отражает распределение площадей неслучайных контактов. (C) Сумма графиков (А) и (В).

Зависимость (1) показана на Рис.1, кривая А. По мере увеличения площади контакта число контактов резко уменьшается. Другими словами, распределение для случайных контактов показывает наличие большого числа малых по площади контактов. Зависимость (2) показана ниже на Рис.1, кривая В. Кривая имеет колоколообразную форму, несимметричную, с некоторым, существенно отличным от нуля средним значением. Распределение для неслучайных контактов отражает существование некоторой характерной площади контакта.

Статистические методы Рассматриваются использованные в данной работе статистические понятия и методы, в том числе методы оценки статистической контакта Плотность вероятности образования значимости, влияние размера выборки, сравнение наборов данных, коэффициент корреляции наборов данных, метод оценки ошибок и индекс представленности контактов. Оценивается минимальный размер выборки, необходимый для того, чтобы оцениваемый параметр находился в доверительном интервале заданной длины с требуемой точностью. Для оценки аминокислотного состава интерфейсов с точностью 2% в доверительном интервале 95% минимальное количество исследованных интерфейсов должно быть около 460.

Индекс представленности контакта В качестве величины, отражающей соотношение между числом наблюдаемых и ожидаемых контактов, был выбран индекс представленности контакта gij, как отношение числа наблюдаемых контактов cij (вычисленных по разбиению Вороного; два остатка считаются взаимодействующими, если два атома имеют общую грань с ненулевой площадью поверхности) и ожидаемых значений, определенных для таблиц сопряженности:

cij gij =, (3) pij * N где pij*N - ожидаемые частоты для таблиц контактов.

Вероятность случайного контакта pij между остатками i и j типов:

ni m j pij = *, (4) N N где общее число контактов N =, а ni =, m =.

cij cij j cij i j j i Эта величина (3) отражает соотношение между наблюдаемым числом контактов и ожидаемым. Если ожидаемое число контактов близко к наблюдаемому, gij принимает значение, близкое 1. gij меньше 1, если ожидаемое число контактов больше наблюдаемого, и больше 1, если ожидаемое число контактов меньше наблюдаемого.

Глава 3. Исследование белок-белковых взаимодействий Представленные в этой Главе результаты относятся к изучению контактов между аминокислотами в белок-белковых интерфейсах гомодимеров и гетерокомплексов.

Выборка белок-белковых комплексов Для изучения закономерностей, существующих в белок-белковых интерфейсах, использовалась репрезентативная выборка из 4602 белокбелковых интерфейсов из работы (Mintz, Shulman-Peleg et al. 2005).

Данная выборка содержит 3067 интерфейсов, образованных идентичными цепями (гомодимеры) и 1535 интерфейсов, образованных различными цепями (гетерокомплексы).

Статистика атом-атомных контактов Основываясь на списке контактов между атомами, было построено распределение расстояний между контактирующими атомами, распределение площадей межатомных контактов и корреляция между расстоянием и площадью контакта взаимодействующих атомов. Всего в данной выборке исследовано 2 057 304 межатомных контактов.

Аминокислотный состав белок-белковых интерфейсов В этом разделе приводятся полученные данные по аминокислотному составу интерфейсов, а также подробное сравнение с результатами, полученными другими авторами.

Контакты между аминокислотными остатками Полный список исследованных взаимодействий содержит интерфейса, 421 956 контактов между аминокислотами и 2 057 контакта между атомами.

Также в данном разделе рассматривается распределение площадей контакта между аминокислотами, взаимосвязь между площадью интерфейса и количеством участвующих в его формировании аминокислот, а также исследование площадей интерфейсов. В данном разделе также приводятся таблицы чисел контактов между остатками типов i и j для гомодимеров и гетерокомплексов. В обоих случаях очевидна «склонность» к образованию контактов между противоположно заряженными аминокислотами (около 24% всех контактов) и между гидрофобными остатками (Leu, Val, Ile, Phe, Ala) (около 33% всех контактов).

Предпочтения в контактах между остатками В этом разделе подробно обсуждаются индексы представленности (3), вычисленные отдельно для гомодимеров и гетерокомплексов, сравнение их между собой и с литературными данными.

Получены следующие результаты:

• статистически значимы индексы представленности для контактов между двумя цистеинами, как для гомодимеров, так и для гетерокомплексов. Для гомодимеров это значение gij составляет 4.85, а для гетерокомплексов 3.48, что свидетельствует о максимальной предпочтительности такого контакта;

• следующими по величине индекса представленности gij идут контакты между остатками противоположного знака. Это характерно как для гомодимеров, так и для гетерокомплексов; отклонение от также статистически значимо.

• гидрофобные остатки образуют парные контакты со значениями индекса представленности, хотя и больше 1, но не имеющими строгой статистической значимости;

• самые низкие значения индексов представленности наблюдаются для взаимодействий одинаково заряженных аминокислот;

• индексы представленности для контактов между остатками одного типа в случае взаимодействия идентичных цепей выше, чем для гетерокомплексов. Этот эффект замечен и другими авторами. Следует отметить, что свойства интерфейсов, образованных двумя идентичными белковыми цепями, отличаются от свойств интерфейсов гетерокомплексов. В частности, первые содержат контакты, образованные симметричными парами аминокислот. В центральной области взаимодействия происходит пространственное сближение остатков, имеющих одинаковые номера в полипептидной цепи, тем самым сближаются остатки одного типа. Обнаружено 6600 таких контактов среди 167000 контактов между остатками в интерфейсах гомодимеров. В литературе также встречаются упоминания, что интерфейсы гомодимеров содержат больше контактов между аминокислотами одного типа благодаря оси симметрии второго порядка;

• приведенная гистограмма расстояний между атомами серы контактирующих остатков цистеина демонстрирует специфические взаимодействия между остатками цистеина. В области 2 наблюдается четко выраженный пик, представляющий собой межцепочечные дисульфидные мостики. Сравнение гистограмм площади для всех контактов остатков цистеина и для дисульфидных связей подтверждает гипотезу о том, что полное распределение состоит из распределения площадей случайных контактов, когда контакт происходит вследствие сближения, и распределения площадей специфических контактов, обусловленных физико-химическими взаимодействиями.

Специфические контакты S-S, обусловленные формированием дисульфидной связи, имеют среднюю площадь взаимодействия 8,23 2;

• проведена оценка ошибок для величин gij с использованием метода «складного ножа». Диапазон значений ошибки от 0,03% до 0,18%, среднее значение 0,06%. Максимальная ошибка составляет 0,18% для контактов Gly-Pro (0,0027), а минимальная 0,03% для контактов Arg-Asp (0,0005) и Arg-Leu (0,0002).

Глава 4. Исследование междоменных взаимодействий в глобулярных белках Данная глава посвящена исследованию взаимодействий доменов, определенных в базе данных доменов CATH. Рассматриваются контакты между тремя типами домен-доменных интерфейсов: образованных доменами, расположенными в разных белковых цепях и имеющими разную классификацию по CATH; интерфейсов, образованных одинаковыми по классификации CATH доменами, принадлежащими разным белковым цепям; интерфейсов, образованных доменами, расположенными в одной белковой цепи Невырожденная подборка интерфейсов составила: 342 интерфейса, образованных разными доменами, расположенными в разных белковых цепях; 557 интерфейсов, образованных одинаковыми доменами, принадлежащими разным белковым цепям; 377 интерфейсов, образованных доменами, расположенными в одной белковой цепи.

Всего рассмотрено 274 656 атомных контактов, составляющих 56 843 контактов между аминокислотными остатками. Построено распределение расстояний между контактирующими атомами и площади межатомных контактов, корреляция между площадью контакта и расстоянием, взаимосвязь между площадью интерфейса и количеством участвующих в его формировании атомов.

Аминокислотный состав домен-доменных интерфейсов Определен аминокислотный состав интерфейсов во взаимодействиях домен-домен. Заряженные аминокислоты Arg, Asp, Glu, Lys на поверхности домен-доменных интерфейсов составляют 24% от общего количества аминокислот. Гидрофобные аминокислоты Ala, Ile, Leu, Val и Phe составляют 32%. Ser и Thr 11%. Мало His (3%), Met(2%), Trp(2%) и Cys(1%).

Контакты между аминокислотными остатками Построена гистограмма площади контакта между аминокислотами на поверхности домен-доменных интерфейсов, вычислена корреляция между площадью области связывания и числом аминокислот. Среднее значение площади интерфейса получилось 400 2, среднее число контактов между аминокислотными остатками на интерфейс 44.5, а средняя площадь контакта 8.6 2.

Предпочтения в контактах между остатками В этом разделе подробно обсуждаются числа контактов и индексы представленности, вычисленные отдельно для: 1) взаимодействий между доменами одной белковой цепи, 2) между разными доменами разных цепей и 3) между одинаковыми доменами, принадлежащими разным белковым цепям и сравнение их между собой.

Получены следующие результаты:

• во всех указанных выше случаях самые большие числа контактов наблюдаются для взаимодействий между противоположно заряженными аминокислотами (Arg, Lys – Asp, Glu) и между гидрофобными аминокислотами (Leu, Ala, Ile, Phe, Thr, Val). Однако, если говорить о сравнении межцепочечных и внутрицепочечных взаимодействий между доменами, то (если сравнивать относительное число контактов) взаимодействия между доменами, расположенными в разных белковых цепях, более богаты контактами между заряженными остатками, такими как Arg, Asp, Glu, Lys, а также Gln и Asn, и менее богаты гидрофобными взаимодействиями, такими как Leu, Ile, Phe, Val, Trp;

• следует отметить увеличение индекса представленности на главной диагонали матрицы индексов для контактов между идентичными доменами, расположенными в разных белковых цепях.

Это усиление диагонали напоминает таковое для контактов между гомодимерами. Все рассуждения относительно контактов, образованных вследствие сближения остатков с одинаковыми номерами, и, следовательно, одного типа, применимы и в данном случае;

• значение индекса представленности контакта Cys-Cys для взаимодействия между одинаковыми доменами составляет 5,8, что является самым большим значением. Отметим, что для взаимодействий между разными доменами значение индекса составляет только 1,24 для одной цепи и 1,17 для доменов, расположенных в разных белковых цепях;

• статистически значимыми также можно считать отклонения для контактов между противоположно заряженными остатками: Arg-Asp, ArgGlu, Lys-Asp, Lys-Glu для всех трех типов рассматриваемых интерфейсов.

Также в эту категорию попадают контакты His-Asp и His-Glu для взаимодействий между доменами в одной белковой цепи;

• все индексы представленности для контактов между гидрофобными аминокислотными остатками лежат в «серой зоне»- величины от 1,20 до 1,58. Значение p-уровня для этих величин составляет около 0,28, что не позволяет сделать вывод о значимости отклонений;

• контакты между гидрофобными и заряженными остатками, за редкими исключениями, имеют величины индексов меньше единицы: от 0,53 до 0,94. Это свидетельствует о том, что контакты такого типа реализуются реже, чем можно было бы предположить из случайной модели;

• одинаково заряженные остатки также имеют величины индексов меньше 1, от 0,29 до 0,99. Это, также как и в случае контактов между гидрофобными и заряженными остатками, свидетельствует о том, что контакты такого типа реализуются реже, чем можно было бы предположить из случайной модели;

Pages:     | 1 || 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»