WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 || 3 | 4 |

При создании формального языка для описания объектов и процессов генных сетей, в качестве базового подхода был применен объектно-ориентированный подход, согласно которому все компоненты генных сетей были разделены на два типа: (1) элементарные структурные компоненты, включающие такие классы объектов, как гены, белки, РНК, низкомолекулярные соединения, и (2) элементарные взаимодействия, включающие реакции и регуляторные воздействия (Рис.1). Для описания каждого класса объектов разработан соб-ственный формат, учитывающий осо-бенности отдель-ных классов. Стандартизация и возможность до-бавления новых классов базовых элементов позво-ляет путем комбинаций огра-ниченного коли-чества элемен-тарных структур и взаимодействий получить огромное разнообразие представлений конкретных процессов и описать практически любое событие в генной сети про- или эукариот, укладывая все разнообразие в рамки стандартных схем и убирая жесткие ограничения форматом.

С помощью системы GeneNet автором диссертации были реконструированы генные сети интерфероновой индукции у млекопитающих: (1) генная сеть интерфероновой регуляции противовирусного ответа "Antiviral response" и (2) генная сеть индукции противовирусного ответа интерфероном- при гепатите С "Hepatitis C (IFN)"). Основные характеристики этих генных сетей приведены в Таблице 1.

Таблица 1.

Основные характеристики генных сетей интерфероновой индукции.

Название сети

Кол-во белков

Кол-во генов

Кол-во связей

Кол-во замкнут. циклов

Организмы

Аннотировано статей

Antiviral response

108

85

219

50

Человек, мышь, крыса, курица

339

Hepatitis C (IFN)

27

20

107

43

Человек, вирус гепатита С

107

Компьютерной анализ генных сетей интерфероновой индукции, осуществленный методами теории графов, выявил преобладание регуляторных контуров с положительными обратными связями (88) над регуляторными контурами с отрицательными обратными связями (14). Эта особенность обеспечивает быструю мобилизацию клетки в ответ на действие интерферонов при различных инфекциях. Путем анализа графов генных сетей интерфероновой индукции были определены ключевые белковые регуляторы этой системы, соответствующие вершинам графа, характеризующимся наибольшим количеством выходящих из них ребер. Ими оказались транскрипционные факторы ISGF3, IRF1, STAT1, NF-B и AP1. На Рис. 2 приведен фрагмент генной сети противовирусного ответа, на котором хорошо видно большое количество регуляторных связей, исходящих от ISGF3, IRF1, STAT1 и NF-B.

Рисунок 2. фрагмент генной сети "Antiviral response" с ключевыми регуляторами - транскрипционными факторами ISGF3, IRF1, STAT1 и NF-B.

В дальнейшем особое внимание уделялось изучению особенностей распределения в регуляторных районах ИИГ сайтов связывания именно этих транскрипционных факторов.

Глава 3. Компьютерный анализ и распознавание регуляторных элементов в интерферон-индуцируемых генах

Для изучения особенностей организации регуляторных районов ИИГ в базе данных TRRD (Transcription Regulatory Database) [Kolchanov N.A. et al., 2002] на основе аннотации более 700 научных публикаций были описаны особенности структурно-функциональной организации регуляторных областей 130 ИИГ и характеристики их экспрессии. Эта информация представлена как база данных интерферон-индуцируемых генов IIG-TRRD [Ананько E.A. и др., 1997], доступная через сеть Интернет по адресу http://wwwmgs.bionet.nsc.ru/mgs/papers/ananko/iig-trrd/. Количественное содержание IIG-TRRD приведено в Таблице 2.

Таблица 2.

Содержание базы данных IIG-TRRD, посвященной описанию регуляции транскрипции интерферон-индуцируемых генов

Кол-во

Генов

из них человека

мыши

130

76

46

Протяженных регуляторных районов (промоторов, энхансеров, сайленсеров)

из них промоторов


238

109

Сайтов связывания транскрипционных факторов

666

Композиционных элементов

28

Паттернов экспрессии

2283

Ссылок на другие базы данных

из них на банки последовательностей (EMBL/GenBank)

1845

878

Аннотировано статей

752

Согласно экспериментальным данным, регуляторные районы ИИГ, описанных в базе IIG-TRRD, содержат сайты связывания более чем 90 различных транскрипционных факторов. Основное внимание при дальнейшей работе было обращено на сайты связывания транскрипционных факторов, частота встречаемости которых в регуляторных районах ИИГ оказалась больше 15%. Эта группа включает ТАТА-бокс (35.4%) и сайты связывания пяти основных транскрипционных регуляторов интерфероновой системы, а именно, IRF1 (29.2%), NF-B (26.2%), ISGF3 (23.8%), АР1 (16.2%) и STAT1 (16.9%). На Рис. 3 приведен пример организации 5'-регуляторного района одного из наиболее изученных ИИГ, аннотированных в базе данных IIG-TRRD, индуцибельной нитрооксидсинтазы мыши (INOS). Из Рисунка 3 видно, что у этого гена в районе [-1000; -1] п.о. экспериментально выявлено 13 сайтов связывания 10 разных транскрипционных факторов.

На основе информации из IIG-TRRD было проанализировано распределение по отношению к старту транскрипции экспериментально выявленных сайтов связывания транскрипционных факторов ISGF3, IRF1, STAT1, NF-B и AP1. Было установлено, что большинство сайтов связывания расположено в промоторах в районе [–1; –200] п.о. по отношению к старту транскрипции. Тем не менее, функциональные сайты встречаются и в очень удаленных 5’-энхансерах, вплоть до –5000 п.о., а также в энхансерах, расположенных в интронах, до +1500 п.о. по отношению к старту транскрипции.

Рисунок 3. Схематичное изображение организации 5'-регуляторного района гена INOS мыши. Позиции сайтов приведены относительно старта транскрипции, который обозначен стрелкой. Интерферон-индуцибельный энхансер выделен рамочкой.

Используя информацию из базы данных IIG-TRRD, были сформированы выборки экспериментально выявленных сайтов связывания транскрипционных факторов ISGF3, IRF1, STAT1, NF-B и AP1. На основе этих выборок были созданы методы распознавания в геномной ДНК сайтов связывания этих факторов.

Для распознавания сайтов применялся метод статистического моделирования [Ananko E.A., Kondrakhin Y.V., et al., 2007], в основу которого положено использование частотных и весовых матриц олигонуклеотидов, конструируемых на основе обучающих выборок сайтов. Примененный для получения частотных и весовых матриц итерационный подход не зависит, в отличие от обычных методов, от начального выравнивания выборок сайтов. Наилучшее выравнивание происходит в процессе получения результирующей матрицы по специальному алгоритму в результате нескольких итераций применения алгоритма.

Таблица 3.

Пороговые значения ошибок первого и второго рода для распознавания сайтов связывания ключевых регуляторов интерфероновой системы

Сайт связывания

Ошибка 1-го рода 1
(недопредсказание)

Ошибка 2-го рода 2
(перепредсказание)

AP1

37%

2.81E-03

IRF1

24%

9.59E-05

ISGF3

25%

6.84E-04

NF-B

42%

5.32E-04

STAT1

43%

8.82E-05

В Таблице 3 приведены пороговые значения ошибок первого и второго рода - 1 и 2 (харак-теризующих уровень недопредсказания и перепредсказания сай-тов, соответственно), которые обеспечивали оптимальное распоз-навание сайтов. Например, для транс-крипционного фактора ISGF3 с помощью разработанного метода не распознается 25% экспериментально выявленных сайтов связывания, в то же время, уровень перепредсказания составляет для этого метода распознавания 6.84 сайта на 10 000 п.о. геномной последовательности.

Созданные методы распознавания сайтов связывания ISGF3, IRF1, STAT1, NF-B и AP1 в дальнейшем использовались для анализа протяженных регуляторных районов генов и разработки методов распознавания интерферон-индуцируемых энхансеров и промоторов. Для решения этой задачи необходимо было выявить закономерности в распределении разных типов сайтов связывания, отличающие ИИГ от остальных генов. Чтобы построить обучающую выборку протяженных регуляторных районов ИИГ, из базы данных IIG-TRRD было выбрано 74 гена человека. Для этих генов из контигов хромосом человека были экстрагированы полные последовательности ДНК с фланками в 5000 п.о. как с 5'-, так и с 3'-концов гена.

Прежде всего, с помощью созданных методов распознавания сайтов связывания IRF1, ISGF3, STAT1, NF-B и AP1 было проведено сравнение распределения экспериментально выявленных и потенциальных (предсказанных компьютерными методами) сайтов. Для этого было проанализировано расположение потенциальных сайтов связывания выше перечисленных факторов относительно старта транскрипции в районах от -5000 до +1000. Для оценки статистической значимости неравномерности распределения сайтов по анализируемым районам использовался стандартный критерий -квадрат. Для этого критерия использовался уровень значимости p-value=0.01. Оказалось, что концентрация потенциальных сайтов связывания IRF1, ISGF3 и STAT1 в районе [-200; -1] п.о. выше, чем в остальных районах. Практически каждый ген содержал в этом районе потенциальные сайты связывания IRF1 и ISGF3 (85% и 77% соответственно) и у 20% генов предсказан сайт связывания STAT1, в то время как экспериментально сайты связывания IRF1, ISGF3 и STAT1 были выявлены соответственно у 39%, 29% и 13% тех же генов. Для сайтов связывания AP1 и NF-B превышения концентрации в районе старта транскрипции по сравнению с другими районами ИИГ практически не наблюдалось.

При сравнении плотностей распределения потенциальных и экспериментально выявленных сайтов относительно старта транскрипции ИИГ становится понятно, что интерес исследователей к промоторному району вполне обоснован, поскольку именно там наблюдалось статистически значимое превышение концентрации сайтов связывания транскрипционных факторов, важных для функционирования интерфероновой системы. Однако, потенциальные сайты связывания этих факторов встречаются также и в более отдаленных от старта транскрипции районах, где, по всей видимости, могут образовывать функциональные интерферон-индуцируемые энхансеры.

Для того, чтобы выявить специфику организации регуляторных районов ИИГ, был проведен сравнительный анализ регуляторных областей трех различных функциональных групп генов. Для анализа были использованы также глюкокортикоид-регулируемые гены (39 генов, выборка составлена Меркуловой Т.И.) и гены липидного метаболизма (56 генов, выборка составлена Игнатьевой Е.В.).

Была проверена гипотеза о повышенной плотности потенциальных сайтов связывания IRF1, ISGF3, STAT1, NF-B и AP1 в протяженных регуляторных последовательностях ИИГ [-5000; +1000] п.о. по сравнению с регуляторными районами того же размера у глюкокортикоид-регулируемых генов и генов липидного метаболизма. Однако оказалось, что статистически значимых различий между тремя исследуемыми группами генов по общему количеству предсказанных сайтов в протяженных районах не было выявлено (при pvalue=0.01). Таким образом, критерий общего повышения плотности сайтов связывания IRF1, ISGF3, STAT1, NF-B и AP1 в регуляторных районах интерферон-регулируемых генов не может использоваться для распознавания таких генов в геномной ДНК.

Pages:     | 1 || 3 | 4 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»