WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 ||

В качестве инструмента для установления этапов отбора действующих веществ лекарственных препаратов, установления информационных связей между ними и указания управляющих воздействий исследователя использованы методы структурного системного анализа1. В рамках этих методов описание предметной области строится в виде иерархической структуры, которая отражает различные уровни абстракции с ограниченным числом компонентов на каждом из уровней. Основным элементом является диаграмма, состоящая из функциональных блоков и соединяющих их дуг.

Различают 4 роли дуг: интерфейс ввода/вывода, управляющее воздействие и механизм реализации функции. Роль дуги задается ее расположением относительно функционального блока: стрелка, входящая в блок слева, обозначает входной параметр, стрелка, входящая сверху, – управление, стрелка, входящая снизу, – механизм реализации, стрелка, выходящая справа, – выходные параметры. Методы структурного системного анализа позволяют удобно описать иерархическую декомпозицию «этап-подэтап» сверху вниз, поскольку обеспечивают пошаговую детализацию диаграмм. Каждый компонент описания может быть декомпозирован на другой диаграмме.

Рекомендации по стандартизации. Информационные технологии поддержки жизненного цикла продукции.

Методология функционального моделирования // Госстандарт России, Москва, Издательство стандартов, 2001.

Методика отбора действующих веществ лекарственных препаратов с помощью ИНС состоит из 5 основных этапов:

разбиение исходных данных на обучающую (ОВ), контрольную (КВ) и тестовую (ТВ) выборки;

построение ИНС;

получение прогнозов исследуемых свойств и анализ прогностических возможностей ИНС;

регуляризация ИНС;

отбор перспективных соединений на основе полученных прогнозов.

На диаграмме, представляющей детализированное описание методики (рис.3), выделено 5 функциональных блоков, соответствующих ее этапам.

Диаграмма включает в себя дуги, описывающие исходные данные и результаты прогнозирования, а также дуги, описывающие взаимодействие отдельных этапов: передачу данных и передачу управления. В частности, после анализа качества ИНС происходит либо построение ИНС для нового варианта разбиения исходных данных на ОВ, КВ и ТВ, либо регуляризация ИНС.

Рассмотрим каждый этап методики более подробно.

На первом этапе производится разбиение описаний соединений на подвыборки: обучающую, с помощью которой производится обучение ИНС, контрольную, служащую для предотвращения переобучения сети, и тестовую, по которой оцениваются прогностические возможности сети. При небольших объемах выборки возможно выполнение полного перебора всех возможных вариантов разбиения, однако чаще используют процедуру, при которой разделение проводится случайным образом. Соотношение мощностей ОВ, КВ и ТВ зависит от мощности исходной выборки; как правило, суммарная мощность КВ и ТВ не превышает 10% от мощности исходной выборки.

описания описания соединений соединений описание описание оценка ошибки оценка ошибки ОВ ОВ разбиение разбиение на ОВ, КВ параметры на ОВ, КВ параметры и ТВ ИНС и ТВ ИНС построепостроение ИНС ние ИНС метод метод разбиения разбиения анализ анализ описание описание прогност.

прогност.

прогнозы прогнозы КВ КВ возм. ИНС возм. ИНС регулярирегуляриописание ТВ описание ТВ зация ИНС зация ИНС способ способ отбор отбор оценки оценки соединесоединеошибки ошибки структура структура ний ний метод метод сети сети регуляризарегуляризации ции наиболее наиболее перспекперспективные тивные соединесоединения ния Рис. 1. Детализированное описание методики отбора действующих веществ Рис. 1. Детализированное описание методики отбора действующих веществ лекарственных препаратов лекарственных препаратов На втором этапе для каждой ОВ выполняется построение трехслойной ИНС с сигмоидальной передаточной функцией. Для анализа прогностических возможностей отдельной ИНС используется величина отношения стандартного отклонения ошибки к стандартному отклонению данных (далее будем называть эту величину «коэффициентом стандартного отклонения», как в программе Statistica Neural Networks).

После построения ИНС по каждой обучающей выборке выполняется анализ прогностических возможностей набора ИНС, для этого рассчитывается средний коэффициент стандартного отклонения как по всему набору ИНС, так и по наборам ИНС для каждой КВ.

Для повышения прогностических возможностей ИНС используются различные алгоритмы регуляризации, позволяющих уменьшить количество используемых в сети дескрипторов. Для исключения маловариабельных и коррелированных дескрипторов используется генетический алгоритм, позволяющий сгенерировать, проанализировать и выбрать приемлемый набор молекулярных дескрипторов.

Дальнейшая регуляризация может быть выполнена на основе анализа набора построенных ИНС. Предложен следующий алгоритм регуляризации.

Выбираются молекулярные дескрипторы, входящие в наибольшее число построенных ИНС, обучается новая ИНС, включающая в качестве входных только отобранные дескрипторы, и выполняется анализ полученных значений коэффициента стандартного отклонения. В том случае, если среднее значение коэффициента стандартного отклонения не возрастает, можно считать регуляризацию выполненной и в дальнейшем использовать только отобранные молекулярные дескрипторы. В противном случае необходимо изменить порог отбора дескрипторов. Диаграмма, описывающая регуляризацию ИНС по предложенному алгоритму, приведена на рис.2.

порог отбора параметры набор сетей дескриптооценка ров отбор ошибки дескрипторов построение регуляриз.

сравнение ИНС оценок прогнозы оценки ошибок сетей ошибок Рис. 2. Детализированное описание этапа регуляризации ИНС Окончательный отбор соединений с требуемыми свойствами осуществляется на основе прогнозов, полученных с помощью регуляризованной ИНС. Для повышения достоверности прогнозов на этом этапе можно использовать также прогнозы, полученные с помощью других методов, например, логических.

В третьей главе представлены результаты применения предложенной процедуры прогнозирования свойств для 2-х различных групп соединений.

Первая группа состояла из производных дитиокарбаминовой кислоты, синтезированных и экспериментально изученных в отделе Медицинской химии Государственного научного центра по антибиотикам (ГНЦА). Эти соединения рассматриваются как перспективная основа для противотуберкулезных препаратов. В качестве исследуемого свойства количественно определялась способность подавлять рост микобактерий туберкулеза на твердой среде. Рассматривалась выборка из 32 соединений, причем большая часть (24 соединения) не обладала исследуемым свойством.

Общая структура соединений представлена на рис.5, расшифровка заместителей и значение свойства для ряда соединений – в табл. 1 (таблица, описывающая всю выборку, приведена в диссертационной работе).

RS RS RN RRRRРис.5. Общая структура исследованных производных дитиокарбаминовой кислоты Таблица № соед. R1 R2 R3 R4 R5 R6 R7 Активность I NO2 H Н H H CH2CH3 CH2CH3 II NO2 H NO2 H H CH2CH3 CH2CH3 III NO2 H F3 H H CH2CH3 CH2CH3 IV NO2 H F3 Cl H CH3 CH3 V NO2 H F3 H NO2 CH3 CH3 … XXVII NO2 H CNH2 H H CH2CH2CH2CH2 O XXVIII NO2 H CN H H CH2CH2CH2CH2 XXIX NO2 H NO2 H CN CH2CH2CH2CH2 XXX NO2 H NO2 H CNH2 CH2CH2CH2CH2 O XXXI NO2 H NO2 H CN CH2CH3 CH3 XXXII NO2 H NO2 H CNCH3 CH2CH2CH2CH2 CHВначале выполнялся скользящий контроль методом полного перебора при 1 контрольном и 1 тестовом веществе. При построении ИНС использовался генетический алгоритм для уменьшения количества входных переменных. Среднее значение коэффициента стандартного отклонения по всем построенным ИНС составляет 0,1, что свидетельствует о приемлемых прогностических возможностях сетей для данной выборки. Наилучшие результаты достигаются при выборе соединения XI в качестве контрольного, в этом случае среднее значение коэффициента стандартного отклонения, рассчитанное по всем тестовым соединениям, составляет 0,04. Значимость полученных результатов особенно возрастает, если учесть, что выборка содержит большое количество соединений с нулевыми значениями выходного параметра. Анализ таких выборок классическими регрессионными методами существенно затруднен, а ИНС показывают приемлемые результаты.

Регуляризация полученных ИНС по предложенному алгоритму позволила отобрать 24 параметра, которые встречались в первоначально полученных ИНС более 20 раз. Значение коэффициента стандартного отклонения для регуляризованной ИНС составило 0,0006.

Прогнозы, построенные с помощью регуляризованной ИНС, позволили отобрать в качестве наиболее перспективных соединения II, XXIX, XXXI, XXXII, что соответствует как экспериментально полученным данным о противотуберкулезной активности, так и прогнозам, полученным с помощью логических методов.

Для исследуемых соединений выполнялся также скользящий контроль с использованием случайного перебора комбинаций соединений, составляющих контрольную и тестовую выборку. Контрольная выборка состояла из 1 соединения, тестовая – из 3 соединений. По 28 случайным комбинациям среднее значение коэффициента стандартного отклонения составило 0,05. Несмотря на сокращение объема обучающей выборки, прогностические возможности ИНС ухудшились незначительно, что свидетельствует об устойчивости полученной модели.

Соединения второй группы - производные тетрагидроимидазобензодиазипенона (TIBO) используются в комплексных анти-ВИЧ препаратах.

Данные о соединениях выбирались из нескольких литературных источников.

Рассматривалась выборка из 49 соединений. В качестве исследуемого свойства рассматривались значения отрицательного логарифма 50% ингибирующей концентрации (IC50), в табл. 2 это свойство обозначено I.

Общая структура соединений представлена на рис.6, расшифровка заместителей и значение для ряда соединений – в табл. 2. (таблица, описывающая всю выборку, приведена в диссертационной работе).

Рис.6 Общая структура исследованных производных TIBO Таблица Соедин. R X Y Z I IC50(м) s-I H S 8-Cl DMA 0,046 1,s-II H S 9-Cl DMA 0,16 0,s-III 7-Me O DMA 12,1 -1,… s-XX 5-Me(S) S DMA 3,32 -0,p-I 4-Me(S) O DMA 32,1 -1,p-II 4-Me(S) S 9-Cl DMA 0,67 0,p-III 7-Me(S) S CH2CH2CH3 2,43 -0,… p-VII 5-Me(S) S DMA 0,026 1,i-I 5-Me(S) S H DMA 0,044 1,i-II 5-Me(S) S 8-F DMA 0,006 2,i-III 5-Me(S) S 8-Br DMA 0,003 2,… i-X 5-Me(S) S 10-Br DMA 1,072 -0,i-XI 5-Me(S) S 10-O-CH3 DMA 4,677 -0,i-XII 5-Me(S) S 9,10-diCl DMA 0,026 1,h-I 4-Me S DMA 0,028 1,… h-VII 4-Me S 9-Cl DEtA 0,012 1,Примечания: DMA - диметилаллил-; DetA – диэтилаллил- Полный перебор всех вариантов разбиения выборки на ОВ, КВ и ТВ практически невозможен, поэтому для второй группы соединений использовался только метод скользящего контроля с использованием случайного перебора комбинаций. Контрольная выборка состояла из соединений, тестовая – также из 2 соединений. Среднее значение коэффициента стандартного отклонения по 10 вариантам составило 0,(табл.3).

Таблица Состав КВ Состав ТВ Коэффициент стандартного отклонения h-III, s-XVI h-V, i-IX 0,s-XI, h-IV t-I, i-I 0,s-XV, p-IV s-X, p-VII 0,s-I, i-VIII s-XV, h-VII 0,i-VII, h-VII s-II, s-XX 0,i-XI, s-XVI s-III, h-III s-II, s-XI p-IV, h-III 0,s-XX, i-I s-V, s-XI 0,s-I, t-II s-VIII, p-VI 0,s-IV, i-VII i-X, h-II 0,Среднее значение коэффициента 0,стандартного отклонения:

При дальнейшей регуляризации было отобрано 29 молекулярных дескрипторов, которые встречались в первоначально полученных ИНС более 8 раз. Коэффициент стандартного отклонения регуляризованной ИНС составил 0,08.

Прогнозы, построенные с помощью регуляризованной ИНС, позволили отобрать в качестве наиболее перспективных соединения s-VII, s-XVI, i-II, iIII, i-IV, h-V, h-VII, что соответствует как экспериментально полученным данным об анти-ВИЧ активности, так и прогнозам, полученным с помощью логических методов.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ 1. выявлены особенности применения искусственных нейронных сетей (ИНС) для задач прогнозирования свойств органических соединений;

2. обоснован выбор структур ИНС и алгоритмов их обучения и тестирования;

3. разработана методика выбора действующих веществ фармакологической продукции химического производства;

4. предложен алгоритм регуляризации, позволяющий уточнить прогнозы за счет уменьшения количества входных параметров ИНС;

5. получены подтвержденные в ходе экспериментальных исследований прогнозы противотуберкулезной активности производных дитиокарбаминовой кислоты и анти-ВИЧ активности производных тетрагидроимидазобензодиазипенона (TIBO) ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ 1. Бурляева Е.В., Ушаков П.А. Применение искусственных нейронных сетей для прогнозирования противотуберкулезной активности органических соединений // Вестник Костромского государственного университета им. Н.А. Некрасова, т.12, № 3, 2006, с. 25-2. Бурляева Е.В., Ушаков П.А. Применение нейронных сетей для прогнозирования активности органических соединений // Вестник МИТХТ, 2008г, т3, №4, стр. 79-83.

3. Бурляев В.В., Ушаков П.A. Применение нейронных сетей для уточнения интервальных прогнозов активности конформационно-гибких соединений // Сборник трудов XVII Международной научной конференции «Математические методы в технике и технологиях», т.4, Кострома, Изд-во КГТУ, 2004, с.165-4. Бурляев В.В., Ушаков П.А. Применение нейронных сетей для прогнозирования противотуберкулезной активности производных дитиокарбаминовой кислоты // Сборник трудов 18-й международной конференции «Математические методы в технике и технологиях», Казань, 2005, т.8, с.5. Бурляев В.В., Бурляева Е.В., Ушаков П.А. Применение искусственных нейронных сетей для прогнозирования противотуберкулезной активности производных дитиокарбиминовой кислоты // Тезисы докладов XIII Российского национального конгресса "Человек и лекарство", Москва, 2006, с. 6. Burljaeva E., Ushakov P. Neural networks application for prediction of anti- tuberculosis activity // Proceeding of 7-th international scientific technical conference “Process Control – 2006”, Czech Republic, Pardubice, 2006, p.Подписано в печать 19.11.2008. Сдано в производство 20.11.2008.

Формат бумаги 60х90 1/16. Объем 1,5 п.л.

Pages:     | 1 ||






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»