WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     || 2 |

На правах рукописи

Ушаков Павел Александрович ПРИМЕНЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ВЫБОРА ДЕЙСТВУЮЩИХ ВЕЩЕСТВ ФАРМАКОЛОГИЧЕСКОЙ ПРОДУКЦИИ ХИМИЧЕСКОГО ПРОИЗВОДСТВА 05.13.01 – Системный анализ, управление и обработка информации (химическая промышленность) А В Т О Р Е Ф Е Р А Т диссертации на соискание ученой степени кандидата технических наук

Москва, 2008 г.

1

Работа выполнена на кафедре Информационных технологий Государственного образовательного учреждения высшего профессионального образования "Московская государственная академия тонкой химической технологии им. М.В. Ломоносова".

Научный консультант: доктор технических наук, профессор Бурляева Елена Валерьевна

Официальные оппоненты: доктор технических наук, профессор Гартман Томаш Николаевич доктор технических наук, профессор Ермуратский Петр Васильевич

Ведущая организация: Московский институт кибернетической медицины

Защита состоится " 23 " " декабря " 2008 года в 14 час. на заседании диссертационного совета Д 212.120.08 в Московской Государственной Академии тонкой химической технологии им. М.В.Ломоносова по адресу:

119571, г. Москва, пр. Вернадского, 86.

С диссертацией можно ознакомиться в библиотеке МИТХТ им. М.В. Ломоносова (119571, г. Москва, пр. Вернадского, 86).

Автореферат диссертации размещен на сайте www.mitht.ru Реферат разослан "20" "ноября" 2008 года.

Ученый секретарь Бурляева Е.В.

диссертационного совета доктор технических наук 2

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы Одним из первых этапов химического производства фармакологической продукции является выбор перспективных действующих веществ из большого массива химических соединений.

Компьютерное прогнозирование таких свойств еще не синтезированных химических соединений, как токсичность, биодоступность, фармакологическая активность и т.п., позволяет проводить дорогостоящие экспериментальные исследования более прицельно и оценивать возможность использования соединения в качестве основы для создания лекарственного препарата на ранних стадиях его изучения. В основе исследований лежит предположение о том, что структура соединения определяет свойства, проявляемые этим соединением. Гипотезы о взаимосвязи структуры молекулы соединения и его свойствами могут быть построены на основе анализа сведений об уже синтезированных и исследованных молекулах соединений того же класса. Эту область исследований кратко называют изучением зависимостей «структура – свойство».

Традиционно для построения гипотез о зависимости между структурой молекулы сложного органического соединения и его свойствами используются методы регрессионного анализа, однако построить модели с приемлемыми прогностическими возможностями не всегда удается. В качестве альтернативных подходов в последнее время предлагается использование эвристических методов, в том числе искусственных нейронных сетей (ИНС) и эволюционных алгоритмов. Однако при применении ИНС для задач прогнозирования свойств органических соединений возникает ряд проблем, связанных, в первую очередь, с малым объемом выборок. Актуальной остается задача разработки алгоритмов и методик применения ИНС для отбора действующих веществ новых лекарственных препаратов на основе прогнозов свойств этих соединений.

Целью работы является повышение эффективности ранних стадий химического производства фармакологической продукции за счет сокращения сроков выбора действующих веществ путем использования искусственных нейронных сетей.

Для достижения этой цели необходимо последовательное решение следующих задач:

1. анализ особенностей применения ИНС для задач прогнозирования свойств органических соединений;

2. выбор структуры ИНС и алгоритмов их обучения и тестирования;

3. разработка методики отбора действующих веществ лекарственных препаратов;

4. выбор инструментальных средств для реализации разработанной методики;

5. применение методики для решения различных задач отбора соединений с требуемыми свойствами.

Научная новизна выявлены особенности применения ИНС для задач прогнозирования активности органических соединений, разработана методика выбора действующих веществ фармакологической продукции химического производства;

предложен алгоритм регуляризации, позволяющий повысить точность прогнозов за счет уменьшения количества входных параметров ИНС.

Практическая значимость. Основным практическим результатом является методика выбора действующих веществ фармакологической продукции химического производства. На основе этой методики получены подтвердившиеся в ходе экспериментальных исследований прогнозы противотуберкулезной активности производных дитиокарбаминовой кислоты и анти-ВИЧ активности производных тетрагидроимидазобензодиазипенона (TIBO).

Методы исследования Разработка методики выбора действующих веществ фармакологической продукции химического производства выполнена с использованием методов структурного системного анализа. Для прогнозирования свойств органических соединений использованы гомогенные однонаправленные трехслойные ИНС с 3-мя нейронами в промежуточном слое.

Апробация работы Основные положения и результаты работы докладывались на российских и международных научно технических конференциях, в том числе на российском национальном конгрессе «Человек и лекарство» (Москва, 2006), международных научно-технических конференциях «Process Control» (Чешская республика, Пардубице, 2006), «Математические методы в технике и технологиях» (Кострома, 2004, Казань, 2005).

Публикации Полученные в работе результаты изложены в 6 опубликованных работах, в том числе 2 статьях в журналах, рекомендованных ВАК РФ.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, сформулированы цель и основные задачи исследования, дана общая характеристика работы.

В первой главе выполнена постановка задачи выбора действующих фармакологической продукции химического производства с использованием искусственных нейронных сетей. Обосновано использование методов компьютерного прогнозирования свойств органических соединений для выбора перспективных соединений. Рассмотрены различные способы описания структуры молекулы соединения и проявляемых этим соединением свойств. Особое внимание уделено описанию структуры с помощью точечных характеристик, называемых молекулярными дескрипторами, в том числе квантово-химическим параметрам, описывающим трехмерную структуру молекулы. Показано, что построение гипотез о взаимосвязи между структурой и свойствами исследуемых соединений сводится к выявлению общей закономерности на основе ряда примеров ее проявления. Рассмотрены различные методы построения гипотез, в том числе статистические, логические и эвристические, и способы получения оценочных значений свойств исследуемых соединений.

Далее рассмотрены методы ИНС как вычислительной схемы, построенной из однородных логических элементов, называемых формальными нейронами. Такой нейрон представляет собой математическую модель простого процессора, имеющего несколько входов и один выход.

Множество входных сигналов, обозначенных x1, x2,…, xn, поступает на формальный нейрон. Каждый сигнал умножается на соответствующий вес w1, w2,…, wn, и поступает на суммирующий блок, обозначенный.

Суммирующий блок складывает взвешенные входы алгебраически. Далее этот результат преобразуется с помощью нелинейной функции, называемой также функцией активации.

Рис.1 Формальный нейрон В диссертационной работе рассмотрены различные типы таких функций: пороговая, линейная, сигмоидальная, гиперболический тангенс.

При построении ИНС отдельные нейроны связываются между собой таким образом, что входные сигналы поступают на вход нескольких нейронов с учетом весов. С точки зрения топологии выделяют полносвязные ИНС, в которых каждый нейрон передает выходной сигнал всем остальным нейронам, слабосвязные ИНС, в которых нейрон передает выходной сигнал нескольким соседним нейронам, и многослойные, в которых нейроны объединяются в слои и каждый слой содержит совокупность нейронов с едиными входными сигналами. Кроме того, выделяют гомогенные ИНС, в которых все нейроны имеют одинаковую функцию активации, и гетерогенные, в которых используются нейроны с различными функциями активации.

В работе выполнен анализ известных из литературы результатов применения ИНС для задач прогнозирования, в том числе прогнозирования свойств химических соединений. Показана необходимость разделения имеющихся данных на обучающую выборку, с помощью которой выполняется формирование гипотез, и тестовую, с помощью которой рассчитываются и анализируются прогнозы. При прогнозировании свойств органических соединений обучающую выборку для построения ИНС составляют векторы числовых значений молекулярных дескрипторов и числовые значения изучаемых свойств. Обучение ИНС эквивалентно установлению зависимостей между молекулярными дескрипторами и исследуемыми свойствами соответствующих соединений.

Показано, что при исследовании зависимости «структура – свойство» предпочтительными являются гомогенные нейронные сети, в которых каждый нейрон последующего слоя связан со всеми нейронами предыдущего слоя. В такой сети выделяют входной слой, осуществляющий распределение значений входных параметров, промежуточные слои и выходной слой, в котором определяется значение выходного параметра сети. Наилучшие результаты достигаются при использовании трехслойных сетей. Для определения оптимального количества нейронов в скрытом слое проводились специальные исследования, в которых было доказано, что наилучшие результаты достигались при использовании 3 нейронов.

Структура трехслойной гомогенной ИНС с 3-мя нейронами в промежуточном слое приведена на рис.bi b Рис.2 Трехслойная гомогенная ИНС с 3-мя нейронами в промежуточном слое В качестве функции активации в такой сети выбрана сигмоидальная функция y, гдеs xi bi wi 1 eas i где xi – значения молекулярных дескрипторов, y – значение исследуемого свойства, a, wi,bi – параметры ИНС.

В основе применения ИНС лежит использование алгоритмов, получаемых при помощи обучения на примерах. Эти алгоритмы кодируются в ИНС в виде значений весов нейронов. Обученная таким образом ИНС способна решать задачу аппроксимации нелинейной функции произвольного вида от многих переменных.

Целью обучения является получение по заданному множеству входов желаемое множество выходов. Каждое такое входное (или выходное) множество рассматривается как вектор. Обучение осуществляется путем последовательного предъявления входных векторов с одновременной подстройкой весов в соответствии с определенной процедурой. В процессе обучения веса сети постепенно становятся такими, чтобы каждый входной вектор вырабатывал требуемый выходной вектор. Таким образом, по конечному набору пар (вход, выход), называемому обучающей выборкой, формируется отображение f(x)=y.

На основе анализа различных алгоритмов обучения ИНС для задач построения зависимости «структура-свойство» обосновано использование алгоритма Левенберга-Маркардта как алгоритма «обратного распространения ошибки» (backpropagation). Минимизируемой целевой функцией ошибки ИНС является величина:

(N ) (1) E(w ) (y d )j,p j,p j,p где y( N ) – реальное выходное состояние нейрона j выходного слоя N j, p нейронной сети при подаче на ее входы p-го образа; djp – идеальное (желаемое) выходное состояние этого нейрона. Суммирование ведется по всем нейронам выходного слоя и по всем обрабатываемым сетью образам.

Минимизация ведется методом градиентного спуска, что означает подстройку весовых коэффициентов следующим образом:

E ( wijn) wij Здесь wij – весовой коэффициент связи, соединяющей i-ый нейрон слоя n-1 с j-ым нейроном слоя n, – коэффициент скорости обучения, 0<<1.

Рассмотрена проблема переобучения ИНС и различные методы их тестирования. Для повышения достоверности результатов предложено применение метода скользящего контроля, позволяющего проанализировать большое количество комбинаций разбивки полной выборки соединений на обучающую, тестовую и контрольную. Рассмотрены методы полного перебора всех вариантов разбивки и случайного выбора.

На основе анализа программ, реализующих построение и тестирование ИНС, обоснован выбор в качестве инструментального средства программы Statistica Neural Networks (производство компании StatSoft Inc).

Рассмотрены основные проблемы, связанные с применением ИНС при построении гипотез о зависимости «структура – свойство», и способы их преодоления. Показано, что факторами, ограничивающими применимость ИНС для задач прогнозирования активности органических соединений, являются большая корреляция между значениями параметров и малые объемы выборок (количество параметров нейронной сети, как правило, на порядок превосходит объем выборки), что приводит к переобучению сети.

При переобучении сети ошибка, полученная по обучающей выборке, мала, но при подстановке в сеть новых данных, т.е. при прогнозировании, резко возрастает. Для преодоления этих проблем применяются различные виды регуляризации, позволяющие уменьшить количество используемых в ИНС параметров без уменьшения прогнозирующей способности сети.

Таким образом, возникает задача разработки методики отбора действующих веществ лекарственных препаратов с использованием искусственных нейронных сетей (ИНС), сформулированная в заключительном параграфе первой главы.

Вторая глава посвящена разработке методики отбора перспективных действующих веществ лекарственных препаратов с помощью ИНС.

Исходными данными для этой методики являются описания набора однотипных соединений, причем описание каждого соединения состоит из численных значений молекулярных дескрипторов и численного значения исследуемого свойства. Результатом являются отобранные с использованием полученных прогнозов перспективные с точки зрения исследуемых свойств соединения.

Pages:     || 2 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»