WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

На правах рукописи

ФАРХИЕВА Светлана Анатольевна

ПОДДЕРЖКА ПРИНЯТИЯ РЕШЕНИЙ В НАЛОГОВОМ АДМИНИСТРИРОВАНИИ НА ОСНОВЕ НЕЙРОСЕТЕВЫХ МОДЕЛЕЙ С БАЙЕСОВСКОЙ РЕГУЛЯРИЗАЦИЕЙ

Специальность 05.13.10 - Управление в социальных и экономических системах

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Уфа - 2012

Работа выполнена на кафедре математики и информатики ФГБОУ ВПО «Всероссийский заочный финансово-экономический институт» Филиал в г. Уфе Научный руководитель д-р техн. наук, проф.

ГОРБАТКОВ Станислав Анатольевич Всероссийский заочный финансовоэкономический институт, филиал в г. Уфе Официальные оппоненты д-р техн. наук, проф.

ЧЕРНЯХОВСКАЯ Лилия Рашитовна Уфимский государственный авиационный технический университет д-р физ.-мат. наук, доц.

АСАДУЛЛИН Рамиль Мидхатович Башкирский государственный педагогиче­ ский университет Ведущая организация ФГБОУ ВПО «Уфимский государственный нефтяной технический университет»

Защита диссертации состоится 18 мая 2012 г. в 10 часов на заседании диссертационного совета Д-212.288.при Уфимском государственном авиационном техническом университете по адресу: 450000, Уфа-центр, ул. К. Маркса,

С диссертацией можно ознакомиться в библиотеке института

Автореферат разослан « » апреля 2012 г.

Ученый секретарь диссертационного совета д-р техн. наук, проф. В. В. Миронов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы В современных условиях развития российской экономики актуальным является максимальное наполнение государственного бюджета доходами и обеспечение их сбалансированности с расходами. В рамках приоритетных направлений совершенствования налоговой системы Российской Федерации, определенных Президентом и Правительством, предусмотрено, что исполь­ зование эффективных приемов и методов налогового администрирования (НА) и дальнейшее их совершенствование должно способствовать значи­ тельному росту налоговых поступлений в бюджет. Поэтому актуальной проблемой исследований представляется совершенствование технологий подсистем налогового администрирования местного уровня на основе но­ вейших инструментариев теории моделирования сложных систем, искусст­ венного интеллекта, информационных технологий и экономико-математи­ ческого моделирования в условиях существенного искажения данных нало­ говых деклараций, дефицита наблюдений и сложных условий формализации моделей.

Вопросы совершенствования контрольной работы в налоговых органах и моделей налогового администрирования представлены в работах Г. Г. Брызгалина, И. Р. Пайзулаева, Ю. Ф. Кваши, А. 3. Дадашева, A. В. Лобанова, В. А. Красницкого, Л. Ф. Черкасовой и др. Вопросам управ­ ления налогообложением в аспекте моделирования процессов сбора налогов и оценки добросовестности отдельных налогоплательщиков посвящены ра­ боты А. Б. Паскачева, Т. Н. Скорика, А. Б. Соколова, Д. Г. Черника, М. В. Мишустина и др. Проблемы интеллектуального управления и нейросетевого моделирования экономических объектов исследованы в трудах отече­ ственных ученых В. И. Васильева, А. А. Ежова, Б. Г. Ильясова, Л. А. Исмагиловой, С. Т. Кусимова, С. А. Терехова, С. А. Шумского, Л. Р. Черняховской, Н. И. Юсуповой, зарубежных ученых И. С. Абу-Мустафы, Д.-Э. Бэстенса, В.-М. ван ден Берга, Д. Вуда. Общие вопросы теории нейронных сетей и нейрокомпьютинга изложены в работах А. И. Галушкина, А. Н. Горбаня, B. Л. Дунина-Барковского, Г. Г. Малинецкого, Э. Баррона, А. Г. Ивахненко, Т. Кохонена, Ф. Розенблата, С. Хайкина и других ученых нашей страны, ближнего и дальнего зарубежья.

Г. И. Букаевым и Н. Д. Бубликом предложена технология оценки фи­ нансовых показателей налогоплательщиков. На основе этих предложений C. А. Горбатковым разработаны общие принципы нейросетевого моделиро­ вания сложных экономических систем, включая системы налогового админи­ стрирования. Построению нейросетевых моделей (НСМ) камеральных про­ верок торговых предприятий посвящены исследования Н. Т. Габдрахмановой и Д. В. Полупанова. Однако, в этих работах не были рассмотрены вопро­ сы устойчивости (регуляризации) НСМ и не были исследованы подсистемы налогового планирования и регулирования.

Несмотря на существующие многочисленные разработки в области нейросетевого моделирования, для стохастических объектов с сильно зашумленными и даже сознательно искаженными данными, методы и принципы построения эффективных, адекватных и качественных НСМ не разработаны в полном объеме. Поэтому актуальной научной задачей является разработка методов и компьютерных технологий построения НСМ поддержки принятия решений в НА в условиях высокой неопределенности данных.

Объектом исследования в работе являются процессы в системе НА, направленные на повышение собираемости налогов при сохранении финан­ совой устойчивости предприятий-налогоплательщиков после уплаты нало­ гов.

Предметом исследования в работе являются НСМ, функционирующие в условиях высокой неопределенности, для представления знаний в эксперт­ ных системах по принятию решений в системе НА.

Подводя итоги анализа актуальности темы диссертации, следует отме­ тить, что уровень автоматизации налогового контроля, планирования и регу­ лирования в существующих информационных технологиях не соответствует запросам практики, с одной стороны, и потенциальным возможностям со­ временного математического аппарата, в частности нейросетевых методов, с другой стороны. Эти обстоятельства определили цель данной работы и зада­ чи исследования.

Цель диссертационной работы состоит в повышении эффективности разработки управленческих решений по налоговому администрированию ме­ стного уровня, а также повышение уровня автоматизации технологий адми­ нистрирования на основе НСМ в качестве моделей представления знаний в экспертных системах НА.

Задачи исследования. Для достижения поставленной цели в диссерта­ ционной работе сформулированы следующие задачи:

1. Разработка подхода к поддержке принятия решений по НА на основе применения инженерии знаний, технологии экспертных систем и нейросете­ вых технологий.

2. Разработка концепции построения эффективных, устойчивых и адек­ ватных гибридных нейросетевых математических моделей (ГНСМ) в услови­ ях высокой неопределенности на основе общесистемных закономерностей и байесовского подхода к регуляризации НСМ.

3. Разработка метода регуляризации НСМ, реализующего концепцию по пункту 2 на основе байесовского ансамбля нейросетей.

4. Разработка метода синтеза оптимального плана выездных налоговых проверок на байесовском ансамбле нейросетей.

5. Разработка метода оценки финансовой состоятельности налогопла­ тельщиков.

Методы исследования. В ходе исследования использовались методы системного анализа, теории принятия решений, методы разработки эксперт­ ных систем, методы нейроматематики, эконометрики и математической ста­ тистики.

На защиту выносятся положения:

1. Подход к поддержке принятия решений в НА с использованием техно­ логии экспертных систем и технологии интеллектуального представления и накопления знаний в виде НСМ.

2. Концепция о необходимости взаимосвязанного управления информа­ тивностью данных и качеством аппроксимации в НСМ.

3. Метод вложенных математических моделей (МВММ) для построения обобщенных моделей восстановления многофакторных зависимостей, скры­ тых в данных, прогнозирования и ранжирования, реализующий концепцию 2.

4. Метод синтеза оптимального плана выездных налоговых проверок на байесовском ансамбле нейросетей, позволяющий повысить достоверность отбора налогоплательщиков для выездных налоговых проверок по налоговому планированию.

5. Гибридный метод оценки кредитоспособности, позволяющий оценить финансовую состоятельность налогоплательщиков и повысить оперативность принятия решений по налоговому регулированию.

Научная новизна работы:

1. Научная новизна подхода к поддержке принятия решений в НА заклю­ чается в том, что в экспертной системе НА ранее НСМ не использовались для представления знаний, что позволяет модели представления знаний функционировать в сложных специфических условиях моделирования (сильном зашумлении и искажении данных, характерных для моделируемой системы).

2. Концепция о необходимости взаимосвязанного управления информа­ тивностью данных и качеством аппроксимации в НСМ на основе байесовско­ го ансамбля нейросетей, отличается тем, что итерационные процедуры пре­ добработки данных, направленные на повышение их однородности и инфор­ мативности с использованием вспомогательных НСМ, предлагается прово­ дить взаимосвязано с процедурой регуляризации обучения основной (рабо­ чей) НСМ, направленной на повышение качества и устойчивости нейросетевого отображения, что позволяет обеспечить состоятельность задачи регуля­ ризации в условиях высокой неопределенности данных и приблизить НСМ к реальным условиям разработки управленческих решений в НА.

3. Научная новизна МВММ заключается в том, что предложенный метод, реализующий концепцию по пункту 2, отличается тем, что вводится 6 ите­ рационных оптимизационных процедур предобработки данных на вспомога­ тельных НСМ и 5 процедур обучения рабочей НСМ с ее реализацией, причем критерии предобработки подчинены качеству будущего обучения НС, это обеспечивает разумный компромисс между прогностическими свойствами НСМ и ее устойчивостью по выбранной числовой мере в сложных условиях моделирования при разработке управленческих решений в НА.

4. Научная новизна гибридного нейросетевого метода (ГНМС) синтеза оптимального плана выездных налоговых проверок на байесовском ансамбле нейросетей состоит в том, что принцип построения критерия ранжирования налогоплательщиков при отборе для выездных налоговых проверок оценивает не только вероятность ненулевых доначислений, но и производит упоря­ дочение (ранжирование) предприятий-налогоплательщиков по ожидаемой сумме доначислений, а также оценивает статистическую устойчивость боль­ ших отклонений в декларациях по предыстории данных. Это позволяет по­ высить достоверность синтезированных планов, и как следствие, повысить собираемость налогов.

5. Научная новизна гибридного метода оценки кредитоспособности нало­ гоплательщиков отличается тем, что в его алгоритм впервые введена нейронечеткая процедура оценки кредитоспособности кластеров отдельно взятых (крупных и проблемных) налогоплательщиков. Это позволяет повысит опе­ ративность принимаемых решений по налоговому регулированию, а также повысить собираемость налогов за счет научно обоснованного углубленного анализа финансового состояния крупных налогоплательщиков.

Обоснование достоверности научных положений, выносимых на защиту. Достоверность положений, выносимых на защиту, обосновывалась проведением широких серий вычислительных экспериментов с использова­ нием реальных (закодированных) данных налоговых деклараций в главах 3 и 4, а также сравнением данных синтеза оптимальных планов выездных нало­ говых проверок с их итогами в производственных условиях для торговых и сельскохозяйственных предприятий Республики Башкортостан. Получена 83-процентная вероятность правильной диагностики нарушений налогового законодательства в декларациях (см. таблицу 2). Кроме того, производилось сравнение результатов расчета оптимального плана выездных проверок в ГНСМ с альтернативной известной модифицированной непараметрической моделью И. И. Голичева в главе 3 (см. таблицу 3).

Практическая значимость работы Получено свидетельство о регистрации электронного ресурса «Алго­ ритм структурирования данных с использованием вспомогательных нейросетевых субмоделей и построение рабочей нейросетевой модели с байесовской регуляризацией» в ОФЭРНиО ИНИМ РАО № 16403 от 22.11.2010 г.

В учебном процессе Уфимской государственной академии экономики и сервиса (УГАЭС) и филиала Всероссийского заочного финансовоэкономического института в г. Уфе (ВЗФЭИ) внедрено математическое обес­ печение экспертной системы НА, а также методика его использования для решения задач налогового контроля, планирования и регулирования.

В работу отдела кредитных продуктов ОАО «Уралсиб» внедрен гиб­ ридный метод оценки кредитоспособности заемщиков, который позволяет малозатратно и оперативно получать достаточно достоверную информацию о финансово-экономическом состоянии заемщиков.

Научное исследование выполнено в 2002-2011 гг. во Всероссийском заочном финансово-экономическом институте. И в частности, в соответствии с комплексной темой «Обеспечение устойчивого экономического и социаль­ ного развития России», по кафедральной подтеме «Разработка теоретических основ и методов нейросетевого моделирования в налогообложении».

Полученные в работе результаты по экспертной системе могут служить научной базой для модернизации аналитического блока электронной систе­ мы обработки данных (ЭОД) местного уровня, которая в настоящее время функционирует в налоговой системе России.

Апробация работы Результаты работы обсуждались и были одобрены на следующих кон­ ференциях и семинарах: Всероссийская научно-техническая конференция «Нейроинформатика» (Москва, 2006, 2007, 2009-2012); V Всероссийская на­ учно-практическая конференция «Проблемы и перспективы российской эко­ номики» (Пенза, 2006); Научно-практическая конференция «Современные направления теоретических и практических исследований» (Одесса, 2006);

XXII Международная научно-техническая конференция «Математические методы и информационные технологии в экономике, социологии и образова­ нии» (Пенза, 2008); III Всероссийская научно-практическая конференция «Система ценностей современного общества» (Новосибирск, 2008); Всерос­ сийская научно-практическая конференция «Финансовая и актуарная мате­ матика» (Уфа, 2009); Международная научно-практическая конференция «Современные проблемы и пути их решения в науке, транспорте, производ­ стве и образовании» (Одесса, 2009); Всероссийская конференция с элемента­ ми научной школы молодежи «Проведение научных исследований в области обработки, хранения, передачи и защиты информации» (Ульяновск 2009);

Всероссийская научно-практическая конференция «Социальная ответствен­ ность бизнеса: теория, методология, практика» (Уфа, 2010, 2011).

Публикации. Список публикаций по теме диссертации содержит работ, в том числе 4 - в рецензируемых журналах ВАК, 1 коллективную мо­ нографию, 1 свидетельство о регистрации алгоритма.

Благодарности. Автор благодарит д-ра физ.-мат. наук, проф. И. И. Голичева, д-ра экон. наук, проф. Н. Д. Бублика, канд. техн. наук, доц. Д. В. По­ лупанова за ценные советы при обсуждении работы.

Структура и объем работы. Диссертация состоит из введения, четы­ рех глав, заключения, списка использованной литературы (109 наименова­ ний), 2 приложений и содержит 176 страниц основного текста, включая ил­ люстрации и таблицы.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертационной работы, сформулированы цели и задачи исследования, приведены методы исследова­ ния, изложены новизна и практическая ценность выносимых на защиту по­ ложений, обоснована достоверность этих положений.

В первой главе рассмотрена актуальная, имеющая важное научнопрактическое значение на современном этапе налоговой реформы и развития НА в России, проблема дальнейшей разработки современной эффективной поддержки принятия решений в системе НА, основанной на современных технологиях искусственного интеллекта и достигнутом уровне новейших информационных технологий.

В результате анализа известных подходов для поддержки принятия ре­ шений в подсистемах НА и существующих методик налогового контроля, планирования и регулирования, а также особенностей условий моделирова­ ния (сильная зашумленность данных) обоснована необходимость исследова­ ния управления процессами в подсистемах НА и разработка НСМ для пред­ ставления знаний в экспертных системах по принятию решений в системе НА.

В ряде научных работ предпринимаются попытки использования ряда производственных факторов, отраженных в налоговых декларациях в виде уравнений регрессии. Однако, такой подход некорректен в силу того, что на­ логовые данные сильно зашумлены вплоть до сознательного их искажения.

Поэтому предпосылки классического метода наименьших квадратов нару­ шаются. В этом направлении более перспективно применение нейросетевых интеллектуальных информационных технологий и методов нечетких мно­ жеств.

Акцент в исследовании сделан на вопросы налогового контроля и пла­ нирования, поскольку эта область наименее исследована в аспекте разработ­ ки систем поддержки принятия решений и применения математических ме­ тодов вследствие сложных условий моделирования.

В работе Д. Г. Черника предложена модель сравнения декларирован­ ных и расчетных значений выходной величины для отбора налогоплатель­ щиков для выездных проверок, построенная на комбинации уравнения рег­ рессии с логит-пробит анализом и реализованная на модельном примере с искусственно введенными зашумлениями, т. е. строится имитационная мо­ дель. В реальную практику указанная модель не внедрена.

Коллективная монография под редакцией А. Н. Романова посвящена вопросам планирования выездных налоговых проверок на основе модели не­ параметрического сглаживания, которую можно рассматривать как альтер­ нативную компьютерную технологию налогового контроля по отношению к разработанной в диссертации. Вопросы моделирования задач налогового планирования и регулирования в ней не рассматривались. Анализ работ оте­ чественных и зарубежных авторов в области подсистем НА определил круг научных и практических задач, решение которых обеспечит эффективность управления процессом НА за счет применения интеллектуальных экспертных систем с представлением знаний с помощью НСМ, на основе байесовского ансамбля регуляризированных нейросетей.

Во второй главе разрабатывается подход к поддержке принятия реше­ ний по НА. Разработана когнитивная мультиагентная модель (карта) финан­ совых и информационных потоков в бюджетно-налоговой системе регио­ нального и муниципального уровней (рисунок 1) в целях системного видения процессов в системе НА. Это позволило декомпозировать общую задачу НА на подзадачи для каждой подсистемы (агента).

* Модернизация налогового контроля (модели и методы): монография / Под ред. А. Н. Романова.

М.: ИНФРА-М: Вузовский учебник, 2010. XI. 320 с.

Государство система НАЛОГОВОГО АДМИНИСТРИРОВАНИЯ РЕГИОНАЛЬНОГО И МУНИЦИПАЛЬНОГО УРОВНЯ./ 2.НАЛОГОПЛАТЕЛЬЩИКИ фи н а н с о в ые пот ок и у п р а в л я юще е в оз дейс т в ие пот ок и и н фо р ма ц и и Рисунок 1 - Когнитивная мультиагентная модель (карта) финансовых и ин­ формационных потоков в бюджетно-налоговой системе регионального и му­ ниципального уровней Рассмотрена схема взаимодействия компонентов системы НА (рису­ нок 2), где определено место разрабатываемой экспертной системы поддерж­ ки принятия решений в системе НА. Основным модулем разрабатываемой экспертной системы являются механизм поиска решений на основе предло­ женных в диссертационной работе методов.

Налоговое администрирование Эксперт X Инженер по знаниям Законодательство ЛПР Подсистема общения Информация от внешних Подсистема принятия источников Подсистема гашений накопления БД знаний Подсистема объяснения ЭС / Рисунок 2 - Схема взаимодействия компонентов системы НА с использова­ нием информационных технологий Во второй главе также разработаны подходы к построению эффек­ тивных, устойчивых и адекватных ГНСМ на основе общесистемных законо­ мерностей.

В подсистемах НА можно выделить в НСМ общее «ядро» в виде вос­ станавливаемой параметрической «обобщенной производственной функции» Y(X,W), где X - вектор входных факторов, W — совокупность оцениваемых параметров (в нейросети - это матрица синаптических весов). Моделирова­ ние такого «ядра» позволяет разработать общую методологию моделирова­ ния в нейросетевом базисе для подсистем НА в виде совокупности методов и алгоритмов.

В предварительных исследованиях был проведен модельный вычис­ лительный эксперимент, который показал, что при повышении некоторого критического значения интенсивности шумов и их объема НСМ теряет ус­ тойчивость. Это обосновывает необходимость предобработки данных и регу­ ляризации (сужения класса допустимых решений) НСМ, что обеспечивает повышение достоверности оценок с помощью НСМ в тяжелых условиях мо­ делирования.

Разработана концепция регуляризации НСМ на основе байесовского ансамбля нейросетей, которая дает возможность парировать дисфункции структурируемой системы в НСМ восстановления многомерных нелинейных зависимостей, скрытых в данных.

Концепция о необходимости взаимосвязного управления информатив­ ностью данных и качеством их аппроксимации в НСМ. Оценку условного математического ожидания Y(X,W) при восстановлении многомерной нели­ нейной зависимости, скрытой в исходных данных,/) = {<х,,у, >},i = l,N с по­ мощью нейросетевого отображения целесообразно выполнять, используя не одну НСМ, а байесовский ансамбль из нескольких нейросетей {h4(X,W)}, где hq-K априорная гипотеза о порождении эмпирических данных. При этом все априорные гипотезы-нейросети {hq(X,W)} принадлежат к одной метагипотезе (классу Н). После построения гипотез-нейросетей производится их фильтра­ ция по вероятностному критерию р* равному отношению числа «хороших» точек (с допустимой относительной ошибкой видаЗ, <,%, где - экспертно задаваемый уровень ошибки объяснения данных) к общему числу то­ чек N. В итоге априорный ансамбль гипотез {hq(X,W)} сужается, что соответ­ ствует увеличению наших знаний о моделируемом объекте. Финишная оцен­ ка производится путем осреднения на отфильтрованном байесовском ан­ самбле нейросетей.

Новым в концепции является введение критерия фильтрации р' = N* IN в отсутствии каких-либо предложений о распределении шумов, а также выявление возможности управления критериями />* посредством предпроцессорной обработки данных.

В третьей главе разрабатываются методы поддержки принятия реше­ ний в подсистемах НА, модели представления знаний и алгоритмическое обеспечение для последующей их реализации.

Разработан основной метод моделирования (МВММ), реализующий предложенную концепцию в главе 2 (рисунок 3).

Подмодель I предпроц$&горной обработки данных при заданной мвтагипогтт (пр0дреауляри$ация) (Hm^oonst) 1.1. Алгоритм априорного экспертного выборе метагилотеэы (Hm=canst), т.е.

парадигмы нейросеж её архитектуры, акгиюционных функций и алгоритма обучения I.2 Итерационный квазиоотимальный алгоритм «дообучения экспертов» при выборе состава переменных и проверка условия [{Ф'^Ф^ЩФ^^ттФ}}? 1.3, Алгоритм нормировки и фильтрации переменных по их статистической значимости по критерию Стырдента 1.4 Алгоритм удаления изданных противоречивых вектор-строк {примеров) наблюдений по критерию Липшица L I.S. Алгоритм оптимальней итерационной кластеризации данных с использованием последовательности {MGCMd}. Проверка условия; а д ^ Ф * -ггтФ)}? 1.6. Алгоритм оптимальной итерационной очистки образованных кластеров данных от аномальных точек с использованием НССМ. Проверка условия:

1.7. Алгоритм «ремонта,» векторстолбцов данных в кластерах Рисунок 3 - Логическая схема МВММ Главной целью этапов 1.1-1.7. предпроцессорной обработки данных в рамках подмодели I является повышение однородности данных и улучшение их качества (информативности) в аспекте обучения нейросети. Подчинение критерия предобработки Ф = ES (где Е - ошибка обобщения; S - критерий устойчивости) во вспомогательных нейросетевых субмоделях целям качества будущего обучения рабочей НСМ в подмодели II - это и есть суть нового подхода к предобработке данных. При этом в 1.1-1.7 используется априорно выбранная экспертным способом парадигма сети, ее архитектура и вид активационных функций и тем самым фиксируется мета-гипотеза Н байесовского подхода к регуляризации нейросети.

В рамках подмодели II считается зафиксированной мета-гипотеза вы­ бранная в ПЛ. Смысл алгоритмов II.1-II.5 подмодели II состоит в том, что выбранный ансамбль априорных гипотез котором варьируются архитектура сети и вид активационных функций, после обучения и оценки его прогностических свойств - сужается (фильтруется). Согласно теории байесовского подхода, осредненные оценки на байесовском ансамбле всегда лучше оценок одной, даже лучшей нейросети ансамбля.

Необходимость взаимосвязанного управления информативностью дан­ ных и качеством их аппроксимации в нейросети для обеспечения состоятель­ ности задачи регуляризации реализуется в МВММ следующим образом. На рисунке 3 между подмоделями I и II имеются перекрестные связи. Таким об­ разом, в подмодель II регуляризации и обучения байесовского ансамбля по­ даются уже структурированные данные, что создает предпосылки хорошего качества обучения ансамбля и регуляризации всей НСМ на ансамбле. Пере­ крестная связь от II.5 к 1.1 дает возможность организации внешнего итера­ ционного цикла по оптимизации выбора мета-гипотезы Нт.

В третьей главе также проводится оценка адекватности МВММ на ос­ нове вычислительных и натурных экспериментов и сравнение с альтернатив­ ным методом. Стратегия и средства реализации этапов метода: оптимальная кластеризация выполнялась с помощью пакета ОЛИМП.СтатЭксперт; по­ строение вспомогательных инверсных НССМ в алгоритме 1.7 производи­ лось с помощью пакета NeuroSolution 5 (демо-версия); для каждого этапа предобработки данных по МВММ оценки находились усреднением по байе­ совскому ансамблю нейросетей.

На рисунке 4 представлены значения критерия Липшица по этапам предобработки данных (7 - исходная база данных; 2 - нормировка данных очищенных кластеров 1.4; 3 - оптимальная итерационная кластеризация 1.5;

4 - устранение аномальных точек в образованных кластерах 1.6; 5 - «ремонт» вектор-столбца 1.7).

Каждый этап предобработки данных вносит свой последовательный вклад в повышение однородности данных, углубляя их структурирование (кривая L(k) монотонно снижается с ростом номера этапа к). Суммарный вклад всех этапов в повышение однородности данных весьма ощутим.

Таким образом, вычисли­ тельный эксперимент подтвердил идею использования НССМ в бло­ ках 1.4—1.7.

Оценки байесовской регуля­ ризации II.1-II.6, приведены в таб­ лице 1.

Рисунок 4 - Значения критерия Лип­ шица по всем этапам алгоритма пре­ добработки данных Таблица 1 - Оценка совместных процедур предобработки данных и регуляh3 *< "б by на "сырых" данных 0.049 0.053 0.041 0.057 0.055 0.054 0.071 0.0Е ft 05.2 0.4" 0.5S. 0.363 0.856 0.720 0.520 0.460 0.540 0.65.20.5S0.026 0.019 0.035 0.040 0.020 0.020 0.039 0.037 ft 0Ф 2,Из таблицы 1 видно: процедуру фильтрации прошли 8 гипотез-нейросетей из 10 (таким образом, адекватность ГНСМ установлена с вероятностью Р*=95 %); предобработка данных совместно с байесовской регуляризацией в составе МВММ позволили более чем на порядок улучшить качество НСМ.

Для подсистем налогового контроля и планирования разработан метод синтеза оптимального плана выездных налоговых проверок на байесовском ансамбле нейросетей. Идея метода:

Q' 1) относительные отклонения S* = (^ ,,,)/б* (б*

2) налогоплательщики ранжируются по критерию отбора 1ц/g\:

g y/g=\Sg\-P(Sg>Sg)-Mg; sg=M[Sgl]+ug ( -номер предприятия; P(Sg>Sg) - веро­ ятность того, что текущее (по времени t) значение отклонения <^для g-ro на­ логоплательщика будет больше его математического ожидания, смещенного вверх на полуширину доверительного интервала ug; М[-] - оператор матема­ тического ожидания временного ряда \sgl\, который считается стационарным н процессом; м - коэффициент масштаба предприятия).

В таблице 2 представлены оптимальный план выездных проверок (со­ ставленный по критерию отбора на основе байесовского ансамбля нейросе­ тей) и величина налоговых доначислений, полученных по результатам вы­ ездных проверок (указаны первые 12 номеров предприятий согласно опти­ мальному плану и с наибольшими доначислениями).

Таблица 2 - Сравнение результатов моделирования с итогами выездных на­ логовых проверок № предприятия 11 3 22 9 14 21 8 24 2 12 30 Значение 0.20276 0.09776 0.07272 0.06346 0.04393 0.02258 0.02081 0.01875 0.01612 0.01565 0.01513 0.013№ предприятия 11 9 8 24 21 22 16 10 13 3 14 Доначисления, руб. 7002076 3140252 2780893 1911636 1700531 1520399 1427865 1384382 1371761 1366995 1041774 8396Для теоретической оценки адекватности НСМ предложен специаль­ ный двухступенчатый метод:

I шаг. Оценка адекватности (ее механизм) скрыта в самом алгоритме регуляризации. То есть, в процедуре фильтрации по апостериорному крите­ рию Р* и последующему осреднению всех расчетных характеристик на от­ фильтрованном ансамбле нейросетей.

II шаг. Обоснование адекватности по финишным характеристикам, полученным с помощью НСМ. То есть, сравниваются синтезированные оп­ тимальные планы выездных налоговых проверок, полученные на каждой нейросети из отфильтрованного ансамбля. Совпадение этих планов с опреде­ ленной требуемой вероятностью и служат гарантией оценки адекватности модели.

Независимым подтверждением адекватности ГНСМ служат резуль­ таты сравнения полученного на ее основе плана отбора налогоплательщи­ ков для 17 проверяющих бригад с планом отбора, полученным по альтер­ нативной модифицированной непараметрической модели (И. И. Голичев).

В таблице 3 приведены коды налогоплательщиков, включенных в планы отбора по обеим моделям.

Таблица 3 - Сравнение ПICM с альтернативной моделью гнем 43 66 68 27 40 18 71 52 46 57 11 73 • Модифицированная непараметрическая 60 35 11 26 43 18 40 73 68 27 71 46 25 66 модель • Из таблицы 3 следует, что по каждой модели совпадают 12 объектов на­ логового контроля из 17 (совпадения обозначены цветом), т. е. модели взаим­ но подтверждают друг друга на 71 %. Таким образом, рассмотренная модель может быть использована как модуль экспертной системы подсистемы налого­ вого планирования.

Для подсистемы налогового регулирования предлагается методика, ос­ нованная на общесистемном законе декомпозиции-агрегировании. Методика о введения групповой оценки финансово-экономического состояния налого­ плательщиков и индивидуальной (углубленной) оценки крупных и проблем­ ных налогоплательщиков. Это позволяет повысить оперативность и понизить затратность разработок управленческих решений.

Предлагается декомпозировать задачу оценки финансово-экономи­ ческого состояния налогоплательщиков на две подзадачи:

I. Групповой оценки в виде кластеризации объектов (внутри образуемых кластеров предприятия считаются приближенно однородными в аспекте их кредитоспособности).

II. Индивидуального углубленного анализа по итогам кластеризации не­ которых предприятий, либо предприятий, выбираемых из кластеров экспертно.

Методика реализуется с помощью гибридного метода оценки кредито­ способности для разработки модели поддержки принятия решений по нало­ говому регулированию с использованием нечетких правил вывода. Алгоритм метода состоит из двух этапов: 1) оценка прогнозных значений основных эк­ зогенных (объясняющих) переменных с помощью НСМ одномерных времен­ ных рядов; 2) применение правила нечеткого вывода с использованием не­ четкой пенташкалы.

В таблице 4 приведен фрагмент интервального анализа попадания од­ ного из предприятий образованных кластеров в диапазон значений финансо­ вых показателей, соответствующих каждому из уровней финансового со­ стояния предприятия, определенных экспертно (интервалы попадания выде­ лены цветом). Как видно из таблицы 4 предприятие принадлежит к классу низкого риска банкротства, что подтверждается экспертами.

Таблица 4 - Значения экономических показателей по группам уровня риска Группа уровня Р1 F1 F2 F3 Fриска Очень высокий риск 0,1-0,4 2,70-2,50 0,25-0,31 -2,00...-1,66 1,60-1,Высокий риск 0,4-0,8 2,50-1,70 0,31-0,54 -1,66...-0,33 1,51-1,Средний риск 0,8-1,5 1,70-1,17 0,54-0,83 -0,33...0,92 1,18-0,Низкий риск 1 1 5-2 1,17-0,Очень низкий риск 2,4-2,0,93-0,95 1,84-3,50 0,56-0,В четвертой главе рассмотрена реализация модулей экспертной сис­ темы НА с помощью прикладных ГНСМ подсистем НА, которые служат ос­ новой для поддержки принятия управленческих решений.

Модули экспертной системы реализованы с помощью нейросетевого аналитического программного продукта BrainMaker Pro 3.11 и NeuroSolution 5, статистического пакета СтатЭксперт {ОЛИМП).

Вычислительные эксперименты показали, что предлагаемые модули экспертной системы по принятию решений в подсистемах НА работоспособ­ ны и могут функционировать в сложных специфических условиях, что по­ зволяет использовать ее в качестве аналитического блока программного ком­ плекса ЭОД.

В работе разработана структурно-функциональная схема информаци­ онно-аналитической системы поддержки принятия решений по НА (рису­ нок 5). В ней наименьший структурный элемент - налоговая декларация, со­ держащая весь набор компонентов вектора X и взаимно однозначно соответ­ ствующие этим переменным значения выходной случайной величины Y.

эод эснп эенр ^СНК эснп эенр ^СНК дав Рисунок 5 - Структурно-функциональная схема информационноаналитической системы поддержки принятия решений в СНА В заключении подводятся основные итоги выполнения исследований в аспекте логической взаимосвязи и завершенности всех задач, рассмотрен­ ных в работе.

В приложениях приводятся данные, использованные для построения ГНСМ в рамках экспертной системы НА.

ОСНОВНЫЕ ВЫВОДЫ И РЕЗУЛЬТАТЫ В диссертационной работе содержится новое решение научной зада­ чи разработки поддержки принятия решений в НА. В ходе исследований по­ лучены следующие результаты:

1. Предложен подход к поддержке принятия решений в НА на основе технологии экспертных систем и технологии накоплении и представления знаний в виде НСМ.

2. Предложена концепция о необходимости взаимосвязанного управле­ ния информативностью данных и качеством аппроксимации в НСМ на байе­ совском ансамбле нейросетей в условиях отсутствия априорных сведений о шумах в данных.

3. Разработан МВММ для построения обобщенных моделей восстанов­ ления многофакторных зависимостей, скрытых в данных, реализующий концепцию по пункту 2.

4. Разработан метод синтеза оптимального плана выездных проверок на основе байесовского ансамбля НСМ.

5. Разработан гибридный метод оценки кредитоспособности предпри­ ятий-налогоплательщиков.

В ходе исследования эффективности поддержки принятия решений в технологии НА показана работоспособность и эффективность предложенных концепций, методов и алгоритмов. Разработанный МВММ, алгоритмы и выдвинутые идеи, положенные в их основу, первоначально не были очевидны, поэтому уделено особое внимание проверке каждой идеи на широких сериях вычислительных экспериментов. Рассмотрены вопросы, связанные с при­ кладными моделями. Предложения по принятию решений в системе НА по­ зволяют организовать аналитический блок, встраиваемый в программный комплекс ЭОД местного уровня, что позволит усовершенствовать техноло­ гию НА.

СПИСОК ПУБЛИКАЦИЙ В рецензируемых журналах из списка ВАК:

1. Регуляризация нейросетевых математических моделей: константа Липшица обучающей выборки. Обозрение прикладной и промышленной ма­ тематики / С. А. Горбатков, С. А. Фархиева // Обозрение прикладной и про­ мышленной математики. Девятый Всероссийский симпозиум по прикладной и промышленной математике. М.: Редакция журнала «ОПиПМ», 2008. Т. 15, вып. 6. С. 1062-1063.

2. Метод вложенных математических моделей для регуляризации нейро­ сетевых задач финансового контроля / С. А. Горбатков, С. А. Фархиева, М. В. Коротнева, А. А. Чапкович // Обозрение прикладной и промышленной математики. Десятый Всероссийский симпозиум по прикладной и промыш­ ленной математики. М.: Редакция журнала «ОПиПМ», 2009. Т. 16, вып. 6.

С. 1050-1051.

3. Регуляризация по Тихонову нейросетевых моделей финансового кон­ троля / С. А. Горбатков, С. А. Фархиева // Вестник Ижевского государствен­ ного технического университета. 2009. № 4 (44). С. 62-65.

4. Об одном подходе к принятию решений в налоговом администрировании на основе нейросетевых моделей с байесовской регуляризацией / С. А. Фар­ хиева // Управление экономическими системами: электронный научный жур­ нал. 2012. № 4 (40). 13 с. Per. № 0421200034. (Режим доступа: http://www.

uecs.ru/index.php?option=com_flexicontent&view=items&id=1217) В монографии:

5. Нейросетевое математическое моделирование в задачах ранжирования и кластеризации в бюджетно-налоговой системе регионального и муници­ пального уровней: монография / С. А. Горбатков, Д. В. Полупанов, А. М. Солнцев, С. А. Фархиева, И. И. Белолипцев, М. В. Коротнева, О. Б. Рашитова. Уфа: РИЦ БашГУ, 2011. 224 с.

В других изданиях:

6. Об одном алгоритме предобработки сильнозашумленных данных при построении нейросетевой модели налогового контроля / С. А. Горбатков, Д. В. Полупанов, С. А. Фархиева // Научная сессия МИФИ-2006. 8-я Всеросс.

науч.-техн. конф. «Нейроинформатика-2006»: сб. науч. тр. М.: МИФИ, 2006.

Ч. 3. С. 104-112.

7. Регуляризация нейросетевых математических моделей налогового кон­ троля на основе идеи вложенных математических моделей / С. А. Горбатков, С. А. Фархиева // Научная сессия МИФИ-2007. 9-я Всеросс. науч.-техн. конф.

«Нейроинформатика-2007»: сб. науч. тр. М: МИФИ, 2007. Ч. 3. С. 172-177.

8. Об одном алгоритме предобработки сильнозашумленных входных дан­ ных в аспекте обеспечения состоятельности задачи регуляризации для нейро­ сетевых моделей / С. А. Горбатков, Г. А. Бесхлебнова, С. А. Фархиева // На­ учная сессия МИФИ-2009. 11-я Всеросс. науч.-техн. конф. «Нейроинформатика-2009»: сб. науч. тр. М.: МИФИ, 2009. Ч. 3. С. 18-26.

9. Обобщение метода вложенных математических моделей на основе бай­ есовского подхода к регуляризации задач нейросетевого моделирования на­ логового и финансового контроля / С. А. Горбатков, Д. В. Полупанов, С. А. Фархиева // Научная сессия НИЯУ МИФИ-2010. 12-я Всеросс. науч.техн. конф. «Нейроинформатика-2010»: сб. науч. тр. М.: НИЯУ МИФИ, 2010. Ч. 2. С. 228-237.

10. Свид. о per. электронного ресурса № 16403. Алгоритм структурирова­ ния данных с использованием вспомогательных нейросетевых субмоделей и построение рабочей нейросетевой модели с байесовской регуляризацией / С. А. Горбатков, С. А. Фархиева. Зарег. в ОФЭРНиО ИНИМ РАО 22.11.2010.

(Номер гос. регистрации в Национальном информационном фонде неопуб­ ликованных документов: 50201050147).

11. Приближенный метод байесовской регуляризации и двухступенчатая оценка адекватности гибридной нейросетевой модели налогового контроля / С. А. Горбатков, И. И. Белолипцев, С. А. Фархиева // 13-я Всеросс. науч.техн. конф. «Нейроинформатика-2011»: сб. науч. тр. М.: НИЯУ МИФИ, 2011.

Ч. 2. С. 144-154.

12. Восстановление многомерных функциональных зависимостей с помо­ щью нейросетевых моделей в задачах налогового администрирования / С. А. Фархиева // Научная перспектива: науч.-аналит. журнал. Уфа: Инфинити, 2011. № 1.С. 27-29.

13. Приближенный метод байесовской регуляризации нейросетевой моде­ ли налогового контроля / С. А. Фархиева // Альманах современной науки и образования. Тамбов: Грамота, 2011. № 1 (44). С. 171-173.

14. Об одном методе оценки кредитоспособности российских предпри­ ятий / С. А. Фархиева // Социальная ответственность бизнеса: теория, мето­ дология, практика: матер. II Всеросс. науч.-практ. конф., 21 ноября 2011 г., ВЗФЭИ. Уфа: Мир печати, 2011. С. 278-282.

15. Оценка эффективности алгоритмов предрегуляризации и байесовской регуляризации нейросетей для камеральной налоговой проверки / С. А. Горбатков, И. И. Белолипцев, С. А. Фархиева, Д. В. Полупанов // Науч­ ная сессия НИЯУ МИФИ-2012. 14-я Всеросс. науч.-техн. конф. «Нейроин­ форматика-2012»: сб. науч. тр. М.: НИЯУ МИФИ, 2012. Ч. 3. С. 38^8.

Диссертант С. А. Фархиева




© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.