WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

На правах рукописи

Жилина Елена Викторовна

МОДЕЛИ, МЕТОДЫ И ИНСТРУМЕНТАЛЬНЫЕ СРЕДСТВА ОЦЕНКИ ПОТРЕБИТЕЛЬСКОГО КАЧЕСТВА ТЕСТОВЫХ СИСТЕМ В ОБРАЗОВАНИИ

Специальность 08.00.13 – математические и инструментальные методы экономики

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата экономических наук

Ростов-на-Дону – 2012

Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Ростовский государственный экономический университет (РИНХ)».

Научный консультант: доктор экономических наук, профессор Ефимов Евгений Николаевич

Официальные оппоненты:

Долятовский Валерий Анастасиевич доктор экономических наук, профессор, заслуженный деятель науки Российской Федерации, ФГБОУ ВПО «Ростовский государственный экономический университет (РИНХ)», профессор кафедры менеджмента Карелин Владимир Петрович доктор технических наук, профессор, НОУ ВПО «Таганрогский институт управления и экономики», профессор кафедры управления и информационных систем

Ведущая организация:

ФГБОУ ВПО «Ростовский государственный университет путей сообщений»

Защита диссертации состоится «23» мая 2012 г. в 14:00 часов, на заседании диссертационного совета ДМ 212.209.03 в ФГБОУ ВПО «РГЭУ (РИНХ)» по адресу: 344002, г. Ростов-на-Дону, ул. Б. Садовая 69, ауд. 302.

С диссертацией можно ознакомиться в научной библиотеке ФГБОУ ВПО «РГЭУ (РИНХ)» по адресу: 344002, г. Ростов-на-Дону, ул. Б. Садовая, 69.

Электронная версия автореферата размещена на официальном сайте ВАК Минобрнауки России: http://vak2.ed.gov.ru, а также на сайте ФГБОУ ВПО «РГЭУ (РИНХ)» www.rsue.ru.

Автореферат разослан «20» апреля 2012 г.

Ученый секретарь диссертационного совета И.Ю. Шполянская

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. Отказ от устоявшихся и введение новых технологий (тестирование при приеме в вузы вместо традиционных экзаменов, балльно-рейтинговая система оценивания, обучение в виртуальной среде и т.д.) выводит проблему качества образования в ряд приоритетных государственных и общественных проблем.

В настоящее время в российской системе высшего образования большинство вузов в своей деятельности обращается к автоматизированным системам тестирования не только в процессе текущего и итогового контроля знаний студентов, но и в качестве механизма оценки уровня образования выпускников.

Тестовые системы в образовании обеспечивают: накопление информации о процессе тестирования каждого испытуемого (учет времени тестирования, статистику результатов, рейтинг и др.); большой объем банка заданий, распределенных по уровням сложности; расчет статистических характеристик и показателей надежности функционирования тестовых заданий; динамическую оценку знаний испытуемого при любой системе оценивания; уменьшение доли субъективизма при оценке результатов освоения дисциплины испытуемым и др.

Важным является тот факт, что с точки зрения пользователя системы тестирования, аналогичные по своему назначению и выполняемым функциям, имеют разную стоимость, обладают разными возможностями. В сложившейся ситуации необходимо адекватно оценивать потребительское качество тестовых систем, степень ее соответствия требованиям пользователя.

Это обусловило необходимость проведения анализа информационных процессов, разработки моделей и методов, обеспечивающих потребительское качество систем тестирования в образовании.

Степень разработанности проблемы. Проблемы оценки качества информационных систем (ИС) рассматриваются в трудах ученых Т.П.Барановской, В.В.Дика, А.И.Долженко, Е.Н.Ефимова, В.В.Липаева, Г.А.Титоренко, Е.Н.Тищенко, Г.Н.Хубаева, И.Ю.Шполянской и др.

Общетеоретические, методологические и практические вопросы по проблемам качества образовательной системы Российской Федерации исследуются в трудах С.В.Арженовского, Г.В.Гореловой, В.А.Долятовского, Л.В.Зайцевой, А.Н.Ткачева и др.

Вопросам проведения тестирования, контроля и оценки знаний посвящены работы В.С.Аванесова, В.И.Васильева, Д.Вейса, К.Х.Калугян, П.И.Канивца, Дж.Раша, Т.Н.Тягуновой, М.Б.Челышковой и др.

Вопросы моделирования информационных процессов с использованием языка UML освещены в работах Д. Рамбо, А. Боггса, Г. Буча, А.М.Вендрова, Т.Кватрани, А.В.Леоненкова, Г.Н.Хубаева, И.Ю.Шполянской, С.М.Щербакова, А.Якобсона и др.

Однако до настоящего времени не существует комплексных теоретических и практических разработок, посвященных проблемам оценки потребительского качества образовательных систем. Не упоминается о разработках и использовании моделей, методов и инструментальных средств адаптивного тестирования, а приводится лишь теоретическое обоснование необходимости его использования в образовании. Большинство применяемых в учебных заведениях квалификационных тестов таковыми не являются. Не выполняется обязательная проверка качества теста, не проводится определение их трудности. Данные обстоятельства обусловили выбор темы диссертационного исследования, определили его цели, задачи и структуру.

Объект и предмет исследования. Объектом исследования являются образовательные учреждения всех организационно-правовых форм. Предметом исследования выступают социально-экономические процессы и явления сферы образования.

Цель диссертационного исследования. Целью диссертационного исследования является разработка методического и инструментального обеспечения для оценки потребительского качества систем тестирования в образовании.

Для достижения поставленной цели потребовалось решить следующие задачи:

разработать экономико-математические модели, позволяющие оценить потребительское качество тестовых заданий (вопросов);

разработать модели формирования индивидуальных итоговых оценок знаний испытуемых, алгоритмы, уменьшающие время проведения адаптивного тестирования, и инструментарий их реализации;

- выполнить оценку функциональной полноты существующих образовательных систем тестирования;

разработать комплекс моделей информационной системы адаптивного тестирования (в нотации унифицированного языка моделирования – UML), который позволит отразить рациональную структуру и функции информационной системы, снизить затраты на ее разработку, модернизацию и модификацию.

Теоретическую и методологическую основу исследования составили труды российских и зарубежных ученых, посвященные исследованию проблем потребительского качества информационных систем и технологий, вопросам системного анализа, методам математической статистики, теории вероятностей и теории нечетких множеств. Диссертационное исследование базируется на современных работах, посвященных методам структурного и объектноориентированного анализа и моделирования информационных систем, материалах конференций, статьях в сборниках научных трудов и в периодической печати, информационных материалах, опубликованных в Интернете.

Эмпирическую базу исследования составили результаты исследований автора, собранные в ходе активных и пассивных экспериментов.

Инструментально-методический аппарат исследования составили методы системного анализа, математической статистики, теории вероятности, теории нечетких множеств, унифицированный язык моделирования UML, современное программное обеспечение общего и специального назначения: AllFusion Process Modeler r7, AllFusion Erwin Data Modeler r7, IBM Rational Rose (в том числе инструменты Data Modeler, Web Modeler), STATISTICA 6.0, Fuzzy Logic Toolbox средства MATLAB 7.11.0, программа «Анализ функциональной полноты ИС», разработанная в ФГБОУ ВПО «РГЭУ (РИНХ)», программа «ModExTest», разработанная автором в среде Visual Basic 6.0.

Работа выполнена в рамках паспорта специальности 08.00.13 – «Математические и инструментальные методы экономики» п.2.6 «Развитие теоретических основ, методологии и инструментария проектирования, разработки и сопровождения информационных систем субъектов экономической деятельности:

методы формализованного представления предметной области, программные средства, базы данных, корпоративные хранилища данных, базы знаний, коммуникационные технологии».

Нормативно-правовая база исследования основана на законодательных и нормативных актах, постановлениях, федеральных государственных стандартах Минобрнауки России.

Рабочая гипотеза заключается в следующем: для эффективной организации деятельности образовательного учреждения при контроле знаний обучаемых необходимы компьютерные системы тестирования, удовлетворяющие требованиям пользователей. Создание и использование моделей, методов и инструментальных средств позволит оценить потребительское качество систем тестирования и минимизировать издержки при их реализации.

Положения, выносимые на защиту:

1. Инструментальное средство для оценки применимости моделей тестирования, учитывающее время прохождения теста, количество вопросов в тесте, уровень сложности тестовых заданий, количество правильных ответов и ошибок испытуемого, вероятность соответствия оценки на каждом уровне знания.

2. Методика оценки вероятности получения качественного тестового задания, определяющая влияние положительных (отрицательных) ответов испытуемых, распределенных по соответствующим уровням знаний, на тестовые задания.

3. Методика оценки уровня обученности и успешности освоения дисциплины студентом при тестировании в рамках накопительной балльно-рейтинговой системы для представления шкалы оценок в естественно-языковых категориях.

4. Результаты сравнительной оценки потребительского качества тестовых систем по критерию функциональной полноты.

5. Построенные визуальные модели информационной системы адаптивного тестирования, функционирующей в Интернет-среде, в нотации UML.

Научная новизна диссертационного исследования заключается в разработке методических и практических основ обеспечения потребительского качества систем тестирования, применяемых в образовательной деятельности вуза.

Основные результаты, содержащие элементы научной новизны, состоят в следующем:

1. Разработано инструментальное средство для оценки применимости комплекса моделей тестирования, отличающееся возможностью выдачи тестовых заданий как случайным образом, так и с учетом адаптации, когда последующее задание отличается от предыдущего коэффициентом «трудности», учитывающее время прохождения теста, количество вопросов в тесте, уровень сложности тестовых заданий, контрольные точки тестирования, количество правильных ответов, случайных ответов и ошибок испытуемого (на основе модели бинарной логистической регрессии), вероятность соответствия оценки (на основе байесовского подхода) на каждом уровне знания, что позволяет существенно снизить затраты на оценку характеристик потребительского качества тестовых систем.

2. Разработана методика оценки вероятности получения требуемого тестового задания на основе модели бинарной логистической регрессии, отличающаяся возможностью использования результатов тестирования группы испытуемых, и позволяющая определить влияние положительных (отрицательных) ответов испытуемых, распределенных по соответствующим уровням знаний, на тестовые задания, выявить динамику изменения их категории («качественное», «некачественное») и повысить потребительское качество тестовых систем.

3. Разработана методика оценки уровня обученности и успешности освоения дисциплины студентом при тестировании в рамках накопительной балльнорейтинговой системы на основе теории нечетких множеств, позволяющая динамически оценивать знания студента, отличающаяся возможностью представления шкалы оценок в естественно-языковых категориях.

4. Выполнена сравнительная оценка потребительского качества существующих классов тестовых систем (дистрибутивные тестовые системы, вебсистемы тестирования и модули тестирования в образовательных системах) с использованием метода анализа функциональной полноты систем1, позволившая количественно оценить степень подобия рассматриваемых системам, степень соответствия той или иной структуры «эталонной» модели информационной системы, учитывающей требования пользователя к информационнообразовательной среде. Результаты анализа помогли выделить группы однородных информационных систем со сходным набором функций, что позволяет сравнивать их между собой, сопоставляя другие характеристики (цена, производительность, надежность и др.), предоставляя пользователям возможность сделать обоснованный выбор.

5. Разработаны визуальные модели в нотации UML информационной системы, отличающиеся описанием процессов адаптивного тестирования. Модели описывают функциональное назначение системы, содержат информационные и образовательные процессы тестирования, отображают структуру объектов и связей в системе в виде модели базы данных и программных компонентов, функционирующих в Интернет-среде, что позволяет существенно снизить затраты на разработку, модернизацию, модификацию и настройку программной системы.

Теоретическая и практическая значимость исследования. Теоретическая значимость результатов диссертационной работы состоит в создании методического обеспечения для оценки потребительского качества систем тестирования.

Практическая значимость диссертационной работы заключается в разработке инструментального средства для реализации комплекса экономико-математических моделей, позволяющего снизить затраты на оценку характеристик потребительского качества тестовых систем. Разработанные UML-модели дают представление о структуре и динамике ИС, что позволяет разработчикам программного обеспечения реализовать решения по созданию системы тестирования для любого образовательного учреждения, а использование объектно-ориентированных технологий на всех стадиях разработки ИС позволяет осуществить ее программную реализацию и адаптацию с минимальными затратами.

Предложенные автором методы, модели и программный инструментарий позволят образовательным учреждениям повысить потребительское качество разрабатываемых систем тестирования, в том числе использующих веб-технологии, сократить временные и финансовые затраты на проектирование.

Апробация работы Теоретические положения и практические рекомендации, сформулированные в диссертационном исследовании, нашли отражение в научноисследовательских работах кафедры «Информационные технологии и защита информации» РГЭУ (РИНХ), докладывались автором на научно-практических конференциях: «Экономико-организационные проблемы проектирования и применения информационных систем: материалы Х междунар. науч.-практич.

конф.» (г.Кисловодск, декабрь, 2008 г.); «Экономические информационные системы и их безопасность: разработка, применение и сопровождение: материалы регион.

науч.-практич. конф.» (п.Архыз, октябрь, 2009 г.); «Современные достижения в науке и образовании: математика и информатика: материалы междунар. науч.практич. конф.» (г.Архангельск, февраль, 2010 г.), «Тенденции развития научных Хубаев, Г.Н. Сравнение сложных программных систем по критерию функциональной полноты //Программные продукты и системы (Soft&System). – 1989. - №2. - C.6-9.

исследований (Тенденції розвитку наукових досліджень)» (г.Киев, февраль, 2011 г.), «Zprvy vdeck ideje – 2011: materily VII mezinrodn vdecko - praktick konference» (г.Прага, октябрь, 2011 г.) и другие.

Отдельные результаты диссертационной работы были использованы в исследованиях по внутривузовскому гранту: Интерактивный инструментарий анализа качества и эффективности применения тестов в учебном процессе РГЭУ «РИНХ» (№ 2/07-вн, 2007 г.).

На основании результатов исследования создан программный продукт «Моделирование экспериментов тестирования ModExTest», зарегистрированный в РОСПАТЕНТе, № 2012612347.

Результаты диссертационной работы нашли применение в учебнометодическом отделе ФГБОУ ВПО «Ростовский государственный экономический университет (РИНХ)» в рамках накопительной балльно-рейтинговой системы и внедрены в учебный процесс; приняты к использованию в НОУ ВПО «Ростовский международный институт экономики и управления» и др.

Публикации. Основные результаты диссертации отражены в опубликованных научных работах, в том числе 4 – в изданиях, рекомендованных ВАК России. Общий объем публикаций по теме 8,25 п.л, из них авторских 6,65 п.л.

Структура и объем диссертации Диссертационная работа состоит из введения, четырех глав, заключения, библиографического списка, содержащего 159 литературных источника, и приложений.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность рассматриваемой проблемы, формулируются цель и задачи диссертационного исследования, определяются его объект и предмет, рассматриваются теоретические и методические основы исследования, выделяются научная новизна, теоретическая и практическая значимость работы, описывается структура диссертационной работы.

В главе 1 «Проблемы оценки потребительского качества компьютерных систем тестирования в образовании» рассмотрено понятие «качество высшего образования1», неотъемлемой частью которого являются результаты деятельности вуза (в том числе, текущие и итоговые оценки студентов, полученные в процессе тестирования).

Общий подход к оценке потребительского качества компьютерной тестовой системы (КТС) базируется на представлении о том, что тестовая оболочка рассматривается как информационная система (ИС). В рамках проведенного исследования было проанализировано более 90 КТС, анализ которых позволил выделить более 100 пользовательских функций. Для анализа информационных процессов2 КТС применялось CASE-средство AllFusion Process Modeler 7.0 (BPwin), с помощью которого была создана функциональная модель ИС тестирования.

Качество высшего образования - это сбалансированное соответствие всех аспектов высшего образования некоторым целям, потребностям, требованиям, нормам и стандартам [ГОСТ Р ИСО 9000-2001.

Системы менеджмента качества. Основные положения и словарь. - М.: ИПК Издательство стандартов, 2001].

Информационный процесс (в экономике) – процессы накопления, обработки и распространения экономической информации в целях принятия решений в экономике, разделенных на три вида по назначению информации: 1) обеспечивающие выбор и формирование целей управляемого объекта; 2) предназначенные для разработки программы действий, т.е. методов, и определения средств достижения целей; 3) обеспечивающие нормальное протекание управляемого процесса по заданной программе [Лопатников, Л.И.

Экономико-математический словарь: словарь современной экономической науки. – М., 2003].

Работа адаптивной системы основана на изменении ее параметров и структуры. Создание КТС с элементами адаптации может повысить эффективность процесса тестирования и оценки уровня знаний испытуемых за счет уменьшения объема и времени тестирования, а также увеличения точности оценки уровня знаний.

Анализ литературных источников и обзор КТС позволил выделить группу функций адаптивного тестирования (24), приведенных в табл. 1:

Таблица Функции адаптивного тестирования Функция Характеристика I. Функции адаптации процесса тестирования:

FА1 установка диапазона количества вопросов в тесте;

FА2 установка/выбор отправной точки – тестируемому устанавливается уровень знаний, определенный в предыдущих испытаниях;

FА3 обратная связь – отбор заданий строится, когда при правильном ответе тестируемого очередное задание выбирается более трудным, а неверный ответ влечет за собой предъявление последующего более легкого задания;

FА4 получение уникального варианта прохождения теста;

FА5 установка контрольных точек тестирования – промежуточный контроль, осуществляемый через установленное количество вопросов;

FА6 установка критерия завершения – когда точность оценки достигает статистически приемлемого уровня, или выдано максимальное число вопросов, или когда тестируемый выходит на некоторый постоянный уровень сложности;

FА7 расчет вероятностей соответствия уровня знания тестируемого той или иной оценке;

FА8 определение уровня обученности тестируемого;

………..

II. Функции адаптации Банка заданий:

FА19 формирование Банка заданий – формируется на основе функций «Объединение вопросов в темы» и «Калибрование вопросов в баллах» (группа «Создание и редактирование тестов»);

FА20 ассигнование времени (распределение) – каждому вопросу можно устанавливать время на ответ, регулируя при этом его уровень сложности;

………..

В главе 2 «Экономико-математические модели процесса адаптации в тестовых системах» была исследована возможность применения комплекса моделей и алгоритмов адаптивного тестирования для оценки знаний испытуемого на основе авторской компьютерной программы «ModExTest».

На основе анализа литературы, используя эвристический подход, была разработана базовая модель адаптивного тестирования. Рассмотрим модель в общем виде: U1=, (1) где Q – количество вопросов в тесте; USCAT – уровень сложности вопроса;

USCAT0 – первоначальный уровень сложности; OTVi – i-ый ответ, i [1..Q]; koef – коэффициент за правильность; VOTVi – i-ый возможный (правильный) ответ, i[1..Q]; R1 – результат тестирования.

Алгоритм реализации базовой модели заключается в следующем:

1) при инициализации процесса тестирования находим уровень сложности первого вопроса: USCAT USCAT0, USCAT0 1;2;3; (2) 2) при последующем тестировании уровень сложности вопросов изменяется в зависимости от варианта тестирования: USCAT 1;2;3; I вариант (3) если ответ положительный и USCAT USCAT 1, если ответ отрицательный и USCAT 1;3;

II вариант (4) USCAT USCAT 1, USCAT.

3) вычисляем коэффициент за правильность:

a, если USCAT 1 или USCAT b, если USCAT0 2 или USCAT1;

при a

c, иначе;

1 koef, если дан верный ответ, 4) получаем i-ответ: (6) OTVi 0, иначе;

5) вычисляем i-ый возможный (правильный) ответ: VOTVi 1 koef ; (7) Q Q 6) находим результат тестирования:. (8) R1 / OTVi VOTVi i1 iРезультаты экспериментов базовой модели адаптивного тестирования доказали ее применимость для оценки знаний испытуемого; практически к 35-40ому тестовому вопросу могут быть сделаны итоговые выводы.

Далее была получена модифицированная базовая модель, общий вид которой выглядит так: U2=, (9) где Q – количество вопросов в тесте; USCAT – уровень сложности вопроса;

USCAT0 – первоначальный уровень сложности; OTVi – i-ый ответ, i [1..Q]; RLi – балл за i-ый ответ на L-ом уровне знания; RL0 – первоначальный балл L-ого уровня знания, задаваемый экспериментально; RL – результат на L-ом уровне знания; R2 – результат тестирования.

Алгоритм реализации модифицированной базовой модели заключается в следующем:

1) и 2) аналогично предыдущему алгоритму;

1, если дан верный ответ, 3) получаем i-ответ: (10) OTVi 0, иначе;

3) задаем экспериментально значения первоначального балла L-ого уровня знания (в нашем случае: 0,25 для каждого уровня, =1);

4) вычисляем балл за i-ый ответ на L-ом уровне знания согласно табл.2, L={2;3;4;5} («+» - положительный ответ, «-» - отрицательный ответ).

Таблица Таблица равнораспределенных баллов (RLi) Ур.сложн 3 2 Ур.знания + - + - + - "5" 1,8 0 0 0 0 "4" 0 0,6 1,6 0 0 "3" 0 0,6 0 0,8 1,4 "2" 0 0,6 0 0,8 0 1,6) вычисляем результат на L-ом уровне знания как частное суммы баллов на L-ом уровне знания с первоначальным баллом L-ого уровня к сумме всех Q результатов: RL ( RL0 ) /, (11) RLi RL i1 L7) определяем результат тестирования как максимальный результат на L-ом уровне знания: R2 max( RL ). (12) Результаты экспериментов модифицированной базовой модели адаптивного тестирования доказали ее применимость для оценки знаний испытуемого;

практически к 30-35-ому тестовому вопросу могут быть сделаны итоговые выводы.

Ограничение на повышение (понижение) уровня сложности обосновывается использованием семиуровневой шкалой уровня знаний, используя «промежуточные уровни знания». Нами предлагается использовать «промежуточные уровни знания» (логическое распределение уточняющих вопросов на оценки 3, 4, 5) во избежание случайности ответов (как положительных, так и отрицательных).

Уровень знания и уровень сложности вопросов рассматриваем в одной шкале (табл. 3):

Таблица Шкала перевода уровня знания (уровня сложности) в оценку L=USCAT Оценка 6 4 2 1 Нами предложена расширенная базовая модель адаптивного тестирования.

Модель в общем виде: U=, (13) где U – результат; L – уровень знания, L={1;2…;7};

L=, где RL – результат на L-ом уровне знания; (14) L f (max( RL )); f (max( RL )) - принимает значение L, в котором RL максимальный;

RL=, (15) где pnt – шаг контрольной точки; Q – количество вопросов в тесте; USCAT – уровень сложности вопроса; USCAT0 – первоначальный уровень сложности OTVLj – j-ый ответ на L-ом уровне знания, OTVLj ={-1; 0; 1}; POLLi – количество правильных ответов на L-ом уровне знания на i-ом этапе; OTRLi – количество неправильных ответов на L-ом уровне знания на i-ом этапе; RLi – результат на L-ом уровне знания на i-ом этапе адаптации; ti – время, отведенное на выполнения i-го задания; tj – время, затраченное на j-ый ответ; i [1..n]; j [1..pnt].

Алгоритм реализации расширенной базовой модели заключается в следующем:

1) устанавливаем максимальное количество этапов тестирования (целесообразно задавать число не более f(целое(m/pnt)), где m – общее количество вопросов в банке знаний);

2) при инициализации процесса тестирования устанавливаем уровень сложности первого вопроса: USCAT USCAT0, USCAT0 1;2;..;7; (16) результаты не зависят от первоначального уровня знания, при любом USCATиспытуемый выйдет на соответствующий ему уровень знания (L), разным будет только количество шагов адаптации;

3) вычисляем j-ый ответ на L-ом уровне знания:

ный ответ или ti t, j 1, 1, если дан не вер ответ, (17) OTVLj если дан верный 0, иначе;

4) при последующем тестировании уровень сложности вопросов изменяется в зависимости от условий:

USCAT 1, если ответ положительный и USCAT 7;

(18) USCAT USCAT 1, если ответ отрицательный и USCAT 1;

USCAT.

5) определяем количество правильных и количество неправильных ответов на L-ом уровне знания на i-ом этапе:

pnt pnt POLLi , если OTVLj 1 ; OTRLi OTVLj |, если OTVLj 1; (19, 20) OTVLj | j1 j6) вычисляем результат на L-ом уровне знания на i-ом этапе адаптации:

n POLLi n n i n n (21) RLi , если 0;

POLLi OTRLi ) i1 iPOLLi OTRLi ( i0,i иначе 7) определяем результат на L-ом уровне знания:

(22) n 2), 1, если R f (max( RLi ), i [1..n] при Li POLLi Если n=NT, то RL (23) i0, иначе;

Результаты экспериментов расширенной базовой модели адаптивного тестирования доказали ее применимость для оценки знаний испытуемого, уже к 2530-ому тестовому вопросу могут быть сделаны итоговые выводы.

В работе были построены эталонные модели расширенной базовой модели адаптивного тестирования оценки знаний испытуемого, соответствующие уровню «2» (неудовлетворительно), «3» (удовлетворительно), «4» (хорошо), «5» (отлично).

Рассмотрим эталонные модели расширенной базовой модели адаптивного тестирования.

1. На оценку «2» (неудовлетворительно) и «5» (отлично).

Модель в общем виде W1=, где W1 – результат; (24) K – уровень знания, K={1;2;…;7};

K=, (25) где pnt – шаг контрольной точки, pnt 4;Q – количество вопросов в тесте;

OTVKj – j-ый ответ на K-ом уровне знания, OTVKj={-1;0;1}; POLKi – количество правильных ответов на K-ом уровне знания на i-ом этапе; OTRKi – количество неправильных ответов на K-ом уровне знания на i-ом этапе; ti. – время, отведенное на выполнения i-го задания; tj. – время, затраченное на j-ый ответ; i [1..n]; j [1..pnt]; n={1;2}.

Алгоритм эталонной модели на оценку «2» и «5» расширенной базовой модели аналогичен алгоритму расширенной базовой модели, для реализации которого необходимы формулы:

7 n 0;

POLKi 1, если K1 i 7, 7 n, (26) K если OTRKi K0, иначе; i pnt pnt POLKi , если OTVKj 1, OTRK1 OTVKj |, если OTVKj 1. (27, 28) OTVKj | j1 j2. На оценку «3» (удовлетворительно) и «4» (хорошо).

Модель в общем виде W2=, (29) где M – уровень знания, M={1;2;...;7};

M=< f (max( PM )) >, где PM – результат на M-ом уровне знания; (30) f (max( PM )) - принимает значение M, в котором PM максимальный;

PM =, (31) где pnt – шаг контрольной точки, pnt 4;Q – количество вопросов в тесте;

OTVMj – j-ый ответ на M-ом уровне знания, OTVMj={-1;0;1}, POLMi – количество правильных ответов на M-ом уровне знания на i-ом этапе; OTRMi – количество неправильных ответов на M-ом уровне знания на i-ом этапе; ti. – время, отведенное на выполнения i-го задания; tj. – время, затраченное на j-ый ответ; i [1..n]; j [1..pnt].

Алгоритм эталонной модели на оценку «3» и «4» расширенной базовой модели аналогичен алгоритму расширенной базовой модели, для реализации которого необходимы формулы:

1, если PM 2 1 и POLM f (max(POL ), M (32) PM 0, иначе;

n POLMi n n i, если POLMi OTRMi ; (33) n n pMi i1 i ) POLMi OTRMi ( 0,i 1иначе i n. (34) POLM POLMi iРезультаты экспериментов эталонных моделей расширенной базовой модели адаптивного тестирования доказали их применимость для оценки знаний испытуемого, алгоритмы которых позволяют завершить тестирование уже на второй контрольной точке.

По всем разработанным моделям итоговые вероятности гипотез подтверждают, что при 50% ответов испытуемый получит оценку "2", при 60% ответов – оценку "3", при 70% ответов – оценку "4", при 80% ответов – оценку "5".

Это в целом соответствует общей практике оценки знаний при тестировании.

На основе байесовского подхода разработана методика динамической оценки знаний при адаптивном тестировании, учитывающая результаты тестирования знаний испытуемого и его предыдущие ответы как вероятности гипотез об уровне знаний при реализации события (ответа или не ответа на вопрос определенной сложности).

Условная вероятность P(Hi\А) гипотезы Hi при появлении события А по n формуле Байеса определяет как1: P(Hi\ A ) P(Hi ) * P(A \ Hi ) / ) * P(A \ Hi ). (35) P(Hi iОбозначения: P(Hi) – априорная вероятность гипотезы Hi ; P(А\Hi) – условная вероятность события А при существовании гипотез; i=1, 2,…,n – номера гипотез.

Определены следующие гипотезы: испытуемый имеет уровень знаний на "неудовлетворительно"; "удовлетворительно"; "хорошо"; "отлично". Состояния испытуемого составляют полную группу событий, следовательно, сумма вероятностей этих состояний равна единице. Априорная вероятность каждой гипотезы до эксперимента равна 0,25, т.е. гипотезы равновероятны.

Используя авторскую программу «ModExTest», с помощью функции Rnd() генерировались случайные числа ответов или не ответов (1 или 0) на вопрос в зависимости от заранее выбранной доли правильных ответов. Независимо от этого с Вентцель, Е.С. Теория вероятностей: учеб. для вузов. - 5-е изд. стер. - М.: Высш. шк., 1998.

помощью той же функции генерировались случайные числа трудности тестового задания (1, 2 и 3) по равномерному закону распределения.

При этих условиях определены события А1, А2, А3 – верные ответы, события 1, 2, 3 – не верные ответы на вопросы сложности 1, 2 и 3 соответственно.

Вероятности этих событий при соответствующих гипотезах заданы в табл. 4.

Таблица Вероятности гипотез и событий Гипотезы Вероятности Вероятности событий гипотез P(Hi) А1 1 А2 2 А3 "2" 0,25 0,6 0,4 0,5 0,5 0,4 0,"3" 0,25 0,7 0,3 0,6 0,4 0,5 0,"4" 0,25 0,8 0,2 0,7 0,3 0,6 0,"5" 0,25 0,9 0,1 0,8 0,2 0,7 0,Вероятности событий при соответствующих гипотезах для каждого этапа тестирования рассчитывались по формуле Байеса динамически, т.е. в качестве априорных вероятностей гипотез для следующего этапа брались соответствующие вероятности гипотез предыдущего этапа.

Дифференцирующую способность оценки знаний можно наблюдать на графике при доле верных ответов в 70% (рис. 1). Причем такое положение сохраняется для всех условий эксперимента.

Из результатов экспериментов видно, что практически к 20-ому Рис. 1. Изменения вероятностей гипотез тестовому вопросу могут быть сделаны для разных этапов тестирования итоговые выводы по оценке знаний при доле верных ответов в 70% испытуемого.

В качестве критерия остановки тестирования (K0) может быть использован показатель разности энтропий предыдущего и последующего этапов тестирования, значение которого меньше заданной величины:

n K0 = |It – It+1| < , где I )log2 P(Hi ), (36, 37) (P(Hi iI – мера степени неопределенности состояния системы (энтропия);

t – этап тестирования; – устанавливаемый предел приращения энтропии.

Динамику изменения критерия K0 для данных проведенного эксперимента (доля верных ответов в 70%, = 0,08) можно проследить на графике (рис. 2).

Рассмотренный подход показывает хорошую дифференцирующую способность оценки знаний, которая наблюдается при различных долях верных ответов (уровне обученности) испытуемых на вопросы различной сложности. Экспериментально установлено, что применение данного вопрос метода оценки знаний позволяет снизить Рис. 2. Динамика изменения значений объем тестирования на треть, т.е. повысить критерия остановки тестирования эффективность тестирования примерно на 30%.

Используя модель бинарной логистической регрессии, предложена методика вычисления количества угаданных ответов и количества случайных ошибок испытуемого, увеличивающая точность оценки.

Во множественной линейной регрессии предполагается, что зависимая переменная («у») является линейной функцией независимых переменных («х»), т.е.:

y a bx, где x — уровень сложности вопроса; (38) b — коэффициент, расчт которого является задачей бинарной логистической регрессии; а — некоторая константа.

Рассматривая исход ответа на тестовое задание, задаем переменную «y» со значениями 1 (тестируемый правильно ответил на вопрос) и 0 (неправильно). Задача регрессии может быть сформулирована так: предсказываем непрерывную переменную со значениями на отрезке [0,1] при любых значениях независимых переменных. Это достигается применением следующего регрессионного уравнения (логит-преобразование): P , (39) 1 ey где P – вероятность того, что произойдет интересующее событие (гипотеза H(0) предполагает, что тестируемый ответит на вопрос правильно); e – основание натуральных логарифмов 2,71…; y – стандартное уравнение регрессии.

Если для P получится значение меньшее 0,5, то можно предположить, что событие не наступит; в противном случае предполагается наступление события.

Роi – начальное значение – принимаем равным 0,5 на каждом уровне сложности. Рассчитываем коэффициент изменения вероятности Р i:

Р i =Pi+1-Pi (40) Используя программный продукт STATISTICA 6.0, были обработаны результаты тестирования1 (рис. 3): р-уровень менее 5%, следовательно, модель значима; значение статистики хи-квадрат для разницы между текущей моделью и моделью, содержащей лишь свободный член, высоко значимо.

Рис. 3. Результаты логистической регрессии четвертого шага адаптации теста Одним из критериев оценки качества логистической регрессии является отношение несогласия2 (Odds ratio) (рис. 4).

Рис. 4. Отношение несогласия Предлагается интерпретировать результаты классификации наблюдений для установления количества угаданных ответов и количества случайных ошибок, совершенных испытуемым (рис. 4).

Адаптивное тестирование проводилось на основе расширенной базовой модели с помощью экспериментов авторской компьютерной программы «ModExTest».

Отношение несогласия вычисляется как отношение произведения чисел правильно расклассифицированных наблюдений к произведению чисел неправильно расклассифицированных.

Отношение несогласия больше 1 показывает, что построенная классификация лучше, чем, если бы мы просто провели классификацию наугад [Паклин, Н. Логистическая регрессия и ROC-анализ - математический аппарат. - [Электронный ресурс]. - Режим доступа: http://www.basegroup.ru/library/analisys/ regression/logistic].

На основании пробного тестирования (проверка остаточных знаний по дисциплине «Информатика» на тему: «Табличный процессор MS Excel») были вычислены числовые характеристики (дисперсия, коэффициент вариации1 и др.), позволившие выявить дифференцирующую способность данной совокупности тестовых вопросов при оценке знаний тестируемыми. Коэффициент вариации показывает, какую долю среднего значения количества правильных ответов составляет их средний разброс, в нашем случае равен: 0,5458. Коэффициент вариации является числом больше 0,3, т.е. распределение не является нормальным.

Разбиение тестовых заданий по уровням сложности позволяет получить распределения ответов, близких к нормальному закону распределения.

В работе предложена методика оценки вероятности получения качественного тестового задания на основе модели бинарной логистической регрессии, позволяющая выявить динамику изменения их категории при дальнейшем использовании банка заданий адаптивного теста.

Рассматривая тестовое задание (вопрос), задаем переменную y (категория) со значениями 1 (тестовое задание качественное) и 0 (некачественное). Для решения задачи регрессии предсказываем непрерывную переменную со значениями на отрезке [0,1] при любых значениях независимых переменных. Это достигается применением регрессионного уравнения (формула 39). Зависимая переменная (y) является линейной функцией независимых переменных (хi):

y b0 b1x1 b2x2 ... b9x9, (41) где x1 — уровень сложности тестового задания;

x2 — положительные ответы тестируемых, чей уровень знаний соответствует «2»;

x3 — отрицательные ответы тестируемых, чей уровень знаний соответствует «2»;

x4 — положительные ответы тестируемых, чей уровень знаний соответствует «3»;

x5 — отрицательные ответы тестируемых, чей уровень знаний соответствует «3»;

x6 — положительные ответы тестируемых, чей уровень знаний соответствует «4»;

x7 — отрицательные ответы тестируемых, чей уровень знаний соответствует «4»;

x8 — положительные ответы тестируемых, чей уровень знаний соответствует «5», x9 — отрицательные ответы тестируемых, чей уровень знаний соответствует «5»;

bi — коэффициенты, расчт которых является задачей бинарной логистической регрессии, b0 — некоторая константа.

После обработки исходных данных (результаты пробного тестирования, расчеты с использованием метода бисериального коэффициента корреляции2, позволяющего распределить задания по категориям: 1 – соответствует качественному тестовому вопросу, 0 – некачественному и данных распределения тестовых вопросов по уровням сложности) в пакете STATISTICA 6.0 были получены следующие результаты (рис.5):

Рис. 5. Результаты бинарной логистической регрессии Аванесов, В.С. Композиция тестовых заданий. – М.: Центр тестирования Минобразования РФ, 2002.

Кречетников, К.Г. Методология проектирования, оценки качества и применения информационных технологий обучения. - М.: Госкоорцентр, 2001.

Уравнение регрессии имеет вид:

y 10 - 0,097709x2 -1,94048x3 x4 -1,05158x5 0,647x6 -1,30542x7 0,38685x8 -1,31951x Анализируем полученные результаты: р-уровень менее 5%, следовательно, модель значима; значение статистики хи-квадрат для разницы между текущей моделью и моделью, содержащей лишь свободный член, высоко значимо;

коэффициент х1=0, следовательно распределение вопросов по уровням сложности незначимо для определения их качества, коэффициенты, полученные для х4, х6, х8, говорят о положительном влиянии переменных на качество тестового задания.

Результаты классификации логит-преобразования показывают, что тестовые задания будут относиться к некачественным (для Observed=1, Predicted<0,5), к качественным (для Observed=0 Predicted>0,5), а остальные будут соответствовать заявленной категории (1 или 0).

Вычисляя Рi по каждому тестовому заданию через i-отрезки времени в разных группах тестирующихся, можно проследить динамику изменения вероятностей наступления события Y (категория)=1, тем самым повышая потребительское качество систем тестирования.

В главе 3 «Оценка знаний студента при адаптивном тестировании на базе теории нечетких множеств» проведено моделирование лингвистических оценок обученности студента и успешности освоения дисциплины, позволяющее динамически получать результат на каждом этапе адаптивного тестирования.

При интегральной оценке знаний студента необходимо вести учет количественных и качественных факторов с использованием лингвистических переменных. В работе предложена методика лингвистической оценки обученности студента и исследована возможность ее использования на каждом этапе тестирования:

1. Необходимо определить для исследуемого параметра («Оценка уровня обученности») его качество как нечеткую переменную, функция которой имеет следующий вид:

0, при 0 x xmin, x xmin, при xmin x xmid, xmid xmin (42) F Оs (x, xmin, xmid, xmax ) xmax x , при xmid x xmax, xmax xmid при x xmax, 0, В такой интерпретации1, если оценка меньше или равна xmin (x xmin) и оценка больше или равна xmax (x xmax), то значение параметра недопустимо низкое (µ(х)=0), что позволяет задавать диапазон, в котором изменение значения параметра плавно влияет на оценку уровня обученности.

2. В процессе оценивания использовать лингвистическую интерпретацию в виде тетрарной шкалы «N-Y-Х-О», где уровень N (неудовлетворительно), уровень Y (удовлетворительно), уровень Х (хорошо) и уровень O (отлично).

Лингвистическая переменная «Оценка уровня обученности» (F) с терммножеством T1={Неудовлетворительно (N), Удовлетворительно (Y), Хорошо (Х), N Y Х О Отлично (О)} имеет соответствующие функции принадлежности ( F, F, F, F ) треугольного вида:

Долженко, А.И. Нечеткие модели – эффективный инструментарий для анализа потребительского качества информационных систем: монография. – Ростов-на-Дону: РГЭУ (РИНХ), 2008.

при 0 x xmin, 1, xmid x N (43) F (x, xmin, xmid, xmax ) , при xmin x xmid, xmid xmin при x xmid, 0, 0, при 0 x xmin, x xmin, при xmin x xmid, xmid xmin j (44) F (x, xmin, xmid, xmax ) где j Y, X, xmax x , при xmid x xmax, xmax xmid при x xmax, 0, при 0 x xmax, 0, x xmid O (45) F (x, xmin, xmid, xmax ) , при xmid x xmax, xmax xmid при x xmax, 1, где xmin, xmid, xmax – некоторые числовые параметры, принимающие произвольные действительные значения и упорядоченные отношением: xmin

4. Сформировать значения числовых параметров функций принадлежности исследуемого параметра «Оценка уровня обученности» путем планирования эксперимента.

5. Построить классификатор терм-множеств значений лингвистической переменной «Оценка уровня обученности» (рис. 6).

0,0,0,0, 0,0,0,0,0,x FN FY FX FO Рис. 6. Классификатор терм-множеств значений лингвистической переменной «Оценка уровня обученности» 6. Сформулировать правила нахождения значений числовых параметров ( xmin, xmid, xmax ) результирующей функции Y, фрагмент которых приведен в табл. 5.

Показатели x'j (j={min, mid, max}) определяются на первом (предыдущем) этапе тестирования, показатели x''j (j={min, mid, max}) – на втором (текущем) этапе тестирования. Значения показателей x'j | x''j зависят от правильности ответа студента на вопрос соответствующего уровня сложности. Значение коэффициента sgl (сглаживание) определяется экспериментальным путем (в нашем случае sgl=2).

7. Определить лингвистическое значение уровня исследуемого параметра («Оценка уровня обученности») на основании минимума расстояния ki между нечетким множеством, заданным функцией принадлежности FОs( x, xmin, xmid, xmax ), и каждым из нечетких множеств показателя качества, соответствующих функциям j принадлежности F ( x, xmin, xmid, xmax ) (j=N, Y, X, O). Расстояние между нечеткими множествами можно представить так:

k i k i k i ki maxamin bmin, amid bmid, amax bmax ,i 1,4 (46) Таблица Правила нахождения значений числовых параметров ( xmin, xmid, xmax ) результирующей функции Y (фрагмент) Пр Пример Условия Формулы Результат ави ло 1,2 1,P1 x'minx''min (x''max- 0,0,x'max)/sgl 0,2 0,xmid= x'mid+ (x''mid- x'mid)/sgl y1 y2 y ………..

Минимальные значения показателей близости: расстояние между нечеткими множествами, абсолютное расстояния Хемминга и абсолютное расстояния Евклидаопределили одинаковую принадлежность показателя «Оценка уровня обученности» к одному из четырех лингвистических уровней тетрарной шкалы классификатора в 95%.

Результаты адаптивного тестирования с использованием динамического оценивания нечеткого показателя «Оценка уровня обученности» доказывают несостоятельность классического оценивания тестируемого, исходя из процента правильно выполненных заданий, и позволяют уже на 20 этапе завершить тест.

В работе предложена методика оценки успешности освоения дисциплины студентом (ОY) на основе теории нечетких множеств (модель формирования лингвистической оценки в общем представлена на рис. 7), позволяющая проводить интегральный учет как количественных (количество вопросов, количество правильных ответов, суммарный балл), так и качественных факторов (освоение на 2 (x1), освоение на 3 (х2), 4 (х3) и 5 (х4)), учитывая неопределенность последних:

xxS Нормирование БП OY xxРис. 7. Модель формирования лингвистической оценки успешности освоения дисциплины студентом в общем виде где S – накопленная сумма баллов; х1 – освоение на 2; х2 – освоение на 3; х– освоение на 4; х4 – освоение на 5.

Круглов, В.В. Нечеткая логика и искусственные нейронные сети / В.В.Круглов, М.И.Дли, Р.Ю.Голунов. – М.: Физматлит, 2001.

1111. Необходимо произвести нормирование накопленной суммы баллов на отрезок [0..100] по уровням.

2. Задать классификационную шкалу и функции принадлежности качества лингвистических переменных.

Лингвистические переменные «освоение на 2» (х1), «освоение на 3» (х2), «освоение на 4» (х3), «освоение на 5» (х4) интерпретированы в виде терм-множества с триарной шкалой Т2={НС, СН, ПС}, где значение НС – «не соответствует уровню (на 2, на 3, 4 или 5)», СН – «соответствует незначительно» и ПС – «соответствует полностью».

Каждая из лингвистических переменных «освоение на 2 (3, 4, 5)» имеет одну треугольную кривую принадлежности (47) и две Т-образных кривых принадлежности НС СН ПС (48) ( xi, xi, xi,i 1,4 ), в общем виде которые могут быть заданы выражениями1:

0, x a, x a b a, a x b, j (47) (xi,a,b,c) i 1,4, j T2, c x , b x c, c b 0, c x где a, b, c – некоторые числовые параметры, характеризующие основание треугольника (a, c) и его вершину (b), причем должно выполняться условие: a b c.

0, x a, x a b a, a x b, 1, b x c, i 1,4, j T 2, (48) Tj(xi,a,b,c,d) d x, c x d, d c 0, d x где a, b, c, d – некоторые числовые параметры, характеризующие основание трапеции (a, d) и верхнее основание трапеции (b, c), принимающие произвольные действительные значения и упорядоченные отношением: a b c d.

На рис. 8-9 приведены графики функций принадлежности нечетких терммножеств лингвистической переменной «освоение на 2 (3, 4, 5)» (input1-х1, input2-х2, input3-х3, input4-х4):

Рис. 8. Формирование входных лингвистических переменных «освоение на 2» (х1),« освоение на 3» (х2) Долженко, А.И. Нечеткие модели – эффективный инструментарий для анализа потребительского качества информационных систем: монография. – Ростов-на-Дону: РГЭУ (РИНХ), 2008.

Рис. 9. Формирование входной лингвистической переменной «освоение на 4» (х3), «освоение на 5» (х4) Значения параметров a, c, d и b могут уточняться в соответствии с экспериментальными данными.

3. Определить классификационную шкалу и функции принадлежности исследуемого параметра «Оценка успешности освоения дисциплины студентом» в виде терм-множества значений T1={Неудовлетворительно (Н), Удовлетворительно (У), Хорошо (Х), Отлично (О)}.

Лингвистическая переменная «Оценка успешности освоения дисциплины студентом» имеет две треугольных кривых принадлежности (47) и две Т-образных Н У Х О кривых принадлежности (48) ( ОY, ОY, ОY, ОY )(рис. 10 - output1 – OY).

Рис. 10. Формирование выходной лингвистической переменной (OY) 4. Определить нечеткие продукционные правила формирования оценки успешности освоения дисциплины студентом (табл. 6).

Таблица Нечеткие продукционные правила (фрагмент) Правило Переменная х1 х2 х3 хOY Вид терма НС + БП1 СН + + + OYO ПС + НС + БП2 СН + + OYХ ПС + НС + + БП3 СН + OYX ПС + + …… 5. Аккумулировать выводы по всем правилам с применением операции maxдизъюнкция. При дефазификации использовать метод центра тяжести для дискретного множества значений функций принадлежности.

С использованием авторской компьютерной программы «ModExTest» проводилось моделирование данных тестирования и определялись значения входных параметров лингвистических переменных «освоение на 2» (х1), «освоение на 3» (х2), «освоение на 4» (х3), «освоение на 5» (х4). Моделирование нечетких моделей проводилось с использованием специализированного пакета Fuzzy Logic Toolbox средства MATLAB. Выполнение нечеткого вывода реализовано на основе алгоритма Мамдани (Mamdani)1.

Рассмотрим один из вариантов адаптивного тестирования, результаты которого приведены в табл. 7.

Таблица Результаты адаптивного тестирования Вопрос 1 2 3 4 5 6 7 8 9 10 11 12 Вопрос на 3 4 5 5 5 5 5 4 3 4 5 4 Ответ 1 1 1 1 1 1 0 0 1 1 0 0 Вопрос 14 15 16 17 18 19 20 21 22 23 24 Вопрос на 3 4 5 4 3 4 3 4 3 4 5 Ответ 1 1 0 0 1 0 1 0 1 1 0 1 60% Значения входных параметров лингвистических переменных приведено в табл.

8. При значении классификатора input1= 97.59 значение лингвистической переменной х1 – «освоение на 2» соответствует терму НС – «не соответствует» с уровнем уверенности x1НС = 1. При значении классификатора input2= 83 значение лингвистической переменной х2 – «освоение на 3» соответствует терму СН – «соответствует незначительно» с уровнем уверенности x2СН = 1. При значении классификатора input3= 78.5 значение лингвистической переменной х3 – «освоение на 4» соответствует терму ПС – «полностью соответствует» с уровнем уверенности x3ПС = 0,5. При значении классификатора input4= 82.6 значение лингвистической переменной х4 – «освоение на 5» соответствует терму СН – «соответствует незначительно» с уровнем уверенности x4СН = 0,9.

Таблица Значения входных параметров лингвистических переменных Переменная Значение Уровень уверенности Переменная Значение Уровень уверенности x1 97,59178 x1НС 1 x3 78,5 x3ПС 0, x2 83 x2СН 1 x4 82,61019 x4НС 0,По заданным условиям активизируются правила 1, 2 и 3. Результирующее значение классификатора выходной переменной output1 соответствует значению 81.7, что определяет значение лингвистической переменной OY «Оценка успешности освоения дисциплины студентом», равное Х - «хорошо» с уровнем уверенности OYХ = 0,5. Реализация правил нечеткого вывода приведена на рис. 11.

Семестровая оценка успеваемости студента по каждой учебной дисциплине выводится, исходя из максимальной суммы баллов, равной 1002. Если по каждому виду учебной работы (F1...Fn) известны лингвистические оценки ОY = (OY1 … OYn) и определены весовые коэффициенты p = (p1,…, pn), тогда оператор агрегирования Wang, L.X. Generating Fuzzy Rules by Learning from Examples, IEEE Transactions on System // Man and Cybernetics. - 1992. – Vol. 22. – Nr. 6. – P. 1414-1427.

Положение об организации учебного процесса в Ростовском государственном экономическом университете (РИНХ) с использованием зачетных единиц (кредитов) и балльно-рейтинговой системы. – Ростов-на-Дону: РГЭУ (РИНХ), 2011.

информации представляет собой взвешенную сумму и характеризуется своей лингвистической оценкой, определяемой функцией принадлежности на 01n классификаторе OY x xpi. (49) i iРис. 11. Реализация правил нечеткого вывода Определим итоговую оценку: Y x=97 x 0.08 + 79 x 0.08 + 83 x 0.1 + 82 x 0.+ 87 x 0.12 + 84 x 0.5 = 84.66 85, что соответствует терму лингвистической переменной OY «Оценка успешности освоения дисциплины студентом» O - «Отлично» с уровнем уверенности OYO = 0,5. При установке критерия значимости уровня уверенности KrZ=0.05, полученное значение переменной OY принимается, поэтому студенту выставляется оценка «Отлично».

Экспериментально установлено, что применение данного подхода к оценке успешности освоения дисциплины студентом позволяет точно выставить оценку на любом этапе адаптивного тестирования. В рамках накопительной балльнорейтинговой системы использование теории нечетких множеств позволяет накапливать баллы в 100-балльной шкале по всем видам учебной работы и формировать итоговый балл в зависимости от максимально возможных баллов, установленных за каждый объем выполненной работы.

В главе 4 «Моделирование информационной системы адаптивного тестирования» для проведения анализа функциональной полноты1 предложено все ИС тестирования разбить на 2 группы: дистрибутивные тестовые системы (ДТС) – системы, которые требуют установки на каждом ПК; веб-системы тестирования (ВСТ) и модули тестирования в обучающих образовательных системах (МТОС). Предложенная группировка позволяет выделить общие функции, присущие каждой группе ИС, и индивидуальные, а также сформировать перечень функций (53) для проведения анализа функциональной полноты ИС адаптивного тестирования. Общие функции, представленные во всех группах ИС тестирования, не рассматривались.

Из полного списка анализируемых тестовых систем были выделены системы, поддерживающие анализируемые функции (29 ДТС: S1 – Конструктор тестов, S2 – «Кафедральные тесты» СГУ, S3 – АСТ-Тест, …, S28 – Test 2002. Professoinal Edition, S29 – СТ М-Тест ;19 ВСТ и МТОС: VS1 – Тест. Программная среда Хубаев, Г.Н. Методика экономической оценки потребительского качества программных средств // Программные продукты и системы (SOFTWARE and SYSTEMS). - 1995. - № 1.

«LEMON», VS2 – «KnowledgeCT», VS3 – «Телетестинг-99», …, VS18 –Microsoft ELearning (модуль "Тестирование"), VS19 – IBM Lotus LearningSpace (модуль "Тестирование")).

Конструктивные особенности создания, применения и выбора дистрибутивных систем и веб-разработок не позволяют провести совместный анализ их функциональной полноты, поэтому данную методику применяли отдельно для каждой из двух групп. Из анализируемых ИС близкими к «эталонной» адаптивной тестовой системе оказались дистрибутивные системы: S3 (АСТ-Тест), S4 («МастерТест»), S5 («СИнТеЗ»), S15 (КТС Net 2), S17 (Quizzz), S25 (FastTEST Professional Testing System, 2.0), S26 (Test4DL, РЭА), S27 (MSCat Demo), S28 (Test 2002. 2.2.0.356. Professoinal Edition), S29 (СТ М-Тест) и веб-системы:

VS6(WebTutor (модуль "Тестирование"), VS11(eLearning Server 3000 (модуль "Тестирование"), VS12(LAMS (модуль "Тестирование"), VS14(Sakai (модуль "Тестирование"), VS15(Прометей (модуль "Тест"), VS17(Learn eXact (модуль "Тестирование"), VS18(Microsoft E-Learning (модуль "Тестирование"), VS19 (IBM Lotus LearningSpace (модуль "Тестирование").

Современные CASE-средства позволяют создавать сложные программные системы от описания информационных процессов предметной области до создания программного кода. В настоящее время наибольшее распространение получил объектный подход к созданию ИС, в частности основанный на унифицированном языке моделирования UML (Unified Modeling Language).

Модель ИС адаптивного тестирования представлена в нотации UML в виде диаграмм прецедентов (главная диаграмм прецедентов представлена на рис. 12), описывающих основные цели системы и ее пользователей, диаграмм деятельности для анализа содержания необходимых управляющих и образовательных процессов процесса тестирования, диаграмм классов для отображения объектов и связей в системе.

Рис. 12. Главная диаграмма прецедентов ИС адаптивного тестирования Фрагмент структуры объектов и связей в системе в виде модели базы данных представлен на рис. 13.

Рис. 13. Модель данных ИС адаптивного тестировании (фрагмент) Созданная в нотации UML модель ИС адаптивного тестирования позволяет существенно снизить затраты на разработку, модернизацию, модификацию и настройку программной системы, а также повысить потребительское качество программного продукта и поставку ИС в запланированные сроки.

В заключении приведены основные выводы и перечислены практические результаты исследования.

ПО ТЕМЕ ДИССЕРТАЦИИ ОПУБЛИКОВАНЫ РАБОТЫ Статьи в изданиях, рекомендованных ВАК Минобрнауки России 1 Жилина, Е.В. Использование бинарной логистической регрессии для оценки качества адаптивного теста /Е.В.Жилина // Вестник Томского государственного университета. – Томск, 2010. – № 334. – С. 106-109. - 0,5 п.л.

2 Жилина, Е.В. Проектирование семантического ядра контента учебного интернет-ресурса с поддержкой функций адаптивного контроля знаний / Е.В.

Жилина, И.И. Мирошниченко // Вестник Ростовского государственного экономического университета. – Ростов-на-Дону, 2010. – № 3 (32). – С. 219-226. - 0,6 п.л. (лично автора 0,3 п.л.).

3 Жилина, Е.В. Нечеткие модели оценки успешности освоения дисциплины студентом /Е.В.Жилина //Управление экономическими системами: электронный журнал. – 2011. – (35) № 11. – № гос.рег.статьи: 0421100034. (дата публикации 30.11.2011). – Электронный ресурс: http://www.uecs.ru (режим доступа - открытый).

- 0,8 п.л.

4 Жилина, Е.В. Сравнительный анализ образовательных систем тестирования по критерию функциональной полноты / Е.Н.Ефимов, М.Ю.Денисов, Е.В.Жилина //Управление экономическими системами: электронный журнал. – 2012. – (40) № 4.

– № гос.рег.статьи: 0421200034. (дата публикации 09.04.2012).– Электронный ресурс: http://www.uecs.ru (режим доступа - открытый). - 0,9 п.л. (лично автора 0,п.л.).

Статьи в журналах, сборниках научных трудов и сборниках материалов докладов конференций 5 Жилина, Е.В. Оценка эффективности использования компьютерных адаптивных тестовых систем в образовании /Е.В.Жилина // Информационные системы, экономика, управление трудом и производством: Ученые записки. Вып.12.

- Ростов-на-Дону: РГЭУ «РИНХ», 2008. – С. 66-72. - 0,5 п.л.

6 Жилина, Е.В. Экономико-организационные аспекты применения адаптивных тестовых систем в высшей школе /Е.В.Жилина // Экономические информационные системы и их безопасность: разработка, применение и сопровождение: материалы регион. науч.-практич. конф. 1-5 октября 2009 г. / п.Архыз. – Ростов-на-Дону: РГЭУ «РИНХ», 2009. – С. 75-80. - 0,5 п.л.

7 Жилина, Е.В. Линейная модель адаптивного тестирования /Е.В.Жилина // Проблемы создания и использования информационных систем и технологий:

материалы III межрегион. конф. 11 декабря 2009 г. – Ростов-на-Дону: РГЭУ «РИНХ», 2009. – С. 10-15.- 0,45 п.л.

8 Жилина, Е.В. Эталонные модели адаптивных систем тестирования в образовании /Е.В.Жилина // Информационные системы, экономика, управление трудом и производством: Ученые записки. Вып.13. - Ростов-на-Дону: РГЭУ «РИНХ», 2010. – С. 76-83. – 0,45 п.л.

9 Жилина, Е.В. Моделирование данных системы адаптивного тестирования в Rational Rose /Е.В.Жилина // Актуальные вопросы развития современной науки, техники и технологий: материалы II всерос. науч.-практич. (заочной) конф. 1-февраля 2010 г. / г. Москва. – М.: Редакционно-издательский комплекс «Независимый издательский институт развития рыночных реформ», 2010. – С. 56-60. - 0,3 п.л.

10 Жилина, Е.В. Визуальное моделирование процессов адаптивного тестирования /Е.В.Жилина // Современные достижения в науке и образовании:

математика и информатика: материалы междунар. науч.-практич. конф. 1-5 февраля 2010 г. – Архангельск, 2010. –С. 550-553. - 0,3 п.л.

11 Жилина, Е.В. Расчет показателей вариации для анализа распределения баллов в адаптивном тесте /Е.В.Жилина // Новые технологии в образовании:

материалы V междунар. Интернет-конф. 31 марта 2010 г. / Таганрогский государственный педагогический институт. – М.: Спутник+, 2010. - С.20-24. - 0,2 п.л.

12 Жилина, Е.В. Применение логит-преобразования для оценки качества банка заданий адаптивного теста /Е.В.Жилина // Молодежь и экономика: материалы VII междунар. науч. конф. молодых ученых, аспирантов и студентов. 22 апреля 20г. – Ярославль, 2010. – С.178-180. - 0,2 п.л.

13 Жилина, Е.В. Функциональное моделирование информационной системы тестирования в образовании / Е.В. Жилина, К.А. Бородин // Перспектива: V материалы междунар. науч.-практич. Интернет-конф. 5 апреля 2010 г. - 30 июня 2010 г. – Железногорск, 2010. – С. 80-87. - 0,6 п.л. (лично автора 0,3 п.л.).

14 Жилина, Е.В. Байесовский подход к оценке знаний при тестировании / Е.Н.

Ефимов, Е.В. Жилина // Проблемы информационной безопасности: материалы VI всерос. науч.-практич. Интернет-конф. 20 мая - 20 июня 2011 г. - Ростов-на-Дону:

РГЭУ «РИНХ», 2011. – 0,3 п.л. (лично автора 0,15 п.л.).

15 Жилина, Е.В. Визуализация компонентов веб-модели автоматизированной системы тестирования в Rational Rose /Е.В.Жилина // Тенденции развития научных исследований (Тенденції розвитку наукових досліджень): материалы междунар.

науч.-практич. конф. 21.02.2011 г. / Украина. – Киев: НАИРИ, 2011. – С.107-112. - 0,5 п.л.

16 Жилина, Е.В. Динамическая оценка знаний при тестировании: байесовский подход / Е.Н. Ефимов, Е.В. Жилина // Информационные системы, экономика, управление трудом и производством: Ученые записки. Вып.14. - Ростов-на-Дону:

РГЭУ «РИНХ», 2011. – 0,45 п.л. (лично автора 0,2 п.л.).

17 Жилина, Е.В. Анализ применяемых моделей и методов тестирования для оценки знаний специалиста /Е.В.Жилина // Zprvy vdeck ideje – 2011: materily VII mezinrodn vdecko - praktick konference. 27 jna - 05 listopadu 2011 roku. Dl 4.

Ekonomick vdy. – Praha: Publishing House «Education and Science» s.r.o, 2011. – C. 53-62. - 0,7 п.л.

Зарегистрированные программные средства 18 Моделирование экспериментов тестирования ModExTest / Авторыправообладатели: Е.Н. Ефимов, Е.В. Жилина // Свидетельство о государственной регистрации программы для ЭВМ. - № 2012612347. – М.: РОСПАТЕНТ, 2012.

Печать цифровая. Бумага офсетная. Гарнитура «Таймс».

Формат 60х84/16. Объем 1,1 уч.-изд.-л.

Заказ № 2581 Тираж 120 экз.

Отпечатано в КМЦ «КОПИЦЕНТР» 344006, г. Ростов-на-Дону, ул. Суворова, 19, тел. 247-34-




© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.