WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     ||
|

– неизвестный средний период проявления самой частой ошибки;

– параметр геометрической модели, значение которого неизвестно;

– общее количество ошибок, оставшихся в системе к началу комплексной отладки системы (также неизвестное).

Параметр модели определяется исходя из фактического начального времени безотказной работы системы (времени наработки на отказ). Исходя из соотношения для среднего начального времени наработки на отказ, получим:.

На рис. 3 представлен фрагмент геометрической модели распределения средних периодов проявления ошибок (в часах).

Процесс отладки ПО заключается в последовательном обнаружении, локализации и устранении ошибок. При этом среднее время наработки на отказ возрастает таким образом, что после устранения l первых ошибок имеет место соотношение:.

Рис. 3. Геометрическая модель распределения средних периодов
проявления ошибок

Преобразуя его, получим:.

Положим, тогда. При, т.е. в начале отладки, когда не устранено еще ни одной ошибки, начальное среднее время наработки на отказ равно:. Тогда формула для среднего времени наработки на отказ после устранения части ошибок может быть представлена в виде:,. Если считать, что начальное среднее время наработки на отказ известно, то остается один неизвестный параметр, который необходимо определить. В работе предложен метод оценки неизвестного параметра по данным о прогонах системы.

Пусть – оценки времени наработки на отказ по результатам m прогонов. В предположении нормальности распределения этих оценок функция правдоподобия имеет вид:

Перейдем к логарифму функции правдоподобия и приравняем производные нулю:

,

.

Тогда оценка максимального правдоподобия параметра имеет вид:

.

Для нахождения оценки максимального правдоподобия параметра подставим выражение для оценки параметра в первое уравнение и, получив нелинейное уравнение относительно, решим его численно.

Таким образом, результаты прогонов системы содержат всю информацию о модели потока отказов, а именно, о значении параметра, которое определяет средние периоды всех ошибок, оставшихся в системе. При этом важно отметить, что это может быть сделано на любой стадии отладки системы, для этого достаточно иметь результаты нескольких прогонов. Эта информация позволяет прогнозировать среднее время наработки на отказ в зависимости от числа устраненных ошибок.

В третьей главе предложены математические модели прогнозирования надежности ПО в процессе тестирования и отладки.

При построении таких моделей будем исходить из следующих предположений:

  1. Время между отказами, вызванными ошибкой со средним периодом проявления T, является случайной величиной, распределенной по экспоненциальному закону;
  2. Для обнаружения и локализации причины программного отказа (ошибки) требуется некоторое число m его проявлений. При этом устранение ошибки возможно с некоторой вероятностью, тем большей, чем больше величина m;
  3. Величина m является случайной величиной, распределенной по закону Пуассона с параметром - среднее число проявлений ошибки, необходимое для ее устранения: m = 0, 1, 2, ….

В рассматриваемом случае вероятность устранения одиночной ошибки за m проявлений при среднем числе проявлений, необходимых для ее устранения, совпадает с функцией распределения Пуассона:

Исходя из принятой модели, вероятность по крайней мере m-кратного проявления ошибки на некотором временном интервале длительности t может быть определена следующим образом:

.

Таким образом интегральная вероятность локализации и устранения ошибки со средним периодом ее проявления Т за время отладки t описывается многомерной функцией:.

На рис.4 представлен вид этой функции для отношения t/T, также варьируемого от 4 до 10. По оси абсцисс отложены значения параметра m – числа проявлений ошибки. Очевидно, что с ростом отношения максимум вероятности локализации и устранения ошибки возрастает, асимптотически приближаясь к единице.

Рис. 4. Вероятности локализации и устранения ошибки со средним периодом ее проявления Т за время t,.

На основе соотношений, описывающих поведение модели процесса тестирования и отладки ПО, построены детерминированная и рандомизированная модели.

Суть детерминированной модели заключается в том, что из всего множества ошибок, которые должны быть устранены для обеспечения требуемого значения наработки на отказ, в первую очередь выбираются наиболее редко проявляющиеся ошибки. Все более частые ошибки (с меньшим периодом проявления) будут устранены в среднем за меньшее время, чем эти наиболее редкие ошибки. Таким образом, среднее время наработки на отказ определяется следующим соотношением:

.

Суть рандомизированной модели заключается в учете всех вероятностей устранения ошибок при заданной продолжительности отладки и расчете на их основе среднего времени наработки на отказ, которое имеет вид:

.

На рис. 5 представлен график зависимости среднего времени наработки на отказ от числа устраненных ошибок для детерминированной и рандомизированной моделей.

Рис. 5. Зависимости среднего времени наработки на отказ от числа устраненных ошибок

Рис.6. Зависимость времени наработки на отказ от продолжительности отладки системы при наличии аномальной ошибки

В реальной практике иногда возникают ситуации так называемых «аномальных» ошибок, которые не могут быть устранены в течение долгого времени. К таким ошибкам относятся, в частности, ошибки в аппаратной части системы, например, неверное выполнение команды в ЭВМ, проявляющееся в определенных ситуациях, не встречавшихся при отладке соответствующих микропрограмм машины. Несмотря на многочисленные проявления, такие ошибки не удается локализовать в течение долгого времени. Иногда число проявлений ошибки может достигать многих десятков и даже сотен. На рис.6 представлена ситуация «аномальной» ошибки. Ошибка со средним периодом 12.8 часа была устранена через 1900 часов отладки системы, т.е. для ее устранения потребовалось около 150 проявлений вместо 5, заложенных в модели. После ее устранения время наработки на отказ скачком возросло с 8 до 28 часов.

Наряду с оценкой надежности по средней наработке на отказ, возможно, оценить надежность системы по интенсивности устранения ошибок в процессе отладки системы. Для этого необходимо построить распределение числа устраненных ошибок на последовательных интервалах времени. Это распределение можно вывести на основе вышеописанных соотношений. Предположим, что для устранения ошибки требуется не менее m ее проявлений. Рассмотрим некоторый промежуток времени. Для ошибки со средним периодом проявления вероятность ее устранения за время вычисляется по формуле:

.

Тогда среднее число устраненных ошибок, т.е. проявившихся в среднем не менее раз на интервале, равно сумме вероятностей устранения каждой ошибки с периодом,. Эта величина может быть вычислена следующим образом:

.

Расчетные и экспериментальные зависимости для этих величин при различных значениях параметра приведены на рис. 7. Шаг по времени составляет 250 часов, что соответствует примерно полутора месяцам работы при 8-часовом рабочем дне.

Рис.7. Распределение числа устраненных ошибок
по интервалам времени N=200, =5

Результаты теоретических расчетов и имитационного моделирования свидетельствуют о том, что среднее время наработки на отказ существенно зависит от параметров модели – начального времени наработки на отказ, продолжительности жизненного цикла системы, числа оставшихся ошибок, квалификации разработчиков, которые известны в процессе прогнозирования надежности лишь приближенно. Для решения задачи прогнозирования надежности при неизвестном значении параметров модели можно исходить из результатов расчетов и моделирования, которые подтверждают, что метрика ведет себя монотонным образом, то есть является гладкой и хорошо аппроксимируется многочленами невысокой степени.

В связи с этим для прогнозирования надежности программного обеспечения предлагается применить следующий алгоритм. На основе результатов нескольких прогонов системы экспериментально определяются времена наработки на отказ на разных фазах тестирования и отладки системы. На основе этих экспериментальных данных осуществляется линейное или квадратичное прогнозирование. После получения результатов очередного прогона системы результаты прогнозирования уточняются.

Рис. 8. Линейное прогнозирование среднего времени наработки на отказ по результатам промежуточных прогонов системы.

Предположим, что в моменты времени выполнены прогоны системы, в ходе которых оценены времена наработки на отказ, где, а число прогонов системы. Будем строить прогноз в виде линейной функции, где a и b - параметры прогноза. В соответствии с методом наименьших квадратов подберем значения параметров a и b так, чтобы минимизировать функцию:

.

Приравняв нулю производные и и решив соответствующую систему линейных уравнений, найдем оценки параметров a и b:

,.

В качестве примера на рис.8 представлена графическая зависимость прогнозной (на 225 час отладки системы) оценки среднего времени наработки на отказ, полученная по результатам промежуточных прогонов через 30, 45, 60 и т.д. часов. Фактическое время наработки на отказ, достигнутое через 230 часов отладки, составило 1,9 часа. Из рис. 8 следует, что имеет место сходимость прогнозной оценки к истинному значению.

В четвертой главе рассмотрены принципы прогнозирования надежности информационных систем реального времени различного типа. Представлены различные варианты организации систем, которые представляют собой совокупность процессоров, объединенных в единую систему.

В диссертационной работе рассматриваются два типа информационных систем: мультипроцессорные – системы, в которых компьютеры используют память совместно, и мультикомпьютерные – системы, в которых компьютеры работают каждый со своей памятью. Изложенные в работе принципы расчета надежности для мультикомпьютерных систем некоторых типов позволяют предложить подход к проектированию информационных систем с учетом требований по надежности их функционирования.

На рис. 9 представлены зависимости среднего времени наработки на отказ, полученные для трех систем с объемом программного обеспечения = 25К, 50К и 100К, или остаточного числа ошибок N = 50, 100 и 200 соответственно.

Рис. 9. Зависимость времени наработки на отказ от продолжительности отладки при разном объеме ПО

Подтверждением справедливости результатов, представленных на рис. 9, являются результаты имитационного моделирования. Моделировалось разбиение интегрированной системы, реализованной на одной ЭВМ, на две ЭВМ, решающих независимые задачи. Объем ПО в интегрированной системе составлял 100К слов, а при разделении задач на две ЭВМ – по 50К слов в каждой. Соответственно, число ошибок в централизованной системе равно 200, а при разделении на две ЭВМ – по 100 ошибок в каждой ЭВМ. Ошибки распределены по ЭВМ случайным образом с равной вероятностью. На рис. 10 представлены зависимости усредненного по двум ЭВМ времени наработки на отказ и времени наработки на отказ для интегрированной системы.

Это позволило предложить следующий принцип декомпозиции систем. На начальной стадии проектирования задачи, решаемые системой, разбиваются на непересекающиеся кластеры задач так, чтобы

.

Рис. 10. Результаты имитационного моделирования зависимости времени наработки на отказ от продолжительности отладки ПО

При этом под непересекающимися кластерами понимаются некоторые группы задач, не имеющие общих информационных и управляющих связей, т.е., где - множество входов задачи, а - множество выходов задачи и при. После выполнения такого разбиения оцениваются объемы программного обеспечения каждого кластера,, и рассчитываются прогнозные оценки показателей надежности - вероятности безотказного функционирования в течение времени или средние времена наработки на отказ, для заданного значения продолжительности отладки системы. Величины вычисляются на основе логической структуры кластера с учетом резервирования отдельных модулей. На рис.11 приведен пример системы S, разбитой на две подсистемы (кластера) и, содержащих 3 и 4 вычислительных модуля соответственно. В силу независимости кластеров задач среднее время наработки на отказ для всей системы составит:

.

Рис.11. Пример декомпозиции системы на кластеры

В пятой главе приведено описание инструментального программного комплекса контроля и прогнозирования надежности, позволяющего применять разработанные модели на практике.

Укрупненная структурная схема разработанного инструментального комплекса представлена на рис.12. В состав комплекса входят подсистемы:

  • сбора и отслеживания информации об ошибках программного обеспечения. Данные об ошибках заносятся в базу данных в стандартизированном виде, позволяющем сопровождать одновременно несколько проектов. Предполагается, что информация об ошибках рассылается разработчикам программного обеспечения, а уведомление об исправлении ошибки возвращается разработчиком в подсистему;
  • статистической обработки информации об ошибках. Выполняется на основе результатов глав 2 и 3 диссертации;
  • математического и имитационного моделирования потоков ошибок и процессов устранения ошибок на основе результатов глав 2 и 3 диссертации;
  • прогнозирования надежности систем реального времени для различной структурной организации системы.

Рис. 12. Укрупненная структурная схема инструментального комплекса

В заключении сформулированы основные научные и практические результаты работы, полученные автором.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

Pages:     ||
|



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.