WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 22 | 23 || 25 | 26 |   ...   | 82 |

Эта функция рассматривается как функция правдоподобия L (, ), значения которой показывают «вероятность» (правдоподобность) появления наблюдаемых xi, i = 1,..., N, при тех или иных значениях и. Имея такую функцию, можно воспользоваться для оценки параметров и методом максимального правдоподобия (ММП): в качестве оценок принять такие значения и, которые доставляют максимум функции правдоподобия (фактически предполагая, что, раз конкретные xi, i =1,..., N реально наблюдаются, то вероятность их появления должна быть максимальной).

Обычно ищется максимум не непосредственно функции правдоподобия, а ее логарифма (значения этой функции при конкретных xi и конечных положительны, и их можно логарифмировать; эта операция, естественно, не меняет точки экстремума), что проще аналитически.

N ln L (, ) =- ln 2 - N ln - (xi - )2.

2 Ищутся производные этой функции по и, приравниваются нулю и определяются искомые оценки:

ln L = (xi - ) =0 = = b, x ln L N 1 = - + e2 =0 2 = e2 = s2.

i 3 i N Это точка минимума, поскольку матрица 2-х производных N 1 - s0 в ней отрицательно определена.

188 Глава 5. Случайные ошибки Таким образом, ММП-оценки и i совпадают с МНК-оценками, но ММПоценка 2 равна не 2, а s2, т.е. является смещенной. Тем не менее, эта оценка состоятельна, т.к. при N различия между 2 и s2 исчезают.

Известно, что метод максимального правдоподобия гарантирует оценкам состоятельность и эффективность, т.е. они обладают минимально возможными дисперсиями (вообще, а не только в классе линейных несмещенных, как оценки класса BLUE).

В рамках гипотезы о нормальности ошибок можно построить доверительный интервал для истинного значения параметра, т.е. интервал, в который это значение попадает с определенной вероятностью 1 -, гд е — уровень ошибки (аналогичен величинам sl и pv, введенным во 2-й и 4-й главах I части книги; в прикладных исследованиях уровень ошибки принимается обычно равным 0.05). Он называется (1 - )100-процентным (например, при =0.05 — 95-процентным) доверительным интервалом.

Следствием нормальности является нормальность b : b N,. ПоN этому (b - ) N N (0, 1), (5.7) и, по определению двустороннего квантиля (см. п. 2.3), (b - ) N 1-, где 1- — (1 - )100-процентный двусторонний квантиль нормального распре деления.

Откуда b ± 1- (5.8) N — искомый (1 - )100-процентный доверительный интервал.

К сожалению, на практике этой формулой доверительного интервала воспользоваться невозможно, т.к. она предполагает знание остаточной дисперсии 2. Известна же только ее оценка 2.

Простая замена в (5.8) на будет приводить к систематическим ошибкам — к преуменьшению доверительного интервала, т.е. к преувеличению точности расчета.

Чтобы получить правильную формулу расчета, необходимо провести дополнительные рассуждения.

5.1. Первичные измерения Прежде всего, доказывается, что e e 2. (5.9) 2 N-Справедливость этого утверждения достаточно очевидна, поскольку, как было показано выше, сумма квадратов e e имеет N - 1 степень свободы, но может быть доказана строго.

В матричной форме выражение (5.6) записывается следующим образом:

e = B, (5.10) где B = IN - 1N1.

N N Матрица B размерности N N :

а) вещественна и симметрична ( B = B), поэтому она имеет N вещественных корней, которые можно «собрать» в диагональной матрице, и N взаимно ортогональных вещественных собственных векторов, образующих по столбцам матрицу Y. Пусть проведена надлежащая нормировка и длины этих собственных векторов равны 1. Тогд а:

-Y Y = IN, Y = Y, BY = Y, B = Y Y ; (5.11) б) вырождена и имеет ранг N - 1. Действительно, имеется один и только один (с точностью до нормировки) вектор = 0, который дает равенство B = 0. Все компоненты этого единственного вектора одинаковы, т.к., как было показано выше, B — центрированный. В частности, B1N =0. (5.12) Это и означает, что ранг B равен N - 1;

в) идемпотентна, т.е. B2 = B (см. Приложение A.3.2):

1 B2 = IN - 1N 1 IN - 1N1 = N N N N 1 1 = IN - 1N1 - 1N1 + 1N 1 1N 1 = B.

N N N N N N2 N -=N -----------------=Далее, пусть 1 u = Y, uj = Yj, (5.13) где Yj — j-й собственный вектор матрицы B.

190 Глава 5. Случайные ошибки Очевидно, что E (uj) =0, дисперсии uj одинаковы и равны 1:

1 E( )=2IN (5.11) E u2 = E Yj Yj = Yj Yj = 1, j и uj взаимно независимы (при j = j ):

(5.11) аналогично E (ujuj ) = Yj Yj = 0.

Тогда e e (5.10) 1 1 (5.11) 1 (5.13) B =B, B2=B = B B = B = Y Y = u u. (5.14) 2 2 2 Собственные числа матрицы B, как и любой другой идемпотентной матрицы, равны либо 1, либо 0 ( — любое собственное число, — соответствующий собственный вектор):

B =, 0, 2 = = 1.

B = B2 = B = и, поскольку ранг матрицы B равен N - 1, среди ее собственных чисел имеется N - 1, равных 1, и одно, равное 0. Поэтому (5.14), в соответствии с определением случайной величины, имеющей распределение 2, дает требуемый результат (см. также Приложение A.3.2).

Случайные величины, определенные соотношениями (5.7, 5.9), некоррелированы, а, следовательно, и взаимно независимы по свойствам многомерного нормального распределения (см. Приложение A.3.2).

Действительно:

(5.3) b - = 1, N N E =2IN ( ) (5.10) 1 2 (5.12) cov(e, b) =E(e (b - ) ) = E(B 1N ) = B1N = 0.

N N Что и требовалось доказать.

Поэтому, в соответствии с определением случайной величины, имеющей t-распределение (см. также Приложение A.3.2):

(b - ) N e e /(N - 1) tN-1, 5.1. Первичные измерения и после элементарных преобразований (сокращения и замены (5.5)) получается следующий результат:

(b - ) N tN-1.

Откуда:

b ± tN-1,1-, (5.15) N где tN-1,1- — (1 - )100-процентный двусторонний квантиль tN-1-распределения.

Это — операциональная (допускающая расчет) форма доверительного интервала для. Как видно, для ее получения в (5.8) надо заменить не только на, но и 1- на tN-1,1-. Т. к. tN-1,1- > 1-, использование (5.8) с простой заменой на действительно преуменьшает доверительный интервал (преувеличивает точность расчета). Но по мере роста N (объема информации), в соответствии со свойствами t-распределения, доверительный интервал сужается (растет точность расчета), и в пределе при N он совпадает с доверительным интервалом (5.8) (с простой заменой на ).

Важным является вопрос содержательной интерпретации доверительных интервалов.

Понятно, что в рамках подхода объективной вероятности непосредственно утверждения (5.8, 5.15) не могут считаться корректными. Величина — детерминирована и не может с какой-либо вероятностью 0 < 1 - <1 принадлежать конкретному интервалу. Она может либо принадлежать, либо не принадлежать этому интервалу, т.е. вероятность равна либо 1, либо 0. Потому в рамках этого подхода интерпретация может быть следующей: если процедуру построения доверительного интервала повторять многократно, то (1 - ) · 100 процентов полученных интервалов будут содержать истинное значение измеряемой величины.

Непосредственно утверждения (5.8, 5.15) справедливы в рамках подхода субъективной вероятности.

Рассмотренная модель (5.1) чрезвычайно идеализирует ситуацию: в экономике условия, в которых измеряются величины, постоянно меняются. Эти условия представляются некоторым набором факторов zj, j =1,..., n, и модель «измерения» записывается следующим образом:

n xi = zijj + + i, i =1,..., N, j=где zij — наблюдения за значениями факторов, j, j =1,..., n, —оцениваемые параметры.

192 Глава 5. Случайные ошибки Такая модель — это предмет регрессионного анализа. Рассмотренная же модель (5.1) является ее частным случаем: формально — при n =0, по существу — c при неизменных по наблюдениям значениях факторов zij = zj ( c — const), так c что оцениваемый в (5.1) параметр в действительности равен zjj +.

Прежде чем переходить к изучению этой более общей модели, будут рассмотрены проблемы «распространения» ошибок первичных измерений (в этой главе) и решены алгебраические вопросы оценки параметров регрессии (следующая глава).

5.2. Производные измерения Измеренные первично величины используются в различных расчетах (в производных измерениях), и результаты этих расчетов содержат ошибки, являющиеся следствием ошибок первичных измерений. В этом пункте изучается связь между ошибками первичных и производных измерений, или проблема «распространения» ошибок первичных измерений. Возможна и более общая трактовка проблемы: влияние ошибок в исходной информации на результаты расчетов.

Пусть xj, j =1,..., n, — выборочные (фактические) значения (наблюдения, измерения) n различных случайных величин, j — их истинные значения, j — ошибки измерений. Если x,, — соответствующие n-компонентные векторстроки, то x = +. Предполагается, что E() =0 и ковариационная матрица ошибок E( ) равна.

Пусть величина y рассчитывается как f(x). Требуется найти дисперсию y ошибки y = y - f() измерения (расчета) этой величины.

Разложение функции f в рядТэйлора в фактической точке x по направлению - x ( = -), если в нем оставить только члены 1-го порядка, имеет вид: f() = = y - g (заменяя « » на « = ») или y = g, гд е g —град иент f в точке x f (вектор-столбец с компонентами gj = (x)).

xj Откуда E (y) =0 и E( )= y = E 2 = E g g = g g. (5.16) y Это — общая формула, частным случаем которой являются известные формулы для дисперсии среднего, суммы, разности, произведения, частного от деления ид р.

.

Пусть n =2, = 5.2. Производные измерения, y = 1 + 2 ± 2.

2 2 а) если y = x1 ± x2, то: g = ± x2 2 2 y, y = x21 + x22 +2x1x2 или = + б) если y = x1x2, то: g = 2 y2 xx+ +2.

x2 x1x, y = 1 1 + 2 - 2 или = + x2 x2 1 x1 x2 2 2 1 2 1 y 2 в) если y =, то: g = x2 x2 x4 x3 y2 x2 x2 2 2 1 xx - 2.

x1x2 y 1 Случаи (б) и (в) можно объединить: если y = x1x±1, то = + ± y2 x2 x2 x1x1 y 1 Можно назвать y, 1, 2 абсолютными, а,, —относительнымиошибкаy x1 xми, и, как только что показано, сделать следующие утверждения.

Если ошибки аргументов не коррелированы ( =0), то квадрат абсолютной ошибки суммы или разности равен сумме квадратов абсолютных ошибок аргументов, а квадрат относительной ошибки произведения или частного от деления равен сумме квадратов относительных ошибок аргументов.

Если ошибки аргументов коррелированы положительно ( > 0), то ошибка суммы или произведения возрастает (предполагается, что x1x2 > 0), а разности или частного от деления — сокращается. Влияние отрицательной корреляции ошибок аргументов противоположное.

Выражение (5.4), которое фактически дает формулу ошибки среднего, также является частным случаем (5.16).

N Действительно, в данном случае y = xi, =2IN, ипоскольку N i= 1.

.

g =, то y = 2.

.

N N В случае, если ошибки величин xj не коррелированы друг с другом и имеют одинаковую дисперсию 2 ( =2In), то y = 2g g, (5.17) т.е. чем резче меняется значение функции в точке расчета, тем в большей степени ошибки исходной информации влияют на результат расчета. Возможны ситуации, когда результат расчета практически полностью определяется ошибками «на входе».

194 Глава 5. Случайные ошибки В случае, если известны дисперсии ошибок j, а информация о их ковариациях отсутствует, можно воспользоваться формулой, дающей верхнюю оценку ошибки результата вычислений:

n y |jgj| =y, j=где j — среднеквадратическое отклонение j.

Пусть в данном случае — диагональная матрица {j}, тогд а =R, гд е R — jj корреляционная матрица ( rjj = ).

jj Тогда (5.16) преобразуется к виду:

y = g Rg.

Пусть далее |g| —вектор-столбец {|jgj|}, а W — диагональная матрица {±1} такая, что g = W |g|.

Тогда y = |g | WRW |g|. (5.18) По сравнению с R в матрице WRW лишь поменяли знаки некоторые недиагональные элементы, и поэтому все ее элементы, как и в матрице R, не превышают единицы:

WRW 1n1.

n Умножение обеих частей этого матричного неравенства справа на вектор-столбец |g| и слева на вектор строку |g | сохранит знак « », т.к. эти векторы, по определению, неотрицательны. Следовательно:

(5.18) |g | WRW |g| = y |g | 1n1 |g| = |jgj|.

n Что и требовалось доказать.

5.3. Упражнения и задачи Упражнение Дана модель xi = + i = 12 + i, i = 1,..., N. Используя нормальное распределение, в котором каждое значение ошибки i независимо, имеет среднее 0 и дисперсию 2, получите 100 выборок вектора размерности (N 1), k = = 1,..., 100, гд е N = 10 (в каждой выборке по 10 наблюдений). Прибавив к каждому элементу этой выборки число 12 получите 100 выборок вектора x.

5.3. Упражнения и задачи 1.1. Используйте 20 из 100 выборок, чтобы получить выборочную оценку bk для (bk = xik, k =1,..., 20).

i=1.2. Вычислите среднее и дисперсию для 20 выборок оценок параметра 20 1 b = bk, s2 = (bk - b)2. Сравните эти средние значения с ис20 20-k=1 k=тинными параметрами.

1.3. Для каждой из 20 выборк оцените дисперсию, используя формулу N 2 = (xi - b)2.

N - i=Пусть 2 — это оценка 2 в выборке k. Рассчитайте 2 исравните k 20k=1 k с истинным значением.

1.4. Объедините 20 выборок по 10 наблюдений каждая в 10 выборок по 20 наблюдений и повторите упражнение 1.1–1.3. Сделайте выводы о результатах увеличения объема выборки.

1.5. Повторите упражнение 1.1–1.3 для всех 100 ид ля 50 выборок и проанализируйте разницу в результатах.

1.6. Постройте распределения частот для оценок, полученных в упражнении 1.5, сравните и прокомментируйте результаты.

1.7. Постройте 95 % доверительный интервал для параметра в каждой выборке, сначала предполагая, что 2 известно, а потом при условии, что истинное значение 2 неизвестно. Сравните результаты.

Задачи 1. При каких условиях средний за ряд лет темп инфляции будет несмещенной оценкой истинного значения темпа инфляции 2. В каком случае средняя за ряд лет склонность населения к сбережению будет несмещенной оценкой истинного значения склонности к сбережению 3. Пусть x1, x2,..., xN — независимые случайные величины, распределенные нормально с математическим ожиданием и дисперсией 2.

N ixi i=Пусть b = — это оценка, N i i=196 Глава 5. Случайные ошибки – покажите, что b — относится к классу несмещенных линейных оценок;

– рассчитайте дисперсию b;

– проверьте b на состоятельность;

N – сравните b с простой средней b = xi;

N i=4. Случайная величина измерена три раза в неизменных условиях. Получены значения: 99, 100, 101. Дать оценку истинного значения этой величины и стандартную ошибку данной оценки.

5. Измерения веса студента Иванова на четырех весах дали следующие результаты: 80.5 кг, 80 кг, 78.5 кг, 81 кг. Дайте оценку веса с указанием ошибки измерения.

Pages:     | 1 |   ...   | 22 | 23 || 25 | 26 |   ...   | 82 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.