WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 21 | 22 || 24 | 25 |   ...   | 82 |

Нарисовать на графике в пространстве переменных облако наблюдений и линии прямой, обратной и ортогональной регрессии. Вычислить объясненную, остаточную дисперсию и коэффициент детерминации для каждого из построенных уравнений регрессии.

6. Какая из двух оценок коэффициента зависимости баллов, полученных на экзамене, от количества пропущенных занятий больше другой: по прямой или по обратной регрессии.

7. В регрессии x1 = a12x2 +1N b1 + e1, фактор x1 равен (1, 3, 7, 1). Параметры регрессии найдены по МНК. Могут ли остатки быть равными:

а) (1, -2, 2, 1) ;

б) (1, -2, 1, -1).

8. Для рядов наблюдений x1 и x2 известны средние значения, которые равны соответственно 10 и 5. Коэффициент детерминации в уравнениях регрессии x1 на x2 равен нулю. Найти значения параметров простой регрессии xпо x2.

9. В регрессии x1 = a12x2 +14b1 + e1, гд е x2 =(5, 3, 7, 1), получены оценки a12 = 2, b1 = 1, а коэффициент детерминации оказался равным 100%.

Найти вектор фактических значений x1.

176 Глава 4. Введение в анализ связей 10. Изобразите на графике в пространстве двух переменных облако наблюдений и линию прямой регрессии, если коэффициент корреляции между переменными:

а) положительный;

б) равен единице;

в) отрицательный;

г) равен минус единице;

д) равен нулю.

11. Существенна ли связь между зарплатой и производительностью труда по выборке из 12 наблюдений, если матрица ковариаций для этих показателей 9 имеет вид.

6 12. Оцените параметры ортогональной регрессии и рассчитайте остаточную дисперсию и коэффициент детерминации для переменных, у которых матрица 9 ковариаций равна, а средние значения равны 3 и 4.

6 13. Имеются данные об объемах производства по четырем предприятиям двух отраслей, расположенным в двух регионах (млн. руб):

Отрасль 1 Регион 1 48 2 20 Рассчитать эффекты взаимодействия, факторную и общую дисперсии.

14. Имеются данные об инвестициях на предприятиях двух отраслей:

Инвестиции Предприятие (млн. руб.) 1 Отрасль 2 3 4 Отрасль 2 5 6 4.5. Упражнения и задачи Рассчитать групповую, межгрупповую и общую дисперсии.

15. Имеются данные об урожайности культуры (в ц/га) в зависимости от способа обработки земли и сорта семян:

Способы обработки земли (B) Сорт семян (A) 1 2 3 1 16 18 20 2 20 21 23 3 23 24 26 С помощью двухфакторного дисперсионного анализа оценить, зависит ли урожайность культуры от сорта семян (A) или от способа обработки земли.

16. Запишите систему нормальных уравнений оценивания параметров полиномиального тренда первой, второй и третей степеней.

17. Перенесите систему отсчета времени в середину ряда, т.е. i =... -3; -2;

-1; 0; 1; 2; 3..., и перепишите систему нормальных уравнений для полиномиального тренда первой, второй и третей степеней. Как изменится вид системы Найдите оценку параметров многочленов в явном виде из полученной системы уравнений.

18. По данным о выручке за 3 месяца: 11, 14, 15 — оцените параметры полиномиального тренда первой степени и сделайте прогноз выручки на четвертый месяц.

19. Имеются данные об ежедневных объемах производства (млн. руб.):

День 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Объем 9 12 27 15 33 14 10 26 18 24 38 28 45 32 Проведите сглаживание временного ряда, используя различные приемы скользящего среднего:

а) используя полиномиальное сглаживание;

б) используя экспоненциальное сглаживание.

20. Оценена регрессия xi = + s sin(i) +c cos(i) +i для частоты /2.

При этом s =4 и c =3. Найти значения амплитуды, фазы и периода.

21. Что называется гармоническими частотами Записать формулу с расшифровкой обозначений.

22. Что такое частота Найквиста Записать одним числом или символом.

178 Глава 4. Введение в анализ связей 23. Строится регрессия с циклическими компонентами:

k xi = + (sj sin(ji) +cj cos(ji)) + i, i =1,..., 5, k =2.

j=Запишите матрицу ковариаций факторов для данной регрессии.

Рекомендуемая литература 1. Доугерти К. Введение в эконометрику. — М.: «Инфра-М», 1997. (Гл. 2).

2. Кендэл М. Временные ряды. — М.: «Финансы и статистика», 1981. (Гл. 3–5, 8).

3. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика — начальный курс. — М.: «Дело», 2000. (Гл. 2).

Часть II Эконометрия — I:

Регрессионный анализ Это пустая страница В этой части развиваются положения 4-й главы «Введение в анализ связей» I-й части книги. Предполагается, что читатель знаком с основными разделами теории вероятностей и математической статистики (функции распределения случайных величин, оценивание и свойства оценок, проверка статистических гипотез), линейной алгебры (свойства матриц и квадратичных форм, собственные числа и вектора). Некоторые положения этих теорий в порядке напоминания приводятся в тексте.

В частности, в силу особой значимости здесь дается краткий обзор функций распределения, используемых в классической эконометрии (см. также Приложение A.3.2).

Пусть — случайная величина, имеющая нормальное распределение с нулевым математическим ожиданием и единичной дисперсией ( N(0, 1)). Функция плотности этого распределения прямо пропорциональна e- ; 95-процентный двусторонний квантиль 0.95 равен 1.96, 99-процентный квантиль — 2.57.

Пусть теперь имеется k таких взаимно независимых величин l N(0, 1), k l =1,..., k. Сумма их квадратов 2 является случайной величиной, имеюl=1 l щей распределение 2 c k степенями свободы (обозначается 2 ). Математическое k ожидание этой величины равно k, а отношение 2/k при k стремится к 1, k т.е. в пределе 2 становится детерминированной величиной. 95-процентный (односторонний) квантиль 2 при k =1 равен 3.84 (квадрат 1.96), при k =5 — k,0.11.1, при k =20 — 31.4, при k = 100 — 124.3 (видно, что отношение 2 /k k,0.приближается к 1).

Если две случайные величины и 2 независимы друг от друга, то случайная k величина tk = имеет распределение t-Стьюдента с k степенями свободы.

2/k k - k+t2 k Ее функция распределения пропорциональна 1+ ; в пределе при k k она становится нормально распределенной. 95-процентный двусторонний кван тиль tk, 0.95 при k = 1 равен 12.7, при k = 5 — 2.57, при k = 20 — 2.09, при k = 100 — 1.98, т.е. стремитсяк 0.95.

Если две случайные величины 2 и 2 не зависят друг от друга, то случайная k1 k2 /kkвеличина Fk,k2 = имеет распределение F -Фишера с k1 и k2 степенями 2 /kkсвободы (соответственно, в числителе и знаменателе). При k2 эта случайная величина стремится к 2 /k1, т.е. k1Fk, = 2. Очевидно также, что F1,k = t2.

k1 1 k1 2 k 95-процентный (односторонний) квантиль F1,k,0.95 при k2 = 1 равен 161, при k2 =5 — 6.61, при k2 =20 — 4.35, при k2 = 100 — 3.94 (квадраты соответ ствующих tk,0.95); квантиль F2,k,0.95 при k2 =1 равен 200, при k2 =5 — 5.79, при k2 =20 — 3.49, при k2 = 100 — 3.09; квантиль Fk,20,0.95 при k1 =3 равен 3.10, при k1 =4 — 2.87, при k1 =5 — 2.71, при k1 =6 — 2.60.

Глава Случайные ошибки Задачей регрессионного анализа является построение зависимости изучаемой случайной величины x от факторов z :

x = f(z, A) +, где A — параметры зависимости.

Если z — истинный набор факторов, полностью определяющий значение x, а f — истинная форма зависимости, то — случайные ошибки измерения x.

Однако в экономике весьма ограничены возможности построения таких истинных моделей, прежде всего потому, что факторов, влияющих на изучаемую величину, слишком много. В конкретных моделях в лучшем случае наборы z включают лишь несколько наиболее значимых факторов, и влияние остальных, неучтенных, факторов определяет. Поэтому называют просто случайными ошибками или остатками.

В любом случае считают, что — случайные величины с нулевым математическим ожиданием и, как правило, нормальным распределением. Последнее следует из центральной предельной теоремы теории вероятностей, поскольку по своему смыслу является результатом (суммой) действия многих мелких малозначимых по отдельности факторов случайного характера.

Действительно, в соответствии с этой теоремой, случайная величина, являющаяся суммой большого количества других случайных величин, которые могут иметь различные распределения, но взаимно независимы и не слишком различаются между собой, имеет асимптотически нормальное распределение, т.е. чем больше случайных величин, тем ближе распределение их суммы к нормальному.

5.1. Первичные измерения 5.1. Первичные измерения Пусть имеется N измерений xi, i =1,..., N, случайной величины x, т.е. N наблюдений за случайной величиной. Предполагается, что измерения проведены в неизменных условиях (факторы, влияющие на x, не меняют своих значений), и систематические ошибки измерений исключены. Тогда различия в результатах отдельных наблюдений (измерений) связаны только с наличием случайных ошибок измерения:

xi = + i, i =1,..., N, (5.1) где — истинное значение x, i — случайная ошибка в i-м наблюдении. Такой набор наблюдений называется выборкой.

Понятно, что это — идеальная модель, которая может иметь место в естественнонаучных дисциплинах (в управляемом эксперименте). В экономике возможности измерения одной и той же величины в неизменных условиях практически отсутствуют. Определенные аналогии с этой моделью возникают в случае, когда некоторая экономическая величина измеряется разными методами (например, ВВП — по производству или по использованию), и наблюдениями выступают результаты измерения, осуществленные этими разными методами. Однако эта аналогия достаточно отдаленная, хотя бы потому, что в модели N предполагается достаточно большим, а разных методов расчета экономической величины может быть в лучшем случае два-три. Тем не менее, эта модель полезна для понимания случайных ошибок.

Если X и — вектор-столбцы с компонентами, соответственно, xi и i, а 1N — N -мерный вектор-столбец, состоящий из единиц, то данную модель можно записать в матричной форме:

X =1N +. (5.2) Предполагается, что ошибки по наблюдениям имеют нулевое математическое ожидание в каждом наблюдении: E (i) = 0, i = 1,..., N; линейно не зависят друг от друга: cov (i, j) =0, i = j; а их дисперсии по наблюдениям одинаковы:

var (i) =2, i =1,..., N или, в матричной форме: E ( ) =IN 2, гд е 2 — дисперсия случайных ошибок или остаточная дисперсия, IN — единичная матрица размерности N. Это—обычныегипотезы относительно случайных ошибок.

Требуется найти b и ei — оценки, соответственно, и i. Для этого используется метод наименьших квадратов (МНК), т.е. искомые оценки определяются N N так, чтобы (xi - b)2 = e2 = e e min!, гд е e вектор-столбец оценок ei.

i i=1 i=184 Глава 5. Случайные ошибки В результате, N 1 b = = xi = 1 X, e = X - 1N b, x N N N i=de e d2e e т.к. = -2 (xi - b) =0. Кроме того, =2N> 0, следовательно, в данdb dbной точке достигается минимум, т.е. МНК-оценкой истинного значения измеряемой величины является, как и следовало ожидать, среднее арифметическое по наблюдениям, а среднее МНК-оценок остатков равно нулю:

= 1 (X - 1Nb) = - b =0.

x N N Оценка b относится к классу линейных, поскольку линейно зависит от наблюдений за случайной величиной.

Полученная оценка истинного значения является несмещенной (т.е. ее математическое ожидание равно истинному значению оцениваемого параметра), что можно легко показать.

Действительно:

1 (5.1) 1 b = xi = ( + i) = + i, (5.3) N N N — детер минировано 1 E(i)=E (b) = + E (i) =.

N Что и требовалось доказать.

Однако несмещенной оценкой является и любое наблюдение xi, т.к. из (5.1) следует, что E (xi) =.

Легко установить, что оценка b лучше, чем xi, т.к. имеет меньшую дисперсию (меньшую ошибку), то есть является эффективной. Более того, b — наилучшая в этом смысле оценка во множестве всех возможных линейных несмещенных оценок. Ее дисперсия минимальна в классе линейных несмещенных оценок и определяется следующим образом:

b = 2, (5.4) N т.е. она в N раз меньше, чем дисперсия xi, которая, как это следует из (5.1), равна 2.

5.1. Первичные измерения Действительно, множество всех линейных оценок по определению представляется следующим образом:

N b = dixi, i=где di — любые детерминированные числа.

Из требования несмещенности, E (b) =, следует, что di =1, т.к.

di — детер минировано E (b) =E dixi = di E (xi) = di.

- Таким образом, множество всех линейных несмещенных оценок описывается так:

N N b = dixi, di =1.

i=1 i=В этом множестве надо найти такую оценку (такие di), которая имеет наименьшую дисперсию, (5.1) b = dixi = di + dii, -= откуда b - = dii, и можно рассчитать дисперсию b :

var(b) =b = E (b - E(b)2 = E 2 =( ) E(ii )= i = E dii = d2E(2) = 2 d2.

i i i Минимум d2 при ограничении di =1 достигается, если все di одинаковы i 1 2 иравны, т.е. если b = b. Отсюда, в частности, следует, что b = 2.

N N Что и требовалось доказать.

Такие оценки относятся к классу BLUE — Best Linear Unbiased Estimators.

Кроме того, оценка b состоятельна (стремится при N к истинному значению параметра), т.к. она несмещена и ее дисперсия, как это следует из (5.4), при N стремится к 0.

186 Глава 5. Случайные ошибки Чтобы завершить рассмотрение данного случая, осталось дать оценку остаточной дисперсии. Естественный «кандидат» на эту «роль» — дисперсия x :

1 1 s2 = (xi - b)2 = ei = e e, N N N — дает смещенную оценку. Для получения несмещенной оценки остаточной дисперсии сумму квадратов остатков надо делить не на N, ана N - 1 :

2 = e e, (5.5) N - поскольку в векторе остатков e и, соответственно, в сумме квадратов остатков e e линейно независимых элементов только N - 1 (т.к. 1 e =0). Этот факт можно N доказать строго.

Если просуммировать по i соотношения (5.1) и поделить обе части полученного выражения на N, то окажется, что b = + i. Кроме того, известно, что N xi = + i = b + ei. Объединяя эти два факта можно получить следующее выражение:

ei = i - i, (5.6) N (т.е. оценки остатков равны центрированным значениям истинных случайных ошибок), и далее получить 2 1 1 e e = i - i = 2 - i + i = i N N N = 2 - i.

i N Наконец:

E 2 =2, E(ii )=( ) i E (e e) =(N - 1) 2, т.е.

E e e = 2.

N - Что и требовалось доказать.

Теперь относительно случайных ошибок вводится дополнительное предположение: они взаимно независимы (а не только линейно независимы) и распре делены нормально: i NID 0, 2. NID расшифровывается как normally and 5.1. Первичные измерения independently distributed (нормально и независимо распределенные случайные величины). Тогда становится известной функция плотности вероятности i :

1 1 1 2 (xi-)2 f (i) =(2)- -1e- 22 i =(2)- -1e-, и функция совместной плотности вероятности (произведение отдельных функций плотности, так как случайные ошибки по наблюдениям взаимно независимы) (см. Приложение A.3.2):

N (xi-)f (1,..., N ) =(2)- -N e-.

Pages:     | 1 |   ...   | 21 | 22 || 24 | 25 |   ...   | 82 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.