WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 20 | 21 || 23 | 24 |   ...   | 82 |

1 1 1 2 k1k2 i1,i2 i1iТеперь, раскрывая скобки в выражении для s2 и учитывая, что xi i2 = xi i2 - b0, 12 1 получаем:

1 1 1 s2 = x2 + b2 + b2 - bi xi 12 1 k1k2 i1,i2 i1i2 k1 i1 i1 k2 i2 i2 k1k2 i1 ii ---=k2bi 2 - bi xi + bi bi = s2 - s2 - s2.

2 1 1 2 1 k1k2 i2 i1 i2 k1k2 ii ---- --- --=k1bi2 =0 = ------------=Т.е. s2 = s2 + s2 + s2, что и требовалось показать.

1 2 166 Глава 4. Введение в анализ связей В силу взаимной независимости эффектов оценки коэффициентов и дисперсий эффектов остаются одинаковыми в любой модели частичного анализа (в котором рассматривается лишь часть всех возможных сочетаний факторов) и совпадают с оценками полного анализа.

Дисперсия s2 имеет K-J степеней свободы:

J K-J = (kj - 1).

J Сумма этих величин по всем J от 1 до G равна N -1. В этом легко убедиться, если раскрыть скобки в следующем тождестве:

N = ((kj - 1) + 1).

G Процедура определения степени влияния факторов на изучаемый признак может быть следующей.

На 1-м шаге выбирается сочетание факторов J1, оказывающих наибольшее влияние на изучаемый признак. Этими факторами будут такие, для которых минимума достигает показатель pv статистики Фишера s2 N - KJ1 - J1 c F1 =.

s2 - s2 KJJ1 На 2-м шаге выбирается сочетание факторов J2, для которого минимума достигает показатель pv статистики Фишера s2 + s2 N - KJ1 - KJ2 - J J2 - c 1 F2 =.

s2 - s2 - s2 KJ1 + KJJ1 J2 - И так далее. Процесс прекращается, как только показатель pv достигнет заданного уровня ошибки, например, 0.05. Пусть этим шагом будет t-й. Оставшиеся сочетания факторов формируют остаточную дисперсию. Как правило, в таком процессе сначала выбираются главные эффекты, затем парные и т.д., так что остаточную дисперсию образуют эффекты высоких порядков.

Расчетные значения изучаемого признака определяются по следующей формуле:

t xc = b0 + bI(Jl).

I l=Этим завершается рассмотрение модели полного многофакторного дисперсионного анализа без повторений.

4.4. Анализ временных рядов Несколько слов можно сказать о многофакторном дисперсионном анализе с повторениями.

Если все NI 1, можно попытаться свести этот случай к предыдущему.

Для каждой конечной группы рассчитываются среднее xI и дисперсия s2. Исполь I зуя приведенные выше формулы можно рассчитать коэффициенты и дисперсии всех эффектов, заменяя xI на xI. К сожалению, в общем случае эффекты перестают быть взаимно независимыми, и в представлении общей дисперсии (4.41) кроме дисперсий эффектов различных сочетаний факторов появляются слагаемые с нижним индексом JJ. Возникает неопределенность результатов и зависимость их от того набора сочетаний факторов, которые включены в анализ. Поэтому разные модели частичного анализа дают разные результаты, отличные от полного анализа.

Имеется несколько частных случаев, в которых «хорошие» свойства оценок сохраняются. Один из них — случай, когда все численности конечных групп одинаковы.

Тогда дисперсионное тождество записывается следующим образом:

G IK s2 = s2 + s2, J I J=1 I=I --se причем последнее слагаемое — остаточная, или внутригрупповая дисперсия — имеет N - K-G - 1 степеней свободы.

4.4. Анализ временных рядов Временным или динамическим рядом называется совокупность наблюдений xi в последовательные моменты времени i =1,..., N (обычно для индексации временных рядов используется t, в этом пункте для целостности изложения материала сохранено i). Задача анализа временного ряда заключается в выделении и моделировании 3-х его основных компонент:

xi = i + i + i, i =1,..., N, или в оценках:

xi = di + ci + ei, i =1,..., N, где i, di — тренд, долговременная тенденция, i, ci — цикл, циклическая составляющая, i, ei — случайная компонента, с целью последующего использования построенных моделей в прикладном экономическом анализе и прогнозировании.

168 Глава 4. Введение в анализ связей Для выявления долгосрочной тенденции используют различные методы.

Наиболее распространено использование полиномиального тренда. Такой тренд строится как регрессия xi на полином определенной степени относительно времени:

xi = a1i + a2i2 +... + b + ei, i =1,..., N.

Для выбора степени полинома можно использовать F -критерий: оценивают тренд как полином, последовательно увеличивая его степень до тех пор, пока удается отвергнуть нулевую гипотезу.

Трендможет быть экспоненциальным. Он строится как регрессия ln xi на полином от времени, так что после оценки параметров регрессии его можно записать в следующем виде:

xi = ea1i+a2i +...+b+ei, i =1,..., N.

Иногда тренд строится как сплайн, т.е. как некоторая «гладкая» композиция разных функций от времени на разных подпериодах.

Пусть, например, на двух подпериодах [1,..., N1] и [N1 +1,..., N] тренд выражается разными квадратическими функциями от времени (в момент времени Nпроисходит смена тенденции):

xi = a1i + a2i2 + b1 + ei1, i =1,..., N1, xi = a3i + a4i2 + b2 + ei2, i = N1 +1,..., N.

Для того чтобы общий тренд был «гладким» требуют совпадения самих значений и значений первых производных двух полиномов в точке «перелома» тенденции:

2 a1N1 + a2N1 + b1 = a3N1 + a4N1 + b2, a1 +2a2N1 = a3 +2a4N1.

Отсюда выражают, например, a3 и b2 через остальные параметры и подставляют полученные выражения в исходное уравнение регрессии. После несложных преобразований уравнение приобретает следующий вид:

xi = a1i + a2i2 + b1 + ei1, i =1,..., N1, xi = a1i + a2 i2 - (i - N1)2 + b1 + a4 (i - N1)2 + ei2, i = N1 +1,..., N.

Параметры полученного уравнения оцениваются, и, тем самым, завершается построение тренда как полиномиального сплайна.

4.4. Анализ временных рядов Для выявления долговременной тенденции применяют также различные приемы сглаживания динамических рядов с помощью скользящего среднего.

Один из подходов к расчету скользящей средней заключается в следующем: в качестве сглаженного значения xi, которое по аналогии с расчетным значением можно обозначить через xc, принимается среднее значений xi-p,..., xi,..., xi+p, i где p — полупериод сглаживания. Сам процесс сглаживания заключается в последовательном расчете (скольжении средней) xc,..., xc. При этом часто p+1 N-p теряются первые и последние p значений исходного временного ряда.

Для сглаживания могут использоваться различные средние. Так, например, при полиномиальном сглаживании средние рассчитываются следующим образом.

Пусть сглаживающим является полином q-й степени. Оценивается регрессия вида:

xi+l = a1l + a2l2 +... + aqlq + b + ei+l, l = -p,..., p, и в качестве сглаженного значения xc принимается b (расчетное значение при i l =0).

Так, при q =2 и p =2 уравнение регрессии принимает следующий вид (исключая i как текущий индекс):

x-2 -2 4 1 e- x-1 -1 1 1 a1 e-.

x0 = 0 0 1 a2 + e x1 e 1 1 1 b x2 2 4 1 eПо аналогии с (4.29), можно записать:

- -2 4 1 x- a1 -2 -1 0 1 2 -1 1 1 -2 -1 0 1 2 x- = a2 4 1 0 1 4 0 0 1 4 1 0 1 4 x0 = b 1 1 1 1 1 1 1 1 1 1 1 1 1 x 2 4 1 x170 Глава 4. Введение в анализ связей x- -14 -7 0 7 14 x- = -5 -10 -5 10 x0.

-6 24 34 24 -6 x xТаким образом, в данном случае веса скользящей средней принимаются равными [-3, 12, 17, 12, -3].

При полиномиальном сглаживании потеря первых и последних p наблюдений в сглаженном динамическом ряду не является неизбежной; их можно взять как расчетные значения соответствующих наблюдений по первому и последнему полиному (в последовательности скольжения средней).

Так, в рассмотренном примере при p = q =2:

x x xc -2a1 +4a2 + b 1 31 9 -3 -5 = = x3, xc -a1 + a2 + b 9 13 12 6 - x x xN- xN- xc a1 + a2 + b 1 -5 6 12 13 N-= = xN-2.

xc 2a1 +4a2 + b 3 -5 -3 9 N xN- xN Как видно, все эти расчетные значения являются средними взвешенными величинами с несимметричными весами.

Для выбора параметров сглаживания p и q можно воспользоваться F -критерием (применение этого критерия в данном случае носит эвристический 4.4. Анализ временных рядов характер). Для каждой проверяемой пары p и q рассчитывается сначала остаточная дисперсия:

N s2 = (xi - xc)2, e i N i=азатем F -статистика:

s2 - s2 (2p - q) c x e F =, s2q e где s2 — полная дисперсия ряда.

x Выбираются такие параметры сглаживания, при которых эта статистика (q степеней свободы в числителе и 2p - q степеней свободы в знаменателе) имеет наименьший показатель pv.

Другой способ сглаживания называется экспоненциальным. Притакомспособе в качестве сглаженного (расчетного) значения принимается среднее всех предыдущих наблюдений с экспоненциально возрастающими весами:

xc =(1 - a) alxi-l, i+l=где 0 < a < 1 — параметр экспоненциального сглаживания (xc является на i самом деле средней, т.к. al = ).

1 - a l=В такой форме процедура сглаживания неоперациональна, поскольку требует знания всей предыстории — до минус бесконечности. Но если из xc вычесть i+axc, то весь «хвост» предыстории взаимно сократится:

i xc - axc =(1 - a)xi +(1- a) alxi-l - (1 - a) al+1xi-1-l.

i+1 i l=1 l= ----------------------- -----------------= Отсюда получается правило экспоненциального сглаживания:

xc =(1 - a)xi + axc, i+1 i в соответствии с которым сглаженное значение в следующий момент времени получается как среднее фактического и сглаженного значений в текущий момент времени.

Для того чтобы сгладить временной ряд, используя это правило, необходимо задать не только a, но и xc. Эти два параметра выбираются так, чтобы минимума достигла остаточная дисперсия. Минимизация остаточной дисперсии в данном 172 Глава 4. Введение в анализ связей случае является достаточно сложной задачей, поскольку относительно a она (остаточная дисперсия) является полиномом степени 2(N - 1) (по xc — квадратичной функцией).

Пусть долговременная тенденция выявлена. На ее основе можно попытаться сразу дать прогноз моделируемой переменной (прогноз, по-видимому, будет точнее, если в нем учесть все компоненты временного ряда).

В случае тренда как аналитической функции от времени i, прогнозом является расчетное значение переменной в моменты времени N +1,, N +2,....

Процедура экспоненциального сглаживания дает прогноз на один момент времени вперед:

xc =(1 - a) xN + axc.

N+1 N Последующие значения «прогноза» не будут меняться, т.к. отсутствуют основания для определения ошибки eN+1 и т.д. и, соответственно, для наблюдения различий между xc и xN+1 ит.д.

N+При полиномиальном сглаживании расчет xc проводится по последнему поN+линому (в последовательности скольжения средней) и оказывается равным некоторой средней последних 2p +1 наблюдений во временном ряду.

В приведенном выше примере (p = q =2):

xN- xN-.

xc =(b +3a1 +9a2) = N+21 -21 -28 0 63 xN- xN- xN Определение циклической и случайной составляющей временного ряда дается во II части книги.

4.5. Упражнения и задачи Упражнение На основании информации о весе и росте студентов вашего курса:

1.1. Сгруппируйте студентов по росту и весу (юношей и девушек отдельно).

4.5. Упражнения и задачи 1.2. Дайте табличное и графическое изображение полученных совместных распределений частот, сделайте выводы о наличии связи между признаками.

1.3. С помощью критерия Пирсона проверьте нулевую гипотезу о независимости роста и веса студентов.

1.4. С помощью дисперсионного анализа установите, существенно ли влияние роста на их вес.

1.5. На основе построенной таблицы сопряженности рассчитайте средние и дисперсии роста и веса, а также абсолютную и относительную ковариацию между ними.

1.6. На основе исходных данных, без предварительной группировки (для юношей и девушек отдельно):

• Оцените с помощью МНК параметры линейного регрессионного уравнения, предположив, что переменная «рост» объясняется переменной «вес». Дайте интерпретацию полученным коэффициентам уравнения регрессии.

• Повторите задание, предположив, что переменная «вес» объясняется переменной «рост».

• Оцените с помощью МНК параметры ортогональной регрессии.

• Изобразите диаграмму рассеяния признаков роста и веса и все три линии регрессии. Объясните почему, если поменять экзогенные и эндогенные переменные местами, получаются различные уравнения.

• Для регрессионной зависимости роста от фактора веса вычислите объясненную и остаточную дисперсию, рассчитайте коэффициент детерминации и с помощью статистики Фишера проверьте статистическую значимость полученного уравнения.

Упражнение Дана таблица (табл. 4.1, индекс Доу—Джонса средних курсов на акции ряда промышленных компаний).

2.1. Изобразить данные, представленные в таблице, графически.

2.2. Найти оценки параметров линейного тренда. Вычислить и изобразить графически остатки от оценки линейного тренда.

2.3. На основе данных таблицы 174 Глава 4. Введение в анализ связей Таблица 4.Год Индекс Год Индекс Год Индекс 1897 45.5 1903 55.5 1909 92.1898 52.8 1904 55.1 1910 84.1899 71.6 1905 80.3 1911 82.1900 61.4 1906 93.9 1912 88.1901 69.9 1907 74.9 1913 79.1902 65.4 1908 75.• произвести сглаживание ряда с помощью процедуры, основывающейся на q =1 и p =3 (q — степень полинома, p — полупериодсглаживания);

• произвести сглаживание ряда с помощью процедуры, основывающейся на q =2 и p =2.

2.4. Сравнить сглаженный ряд с трендом, подобранным в упражнении 2.2.

Задачи 1. Используя интенсивность цвета для обозначения степени концентрации элементов в группах, дайте графическое изображение совокупности, характеризующейся:

а) однородностью и прямой зависимостью признаков (x1, x2) ;

б) однородностью и обратной зависимостью признаков (x1, x2) ;

в) неоднородностью и прямой зависимостью признаков (x1, x2) ;

г) неоднородностью и обратной зависимостью признаков (x1, x2) ;

д) неоднородностью и отсутствием связи между признаками (x1, x2).

2. Пусть заданы значения (x1, x2). Объясните, какие приемы следует применять для оценки параметров следующих уравнений, используя обычный метод наименьших квадратов:

а) x1 = x;

б) x2 = ex1;

в) x1 = + ln(x2);

г) x1 = x2/( + x2);

д) x1 = + /( - x2).

4.5. Упражнения и задачи 3. Может ли матрица 2 3 4 а) б) 3 4 2 являться ковариационной матрицей переменных, для которых строятся уравнения регрессии Ответ обосновать.

4. Наблюдения трех пар (x1, x2) дали следующие результаты:

x2 =41, x2 =14, xi1xi2 =23, xi1 =9, xi2 =6.

i1 ii i i i i Оценить уравнения прямой, обратной и ортогональной регрессии.

5. Построить уравнения прямой, обратной и ортогональной регрессии, если а) X1 =(1, 2, 3),X2 =(1, 0, 5) ;

б) X1 =(0, 2, 0, 2),X2 =(0, 0, 2, 2) ;

в) X1 =(0, 1, 1, 2),X2 =(1, 0, 2, 1).

Pages:     | 1 |   ...   | 20 | 21 || 23 | 24 |   ...   | 82 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.