WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 13 | 14 || 16 | 17 |   ...   | 22 |

«Практическое руководство ТРЕТЬЕ ИЗДАНИЕ НЭРЕШ К. МАЛХОТРА Технологический институт штата Джорджия вильямс WT Москва • Санкт-Петербург • Киев 2002 ББК88.5Я75 М19 УДК 681.3.07 Издательский ...»

-- [ Страница 15 ] --

Две независимые выборки Если необходимо сравнить различие в показателях центратьной тенденции двух генеральных совокупностей, исходя из наблюдений из двух независимых выборок, а переменная измерена на основании порядковой шкалы, то можно использовать {/-критерий Манна—Уитни (Mann-Whitney /-test) [22]. Этот критерий соответствует /-критерию двух независимых выборок, переменные которых выражены в интервальной шкале, когда предполагают, что дисперсии двух совокупностей равны. При использовании {/-критерия Манна—Уитни две выборки объединяют и наблюдения ранжируют в порядке возрастания. Тест-статистику U вычисляют как число повторений рангов из одной выборки или группы 1, которое стоит впереди рангов из группы 2. Если выборки взяты из одной совокупности, распределение рангов из двух групп в ранжированном перечне должно быть случайным. Экстремальное значение (/-статистики свидетельствует о неслучайном характере, указывая на неравенство двух групп. Для выборок размером меньше 30 вычисляют точное значение уровня значимости для ^/-статистики, Для выборок большого размера Uстатистику преобразуют в нормально распределенную ^-статистику, которую можно скорректировать с учетом совпадений внутри рангов. ^/-критерий Манна-Уитни (Mann-Whitney (Atest) Статистический критерий для переменной, измеренной с помощью порядковой шкалы, который сравнивает различие в показателях положения двух совокупностей, исходя из наблюдений, взятых из двух независимых выборок. Мы снова рассмотрим различие использования Internet мужчинами и женщинами, обратившись к {/-критерию Манна—Уитни. Результаты приведены в табл. 15.17.

Таблица 15.17. {/-критерий Манна-Уитни (/-критерий Манна-Уитни и W-критерий парных сравнений Уилкоксона Зависимость степени использования Internet от пола Пол Мужчины Женщины Итого U 31, Средний ранг 20,93 10,07 W 151, Количество случаев 15 15 30 z - 3, Откорректированная вероятность р Примечание. U ~ тест-статистика Манна-Уитни, i — U-статистика, преобразованная в нормально распределенную z-статистику. Из данных таблицы обнаруживается значительное различие между двумя группами, подкрепляющее изложенные результаты проверки двух независимых выборок с помощью Г-критерия. Поскольку ранги присвоены в порядке возрастания наблюдений, то более высоW— W-статистика Уилкоксона, Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез кое среднее значение ранга для мужчин (20,93) свидетельствует, что они интенсивнее используют Internet по сравнению с женщинами (среднее значение ранга 10,7). Исследователи часто хотят проверить различия в долях, полученных из анализа двух независимых выборок. В качестве альтернативы параметрической г-статистики можно использовать процедуру кросс-табуляции, чтобы выполнить проверку с помощью критерия хиквадрат [23]. В этом случае имеем таблицу 2 x 2. Одну переменную используем для обозначения выборки, допустим, значение 1 — для выборки 1, а значение 2— для выборки 2. Другая переменная будет интересующей нас двоичной переменной. Два других непараметрических метода проверки независимых выборок— это медианный критерий и критерий Колмогорова—Смирнова. Двухвыборочный медианный критерий (twosample median test) определяет, действительно ли две группы взяты из совокупностей с одной и той же медианой. Медианный критерий не такой мощный, как ^/-критерий Манна—Уитни, поскольку он попросту использует показатель положения каждого наблюдения относительно медианы, а не ранг каждого наблюдения. Двухвыборочный медианный критерий (two-sample median test) Непараметрический метод проверки, который определяет, действительно ли две группы взяты из совокупностей с одной и той же медианой. Медианный критерий не такой мощный, как U-критерий Манна-Уитни. Двухвыборочный критерий Колмогорова—Смирнова (Kolmogorov-Smirnov two-sample test) проверяет, действительно ли две совокупности подчиняются одному и тому же закону распределения. Он учитывает любые различия между двумя распределениями, включая медиану, вариацию и асимметрию, о чем свидетельствует приведенный ниже пример. Двухвыборочный критерий Колмогорова-Смирнова (Kolmogorov-Smirnov two-sample test) Непараметрический метод проверки, действительно ли две совокупности подчиняются одному и тому же закону распределения. Этот критерий учитывает любые различия между двумя распределениями, включая медиану, вариацию и асимметрию. ПРИМЕР. Большой бизнес: так ли просто поменять стартегию? Как руководители маркетинговых компаний и их клиенты — компании из списка Fortune 500— представляют себе роль маркетинговых исследований в изменении маркетинговой стратегии? Обнаружено, что руководители маркетинговых компаний, в отличие от своих клиентов, положительно смотрят на изменение стратегии и не склонны откладывать начало изменений. Выраженные в процентах ответы на один из пунктов опроса "Должны ли вноситься изменения в маркетинговую стратегию фирмы при первой возможности" приведен ниже. С помощью критерия Колмогорова—Смирнова показано (в таблице), что различия в определении роли маркетинI говых исследований статистически значимы при уровне значимости 0,05 [24].

;

Роль маркетингового исследования в выработке стратегии Ответы (%) Выборка D U п 77 Должны Предпочтитель И могут, и не обязательно но должны могут 7 26 15 43 Предпочтитель Абсолютно не но не должны должны 19 Уровень значимости К - С = 0,05 'D — руководители маркетинговых компаний;

U — клиенты маркетинговых компаний.

Часть III. Сбор, подготовка и анализ данных В этом примере руководители маркетинговых компаний и их клиенты представляют две независимые выборки. Однако выборки не всегда независимые. В случае парных выборок следует использовать другой набор критериев.

Парные выборки Важным непараметрическим критерием для изучения различий в показателях центральной тенденции двух генеральных совокупностей на основе парных наблюдений является критерий попарных сравнений Уилкоксона (Wilcoxon matched-pairs signed-ranks test). С его помощью анализируется величина разностей между парными наблюдениями. В этом методе вычисляют разности между парами переменных и ранжируют абсолютные значения разностей. На следующем этапе суммируют положительные и отрицательные ранги. Далее на основании положительных и отрицательных сумм рангов рассчитывают г-статистику. В соответствии с нулевой гипотезой, утверждающей об отсутствие различий, z представляет собой случайную величину, распределенную по нормальному закону, со значением медианы, равным 0, и дисперсией 1 для больших выборок. Критерий Уилкоксона соответствует рассмотренному ранее парному f-критерию [25]. Критерий попарных сравнений Уилкоксона (Wilcoxon matched-pairs signed-ranks test). Непараметрический метод проверки, посредством которого анализируют разности между парными наблюдениями, учитывая их величину. Рассмотрим еще раз пример, приведенный для парного /-критерия и касающийся наличия различий в отношении респондентов к Internet и Internet-технологиям. Допустим, что обе эти переменные измерены с помощью порядковой шкалы, а не интервальной. В соответствии с этим используем критерий Уилкоксона. Результаты приведены в табл. 15.18.

Таблица 15.18. Критерий попарных сравнений Уилкоксона internet с Internet-технологиями (Internet-технологии - internet} - Ранги +- Ранги Совпадающие ранги Итого г = -4,207 Число случаев н м^^^н^ н^^^^^^^ М ^^^^^ ^ н ^^^^ ^м ^^^^^^^В Н^^^^НН Средний ранг 12, 1 7, Вероятность для двусторонней проверки р= 0, Здесь снова выявлено различие в переменных, и результаты согласуются с выводами, сделанными на основании парного /-критерия. В данном случае мы имеем 23 отрицательные разности (респонденты лучше относятся к Internet, чем к Internet-технологиям). Средний ранг их равен 12,72. С другой стороны, есть только одна положительная разность (один респондент лучше относится к Internet-технологиям, чем к Internet). Средний ранг этой разности равен 7,50. Кроме того, есть 6 совпадающих рангов, т.е. 6 одинаковых значений обеих переменных. Эти числа показывают, что респонденты лучше относятся к Internet, чем к Internetтехнологиям. Кроме того, вероятность соответствующей ^-статистики меньше, чем 0,05, свидетельствует о том что различие в отношениях действительно значимое. Критерий знаков (sign test) Непараметрический критерий для изучения разностей в показателях центральной тенденции двух генеральных совокупностей на основе парных наблюдений, который только сравнивает знаки разностей между парами переменных, но не учитывает величину разностей.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез Другой непараметрический метод парной проверки — критерий знаков (sign test) [26]. Он не такой мощный, как критерий Уилкоксона, поскольку только сравнивает знаки разностей между парами переменных, не учитывая величину разностей. В особом случае двоичной переменной, когда исследователь желает проверить разности в долях, можно использовать критерий Мак-Немара. В противном случае можно использовать критерий хи-квадрат. Различные параметрические и непараметрические критерии для различий обобщены в табл. 15.19.

Таблица 15.19. Проверка гипотез о различиях: итог Выборка Одна выборка Одна выборка Распределения Неметрическая Критерии согласия Колмогорова-Смирнова и хиквадрат Критерий серий Биномиальный тест согласия для дихотомических переменных (-критерий, если дисперсия неизвестна z-критерий, если дисперсия известна Одна выборка Доли Метрическая z -критерий Две независимые выборки Две независимые выборки Распределения Две независимые выборки Средние Две независимые выборки Доли Две независимые выборки Ранги/Медианы Парные выборки Парные выборки Парные выборки Парные выборки Средние Доли Ранги/Медианы Метрическая Неметрическая Неметрическая Парный (-критерий Критерий Мак-Немара для двоичных переменных. Критерий хи-квадрат Критерий попарных сравнений Уилкоксона более мощный, чем критерий знаков Неметрическая Метрическая Метрическая Неметрическая Неметрическая Двухвыборочный критерий КолмогороваСмирнова для проверки эквивалентности двух распределений Двугрупповой (-критерий F-критерий для равенства дисперсий z-критерий критерий хи-квадрат f-критерий Манна-Уитни более мощный, чем медианный критерий Применение Шкала измерения Критерий/Комментарии Одна выборка Средние Метрическая Критерии в табл. 15.19 легко соотнести с представленными на рис. 15.9. Табл. 15.19 делит критерии для распределений и для рангов/медиан. Врезка 15.1 "Практика маркетинговых исследований" показывает использование проверки гипотез в стратегии международного брэндинга, в то время как врезка 15.2 "Практика маркетинговых исследований" излагает использование описательных статистик в исследованиях по этике. Врезка 15.1. Практика маркетинговых исследований Стратегия международного брэндинга С 1990-х годов наблюдается тенденция к глобальному маркетингу. Как можно продавать фирменный товар за границей, учитывая многообразие исторических и культурных традиций? По словам Боба Кролла (Bob Kroll), бывшего президента компании Del Monte Часть III. Сбор, подготовка и анализ данных International', преимуществом может стать унифицированная упаковка, также важно удовлетворение кулинарных вкусовых предпочтений в каждой стране. Эту мысль проясняет одно из последних международных маркетинговых исследований. В настоящее время руководители маркетинговых компаний считают, что лучше мыслить глобально, а действовать — локально. В число респондентов вошли 100 менеджеров по управлению продуктом и сотрудники маркетинговых служб из некоторых наиболее крупных пищевых, фармацевтических и других компаний США. 39% ответили, что использование унифицированной упаковки на зарубежных рынках — неудачная идея, а 38% поддержали ее. Однако те, кто были за то, чтобы упаковка разрабатывалась для каждой страны, пожелали, чтобы упаковка все-таки была как можно ближе к своему оригиналу, независимо от страны, где продается данный товар. Но они также считали необходимым, чтобы упаковка товара соответствовала языковым особенностям и требованиям различных рынков. Исходя из этих положений, подходящим поисковым вопросом такого исследования мог стать следующий: "Предпочитают ли потребители в разных странах покупать товары фирм с известной всему миру товарной маркой в различной упаковке, соответствующей местным требованиям?" На основании такого поискового вопроса выдвинем гипотезу о том (при всех других равных условиях), что предложение фирменного товара в специально разработанной упаковке может увеличить его долю рынка. Гипотезу можно сформулировать так: Я0: Для хорошо известного фирменного товара доработанная для местных рынков упаковка не увеличит долю на международном рынке. //,: При равных прочих условиях для хорошо известного фирменного товара доработанная для местных рынков упаковка увеличит долю на международном рынке. Для проверки нулевой гипотезы в качестве хорошо известного фирменного товара можно выбрать зубную пасту фирмы Colgate, которая придерживалась смешанной стратегии. Долю рынка в странах со стандартной упаковкой можно сравнить с долей рынка в странах с доработанной для местных рынков упаковкой при контроле влияния других факторов. Можно использовать /-критерий для двух независимых выборок [28].

Врезка 15.2. Практика маркетинговых исследований Недоверие, подтвержденное статистически Описательные статистики указывают на то, что общественное восприятие этики в бизнесе и, таким образом, этики в маркетинге, слабое. В опросе, проведенном Business Week, 46% респондентов ответили, что только этические принципы руководителей компаний справедливы. Опрос журнала Time показал, что 76% американцев считают, что менеджерам компаний (и, таким образом, исследователям) не хватает этики поведения, и это отсутствие морали снижает нравственные стандарты в Соединенных Штатах Америки. Результаты исследования бизнесменов, проведенные Туше Росс (louche Ross), показали, что мораль является серьезным вопросом и предположение масс-медиа об отсутствии морали в бизнес-кругах не преувеличено [29].

ИСПОЛЬЗОВАНИЕ INTERNET И КОМПЬЮТЕРА Все три стандартных статистических пакета (SPSS, SAS, BMDP) имеют схожие функции для вычисления распределения частот, построения таблиц сопряженности признаков и проверки гипотезы. Основные программы для вычисления распределения частот следующие: FREQUENCIES (SPSS), UNIVARIATE (SAS) и 2D (BMDP). Другие программы определяют только распределение частот (FREQ в SAS, 4D в BMDP) или только некоторые статистики [27].

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез Компьютерные программы для анализа распределения частот SPSS Основная программа в SPSS — FREQUENCIES. С ее помощью строится таблица значений частот, частостей и накопленных частостей для значений каждой переменной. Она проводит расчет всех необходимых статистик, за исключением коэффициента вариации. Если данные интервальные и требуется определить только итоговые статистики, то можно использовать процедуру DESCRIPTIVES. Все статистики, которые вычисляют с помощью DESCRIPTIVES, доступны и в FREQUENCIES. Однако DESCRIPTIVES эффективнее, поскольку она не сортирует значения в таблице частот. Дополнительная программа MEANS вычисляет среднее значение и стандартное отклонение для зависимой переменной в подгруппах случаев, определяемых независимыми переменными.

SAS Основная программа в SAS — UNIVARIATE. В дополнение к определению таблицы частот, эта программа позволяет вычислить все необходимые статистики. Другая доступная процедура — FREQ, Для одномерного распределения частот FREQ не дает ни одной необходимой статистики. Для определения итоговых статистик используются такие процедуры, как MEANS, SUMMARY и TABULATE. Следует отметить, что FREQ недоступна в качестве независимой программы в микрокомпьютерной версии, BMDP Главная процедура в BMDP — 2D, она позволяет определять распределение частот и все ассоциированные статистики, за исключением коэффициента вариации. С помощью ID можно вычислить итоговые статистики для интервальных данных, но нельзя вычислить распределение частот. 4D вычисляет распределение частот для метрических и неметрических данных, но не позволяет вычислить итоговые статистики. Minitab Главная функция — Stats1^Descriptive Statistics. Выходные величины включают среднее, медиану, стандартное отклонение, минимум, максимум и квартили. Гистограмму можно получить при выборе опции Graph^Histogram.

Excel С помощью функции ToolsOData Analysis (Инструменты"=> Анализ данных) вычисляют дескриптивные статистики. Можно определить среднее, стандартную ошибку, медиану, моду, стандартное отклонение, дисперсию, эксцесс, асимметрию, размах, минимум, максимум, сумму и доверительный интервал. Частоты можно отобразитьть с помошью гистограммы. Основные программы для построения таблиц сопряженности признаков— CROSSTABS (SPSS), FREQ (SAS) и 4F (BMDP). Все они могут строить таблицы сопряженности и вычислять данные для ячеек, проценты для категорий в рядах и колонках, высчитывать критерий хиквадрат для определения уровня значимости и все рассмотренные показатели силы связи. Программу TABULATE (SAS) также можно использовать для получения данных для ячеек, процентов рядов и колонок, хотя она не вычисляет ни одной ассоциированной статистики. В программе Minitab таблицы сопряженности и критерий хи-квадрат вычисляют с помощью функции Stats'*Tables. Каждую из этих характеристик можно выбрать с помощью функции Tables. Функция Data1^Pivot Table выполняет построение таблиц сопряженности в программе Excel. Для дополнительного анализа необходимы такие функции: максимум, минимум, среднее или стандартное отклонение. Расчеты можно провести также на основе других ячеек. Для ChiTest можно воспользоваться функцией Insert^Function^Statistical^ChiTest.

Часть III. Сбор, подготовка и анализ данных Основная программа для выполнения проверки с помошью (-критерия в SPSS — T-TEST. Она_с помощью /-критерия проверяет как независимые, так и парные выборки. Все рассмотренные выше непараметрические методы проверки выполняются с помощью программы NPAR. В SAS используется T-TEST. Непараметрические методы проверки выполняются программой NPAR1WAY, которая проверяет гипотезу для двух независимых выборок (с помощью критерия Манна—Уитни, медианого критерия и критерия Колмогорова—Смирнова), а также вычисляет критерий Уилкоксона для парных выборок. Параметрический метод проверки с помощью /-критерия можно выполнить в BMDP, используя программы 3D, а непараметрическую проверку с помощью того же критерия — с использованием программы 3S. Параметрические критерии, доступные в Minitab с помощью функции descriptive stat, следующие: ^-критерий для средних, /-критерий для средних и двухвыборочный /-критерий. Непараметрические критерии доступны с помощью функции Stat^Time Series. Они включают следующие категории: од но выборочный знаков, Уилкоксона, Манна—Уитни, Крускала-Уэллиса, медианный, Фридмана, серий и попарных разностей. Доступные параметрические критерии в Excel и других электронных таблицах включают /-критерий: парных выборок для средних;

г-критерий: две независимые выборки, предполагающие равные дисперсии;

/-критерий: две независимые выборки при допущении неравенства дисперсий;

^-критерий: две выборки для средних и F-критерий для дисперсий двух выборок. Непараметрических критериев здесь нет.

!

В центре внимания Burke Основной инструмент, используемый большинством исследователей для анализа дан| ных, — построение таблиц сопряженности признаков (кросс-табуляция). Она позволяет окинуть быстрым взглядом распределение ответов и выявить проблемы с данными. Однако она может ввести в заблуждение, если не предпринять определенных мер. Рассмотрим такой пример. Корпорация Burke завершила исследование, представляющее большой интерес для клиента. Результаты таблиц Burke отличались от недавних результатов другой маркетинговой компании. Для разбора этого примера используем иллюстративные данные (фактические данные — частная собственность компании). Это исследование проводилось среди небольших компаний (с количеством работающих меньше 20 человек) относительно использования ими кадровых агентств как источника приема временных рабочих. Взята выборка в 100 фирм с одним работником, а также в 100 фирм с количеством работающих от 2 до 19 человек, Создана следующая таблица, Это тип таблицы привычен для обычного клиента. Получается, что 52% фирм используют помощь кадровых агентств для привлечения временных рабочих Информационный центр корпорации Burke имел данные переписи населения, показывающие, что в генеральной совокупности имелось 9,2 миллиона фирм с одним работником и только 2,5 миллиона фирм с количеством работающих от 2 до 20 человек. Взвешенная общая колонка должна выглядеть следующим образом. Количество постоянных работников, t =1 100 Использовали агентство? База 40 Да 40% 60 Нет 60% От 2 до 19 100 65% 35 35% Итого 200 105 52% 48% Репрезентативная выборка должна включать 157 фирм с одним работником и 43 фирмы от 2 до 20 человек. Тогда веса для формирования общей колонки равны 1,57 и 0,43 соответственно. Правильная таблица должна имеет следующий вид:

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез Использовали агентство?

Количество постоянных работников, t =1 От 2 до 19 База 100 100 Да 40 65 40% 65% Нет 60 35 60% 35% Взвешенный итог 200 91 45% % выборочной совокупности (выборки) —1 работник = 0,79 % выборочной совокупности (выборки) — от 2 до 20 работников = 0,21 Теперь клиенту сказали, что 45% (а не 52%) компаний с количеством работников меньше 20 человек используют кадровые агентства для приема временных работников. Может показаться, что это незначительное изменение, но когда клиент увидел последнюю таблицу, он принял решение о перестройке своего бизнеса. Никогда не формируйте итоговую колонку в таблицах, не рассмотрев истинное распределение в генеральной совокупности.

РЕЗЮМЕ Базовый анализ данных позволяет глубже проникнуть в суть явления и является основой как для выполнения последующего анализа, так и для интерпретации данных. Для каждой переменной необходимо получить распределение частот признаков (вариационный ряд). Результаты анализа отражены в таблицах частот, частостей и накопленных частот для всех значений переменной. Они показывают наличие выбросов, пропущенных или экстремальных значений. Показатели центра распределения— среднее арифметическое, медиана и мода. Вариация распределения признаков описывается размахом, дисперсией, стандартным отклонением, коэффициентом вариации и межквартильным размахом. Форму кривой распределения определяют асимметрия и эксцесс. Кросс-табуляция представляет собой процедуру создания таблиц сопряженности признаков, которые отражают совместное распределение значений двух или больше переменных. В кросс-табуляции проценты вычисляем по колонкам (к итоговой колонке) или по рядам (к итоговому ряду). Общее правило — вычисление процентов в направлении независимой переменной через зависимую переменную. Часто, чтобы лучше уяснить суть связи переменных, вводят третью переменную. Статистика хи-квадрат позволяет проверить статистическую значимость наблюдаемой связи в таблице сопряженности. С помощью фи-коэффициента, коэффициента сопряженности, V -коэффициент Крамера и коэффициента "лямбда" определяют силу связи между переменными. Для проверки гипотез о различиях используют параметрические и непараметрические методы. Из параметрических методов для проверки гипотезы относительно среднего совокупности используют /-критерий. Его различные типы подходят для проверки гипотезы, в основе которой лежит одна выборка, две независимые выборки или парные выборки. Из непараметрических методов популярны одновыборочные критерии, включающие критерий согласия Колмогорова—Смирнова, критерий хи-квадрат, критерий серий и биномиальный критерий. Для двух независимых непараметрических выборок можно использовать ^/-критерий МаннаУитни, медианный критерий и критерий Колмогорова—Смирнова. В случае парных выборок для проверки гипотезы о показателе центра распределения полезны критерий попарных сравнений Уилкоксона и критерий знаков.

ОСНОВНЫЕ ТЕРМИНЫ И ПОНЯТИЯ • /-критерий, критерий Фишера (/-test) • /"-распределение (/'-distribution) • /"-статистика (/"-statistic) • /-критерий (/-test) • /-распределение (/ -distribution) Часть III. Сбор, подготовка и анализ данных • {/-критерий Манна-Уитни (MannWhitney U-test) • К-коэффициент Крамера (Cramer's V) • г-статистики ( г -test) альтернативная гипотеза (alternative hypothesis) • асимметричная "лямбда" (asymmetric lambda) • асимметрия (skewness) • биномиальный критерий (binomial test) • вариационный ряд, распределение частот (frequency distribution) • выборочная (наблюдаемая) статистика, статистика критерия (test statistic) • гамма (gamma) • двусторонний критерий (two-tailed test) • двухвыборочный критерий согласия Колмогорова—Смирнова (Kolmogorov— Smirnov two-sample test) • двухвыборочный медианный критерий (two-sample median test) • дисперсия (variance) • коэффициент вариации (coefficient of variation) • коэффициент сопряженности признаков (contingency coefficient) • критерий знаков (sign test) • критерий попарных сравнений Уилкоксона (Wilcoxon matched-pairs signed-ranks test) • критерий серий (run test) • медиана (median) • межквартильный размах (interquartile range) • мода (mode) • мощность критерия (power of a test) • независимые выборки (independent samples) • непараметрические методы проверки гипотез (nonparametric tests) • нулевая гипотеза (null hypothesis) одновыборочный критерий согласия Колмогорова—Смирнова (Kolmogorov— Smirnov one-sample test) односторонний критерий (one-tailed test) ошибка I рода (type I error) ошибка II рода (type II error) параметрические методы проверки гипотез (parametric tests) парные выборки (paired samples) парный г -критерий (paired samples t test) показатели вариации (measures of variability) показатели центра распределения (measures of location) построение таблицы сопряженности признаков, кросс-табуляция (crosstabulation) размах вариации (range) распределение хи-квадрат (chi-square distribution) симметричная "лямбда" (symmetric lambda) средняя арифметическая, среднее (mean) стандартное (среднеквадратическое) отклонение (standard deviation) t -статистика ( t -statistic) статистика хи-квадрат (chi-square statistic) таблица сопряженности признаков (contingency table) тау b (tau b ) тау с (tau с ) уровень значимости (level of significance) фи-коэффициент (phi coefficient) эксцесс (kurtosis) УПРАЖНЕНИЯ Вопросы 1. Опишите процедуру определения частот распределения значений переменной. 2. Какие показатели центра распределения обычно вычисляют?

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 3. Определите межквартильный размах. Что он измеряет? 4. Что означает коэффициент вариации? 5. Каким образом измеряют относительную плоско верши нность или островершинность кривой распределения? 6. 7. 8. 9. Что такое асимметричное распределение? Чем отличается таблица распределения частот от таблицы сопряженности? Какое общее правило вычисления процентов при кросс-табуляции? Дайте определение ложной корреляции.

10. Что означает подавленная связь? Как ее выясняют? П. Проанализируйте причины частого использования таблиц сопряженности. Каковы ограничения их применения? 12. Представьте классификацию методов проверки гипотез. 13. Опишите обычную процедуру для выполнения проверки гипотезы с помощью /-критерия. 14. Чем отличаются параметрические и непараметрические методы проверки гипотез? 15. Какие непараметрические критерии соответствуют t -критерию двух независимых выборок для параметрических данных? 16. Какие непараметрические критерии соответствуют t -критерию парных выборок для параметрических данных?

Задачи 1. Для каждой из следующих ситуаций укажите статистический анализ, который надо провести, и подходящий для этого критерий или тест-статистику. a) Потребители оценили свое предпочтение мыла Camay по 11-балльной шкале Лайкерта. Затем они просмотрели коммерческую рекламу о мыле Camay. После этого предпочтения потребителей опять измерили. Изменила ли реклама предпочтения потребителей? b) Подчиняются ли предпочтения относительно мыла Camay закону нормального распределения? c) Маркетологи разбили одну тысячу семей на следующие группы, исходя из уровня потребления мороженного: много, средне, мало и не употребляющие. Одновременно их разделили на семьи с высоким, средним и низким доходом, Зависит ли потребление мороженого от уровня дохода? d) В исследовании, использующем репрезентативную выборку из 2000 домохозяйств из потребительской почтовой панели Market Facts, респондентов попросили проранжировать 10 универмагов, включая универмаг Sears, в порядке предпочтения. Выборка была разделена на малые и большие семьи (по медиане). Варьируются ли предпочтения покупателей относительно покупки товаров в универмаге Sears в зависимости от размера семьи? 2. Текущую рекламную кампанию для известного прохладительного напитка следует изменить, если реклама понравится менее чем 30% потребителей. a) Сформулируйте нулевую и альтернативную гипотезы. b) Обсудите ошибки I и II рода, которые могут иметь место при проверке гипотез, c) Какой статистический критерий вам следует использовать? Почему? d) Была взята случайная выборка из 300 потребителей, и 84 респондента указали, что им понравилась рекламная кампания. Стоит ли вносить в рекламную кампанию корректировку? Почему?

Часть III. Сбор, подготовка и анализ данных 3.

Сеть универмагов (10 магазинов) организовала распродажу холодильников. Количество проданных холодильников в выборке из десяти магазинов было такими: 80 110 0 40 70 80 100 50 80 30 a) Очевидно ли, что в среднем продано свыше 50 холодильников одним магазином в течение этой распродажи? Используйте а = 0,05. b) Какое допущение необходимо сделать для этой проверки?

УПРАЖНЕНИЯ С ИСПОЛЬЗОВАНИЕМ INTERNET И КОМПЬЮТЕРА 1. Используйте статистические пакеты (SPSS, SAS BMDP) для вычисления статистического критерия для задачи 3.

КОММЕНТАРИИ 1. Chow-Hou Wee, Mei-Lan Choong, Siok-Kuan Tambyah, "Sex Role Portrayal in Television Advertising", International Marketing Review, January 1995, p. 49-64;

Магу С. Gilly, "Sex Roles in Advertising: A Comparison of Television Advertisements in Australia, Mexico and the United States", Journal of Marketing, April 1988, p. 75-85. 2. Melissa Dowling, "To Go Direct — or Not", Catalog Age, September 1, 1997, p. 5;

Troy A. Festervand, Don R. Snyder, John D. Tsalikis, "Influence of Catalog vs. Store Shopping and Prior Satisfaction on Perceived Risk", Journalof the Academy of Marketing Science, Winter 1986, p. 28—36. 3. Saviour L.S. Nwacukwu, Scott. J. Vitell, Jr., Faye W. Gilbert, James H. Barnes, "Ethics and Social Responsibility in Marketing: An Examination of the Ethical Evaluation of Advertising Strategies", Journal of Business Research, June 1997, p. 107—18;

Shelby D. Hunt, Lawrence B. Chonko, "Ethical Problems of Advertising Agency Executives", Journal of Advertising, Fall 1994,p. 16—24. 4. О применении частот и дискрептивных статистик см, статью Mary Jo Bitner, Bernard H. Booms, Lois A. Mohr, "Critical Service Encounters: The Employee's Viewpoint", Journal of Marketing, October 1994, p. 95-106. 5. Для более подробного описания таких статистик см. любую книгу по статистике, например, Mark L. Berenson, David M. Levine, Basic Business Statistics: Concepts and Applications, 6th ed. (Englewood Cliffs, NJ: Prentice Hall, 1996). 6. Для нашей цели не следует делать различие между проверкой гипотезы и статистическим выводом через доверительный интервал. 7. Thomas T. Semon, "Let's Hear It for Disaggregate Analysis", Marketing News, March 25, 1996, p. 10;

O. Hellevik, Introduction to Causa! Analysis: Exploring Survey Data by CrossTabulation (Beverly Hills, CA: Sage Publications, 1984). 8. Lawrence F. Feick, "Analyzing Marketing Research Data with Association Models", Journal of Marketing Research, November 1984, p. 376-386. Последние применения см. в статье Wagner A. Kamakura, Michel Wedel, "Statistical Data Fusion for Cross-Tabulation", Journal of Marketing Research, November 1997, p. 485-498. 9. Wayne Lenell, Robert Boissoneau, "Using Causal-Comparative and Correlational Designs in Conducting Market Research", Journal of Professional Services Marketing, February 1996, p, 59-69. 10. R. Mark Sirkin, Statistics for the Social Sciences (Thousand Oaks, CA: Sage Publications, 1997). 11. Marjorie A. Pett, Nonparametric Statistics for Health Care Research (Thousand Oaks, CA: Sage Publications, 1997). Для более глубокого изучения см. работу Н.О. Lancaster, The Chi-Squared Distribution (New York: John Wiley, 1969).

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 12. Mark L. Berenson, David M. Levine, Basic Business Statistics: Concepts and Applications, 6th ed. (Upper Saddle River, NJ: Prentice Hall, 1996): 13. Однако некоторые ученые-статистики с этим не согласны. Они считают, что не стоит использовать поправочный коэффициент. См., например, статью John E, Overall, "Power of Chi-Square Tests for 2 x 2 Contingency Tables with Small Expected Frequencies", Psychological Bulletin, January 1980, p, 132-135. 14. Проверка значимости и доверительных интервалов также возможна как для асимметричного коэффициента "лямбда", так и для симметричного. См. статью L.A. Goodman, W.H. Kruskal, "Measures of Association for Cross Classification: Appropriate Sampling Theory", Journal of the American Statistical Association, June 1963, p. 310—364. 15. Rohit Verma, John C. Goodale, "Statistical Power in Operations Management Research", Journal of Operations Management, August 1995, p. 139—152. 16. С технической точки зрения нулевую гипотезу нельзя принять. Ее можно либо отвергнуть, либо не отвергнуть. 17. Условие, когда нельзя предполагать равенства дисперсий, известно под названием проблемы Беренса-Фишера (Behrens-Fisher). Существует несколько мнений по поводу лучшего метода расчета данного случая, 18. Anne L. Balazs, "Positioning the Retail Shopping Center for Aging Customers", Stores, April 1995, p. RR10—RR11;

James R. Lumpkin, James B. Hunt, "Mobility as an Influence on Retail Patronage Behavior of the Elderly: Testing Conventional Wisdom'', Journal of the Academy of Marketing Science, Winter 1989, p. 1-12. 19. Eleflheria Parpis, "Playing for the Ring", Adweek (Eastern Edition), January 19, 1998, p. 29—31;

Larry Dunst, "Is It Possible to Get Creative in 15 Seconds?", Advertising Age, November 29, 1993, p. 18;

Jerry A. Rosenblatt, Janett Mainprize, "The History and Future of 15-Second Commercials: An Empirical Investigation of the Perception of Ad Agency Media Directors", in William Lazer, Eric Shaw, Chow-Hou Wee (eds.), World Marketing Congress (International Conference Scries), vol. IV (Boca Raton, FL: Academy of Marketing Science, 1989), p. 169-177. 20. Gopal K. Kanji, 100 Statistical Tests (Thousand Oaks, CA: Sage Publications, 1993);

Donald L. Harnett, Statistical Methods, 3rd ed. (Reading, MA: Addison-Wesley, 1982). 21. Marjorie A. Pelt, Nonparametric Statistics for Health Care Research (Thousand Oaks, CA: Sage Publications, 1997), 22. Существуют разные точки зрения о том, следует ли использовать непараметрические статистические методы, чтобы сделать статистический вывод о параметрах совокупности. См. также статью Y.K. Cheung, J.H. Klotz, "The Mann-Whitney-Wilcoxon Distribution Using linked Lists", Statistica Sinica, July 1997, p. 805-813. 23. t -критерий в этом случае эквивалентен критерию "хи-квадрат" для проверки независимости в таблице сопряженности 2x2. Этих два критерия связаны между собой следующим образом: #:о.и<п = п>.<и<«,+« ;

-2). Для больших выборок г-распределение приближается к нормальному, следовательно, / -критерий и г-критерий эквивалентны. 24. James R, Crum, Pradeep A. Rau, Stephen K. Reiser, 'The Marketing Research Process: Role Perceptions of Researches and Users", Journal of Advertising Research, December—January 1988, p. 9— 21. См, также статью Cyndee Miller, "Gallup Brothers Analyze the Research Industry", Marketing News, January 6, 1997, p. 2. 25. Пример последнего применения критерия парных сравнений Вилкоксона приведен в работе U. Kalwani, Narakesari Narayandas, "Long-Term Manufacturer-Supplier Relationships: Do They Pay Off for Supplier Firms?", Journal of Marketing, January 1995, p. 1—16. 26. Marjorie A. Pett, Nonparametric Statistics for Health Care Research (Thousand Oaks, CA: Sage Publications, 1997);

J.G. Field, "The World's Simplest Test of Significance", Journal of the Market Research Society, July 1971, p. 170-172.

Часть III. Сбор, подготовка и анализ данных 27. Eric L. Einspruch, An Introductory Guide to SPSS for Windows (Thousand Oaks, CA: Sage Publications, 1993);

Paul E. Spector, SAS Programming for Researchers and Social Scientists (Thousand Oaks, CA: Sage Publications, 1993);

Mahamed Afzal Norat, "Software Reviews", Economic Journal: The Journal of the Royal Economic Society, May 1997, p. 857—882;

John Wass, "How Statistical Software Can be Assessed", Scientific Computing and Automation (October 1966). 28. Leslie de Chernatony, Chris Halliburton, Ratna Bernath, "International Branding: Demand or Supply Driven", International Marketing Review, February 1995, p. 9—21. 29. Lawrence B. Chonko, Ethical Decision Making in Marketing (Thousand Oaks, CA: Sage Publications, 1995);

G.R. Laczniak, E. Murphy, "Foresting Ethical Marketing Decisions", Journal of Business Ethics, October 1991, p. 259-271.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез Г л а в а Дисперсионный и ковариационный анализ После изучения материала этой главы вы должны уметь...

1. Трактовать диапазон применения дисперсионного анализа (ANOVA) и его связь с (-критерием и регрессионным анализом. 2. Описывать однофакторный дисперсионный анализ, включая разложение полной вариации, измерение эффектов, проверку значимости и интерпретацию результатов. 3. Рассматривать многофакторный дисперсионный анализ и проверять значимость полного эффекта, эффекта взаимодействия и главный эффект каждого фактора. 4. Проводить анализ ковариации и показывать, каким образом он учитывает влияние неуправляемых независимых переменных. 5. Объяснять ключевые факторы, относящиеся к интерпретации результатов, делая акцент на взаимодействии факторов, их относительной важности и множественных сравнениях. 6. Обсуждать специальные методы дисперсионного анализа, используемые в маркетинге, такие как повторные измерения в дисперсионном анализе, неметрический дисперсионный анализ и многомерный дисперсионный анализ (MANOVA).

КРАТКИЙ ОБЗОР В главе 15 мы изучали методы проверки различий между двумя средними или двумя медианами разных выборок. В этой главе мы рассмотрим что делать в том случае, если маркетолог имеет дело с большим числом средних или медиан. Такого рода методы называют дисперсионным анализом и ковариационным анализом. Несмотря на то, что обычно их используют для анализа экспериментальных данных, они также полезны для анализа результатов опроса или данных наблюдений. Опишем методы выполнения дисперсионного и ковариационного анализа и обсудим их соотношение с другими методами проверки связей. Затем опишем однофакторный дисперсионный анализ, самый простой из этих методов, следом за ним — многофакторный дисперсионный и ковариационный анализ. Особое внимание мы уделим вопросам интерпретации результатов, а именно, взаимодействию факторов, их относительной важности и множественным сравнениям. Мы широко осветим некоторые специальные темы, такие как повторные измерения в дисперсионном анализе, неметрический дисперсионный анализ и многомерный дисперсионный анализ. Рассмотрим примеры, иллюстрирующих применение дисперсионного анализа. СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА """ ""I Дисперсионный анализ В проекте "Выбор универмага" несколько независимых переменных относились к числу категориальных, имеющих больше двух категорий (уровней) значения. Например, степень ос- ! ведомленности об универсальных магазинах маркетологи разделили на высокую, среднюю : и низкую. С помощью дисперсионного анализа они выявили влияние этих независимых Часть III. Сбор, подготовка и анализ данных переменных на метрические зависимые переменные. Таким образом маркетологи получили общее представление об этой проблеме, что послужило основанием для последующего анализа данных. Так, использование трех категорий применительно к степени осведомленности о магазине не позволило получить статистически значимые результаты, тогда как разделение степени осведомленности на два уровня (высокая и низкая степень) привело к значимым результатам. Таким образом маркетологи увидели, что в данном случае лучше всего подходит рассмотрение степени осведомленности о магазине как переменной, имеющей только две категории.

ПРИМЕР. Риски электронной коммерции Для проверки различий в предпочтениях приобретения через Internet товаров с различными уровнями экономического и социального риска маркетологи использовали дисперсионный анализ. Экономический и социальный риск имел два значения (высокий и низкий риск). Предпочтение к приобретению товаров через Internet выступало зависимой переменной. Результаты выявили существенное взаимодействие социального и экономического риска. Приобретение товаров через Internet не является предпочтительным для продуктов с высоким социальным риском (например, модной одежды), независимо от уровня экономического риска товара, но зато предпочтительно для продуктов с низким экономическим риском по сравнению с продуктами с высоким экономическим риском при низком уровне социального риска [1].

ПРИМЕР. Лекарства с точки зрения ANOVA Анализируя эффективность различных форматов рекламных обращений для продаваемого без рецепта средства от изжоги, маркетологи изучили роль содержания рекламного обращения и относительной новизны торговой марки. Зависимой переменной выступало отношение к рекламируемой торговой марке. Независимыми переменными служили три фактора, каждый из которых имел две категории: формат рекламы, содержание и относительная новизна. Категории формата рекламы были следующие;

реклама со сравнением и реклама без сравнения. В первом случае для сравнения использовались широко известные торговые марки Rolaids и Turns. Категрии относительной новизны получали, изменяя производителя лекарства. Название Alka-Seltzer использовалось в качестве твердо устоявшейся торговой марки, вто время как Acid-off выступало новой маркой. Название Acid-off выбрано на основе предварительного тестирования. Категориями содержания рекламного обращения выступали фактическое и ценностное содержания. Респондентов набрали в торговом центре и случайным образом распределили по разным 1 группам. Из 207 полученных ответов 200 признали годными для анализа. 25 респондентов | вошли в каждую из восьми ( 2 x 2 x 2 ) групп для проведения эксперимента. Затем был выполнен трехфакторный дисперсионный анализ, где зависимой переменной служило отношение респондента к торговой марке. Общие результаты оказались статистически значимыми. Взаимодействие трех факторов также оказалось существенным. Из имеющихся двухфакторных взаимодействий статистически значимым было только взаимодействие между форматом рекламного ролика и относительной новизной. На основании этих результатов маркетологи сделали вывод, что сравнительный формат рекламы, который подчеркивал фактическую информацию, оказался наиболее подходящим для выхода на рынок нового товара [2]. В примере с универсальным магазином, где осведомленность была представлена тремя категориями (уровнями), /-критерий не подходил для изучения различий выборочных средних, поэтому применили дисперсионный анализ. Изучение приобретения товаров через Internet Глава 16. Дисперсионный и ковариационный анализ включало сравнение средних при наличии двух факторов (независимых переменных), у каждого из которых было два уровня. Более сложное исследование сравнительной эффективности рекламы лекарства включало три фактора, у каждого из которых было два уровня. В последних двух примерах /-критерии также оказались неподходящими, поскольку влияние каждого фактора зависело от действия других факторов (взаимодействия факторов были существенными), В следующем разделе этой главы рассматривается связь дисперсионного анализа с /-критерием и другими методами проверки.

ВЗАИМОСВЯЗЬ МЕТОДОВ Дисперсионный и ковариационный анализ используется маркетологами для изучения различий средних значений зависимых переменных, вызванных влиянием контролируемых независимых переменных, при условии, что учтено влияние неконтролируемых независимых переменных. По сути, дисперсионный анализ (analysis of variance — ANOVA) применяют как проверку статистической значимости различий выборочных средних для двух или больше совокупностей. Обычно нулевая гипотеза утверждает, что все выборочные средние равны. Например, предположим, что исследователю интересно узнать, действительно ли люди с различным уровнем потребления сухих завтраков (едят много, средне, слабо и вообще не едят) различаются предпочтением к Total cereal, измеренным по девятибалльной шкале Лайкерта. Проверку нулевой гипотезы, утверждающей, что четыре группы потребителей не различаются предпочтением к Total, можно выполнить, используя дисперсионный анализ. Дисперсионный анализ (analysis of variance — ANOVA) Статистический метод изучения различий между выборочными средними для двух или больше совокупностей. В своей простейшей форме дисперсионный анализ должен иметь зависимую переменную (предпочтение к сухому завтраку Total cereal), которая является метрической (измеренной с помощью интервальной или относительной шкалы). Кроме того, должна быть одна или больше независимых переменных (потребление продукта: сильное, среднее, слабое и отсутствие потребления). Все независимые переменные должны быть категориальными (неметрическими), их еще называют факторами (factors). Фактор (factors) Категориальная независимая переменная. Чтобы использовать дисперсионный анализ, независимые переменные должны все быть категориальными (неметрическими). Конкретная комбинация уровней (условиями испытаний) (treatment). факторов называется факторным экспериментом Факторный эксперимент (условия испытаний) (treatment) В дисперсионном анализе конкретная комбинация категорий (уровней) факторов. Однофакторный дисперсионный анализ (one-way analysis of variance) включает только одну категориальную переменную или единственный фактор. Однофакторный дисперсионный анализ (one-way analysis of variance) Метод дисперсионного анализа, при котором используется только один фактор.

Часть III. Сбор, подготовка и анализ данных Различия в предпочтениях потребителей с сильным, средним, слабым и нулевым уровнями потребления можно изучить с помощью однофакторного дисперсионного анализа, в котором факторный эксперимент представлен определенным уровнем фактора (пользователи со средним уровнем потребления как раз и составляют факторный эксперимент). Если существует два или больше факторов, то анализ называют многофакторным дисперсионным анализом (n-way analysis of variance). (Если в дополнение к фактору использования продукта исследователь также хочет узнать отношение к Tola! cereal потребителей с разным уровнем лояльности (новый фактор), то для этого подходит многофакторный дисперсионный анализ). Многофакторный дисперсионный анализ (n-way analysis of variance) Модель дисперсионного анализа, которая включает два или больше факторов. Если набор независимых переменных состоит из категориальных и метрических переменных, то их изучают методом ковариационного анализа (analysis of covariance — ANCOVA). Ковариационный анализ, ANCOVA (analysis of covariance — ANCOVA) Специальный метод анализа дисперсий, в котором эффекты одной или больше сторонних переменных, выраженных в метрической шкале, удаляют из зависимой переменной перед выполнением дисперсионного анализа. Например, ковариационный анализ необходим, если исследователь хочет изучить предпочтения пользователей в группах с различным уровнем потребления и уровнем лояльности, приняв во внимание отношение респондентов к составу продуктов питания и к значению завтрака, как способу приема пищи. Две последние переменные измеряются по девятибалльной шкале Лайкерта. В этом случае категориальные независимые переменные (потребление продукта и лояльность к торговой марке) по-прежнему называются факторами, в то время как метрические независимые переменные (отношение к составу продуктов питания и значение, придаваемое завтраку) — ковариатами (covariates). Ковариата (covariates) Метрическая независимая {ANCOVA).

переменная, используемая в ковариационном анализе Взаимосвязь дисперсионного анализа с f-критерием и другими методами анализа, такими как регрессионный анализ (глава 17), показана на рис. 16.1. Во всех этих методах анализа используется метрическая зависимая переменная. Дисперсионный и ковариационный анализ может включать несколько независимых переменных (степень использования продукта, лояльность к торговой марке, отношение, важность). Более того, одна из независимых переменных должна быть категориальной и категориальные переменные могут иметь больше двух уровней (в нашем примере степень использования продукта имеет четыре уровня). С другой стороны, /-критерий предназначен для использования в случае с единственной бинарной независимой переменной. Например, различие в предпочтениях товара у лояльных и нелояльных респондентов можно узнать, выполнив проверку с помощью /-критерия. Регрессионный анализ, подобный дисперсионному и ковариационному, также может включать несколько независимых переменных. Однако все независимые переменные, в основном, измеряются интервальной шкалой, хотя бинарные или категориальные переменные могут приспосабливаться к анализу за счет введения фиктивных (dummy) переменных. Например, связь между предпочтением продукта Total cereal, отношением к составу продукта и важностью завтрака можно изучить с помощью регрессионного анализа.

Глава 16. Дисперсионный и ковариационный анализ Одна или несколько независимых переменных.. ьинарнавпеременная Категориальная <лЯ1Гтпг.няо1 Дисперсионный и Категориальная интмюяпииа Ковариационный Однофакторный..анализ Многофакторный.дисперсионный анализ Рис. 16.1. Взаимосвязь между t-критерием, дисперсионным и ковариационным анализом и регрессией ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ Довольно часто у маркетологов возникает необходимость установить различия в средних значениях зависимой переменной для нескольких категорий одной независимой переменной (фактора). • Различаются ли разные сегменты рынка с точки зрения объема потребления товара? • Действительно ли различаются оценки торговой марки группами респондентов, которые посмотрели разные рекламные ролики? • Различается ли отношение розничных, оптовых торговцев и торговых агентов к политике распределения, проводимой фирмой? • Зависит ли намерение потребителей приобрести товар данной торговой марки от разницы в уровнях цен? • Влияет ли осведомленность потребителей о магазине (высокая, средняя и низкая) на предпочтение данного магазина? Ответ на эти и другие вопросы можно получить, выполнив однофакторный дисперсионный анализ. Перед описанием процедуры мы определим основные статистики, используемые в однофакторном дисперсионном анализе [3].

Часть III. Сбор, подготовка и анализ данных СТАТИСТИКИ, ИСПОЛЬЗУЕМЫЕ В ОДНОФАКТОРНОМ ДИСПЕРСИОННОМ АНАЛИЗЕ Эта-квадрат (п.2) — корреляционное отношение. С ее помощью выражают степень влияния или силу эффекта А1 (независимой переменной, фактора) на У (зависимую переменную). Значение п2 лежит в интервале от 0 до 1. F-статистика (F-statistic). Нулевую гипотезу о том, что категориальные средние в двух выборочных совокупностях равны, проверяют с помощью f-статистики, представляющей собой отношение межгрупповой дисперсии к дисперсии ошибки (отношение среднего квадрата X к среднему квадрату ошибки). Средний квадрат (mean square). Сумма квадратов отклонений наблюдений, деленная на соответствующее ей число степеней свободы. SSmx^, вариация переменной Y, обусловленная различием средних между группами (межгрупповая дисперсия) (SS^^^ SSf). Вариация переменной К, связанная с вариацией средних значений категорий переменной X. Она представляет собой вариацию между уровнями переменной Xили долю в сумме квадратов переменной Y, связанную с переменной X. SSeHympu> вариация переменной Y, обусловленная вариацией внутри каждой группы категорий (внутригрунповая дисперсия) (SSvilhin Ssfmr). Это вариация переменной Y, обусловленная изменением внутри каждой из групп переменной X. Она осуществляется за счет всех факторов, кроме АЧпри исключенном X). Общая сумма квадратов SSy. Полная дисперсия переменной Y.

ВЫПОЛНЕНИЕ ОДНОФАКТОРНОГО ДИСПЕРСИОННОГО АНАЛИЗА Процедура выполнения однофакторного дисперсионного анализа представлена на рис. 16.2....Определение зависимой и независимой переменных Рис. 16.2. Однофакторный дисперсионный анализ Она включает: определение зависимых и независимых переменных, разложение общей вариации, измерение эффектов, проверку значимости и интерпретацию результатов. Мы подробно рассмотрим эти стадии и их применение.

Глава 16. Дисперсионный и ковариационный анализ Определение зависимой и независимой переменных Пусть Y— зависимая переменная, а X— независимая переменная. К— это категориальная переменная, имеющая с категорий (уровней, групп). Для каждой группы Л"существует п наблюдений Y, как это показано в табл. 16.1. Из данных таблицы видно, что размер выборки в каждой группе ЛТ равен п, а размер общей выборки N = п х с. Для упрощения допускают, что размеры выборок в группах переменной ЛТ(групповые размеры) равны, но это допущение необязательно.

Таблица 16.1. Разложение полной вариации: однофакторный дисперсионный анализ Независимая переменная X Группы Полная выборка = Внутригрупповая вариация 55анутр( Уг Полная вариация = SSy Y Yfl Групповые средние Y Y, Межгрупповая вариация = SSMaw Разложение полной вариации Для изучения различий между средними однофакторный дисперсионный анализ использует разложение полной вариации (decomposition of the total variation), наблюдаемой в зависимой переменной. Разложение полной вариации (decomposition of the total variation) 8 однофакторном дисперсионном анализе разделение вариации, зависимой переменной, на вариацию, обусловленную различием средних внутри групп плюс вариацию, обусловленную внутригрупповой изменчивостью. Эту вариацию вычисляют как сумму квадратов с поправкой на среднее (на число степеней свободы) (SS). Дисперсионный анализ называют так потому, что он изучает изменчивость или дисперсию выборки (применительно к зависимым переменным) и, исходя из этой изменчивости, определяет, действительно ли выборочные средние равны между собой. Полную вариацию У, обозначаемую SS, можно разложить на два компонента:

Ь&у ЬЬцнокду """ ^внутри где нижние индексы между (between) и внутри (within) относятся к группам переменной X. SSMf*cay~ это вариация переменной Y, связанная с различием средних между группами переменной X. Она представляет вариацию между категориями переменной X (межгрупповая изменчивость). Другими словами, 53„ежду -~ это доля в сумме квадратов переменной Y, обусловленная действием независимой переменной или фактором X. Поэтому 55жжАу также обозначают как SB*. SSMHympu — это вариация переменной У, связанная с вариацией внутри каждой группы Часть III. Сбор, подготовка и анализ данных переменной X, ее вычисляют, не учитывая фактор X. Поэтому SSmympu также называют дисперсией ОШИбкИ 55ОШиб№ SS = SS + SS yj — отдельное наблюдение Y} —среднее для группы/ Y — среднее для всей выборки или общая средняя Yij — i-наблюдение в/-группе Смысл разложения полной вариации в переменной Y, SSy на компоненты SS^^ и SSeHympli в том, чтобы наглядно представить и затем изучить различия в групповых средних. Вспомним из главы 15, если вариация переменной в совокупности известна, то можно определить, насколько сильно изменение выборочного среднего обусловлено только случайной вариацией. В дисперсионном анализе рассматривают несколько различных групп (например, сильное, среднее, слабое использование, отсутствие использования товара). Если нулевая гипотеза верна, и все группы имеют одно и то же среднее значение совокупности, то можно оценить, насколько сильно отличаются выборочные средние вследствие только выборочной (случайной) вариации. Если наблюдаемое различие в выборочных средних больше ожидаемого, то логично заключить, что эта дополнительная вариация связана с различиями в групповых средних в совокупности. В дисперсионном анализе мы определяем два показателя вариации: внутри групп (SS,,Hymi,a) (внутригрупповая изменчивость) и между группами (SSHejfdy) (межгрупповая изменчивость). Внутри групповая вариация показывает, насколько сильно кодеблятся значения переменной Y внутри группы. Поэтому ее используют для оценки дисперсии внутри группы. Предполагается, что все группы в рассматриваемой совокупности имеют одну и ту же вариацию. Однако изза того, что неизвестно, имеют ли все группы одно и то же значение средней, мы не может вычислить дисперсию всех объединенных вместе наблюдений. Дисперсия для каждой группы рассчитывается отдельно, и затем эти дисперсии следует объединить в "среднюю" или "общую". Аналогично, можно получить другую оценку дисперсии значений Y, изучив вариации между средними- (Этот процесс обратный процессу определения вариации в средних.) Если среднее совокупности одно и то же во всех группах, то для оценки дисперсии К используем вариацию в выборочных средних и размеры выборочных групп. Приемлемость этой оценки дисперсии Узависит от истинности нулевой гипотезы. Если нулевая гипотеза верна и средние совокупности равны, то оценка дисперсии на основе межгрупповой изменчивости корректна. С другой стороны, если группы имеют различные средние в совокупности, то оценка дисперсии на основе межгрупповой изменчивости слишком большая. Таким образом, сравнивая оценки дисперсии на основе межгрупповой и внутригрупповой изменчивости (вариации), мы можем проверить нулевую гипотезу [4]. Разложение полной вариации также позволяет измерить влияние переменной ЛГ на Y.

Измерение эффекта Сила влияния переменной А1 на У измеряется с помощью SSf. Поскольку SSt связана с вариацией средних значений групп X, то относительное значение SS^ растет с увеличением различий между средними значениями У в группах X. Относительное значение SSX также увеличивается при уменьшении вариаций Y внутри групп X. Эффект влияния переменной X на Y вычисляют по формуле: Глава 16. Дисперсионный и ковариационный анализ JiJ tJj Значение корреляционного отношения п лежит в пределах от 0 до 1. Оно равно нулю, когда 2 все групповые средние равны, т.е. переменная X не влияет на Y. Значение г\ равно 1, когда внутри каждой из групп переменной Xизменчивость отсутствует, но имеется некоторая измен2 чивость между группами. Таким образом, г\ представляет собой меру вариации Y, которая объясняется влиянием независимой переменной X. Мы не только можем измерить влияние Хна Y, но и проверить его значимость.

Проверка значимости В однофакторном дисперсионном анализе проверяют нулевую гипотезу, утверждающую, что групповые средние в рассматриваемой совокупности равны [5]. Другими словами, В соответствии с нулевой гипотезой значения 55V и SSoiauSllu зависят от одного источника вариации. В таком случае оценка дисперсии совокупности К может определяться межгрупповой или внутри групповой вариацией. Иначе говоря, оценка дисперсии совокупности Y „;

_ у SS, ~ (с-\] = средний квадрат, обусловленный действием X = MSX или S,1 = ' (УУ-с) = средний квадрат, обусловленный действием всех факторов, кроме X = М5ошибки. Нулевую гипотезу можно проверить с помощью /"-статистики, рассчитываемой как отношение между этими двумя оценками дисперсий: SSJ(c~\) MS, SSuua^J(N-c) Шои,„й„ Эта статистика подчиняется /"-распределению с числом степеней свободы (d0, равным (с — 1) и (N — с). Таблица распределения /'-статистики приведена в табл. 5 Статистического приложения. Как упоминалось в главе 15, /"-распределение представляет собой распределение вероятностей отношений выборочных дисперсий. Значение F зависит от числа степеней свободы в числителе и знаменателе [6].

Интерпретация результатов Если нулевую гипотезу о равенстве групповых средних не отклоняют, то независимая переменная не оказывает статистически значимого влияния на зависимую переменную. С другой стороны, если нулевую гипотезу отклонить, то эффект независимой переменной на зависимую трактуется как статистически значимый. Другими словами, среднее значение зависимой переменной различно для различных групп независимой переменной. Сравнение значений групповых средних показывает характер влияния независимой переменной. Другие важные вопросы интерпретации результатов, такие как изучение различий между конкретными средними, обсуждаются ниже. Проиллюстрируем применение од кофактор ного дисперсионного анализа и других связанных с ним методов. Иллюстрация. Рассмотрим изложенный материал на основе данных табл. 16.2, полученных в ходе эксперимента в сети крупных универмагов. Цель эксперемента — изучить влияние Часть III. Сбор, подготовка и анализ данных уровня рекламы товаров непосредственно в самом магазине и купонной распродажи на объем продаж. Маркетологи использовали три уровня рекламы товаров в магазине: высокий, средний и низкий. У купонной распродажи было два уровня. Купон на 20-долларовую скидку либо давали потенциальным покупателям (уровень в этом случае обозначали номером 1), либо не давали (этот уровень обозначали номером 2 в табл. 16.2). Результаты экспериментов с рекламой и купоном объединили в таблицу размером 3 х2 с шестью ячейками. Тридцать магазинов были выбраны случайным образом, и для каждой комбинации условий эксперимента случайным образом взяли по пять магазинов, как показано в табл. 16,2. Эксперимент продолжался два месяца. Определили объем продаж в каждом магазине, нормализовали его, приняв во внимание посторонние факторы (размер магазина, товарооборот и т.д.) и пересчитали по десятибалльной шкале. В дополнение была получена качественная оценка относительного числа постоянных покупателей для каждого магазина, также с использованием десятибалльной шкалы. Полученные данные приведены в табл. 16. Таблица 16.2, Уровень купонной распродажи, реклама товаров на месте купли-продажи;

продажи и постоянные покупатели Номер магазина Уровень купонной распродажи 1,00 1.00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1, Внутримэгазинная реклама Продажи 1,00 1,00 1,00 1,00 1,00 2,00 2,00 2,00 2,00 2,00 3,00 3,00 3,00 3,00 3,00 1,00 1,00 1,00 1, 10, Постоянные покупатели 9, 10, 1 3 4 5 9, 10, 8,00 4,00 6,00 8,00 4, 10, 8,00 9,00 8,00 8,00 7,00 9,00 6,00 5, 8 10 11 1? 13 14 15 6,00 9,00 8,00 9,00 6, 10, 1,00 1,00 1,00 2,00 2,00 2,00 2,00 2,00 2.00 2,00 2,00 2,00 2,00 2,00 2, г,оо 6, 4 ( 5, 8,00 9,00 7,00 7,00 6,00 4, 4, 10, 6,00 8,00 4,00 9,00 6,00 8, 10, 18 20 !,(!(] 2,00 2,00 2,00 2,00 2,00 3,00 3, 22 23 24 25 26 5, Ei.OQ 6,00 4,00 2,00 3, 4,00 9,00 4,00 6, Глава 16, Дисперсионный и ковариационный анализ Окончание табл. 16. Номер магазина 29 Уровень купонной распродажи 2,00 2,00 2, Внугримагазинная реклама 3,00 3,00 3, Продажи 2,00 1,00 2, Постоянные покупатели 10, 9,00 8, ПРИМЕНЕНИЕ ОДНОФАКТОРНОГО ДИСПЕРСИОННОГО АНАЛИЗА Проиллюстрируем применение од кофактор но го анализа вначале с вычислениями, сделанными вручную, а затем с использованием компьютера. Предположим, что мы оперировали только одним фактором, а именно, рекламой на месте торговли, т.е. чтобы показать процесс вычисления, проигнорируем второй фактор — купонную распродажу. Маркетологи пытались определить влияние внутримагазинной рекламы товаров (X) на продажи (Y). Чтобы показать процесс вычисления с помощью ручного калькулятора, данные табл. 16.2 преобразованы в табл, 16.3, где приведены продажи (У?) для каждого уровня рекламы. Нулевая гипотеза утверждает, что групповые средние равны: Н0\ ji, = ц2 = ц y (JO - 6,067) 2 + (9-6,067) 2 + (10-6,067) 2 + (8 - 6,067)2 + (9 - 6,067)2 4- (8 - 6,067)2 + +(9 - 6,067) 2 + (7 - 6,067)2 + (7 - 6,067)2 + (6 - 6,067)2 + (8 - 6,067)2 + (8 - 6,067)2 + +(7 - 6,067)2 + (9 - 6,067)2 + (6 - 6,067)2 -b (4 - 6,067)2 + (5 - 6,067)2 + (5 - 6,067)2 + +(6 - 6,067)2 + (4 - 6,067)2 + (5 - 6,067)2 •f (7 - 6,067)2 + (6 - 6,067)2 + (4 - 6,067)2 + +(5 - 6,067) 2 + (2 - 6,067)2 + (3 - 6,067)2 + (2 - 6,067)2 + (1 - 6,067)2 + (2 - 6,067): = = (3,933)2 + (2,933)2 + (3,933)2 + (1,933)2 + (2,933)2 + (1,933)2 + (2,933):..- (0,933)2 + +(0,933) 2 +( -0,067)2 + (l,933) 2 +(l,933) 2 -f -(0,933) 2 +(2,933) 2 + (- 0,067)2 (- 2,067)2 + +(- 1,067)2-f- (- 1,067)2 + (- 0,067)2 + (- 2,067)2 + (- 1,067)2 + | - 0,067)2 (- 0,067)2 + +(- 2,067)2 •M-l,067) 2 +(-4,067) 2 + (-3,067)2 + (- 4,067)2 + ( - 5,067)2 (- 4,067)2 = =185, SSX = 10(8,3 - 6,067)2 + 10(6,2 - 6,067)2 + 10(3,7 - 6,067)2 = 10(2,223)2 + Ю(ОДЗЗ)2 + 10(- 2,367)2 = =106,067 ^ащ^ы= (Ю - 8,3)2 + (9 - 8,3)2 + (10 - 8,3)2 + (8 - 8,3)2 + (9 - 8,3): + (8 - 8,3)2 + (9 - 8,3)2 + +(7 - 8,3)2 + (7 - 8.3)2 + (6 - 8,3)2 + (8 - 6,2)2 + (8 - 6,2)2 + (7 - 6,2)2 + (9 - 6,2)2 + +(6 - 6,2)2 + (4 - 6,2)2 + (5 - 6,2)2 + (5 - 6,2): + (6 - 6,2)2 + (4 - 6,2)2 + (5 - 3,7)2 + +(7 - 3,7)2 + (6 - 3,7)2 + (4 - 3,7)2 + (5 - 3,7)2 + (2 - 3,7)2 + (3 - 3,7)2 + (2 - 3,7)2 + +(1 - 3,7)2 + (2 - 3,7)2 = (1,7)2 + (0,7)2 + (1,7)г +( -0,3)2 + (0,7)2 + (~0,3)2 + (0,7)2 + +(-1,3)2 + (-1.3)2 + (-2,3)2 + (1,8)2 + (1,8)2 + (0,8)2 + (2,8)2 + (-0,2)2 + <-2,2)2 + (-1.2)1 + +(-1,2)2 + (-0,2)2+ (-2,2)г+ (1,3)2+ (3,3)2+ (2,3)2+ (0,3)2+ (1,3)2+ (- 1,7)2+ (- 0,7)2 + +(- 1,7)2+ (- 2,7)2+ (- 1,7)2= 79,80 Можно утверждать, что SSy = SSt + ДУвииДи и 185,867=106,067 + 79,80 Степень влияния (эффекта) А" на Увычисляют по формуле: Л2 = SS,/SSy= 106,067/185,867 = 0,571 Другими словами, 57,1% вариации в продажах (У) обусловлено влиянием внутримагазинной рекламы, что указывает на умеренный эффект. Теперь проверим нулевую гипотезу.

Часть III. Сбор, подготовка и анализ данных 106,Q67/(3-l) SS1IW,lflKUf(N-c) 79,800/(30-3) = 17, Таблица 16.3. Влияние уровня вкутримагазинной рекламы на продажи Уровень внутримагазинной рекламы Номер магазина Высокий Средний Низкий Нормированные продажи 2 3 4 5 6 7 8 1!) 10 9 8 9 8 7 7 7 6 9 5 2 3 2 1 37 37 — = 3,7 5 5 S Суммы по колонкам Групповые средние: К, ^ = 8,3 ^=6,2 - (83 + 62 + 37) Общее среднее, У = = 6, По табл. 5 Статистического приложения находим, что для 2 и 27 степеней свободы критическое значение ^-статистики равно 3,35 при уровне значимости а = 0,05. Поскольку вычисленное значение /'-статистики больше критического, мы отклоняем нулевую гипотезу. Заключаем, что средние значения совокупностей для трех уровней внутримагазинной рекламы товаров действительно различаются между собой. Сравнение средних для трех категорий показывает, что высокий уровень рекламы ведет к существенно более высоким продажам. Теперь проиллюстрируем процедуру выполнения дисперсионного анализа с помощью компьютерной программы. Результаты выполнения анализа на компьютере приведены в табл. 16,4.

Таблица 16.4. Однофакторный дисперсионный анализ (ANOVA) Источник дисперсии Между группами (внутримагазинная реклама) Внутри групп (дисперсия ошибки) Итого Сумма квадратов 106,067 79,800 185, Степени свободы 27 Средний квадрат 53,033 2,956 6, F-статистика 17, Вероятность F 0, Глава 16. Дисперсионный и ковариационный анализ Окончание табл. 16. Средние ячеек Уровень рекламы Высокий (1) Средний (2) Низкий (3) Итого Количество (наблюдений) 10 10 10 30 Среднее 8,300 6,200 3,700 6, Значение SSX,, указывающее на главные эффекты (систематические), равно 106,067 для двух степеней свободы;

значение SS^^ указывающее на остаточные эффекты, равно 79,80 для 27 степеней свободы. Следовательно, значения средних квадратов соответственно равны MS = 106,067/2 = 53,033 и MSautu6KU = 79,80/27 = 2,956. Значение F= 53,033/2,956 = 17,944 при 2 и 27 степенях свободы приводит к вероятности, равной 0,000. Так как соответствующая вероятность меньше, чем уровень значимости, равный 0,05, то нулевую гипотезу о равенстве средних в совокупности отклоняют. Альтернативно, из табл. 5 Статистического приложения видно, что критическое значение ^для 2 и 27 степеней свободы равно 3,35. Поскольку вычисленное значение /(17,944) больше критического, то нулевую гипотезу отклоняют. Данные табл. 16.4 показывают, что выборочные средние, равные 8,3;

6,2 и 3,7, совершенно различны, Процедура однофакторного дисперсионного анализа и его применения помогут понять допущения данного анализа.

ДОПУЩЕНИЯ В ДИСПЕРСИОННОМ АНАЛИЗЕ Обобщим допущения дисперсионного анализа: 1. Обычно считается, что уровни независимой переменной фиксированные. Статистический вывод касается только рассматриваемых конкретных уровней. Это называется моделью с фиксированным влиянием уровней фактора (fixed-effects model). Существуют и другие модели. Для модели со случайным влиянием уровней фактора (random-effects model) считают, что факторы представляют собой случайные выборки из генеральной совокупности факторного эксперимента. Статистические выводы делают в отношении других уровней, не изучаемых в анализе. Модель со смешанными уровнями (mixed-effects model) получают, если некоторые факторы (условия эксперимента) фиксированные, а некоторые — случайные [7]. 2. Остаточный член в дисперсионной модели, определяющей значение зависимой переменной Y, имеет нормальное распределение;

его математическое ожидание равно нулю, а дисперсия является постоянной1. Остаточный член не связан ни с одним уровнем переменной X. Умеренное отклонение от этих допущений серьезно не влияет на достоверность анализа. Более того, данные можно преобразовать таким образом, чтобы они удовлетворяли допущению о нормальности распределения или постоянству дисперсий. 3. Остаточные члены не коррелируют. Если остаточные члены взаимосвязаны (т.е. наблюдения зависимые), то отношение дисперсий /может быть сильно искажено.

Xii Однофа к торная дисперсионная модель имеет вид = u+F< + s,jf где Ху — значение исследуемой переменной, полученной на i-м уровне фактора (I = 1,2,...т) cj-м порядковым номером (I = 1,2,...п);

fj — общая средняя;

FI — эффект, обусловленный влиянием i-гоуровня фактора;

%• — остаточный член, или возмущение, вызванное влиянием неконтролируемых факторов, т.е. вариацией переменной внутри отдельного уровня. (Прим, научн. ред. Подробнее см. Н. Ш. Кремер. Теория вероятностей и математическая статистика. — М.: ЮНИТИ-ДАНА. — 2000. — С. 375) Часть III. Сбор, подготовка и анализ данных Часто при анализе ситуаций данные соответствуют описанным выше допущениям, Поэтому дисперсионный анализ достаточно распространен, что и подтверждают следующие примеры. ПРИМЕР. Торговля по видеокаталогу Хотя применение видео каталогов для покупки товаров на дому недостаточно распространено, многие компании, практикующие прямой маркетиинг, проявили заинтересованность их использования. Spiegel и Neiman Marcus предлагают видеокаталоги потребителям. Маркетологи исследовали с помощью видеокаталогов эффективность розничной торговли как формы прямого маркетинга. Участники эксперимента были случайным образом включены в один из трех вариантов эксперимента, когда они использовали: только видеокаталог;

видеокаталог и обычный каталог или только обычный каталог. Анализировались зависимые переменные, представляющие собой отношения и мнения: оценки характеристик товара (одежды);

оценки компании-рекламодателя видеокаталога/каталога;

оценки информации о ценах;

намерение сделать покупку. Для каждой зависимой переменной выполнен самостоятельный однофакторный дисперсионный анализ. Результаты показали, что респонденты отнеслись к покупкам по видеокаталогам или видеокаталогам и каталогам более позитивно, чем к покупкам только по обычному каталогу. Хотя факторный эксперимент "только видеокаталог' повысил восприятие компании-рекламодателя, результаты не были такими впечатляющими, как в случае восприятий товара (одежды). Не обнаружено существенных различий в восприятии цены и намерений сделать покупки. Кроме того, среднее число наименований товаров, которые, по словам респондентов, они бы купили, больше среди познакомившихся с видеокаталогом и с обычным каталогом, чем среди тех, кто посмотрел только видеокаталог, или только обычный каталог. Хотя это исследование и было пробной попыткой изучить влияние некоторых факторов на продажи, позитивные результаты оценки товаров (одежды), по видеокаталогу, предполагают, что такой метод маркетинга представляет собой потенциальный интерес для продавцов, использующих прямой маркетинг [8].

МНОГОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ При проведении маркетинговых исследований часто приходится иметь дело с одновременным влиянием нескольких факторов [9]. • Как меняется намерение потребителей купить товар данной торговой марки при различных уровнях цены и распределения? • Как уровень рекламы и уровень цен (высокий, средний, низкий) одновременно влияют на продажи товара данной торговой марки? • Влияет ли на выбор потребителем данной торговой марки уровень образования (ниже среднего, среднее, колледж, высшее) и возраст? • Как осведомленность об универмаге (высокая, средняя, низкая) и представление о нем (позитивное, нейтральное, негативное) влияют на предпочтение потребителем этого магазина? При определении влияния на зависимую переменную нескольких факторов можно использовать многофакторный дисперсионный анализ. Главное преимущество этого метода в том, что он позволяет исследователю изучать взаимодействие факторов. Взаимодействия (interaction) имеют место, когда эффекты одного фактора на зависимую переменную зависят от уровня других факторов.

Глава 16. Дисперсионный и ковариационный анализ Взаимодействие (interaction) При оценке зависимости между двумя переменными взаимодействие имеет место, если влияние Х\ зависит от уровня Хг, и наоборот. Процедура многофакторного дисперсионного анализа аналогична процедуре однофакторного дисперсионного анализа. Статистики, соответствующие многофакторному дисперсионному анализу, также определяются аналогично определению статистик в однофакторном дисперсионном анализе. Рассмотрим простой пример, в который входят факторы Х}нХ2с уровнями с, и ^соответственно. В этом случае полная вариация раскладывается следующим образом: 55„шиаи = SS за счет X, + SS за счет Х2 + SS за счет взаимодействия X, и Х или 55 = SS + 55 + Большее влияние X, будет отражаться в большем отличии среднего в уровнях Х}к более высоком значении 55,. Это же касается и фактора Х2. Чем сильнее взаимодействие между факторами X, и Х21 тем больше значение 55,^,. С другой стороны, если Л^иЛ^не зависят один от другого, то значение 55,,,, приближается к нулю [10]. Степень объединенного влияния (эффекта) двух факторов называют полным эффектом, или множественной корреляцией r\2 (multiple л2), вычисляемой по формуле: (55, +55, +55„ ) V Множественная корреляция r)2 (multiple т]2) Степень объединенного влияния двух (или более) факторов, или полный эффект. Значимость полного эффекта (significance of the overall effect) проверим с помощью /-"-критерия, используя формулу: _ (55Д| +55,: +SS,i3: }ldfn _ SSXi^v, /dfa _ MS, где df n — число степеней свободы для числителя = (с, - 1) + <с2 - 1) + (с, - 1) (с2 - 1) = Cic2 - 1 dfd — число степеней свободы для знаменателя = N - с,с2 MS — средний квадрат.

Значимость полного эффекта (significance of the overall effect) Проверка наличия различий между некоторыми из групп факторного эксперимента. Если полный эффект статистически значимый, то на следующем этапе изучают значимость эффекта взаимодействия (significance of the interaction effect) [11]. Если нулевая гипотеза утверждает, что взаимодействие между факторами отсутствует, то соответствующий /•'-критерий вычисляют по формуле:

^ n _ Д „ 'sS^/dfj'MS^ где ' df n = (c,-l) + (c 2 -l) df d = N - с,с2 618 Часть III. Сбор, подготовка и анализ данных Значимость эффекта взаимодействия (significance of the interaction effect) Проверка значимости взаимодействия между двумя или больше независимыми переменными. Если окажется, что эффект взаимодействия статистически значимый, значит, эффект А/ зависит отЛ"^ и наоборот. Поскольку эффект (влияние) одного фактора неоднородный, а зависит от уровня другого фактора, то вообще бессмысленно проверять значимость главных эффектов, Однако имеет смысл проверить значимость главного эффекта каждого фактора, если эффект взаимодействия статистически незначимый [12]. Значимость главного эффекта каждого фактора (significance of the main effect of each factor) можно проверить следующим образом (для X,): Idf MSX ' L J l\ K, MS,, где df d =N-c,c 2 Значимость главного эффекта каждого фактора (significance of the main effect of each factor) Проверка значимости главного эффекта для каждого отдельного фактора. При анализе предполагалось, что план эксперимента сбалансированный (число случаев в каждой ячейке одинаково). Если это не так, то анализ становится сложнее. Приведенный ниже пример иллюстрирует применение многофакторного дисперсионного анализа. Иллюстрация применения многофакторного дисперсионного анализа. Возвратившись к данным табл. 16.4, изучим эффекты, обусловленные влиянием уровня внутримагазинной рекламы и уровня купонной распродажи на продажи магазина. Результаты выполненного на компьютере обсчета дисперсионного анализа 3 x 2 приведены в табл. 16.5. Для главного эффекта, вызванного влиянием уровня внутримагазинной рекламы, сумма квадратов SSV, число степеней свободы и средний квадрат MSV те же, что и в табл. 16.4. Сумма квадратов для эффекта, обусловленного уровнем купонной распродажи $5Ж= 53,333 с одной степенью свободы, что приводит к значению среднего квадрата MS^, равного сумме квадратов. Объединенный эффект определяют, сложив суммы квадратов, обусловленные двумя главными эффектами (SS^ + SS^. = = 106,067 + 53,333 = 159,400). Так же поступаем и со степенями свободы (2 + 1) = 3. Для эффекта взаимодействия внутримагазинной рекламы и купонной распродажи сумма квадратов равна SSxpxe = 3,267 с (3 - 1) х (2 — I) = 2 степенями свободы, и значит, средний квадрат равен MS-quf — 3,267/2 = 1,633. Для полного эффекта сумма квадратов состоит из суммы квадратов для главного эффекта рекламы, главного эффекта купонной распродажи и эффекта взаимодействия = 106,067 + 52,333 + 3,267 = 162,667 с 2 + 1 + 2 = 5 степенями свободы, и значит, средний квадрат равен 162,667/5 = 32,533. Однако обратите внимание, что статистики ошибки отличаются от приведенных в табл. 16.4. Это обусловлено тем, что сейчас у нас два фактора вместо одного: SSoulu6KU = 23,2c (30 — 3 x 2 ) или 24 степенями свободы, отсюда средний квадрат М$аашбки= 0,967. Таблица 16.5. Двухфакторный дисперсионный анализ Источник вариации Главные эффекты Вкутришгазинная реклама Купонная распродажа 106,067 53,333 Сумма квадратов Степени свободы Средний квадрат F Значимость F of 2 53,033 53, 54,862 55, 0,000 0, 0,557 0, Глава 16. Дисперсионный и ковариационный анализ Окончание табл. 16. Источник вариации Объединенный Двухфакгорное взаимодействие Модель Остаточный компонент (ошибка) Итого Уровень внугримагазиннои рекламы квадратов 159,400 3,267 162,667 23,200 185, Сумма Степени свободы Средний квадрат 53,133 1,633 32,533 0,967 6, F 54,966 1,690 33, Значимость F 0,000 0,206 0, of • !

24 Количество {наблюдений) Средние ячеек Купонная распродажа Среднее 9,200 7,400 7,600 4,800 5,400 2, Высокий Высокий Средний Да 5 5 5 5 5 Количество (наблюдений 10 10 10 Нет fc Нет Да Нет Купонная распродажа Средний Низкий Низкий Средние факторного уровня Уровень внутримагазинной рекламы Среднее 8,300 6,200 3,700 7,400 4,733 6, Высокий Средний Низкий Нет Общее среднее 15 F- критерий для проверки значимости полного эффекта равен: 0,967 с 5 и 24 степенями свободы. Полный эффект статистически значимый при уровне значимости, равном 0,05. /-критерий для проверки значимости эффекта взаимодействия равен:

т- _ 1, 0, = 1, с 2 и 24 степенями свободы. Эффект взаимодействия статистически незначимый при уровне значимости, равном 0,05. Поскольку эффект взаимодействия статистически незначимый, оценим значимость главных эффектов, /-критерий для проверки значимости главного эффекта внутримагазинной рекламы равен: 0,967 с 2 и 24 степенями свободы. Главный эффект рекламы статистически значимый при уровне значимости, равном 0,05, Часть III. Сбор, подготовка и анализ данных /"-критерия для проверки значимости главного эффекта купонной распродажи равен;

53,333 ™ 0,967 с 1 и 24 степенями свободы. Главный эффект купонной распродажи статистически значимый при уровне значимости, равном 0,05. Таким образом, чем выше уровень рекламы, тем выше продажи. Распространение премиальных купонов также повышает продажи. Эффект влияния каждого фактора не зависит от эффекта другого фактора. Рассмотрим использование многофакторного дисперсионного анализа. ПРИМЕР. Где делают качественные телевизоры? Маркетологи исследовали эффекты, обусловленные влиянием страны-производителя телевизора на доверие людей к его качественным характеристикам: хороший звук, безотказность (надежность), четкое изображение и современный дизайн. Независимые переменные включали цену, страну-изготовителя и каналы распределения телевизоров. Использовался следующий план пересечения факторов: 2 x 2 x 2. Установили два уровня цен: 349,95 долларов (нижний) и 449,95 долларов (высший), взяли две страны-изготовителя— Корею и Соединенные Штаты Америки, и два уровня каналов распределения — в магазинах компании Hudson и в других магазинах. Данные собирали в двух крупных пригородных торговых центрах в большом городе. 30 респондентов были отобраны случайным образом для каждой из восьми ячеек факторного эксперимента, таким образом было привлечено 240 людей. В табл. 1 представлены результаты обработки комбинаций переменных, которые оказали значимые эффекты на каждую из зависимых переменных. Таблица 1. Анализ значимости комбинаций независимых переменных (факторов) Эффект, обусловленный Зависимая влиянием следующих факторов: переменная Страна х цена Странах цена Страна х распределение Страна х распределение Страна х распределение Хороший звук Безотказность Четкость изображения Безотказность Современный дизайн Одномерный критерий, F 7,57 6,57 6,17 6,57 10,31 Степени свободы (df) 1,232 1,232 1,232 1,232 1,232 Вероятность, р 0,006 0,011 0,014 0,011 0, Направления эффектов взаимодействия "страна-распределение" для трех зависимых переменных показаны в табл. 2. Таблица 2, Средние значения зависимых переменных для эффекта взаимодействия "страна-распределение" Странахраспределение Корея Hudson Другие магазины Соединенные Штаты Америки Hudson Другие магазины Четкое изображение 3,67 3,18 3,60 3,77 Безотказность 3,42 2,88 3,47 3,65 Модный дизайн 3,82 3,15 3,53 3, В то время как рейтинг доверия к таким характеристикам, как четкость изображения, I безотказность и современный дизайн повышался при распределении южнокорейских теле- \ визоров через магазины Hudson больше, чем при продаже через других дистрибьюторов, это I Глава 16. Дисперсионный и ковариационный анализ оказалось неверным для телевизоров производства США. Аналогично, направления эффектов взаимодействия "страна-распределение" для двух зависимых переменных показаны в табл. 3. При цене 449,95 долларов рейтинги доверия для "хорошего звука" и "безотказности" были выше для американских телевизоров, по сравнению с южно корейскими, но совсем незначительное различие наблюдалось в отношении страны изготовления при стоимости телевизора 349,95 доллара. Таблица 3. Средние значения зависимых переменных для эффекта взаимодействия "страна-цена" Страна ж цена $349,95 Корея 3,75 3, Хороший звук Безотказность Соединенные Штаты Америки $449,95 Корея Соединенные Штаты Америки 3, 3,15 3, 3, 2,90 3, Это исследование показывает, что доверие к характеристикам изделия для товаров, традиционно экспортируемых в Соединенные Штаты Америки компанией из быстро развивающейся индустриальной страны, можно существенно повысить, если компания распределяет свой товар через магазины известной розничной сети в США. В частности, характеристики изделия (четкость изображения, безотказность и модный дизайн) заслуживают доверия, если телевизоры сделаны в Южной Корее и распространяются через известную торговую сеть Соединенных Штатов Америки. Аналогично, такие характеристики телевизоров, как "хороший звук" и "безотказность" заслуживают доверия, если телевизоры сделаны в Соединенных Штатах Америки и продаются по более высокой цене, возможно, компенсируя потенциальный недостаток высоких производственных затрат в Соединенных Штатах Америки [13].

КОВАРИАЦИОННЫЙ АНАЛИЗ При проверке различий в средних значениях зависимой переменной, связанных с влиянием контролируемых независимых переменных, часто необходимо учитывать неконтролируемые независимые переменные. При определении намерений потребителей относительно приобретения товара известной фирмы в зависимости от цены необходимо учесть отношение к торговой марке. • Для того чтобы определить, как различные группы под влиянием разных видов рекламы, оценивают торговую марку, необходимо проконтролировать, какой информацией априорно обладают члены этих групп. • При определении влияния различных иен на потребление в семьях сухих завтраков может оказаться существенным такой фактор, как размер семьи. В приведенных выше ситуациях следует использовать дисперсионный анализ, который включает, по крайней мере, одну категориальную независимую переменную и одну интервальную или метрическую независимую переменную. Категориальную независимую переменную называют фактором, а метрическую — ковариатой. Чаше всего ковариату используют для удаления посторонней вариации из зависимой переменной, поскольку самыми важными являются эффекты факторов. Вариацию в зависимой переменной, обусловленную ковариатой, удаляют корректировкой среднего значения зависимой переменной в пределах каждого условия эксперимента. Затем, исходя из скорректированных оценок, выполняют дисперсионный анализ [14]. Значимость суммарного эффекта ковариат, как и эффект каждой ковариаты, про622 Часть III. Сбор, подготовка и анализ данных • веряют с помощью соответствующих /- критериев. Коэффициенты ковариат позволяют понять влияние, оказываемое на зависимую переменную. Ковариационный анализ наиболее полезен, когда ковариата линейно связана с зависимой переменной и не связана с факторами [15]. Для иллюстрации ковариационного анализа мы снова используем данные табл. 16.2. Предположим, что мы хотели бы определить эффекты, обусловленные влиянием внутри магазинной рекламы и купонной распродажи, на продажи, при наличии такой ковариаты> как принадлежность покупателя к числу постоянных клиентов магазина. Предполагается, что принадлежность к числу постоянных покупателей может также влиять на продажи универмага. Зависимая переменная представляла собой продажи. Как и ранее, реклама имела три уровня, а купонная распродажа — два. Степень приверженности магазину, измеренная по интервальной шкале, служила ковариатой. Результаты приведены в табл. 16.6.

Таблица 16.6. Ковариационный анализ Источник вариации Ковариаты Степень приверженности магазину Главные эффекты Реклама Купонная распродажа Объединенный Двухфакторное взаимодействие рекламационная распродажа Модель Остаточный компонент (ошибка) Итого Ковариата -постоянный покупатель 0,838 1 0,838 0,868 0,363 Сумма квадратов Степени свободы Средний квадрат Значимость F 106,067 53,333 159, 2 1 53,033 53,333 53, 54,546 54,855 54, 0,000 0,000 0, 3,267 163,505 22,362 185,867 Коэффициент корреляции - 0, 2 6 23 1,633 27,251 0,972 6, 1,680 28, 0,208 0, Как видно, сумма квадратов, связанная с ковариатой, незначительна (0,838) и имеет одну степень свободы, поэтому значение среднего квадрата идентично сумме квадратов. Соответствующий /"-критерий равен 0,838/0,972 = 0,862 с 1 и 23 степенями свободы, незначимый при уровне— 0,05. Таким образом, можно сделать следующее заключение: наличие постоянных покупателей не влияет на объем продаж универмага. Если же эффект ковариаты статистически значимый, то можно использовать знак групповового коэффициента, чтобы определить направление эффекта на зависимую переменную (прямая или обратная связь).

ВОПРОСЫ ПРИ ИНТЕРПРЕТАЦИИ РЕЗУЛЬТАТОВ Важные вопросы, возникающие при интерпретации результатов дисперсионного анализа, включают взаимодействия, относительную важность факторов и множественные сравнения.

Взаимодействие Различные взаимодействия, которые могут возникнуть при проведении ANOVA по двум или больше факторам, показаны на рис. 16.3. Одним из результатов является то, что AN OVA может указать на отсутствие взаимодействий (эффекты взаимодействий считаются незначимыми). Другая возможность заключается в том, что взаимодействие — значимое. Эффект в результате взаимодействия имеет место тогда, когда Глава 16. Дисперсионный и ковариационный анализ эффект, обусловленный действием независимой переменной на зависимую, различен для различных уровней другой независимой переменной. При упорядоченном взаимодействии (ordinal interaction) ранжированный порядок эффектов, связанных с одним фактором, не меняется вдоль уровней второго фактора.

1озможные эффекты взаимодеж Взаимодействие отсутствует (случай 1) Наличие взаимодействия Г Упорядоченное взаимодействие (случай 2) Неупорядоченное взаимодействие Взаимодействие непересекающегося типа (случай 3} Взаимодействие пересекающегося типа (случай 4) Рис. 16.3. Классификация эффектов в результате взаимодействий Упорядоченное взаимодействие (ordinal interaction) Ранжированный порядок эффектов, связанных с одним фактором, не меняется вдоль уровней второго фактора. Неупорядоченное взаимодействие (disordinal interaction), напротив, характеризуется изменением ранжированного порядка эффектов одного фактора вдоль уровней другого. Неупорядоченное взаимодействие (disordinal interaction) Изменение ранжированного порядка эффектов одного фактора вдоль уровней другого. Если взаимодействие неупорядоченное, то оно может быть непересекающимся или пересекающимся [16]. Случаи взаимодействий приведены на рис. 16.4, где принимается, что имеется два фактора: А", с тремя уровнями (Х,,,Х]21лХ,3) и Х2 с двумя уровнями (Х2„Х22). Случай 1 указывает на отсутствие взаимодействия, Отрезки прямой, отражающие эффекты, обусловленные влиянием X, на Y, параллельны отрезкам прямой, отражающим эффекты, обусловленные влиянием Х2, при двух уровнях. Наблюдается некоторое отклонение от параллельности, но оно не выше предполагаемого в данной ситуации. Параллельность подразумевает, что итоговое влияние Х22 по сравнению с Х2, одинаково на всех трех уровнях Х}. При отсутствии взаимодействия совместный эффект Х{ и Х2 равен просто сумме их индивидуальных главных эффектов. Случай 2 относится к упорядоченному взаимодействию. Отрезки прямой, отражающие влияние X, и Х2, непараллельны. Разность ординат между Х22 и Х21 увеличивается по мере движения от Хп к Х12 и от Х]2 к X,-,, но порядок рангов эффектов X, одинаков на двух уровнях Х2. Этот ранжированный порядок, причем возрастающий, такой: Х„, Х!2, Хп;

он остается таким же и для Х21 и АГщ.

Часть III. Сбор, подготовка и анализ данных Случай! Взаимодействие отсутствует Случай 2 Упорядоченное взаимодействие I I Случай 3 Неупорядоченное взаимодействие: непересекающийся тип Случай 4 Неупорядоченное взаимодействие: пересекающийся тип Рис. 16.4. Примеры взаимодействия Неупорядоченное взаимодействие непересекающегося типа имеет место в случае 3. Наименьший эффект, обусловленный влиянием Х„ наблюдается при уровне фактора Х2} и имеет место в точке Х„, а порядок рангов эффектов будет таким;

Хи, Х!2, Х,3. Однако при уровне Х22 (переменной Х2) наименьший эффект, обусловленный влиянием X,, имеет место в точке Х}2, и порядок рангов меняется на следующий: Хп, Х}1, Х13. Поскольку наблюдается изменение в порядке рангов, неупорядоченное взаимодействие сильнее, чем упорядоченное. При неупорядоченном взаимодействии пересекающегося типа отрезки прямой пересекаются, что соответствует случаю 4 на рис. 16,4. При этом относительный эффект уровней одного фактора изменяется в направлении уровней другого. Обратите внимание, что Х22 оказывает больший эффект, чем Х21 при уровнях Х„ равных Х„ и Х!2. При уровне фактора Х„ равном Х13, наблюдается обратная ситуация, и Х2} имеет больший эффект по сравнению с Х12. (В случаях 1, 2 и 3 фактор Х2 при уровне Х22 воздействует больше, чем при уровне Х2} вдоль всех трех уровней фактораX,.) Следовательно, неупорядоченное взаимодействие пересекающегося типа представляют собой наиболее сильное взаимодействие [17].

ОТНОСИТЕЛЬНАЯ ВАЖНОСТЬ ФАКТОРОВ Экспериментальные планы обычно сбалансированы, т.е. каждая ячейка содержит одинаковое количество респондентов. Это приводит к ортогональному плану, в котором факторы невзаимосвязаны. Следовательно, можно однозначно определить относительную важность каждого фактора при объяснении дисперсии зависимой переменной [18]. Самый используемый критерий в ANOVA — это омега в квадрате (omega squared), ш2. Он указывает, какая доля вариации зависимой переменной обусловлена влиянием конкретной независимой переменной (фактором).

Глава 16. Дисперсионный и ковариационный анализ Омега в квадрате, со2 (omega squared, ш2) Критерий, указывающий долю вариации зависимой переменной, обусловленную влиянием конкретной независимой переменной (фактором). Относительный вклад фактора А"вычисляют следующим образом [19];

, Ш * sso6,llia+Msouai6KU SSx-(dflxMSoaiu6ai) Обычном2 интерпретируют только для статистически значимых эффектов [20]. В табл, 16.5 ш, имеющую отношение к уровню внутри магазин ной рекламы товаров, вычисляют следующим образом:

104,133 = = 0,557 185,867 + 0,967 186,834 Обратите внимание, что в табл. 16.5 ОТ? = SS*#* = Ю6,067 + 53,333 + 3,267 + 23,2 = 185,867 Точно так же оз2, связанная с купонной распродажей, равна: 53.333-0x0,967) =52,Ш 185,867+0,967 186,834 В качестве руководства по интерпретации ш2 используем такое эмпирическое правило: большему эффекту отвечает значение ы2, равное 0,15 или выше, средний эффект имеет место при значении коэффициента, равном 0,06, и незначительный эффект— при 0,01 [21]. В табл. 16.5 и эффект рекламы, и эффект системы премиальных купонов достаточно большие, однако эффект рекламы значительно больше.

106,067-(2хО,967) Множественные сравнения С помощью /"-критерия в ANOVA проверяется только общее различие средних. Если нулевую гипотезу о равных средних отклоняют, то можно заключить, что не все групповые средние равны. Однако статистически различными могут быть не все, а только некоторые средние и поэтому необходимо проверить различия среди конкретных средних. Это можно сделать методом контрастов (contrast) или множественными сравнениями, Метод контрастов (contrast) В дисперсионном анализе метод проверки различий среди двух или больше средних групп факторного эксперимента. Контрасты могут быть априорными и апостериорными. Априорные контрасты (a priori contrasts) определяют до проведения анализа, опираясь на теоретические исследовательские выкладки. Априорные контрасты (a priori contrasts) Контрасты, которые определяют до проведения анализа, опираясь на теоретические исследовательские выкладки. Обычно априорные контрасты используют вместо /"-критерия ANOVA. Отобранные контрасты ортогональны (они независимы в статистическом смысле). Апостериорные контрасты (a posteriori contrasts) определяют после анализа. Апостериорные контрасты (a posteriori contrasts) Контрасты, сделанные после анализа. Обычно они представляют собой критерии множественных сравнений.

Часть III. Сбор, подготовка и анализ данных Чаше всего они являются критериями множественных сравнений (multiple comparison tests), Критерии множественных сравнений (multiple comparison tests) С помощью апостериорных контрастов строятся итоговые доверительные интервалы, которые можно использовать для попарных сравнений всех средних, присущих всем комбинациям условий, используемых в рамках эксперимента. Они позволяют исследователю построить итоговые доверительные интервалы, которые можно использовать для попарных сравнений всех средних для всех комбинаций условий. Эти критерии, перечисленные в порядке снижения их мощности, включают: проверку наименьшего значения значимой разности, критерий множественного размаха Дункана (Dunkan), метод Стьюдента— Ньюмана-Келса (Student-Newman—Keuls), альтернативный метод Тьюки (Tukey), проверку действительной значимой разности, модифицированную проверку наименьшего значения значимой разности и критерий Шеффе (ScliefTe). Из всех этих критериев наиболее мощный — проверка наименьшего значения значимой разности. Для углубленного ознакомления с априорными и апостериорными контрастами необходимо обратиться к соответствующей литературе [22]. Наша дискуссия предполагала, что каждый респондент подвергается воздействию факторного эксперимента только однажды. Иногда группы респондентов подвергаются воздействию факторного эксперимента несколько раз, и в этом случае следует использовать ANOVA с повторными измерениями.

ANOVA С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ Часто при проведении исследований маркетологи сталкиваются с большими различиями между индивидуальными характеристиками респондентов. Если этот источник изменчивости отделим от эффектов, обусловленных влиянием независимой переменной и ошибки эксперимента, то можно повысить чувствительность эксперимента. Один из способов управления различиями между участниками эксперимента — наблюдение каждой группы при каждой комбинации условий эксперимента (табл. 16.7).

Таблица 16.7. Разложение полной вариации;

ANOVA с повторными измерениями Независимая переменная X Номер Категории Г X, Х У] Общая выборка Хз УП.

Хс V ^ П \f Вариация между группами людей = 1 Уп У2, Пс УЙ Угз У& Уг Полная вариация= SSy 55..

Yr, YN Групповые средние У ' Y 'I Г Вариация внутри группы людей — ООднугри ГрртПЫ ЛИДИЙ Глава 16. Дисперсионный и ковариационный анализ В этом смысле каждый участник эксперимента как бы контролирует сам себя. Например, в исследовании, призванном определить различия в оценках разных авиалиний, каждый респондент оценивал все главные конкурирующие авиалинии, Поскольку от каждого респондента получают повторные данные, этот план называют внутригрупповым, или дисперсионным анализом с повторными измерениями (repeated measures analysis of variance). Дисперсионный анализ с повторными измерениями (repeated measures analysis of variance) Метод дисперсионного анализа, используемый, когда одни и те же респонденты подвергаются разным условиям эксперимента с повторными измерениями одних и тех же переменных. Дисперсионный анализ с повторными измерениями отличается от изученных ранее методов, где принималось, что каждого респондента подвергают испытаниям при одной комбинации условий эксперимента, сказанное относится и к межгрупповому плану (сравнение разных групп объектов) [23]. Дисперсионный анализ с повторными измерениями можно рассматривать как распространение r-критерия для парной выборки для случая с более, чем двумя взаимосвязанными выборками. В случае единственного фактора с повторными измерениями полную вариацию с пс ~ 1 степенями свободы можно разделить на межгрупповую и внутри групповую:

Удалим = ^^между группами людей """ ^тутро tpynnu аоАей Межгрупповая вариация, связанная с различиями в средних значениях групп, имеет л — 1 степеней свободы, а внутри групповая — п (п — \) степеней свободы. Внутри групповую вариацию, в свою очередь, можно разделить на два различных источника вариации. Один источник связан с различиями между средними факторного эксперимента, а второй состоит из остаточной вариации или вариации ошибок. Степень свободы, соответствующая вариации модели эксперимента, равна с — 1, а соответствующая остаточной вариации — (с — \) (п — \). Таким образом, VV ри fpynnij яюйей х ошибки ^^ Проверку нулевой гипотезы о равенстве средних выполним обычным методом: SSJ(c-\] MSt = ~ SSota^l(n'l}(c~\)~ MS^^ До сих пор мы считали, что зависимую переменную измеряют интервальной или относительной шкалой. Однако если зависимая переменная неметрическая, то используется другой метод проверки.

НЕМЕТРИЧЕСКИЙ ДИСПЕРСИОННЫЙ АНАЛИЗ С помощью неметрического дисперсионного анализа (nonmetric analysis of variance) проверяют различие средних значений более, чем двух групп, когда зависимая переменная измерена порядковой шкалой. Неметрический дисперсионный анализ (nonmetric analysis of variance) Методом дисперсионного анализа проверяется различие центральных значений тенеденций более, чем двух групп, когда зависимая переменная измерена порядковой шкалой. Одной из таких процедур проверки является k-выборочный медианный тест (k-sample median test). Как указывает его название, этот критерий является распространением медианного теста для двух выборок, который рассматривался в главе 15.

Часть III. Сбор, подготовка и анализ данных k-выборочный медианный тест (k-sample median test) Непараметрический критерий, используемый для проверки различий, когда число выборок больше двух и когда зависимая переменная измерена с помощью порядковой шкалы. Нулевая гипотеза утверждает, что медианы k генеральных совокупностей равны, Проверка нулевой гипотезы включает вычисление общей медианы k выборок. Затем создают 2 х Лтаблицу, состоящую из ячеек со значениями счётов, исходя из количества наблюдений, которые лежат ниже или выше медианы. Вычисляют статистику хи-квадрат. Значимость статистики хи-квадрат означает, что нулевую гипотезу следует отклонить. Более мощным критерием является однофакторный дисперсионный анализ Краскела— Уоллиса (Kruskal—Wallis one-way analysis of variance). Однофакторный дисперсионный анализ Краскела-Уоллиса (Kruskal-Wallis one-way analysis of variance) Неметрический ANOVA критерий, который использует значение ранга (порядковую статистику) каждого случая, а не просто его положение относительно медианы. Он является расширением критерия Манна—Уитни (глава 15), а также проверяет различие в значениях медиан. Нулевая гипотеза в этом случае та же, что и для медианного теста /с-выборок, но процедура проверки отличается. Все наблюдения из k групп располагают в одном ранжированном ряду. Если k совокупности одинаковые, то и группы должны быть аналогичными в смысле ранжирования в пределах каждой группы. Для каждой группы вычисляют сумму рангов. Затем вычисляют //-статистику Краскела—Уоллиса с распределением хи-квадрат. Критерий Краскела—Уоллиса более веский, чем ^-выборочный медианный, поскольку использует значение ранга каждого случая, а не просто его положение относительно медианы. Однако если в данных имеется большое число совпадающих рангов, то лучше использовать ^-выборочный медианный тест. Неметрический дисперсионный анализ непопулярен в коммерческих маркетинговых исследованиях. Другая редко используемая процедура — многомерный дисперсионный анализ.

МНОГОМЕРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ Многомерный дисперсионный анализ (multivariate analysis of variance — MANOVA) аналогичен дисперсионному анализу (ANOVA), за исключением того, что вместо одной метрической зависимой переменной имеется две или больше переменных. Многомерный дисперсионный анализ (MANOVA) (multivariate analysis of variance — MANOVA) Метод ANOVA, использующий две или больше метрических зависимых переменных. В этом случае цель остается той же, поскольку MANOVA проверяет различия между группами. В отличие от ANOVA, который проверяет групповые различия в отношении единственной зависимой переменной, MANOVA одновременно проверяет групповые различия в отношении нескольких зависимых переменных. При ANOVA нулевую гипотезу формулируют следующим образом: средние зависимой переменной равны во всех группах. Многомерный дисперсионный анализ лучше использовать, если имеется две или больше зависимых переменных, которые коррелируют. Если же имеется много зависимых переменных, которые не коррелируют или являются ортогональными, то лучше для каждой зависимой переменной выполнить ANOVA, а не MANOVA [24]. Предположим, например, что четырем группам людей, каждая из которых состоит из 100 индивидуумов, отобранных случайным образом, показано четыре вида рекламы стирального Глава 16. Дисперсионный и ковариационный анализ порошка Tide. После просмотра рекламы каждый высказал свое отношение (рейтинг предпочтения) к Tide, компании Procter & Gamble (компании, производящей Tide) и к самой рекламе. Поскольку эти три переменных взаимосвязаны, многомерным дисперсионным анализом, следует определить наиболее эффективный вид рекламы (самый высокий рейтинг предпочтения среди трех переменных). Врезка 16.1 "Практика маркетинговых исследований" демонстрирует применение ANOVA и MANOVA в международном маркетинговом исследовании, а врезка 16.2 "Практика маркетинговых исследований" показывает применение этих методов при проверке этики в маркетинговом исследовании. Врезка 16.1. Практика маркетинговых исследований Общие черты нарушения этика в ходе проведения марктеинговых исследований Рассмотрим методику исследования, в ходе которого выяснялось отношение маркетологов к нарушению этики в различных странах. Выборка маркетологов объединила специалистов из Австралии, Канады, Великобритании и Соединенных Штатов Америки. Оценки респондентов проанализированы компьютерными программами для MANOVA и ANOVA. При анализе страна, где живет респондент, являлась независимой переменной, а 15 оценок— зависимыми переменными. Значения F-статистики при выполнении дисперсионного анализа указывали на то, что только две из 15 оценок были значимыми (р < 0,05 или лучше). Значение f-статистики при выполнении многомерного дисперсионного анализа оказалось статистически незначимым, что указывало на отсутствие различий в оценках среди респондентов четырех стран. Поэтому был сделан вывод, что маркетологи из четырех стран одинаково относятся к неэтичной исследовательской практике [25].

Врезка 16.2. Практика маркетинговых исследований MANO VA демонстрирует, что мнение мужчины отличается от мнения женщины Для исследования различия в оценках этики мужчинами и женщинами использовали статистические методы MANOVA и ANOVA. Респондентов просили указать их степень одобрения серии сценариев, включающих решения этического характера. Эти оценки служили зависимыми переменными при анализе, а пол респондентов — независимой переменной, MANOVA использовали для выполнения многомерного анализа, в результате которого оказалось, что значение /'является значимым с уровнем значимости р < 0,001. Это означает, что отношение мужчин и женщин к этике исследования полностью отличаются. Выполнен одномерный дисперсионный анализ, и f-значения указали, что три пункта внесли наибольший вклад в различие оценок, даваемых мужчинами и женщинами этике исследования: использование ультрафиолетовых чернил для предварительного кодирования почтового вопросника;

использование рекламы, которая способствовала неправильному использованию потребителями товара, и нежелание исследователя предоставить данные, которые помогли бы городской группе консультантов [27].

ИСПОЛЬЗОВАНИЕ INTERNET И КОМПЬЮТЕРА Все три компьютерных пакета (SPSS, SAS, BMDP) имеют возможности для проведения дисперсионного и ковариационного анализа. Дополнительно к основному анализу, эти программы могут выполнять более сложный анализ. Minitab и Excel также предлагают некоторые программы для этой цели. Приведем описание соответствующих программ. Для детального ознакомления обратитесь к соответствующим руководствам [26].

Часть III. Сбор, подготовка и анализ данных Компьютерные программы для ANOVA и ANCOVA SPSS Можно эффективно выполнить однофакторный AN OVA, используя программу ONEWAY. Эта программа также позволяет проверить априорные и апостериорные контрасты. Для выполнения многофакторного дисперсионного анализа используем ANOVA. Хотя с помощью программы ANOVA можно определить ковариаты, она не позволяет выполнить полный ковариационный анализ. Для полного дисперсионного или ковариационного анализа, включая повторные измерения или множественные зависимые измерения, рекомендуется процедура MANOVA. Для неметрического дисперсионного анализа, включая медианный тест ^-выборок и однофакторный дисперсионный анализ Краскела—Уоллеса (Kruskal-Wallis), следует использовать программу NPAR TESTS.

SAS Основная программа для выполнения дисперсионного анализа в случае сбалансированного плана — ANOVA. Она обрабатывает данные из широкого диапазона экспериментальных планов, включая многомерный дисперсионный анализ и повторные измерения. Можно проверить как априорные, так и апостериорные контрасты. Для несбалансированных планов используется более общая GLM-процедура. Эта программа выполняет следующий анализ: дисперсионный, ковариационный, дисперсионный с повторными измерениями и множественный дисперсионный, а также проверяет априорные и апостериорные контрасты. Хотя программа GLM используется и для анализа сбалансированных планов, она не настолько эффективна для таких моделей, как программа ANOVA. Процедура VARCOMP вычисляет компоненты дисперсии. Для неметрического дисперсионного анализа используем NPAR1WAY.

BMDP Для однофакторного дисперсионного анатиза используем программу P1V. Она выполняет ковариационный анализ, а также проверяют конкретные контрасты групповых средних. Однако более общей моделью является программа P2V, которая выполняет дисперсионный и ковариационный анализ для множества моделей эксперимента с фиксированными уровнями факторов. Она также может обрабатывать повторные измерения, сбалансированные и несбалансированные планы. P4V, являясь более совершенной программой, может выполнять многомерный дисперсионный и ковариационный анализы, в том числе и анализ комплексных экспериментальных планов. Другой специализированной программой является P3V, которая использует метод максимального правдоподобия для анализа моделей с фиксированными и случайными коэффициентами. Она подходит как для сбалансированных, так и несбалансированных планов. P8V является общей моделью, которая выполняет дисперсионный анализ для любого полного плана с ячейками одинакового размера. Непараметрическии дисперсионный анализ можно выполнить с помощью программы P3S. И наконец, программа P7D, кроме создания гистограмм, может выполнять однофакторный дисперсионный анализ.

Minitab Дисперсионный и ковариационный анализ можно выполнить с помощью функции Stats>ANOVA. Она выполняет однофакторный ANOVA, однофакторный невложенный (unstacked) ANOVA, двухфакторный ANOVA, анализ средних, сбалансированный ANOVA, ковариационный анализ, общую линейную модель, построение графика главных эффектов, графика взаимодействия и графиков остатков. Для вычисления среднего и стандартного отклонений применима функция кросстабулирования. Для получения F и р значений используйте сбалансированный ANOVA. Excel С помощью функции Tools>Data Analysis можно выполнить как однофакторный, так и двухфакторный ANOVA. Двухфакторный ANOVA имеет возможности двухфакторного ана Глава 16. Дисперсионный и ковариационный анализ лиза с повторением и без повторения. Двухфакторный анализ с повторением содержит несколько выборок для каждой группы данных.

Часто задачи, для которых можно использовать ANOVA, имеют независимые переменные (предикторы), которые являются взаимосвязанными. Такая ситуация требует особого внимания. Проанализируем исследование, выполненное Burke, в котором коррелируют две категориальные независимые переменные. Здесь приводится небольшой набор данных (реальные данные являются собственностью компании).

Намерение купить товар (PI) Рейтинг эффективности 1,00 2,00 3,00 4,00 5,00 6,00 1,00 2,00 3,00 4,00 5,00 6, Пол 0,00 1, 1,1) 2,00 4,00 6,00 4,00 5,00 6,00 2,00 3,00 4,00 5,00 6,00 8, 0,00 0,00 1,00 0.00 0,00 0,00 1,00 1,00 1, Поскольку два предиктора в некоторой степени коррелируют (г = 0,24), важно определить вклад каждого. Первая таблица ANOVA показывает сумму квадратов рабочей модели при допущении, что суммы квадратов для каждого предиктора скорректированы на наличие другого предиктора (т.е. как будто каждый предиктор был введен вторым). Вторая таблица ANOVA показывает результирующее действие иерархического моделирования, когда предиктор '"Рейтинг" был "введен" первым. Третья таблица ANOVA показывает результирующее действие иерархического моделирования, когда предиктор '"Пол" "введен" первым. ANOVA а.Ь Однозначный метод Сумма квадратов PI Главные эффекты (Совместный} Рейтинг 32,542 Степени свободы (df) Средний квадрат 5,424 F 11,418 Значимость 0, Пол Модель Остаток Итого a) PI по рейтингу, полу;

в) Все эффекты введены одновременно.

13,792 3,125 32,542 2.375 34, 5 2,758 3,125 3,424 0, 5,807 6,579 11, 0,038 0,050 0, 3, Часть III. Сбор, подготовка и анализ данных ANOVAa Иерархический метод Сумма квадратов PI Главные эффекты (Совместный) Рейтинг Пол МОДЕЛЬ Степени свободы (df) Средний квадрат 5,424 5, F Значимость 32,542 29, 3, 32,542 2,375 34, Остаток Итого а) Р1 по рейтингу, полу 6 5 1 6 5 11,418 12,386 6,579 11, 0,009 0,008 0,050 0, 3, 5,424 0, 3, ANOVA И Иерархический метод Сумма квадратов Главные эффекты Модель Степени свободы (df) Средний квадрат 5,424 18,750 2,758 5,424 0, 3, F 11,418 39,474 5,807 11, Значимость 0,009 0,002 0,038 0, (Совместный) Рейтинг Пол 32, 18,750 13,792 32,542 2,375 34, 6 Остаток Итог a) PI по полу, рейтингу.

Обобщение результатов Сумма квадратов Регрессия 13,792 Первый фактор ~ рейтинг 29,417 Первый фактор — пол 18,750 13,792 32,542 32, Рейтинг ;

Пол Общая для предикторов Общая объяснимая 3, 16,917 32, 3, 32,542 32, Теперь, когда вопрос ясен, необходимо определить, за какую долю в сумме квадратов отвечает каждая независимая переменная? Так как предикторы взаимосвязаны, иерархический метод показывает сумму квадратов для предикторов, введенных в заданном порядке. Однозначное решение показывает объяснимую сумму квадратов для каждого предиктора, как будто он был введен вторым (вот почему ее не прибавляют к собственной сумме... оба предиктора нельзя ввести вторыми). Три решения дают полную картину вклада каждого предиктора, если бы он был единственной независимой переменной и его предельный вклад был бы как у второго предиктора.

РЕЗЮМЕ В дисперсионном (ANOVA) и ковариационном (ANCOVA) анализе зависимая переменная метрическая, а все независимые переменные категориальные или представляют собой комби Глава 16. Дисперсионный и ковариационный анализ нации категориальных и метрических переменных. Однофакторный дисперсионный анализ включает единственную независимую категориальную переменную. Суть метода заключается в проверке нулевой гипотезы о равенстве средних в совокупности. Полная вариация в зависимой переменной раскладывается на два компонента: вариация, связанная с независимой переменной, и вариация, связанная с ошибкой. Вариацию выражают как сумму квадратов, скорректированную на среднее значение (SS). Средний квадрат получают делением суммы квадратов (SS) на соответствующее число степеней свободы (df)- Нулевую гипотезу о равенстве средних проверяют с помощью F-статистики, которая представляет собой отношение среднего квадрата независимой переменной к среднему квадрату ошибки. Многофакторный дисперсионный анализ включает одновременное исследование двух или больше категориальных независимых переменных. Главное преимущество этого анализа в том, что он позволяет изучить взаимодействия между независимыми переменными. Значимость общего эффекта, эффекты взаимодействия и главные эффекты отдельных факторов изучают с помощью соответствующих У7-критериев. Имеет смысл проверять значимость главных эффектов отдельных факторов, только если соответствующие эффекты взаимодействия незначимы. Ковариационный анализ включает, по крайней мере, одну категориальную независимую переменную и одну интервальную или метрическую независимую переменную. Метрическую независимую переменную или ковариату обычно используют для удаления посторонних вариаций из независимой переменной. Если дисперсионный анализ выполняют для двух или больше факторов, то могут возникнуть проблемы их взаимодействия. Взаимодействие имеет место, если эффект независимой переменной на зависимую различен для разных уровней другой независимой переменной. Если взаимодействие статистически значимо, оно может быть упорядоченным или неупорядоченным. Неупорядоченное взаимодействие может быть пересекающегося или непересекающегося типа. В сбалансированных планах относительную важность факторов при объяснении вариации в зависимой переменной измеряют с помощью со2. Для изучения рахтичий между конкретными средними используются множественные сравнения либо в форме априорных, либо в форме апостериорных контрастов. В дисперсионном анализе с повторными измерениями наблюдения над каждым участником эксперимента выполняются для каждой комбинации условий эксперимента. Этот план полезен для управления различиями среди участников, которые существуют априори и известны до проведения эксперимента. Неметрический дисперсионный анализ включает изучение различий в средних значениях двух или больше групп, когда зависимая переменная измерена порядковой шкалой. Многомерный дисперсионный анализ (MANOVA) включает две или больше метрических зависимых переменных.

ОСНОВНЫЕ ТЕРМИНЫ И ПОНЯТИЯ F-статистика (F-statstic) ^-выборочный медианный тест (^-sample median test) апостериорные контрасты (a posteriori contrasts) априорные контрасты (a priori contrasts) взаимодействие (interaction) внутри групповая вариация SSeHympu (^ет,г) дисперсионный анализ (analysis of variance-AN OVA) дисперсионный анализ с повторными измерениями (repeated measures analysis of variance) значимость главного эффекта каждого фактора (significance of the main effect of each factor) значимость полного эффекта (significance of overall effect) значимость эффекта взаимодействия (significance of the interaction effect) ковариата (covariate) ковариационный анализ (analysis of covariance - ANCOVA) Часть III. Сбор, подготовка и анализ данных контрасты (contrasts) корреляционное отношение, eta

10. Как измеряют относительную важность факторов в сбалансированном плане? 11. Что такое априорный контраст? 12. Какой самый мощный критерий для апостериорных контрастов? Какой критерий наиболее слабый? 13. Что подразумевают под ANOVA с повторными измерениями? Опишите разложение вариации в ANOVA с повторными измерениями. 14. Какие различия между метрическим и неметрическим дисперсионным анализом? 15. Опишите два критерия, используемые для изучения среднего значения в совокупностях при неметрическом ANOVA. 16. Что такое многомерный дисперсионный анализ? Когда его лучше использовать?

Глава 16. Дисперсионный и ковариационный анализ Задачи 1. Получив ряд жалоб от читателей, редколлегия студенческой газеты решила переоформить первую страницу. Разработали два новых варианта — В и С, которые сравнили со старым вариантом А. Сформирована случайным образом выборка из 75 студентов и по 25 студентов распределены для оценки каждого из трех вариантов. Студентов попросили оценить эффективность варианта по одиннадцатибальной шкале (1 бал— плохо, 11 —отлично). a) Сформулируйте нулевую гипотезу. b) Какой статистический критерий вам следует использовать? c) Сколько степеней свободы связано со статистикой, лежащей в основе критерия для проверки гипотезы? 2. Маркетолог-исследователь хочет проверить гипотезу о том, что в генеральной совокупности не существует различий в важности покупок для потребителей, которые живут на севере, юге, востоке и западе Соединенных Штатов Америки. После сбора данных и дисперсионного анализа получены результаты, представленные в следующей таблице. Источник вариации Меаду группами Внутри групп Степени свободы 3 Сумма квадратов 70,212 20812, Средние квадраты 23,404 20, F (отношение дисперсий) 1, Вероятность 0, a) Достаточно ли оснований для отклонения нулевой гипотезы? b) Какое заключение можно сделать на основании данной таблицы? c) Если среднее значение важности покупок рассчитано для каждой группы, то, как вы считаете, выборочные средние одинаковы или разные? d) Чему равен размер выборки в данном исследовании? 3. В пилотном исследовании, где изучалась эффективность трех рекламных роликов (А, # и С), выбрали 10 потребителей для оценки рекламы по девяти балльной шкале Лайкерта. Полученные данные приведены в таблице. a) Вычислите категориальную и общую средние. b) Вычислите SSy, SSt и SSautufiKU. c) Вычислите корреляционное отношение г\2. d) Вычислите значение F. e) Эффективны ли в равной степени все три ролика?

Рекламные ролики А в 7 л 6 5 4 г С 8 7 7 4 П 3 4 Л 8 7 6 8 5 ( 3 :• :;

> 4 Часть lit. Сбор, подготовка и анализ данных 4. Маркетологи с помощью эксперимента проверили влияние дизайна упаковки и оформления витрины на вероятность покупки сухого завтрака Product 19. Дизайн упаковки и оформление витрины изменялись на двух уровнях каждый, что вылилось в план 2 x 2. Вероятность покупки измерялась по семибалльной шкале. Результаты частично приведены ниже в таблице. a) Заполните до конца таблицу, вычислив значения среднего квадрата, F, значимости Ей (о. b) Как интерпретировать главные эффекты?

Источник вариации Сумма квадратов Степени свободы Средний квадрат F Значимость F of Дизайн упаковки Оформление витрины 68, 320, Двухфакторное взаимодействие 55,05 Остаточная ошибка 176, 1 УПРАЖНЕНИЯ С ИСПОЛЬЗОВАНИЕМ INTERNET И КОМПЬЮТЕРА Используя соответствующие программы для компьютера на свой выбор (SPSS, SAS, BMDP, Minitab и Excel), проанализируйте данные табл. 16.2. Выполните однофакторный ANOVA, двухфакторный ANOVA и ковариационный анализ. Сравните полученные результаты с приведенными в книге. 2. Используя подходящую компьютерную программу, проанализируйте данные задачи 3. 1.

КОММЕНТАРИИ 1. Thomas Kiely, "The Internet: Fear and Shopping in Cyberspace"1, Harvard Business Review, JulyAugust 1997, p. 13—14;

Pradeep Korgaonkar, George Moschis, "The Effects of Perceived Risk and Social Class on Consumer Preferences for Distribution Outlets" in Paul Bloom, Russ Winer, Harold H. Kassarjian, Debra L. Scammon, Bart Weitz, Robert Spekman, Vijay Mahajan, Michael Levy (eds.) Enhancing Knowledge Development in Marketing, Series № 55 (Chicago, IL: American Marketing Association, 1989), p. 39-43. 2. Michael Wilke, "Health Reports in Vogue Again for Drug Advertisers", Advertising Age, August 18, 1997, p. 31;

Easwar S. Iyer, "The Influence of Verbal Content and Relative Newness on the Effectiveness of Comparative Advertising", Journal of Advertising 17 (1988), p. 15—21. 3. По последним применениям дисперсионного анализа см. работы Sajeev Varki, Rowland T. Rust, "Satisfaction Is Relative", Marketing Research: A Magazine of Management & Applications, Summer 1997, p, 14—19;

Rohit Deshpande, Douglas M. Stayman, "A Tale of Two Cities: Distinctiveness Theory and Advertising Effectiveness", Journal of Marketing Research, February 1994, p. 57—64. 4. Daniel B. Wright, Understanding Statistics (Thousand Oaks, CA: Sage Publications, 1993);

M.J. Norusis, The SPSS Guide to Data Analysis for SPSS/PC+ (Chicago: SPSS Inc., 1991), p. 4. 5. Wade C. Driscoll, "Robustness of the ANOVA and Tukey-Kramer Statistical Tests", Computers & Industrial Engineering, October 1996, p. 265-268;

Richard K. Burdick, "Statement of Hypotheses in the Analysis of Variance", Journal of Marketing Research, August 1983, p. 320-324. 6. F -критерий представляет собой обобщенную форму ( -критерия. Если случайная переменная является t -распределенной с л степенями свободы, то г подчиняется F -распределению с 1 и п степенями свободы. Если есть два факторных уровня или факторных эксперимента, то дисперсионный анализ эквивалентен двусторонней проверке с помощью / -критерия.

Глава 16. Дисперсионный и ковариационный анализ 7.

Хотя расчеты аналогичны для модели с фиксированными факторами и случайными, интерпретация результатов разная. Сравнение этих методов можно найти в работах Amir Frez, Matthew С. Bloom, Martin T. Wells, "Using Random Rather Than Fixed Effects Models in MetaAnalysis: Implications for Situational Specificity and Validity Generalization'', Personnel Psychology, Summer 1996, p. 275-306;

John W. Neter, Applied Linear Statistical Models, 4th ed. (Burr Ridge, IL: Irwin, 1996), 8. Dawn Wilensky, "Cents and Sensibility", Discount Store News, March 4, 1996, p. 18—19;

Denise T, Smart, James E. Zemanek, Jr., Jeffrey S. Conant, "Videolog Retailing: How Effective Is This New Form of Direct Mail Marketing?", in Paul Bloom, Russ Winer, Harold H. Kassarjian, Debra L. Scammon, Bart Weitz, Robert Speckman, Vijay Mahajan, Michael Levy (eds.), Enhancing Knowledge Development in Marketing, Series № 55 (Chicago, IL: American Marketing Association, 1989), p.85. 9. Мы рассматриваем только полные факториальные модели, которые объединяют все возможные комбинации уровней факторов. Например, см. статью Geeta Menon, "Are the Parts Better Than the Whole? The Effects of Decomposition Questions on Judgements of Frequent Behaviors", Journal of Marketing Research, August 1997, p. 335—346. 10. James Jaccard, Interaction Effects in Factorial Analysis of Variance (Thousand Oaks, CA: Sage Publications, 1997);

Jerome L. Mayers, Fundamentals of Experimental Design, 3rd ed. (Boston, MA: Allyn & Bacon, 1979). Также см. статью Mark T. Spence, Merrie Brucks, "The Moderating Effects of Problem Characteristics on Experts' and Noveces' Judgements", Journal of Marketing Research, February 1997, p. 233-247. 11. Jacques Tacq, Muftivariate Analysis Techniques in Social Science Research (Thousand Oaks, CA: Sage Publications, 1997);

Wayne W. Daniel, James C. Terrell, Business Statistics, 7th ed. (Boston, MA: Houghton Mifflin, 1995). 12. James Jaccard, Interaction Effects in Factorial Analysis of Variance (Thousand Oaks, CA: Sage Publications, 1997). 13. Robert A. Peterson, Alain J. Jolibert, "A Meta-Analysis of Country-of-Origin Effects", Journal of International Business Studies, Fourth Quarter 1995, p. 883—900;

Paul Chao, "The Impact of Country Affiliation on the Credibility of Product Attribute Claims", Journal of Advertising Research, AprilMay 1989, p, 35-41. 14. Хотя это и считается наиболее обшим методом выполнения дисперсионного анализа, возможны и другие ситуации. Например, эффекты ковариаций и факторов могут быть интересны в равной степени или набор ковариаций может быть очень важным. Текущее применение см. в статье Kevin Lane Keller, David A. Aaker, "The Effects of Sequential Introduction of Brand Extensions", Journal of Marketing Research, February 1992, p. 35—50. 15. Для более детального обсуждения см. работы John W, Neter, Applied Linear Statistical Models, 4th ed. (Burr Ridge, IL: Irwin, 1996);

A.R. Wildt, O.T. Ahtola, Analysis ofCovariance (Beverly Hills, CA: Sage Publications, 1978). 16. U.N. Umesh, Robert A. Peterson, Michelle McCann-Nelson, Rajiv Vaidyanathan, "Type IV Error in Marketing Research: The Investigation of AN OVA Interactions", Journal of the Academy of Marketing Science, Winter 1966, p. 17—26;

William T. Ross, Jr., Elizabeth H. Greyer, "Interpreting Interactions: Raw Means or Residual Means", Journal of Consumer Research, September 1993, p. 330—338;

J.H. Leigh, T.C. Kennear, "On Interaction Classification", Educational and Psychological Measurement, Winter 1980, p. 841-843. 17. James Jaccard, Interaction Effects in Factorial Analysis of Variance (Thousand Oaks, CA: Sage Publications, 1997);

Brian Wansink, "Advertising's Impact on Category Substitution", Journal of Marketing Research, November 1994, p. 505—515;

Laura A. Peracchio, Joan Meyers-Levy, "How Ambiguous Cropped Objects in Ad Photos Can Affect Product Evaluations", Journal of Consumer Research, June 1994, p. 190-204. 18. Rohit Verma, John C. Goodale, "Statistical Power in Operations Management", Journal of Operations Management, August 1995, p. 139—152;

Gordon A. Wyner. ''The Significance of Marketing Research", Часть III. Сбор, подготовка и анализ данных Marketing Research: A Magazine of Management & Applications, Winter 1993, p. 43—45;

Alan Sawyer, J. Paul Peter, "The Significance of Statistical Significance Tests in Marketing Research", Journal of Marketing Research, May 1983, p. 125;

Pages:     | 1 |   ...   | 13 | 14 || 16 | 17 |   ...   | 22 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.