WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 10 |

Найдем табличное значение коэффициента ртабл, для = 0,05 и n = его величина составит 0,580. Поскольку ррасч > ртабл (0,633 и 0,580), то с вероятностью 95 % можно утверждать, что исследуемая связь является значимой.

Однако для уровня значимости = 0,01 табличное значение ртабл = 0,723. Тем самым уже для вероятности 99 % наличие связи становится неочевидной.

Таким образом, общий вывод можно свести к следующему тезису:

следовало бы повысить число обследуемых студентов (увеличить объем выборки), а при отсутствии такой возможности высказанные оценки следует воспринимать с определенной осторожностью.

ГОУ ВПО УГТУ-УПИ – Бараз В.Р. Корреляционно-регрессионный анализ Таблица Расчетная таблица для определения коэффициента корреляции рангов Спирмена Поряд- Заработок, Разность ковый фирма «Коло- Заработок, фирма рангов Ранг Ранг номер кольный «Мельхиор», dRx Ry d = Rx - студен- звон», тыс. тыс. руб. (у) Ry та руб. (х) 1 2 3 4 5 6 1 2,8 3,3 6 3 3 2 3,1 3,0 5 6 1 3 2,0 2,8 11 7 4 4 3,2 4,1 4 2 2 5 2,4 2,1 8 12 4 6 3,3 2,7 3 8 5 7 2,2 2,5 10 10 0 8 1,8 2,3 12 11 1 9 2,5 3.2 7 4 3 10 2,3 2.6 9 9 0 11 3,5 3,1 1 5 4 12 3,4 4,5 2 1 1 Итого Заметим, что ранговый коэффициент корреляции Спирмена может быть использован не только для оценки связи качественных признаков, но и количественных. Принципиальное условие - значения признаков поддаются ранжированию (как именно - по степени убывания или возрастания - это не важно).

Теперь ту же задачу мы решим, используя компьютерные расчеты. В данном случае Excel нам поможет выполнить рутинные расчеты, хотя сама процедура поиска коэффициента корреляции Спирмена будет носить схожий характер.

ГОУ ВПО УГТУ-УПИ – связи показателей коммерческой деятельности с использованием программы Excel Итак, запустим программу Excel. В открывшемся рабочем листе Excel (Лист 1) сформируем исходную таблицу, в которой поместим данные, соответствующие содержимому колонок 1-3 табл.3. Эта таблица будет располагаться в ячейках A1:C13. Итоговый результат представлен на рис.6.

Рис.6. Исходные данные в таблице Excel Далее будем двигаться следующим образом: запустим опции Сервис/Анализ данных/Ранг и персентиль.

Примечание. Тут следует дать предварительное пояснение. В отношении рангов рассуждения у нас уже были. Теперь дадим разъяснение по поводу термина персентиль (или, как принято писать, перцентиль).

Как уже говорилось, для характеристики формы распределения вариационного ряда применяют ранговые показатели. Под этим понимают такие единицы исследуемого массива, которые занимают определенное место в вариационном ряду (например, десятое, двадцатое и т.д.). Они получили название квантилей или градиентов. Квантили в свою очередь подразделяГОУ ВПО УГТУ-УПИ – Бараз В.Р. Корреляционно-регрессионный анализ ются на квартили, децили и перцентили. Различие между ними в том, на какое количество частей делится вариационный ряд. Если на 4 части - это квартили; на 10 - децили и, наконец, на 100 - перцентили.

Поясним это на примере перцентилей. Перцентили - это характеристики набора данных, которые выражают ранги элементов массива в виде процентов от 0 до 100 %, а не в виде чисел от 1 до n. В результате наименьшему значению соответствует нулевой перцентиль, наибольшему - 100-й перцентиль, медиане - 50-й перцентиль и т.д. Следовательно, перцентили можно рассматривать как показатели, разбивающие анализируемый массив на определенные части.

Заметим, что перцентиль представляет собой какой-то элемент массива, имеющий определенный ранг и выраженный в тех же единицах, что и сам массив в целом. Так, 60-й перцентиль эффективности сбора металлолома в конторе «Ржавая подкова» составляет, скажем, 85062 руб. (измерен не в процентах, а в рублях, как элемент набора данных). Если этот 60-й перцентиль, равный 85062 руб., характеризует деятельность определенного агента по заготовкам (например, г-на Пупкина), то это означает, что примерно 60 % других тружеников имеют результат ниже, чем у г-на Пупкина, а 40 % - более высокие показатели.

Перцентили используются для двух целей:

- чтобы показать значение элемента в массиве при заданном перцентильном ранге (например, «10-й перцентиль равен 46293 руб.»);

- чтобы показать перцентильный ранг значения данного элемента в рассматриваемом массиве статистических данных (например, «эффективность заготовок металлолома агента г-на Козлевича составляет 65994 руб., что соответствует 55-му перцентилю»).

ГОУ ВПО УГТУ-УПИ – связи показателей коммерческой деятельности с использованием программы Excel Продолжим рассмотрение нашей задачи. В диалоговом окне Ранг и персентиль заполним поле Входной интервал (рис.7).

Рис. 7. Диалоговое окно Ранг и перцентиль В нем укажем данные 2-й графы табл. 3 (вместе с заголовком), относящиеся к фирме «Колокольный звон» (это диапазон ячеек $B$1:$B$13). Отметим флажком позицию Метки в первой строке (поскольку нам нужно сохранить заголовок этой графы), а затем в окне Выходной интервал укажем ячейку $I$1, в которой будет размещена таблица с рассчитанными показателями рангов и перцентилей. После этого – кнопка ОК.

Затем аналогичным образом поступим с данными 3-й графы (сведения от фирмы «Мельхиор»). При заполнении диалогового окна Ранг и персентиль отметим диапазон ячеек $С$1:$С$13, а для опции Выходной интервал покажем ячейку, которая должна быть по соседству с первой половинкой нашей общей таблицы. Это ячейка $М$1.

В окончательном виде наша таблица примет следующий вид (рис.8).

Как видно, Excel аккуратно проранжировал результаты по каждому эпизоду, расположив студентов по местам в соответствии с их материальныГОУ ВПО УГТУ-УПИ – Бараз В.Р. Корреляционно-регрессионный анализ ми успехами, а также указал их перцентильный ранг (в %). Для дальнейших рассуждений данные по перцентилям мы использовать не станем, а вот ранги окажутся совершенно необходимыми.

Рис. 8. Расчетная таблица с показателями рангов и перцентилей На основании ранговых оценок организуем сводную таблицу, аналогичную уже знакомой нам табл.3 (рис.9). Для удобства перейдем на другой рабочий лист (Лист 2). Для выполнения последующих расчетов используем итоговый результат, отражающий сумму разностей квадратов рангов, равную 105. Оформим вспомогательную таблицу (рис.9), в которой укажем значение d2 = 105, размер выборки n = 12, а также предусмотрим в ней ячейку, где поместим рассчитанное значение коэффициента ранговой корреляции р (ячейка Е22).

Поместим курсор в ячейку Е22, а затем в поле формулы запишем уравнение, по которому будем рассчитать коэффициент р. Выглядит оно так:

= 1 - 6*(Е20)/(Е21*(Е21^2 - 1)) В ячейке появится искомый результат 0,632867. С округлением принимаем его равным 0,633 – коэффициент оказался именно таким, каким мы его вычислили «вручную».

ГОУ ВПО УГТУ-УПИ – связи показателей коммерческой деятельности с использованием программы Excel Полученный результат показывает, что в данной ситуации надлежит высказать совершенно те же соображения по поводу исследуемого процесса, какие были сделаны для случая расчета коэффициента р традиционным способом. При доверительной вероятности 0,95 студенты вполне могут горделиво полагать, что их материальные достижения всецело определяются личным усердием и не зависят от каких-то иных привходящих факторов. Однако требование более строгой оценки (с вероятностью 99 %) делает такое мнение менее очевидным и для значимого статистического вывода возникает необходимость расширить выборку (привлечь для анализа большее число студентов) либо (при невозможности это сделать) отнестись к результату вполне философски.

Рис. 9. Фрагмент рабочего листа Excel с обобщенной таблицей и данными для расчета коэффициента корреляции Спирмена.

ГОУ ВПО УГТУ-УПИ – Бараз В.Р. Корреляционно-регрессионный анализ Регрессионный метод оценки коммерческой деятельности Если мой сосед бьет жену каждый день, а я никогда, то с точки зрения статистики мы оба бьем своих жен через день.

(Бернард Шоу) Подожди - и плохое само собой исчезнет..., нанеся положенный ущерб.

(Расширенный закон Мэрфи) В практике статистического исследования весьма часто возникает необходимость определить не только корреляционное соотношение между изучаемыми характеристиками, но и установить определенную обусловленность между ними, представив выявленную связь в строгой аналитической форме.

В этом случае результат исследования – экспериментальная зависимость воздействия какого-либо фактора (скажем, производительности труда, уровня образования, практического стажа работы и т.д.) на изменение изучаемого параметра (например, величины прибыли фирмы) - может быть не только представлен в виде графика (что весьма наглядно), но и описан математически с использованием аппроксимирующего выражения (эмпирической формулы).

Исследование такой ситуации и является задачей регрессионного анализа, который дает предсказание (прогнозирование) одной переменной на основании другой. Регрессионный анализ четко распределяет роли между изучаемыми характеристиками - одна из них является аргументом, а вторая функцией. Переменная, которая прогнозируется (функция), обозначается как у, а переменная, которая используется для такого прогнозирования (аргумент или фактор), - это х.

Таким образом, в случае выявления корреляции дается попытка ответить на вопрос: «Существует ли связь» Целью регрессионного анализа являГОУ ВПО УГТУ-УПИ – связи показателей коммерческой деятельности с использованием программы Excel ется поиск ответа на уже более сложный вопрос: «Каков вид этой связи Что на что влияет» Однако в последнем случае речь не идет о выяснении механизма причинности обнаруженной связи, т.е. не ставится вопрос «Почему существует связь» Это уже считается проблемой специального исследования, касающегося выявления физической (или социальной) природы изучаемого процесса.

2.1. Аппроксимационные модели При изучении любого процесса (физического, социального) приходится сталкиваться с необходимостью представлять его в качестве некоторой модели, т.е. в виде какого-то образа. Этот образ может быть заявлен в описательной форме (эпистолярный жанр), может изображаться в форме математического уравнения (формулы) или же показан как графическая картинка.

Следовательно, сам оригинал (физический процесс, экономическое явление) заменяется некоторым аналогом, «эрзацем» (т.е. моделью). Такое создание «заместителя оригинала» и принято называть аппроксимацией.

Обычно под аппроксимацией (от лат. approximatio - приближение) понимают замену одного объекта другим, более известным и более простым, однако весьма близким к исходному по своему содержанию.

В этом случае связь между исходным объектом (оригиналом) F и его приближенным представлением (моделью) f соответствует приближенному равенству F f (рис.10).

Оригинал F (в виде Изображение f (в виде реального процесса) математической модели) Рис.10. Схематическая связь между оригиналом и моделью объекта ГОУ ВПО УГТУ-УПИ – Бараз В.Р. Корреляционно-регрессионный анализ Задача аппроксимации часто возникает при обработке результатов экспериментов, когда становится необходимым подобрать математическую модель изучаемого процесса, т.е. дать его аналитическое описание в виде так называемой эмпирической формулы.

При подборе эмпирической формулы обычно используется феноменологический подход. Этот термин означает, что изучаемому процессу придается чисто описательный вид, при котором довольствуются только сведениями о внешнем характере этого процесса, но игнорируется причинность проявления рассматриваемой зависимости. В этом смысле феноменологический подход можно уподобить кибернетической модели «черного ящика». Как известно, при этом анализируется комбинация «вход-выход», т.е. характер влияния воздействующего фактора (аргумента) на исследуемый параметр (отклик или функцию). Однако содержимое «черного ящика» остается вещью в себе, т.е. физическая (или экономическая) природа процесса не обсуждается. Принципиальная особенность физического подхода состоит в том, что исследуемый процесс оценивается с позиций причин его проявления. Следовательно, если при феноменологическом подходе основной вопрос ставится в формулировке «Как произошло», то при физическом описании - «Почему произошло» Тем самым феноменология дает чисто формальное, внешнее описание процесса, физический же подход основывается на выяснении его причин, его природы.

2.2. Выбор формул лучшего вида При изучении связи показателей коммерческой деятельности применяются различного вида уравнения прямолинейной и криволинейной связи.

Формально могут возникать ситуации двух типов:

1. Вид функциональной зависимости неизвестен. В этом случае нужно решить предварительно задачу, направленную на отыскание подходящей функциональной зависимости. Это достаточно сложная задача, но она усГОУ ВПО УГТУ-УПИ – связи показателей коммерческой деятельности с использованием программы Excel пешно решается современными средствами информационных технологий (программа Excel).

2. Вид функциональной зависимости известен и требуется только найти ее параметры (коэффициенты регрессии b0, b1, b2, …).

Термином линейный регрессионный анализ обозначают такое прогнозирование, которое описывается линейной взаимосвязью между исследуемыми переменными: y = b0 + b1x.

В случае криволинейных зависимостей применяются математические функции следующего вида:

гиперболическая y = b0 + b1 /x;

показательная y = b0 + b1x;

степенная y = b0x b1;

параболическая y = b0 + b1x + b2x2;

логарифмическая y = b0 + b1lgx;

экспоненциальная y = b0exp (b1x) и другие.

Решение математических уравнений связи предполагает вычисление по исходным данным их параметров (свободного члена b0 и коэффициентов регрессии b1, b2, …).

При всем разнообразии эмпирических формул все же имеется вид аналитической зависимости, получивший широкое распространение. Им является уравнение регрессии в виде многочленов (полинома), расположенных по восходящим степеням изучаемого фактора и одновременно линейных ко всем коэффициентам.

Такая формула имеет вид:

y = f(x) = b0 + b1x + b2x2 +…+ bm xm, где b0, b1, b2,…, bm - коэффициенты, подлежащие определению.

Этот ряд - сходящийся, т.к. стремится к некоторому пределу.

ГОУ ВПО УГТУ-УПИ – Бараз В.Р. Корреляционно-регрессионный анализ Эмпирические формулы (аппроксимирующие уравнения) всегда имеют ограниченную область применения, которая не должна выходить за пределы имеющихся опытных данных.

Широкое применение аппроксимирующих уравнений объясняется следующими причинами:

Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 10 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.