WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 179 | 180 || 182 | 183 |   ...   | 506 |

Надежность указывает на согласованность (устойчивость) тестовых показателей индивидуума. Обычно ее определяют путем сравнения (вычисления корреляции) тестового показателя индивидуума с показателем, полученным в рез-те повторного проведения на нем того же самого теста или его эквивалентной формы. Валидность показывает, действительно ли используемый тест измеряет то, что он предположительно должен измерять, а именно: какие выводы можно сделать из тестового показателя в отношении того, что находится за пределами данного теста. Т. о., валидность обычно используется для характеристики того, в какой степени показатели IQ-теста коррелируют с прошлыми или будущими измерениями эффективности деятельности индивидуума, напр., академической успеваемостью или профессиональной успешностью.

Было разраб. неск. объективных мер уровня адаптивной успешности индивидуума (гл. обр. для уровней успешности детей в повседневной жизни). Коэффициенты корреляции между показателями, полученными на основе таких шкал адаптивного поведения, и показателями того же самого ребенка по тестам интеллекта варьируют от 0,58 до 0,95, указывая на то, что адаптивное поведение и измеряемый интеллект коррелируют, но не являются идентичными. Эксперты сходятся в том, что в области психич. задержки (mental retardation) использование опытным специалистом наряду с показателями IQ клиента показателей его социоадаптивного поведения и клинической истории повышало достоверность диагноза психической задержки в большей степени, чем валидность любого др. диагноза в области психопатологии.

Подобно большинству инструментов, методики психол. оценки могут использоваться в разнообразных целях, как деструктивных, так и конструктивных, и их использование невозможно отделить от опыта, компетентности и этических ценностей психолога. Большинство пользователей тестов интеллекта применяют их мудро и гуманно и в сопряжении с мерами адаптивной успешности стремятся проводить оценку т. о., чтобы максимально раскрыть потенциал каждого проходящего обследование индивидуума.

См. также Модель структуры интеллекта, Векслеровские тесты интеллекта Дж. Д. Матараццо, Д. Р. Денвер Меры креативности (creativity measures) Креативность (творчество) - это область когнитивного функционирования, играющая важную роль в широком разнообразии решаемых человеком задач, причем не только в области иск-ва, но также в технике, науке и других видах деятельности.

Большинство М. к. основаны на модели "структуры интеллекта" (SI) Дж. П. Гилфорда. Согласно Гилфорду, можно провести различие между конвергентным и дивергентным продуцированием как интеллектуальными операциями.

При конвергентном мышлении происходит "сужение" области поиска - при этом рассматривается лишь несколько возможных альтернатив и выбирается единственное - наилучшее - решение задачи или проблемы. Такое мышление проявляется при ответах в тестах, предполагающих множественный выбор, а также в большинстве тестов общего интеллекта. В противоположность этому, дивергентное продуцирование предполагает способность мыслить во многих расходящихся направлениях и часто приводит к новым и оригинальным решениям проблем. Многие М. к. создавались именно для оценки дивергентного продуцирования.

См. также Тестирование способностей Ф. Бенсон Меры критерия (criterion measures) М. к. или критериальная мера - это стандарт, эталон и т. п. В психологии под критерием чаще всего подразумевается стандарт (эталон) для оценивания валидности теста. Иногда термин "критерий" также используют для обозначения переменной, значения к-рой предсказываются по др. переменным, как в случае изучения множественной корреляции.

Когда дело касается оценки валидности теста, М. к. обычно выступает общепринятая мера изучаемого поведения. Чем в большей степени коррелирует тест с таким стандартом, тем выше критериальная валидность (criterion-related validity) данного теста. Критериальная валидность подразделяется на текущую (диагностическую) и прогностическую валидности. Текущая валидность (concurrent validity) определяется на основе корреляции показателей теста с замерами критерия, проводимыми примерно в одно время с тестированием. Прогностическая валидность (predictive validity) определяется на основе корреляции показателей теста с замерами критерия, полученными спустя какое-то время после тестирования.

Проблема мер критерия заключается в том, чтобы найти такие меры, которые можно было бы принять в качестве общепризнанных стандартов. Эта проблема легче решается в том случае, когда имеется возможность получить выборочные замеры деятельности (work samples), например, работы продавца. Хотя работа хорошего продавца может характеризоваться несколькими важными показателями - уровнем удовлетворенности покупателей, числом и объемом повторных продаж и числом покупателей - за М. к. чаще всего принимаются показатели общего объема продаж. Можно также сконструировать составную М. к., используя весовые коэффициенты, рассчитываемые путем усреднения оценок важности отдельных критериев, полученных на соответствующей выборке менеджеров по продажам.

Стандартизация вызывает большую проблему в ситуации, когда критерий представляет собой конструкт. Эта проблема начинается с принятия решения о том, что включать в "умение продавать". Чем более многозначен такой конструкт, тем больше возникает затруднений. Сначала необходимо определиться с тем, что должно входить в данный конструкт, затем найти способы оценки таких многозначных понятий как "социальная успешность", затем прийти к согласию в отношении того, как взвешивать эти аспекты при использовании их в сочетании - весьма непростая задача.

Чтобы использование М. к. в роли стандартов не вызывало сомнений, их следует тщательно проанализировать на предмет того, что они измеряют именно то, что должны, по предположению, измерять. К примеру, Рой Голдмен и Роберт Слотер указывают на то, что средний балл успеваемости является ненадежным критерием успешности обучения в колледже, потому что студенты с низкими способностями тяготеют к выбору легких курсов, в которых они могут добиться успеха, в то время как студенты с более высокими способностями выбирают для себя более трудные курсы, где они могут не получить высоких отметок.

Богден и Тейлор подробно рассматривают источники смещения критерия (criterion bias). Они выделяют четыре класса причин, приводящих к систематическим ошибкам: а) недостаточность критерия (criterion insufficiency), или упущение релевантных элементов; б) дефектность критерия (criterion deficiency), или включение в его состав посторонних элементов; в) смещение единиц критериальной шкалы (criterion scale unit bias), или неравномерность шкалы (напр., шкала дает слишком большое число благоприятных оценок, вместо их малого числа, к-рое бы получилось в случае их колоколообразного распределения); г) деформация критерия (criterion distortion), или неправильное взвешивание элементов в составном критерии.

К числу факторов, могущих приводить к систематическим ошибкам при измерении критерия, относят ошибку благоприятной возможности, эффект ореола и вмешательство опыта. Ошибка благоприятной возможности (opportunity bias) происходит, когда некоторые из работников, в отличие от других, имеют больше возможностей проявлять критериальное поведение, что приводит к их более высоким оценкам по критерию, хотя при равных возможностях эти другие могли бы реализовывать это поведение с неменьшим успехом. Эффект ореола (halo effect) обнаруживается при работе с оценочными шкалами, когда на оценки отдельных черт влияет общее впечатление оценивающего об оцениваемом им чел. Вмешательство жизненного опыта (experience contamination) имеет место в ситуации, когда критериальное поведение изменяется вместе с неконтролируемым фактором жизненного опыта.

См. также Тестирование способностей, Методы эмпирического исследования, Измерение Д. Крэсвул Меры речи и слуха (speech and hearing measures) Измерение речи и слуха может осуществляться в клинических, промышленных и исследовательских целях. Характер используемых при этом тестов и методов зависит от целей тестирования.

Меры речи-языка Системы речевой коммуникации. Для таких целей, как разработка высококачественной телефонной аппаратуры, речь может измеряться экспериментальными психологами или инженерами в характеристиках звуковой волны, таких как частота, амплитуда и форма звукового сигнала. Ликлайдер и Миллер упоминают графические методы, в которых используется математический анализ Фурье для разложения речи на ее составляющие частоты. Они тж описывают использование электрических методов, таких как звуковая спектрография, регистрирующая изменения паттерна интенсивности-частоты как функции времени. Это позволяет получать и сравнивать между собой визуальные паттерны (спектрограммы) различных слов или фраз.

Физиолог. функция. Физиолог. аспекты речеобразования и голосообразования могут изучаться с использованием электрофизиологических и кинофлюорографических методов.

Клиническая оценка речи-языка. Оценка функций речи и языка в клинических целях связана с оценкой одной или более подобластей речи и языка. Эти подобласти могут включать артикуляцию, или фонологию (образование речевых звуков); голос, или фонацию, и резонанс; восприятие речи, обработку речевой информ. и порождение речи, а также ее плавность (включ. заикание).

Персонал, подготовленный к проведению таких клинических оценок, включает дипломированных специалистов по патологии речи и дипломированных аудиологов. Мед. оценка является обязательным элементом общего плана оценки при определении этиологии и планировании лечения голосовых и слуховых нарушений.

Несмотря на существование целого ряда стандартизированных тестов, оценивание функций речи и языка часто включает неформальную оценку квалифицированных специалистов вследствие изменчивости культурных и региональных норм.

Измерение слуха Электрические реакции центральной слуховой системы дают информ., представляющую как экспериментальный, так и клинический интерес. Аудиометры чистого тона генерируют колебания, к-рые могут регулироваться по интенсивности (громкости звука) тонов в диапазоне от низкой до высокой частоты (высоты звука). Подтверждение индивидуумом слышимости того или иного тона позволяет оценить его слуховой порог во всем диапазоне слышимых частот. Для графического представления результатов этого теста используется аудиограмма. Для тестируемых частот регистрируется снижение слуха в децибелах. Вслед за этим, на основе оценки данных, полученных из аудиометрических и других клинических тестов, может определяться тип потери слуха.

См. также Аудиометрия, Психофизика Б. Мейтс Меры центральной тенденции (central tendency measures) Назначение М. ц. т. - служить сводными количественными характеристиками, обеспечивающими наилучшее описание множества наблюдений или оценок одним единственным числом. Термины М. ц. т. и "средняя величина" часто употребляются как равнозначные, хотя некоторые авторы сужают объем понятия "средняя величина" до среднего арифметического. Несмотря на разнообразие М. ц. т., чаще всего встречаются мода, медиана и среднее.

Мода - это просто наиболее часто встречающееся в определенной совокупности наблюдений значение переменной. При сгруппированных данных мода определяется как середина интервала группирования, содержащего наибольшее число значений наблюдаемой переменной.

Медиана - это значение переменной, делящее упорядоченную совокупность наблюдений пополам, так что одна половина значений в этой совокупности лежит ниже медианы, а др. их половина - выше медианы. Если совокупность образована нечетным числом значений наблюдаемой переменной, то медиана равна значению переменной, являющемуся серединой упорядоченной совокупности наблюдений. Если же совокупность образована четным числом значений, то медиана определяется значением, лежащим посередине между двумя значениями, находящимися в центре упорядоченной совокупности наблюдений. Медиана - более полезная мера, чем мода, и часто используется в случае скошенного (асимметричного) распределения данных. Следует, однако, отметить, что медиана нечувствительна к величине крайних значений упорядоченной совокупности наблюдений.

Среднее арифметическое - самая распространенная мера центральной тенденции - определяется как сумма значений наблюдаемой переменной, разделенная на их число. (В данной статье под "средним" подразумевается среднее арифметическое.) Использование среднего дает исследователю ряд преимуществ. В отличие от др. М. ц. т., среднее чувствительно к точному положению каждого значения в распределении переменной. Правда, это достоинство среднего арифметического оборачивается недостатком в виде повышенной чувствительности к крайним значениям переменной, и потому его иногда избегают использовать в случае сильно скошенных распределений.

Среднее - особенно полезная мера в области статистических выводов, поскольку выборочное среднее является относительно эффективной оценкой генерального среднего. Если из генеральной совокупности значений наблюдаемой переменной случайно извлечь даже большое количество выборок, не следует ожидать точного равенства выборочных средних между собой или генеральному среднему. Однако, можно доказать, что выборочные средние отклоняются от генерального среднего меньше, чем выборочные медианы отклоняются от медианы генеральной совокупности. Можно также доказать (центральная предельная теорема), что выборочное распределение среднего приближается к нормальному распределению по мере увеличения объема выборки.

См. также Статистика в психологии А. Велл Меры читаемости (reading measures) Что-либо читаемое людьми может определяться как доходчивое, легкое, доставляющее удовольствие и/или интересное. Оценка читаемости текстов является сложной проблемой. Хотя большинство исследователей признают необходимость в количественных М. ч., они расходятся в том, что кладется в основу таких мер.

Широко используемые меры включают формулу читаемости Дейла-Челла (Dale-Chall Readability Formula), формулы Флеша, формулу Фарра-Дженкинса-Паттерсона (Farr-Jenkins-Patterson Formula), формулу читаемости Фрая (Fry Readability Formula), индекс Фога (Fog Index), формулу Лоджа (Lorge formula) и SMOG классификацию (SMOG Grading).

Формулы Флеша послужили стандартом для валидизации большинства других М. ч. Однако, использование этих индексов сопряжено с некоторыми проблемами.

Pages:     | 1 |   ...   | 179 | 180 || 182 | 183 |   ...   | 506 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.