0035 - page 201 of 318

201 of 318

201

единой шкале, то есть все первичные результаты тестовых исследований необходимо

преобразовать таким образом, чтобы они оказались сопоставимыми - стандартизация шкал теста.

Под

над¸жностью теста понимается степень точности, с которой тест измеряет

определ¸нное свойство или способ поведения личности. Над¸жность теста – это характеристика

точности его как измерительного инструмента, его устойчивости к действию помех (как внешних,

так и внутренних). Эмпирическое определение над¸жности теста является обязательным условием

его допуска для использования в практической деятельности психолога.

В психометрике обоснование получили три метода оценки над¸жности тестов:

1) метод повторного тестирования (метод тест-ретест);

2) метод тестирования параллельной, или эквивалентной, формой теста;

3) метод деления, или расщепления теста на части. Оценка над¸жности по методу повторного

тестирования требует, чтобы тест дважды предъявлялся одной и той же выборке испытуемых

через какое-то время. Длительность временного промежутка определяется содержанием и

характером задач теста.

Второй метод оценки над¸жности теста требует наличия параллельной, то есть

эквивалентной, формы теста, например формы "А" и "Б". Репрезентативную выборку испытуемых,

на которой проверяется над¸жность теста, случайным образом делят на две примерно

равночисленные группы. Затем первой группе предъявляются задачи формы "А", а второй группе

– задачи формы "Б". Через некоторое время (не более одной недели) задачи формы "Б" решает

первая группа, а формы "А" - вторая. После этого для всей репрезентативной выборки

испытуемых отдельно вычисляются первичные результаты для форм "А" и "Б", которые затем

подвергаются корреляции.

Общим недостатком первых двух методов оценки над¸жности теста является то, что они

зачастую дают заниженные или завышенные коэффициенты над¸жности. Дело в том, что

дисперсия результатов, на основе которой рассчитывается коэффициент корреляции, неоднородна

по своему составу. Наряду с дисперсией действительных индивидуальных различий в не¸ входят

частные дисперсии, обусловленные влиянием как внутренних, психологических, причин

(колебания внимания, усталость и др.), так и внешних (уличный шум, поведение и высказывания

исследователя и т. п.). При этом сила и сочетание этих причин в первом и во втором тестировании

могут быть различными, и оценить их влияние или полностью их нейтрализовать оказывается

невозможным.

Поэтому, особенно при проверке над¸жности тестов мощности (например, интеллектуальных

тестов) и достижений, предпочтение следует отдавать третьему методу, поскольку он

предполагает лишь однократное тестирование. Третий метод оценки над¸жности включает два

различных при¸ма расч¸та: разделение тестовых задач на две части, например по принципу

"ч¸тные и неч¸тные", и расч¸т коэффициента консистентности задач теста.

Валидность (или обоснованность) всякой процедуры измерения состоит в однозначности

(устойчивости) получаемых результатов относительно измеряемых свойств объектов, то есть

относительно предмета измерения. Отличие понятия "валидности" от "над¸жности" измерения

удобно раскрывать с помощью различения "объекта" и "предмета" измерения.

Над¸жность

- это устойчивость процедуры относительно объектов. Над¸жность не

обязательно предполагает валидность. В психологии довольно часто возникает такая ситуация,

когда исследователь вначале предлагает определ¸нную процедуру измерения, показывает е¸

над¸жность – способность устойчиво различать объекты, но вопрос о валидности оста¸тся

открытым.

Устойчивость теста относительно объектов (испытуемых) является необходимым, но не

достаточным условием его устойчивости относительно измеряемых атрибутов (свойств) объектов.

Над¸жность является необходимым, но не достаточным условием валидности. Отсюда понятно

основное соотношение психометрики:

валидность < над¸жность.

Это означает, что валидность теста не может превышать над¸жности теста.

Данное соотношение, однако, неверно трактовать как указание на прямо пропорциональную

связь валидности и над¸жности. Повышение над¸жности отнюдь не обязательно приводит к

повышению валидности. В терминах Анны Анастази [11] валидность определяется

репрезентативностью теста относительно измеряемой области поведения.

При проверке устойчивости распределения общая логика основывается на индуктивном

рассуждении: если "половинное" (полученное по половине выборки) распределение хорошо

моделирует конфигурацию целого распределения, то можно предположить, что это целое

распределение будет также хорошо моделировать распределение генеральной совокупности.

Таким образом, доказательство устойчивости распределения означает доказательство

Сайт создан в системе uCoz